WO2016092767A1 - グルーピングシステム、グルーピング方法およびグルーピングプログラム - Google Patents

グルーピングシステム、グルーピング方法およびグルーピングプログラム Download PDF

Info

Publication number
WO2016092767A1
WO2016092767A1 PCT/JP2015/005926 JP2015005926W WO2016092767A1 WO 2016092767 A1 WO2016092767 A1 WO 2016092767A1 JP 2015005926 W JP2015005926 W JP 2015005926W WO 2016092767 A1 WO2016092767 A1 WO 2016092767A1
Authority
WO
WIPO (PCT)
Prior art keywords
product
customer
group
purchase
grouping
Prior art date
Application number
PCT/JP2015/005926
Other languages
English (en)
French (fr)
Inventor
慎二 中▲台▼
光太郎 落合
考之 寺川
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US15/534,273 priority Critical patent/US20180260829A1/en
Priority to JP2016563402A priority patent/JP6662298B2/ja
Priority to EP15866581.0A priority patent/EP3232390A4/en
Publication of WO2016092767A1 publication Critical patent/WO2016092767A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Definitions

  • the present invention relates to a grouping system, a grouping method, and a grouping program for grouping customers and grouping items or items related to items or items related to services or services.
  • Non-Patent Document 1 describes a method for creating customer clusters.
  • characteristics such as “low price” and “high-grade” are given to each product in advance.
  • the feature imparted to the product may be referred to as product DNA.
  • the characteristic provided to the goods which each customer purchased is totaled, and the result is made into the characteristic of a customer. This feature is sometimes referred to as customer DNA.
  • a cluster of customers is created based on the customer characteristics.
  • Non-Patent Document 2 describes a method for classifying customers.
  • product DNA such as “easy health system” and “time saving system” representing a lifestyle is determined and applied to various products. For example, a customer who purchases a certain amount of a product called “Easy Health” is also classified as “Easy Health”.
  • Patent Document 1 describes that consumers are classified according to price sensitivity, and that a product category is determined based on cross elasticity of demand and a standard industry classification system. Patent Document 1 describes grouping products in a product category according to the type of consumer who purchases the product.
  • the inventor of the present invention has conceived “a group of products similar in terms of purchasing tendency” and “a group of customers having a similar purchasing tendency” defined as follows.
  • a group of products similar in terms of purchasing tendency refers to a group of products in which customers belonging to the same “group of customers having a similar purchasing tendency” show similar purchasing trends.
  • the group of customers having a similar purchase tendency is a group of customers who show a similar purchase tendency with respect to products belonging to the same “group of similar products from the viewpoint of purchase tendency”.
  • Groups of products that are similar in terms of purchasing trends are defined based on “Groups of customers that have similar purchasing trends”, and “Groups of customers that have similar purchasing trends” It is defined based on a group of products that are similar in terms of viewpoint. Therefore, it can be said that “a group of products similar in terms of purchasing tendency” and “a group of customers having a similar purchasing tendency” have a so-called chicken-egg relationship.
  • Non-Patent Document 1 the accuracy of “a group of customers having a similar purchasing tendency” may be deteriorated.
  • the work of adding features to each product is performed manually. Therefore, the accuracy of the customer cluster obtained by the method described in Non-Patent Document 1 depends on the method of adding features to the product, and the accuracy of the customer cluster may deteriorate. The same applies to the method described in Non-Patent Document 2.
  • the present invention accurately defines a group of customers having a similar purchasing tendency, and relates to a similar product or a group of items related to the product in terms of purchasing tendency or a service or service similar in terms of purchasing tendency. It is an object of the present invention to provide a grouping system, a grouping method, and a grouping program that can accurately determine a group of matters to be performed.
  • the grouping system has a tendency for a customer to purchase a product for each combination of a customer and a product, or for each combination of a product and a product-related matter that is a matter related to the customer and the product, based on the product purchase status of the customer.
  • a purchase trend calculating means for calculating the product and a grouping means for determining a group of customers and a group of product-related items based on the trend and the distribution of the trend.
  • the grouping system includes a feature amount calculation unit that calculates a feature amount of a product for each product, a product purchase record obtained for each combination of a customer and a product, a distribution of product purchase results, and a feature for each product.
  • Grouping means for determining a group of customers and a group of products based on the quantity and the distribution of the feature quantity.
  • the grouping system enables a customer to purchase a service for each combination of a customer and a service, or for each combination of a service-related item that is a matter related to the customer and the service, based on the customer's service purchase status.
  • Purchasing tendency calculating means for calculating a tendency to Based on the trend and the distribution of the trend, a group of customers is defined, and grouping means for determining a group of services or a group of service-related items is provided.
  • the grouping system includes a feature amount calculation unit that calculates a feature amount of a service for each service, a service purchase record obtained for each combination of a customer and a service, a distribution of service purchase record, and a feature for each service. And grouping means for determining a customer group and a service group based on the quantity and the distribution of the feature quantity.
  • the grouping method according to the present invention enables a customer to purchase a product for each combination of a customer and a product, or for each combination of a product related item that is a matter related to the customer and the product, based on the product purchase status of the customer.
  • a customer group is defined based on the trend and the distribution of the trend, and a product group or a product-related item group is defined.
  • the grouping method according to the present invention calculates the feature quantity of each product, and the product purchase results obtained for each combination of customers and products, the distribution of product purchase results, the feature values for each product, and the feature values A customer group and a product group based on the distribution of the product.
  • the grouping method according to the present invention enables a customer to purchase a service for each combination of a customer and a service, or for each combination of a service-related item that is a matter related to the customer and the service, based on the customer's service purchase status.
  • a customer group is defined based on the trend and the distribution of the trend, and a service group or a service-related item group is defined.
  • the grouping method calculates service feature values for each service, obtains service purchase results obtained for each combination of customers and services, distribution of service purchase results, feature values for each service, and feature values. And determining a group of customers and a group of services based on the distribution of the services.
  • the grouping program allows a customer to store a computer for each combination of a customer and a product, or for each combination of a product and a product-related matter that is a matter related to the product. Based on the purchase trend calculation process for calculating the tendency to purchase products and the trend and distribution of the trend, the group of customers is determined and the grouping process for determining the group of products or the group of product related items is executed. It is characterized by.
  • the grouping program according to the present invention includes a computer, a feature amount calculation process for calculating a feature amount of a product for each product, a product purchase record obtained for each combination of a customer and a product, a distribution of product purchase results, A grouping process for determining a group of customers and a group of products is executed based on the feature value for each product and the distribution of the feature value.
  • the grouping program allows a customer to store a computer for each combination of a customer and a service, or for each combination of a service and a service-related matter that is a matter related to the customer and the service, based on the service purchase status of the customer.
  • Purchasing trend calculation processing for calculating a tendency to purchase a service
  • grouping processing for determining a group of customers and a group of services or a service related item based on the trend and the distribution of the trend. It is characterized by.
  • the grouping program according to the present invention includes a computer, a feature amount calculation process for calculating a feature amount of a service for each service, a service purchase record obtained for each combination of a customer and a service, a distribution of service purchase record, A grouping process for determining a customer group and a service group is executed based on the feature amount for each service and the distribution of the feature amount.
  • a group of customers having a similar purchasing tendency is accurately determined and related to a similar product or a group of items related to the product in terms of purchasing tendency or a service or service similar in terms of purchasing tendency.
  • a group of matters to be performed can be accurately determined.
  • FIG. 1 is a block diagram illustrating an example of a grouping system according to a first embodiment of this invention.
  • the grouping system 1 according to the first embodiment includes a data storage unit 2, a purchase tendency calculation unit 3, and a grouping unit 4.
  • the data storage means 2 is a storage device for storing purchase data indicating the customer's product purchase status.
  • the data storage unit 2 stores, for example, a customer master and a product master, and stores information that associates a customer ID, a product ID, a sales price of the product, and a purchase date on each purchase date when the customer purchases the product. May be stored as
  • the customer master is information indicating the attributes (age, sex, etc.) of each customer.
  • the customer master is a set of information in which a customer ID is associated with each attribute of the customer.
  • the product master is information indicating the attributes (product name, standard price, product category, release date, etc.) of each product.
  • the product master is a set of information in which the product ID is associated with each attribute of the product.
  • the customer ID is customer identification information
  • the product ID is product identification information.
  • the purchasing tendency calculation means 3 calculates a purchasing tendency index value for each combination of customer and product based on the purchasing data.
  • the purchase tendency index value is an index value indicating a tendency of a customer to purchase a product.
  • Various values can be used as purchase tendency index values. An example of the operation in which the purchase tendency calculation unit 3 calculates the purchase tendency index value will be described later.
  • the purchasing trend calculation means 3 does not have to calculate a purchasing trend index value for the customer and the combination of the product.
  • a customer is identified by a customer ID.
  • the customer ID is represented by the symbol c.
  • the product is identified by the product ID.
  • the product ID is represented by the symbol i.
  • the purchase trend index value calculated by the purchase trend calculation means 3 for the combination of the customer with the customer ID “c” and the product with the product ID “i” is denoted as x c, i .
  • the purchase tendency index value calculated for the combination of the customer with the customer ID “2” and the product with the product ID “5” is denoted as x 2,5 .
  • a customer with a customer ID “c” is described as a customer “c”.
  • the product with the product ID “i” is described as the product “i”.
  • the purchasing tendency calculation means 3 designates the type of distribution of the purchasing tendency index value.
  • the type of distribution of the purchasing tendency index value may change depending on what value is calculated as the purchasing tendency index value.
  • the purchase tendency calculation means 3 may calculate a purchase tendency index value for each combination of a customer and a product related item, not for each combination of a customer and a product.
  • the product related item is not a product itself but a matter related to the product.
  • a commodity related item for example, a commodity category can be cited.
  • the merchandise related items are not limited to the merchandise category.
  • Product-related matters are also identified by ID.
  • An ID for identifying a product-related item is represented by i as in the product ID.
  • the purchasing tendency index value calculated for the combination of the customer with the customer ID “c” and the product related item with the ID “i” is also denoted as x c, i .
  • product-related matter with ID “i” is referred to as product-related matter “i”.
  • product-related matter “i” For example, a product category with ID “1” is described as a product category “1”.
  • the grouping means 4 determines a customer group and a product group.
  • the grouping means 4 determines a customer group and a product related item group. For example, when the purchase tendency calculation means 3 calculates the purchase tendency index value xc, i for each combination of a customer and a product category, the grouping means 4 determines a customer group and a product category group.
  • the purchasing tendency calculation means 3 may calculate any purchasing tendency index value in the following examples.
  • the purchase tendency calculation unit 3 may calculate a value other than the values exemplified below as the purchase tendency index value.
  • the natural logarithm of an arbitrary variable v is denoted as ln (v).
  • Example 1 the purchase tendency calculation means 3 calculates the degree of change in the purchase amount of a product in accordance with a price reduction (a discount rate is acceptable) of the product as a purchase trend index value. For example, the purchase tendency calculation means 3 calculates price elasticity as a purchase tendency index value.
  • the purchase tendency calculation means 3 creates, for example, information in which the purchase amount is associated with the combination of the customer ID, the product ID, and the actual sales price of the product based on the purchase data. At this time, even if the customer IDs are common and the product IDs are common, if the selling price is different, the purchase tendency calculation means 3 is set to another group. That is, the purchase tendency calculation means 3 specifies the number of purchases for each actual selling price of the product for the combination of the customer ID and the product ID.
  • the purchase tendency calculation means 3 refers to the above information created based on the purchase data, and performs a regression analysis using ln (volume c, i ) as an objective variable and ln (price c, i ) as an explanatory variable. By this regression analysis, w c, i in the following equation (1) is obtained.
  • the purchase tendency calculation means 3 calculates w c, i in the equation (1) as a purchase tendency index value x c, i .
  • purchasing habits index value x c, as i may be the absolute value of the above w c, i. This value is price elasticity.
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • Example 2 the purchase trend calculation means 3 calculates a value indicating the degree of days from the advertisement date of a product until the customer purchases the product as a purchase trend index value.
  • the data storage means 2 also stores information in which the product ID is associated with the advertisement date of the product.
  • the purchase tendency calculation means 3 uses, as purchase data, information that associates a customer ID, a product ID, and the number of days elapsed since the most recent advertisement date on each purchase date when the customer purchased the product. Create based on.
  • the number of days that have elapsed since the advertisement date of the product on each purchase date when the customer “c” purchased the product “i” is referred to as an elapsed days variable day c, i .
  • the purchase quantity that the customer “c” purchased the product “i” on each purchase date is described as a purchase quantity variable volume c, i .
  • the purchase tendency calculation means 3 refers to the above information created based on the purchase data, and performs regression analysis using ln (volume c, i ) as an objective variable and ln (day c, i ) as an explanatory variable. W c, i in the equation (2) shown in FIG.
  • the purchase tendency calculation means 3 calculates w c, i in the equation (2) as a purchase tendency index value x c, i .
  • the purchase tendency calculating means 3 may obtain the reciprocal of the absolute value of w c, i as the purchase tendency index value x c, i . This value can be said to be the advertisement effective lifetime of the product “i” for the customer “c”.
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • Example 3 the purchase trend calculation means 3 calculates a value indicating the degree of days from when a new product is released until the customer purchases the product as a purchase trend index value.
  • the purchase trend calculation means 3 uses the purchase data as the information that associates the customer ID, the product ID, and the number of days elapsed from the release date of the product on each purchase date when the customer purchased the product. Create based on.
  • the elapsed days from the product release date on each purchase date when the customer “c” purchased the product “i” is denoted as an elapsed day variable day c, i .
  • the purchase quantity that the customer “c” purchased the product “i” on each purchase date is described as a purchase quantity variable volume c, i .
  • the purchase tendency calculation means 3 refers to the above information created based on the purchase data, and performs regression analysis using ln (volume c, i ) as an objective variable and ln (day c, i ) as an explanatory variable. W c, i in the equation (3) shown in FIG.
  • the purchase tendency calculation means 3 calculates w c, i in the equation (3) as a purchase tendency index value x c, i .
  • the purchase tendency calculating means 3 may obtain the reciprocal of the absolute value of w c, i as the purchase tendency index value x c, i . This value can be said to be the new product sensitivity life.
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • the purchase tendency calculation means 3 may designate a Poisson distribution.
  • Example 4 the purchase trend calculation means 3 calculates a value indicating the degree of days from when a product is displayed at a store until the customer purchases the product as a purchase trend index value.
  • the data storage means 2 also stores information in which the product ID is associated with the display date of the product.
  • the purchase tendency calculation means 3 Based on the purchase data, the purchase tendency calculation means 3, for example, associates the customer ID, the product ID, and the number of days elapsed from the display date of the product on each purchase date when the customer purchased the product. create.
  • the number of days elapsed from the display date of the product on each purchase date when the customer “c” purchased the product “i” is referred to as an elapsed days variable day c, i .
  • the purchase quantity that the customer “c” purchased the product “i” on each purchase date is described as a purchase quantity variable volume c, i .
  • the purchase tendency calculation means 3 refers to the above information created based on the purchase data, and performs regression analysis using ln (volume c, i ) as an objective variable and ln (day c, i ) as an explanatory variable. Wc, i in the equation (4) shown in FIG.
  • the purchase tendency calculation means 3 calculates w c, i in the equation (4) as a purchase tendency index value x c, i .
  • the purchase tendency calculating means 3 may obtain the reciprocal of the absolute value of w c, i as the purchase tendency index value x c, i .
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • the purchasing tendency calculation means 3 associates the customer ID, the product ID, and the number of days elapsed from the display date of the product. Information may be created.
  • Example 5 the purchase trend calculation means 3 calculates a value indicating the degree of days from when a customer purchases a product to the next purchase of the product as a purchase trend index value.
  • the purchase tendency calculation means 3 creates, for example, information in which a customer ID, a product ID, and an average purchase interval of products are associated with each other based on purchase data.
  • the average purchase interval corresponding to the combination of the customer ID and the product ID is set as a purchase tendency index value xc, i .
  • the purchase tendency calculation means 3 calculates the elapsed days from the date when the customer “c” purchased the product “i” to the next date when the same customer “c” purchased the same product “i”. Then, the average value of the elapsed days is calculated as the purchase tendency index value xc, i .
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • the purchasing tendency calculation means 3 calculates a purchasing tendency index value x c, i for each combination of customer and product.
  • Example 6 the purchase tendency calculation means 3 calculates the degree of customer's commitment (in other words, the degree of attachment) to individual products in the product category as a purchase tendency index value.
  • the purchasing tendency calculation means 3 calculates, for example, a Manton coefficient or Gini coefficient as the purchasing tendency index value xc, i .
  • the purchase tendency calculation means 3 obtains the purchase share in the product category “i” by the customer “c” for the product belonging to the product category “i”, and the product category Calculate the sum of the squares of the purchase shares obtained for each product belonging to “i”.
  • the purchasing tendency calculation means 3 uses this value (Hafender coefficient) as the purchasing tendency index value xc, i .
  • the purchasing tendency calculation means 3 calculates a purchasing tendency index value xc, i for each combination of customer and product category.
  • x c, i is a small value indicates that the customer “c” buys various products of the product category “i” and seeks diversity in the products.
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • product DNA may be applied as a product-related item instead of the product category.
  • Example 7 the purchase tendency calculation means 3 calculates the degree of customer's commitment (in other words, the degree of attachment) to the manufacturer of individual products in the product category as a purchase tendency index value.
  • the purchase tendency calculation means 3 calculates, for example, a Human Capital Average coefficient or Gini coefficient as the purchase tendency index value xc, i .
  • a Human Capital Average coefficient or Gini coefficient For example, when calculating the Manton coefficient, for each manufacturer belonging to a certain product category “i”, the purchase share in the product category “i” by the customer “c” is obtained and belongs to the product category “i”. Calculate the sum of the squares of the purchase shares obtained for each manufacturer.
  • the purchasing tendency calculation means 3 uses this value (Hafender coefficient) as the purchasing tendency index value xc, i .
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • Example 7 a product brand or the like may be applied instead of the manufacturer.
  • the purchasing tendency calculation means 3 calculates a purchasing tendency index value x c, i for each combination of a customer and a product related item (product category in the above example).
  • the grouping unit 4 uses the purchase trend index values x c, i calculated by the purchase trend calculation unit 3 and the distribution types of the specified purchase trend index values x c, i to determine the customer groups and products. Define a group.
  • the grouping means 4 may determine a group of customers and a group of merchandise related items (for example, merchandise category). In any case, the operation of the grouping means 4 is the same. In the following description, a case where the grouping means 4 determines a customer group and a product group will be described as an example.
  • one customer belongs to only one group
  • one product belongs to only one group.
  • grouping A case where grouping is performed will be described as an example. In this way, defining a group so that one element belongs to only one group is called clustering. A group obtained by clustering is called a cluster. Further, simultaneous clustering for a plurality of objects (customers and products in this example) is called Co-clustering. That is, in the following description, a case where the grouping unit 4 executes Co-clustering will be described as an example.
  • FIG. 2 is a diagram schematically showing a customer ID and a product ID before execution of Co-clustering.
  • a state in which customer IDs are sequentially arranged in the vertical axis direction and product IDs are sequentially arranged in the horizontal axis direction is illustrated.
  • Each purchase tendency index value x c, i calculated by the purchase tendency calculation means 3 corresponds to a combination of one customer ID and one product ID.
  • x 2,1 shown in FIG. 2 corresponds to a combination of customer ID “2” and product ID “1”.
  • the purchase tendency index value x c, i does not have to be calculated for the combination of the customer and the product.
  • FIG. 3 is an explanatory diagram schematically showing an example of a customer group (customer cluster) and a product group (product cluster) defined by the grouping means 4.
  • the grouping means 4 determines a plurality of product clusters and a plurality of customer clusters.
  • the number of product clusters and the number of customer clusters may be set to fixed values or may not be limited to fixed values.
  • the commodity cluster ID is “a”
  • the commodity cluster is referred to as commodity cluster “a”.
  • the customer cluster ID is “b”
  • the customer cluster is described as a customer cluster “b”.
  • the products “6”, “8”, and “10” belong to the product cluster “9” determined by the grouping means 4. Further, it is assumed that customers “2”, “5”, and “9” belong to the customer cluster “3” determined by the grouping means 4.
  • the number of products (product ID) belonging to the product cluster and the number of customers (customer ID) belonging to the customer cluster are not particularly limited.
  • a combination of one product cluster and one customer cluster corresponds to a purchase tendency index value xc, i corresponding to the combination of the product belonging to the product cluster and the customer belonging to the customer cluster.
  • x 2,6 , x 5,6 and the like correspond to the combination of the product cluster “9” and the customer cluster “3”.
  • the distribution parameters of the purchasing tendency index values xc, i in the specified distribution type are also determined for each combination of one product cluster and one customer cluster. become. For example, distribution parameters such as x 2,6 , x 5,6 corresponding to the combination of the product cluster “9” and the customer cluster “3” are also determined.
  • distribution parameters such as x 2,6 , x 5,6 corresponding to the combination of the product cluster “9” and the customer cluster “3” are also determined.
  • the parameters corresponding to the combination of the product cluster “9” and the customer cluster “3” are represented as ⁇ 3,9 .
  • Examples of distribution parameters of xc, i include, for example, an average value and variance.
  • ⁇ 3 , 9 and the like may be expressed as a vector having an average value, variance, and the like as elements, for example.
  • FIG. 3 is a modification of FIG. 2 so that product IDs belonging to the same product cluster are continuously arranged, and customer IDs belonging to the same customer cluster are continuously arranged. it can.
  • the grouping means 4 has, for example, a plurality of sets of likelihoods obtained by combining customer clusters (customer groups), product clusters (product groups), and parameters of distribution of purchase tendency index values xc, i. Each customer cluster and each product cluster are defined so as to be maximized. This likelihood is expressed by the following equation (5).
  • the grouping unit 4 may obtain a customer cluster and a product cluster by performing processing for maximizing the lower limit of the marginal likelihood obtained by marginalizing ⁇ shown in Expression (5), or processing similar thereto.
  • C is a set of customer IDs
  • I is a set of product IDs.
  • C is a set of customers and I is a set of products.
  • Z c represents the customer cluster to which the customer ID “c” belongs.
  • Z i represents the product cluster to which the product ID “i” belongs.
  • the grouping means 4 executes Co-clustering so that one customer ID belongs to only one customer cluster and one product ID belongs to only one product cluster.
  • is a distribution parameter designated by the purchasing tendency calculation means 3.
  • is a parameter of distribution of x c, i corresponding to a combination of one customer cluster indicated by Z c and one commodity cluster indicated by Z i .
  • Z c indicates the customer cluster “3” shown in FIG. 3
  • Z i indicates the product cluster “9” shown in FIG. 3
  • ⁇ 3,9 is assigned to the set of Z c and Z i .
  • ⁇ , Z c , Z i ) represents the probability (probability) of x c, i .
  • the value of Expression (5) is the likelihood as a whole of a plurality of sets obtained by combining the customer cluster, the product cluster, and the parameters of the distribution of xc, i corresponding to the two clusters.
  • the grouping means 4 determines a customer cluster and a product cluster by determining a plurality of sets of customer clusters, product clusters and parameters so that the value of the equation (5) is maximized. Good.
  • the grouping unit 4 calculates the posterior distribution of ⁇ shown in Equation (5).
  • the grouping unit 4 uses the EM (Expectation-Maximization) method to set the combination of the customer cluster, the product cluster, and the parameters so that the value of Expression (5) becomes maximum. It suffices to determine more than one. If it is Bayesian estimation, the grouping means 4 calculates
  • the Gibbs sampling method is one of MCMC methods (Markov Chain Monte Carlo algorithm).
  • the purchase tendency calculation means 3 and the grouping means 4 are realized by a CPU of a computer, for example.
  • the CPU only has to read the grouping program from a program recording medium such as a computer program storage device (not shown in FIG. 1) and operate as the purchase tendency calculating means 3 and the grouping means 4 according to the grouping program.
  • Each means may be realized by separate hardware.
  • the grouping system may have a configuration in which two or more physically separated devices are connected by wire or wirelessly. This also applies to embodiments described later.
  • FIG. 4 is a flowchart showing an example of processing progress of the first embodiment of the present invention.
  • the purchasing tendency calculation means 3 calculates a purchasing tendency index value xc, i for each combination of customer and product based on the purchase data (step S1). In step S1, the purchasing tendency calculation means 3 designates the distribution type of the purchasing tendency index value xc, i .
  • step S1 the grouping means 4 determines a plurality of sets of customer clusters, product clusters, and xc, i distribution parameters so that the value of the equation (5) is maximized, whereby the customer clusters and products.
  • a cluster is determined (step S2). This distribution is designated by the purchasing tendency calculation means 3.
  • a human does not give any feature to a product.
  • Xc, i obtained in step S1 is objective data obtained from purchase data.
  • the grouping means 4 defines a group of customers and a group of products (in the above example, a customer cluster and a product cluster), so that a group of customers having a similar purchasing tendency can be accurately defined. It is possible to accurately determine a group of products that are similar in terms of purchasing tendency.
  • the grouping means 4 is configured so that the value of the expression (5) is maximized.
  • the customer cluster and the product category (product related item) cluster may be determined.
  • the grouping unit 4 may perform Co-clustering in step S2 using the product category ID as “i” in the equation (5) instead of the product ID.
  • the other points are the same as the operation of the grouping means 4 already described. In this case, it is possible to accurately determine a group of customers having a similar purchasing tendency and to accurately determine a group of similar product categories from the viewpoint of purchasing tendency.
  • the grouping means 4 allows the group of customers while allowing one customer (customer ID) to belong to a plurality of groups and one product (product ID) to belong to a plurality of groups. And product groups may be defined. Also in this case, the grouping means 4 may determine the customer group and the product group so that the value of the expression (5) is maximized. Even in this case, the grouping means 4 may use the Gibbs sampling method, the EM method, or the variational Bayes method as a method of determining the customer group and the product group so that the value of the expression (5) is maximized. . The same applies to a group of product-related items such as product categories.
  • the grouping unit 4 determines a customer group and a product group while allowing one customer (customer ID) to belong to a plurality of groups and one product (product ID) to belong to a plurality of groups.
  • the data analyst can find hidden features (features that are difficult to find directly) of the customer or the product by referring to the group of the customer and the group of the product.
  • the purchase tendency index value x c, i for the product i of the customer c is modeled as f (Z T i AZ c ) using the function f.
  • This function f is a logistic function, Poisson distribution, Gaussian distribution, or the like.
  • the function f may be determined by the purchase tendency index value xc , i . If the purchasing tendency index value x c, i is a value of 0 or 1, the function f is a logistic function. If the purchasing tendency index value x c, i is a number, the function f has a Poisson distribution. If the purchase tendency index value x c, i is a real number, the function f has a Gaussian distribution.
  • the probability distribution shown as a specific example in the embodiment corresponds to this function.
  • the purchase tendency calculation unit 3 specifies the type of distribution of the purchase tendency index value xc, i .
  • Buying habits index value x c depending on whether using what value as i, buying habits index value x c, the type of distribution of the i may be determined in advance.
  • the purchasing tendency calculation means 3 does not have to specify the type of distribution of the purchasing tendency index value xc, i .
  • the grouping unit 4 may determine a group of customers and a group of products or product-related items by using distribution parameters of purchase tendency index values xc, i in a predetermined distribution type.
  • FIG. FIG. 5 is a block diagram illustrating an example of a grouping system according to the second embodiment of this invention.
  • the grouping system 11 according to the second embodiment includes a data storage unit 12, a feature amount calculation unit 13, and a grouping unit 14.
  • the data storage means 12 is a storage device for storing purchase data indicating the customer's product purchase status.
  • the customer master and the product master may be stored, and information in which the customer ID, the product ID, the price of the product, and the purchase date are associated with each purchase date when the customer purchased the product may be stored as purchase data.
  • the feature amount calculation unit 13 calculates the relative price of a product as the feature amount of the product using the standard price in the product master will be described as an example.
  • the number of purchases is used as an index value indicating a product purchase record (hereinafter referred to as a purchase record index value).
  • the feature amount calculation means 13 calculates the feature amount of the product for each product. This feature amount is a feature amount of the product itself and does not depend on the customer. In this example, the case where the feature amount calculation unit 13 calculates the relative price of each product as the feature amount of the product will be described as an example. In this case, the feature amount calculation unit 13 is based on the standard price of each product stored in the data storage unit 12 and the standard price (hereinafter, referred to as i av ) of the standard price of each product. The standard deviation (hereinafter referred to as i dev ) is calculated. The standard price of the product “i” stored in the data storage unit 12 is set to s i . Also, let the relative price of the product “i” be r i . The feature quantity calculation means 13 calculates the relative price of each product by performing the following equation (6) for each product.
  • the feature amount calculation means 13 designates the distribution type of the feature amount of the product.
  • the feature quantity calculation means 13 designates, for example, a standard normal distribution as the distribution type of the feature quantity (relative price).
  • the feature amount calculation unit 13 may specify a Gaussian distribution.
  • the grouping unit 14 refers to the purchase data stored in the data storage unit 12 and calculates a purchase record index value for each combination of customer and product.
  • a purchase performance index value calculated for each combination of a customer and a product is represented by a symbol uc , i .
  • the grouping means 14 employs a Poisson distribution as a distribution of purchase performance index values (number of purchases).
  • the grouping means 14 determines the number of purchases derived for each combination of customer and product, the type of distribution of the number of purchases (Poisson distribution in this example), the relative price for each product, and the distribution of the relative price. Define customer groups and product groups based on type.
  • grouping is performed so that one customer (in other words, one customer ID) belongs to only one cluster, and one product (in other words, one product ID) belongs to only one cluster.
  • a case where the means 14 executes Co-clustering will be described as an example.
  • the grouping unit 14 sets each customer so that the likelihood of a plurality of sets obtained by combining the customer cluster, the product cluster, the distribution parameter of the number of purchases, and the distribution parameter of the relative price of the product is maximized. Define clusters and each product cluster. This likelihood is expressed by the following equation (7).
  • C is a set of customer IDs
  • I is a set of product IDs
  • Z c represents the customer cluster to which the customer ID “c” belongs.
  • Z i represents the product cluster to which the product ID “i” belongs. This point is the same as in the first embodiment.
  • ⁇ ′ is a parameter of the distribution of the number of purchases u c, i corresponding to the combination of one customer cluster indicated by Z c and one product cluster indicated by Z i .
  • ⁇ ′ may be represented by a vector, for example.
  • Equation (7) p (u c, i
  • is a parameter of the distribution designated by the feature amount calculation unit 13.
  • is a parameter of the relative price distribution of products belonging to the product cluster Z i .
  • ⁇ , Z i ) represents the probability of r i .
  • the value of Expression (7) is the distribution of the customer cluster, the product cluster , the distribution parameter ⁇ ′ of uc, i corresponding to the two clusters, and the relative price (feature value) of the product belonging to the product cluster. It can be said that it is the likelihood as a whole of a plurality of sets obtained by combining the parameter ⁇ .
  • the grouping unit 14 may determine the customer cluster and the product cluster by determining a plurality of sets of customer clusters, product clusters, and parameters ⁇ ′ and ⁇ so that the value of the expression (7) is maximized.
  • the grouping means 14 uses the Gibbs sampling method, the EM method, or the variational Bayes method, for example, so as to maximize the value of the expression (7), the customer cluster, the product cluster, and the parameters ⁇ ′, ⁇ What is necessary is just to define two or more sets.
  • the feature quantity calculation means 13 and the grouping means 14 are realized by a CPU of a computer, for example.
  • the CPU may read the grouping program from a program recording medium such as a computer program storage device (not shown in FIG. 5), and operate as the feature amount calculation unit 13 and the grouping unit 14 in accordance with the grouping program.
  • Each means may be realized by separate hardware.
  • FIG. 6 is a flowchart showing an example of processing progress of the second embodiment of the present invention.
  • Feature calculating unit 13 for example, based on the product master calculates the relative price r i Product for each product (step S11).
  • the feature quantity calculation means 13 may calculate the relative price of each product by calculating the formula (6) for each product. Further, in step S11, the feature amount calculating unit 13 specifies the type of the distribution of the relative price r i.
  • the grouping unit 14 refers to the purchase data and derives the number of items purchased by the customer (number of purchases u c, i ) for each combination of the customer and the item (step S12). Note that the number of purchases uc , i may be stored in the data storage unit 12 for each combination of customer and product. In that case, the grouping means 14 may read each purchase quantity u c, i from the data storage means 12.
  • the grouping unit 14 may determine the customer cluster and the product cluster by determining a plurality of sets of the customer cluster, the product cluster, and the parameters ⁇ ′ and ⁇ so that the value of Expression (7) is maximized. (Step S13).
  • a human does not give any feature to a product.
  • ri, uc, and i in this embodiment are objective data obtained from the product master and purchase data. Using such data, the grouping means 14 determines customer clusters and product clusters. Accordingly, it is possible to accurately determine a group of customers having a similar purchasing tendency and to accurately determine a group of similar products from the viewpoint of purchasing tendency.
  • the grouping means 14 determines a customer group and a product group while allowing one customer (customer ID) to belong to a plurality of groups and one product (product ID) to belong to a plurality of groups. Also good. Also in this case, the grouping means 14 can determine the customer cluster and the product cluster by determining a plurality of combinations of the customer cluster, the product cluster, and the parameters ⁇ ′ and ⁇ so that the value of the expression (7) is maximized. That's fine. Even in this case, the grouping means 14 may use the Gibbs sampling method, the EM method, or the variational Bayes method as a method of determining the customer group and the product group so that the value of the expression (7) is maximized. .
  • the grouping means 14 defines a group of customers and a group of products while allowing one customer (customer ID) to belong to a plurality of groups and one product (product ID) to belong to a plurality of groups.
  • the data analyst can find hidden features (features that are difficult to find directly) of the customer or the product by referring to the group of the customer and the group of the product.
  • the feature amount calculation unit 13 specifies the type of distribution of the feature amount of the product.
  • the type of distribution of the feature amount of the product may be determined in advance.
  • the feature amount calculation unit 13 does not have to specify the type of distribution of the feature amount of the product.
  • the grouping unit 14 may determine the customer group and the product group using the distribution parameter of the feature amount of the product in the predetermined distribution type.
  • FIG. 7 is a schematic diagram showing an example of a customer master stored in the data storage unit 2 of the first embodiment and the data storage unit 12 of the second embodiment.
  • FIG. 7 illustrates a case where the customer ID is associated with the customer's age and sex for each customer ID.
  • FIG. 8 is a schematic diagram illustrating an example of a product master stored in the data storage unit 2 of the first embodiment and the data storage unit 12 of the second embodiment.
  • FIG. 8 illustrates a case where a product ID is associated with a product name, a standard price, a product category, and a release date for each product ID.
  • FIG. 9 is a schematic diagram showing an example of purchase data stored in the data storage means 2 of the first embodiment and the data storage means 12 of the second embodiment.
  • FIG. 9 illustrates purchase data in which a customer ID, a product ID, an actual sales price of a product, and a purchase date are associated with each purchase date when the customer purchases the product. Note that the data in one row shown in FIG. 9 indicates that the customer has purchased one product.
  • FIGS. 7 to 9 are examples of data stored in the data storage means 2 and 12.
  • FIG. Specific numerical values shown in the specific examples described below are not necessarily based on the data shown in FIGS.
  • Specific example 1 shown below shows a specific example of the feature amount of the product in the second embodiment.
  • the feature quantity calculation means 13 calculates the feature quantity of each product in the category for each product category. In this example, the case where the feature amount calculation means 13 calculates a relative price as the feature amount of the product is taken as an example.
  • the feature amount calculating means 13 selects a product category one by one, and calculates an average value i av of the standard price of each product in the selected product category and a standard deviation i dev of the standard price of each product.
  • FIG. 10 is a diagram illustrating examples of average values and standard deviations calculated for two product categories of “confectionery bread” and “bread bread”, respectively.
  • the feature quantity calculation means 13 selects a product category one by one, and calculates the relative price r i of each product in the selected product category using the above-described equation (6).
  • i av and i dev in the calculation of Equation (6) are the average value i av and the standard deviation i dev calculated for the selected product category.
  • FIG. 11 is a diagram illustrating an example of the relative price calculated for each product.
  • FIG. 11 shows an example of product names and relative prices for each product ID.
  • the feature quantity calculation unit 13 designates, for example, a Gaussian distribution as the type of distribution of the relative price r i calculated as described above.
  • the feature amount calculation unit 13 may specify a standard normal distribution as the distribution type of the relative price r i .
  • the grouping means 14 refers to the purchase data, calculates the number of items that the customer has purchased the item (the number of purchases) for each combination of the customer ID and the item ID, and uses the number of purchases as the purchase performance index value. Let u c, i . Furthermore, the grouping means 14 employs a Poisson distribution as a distribution of purchase performance index values u c, i (hereinafter, the number of purchases u c, i ).
  • the grouping unit 14 determines the customer ID and the product ID based on the relative price r i of each product and the type of distribution thereof, and the number of purchases u c, i derived for each combination of the customer ID and product ID and the type of distribution thereof. Group. Since this process has already been described, the description thereof is omitted here.
  • Specific example 2 shows a specific example of example 1 described in the first embodiment.
  • the purchase tendency calculation means 3 specifies the number of purchases (purchase amount) for each actual sales price of the product for the combination of the customer ID and the product ID based on the purchase data. As a result, as illustrated in FIG. 12, information in which the number of purchases is associated with the combination of the customer ID, the product ID, and the actual sales price of the product is obtained.
  • the purchasing tendency calculation means 3 performs a regression analysis with ln (volume c, i ) as an objective variable and ln (price c, i ) as an explanatory variable.
  • volume c, i is a purchase quantity variable
  • price c, i is a price variable.
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • the grouping unit 4 groups customer IDs and product IDs based on the purchase tendency index value xc, i and the type of distribution thereof. Since this process has already been described, the description thereof is omitted here. This also applies to other specific examples described below.
  • Specific Example 3 shows a specific example of Example 2 described in the first embodiment.
  • FIG. 13 is a diagram illustrating an example of information in which a product ID and an advertisement date are associated with each other.
  • the advertisement may be a commercial message for television broadcasting or radio broadcasting.
  • the information illustrated in FIG. 13 may reflect the results of advertisements broadcasted together in conjunction with a program.
  • the information illustrated in FIG. 13 may be created based on an advertisement (for example, online advertisement) that is individually executed for each customer.
  • the purchase tendency calculation means 3 uses, as purchase data, information that associates a customer ID, a product ID, and the number of days elapsed since the most recent advertisement date on each purchase date when the customer purchased the product. Create based on.
  • FIG. 14 shows an example of information in which the customer ID, the product ID, and the number of days elapsed from the advertisement date are associated with each other.
  • the purchase tendency calculation means 3 may treat the number of days elapsed from the advertisement date as a sufficiently large value or a missing value. “Inf.” Shown in FIG. 14 means a sufficiently large value.
  • the purchase tendency calculation means 3 calculates the advertisement effective lifetime T c, i of the product for the customer for each combination of the customer “c” and the product “i”.
  • the number of purchases in the number of days c, i since the advertisement date is proportional to exp ( ⁇ day c, i / T c, i )
  • the probability that the customer “c” purchases the product “i” in the days c, i since the advertisement date is proportional to exp ( ⁇ day c, i / T c, i ).
  • the former case is shown.
  • the purchasing tendency calculation means 3 performs a regression analysis using ln (volume c, i ) as an objective variable and ln (day c, i ) as an explanatory variable.
  • volume c, i is a purchase quantity variable
  • day c, i is an elapsed day variable.
  • ⁇ 0.2 is obtained as the value of the coefficient w c, i in the equation (2).
  • the purchasing tendency calculation means 3 similarly calculates the purchasing tendency index value xc, i for each other combination of the customer ID and the product ID.
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • the purchase tendency calculation means 3 may use the number of days elapsed from the display date of the product instead of the number of days elapsed from the advertisement date.
  • the purchase tendency calculation means 3 may specify, for example, a normal distribution or a Poisson distribution as the distribution type of the purchase tendency index value xc, i .
  • Specific example 4 shows an example in which the purchase tendency index value x c, i is obtained using the number of days elapsed from the sale date of the product.
  • the purchase tendency calculation means 3 uses information on the purchase date that associates the customer ID, the product ID, and the number of days elapsed from the release date of the product on each purchase date when the customer purchased the product. create.
  • FIG. 15 shows an example of information in which the customer ID, the product ID, and the number of days elapsed from the release date are associated with each other.
  • the purchase tendency calculation means 3 calculates a new product sensitivity life T c, i of the product for the customer for each combination of the customer “c” and the product “i”.
  • the probability that the customer “c” purchases the product “i” in the number of days c, i since the product release date is exp ( ⁇ day c, i / Assume that it is proportional to T c, i ).
  • the purchase tendency calculating means 3 sets the new product sensitivity lifetime T 01,11 that maximizes the likelihood of sensitivity to the product “11” of the customer “01” as the advertisement effective lifetime T 01,11 in the above specific example. It can be obtained similarly.
  • the purchase trend calculation means 3 sets the new product sensitivity life T 01,11 as the purchase trend index value x 01,11 for the combination of the customer ID “01” and the product ID “11”.
  • the purchasing tendency calculation means 3 similarly calculates the purchasing tendency index value xc, i for each other combination of the customer ID and the product ID.
  • the purchase tendency calculation means 3 designates, for example, a Poisson distribution as the distribution type of the purchase tendency index value xc, i .
  • the purchase tendency calculation means 3 may specify a normal distribution.
  • Specific example 5 shows a specific example of example 5 described in the first embodiment.
  • the purchasing tendency calculation means 3 calculates the elapsed days from the date when the customer “c” purchased the product “i” to the next date when the same customer “c” purchased the same product “i”, respectively.
  • the average value of the elapsed days is calculated as the purchase tendency index value xc, i .
  • the average purchase interval corresponds to the optimal parameter of the distribution when the purchase interval follows the Poisson distribution.
  • the purchase tendency calculation means 3 calculates an average purchase interval (purchase tendency index value x c, i ) for each combination of customer ID and product ID. And the purchase tendency calculation means 3 produces the information which matched customer ID, goods ID, and an average purchase space
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • Specific Example 6 shows a specific example of Example 6 described in the first embodiment.
  • the product master illustrated in FIG. 17 is stored in the data storage unit 2 (see FIG. 1).
  • a product ID, a product name, a product category, and a product manufacturer are associated with each product ID.
  • the purchase data illustrated in FIG. 18 is stored in the data storage unit 2 (see FIG. 1).
  • the number of purchases (the number of purchases) in which the customer identified by the customer ID purchases the product identified by the product ID is associated with the combination of the customer ID and the product ID. .
  • the purchasing tendency calculation means 3 calculates the customer's commitment (attachment level) to the individual product in the product category.
  • the purchasing tendency calculation means 3 calculates a Skinder coefficient as the degree of sticking and sets the value as the purchasing tendency index value xc, i .
  • the purchase tendency calculating means 3 calculates the degree of sticking regarding the combination of the customer ID “01” and the product category “confectionery bread” as an example.
  • the customer “01” has one anpan (product ID “11”) and a high-quality bread (product ID “12”) as products belonging to the product category “confectionery bread”.
  • Two pieces of curry bread (product ID “15”) and one piece of melon bread (product ID “16”) are purchased. Therefore, the purchase shares of “an”, “high-quality”, “curry” and “melon” belonging to “sweet bread” by the customer “01” are “1/6”, “1/3”, “1/3” and “1”, respectively. / 6 ". Therefore, the purchasing tendency calculation means 3 calculates 0.28 as the sticking degree (in this example, the Gross coefficient) in the combination of the customer ID “01” and the product category “confectionery bread” by the following calculation.
  • the purchase tendency calculation means 3 calculates the sticking degree regarding the combination of the customer ID “02” and the product category “confectionery bread”.
  • the customer “02” has two anpan (product ID “11”), three high-quality bread (product ID “12”), and curry bread (product ID “product ID”) as products belonging to the product category “confectionery bread”. 18 ′′) is purchased (see FIGS. 17 and 18). Therefore, the purchase shares of the bread, high-quality bread and spicy curry bread belonging to the “confectionery bread” by the customer “02” are “1/3”, “1/2” and “1/6”, respectively. Therefore, the purchasing tendency calculation means 3 calculates 0.39 as the sticking degree in the combination of the customer ID “02” and the product category “confectionery bread” by the following calculation.
  • the purchase tendency calculation means 3 calculates the sticking degree for the combination of the customer ID “03” and the product category “confectionery bread”.
  • the customer “03” is a product belonging to the product category “confectionery bread”, two high-quality breads (product ID “12”), eight melon breads (product ID “16”), and yakisoba bread (product ID “17”). ) Is purchased (see FIGS. 17 and 18). Accordingly, the purchase shares of high-quality bread, melon bread and yakisoba bread belonging to “confectionery bread” by customer “03” are “2/11”, “8/11” and “1/11”, respectively. Accordingly, the purchasing tendency calculation means 3 calculates 0.57 as the sticking degree in the combination of the customer ID “03” and the product category “confectionery bread” by the following calculation.
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • FIG. 19 is a diagram illustrating an example of the sticking degree (x c, i ) for each combination of the customer ID and the product category.
  • the customer ID “01” and the customer ID “02” are grouped into the same customer group (A) by grouping by the grouping means 4, and the customer ID “03” is set as another customer group (B). )).
  • “confectionery bread” and “rice ball” are considered to be grouped into the same product category group. If such a grouping result is obtained, customer group A tends to purchase various products for “confectionery bread” and “rice ball”, and tends to select their favorite products for “bread”. Can be analyzed. Further, the customer group B can analyze that there is a tendency to purchase specific products not only for “bread bread” but also for “confectionery bread” and “rice ball”.
  • Specific Example 7 shows a specific example of Example 7 described in the first embodiment.
  • the purchase tendency calculation means 3 calculates the degree of customer's commitment (attachment) to the manufacturer of the product in the product category.
  • the purchasing tendency calculation means 3 calculates a Skinder coefficient as the degree of sticking and sets the value as the purchasing tendency index value xc, i .
  • the purchase tendency calculation means 3 refers to the product master and the purchase data, for example, for the product category “confectionery bread”, the customer ID, the manufacturer of the sweet bread purchased by the customer, and the number of purchases of the sweet bread of the manufacturer. Identify relationships. Then, it is assumed that the result shown in FIG. 20 is obtained as the relationship between the customer ID, the confectionery bread maker, and the number of confectionery bread purchases by the maker.
  • the purchasing tendency calculation means 3 calculates a sticking degree (in this example, a Mader coefficient) 0.5 in the combination of the customer ID “01” and the product category “confectionery bread” by the following calculation.
  • the purchase tendency calculation means 3 calculates a sticking degree (a Mamony coefficient in this example) 0.72 in the combination of the customer ID “02” and the product category “confectionery bread” by the following calculation.
  • the purchase tendency calculation means 3 calculates a sticking degree (a Mamony coefficient in this example) 0.70 in the combination of the customer ID “03” and the product category “confectionery bread” by the following calculation.
  • the purchase tendency calculation means 3 calculates the sticking degree (x c, i ) for each combination of the customer ID and the product category.
  • the purchasing tendency calculation means 3 designates, for example, a normal distribution as the type of distribution of the purchasing tendency index value xc, i .
  • FIG. 21 is a schematic block diagram showing a configuration example of a computer according to each embodiment of the present invention.
  • the computer 1000 includes a CPU 1001, a main storage device 1002, an auxiliary storage device 1003, and an interface 1004.
  • the grouping system of each embodiment is mounted on the computer 1000.
  • the operations of the grouping system are stored in the auxiliary storage device 1003 in the form of a program (grouping program).
  • the CPU 1001 reads out the program from the auxiliary storage device 1003, develops it in the main storage device 1002, and executes the above processing according to the program.
  • the auxiliary storage device 1003 is an example of a tangible medium that is not temporary.
  • Other examples of the non-temporary tangible medium include a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, and a semiconductor memory connected via the interface 1004.
  • this program is distributed to the computer 1000 via a communication line, the computer 1000 that has received the distribution may develop the program in the main storage device 1002 and execute the above processing.
  • the program may be for realizing a part of the above-described processing.
  • the program may be a differential program that realizes the above-described processing in combination with another program already stored in the auxiliary storage device 1003.
  • FIG. 22 is a block diagram showing an example of the outline of the present invention.
  • the grouping system 1 includes purchase tendency calculation means 3 and grouping means 4.
  • Purchasing tendency calculation means 3 uses the customer's product purchase status for each combination of the customer and the product, or for each combination of the customer and the product related matter (for example, product category) that is a matter related to the product. Calculates the tendency to purchase goods.
  • the grouping unit 4 determines a group of customers and a group of products or a product related item based on the trend and the distribution of the trend.
  • the purchase tendency calculation means 3 is based on the purchase data indicating the customer's product purchase status, for each combination of the customer and the product, or for each combination of the product related items that are items related to the customer and the product.
  • a purchase tendency index value which is an index value indicating the tendency of the customer to purchase the product.
  • the grouping means 4 determines a group of customers and a group of products or a group of product related items based on the purchase trend index value and the distribution parameter of the purchase trend index value.
  • the grouping system 1 may determine a group of services or a group of service-related matters (for example, service categories).
  • FIG. 23 is a block diagram showing another example of the outline of the present invention.
  • the grouping system 11 includes a feature amount calculation unit 13 and a grouping unit 14.
  • the feature amount calculation means 13 calculates the feature amount of the product for each product.
  • the grouping means 14 determines the customer group and the product group based on the product purchase record obtained for each combination of the customer and the product, the distribution of the product purchase record, the feature value for each product, and the feature value distribution. Determine. Specifically, the grouping means 14 obtains for each combination of a customer and a product, a purchase performance index value that is an index value indicating a product purchase performance, a distribution parameter of the purchase performance index value, and a feature amount for each product. And a group of customers and a group of products based on the distribution parameter of the feature amount.
  • the grouping system 11 may define a service group.
  • a grouping system comprising: a purchasing tendency calculation unit; and a grouping unit that determines a group of customers based on the trend and the distribution of the trend, and a group of products or a group of product-related items.
  • a purchase tendency calculation means for every combination of a customer and goods, or for every combination of goods related matters which are matters related to a customer and goods
  • the purchase trend index value which is an index value indicating the tendency of the customer to purchase the product
  • the grouping means determines the customer group based on the purchase trend index value and the distribution parameter of the purchase trend index value.
  • the grouping system according to appendix 1, which defines a group of products or a group of product-related items.
  • the grouping means uses a plurality of sets of likelihoods obtained by combining a customer group, a product group or a product-related item group, and a distribution parameter of a purchase tendency index value,
  • the grouping system according to appendix 2 which defines a group and a group of products or a group of product-related matters.
  • the purchase tendency calculating means calculates price elasticity as a purchase tendency index value for each combination of a customer and a product, and the grouping means is described in Supplementary 2 or Supplementary 3 for determining a customer group and a product group Grouping system.
  • the purchase trend calculation means calculates a value indicating the degree of days from the product advertisement date until the customer purchases the product as a purchase trend index value. 4.
  • the purchase trend calculation means calculates a value indicating the degree of days from the product release date until the customer purchases the product as a purchase trend index value. 4.
  • the purchase trend calculation means calculates a value indicating the degree of days from when the product is displayed at the store until the customer purchases the product as a purchase trend index value.
  • the means is the grouping system according to the supplementary note 2 or the supplementary note 3, which defines a customer group and a product group.
  • the purchase tendency calculating means calculates the average purchase interval as a purchase tendency index value for each combination of the customer and the product, and the grouping means is described in the supplementary note 2 or the supplementary note 3 that defines the customer group and the product group. Grouping system.
  • the purchase trend calculation means calculates the customer's commitment to an individual product in the product category as a purchase tendency index value, and the grouping means defines a group of customers.
  • the grouping system according to appendix 2 or appendix 3, wherein a group of product categories is defined as a group of product-related items.
  • the purchase trend calculation means calculates the customer's attention to an individual manufacturer of the product in the product category as a purchase tendency index value
  • the grouping means calculates the customer group
  • the grouping system according to Supplementary Note 2 or Supplementary Note 3, wherein a group of product categories is defined as a group of product-related items.
  • the purchase trend calculation means calculates the customer's attention to an individual brand of the product in the product category as a purchase tendency index value.
  • the grouping means is any one of Supplementary notes 1 to 8 that defines a group of customers and a group of products so that one customer belongs to only one group and one product belongs to only one group.
  • the grouping means allows one customer to belong to a plurality of groups and one product to belong to a plurality of groups, and defines a customer group and a product group.
  • a grouping system according to any one of the above.
  • the grouping means includes the supplementary notes 1, 2, and 7 that define a group of customers and a group of product related items such that one customer belongs to only one group and one product related item belongs to only one group.
  • the grouping system according to any one of 3, 9, 10, and 11.
  • the grouping means allows a customer to belong to a plurality of groups, and allows one product-related matter to belong to a plurality of groups, and defines a customer group and a product-related matter group.
  • the grouping system according to any one of 1, 2, 3, 9, 10, and 11.
  • the feature-value calculation means which calculates the feature-value of a product for every product, The product purchase results obtained for every combination of a customer and a product, Distribution of the said product purchase results, The said feature-value for every product,
  • a grouping system comprising grouping means for determining a group of customers and a group of products based on the distribution of feature quantities.
  • the grouping means includes a purchase record index value that is an index value indicating a product purchase record obtained for each combination of a customer and a product, a distribution parameter of the purchase record index value, and a feature value for each product.
  • the grouping system according to attachment 16 wherein a group of customers and a group of products are defined based on the distribution parameter of the feature amount.
  • the grouping means uses a plurality of sets of likelihoods obtained by combining a customer group, a product group, a distribution parameter of purchase performance index values, and a distribution parameter of the feature amount of the product.
  • the grouping system according to appendix 17, which defines a customer group and a product group.
  • the grouping means is any one of supplementary note 16 to supplementary note 19, which defines a customer group and a product group so that one customer belongs to only one group and one product belongs to only one group.
  • the grouping means allows one customer to belong to a plurality of groups and one product to belong to a plurality of groups, and defines a customer group and a product group.
  • a grouping system according to any one of the above.
  • a grouping system comprising: a purchasing tendency calculation means; and a grouping means for determining a group of customers and a group of services or service-related matters based on the trend and the distribution of the trends.
  • the feature-value calculation means which calculates the feature-value of a service for every service, The service purchase track record obtained for every combination of a customer and a service, Distribution of the said service purchase track record, The said feature-value for every service, A grouping system comprising grouping means for determining a group of customers and a group of services based on the distribution of feature quantities.
  • the tendency for the customer to purchase the product is calculated for each combination of the customer and the product, or for each combination of the product and the product-related item that is related to the customer and the product.
  • a grouping method characterized by defining a group of customers and a group of products or a group of product related items based on the trend and the distribution of the trends.
  • the feature-value of a product is calculated for every product,
  • the product purchase track record obtained for every combination of a customer and a product, the distribution of the said product purchase track record, the said feature-value for every product, and the distribution of the feature-value
  • a grouping method characterized by defining a group of customers and a group of products based on
  • the tendency for the customer to purchase the service is calculated for each combination of the customer and the service, or for each combination of the service and related items that are related to the customer and the service.
  • a grouping method characterized by defining a group of customers and a group of services or a group of service-related matters based on the trend and the distribution of the trends.
  • the feature-value of a service is calculated for every service, The service purchase track record obtained for every combination of a customer and a service, the distribution of the said service purchase track record, the said feature-value for every service, and the distribution of the said feature-value
  • a grouping method characterized in that a group of customers and a group of services are defined based on
  • a feature amount calculation process for calculating a feature amount of a product for each product, a product purchase record obtained for each combination of a customer and a product, a distribution of the product purchase record, and the product purchase result A grouping program for executing a grouping process for determining a group of customers and a group of products based on the feature amount and the distribution of the feature amount.
  • the feature-value calculation process which calculates the feature-value of a service for every service in a computer, the service purchase performance obtained for every combination of a customer and a service, the distribution of the said service purchase performance, and the said for every service
  • a grouping program for executing a grouping process for determining a customer group and a service group based on a feature amount and a distribution of the feature amount.
  • the purchase tendency calculation means 3 is a tendency for the customer to purchase a product for each combination of the customer and the product or for each combination of the customer and the product-related matter ( Specifically, the case of calculating the purchasing tendency index value) is shown.
  • the grouping system may be configured to acquire a tendency (purchasing tendency index value) of a customer to purchase a product from the outside. A configuration example of the grouping system in this case is shown in FIG.
  • the grouping system 90 shown in FIG. 24 includes purchase tendency acquisition means 95 and grouping means 4.
  • the purchase tendency acquisition unit 95 acquires a tendency (purchasing tendency index value) that the customer purchases the product for each combination of the customer and the product, or for each combination of the customer and the product related item. At this time, the purchasing tendency acquisition means 95 also acquires information on the type of distribution of the purchasing tendency index value. For example, on a server provided outside the grouping system 90, a purchase tendency index value determined for each combination of a customer and a product or a combination of a customer and a product-related item, and a type of distribution of the purchase trend index value Is stored in advance by the administrator. The purchase tendency acquisition unit 95 may acquire information on each purchase tendency index value and the type of distribution of the purchase tendency index value from the server via the communication network.
  • the aspect in which the purchase tendency acquisition means 95 acquires a purchase tendency index value etc. from the outside is not limited to said aspect, Another aspect may be sufficient.
  • the purchase tendency acquisition unit 95 may accept information on each purchase tendency index value and its distribution type input from the outside.
  • the purchase trend index value acquired by the purchase trend acquisition unit 95 is the same as the purchase trend index value calculated by the purchase trend calculation unit 3 in the first embodiment.
  • the grouping means 4 determines a group of customers and a group of products or a group of product related items based on the tendency of the customer to purchase products and their distribution. This operation is the same as the operation of the grouping unit 4 of the first embodiment.
  • the purchase tendency acquisition unit 95 and the grouping unit 4 are realized by a CPU of a computer, for example.
  • the CPU may read the grouping program from a program recording medium such as a computer program storage device (not shown in FIG. 24) and operate as the purchase tendency acquisition unit 95 and the grouping unit 4 according to the grouping program.
  • a program recording medium such as a computer program storage device (not shown in FIG. 24)
  • Each means may be realized by separate hardware.
  • the grouping program obtains a purchase tendency for the customer to acquire a tendency to purchase the product for each combination of the customer and the product or for each combination of the product and the product-related matter that is a matter related to the customer and the product. It can be said that the program is a program for executing a grouping process for determining a group of products and a group of product-related items as well as a group of customers based on the process and the trend and the distribution of the trend.
  • the purchase tendency acquisition unit 95 may acquire a tendency for a customer to purchase a service for each combination of a customer and a service, or for each combination of a customer and a service-related item.
  • the grouping means 4 may determine a group of customers and a group of services or a group of service related matters based on the tendency of the customer to purchase the service and its distribution.
  • the feature amount calculation unit 13 calculates the feature amount of the product for each product
  • the grouping unit 14 records the product purchase record for each combination of the customer and the product ( Specifically, the case where the product purchase actual value) is calculated is shown.
  • the grouping system may be configured to acquire the feature amount of the product and the product purchase record (product purchase record value) from the outside. A configuration example of the grouping system in this case is shown in FIG.
  • 25 includes an information acquisition unit 96 and a grouping unit 97.
  • the information acquisition unit 96 acquires the feature amount of the product for each product. At this time, the information acquisition unit 96 also acquires information on the type of distribution of the feature amount.
  • the information acquisition means 96 also acquires a product purchase record value for each combination of customer and product. At this time, the information acquisition unit 96 also acquires information on the distribution type of the product purchase record value.
  • the administrator stores in advance information on the feature amount of each product determined for each product and the type of distribution of the feature amount in a server provided outside the grouping system 91. Further, the manager stores in advance information on the product purchase record value determined for each combination of the customer and the product and the distribution type of the product purchase record value in the server.
  • the information acquisition unit 96 receives information about the feature amount of each product and the distribution type of the feature amount, and information about the distribution type of each product purchase actual value and the product purchase actual value from the server via the communication network. And get it.
  • the aspect in which the information acquisition means 96 acquires such information is not limited to the above aspect, and may be another aspect. For example, even if the information acquisition means 96 accepts information on the feature amount of each product and the type of distribution of the feature amount input from the outside, information on the type of each product purchase actual value and the distribution of the product purchase actual value, Good.
  • the feature amount of the product acquired by the information acquisition unit 96 is the same as the feature amount of the product calculated by the feature amount calculation unit 13 in the second embodiment.
  • the product purchase record value acquired by the information acquisition unit 96 is the same as the product purchase record value calculated by the grouping unit 14 in the second embodiment.
  • the grouping means 97 determines the customer group based on the product purchase record value determined for each combination of the customer and the product, the distribution of the product purchase record value, the feature value for each product, and the feature value distribution. And define product groups. This operation is the same as the operation in which the grouping means 14 determines the customer group and the product group in the second embodiment.
  • the information acquisition unit 96 and the grouping unit 97 are realized by a CPU of a computer, for example.
  • the CPU may read the grouping program from a program recording medium such as a computer program storage device (not shown in FIG. 25) and operate as the information acquisition unit 96 and the grouping unit 97 according to the grouping program.
  • a program recording medium such as a computer program storage device (not shown in FIG. 25)
  • Each means may be realized by separate hardware.
  • the grouping program causes the computer to acquire the feature amount of the product for each product, the product purchase results determined for each combination of the customer and the product, the distribution of the product purchase results, It can be said that this is a program for executing a grouping process for determining a group of customers and a group of products based on each feature quantity and the distribution of the feature quantity.
  • the information acquisition means 96 includes a service feature amount determined for each service, information on the type of distribution of the feature amount, a service purchase record determined for each combination of customer and service, and a distribution of the service purchase record May be acquired.
  • the grouping means 97 determines the customer based on the service purchase record obtained for each combination of the customer and the service, the distribution of the service purchase record, the feature value for each service, and the distribution of the feature value. And a group of services may be defined.
  • the present invention is suitably applied to a grouping system that groups customers and items related to products or items related to services or services.

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

 似た購買傾向を有する顧客のグループを精度よく定めるとともに、購買傾向の観点で類似した商品もしくは商品に関連する事項のグループまたは購買傾向の観点で類似したサービスもしくはサービスに関連する事項のグループを精度よく定めることができるグルーピングシステムを提供する。購買傾向算出手段3は、顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出する。グルーピング手段4は、その傾向およびその傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定める。

Description

グルーピングシステム、グルーピング方法およびグルーピングプログラム
 本発明は、顧客をグルーピングするとともに、商品もしくは商品に関連する事項またはサービスもしくはサービスに関連する事項をグルーピングするグルーピングシステム、グルーピング方法およびグルーピングプログラムに関する。
 非特許文献1には、顧客のクラスタを作る方法が記載されている。非特許文献1に記載された方法では、予め各商品に「低価格」、「高級」等の特徴を付与する。なお、商品に付与される特徴は、商品DNAと呼ばれる場合がある。そして、非特許文献1に記載された方法では、各顧客が購入した商品に付与されている特徴を総計し、その結果を顧客の特徴とする。この特徴は、顧客DNAと呼ばれる場合がある。非特許文献1に記載された方法では、この顧客の特徴に基づいて、顧客のクラスタを作成する。
 非特許文献2には、顧客を分類する方法が記載されている。非特許文献2に記載の方法では、ライフスタイルを表す「お手軽健康系」、「時間節約系」といった商品DNAを決め、種々の商品に付与する。そして、例えば、「お手軽健康系」という商品を一定量購入する顧客も、「お手軽健康系」に分類する。
 また、特許文献1には、価格への感度に従って消費者を分類することや、需要の交差弾力性や、標準産業分類システムに基づいて、製品カテゴリを決定することが記載されている。そして、特許文献1には、製品カテゴリ内の製品を、その製品を購入する消費者のタイプによってグルーピングすることが記載されている。
特表2008-516355号公報(段落0021,0027-0030等参照)
Clive Humby, Terry Hunt, Tim Phillips, "Scoring Points: How Tesco continues to win customer loyalty", 2ND EDITION, Kogan Page Ltd. "購入動機やライフスタイルを分析、「商品DNA」で売り上げ4割増(2/2)"、日経BP社、[2014年9月18日検索]、インターネット<URL: http://itpro.nikkeibp.co.jp/article/JIREI/20081020/317282/?ST=cio&P=2>
 本願発明の発明者は、以下のように定義される「購買傾向の観点で類似した商品のグループ」および「似た購買傾向を有する顧客のグループ」を着想した。
 「購買傾向の観点で類似した商品のグループ」とは、同じ「似た購買傾向を有する顧客のグループ」に属する顧客が、似たような購買傾向を示す商品のグループである。
 「似た購買傾向を有する顧客のグループ」とは、同じ「購買傾向の観点で類似した商品のグループ」に属する商品に対して、似た購買傾向を示す顧客のグループである。
 なお、「購買傾向の観点で類似した商品のグループ」は、「似た購買傾向を有する顧客のグループ」に基づいて定義され、「似た購買傾向を有する顧客のグループ」は、「購買傾向の観点で類似した商品のグループ」に基づいて定義される。従って、「購買傾向の観点で類似した商品のグループ」および「似た購買傾向を有する顧客のグループ」は、いわゆる、鶏と卵の関係にあると言える。
 種々の商品に対して種々の顧客が感じる価値観を分析するときに、「似た購買傾向を有する顧客のグループ」および「購買傾向の観点で類似した商品のグループ」を定めることは有用である。また、そのような商品のグループの代わりに、購買傾向の観点で類似した商品カテゴリのグループ等のように、商品に関連する事項のグループを定めることも有用である。なお、購買傾向の観点で類似した商品カテゴリのグループ等は、購買傾向の観点で類似した商品のグループの定義において、商品を、商品カテゴリ等に置き換えることで定義される。
 しかし、非特許文献1に記載された方法では、「似た購買傾向を有する顧客のグループ」の精度が悪くなる可能性がある。非特許文献1に記載された方法では、各商品に特徴を付与する作業は人手で行われる。従って、非特許文献1に記載された方法によって得られる顧客のクラスタの精度は商品への特徴の付与の仕方に依存し、顧客のクラスタの精度が悪くなる可能性がある。非特許文献2に記載された方法でも同様である。
 そこで、本発明は、似た購買傾向を有する顧客のグループを精度よく定めるとともに、購買傾向の観点で類似した商品もしくは商品に関連する事項のグループまたは購買傾向の観点で類似したサービスもしくはサービスに関連する事項のグループを精度よく定めることができるグルーピングシステム、グルーピング方法およびグルーピングプログラムを提供することを目的とする。
 本発明によるグルーピングシステムは、顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出する購買傾向算出手段と、その傾向およびその傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定めるグルーピング手段とを備えることを特徴とする。
 また、本発明によるグルーピングシステムは、商品毎に商品の特徴量を算出する特徴量算出手段と、顧客および商品の組み合わせ毎に得られる商品購買実績と、商品購買実績の分布と、商品毎の特徴量と、特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定めるグルーピング手段とを備えることを特徴とする。
 また、本発明によるグルーピングシステムは、顧客のサービス購買状況に基づいて、顧客およびサービスの組み合わせ毎、または、顧客および、サービスに関連する事項であるサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を算出する購買傾向算出手段と、
 その傾向およびその傾向の分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定めるグルーピング手段とを備えることを特徴とする。
 また、本発明によるグルーピングシステムは、サービス毎にサービスの特徴量を算出する特徴量算出手段と、顧客およびサービスの組み合わせ毎に得られるサービス購買実績と、サービス購買実績の分布と、サービス毎の特徴量と、特徴量の分布とに基づいて、顧客のグループおよびサービスのグループを定めるグルーピング手段とを備えることを特徴とする。
 また、本発明によるグルーピング方法は、顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出し、その傾向およびその傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定めることを特徴とする。
 また、本発明によるグルーピング方法は、商品毎に商品の特徴量を算出し、顧客および商品の組み合わせ毎に得られる商品購買実績と、商品購買実績の分布と、商品毎の特徴量と、特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定めることを特徴とする。
 また、本発明によるグルーピング方法は、顧客のサービス購買状況に基づいて、顧客およびサービスの組み合わせ毎、または、顧客および、サービスに関連する事項であるサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を算出し、その傾向およびその傾向の分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定めることを特徴とする。
 また、本発明によるグルーピング方法は、サービス毎にサービスの特徴量を算出し、顧客およびサービスの組み合わせ毎に得られるサービス購買実績と、サービス購買実績の分布と、サービス毎の特徴量と、特徴量の分布とに基づいて、顧客のグループおよびサービスのグループを定めることを特徴とする。
 また、本発明によるグルーピングプログラムは、コンピュータに、顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出する購買傾向算出処理、および、その傾向およびその傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定めるグルーピング処理を実行させることを特徴とする。
 また、本発明によるグルーピングプログラムは、コンピュータに、商品毎に商品の特徴量を算出する特徴量算出処理、および、顧客および商品の組み合わせ毎に得られる商品購買実績と、商品購買実績の分布と、商品毎の特徴量と、特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定めるグルーピング処理を実行させることを特徴とする。
 また、本発明によるグルーピングプログラムは、コンピュータに、顧客のサービス購買状況に基づいて、顧客およびサービスの組み合わせ毎、または、顧客および、サービスに関連する事項であるサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を算出する購買傾向算出処理、および、その傾向およびその傾向の分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定めるグルーピング処理を実行させることを特徴とする。
 また、本発明によるグルーピングプログラムは、コンピュータに、サービス毎にサービスの特徴量を算出する特徴量算出処理、および、顧客およびサービスの組み合わせ毎に得られるサービス購買実績と、サービス購買実績の分布と、サービス毎の特徴量と、特徴量の分布とに基づいて、顧客のグループおよびサービスのグループを定めるグルーピング処理を実行させることを特徴とする。
 本発明によれば、似た購買傾向を有する顧客のグループを精度よく定めるとともに、購買傾向の観点で類似した商品もしくは商品に関連する事項のグループまたは購買傾向の観点で類似したサービスもしくはサービスに関連する事項のグループを精度よく定めることができる。
本発明の第1の実施形態のグルーピングシステムの例を示すブロック図である。 Co-クラスタリング実行前の顧客IDおよび商品IDを模式的に示す図である。 グルーピング手段によって定められた顧客のグループおよび商品のグループの例を模式的に示す説明図である。 本発明の第1の実施形態の処理経過の例を示すフローチャートである。 本発明の第2の実施形態のグルーピングシステムの例を示すブロック図である。 本発明の第2の実施形態の処理経過の例を示すフローチャートである。 顧客マスタの例を示す模式図である。 商品マスタの例を示す模式図である。 購買データの例を示す模式図である。 2つの商品カテゴリについてそれぞれ算出された平均値および標準偏差の例を示す図である。 商品毎に算出された相対価格の例を示す図である。 顧客ID、商品IDおよび商品の実際の販売価格の組み合わせに対して、購買数を対応付けた情報の例を示す図である。 商品IDと広告日とを対応付けた情報の例を示す図である。 顧客ID、商品ID、および広告日からの経過日数を対応付けた情報の例を示す図である。 顧客ID、商品ID、および発売日からの経過日数を対応付けた情報の例を示す図である。 顧客IDと、商品IDと、平均購買間隔とを対応付けた情報の例を示す図である。 商品マスタの例を示す模式図である。 購買データの例を示す模式図である。 顧客IDと商品カテゴリの組み合わせ毎のこだわり度の例を示す図である。 顧客IDと、菓子パンのメーカと、そのメーカの菓子パンの購買数との関係の例を示す図である。 本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。 本発明の概要の例を示すブロック図である。 本発明の概要の他の例を示すブロック図である。 顧客が商品を購買する傾向(購買傾向指標値)を外部から取得する場合のグルーピングシステムの構成例を示すブロック図である。 商品の特徴量、および、商品購買実績(商品購買実績値)を外部から取得する場合のグルーピングシステムの構成例を示すブロック図である。
 以下、本発明の実施形態を図面を参照して説明する。なお、以下に説明する各実施形態では、本発明が、顧客をグルーピングするとともに、商品または商品に関連する事項をグルーピングする場合を例にして説明する。ただし、本発明は、顧客をグルーピングするとともに、サービスまたはサービスに関連する事項(例えば、サービスのカテゴリ)をグルーピングしてもよい。
実施形態1.
 図1は、本発明の第1の実施形態のグルーピングシステムの例を示すブロック図である。第1の実施形態のグルーピングシステム1は、データ記憶手段2と、購買傾向算出手段3と、グルーピング手段4とを備える。
 データ記憶手段2は、顧客の商品購買状況を示す購買データを記憶する記憶装置である。データ記憶手段2は、例えば、顧客マスタおよび商品マスタを記憶するとともに、顧客が商品を購買した各購買日における、顧客ID、商品ID、商品の販売価格および購買日を対応付けた情報を購買データとして記憶してもよい。顧客マスタは、各顧客の属性(年齢、性別等)を示す情報である。例えば、顧客マスタは、顧客IDと顧客の各属性とを対応付けた情報の集合である。商品マスタは、各商品の属性(商品名、標準価格、商品カテゴリ、発売日等)を示す情報である。例えば、商品マスタは、商品IDと商品の各属性とを対応付けた情報の集合である。また、顧客IDは、顧客の識別情報であり、商品IDは、商品の識別情報である。
 購買傾向算出手段3は、購買データに基づいて、顧客および商品の組み合わせ毎に、購買傾向指標値を算出する。購買傾向指標値は、顧客が商品を購買する傾向を示す指標値である。様々な値を購買傾向指標値として用いることができる。購買傾向算出手段3が購買傾向指標値を算出する動作の例については後述する。
 ただし、ある顧客がある商品を購買したことがない場合、購買傾向算出手段3は、その顧客およびその商品の組み合わせについては、購買傾向指標値を算出しなくてよい。
 以下の説明では、顧客を顧客IDで識別する。顧客IDを符号cで表す。また、商品を商品IDで識別する。商品IDを符号iで表す。また、顧客ID“c”の顧客と商品ID“i”の商品との組み合わせに対して、購買傾向算出手段3が算出した購買傾向指標値をxc,iと記す。例えば、顧客ID“2”の顧客と商品ID“5”の商品との組み合わせに対して算出された購買傾向指標値をx2,5と記す。
 また、顧客ID“c”の顧客を、顧客“c”と記す。商品ID“i”の商品を商品“i”と記す。
 また、購買傾向算出手段3は、購買傾向指標値の分布の種別を指定する。購買傾向指標値の分布の種別は、どのような値を購買傾向指標値として算出するかに応じて変わる場合がある。
 また、購買傾向算出手段3は、顧客および商品の組み合わせ毎ではなく、顧客および商品関連事項の組み合わせ毎に、購買傾向指標値を算出してもよい。商品関連事項は、商品そのものではなく、商品に関連する事項である。商品関連事項の例として、例えば、商品カテゴリが挙げられる。なお、商品関連事項は、商品カテゴリに限定されない。商品関連事項もIDで識別する。商品関連事項を識別するIDは、商品IDと同様にiで表す。顧客ID“c”の顧客とID“i”の商品関連事項の組み合わせに対して算出された購買傾向指標値もxc,iと記す。
 ID“i”の商品関連事項を商品関連事項“i”と記す。例えば、ID“1”の商品カテゴリを、商品カテゴリ“1”と記す。
 購買傾向算出手段3が顧客および商品の組み合わせ毎に購買傾向指標値xc,iを算出した場合、グルーピング手段4は、顧客のグループおよび商品のグループを定める。
 また、購買傾向算出手段3が顧客および商品関連事項の組み合わせ毎に購買傾向指標値xc,iを算出した場合、グルーピング手段4は、顧客のグループおよび商品関連事項のグループを定める。例えば、購買傾向算出手段3が顧客および商品カテゴリの組み合わせ毎に購買傾向指標値xc,iを算出した場合、グルーピング手段4は、顧客のグループおよび商品カテゴリのグループを定める。
 以下、購買傾向指標値の例を説明する。購買傾向算出手段3は、以下に示す例のうちのいずれかの購買傾向指標値を算出すればよい。あるいは、購買傾向算出手段3は、以下に例示する値以外の値を購買傾向指標値として算出してもよい。以下の説明では、任意の変数vの自然対数をln(v)と記す。
(例1)
 例1では、顧客が商品の値下げ(割引率でもよい。)に応じてその商品の購買量を変える度合いを、購買傾向算出手段3が購買傾向指標値として算出する。例えば、購買傾向算出手段3は、価格弾力性を購買傾向指標値として算出する。
 この場合、購買傾向算出手段3は、例えば、顧客ID、商品ID、および、商品の実際の販売価格の組み合わせに対して、購買量を対応付けた情報を、購買データに基づいて作成する。このとき、顧客ID同士が共通であり、かつ、商品ID同士が共通であっても、販売価格が異なっていれば、購買傾向算出手段3は、別の組とする。すなわち、購買傾向算出手段3は、顧客IDおよび商品IDの組み合わせに対して、その商品の実際の販売価格毎に、購買数を特定する。
 商品の実際の販売価格は変動し得るので、この販売価格を価格変数pricec,iと記す。顧客ID、商品IDおよび実際の販売価格の組に対応する購買量も変動し得るので、この購買量を、購買量変数volumec,iと記す。購買傾向算出手段3は、購買データに基づいて作成した上記の情報を参照し、ln(volumec,i)を目的変数とし、ln(pricec,i)を説明変数とする回帰分析を行う。この回帰分析によって、以下に示す式(1)におけるwc,iが得られる。
 ln(volumec,i)=wc,i×ln(pricec,i)+b   式(1)
 購買傾向算出手段3は、式(1)におけるwc,iを、購買傾向指標値xc,iとして算出する。
 また、購買傾向算出手段3は、購買傾向指標値xc,iとして、上記のwc,iの絶対値を求めてもよい。この値は、価格弾力性である。
 例1では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
(例2)
 例2では、商品の広告日から顧客が商品を購買するまでの日数の程度を示す値を、購買傾向算出手段3が購買傾向指標値として算出する。
 この場合、データ記憶手段2には、商品IDと、その商品の広告日とを対応付けた情報も記憶させておく。
 購買傾向算出手段3は、例えば、顧客が商品を購買した各購買日における、顧客IDと、商品IDと、その商品の直近の広告日からの経過日数とを対応付けた情報を、購買データに基づいて作成する。
 顧客“c”が商品“i”を購買した各購買日におけるその商品の広告日からの経過日数を、経過日数変数dayc,iと記す。また、各購買日において顧客“c”がその商品“i”を購買した購買量を、購買量変数volumec,iと記す。購買傾向算出手段3は、購買データに基づいて作成した上記の情報を参照し、ln(volumec,i)を目的変数とし、ln(dayc,i)を説明変数とする回帰分析によって、以下に示す式(2)におけるwc,iを得る。
 ln(volumec,i)=wc,i×ln(dayc,i)+b   式(2)
 購買傾向算出手段3は、式(2)におけるwc,iを、購買傾向指標値xc,iとして算出する。
 また、購買傾向算出手段3は、購買傾向指標値xc,iとして、上記のwc,iの絶対値の逆数を求めてもよい。この値は、顧客“c”に対する商品“i”の広告有効寿命であるということができる。
 例2では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
(例3)
 例3では、新商品の発売日から顧客が商品を購買するまでの日数の程度を示す値を、購買傾向算出手段3が購買傾向指標値として算出する。
 この場合、購買傾向算出手段3は、例えば、顧客が商品を購買した各購買日における、顧客IDと、商品IDと、その商品の発売日からの経過日数とを対応付けた情報を、購買データに基づいて作成する。
 顧客“c”が商品“i”を購買した各購買日における商品発売日からの経過日数を、経過日数変数dayc,iと記す。また、各購買日においてその顧客“c”がその商品“i”を購買した購買量を、購買量変数volumec,iと記す。購買傾向算出手段3は、購買データに基づいて作成した上記の情報を参照し、ln(volumec,i)を目的変数とし、ln(dayc,i)を説明変数とする回帰分析によって、以下に示す式(3)におけるwc,iを得る。
 ln(volumec,i)=wc,i×ln(dayc,i)+b   式(3)
 購買傾向算出手段3は、式(3)におけるwc,iを、購買傾向指標値xc,iとして算出する。
 また、購買傾向算出手段3は、購買傾向指標値xc,iとして、上記のwc,iの絶対値の逆数を求めてもよい。この値は、新商品感度寿命であるということができる。
 例3では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。あるいは、購買傾向算出手段3は、ポアソン分布を指定してもよい。
(例4)
 例4では、商品が店舗に陳列されてから顧客が商品を購買するまでの日数の程度を示す値を、購買傾向算出手段3が購買傾向指標値として算出する。
 この場合、データ記憶手段2には、商品IDと、その商品の陳列日とを対応付けた情報も記憶させておく。
 購買傾向算出手段3は、例えば、顧客が商品を購買した各購買日における、顧客IDと、商品IDと、その商品の陳列日からの経過日数とを対応付けた情報を、購買データに基づいて作成する。
 顧客“c”が商品“i”を購買した各購買日におけるその商品の陳列日からの経過日数を、経過日数変数dayc,iと記す。また、各購買日においてその顧客“c”がその商品“i”を購買した購買量を、購買量変数volumec,iと記す。購買傾向算出手段3は、購買データに基づいて作成した上記の情報を参照し、ln(volumec,i)を目的変数とし、ln(dayc,i)を説明変数とする回帰分析によって、以下に示す式(4)におけるwc,iを得る。
 ln(volumec,i)=wc,i×ln(dayc,i)+b   式(4)
 購買傾向算出手段3は、式(4)におけるwc,iを、購買傾向指標値xc,iとして算出する。
 また、購買傾向算出手段3は、購買傾向指標値xc,iとして、上記のwc,iの絶対値の逆数を求めてもよい。
 例4では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
 なお、店舗が、一度、商品の陳列をやめ、再度その商品を陳列した場合、購買傾向算出手段3は、顧客IDと、商品IDと、その商品の陳列日からの経過日数とを対応付けた情報を、作成してもよい。
(例5)
 例5では、顧客がある商品を購買してから次にその商品を購買するまでの日数の程度を示す値を、購買傾向算出手段3が購買傾向指標値として算出する。
 この場合、購買傾向算出手段3は、例えば、顧客IDと、商品IDと、商品の平均購買間隔とを対応付けた情報を、購買データに基づいて作成する。そして、顧客IDと商品IDの組み合わせに対応する平均購買間隔を、購買傾向指標値xc,iとする。
 すなわち、購買傾向算出手段3は、顧客“c”が商品“i”を購買した日から、次に同一の顧客“c”が同一の商品“i”を購買した日までの経過日数をそれぞれ計算し、その経過日数の平均値を、購買傾向指標値xc,iとして算出する。
 例5では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
 上記の例1から例5において、購買傾向算出手段3は、顧客と商品の組み合わせ毎に購買傾向指標値xc,iを算出する。
(例6)
 例6では、商品カテゴリ内の個別の商品への顧客のこだわり度(換言すれば、愛着度)を、購買傾向算出手段3が購買傾向指標値として算出する。
 例6では、購買傾向算出手段3は、例えば、ハーフィンダール係数またはジニ係数等を、購買傾向指標値xc,iとして算出する。例えば、ハーフィンダール係数を算出する場合、購買傾向算出手段3は、商品カテゴリ“i”に属する商品について、顧客“c”によるその商品カテゴリ“i”の中での購買シェアを求め、商品カテゴリ“i” に属する各商品について求めた購買シェアの二乗の総和を算出する。購買傾向算出手段3は、この値(ハーフィンダール係数)を購買傾向指標値xc,iとする。本例では、購買傾向算出手段3は、顧客と商品カテゴリの組み合わせ毎に購買傾向指標値xc,iを算出する。
 xc,iが小さい値であるということは、顧客“c”が商品カテゴリ“i”の様々な商品を買い回り、商品に多様性を求めていることを表している。
 例6では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
 例6において、商品カテゴリの代わりに、商品関連事項として、例えば、商品DNAを適用してもよい。
(例7)
 例7では、商品カテゴリ内の個別の商品のメーカへの顧客のこだわり度(換言すれば、愛着度)を、購買傾向算出手段3が購買傾向指標値として算出する。
 例7では、購買傾向算出手段3は、例えば、ハーフィンダール係数またはジニ係数等を、購買傾向指標値xc,iとして算出する。例えば、ハーフィンダール係数を算出する場合、ある商品カテゴリ“i”に属する各メーカについて、顧客“c”によるその商品カテゴリ“i”の中での購買シェアを求め、商品カテゴリ“i” に属する各メーカについて求めた購買シェアの二乗の総和を算出する。購買傾向算出手段3は、この値(ハーフィンダール係数)を購買傾向指標値xc,iとする。
 例7では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
 例7において、メーカの代わりに、商品のブランド等を適用してもよい。
 例6および例7において、購買傾向算出手段3は、顧客と商品関連事項(上記の例では商品カテゴリ)の組み合わせ毎に購買傾向指標値xc,iを算出する。
 グルーピング手段4は、購買傾向算出手段3によって算出された各購買傾向指標値xc,i、および、指定された購買傾向指標値xc,iの分布の種別に基づいて、顧客のグループおよび商品のグループを定める。なお、グルーピング手段4は、顧客のグループおよび商品関連事項(例えば、商品カテゴリ)のグループを定めてもよい。いずれの場合であっても、グルーピング手段4の動作は同様である。以下の説明では、グルーピング手段4が顧客のグループおよび商品のグループを定める場合を例にして説明する。
 また、以下の説明では、一人の顧客(換言すれば、1つの顧客ID)が1つのグループのみに属し、1つの商品(換言すれば、1つの商品ID)が1つのグループのみに属するように、グルーピングを行う場合を例にして説明する。このように、1つの要素が1つのグループのみに属するようにグループを定めることをクラスタリングと呼ぶ。クラスタリングによって得られたグループをクラスタと呼ぶ。また、複数の対象(本例では顧客および商品)に対してそれぞれ同時にクラスタリングを行うことをCo-クラスタリングと呼ぶ。すなわち、以下の説明では、グルーピング手段4がCo-クラスタリングを実行する場合を例にして説明する。
 図2は、Co-クラスタリング実行前の顧客IDおよび商品IDを模式的に示す図である。図2に示す例では、縦軸方向に顧客IDを順番に並べ、横軸方向に商品IDを順番に並べた状態を図示している。また、購買傾向算出手段3によって算出された個々の購買傾向指標値xc,iは、それぞれ、1つの顧客IDと1つの商品IDとの組み合わせに対応している。例えば、図2に示すx2,1は、顧客ID“2”と商品ID“1”との組み合わせに対応している。なお、ある顧客がある商品を購買したことがない場合、その顧客および商品の組み合わせについては、購買傾向指標値xc,iは算出されていなくてよい。
 図3は、グルーピング手段4によって定められた顧客のグループ(顧客クラスタ)および商品のグループ(商品クラスタ)の例を模式的に示す説明図である。図3では、説明を簡単にするため、商品クラスタとしてID“9”の商品クラスタのみを図示し、顧客クラスタとしてID“3”の顧客クラスタのみを図示している。図3では、商品クラスタおよび顧客クラスタを1つずつ図示しているが、グルーピング手段4は、複数の商品クラスタおよび複数の顧客クラスタを定める。商品クラスタの数および顧客クラスタの数は、固定の値に定めてもよく、あるいは、固定の値に限定されなくてもよい。以下の説明では、商品クラスタのIDが“a”であるとき、その商品クラスタを商品クラスタ“a”と記す。同様に、顧客クラスタのIDが“b”であるとき、その顧客クラスタを顧客クラスタ“b”と記す。
 図3に示す例では、グルーピング手段4によって定められた商品クラスタ“9”には、商品“6”,“8”,“10”が属しているものとする。また、グルーピング手段4によって定められた顧客クラスタ“3”には、顧客“2”,“5”,“9”が属しているものとする。なお、商品クラスタに属する商品(商品ID)の数や、顧客クラスタに属する顧客(顧客ID)の数は、特に限定されない。
 1つの商品クラスタおよび1つの顧客クラスタの組み合わせには、その商品クラスタに属する商品およびその顧客クラスタに属する顧客の組み合わせに応じた購買傾向指標値xc,iが対応している。例えば、図3に示す例では、商品クラスタ“9”および顧客クラスタ“3”の組み合わせには、x2,6,x5,6等が対応している。各商品クラスタおよび各顧客クラスタが定められた場合、1つの商品クラスタおよび1つの顧客クラスタの組み合わせ毎に、指定された分布の種別における、購買傾向指標値xc,iの分布のパラメータも定まることになる。例えば、商品クラスタ“9”および顧客クラスタ“3”の組み合わせに対応するx2,6,x5,6等の分布のパラメータも定まることになる。図3では、商品クラスタ“9”および顧客クラスタ“3”の組み合わせに対応するパラメータをθ3,9と表している。xc,iの分布のパラメータの例として、例えば、平均値や分散等が挙げられる。また、θ3,9等は、例えば、平均値や分散等を要素とするベクトルとして表現されてもよい。
 なお、図3は、同一の商品クラスタに属する商品IDが連続して並び、かつ、同一の顧客クラスタに属する顧客IDが連続して並ぶように、図2を変形した図であると言うことができる。
 グルーピング手段4は、例えば、顧客クラスタ(顧客のグループ)と、商品クラスタ(商品のグループ)と、購買傾向指標値xc,iの分布のパラメータとを組み合わせて得られる複数の組の尤度が最大になるように、各顧客クラスタおよび各商品クラスタを定める。この尤度は、以下に示す式(5)で表される。あるいは、グルーピング手段4は、式(5)に示すθを周辺化した周辺尤度の下限を最大化させる処理、または、それに類する処理を施すことによって、顧客クラスタおよび商品クラスタを得てもよい。
Figure JPOXMLDOC01-appb-M000001
 式(5)において、Cは、顧客IDの集合であり、Iは、商品IDの集合である。換言すれば、Cは、顧客の集合であり、Iは、商品の集合である。また、Zは、顧客ID“c”が属する顧客クラスタを表す。Zは、商品ID“i”が属する商品クラスタを表す。本例では、グルーピング手段4は、1つの顧客IDが1つの顧客クラスタのみに属し、1つの商品IDが1つの商品クラスタのみに属するように、Co-クラスタリングを実行する。この場合、Z=2、Z=3等のように、Zが顧客クラスタのIDを表し、Zが商品クラスタのIDを表してもよい。また、例えば、Zを顧客クラスタのIDに対応する要素のみを1とし他の要素を0とするベクトルで表し、Zを商品クラスタのIDに対応する要素のみを1とし他の要素を0とするベクトルで表してもよい。例えば、顧客ID“4”が顧客クラスタ“2”に属する場合、2番目の要素のみを1とし、他の要素を全て0とするベクトルを用いて、Z=(0,1,0,0,0,・・・)と表してもよい。なお、本例において、Zにおける添え字cは、具体的には4である。同様に、例えば、商品ID“7”が商品クラスタ“3”に属する場合、3番目の要素のみを1とし、他の要素を全て0とするベクトルを用いて、Z=(0,0,1,0,0,・・・)と表してもよい。なお、本例において、Zにおける添え字iは、具体的には7である。
 また、式(5)において、θは、購買傾向算出手段3によって指定された分布のパラメータである。また、θは、Zが示す1つの顧客クラスタとZが示す1つの商品クラスタとの組み合わせに対応するxc,iの分布のパラメータである。例えば、Zが図3に示す顧客クラスタ“3”を示し、Zが図3に示す商品クラスタ“9”を示している場合、θ3,9が、そのZおよびZの組に対応するθに該当する。
 また、式(5)において、p(xc,i|θ,Z,Z)は、xc,iの確率(probability )を表す。
 式(5)の値は、顧客クラスタと商品クラスタとその2つのクラスタに対応するxc,iの分布のパラメータとを組み合わせて得られる複数の組全体としての尤度であるということができる。
 グルーピング手段4は、最尤推定する場合には、式(5)の値が最大になるように、顧客クラスタ、商品クラスタおよびパラメータの組を複数定めることによって、顧客クラスタおよび商品クラスタを定めればよい。グルーピング手段4は、ベイズ推定する場合には、式(5)に示すθの事後分布を算出する。
 このとき、グルーピング手段4は、例えば、最尤推定であれば、EM(Expectation-Maximization)法を用いて、式(5)の値が最大になるように、顧客クラスタ、商品クラスタおよびパラメータの組を複数定めればよい。グルーピング手段4は、ベイズ推定であれば、変分ベイズ法を用いて、パラメータの事後分布を求める。あるいは、グルーピング手段4は、Gibbsサンプリング法を用いてもよい。Gibbsサンプリング法は、MCMC法(Markov Chain Monte Carlo algorithm)の1つである。
 購買傾向算出手段3およびグルーピング手段4は、例えば、コンピュータのCPUによって実現される。この場合、CPUは、コンピュータのプログラム記憶装置(図1において図示略)等のプログラム記録媒体からグルーピングプログラムを読み込み、そのグルーピングプログラムに従って、購買傾向算出手段3およびグルーピング手段4として動作すればよい。また、各手段が、それぞれ別々のハードウェアで実現されていてもよい。
 また、グルーピングシステムは、2つ以上の物理的に分離した装置が有線または無線で接続されている構成であってもよい。この点は、後述の実施形態においても同様である。
 次に、処理経過について説明する。図4は、本発明の第1の実施形態の処理経過の例を示すフローチャートである。
 購買傾向算出手段3は、購買データに基づいて、顧客および商品の組み合わせ毎に、購買傾向指標値xc,iを算出する(ステップS1)。また、ステップS1において、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別を指定する。
 購買傾向算出手段3の種々の動作の例については既に例1から例7で説明したので、ここでは説明を省略する。
 ステップS1の後、グルーピング手段4は、式(5)の値が最大になるように、顧客クラスタ、商品クラスタ、およびxc,iの分布のパラメータの組を複数定めることによって、顧客クラスタおよび商品クラスタを決定する(ステップS2)。なお、この分布は、購買傾向算出手段3によって指定されたものである。
 本実施形態によれば、非特許文献1等に記載された技術とは異なり、人間が何らかの特徴を商品に付与しない。そして、ステップS1で得られるxc,iは、購買データから得られる客観的なデータである。そのようなデータを用いて、グルーピング手段4は、顧客のグループおよび商品のグループ(上記の例では、顧客クラスタおよび商品クラスタ)を定めるので、似た購買傾向を有する顧客のグループを精度よく定めるとともに、購買傾向の観点で類似した商品のグループを精度よく定めることができる。
 なお、前述の例6や例7に例示するように購買傾向算出手段3が購買傾向指標値xc,iを算出した場合、グルーピング手段4は、式(5)の値が最大になるように、顧客クラスタおよび商品カテゴリ(商品関連事項)のクラスタを決定すればよい。この場合、グルーピング手段4は、ステップS2において、商品IDの代わりに、商品カテゴリのIDを式(5)における“i”として用いて、Co-クラスタリングを実行すればよい。その他の点については、既に説明したグルーピング手段4の動作と同様である。この場合には、似た購買傾向を有する顧客のグループを精度よく定めるとともに、購買傾向の観点で類似した商品カテゴリのグループを精度よく定めることができる。
 また、第1の実施形態において、グルーピング手段4は、1つの顧客(顧客ID)が複数のグループに属し、1つの商品(商品ID)が複数のグループに属することを許容しつつ、顧客のグループおよび商品のグループを定めてもよい。この場合にも、グルーピング手段4は、式(5)の値が最大になるように、顧客のグループおよび商品のグループを定めればよい。この場合においても、式(5)の値が最大になるように顧客のグループおよび商品のグループを定める方法として、グルーピング手段4は、Gibbsサンプリング法、EM法、あるいは変分ベイズ法を用いればよい。商品カテゴリ等の商品関連事項のグループを定める場合も同様である。
 グルーピング手段4は、1つの顧客(顧客ID)が複数のグループに属し、1つの商品(商品ID)が複数のグループに属することを許容しつつ、顧客のグループおよび商品のグループを定めたとする。この場合、データ分析者は、その顧客のグループおよび商品のグループを参照することによって、顧客や商品の隠れた特徴(直接的には見出しにくい特徴)を見出すことができる。例えば、商品の隠れ特徴をZ=(0,0,1,0,1,・・・)と表し、顧客の隠れ特徴をZ=(1,0,0,1,0,・・・)と表す。特徴数をKiとKcとしたときに、Ki×Kcの重み行列Aがパラメータとして学習される。顧客cの商品iに対する購買傾向指標値xc,iが、関数fを用いてf(Z AZ)としてモデル化される。この関数fは、ロジスティック関数やポアソン分布、ガウス分布等である。関数fがいずれを取るかは、購買傾向指標値xc,iにより定めればよい。購買傾向指標値xc,iが0か1の値であれば、関数fはロジスティック関数である。購買傾向指標値xc,iが個数であれば、関数fはポアソン分布である。購買傾向指標値xc,iが実数であれば、関数fはガウス分布である。実施形態で具体例として示している確率分布は、この関数と対応する。
 また、第1の実施形態では、購買傾向算出手段3が購買傾向指標値xc,iの分布の種別を指定する場合を説明した。購買傾向指標値xc,iとしてどのような値を用いるかに応じて、購買傾向指標値xc,iの分布の種別が予め定められていてもよい。この場合、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別を指定しなくてよい。そして、グルーピング手段4は、予め定められた分布の種別における購買傾向指標値xc,iの分布のパラメータを用いて、顧客のグループと、商品または商品関連事項のグループとを定めればよい。
実施形態2.
 図5は、本発明の第2の実施形態のグルーピングシステムの例を示すブロック図である。第2の実施形態のグルーピングシステム11は、データ記憶手段12と、特徴量算出手段13と、グルーピング手段14とを備える。
 データ記憶手段12は、顧客の商品購買状況を示す購買データを記憶する記憶装置である。例えば、顧客マスタおよび商品マスタを記憶するとともに、顧客が商品を購買した各購買日における、顧客ID、商品ID、商品の価格および購買日を対応付けた情報を購買データとして記憶してもよい。以下に示す例では、特徴量算出手段13が、商品マスタ内の標準価格を用いて、商品の特徴量として商品の相対価格を算出する場合を例にして説明する。また、以下に示す例では、商品購買実績を示す指標値(以下、購買実績指標値と記す。)として、購買数を用いるものとする。
 特徴量算出手段13は、商品毎に商品の特徴量を算出する。この特徴量は、商品自体の特徴量であり、顧客に依存しない。本例では、特徴量算出手段13が、商品の特徴量として、各商品の相対価格を算出する場合を例にして説明する。この場合、特徴量算出手段13は、データ記憶手段12に記憶された各商品の標準価格に基づいて、それらの各商品の標準価格の平均値(以下、iavと記す。)と、標準価格の標準偏差(以下、idevと記す。)とを算出する。そして、データ記憶手段12に記憶されている商品“i”の標準価格をsとする。また、商品“i”の相対価格をrとする。特徴量算出手段13は、商品毎に、以下に示す式(6)の計算を行うことによって、個々の商品の相対価格を算出する。
 r=(s-iav)/idev       式(6)
 特徴量算出手段13は、商品の特徴量の分布の種別を指定する。特徴量として相対価格を算出する場合、特徴量算出手段13は、特徴量(相対価格)の分布の種別として、例えば、標準正規分布を指定する。あるいは、特徴量算出手段13は、ガウス分布を指定してもよい。
 グルーピング手段14は、データ記憶手段12に記憶された購買データを参照して、顧客と商品との組み合わせ毎に購買実績指標値を算出する。本実施形態では、顧客と商品との組み合わせ毎に算出される購買実績指標値を符号uc,iで表す。本例では、この購買実績指標値として商品の購買数を用いる場合を例にして説明するので、購買数も符号uc,iで表す。例えば、顧客“2”による商品“3”の購買数が7個である場合、u2,3=7である。従って、グルーピング手段14は、顧客と商品との組み合わせ毎に購買数uc,iを導出する。
 また、グルーピング手段14は、購買実績指標値(購買数)の分布として、ポアソン分布を採用する。
 そして、グルーピング手段14は、顧客と商品との組み合わせ毎に導出した購買数と、その購買数の分布の種別(本例ではポアソン分布)と、商品毎の相対価格と、その相対価格の分布の種別とに基づいて、顧客のグループおよび商品のグループを定める。
 以下の説明では、一人の顧客(換言すれば、1つの顧客ID)が1つのクラスタのみに属し、1つの商品(換言すれば、1つの商品ID)が1つのクラスタのみに属するように、グルーピング手段14がCo-クラスタリングを実行する場合を例にして説明する。
 グルーピング手段14は、顧客クラスタと、商品クラスタと、購買数の分布のパラメータと、商品の相対価格の分布のパラメータとを組み合わせて得られる複数の組の尤度が最大となるように、各顧客クラスタおよび各商品クラスタを定める。この尤度は、以下に示す式(7)で表される。
Figure JPOXMLDOC01-appb-M000002
 式(7)において、Cは、顧客IDの集合であり、Iは、商品IDの集合である。また、Zは、顧客ID“c”が属する顧客クラスタを表す。Zは、商品ID“i”が属する商品クラスタを表す。この点は、第1の実施形態と同様である。
 式(7)において、θ’は、Zが示す1つの顧客クラスタとZが示す1つの商品クラスタとの組み合わせに対応する購買数uc,iの分布のパラメータである。θ’も第1の実施形態におけるθと同様に、例えば、ベクトルで表されてよい。
 また、式(7)において、p(uc,i|θ’,Z,Z)は、uc,iの確率(probability )を表す。
 また、式(7)において、φは、特徴量算出手段13によって指定された分布のパラメータである。また、φは、商品クラスタZに属する商品の相対価格の分布のパラメータである。
 また、式(7)において、p(r|φ,Z)は、rの確率を表す。
 式(7)の値は、顧客クラスタと、商品クラスタと、その2つのクラスタに対応するuc,iの分布のパラメータθ’と、その商品クラスタに属する商品の相対価格(特徴量)の分布のパラメータφとを組み合わせて得られる複数の組全体としての尤度であるということができる。
 グルーピング手段14は、式(7)の値が最大になるように、顧客クラスタ、商品クラスタおよびパラメータθ’,φの組を複数定めることによって、顧客クラスタおよび商品クラスタを定めればよい。
 このとき、グルーピング手段14は、例えば、Gibbsサンプリング法、EM法、あるいは変分ベイズ法を用いて、式(7)の値が最大になるように、顧客クラスタ、商品クラスタおよびパラメータθ’,φの組を複数定めればよい。
 特徴量算出手段13およびグルーピング手段14は、例えば、コンピュータのCPUによって実現される。この場合、CPUは、コンピュータのプログラム記憶装置(図5において図示略)等のプログラム記録媒体からグルーピングプログラムを読み込み、そのグルーピングプログラムに従って、特徴量算出手段13およびグルーピング手段14として動作すればよい。また、各手段が、それぞれ別々のハードウェアで実現されていてもよい。
 次に、処理経過について説明する。図6は、本発明の第2の実施形態の処理経過の例を示すフローチャートである。
 特徴量算出手段13は、例えば、商品マスタに基づいて、商品毎に商品の相対価格rを算出する(ステップS11)。特徴量算出手段13は、商品毎に、式(6)の計算を行うことによって、個々の商品の相対価格を算出すればよい。また、ステップS11において、特徴量算出手段13は、相対価格rの分布の種別を指定する。
 また、グルーピング手段14は、購買データを参照して、顧客および商品の組み合わせ毎に、顧客が商品を購買した数(購買数uc,i)を導出する(ステップS12)。なお、顧客および商品の組み合わせ毎に購買数uc,iがデータ記憶手段12に記憶されていてもよい。その場合、グルーピング手段14は、各購買数uc,iをデータ記憶手段12から読み込めばよい。
 次に、グルーピング手段14は、式(7)の値が最大になるように、顧客クラスタ、商品クラスタおよびパラメータθ’,φの組を複数定めることによって、顧客クラスタおよび商品クラスタを定めればよい(ステップS13)。
 本実施形態においても、非特許文献1等に記載された技術とは異なり、人間が何らかの特徴を商品に付与しない。また、本実施形態におけるrやuc,iは、商品マスタや購買データから得られる客観的なデータである。そのようなデータを用いて、グルーピング手段14は、顧客クラスタおよび商品クラスタを定める。従って、似た購買傾向を有する顧客のグループを精度よく定めるとともに、購買傾向の観点で類似した商品のグループを精度よく定めることができる。
 また、グルーピング手段14は、1つの顧客(顧客ID)が複数のグループに属し、1つの商品(商品ID)が複数のグループに属することを許容しつつ、顧客のグループおよび商品のグループを定めてもよい。この場合にも、グルーピング手段14は、式(7)の値が最大になるように、顧客クラスタ、商品クラスタおよびパラメータθ’,φの組を複数定めることによって、顧客クラスタおよび商品クラスタを定めればよい。この場合においても、式(7)の値が最大になるように顧客のグループおよび商品のグループを定める方法として、グルーピング手段14は、Gibbsサンプリング法、EM法、あるいは変分ベイズ法を用いればよい。
 グルーピング手段14は、1つの顧客(顧客ID)が複数のグループに属し、1つの商品(商品ID)が複数のグループに属することを許容しつつ、顧客のグループおよび商品のグループを定めたとする。この場合、データ分析者は、その顧客のグループおよび商品のグループを参照することによって、顧客や商品の隠れた特徴(直接的には見出しにくい特徴)を見出すことができる。
 また、第2の実施形態では、特徴量算出手段13が商品の特徴量の分布の種別を指定する場合を説明した。商品の特徴量としてどのような値を用いるかに応じて、商品の特徴量の分布の種別が予め定められていてもよい。この場合、特徴量算出手段13が商品の特徴量の分布の種別を指定しなくてよい。そして、グルーピング手段14は、予め定められた分布の種別における商品の特徴量の分布のパラメータを用いて、顧客のグループと、商品のグループとを定めればよい。
 以下、顧客マスタ、商品マスタ、購買データの具体例や、第2の実施形態における特徴量の具体例や、第1の実施形態における購買傾向指標値xc,iの具体例を示す。
 図7は、第1の実施形態のデータ記憶手段2や第2の実施形態のデータ記憶手段12に記憶される顧客マスタの例を示す模式図である。図7では、顧客ID毎に、顧客IDと、顧客の年齢および性別とが対応付けられている場合を例示している。
 図8は、第1の実施形態のデータ記憶手段2や第2の実施形態のデータ記憶手段12に記憶される商品マスタの例を示す模式図である。図8では、商品ID毎に、商品IDと、商品名、標準価格、商品カテゴリおよび発売日が対応付けられている場合を例示している。
 図9は、第1の実施形態のデータ記憶手段2や第2の実施形態のデータ記憶手段12に記憶される購買データの例を示す模式図である。図9では、顧客が商品を購買した各購買日における、顧客ID、商品ID、商品の実際の販売価格および購買日を対応付けた購買データを例示している。なお、図9に示す1行のデータは、顧客が商品を1つ買ったことを示している。
 なお、図7から図9は、データ記憶手段2,12に記憶されるデータの例示である。以下で述べる各具体例で示す具体的な数値は、必ずしも図7から図9に示すデータに基づくものであるとは限らない。
(具体例1)
 以下に示す具体例1では、第2の実施形態における商品の特徴量の具体例を示す。特徴量算出手段13は、商品カテゴリ毎に、カテゴリ内の各商品の特徴量を算出する。本例では、特徴量算出手段13が商品の特徴量として、相対価格を算出する場合を例にする。
 特徴量算出手段13は、商品カテゴリを1つずつ選択し、選択した商品カテゴリ内の各商品の標準価格の平均値iavと、その各商品の標準価格の標準偏差idevを算出する。図10は、「菓子パン」および「食パン」という2つの商品カテゴリについてそれぞれ算出された平均値および標準偏差の例を示す図である。
 さらに、特徴量算出手段13は、商品カテゴリを1つずつ選択し、選択した商品カテゴリ内の個々の商品の相対価格rを、前述の式(6)によって算出する。ここで、式(6)の計算におけるiavおよびidevは、選択した商品カテゴリに関して算出した平均値iavおよび標準偏差idevである。
 この結果、商品毎に相対価格が得られる。図11は、商品毎に算出された相対価格の例を示す図である。図11では、商品ID毎に、商品名および相対価格の例を示している。
 特徴量算出手段13は、上記のように算出した相対価格rの分布の種別として、例えば、ガウス分布を指定する。あるいは、特徴量算出手段13は、相対価格rの分布の種別として、標準正規分布を指定してもよい。
 なお、グルーピング手段14は、購買データを参照して、顧客IDおよび商品IDの組み合わせ毎に、その顧客がその商品を購買した個数(購買数)を算出し、その購買数を、購買実績指標値uc,iとする。さらに、グルーピング手段14は、購買実績指標値uc,i(以下、購買数uc,i)の分布としてポアソン分布を採用する。
 グルーピング手段14は、各商品の相対価格rおよびその分布の種別と、顧客IDおよび商品IDの組み合わせ毎に導出した購買数uc,iおよびその分布の種別に基づいて、顧客IDと商品IDをグルーピングする。この処理については、既に説明しているので、ここでは説明を省略する。
(具体例2)
 具体例2では、第1の実施形態で説明した例1の具体例を示す。購買傾向算出手段3は、購買データに基づいて、顧客IDおよび商品IDの組み合わせに対して、その商品の実際の販売価格毎に、購買数(購買量)を特定する。この結果、図12に例示するように、顧客ID、商品IDおよび商品の実際の販売価格の組み合わせに対して、購買数を対応付けた情報が得られる。
 購買傾向算出手段3は、ln(volumec,i)を目的変数とし、ln(pricec,i)を説明変数として、回帰分析を行う。volumec,iは購買量変数であり、pricec,iは価格変数である。顧客ID“01”および商品ID“11”の組み合わせについてこの回帰分析を行うと、式(1)の係数wc,iの値は-3となり、価格弾力性は3となる。購買傾向算出手段3は、この価格弾力性“3”を、購買傾向指標値x01,11とする。購買傾向算出手段3は、顧客IDおよび商品IDの他の各組み合わせに関しても、同様に、購買傾向指標値xc,iを算出する。
 なお、価格弾力性“3”とは、価格が10%下がったときに、購買数が10×3=30%増加することを意味する。
 本例では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
 グルーピング手段4は、購買傾向指標値xc,iおよびその分布の種別に基づいて、顧客IDと商品IDをグルーピングする。この処理については、既に説明しているので、ここでは説明を省略する。この点は、以下に説明する他の具体例でも同様である。
(具体例3)
 具体例3では、第1の実施形態で説明した例2の具体例を示す。
 本例では、ある商品の広告が行われた日毎に、商品IDとその商品の広告日とを対応付けた情報をデータ記憶手段2に記憶させておく。図13は、商品IDと広告日とを対応付けた情報の例を示す図である。なお、広告は、テレビジョン放送やラジオ放送のコマーシャルメッセージであってもよい。また、図13に例示する情報は、番組と連動する等してまとまって放送された広告の実績を反映させたものであってもよい。また、図13に例示する情報は、顧客毎に個別に実施される広告(例えば、オンライン広告)に基づいて作成されたものであってもよい。
 購買傾向算出手段3は、例えば、顧客が商品を購買した各購買日における、顧客IDと、商品IDと、その商品の直近の広告日からの経過日数とを対応付けた情報を、購買データに基づいて作成する。顧客ID、商品ID、および広告日からの経過日数を対応付けた情報の例を、図14に示す。
 なお、広告の実績がなく購買されている商品に関しては、購買傾向算出手段3は、広告日からの経過日数を、十分に大きな値、あるいは、欠損値として扱えばよい。図14に示す“inf.”は、十分に大きな値を意味する。
 購買傾向算出手段3は、顧客“c”と商品“i”の組み合わせ毎に、顧客に対する商品の広告有効寿命Tc,iを算出する。なお、顧客“c”と商品“i”の組み合わせに関し、広告日からの経過日数dayc,iにおける購買数がexp(-dayc,i/Tc,i)に比例すると仮定する方式と、広告日からの経過日数dayc,iにおいて顧客“c”が商品“i”を購買する確率がexp(-dayc,i/Tc,i)に比例すると仮定する方式が挙げられる。ここでは、前者の場合を示す。購買傾向算出手段3は、ln(volumec,i)を目的変数とし、ln(dayc,i)を説明変数として、回帰分析を行う。volumec,iは購買量変数であり、dayc,iは、経過日数変数である。顧客ID“01”および商品ID“11”の組み合わせについてこの回帰分析を行うと、式(2)の係数wc,iの値として-0.2が得られる。購買傾向算出手段3は、この値の絶対値の逆数として、T01,11=5を算出し、この値を、購買傾向指標値x01,11とする。購買傾向算出手段3は、顧客IDおよび商品IDの他の各組み合わせに関しても、同様に、購買傾向指標値xc,iを算出する。
 本例では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
 また、具体例3において、広告日の代わりに、商品が店舗に陳列された日を用いてもよい。この場合、購買傾向算出手段3は、広告日からの経過日数の代わりに、商品の陳列日からの経過日数を用いればよい。また、この場合、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布またはポアソン分布を指定すればよい。
(具体例4)
 具体例4では、商品の発売日からの経過日数を利用して購買傾向指標値xc,iを求める場合の例を示す。
 購買傾向算出手段3は、例えば、顧客が商品を購買した各購買日における、顧客IDと、商品IDと、その商品の発売日からの経過日数とを対応付けた情報を、購買データに基づいて作成する。顧客ID、商品ID、および発売日からの経過日数を対応付けた情報の例を、図15に示す。
 購買傾向算出手段3は、顧客“c”と商品“i”の組み合わせ毎に、顧客に対する商品の新商品感度寿命Tc,iを算出する。ここでは、顧客“c”と商品“i”の組み合わせに関し、商品発売日からの経過日数dayc,iにおいて顧客“c”が商品“i”を購買する確率がexp(-dayc,i/Tc,i)に比例すると仮定する。購買傾向算出手段3は、顧客“01”の商品“11”に対する感度の尤度を最大にするような新商品感度寿命T01,11を、上記の具体例における広告有効寿命T01,11と同様に求めることができる。購買傾向算出手段3は、新商品感度寿命T01,11を、顧客ID“01”と商品ID“11”の組み合わせに対する購買傾向指標値x01,11とする。購買傾向算出手段3は、顧客IDおよび商品IDの他の各組み合わせに関しても、同様に、購買傾向指標値xc,iを算出する。
 本例では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、ポアソン分布を指定する。あるいは、購買傾向算出手段3は、正規分布を指定してもよい。
(具体例5)
 具体例5では、第1の実施形態で説明した例5の具体例を示す。
 購買傾向算出手段3は、顧客“c”が商品“i”を購買した日から、次に同一の顧客“c”が同一の商品“i”を購買した日までの経過日数をそれぞれ計算し、その経過日数の平均値(平均購買間隔)を、購買傾向指標値xc,iとして算出する。なお、平均購買間隔は、購買間隔がポアソン分布に従うとしたときの分布の最適パラメータに相当する。
 購買傾向算出手段3は、顧客IDと商品IDの組み合わせ毎に平均購買間隔(購買傾向指標値xc,i)を算出する。そして、購買傾向算出手段3は、顧客IDと、商品IDと、平均購買間隔とを対応付けた情報を作成する。顧客IDと、商品IDと、平均購買間隔とを対応付けた情報の例を図16に示す。
 本例では、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
(具体例6)
 具体例6では、第1の実施形態で説明した例6の具体例を示す。
 本例では、図17に例示する商品マスタが、データ記憶手段2(図1参照)に記憶されているとする。図17に示す商品マスタでは、商品ID毎に、商品IDと、商品名と、商品カテゴリと、商品のメーカとが対応づけられている。
 また、本例では、図18に例示する購買データが、データ記憶手段2(図1参照)に記憶されているとする。図18に示す購買データでは、顧客IDおよび商品IDの組み合わせに対して、その顧客IDで識別される顧客がその商品IDで識別される商品を購買した個数(購買数)が対応付けられている。
 購買傾向算出手段3は、顧客と商品カテゴリの組み合わせ毎に、その商品カテゴリ内の個別の商品へのその顧客のこだわり度(愛着度)を算出する。本例では、購買傾向算出手段3が、このこだわり度としてハーフィンダール係数を算出し、その値を購買傾向指標値xc,iとする例を示す。
 例えば、購買傾向算出手段3が、顧客ID“01”と商品カテゴリ“菓子パン”の組み合わせに関して、こだわり度を算出する場合を例にして説明する。図17および図18から分かるように、顧客“01”は、商品カテゴリ“菓子パン”に属する商品として、あんパン(商品ID“11”)を1個、高級あんパン(商品ID“12”)を2個、カレーパン(商品ID“15”)を2個、メロンパン(商品ID“16”)を1個、購買している。従って、顧客“01”による“菓子パン”に属するあんパン、高級あんパン、カレーパンおよびメロンパンの購買シェアは、それぞれ、“1/6”、“1/3”、“1/3”および“1/6”である。従って、購買傾向算出手段3は、以下の計算によって、顧客ID“01”と商品カテゴリ“菓子パン”の組み合わせにおけるこだわり度(本例ではハーフィンダール係数)として0.28を算出する。
 0.28=(1/6)+(1/3)+(1/3)+(1/6)
 同様に、購買傾向算出手段3が、顧客ID“02”と商品カテゴリ“菓子パン”の組み合わせに関して、こだわり度を算出する場合を例にして説明する。顧客“02”は、商品カテゴリ“菓子パン”に属する商品として、あんパン(商品ID“11”)を2個、高級あんパン(商品ID“12”)を3個、辛カレーパン(商品ID“18”)を1個、購買している(図17および図18参照)。従って、顧客“02”による“菓子パン”に属するあんパン、高級あんパンおよび辛カレーパンの購買シェアは、それぞれ、“1/3”、“1/2”および“1/6”である。従って、購買傾向算出手段3は、以下の計算によって、顧客ID“02”と商品カテゴリ“菓子パン”の組み合わせにおけるこだわり度として0.39を算出する。
 0.39=(1/3)+(1/2)+(1/6)
 同様に、購買傾向算出手段3が、顧客ID“03”と商品カテゴリ“菓子パン”の組み合わせに関して、こだわり度を算出する場合を例にして説明する。顧客“03”は、商品カテゴリ“菓子パン”に属する商品として、高級あんパン(商品ID“12”)を2個、メロンパン(商品ID“16”)を8個、焼きそばパン(商品ID“17”)を1個、購買している(図17および図18参照)。従って、顧客“03”による“菓子パン”に属する高級あんパン、メロンパンおよび焼きそばパンの購買シェアは、それぞれ、“2/11”、“8/11”、“1/11”である。従って、購買傾向算出手段3は、以下の計算によって、顧客ID“03”と商品カテゴリ“菓子パン”の組み合わせにおけるこだわり度として0.57を算出する。
 0.57=(2/11)+(8/11)+(1/11)
 なお、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
 図19は、顧客IDと商品カテゴリの組み合わせ毎のこだわり度(xc,i)の例を示す図である。例えば、図19に例示する結果が得られたとする。この場合、グルーピング手段4によるグルーピングによって、顧客ID“01”および顧客ID“02”が同一の顧客グループ(Aとする。)にグルーピングされ、顧客ID“03”が別の顧客グループ(Bとする。)にグルーピングされると考えられる。また、「菓子パン」および「おにぎり」が同一の商品カテゴリグループにグルーピングされると考えられる。このようなグルーピングの結果が得られたとすると、顧客グループAは、「菓子パン」や「おにぎり」では様々な商品を購買する傾向があり、「食パン」については自分の好きな商品を選ぶ傾向があるということを分析できる。また、顧客グループBは、「食パン」だけでなく、「菓子パン」や「おにぎり」についても特定の商品を購買する傾向があるということを分析できる。
(具体例7)
 具体例7では、第1の実施形態で説明した例7の具体例を示す。
 購買傾向算出手段3は、顧客と商品カテゴリの組み合わせ毎に、その商品カテゴリ内の商品のメーカへのその顧客のこだわり度(愛着度)を算出する。本例では、購買傾向算出手段3が、このこだわり度としてハーフィンダール係数を算出し、その値を購買傾向指標値xc,iとする例を示す。
 購買傾向算出手段3は、商品マスタおよび購買データを参照して、例えば、「菓子パン」という商品カテゴリに関して、顧客IDと、その顧客が購買した菓子パンのメーカと、そのメーカの菓子パンの購買数との関係を特定する。そして、顧客IDと、菓子パンのメーカと、そのメーカの菓子パンの購買数との関係として、図20に示す結果が得られたとする。
 顧客“01”が、「菓子パン」という商品カテゴリにおいて、海崎パンから菓子パンを購買した数は3であり、山谷パンから購買した数は3である(図20参照)。従って、「菓子パン」という商品カテゴリにおいて、顧客“01”による海崎パンの購買シェア、山谷パンの購買シェアは、それぞれ“1/2”、“1/2”である。よって、購買傾向算出手段3は、以下に示す計算によって、顧客ID“01”と商品カテゴリ「菓子パン」の組み合わせにおけるこだわり度(本例ではハーフィンダール係数)0.5を算出する。
 0.5=(1/2)+(1/2)
 また、顧客“02”が、「菓子パン」という商品カテゴリにおいて、海崎パンから菓子パンを購買した数は5であり、山谷パンから購買した数は1である(図20参照)。従って、「菓子パン」という商品カテゴリにおいて、顧客“02”による海崎パンの購買シェア、山谷パンの購買シェアは、それぞれ“5/6”、“1/6”である。よって、購買傾向算出手段3は、以下に示す計算によって、顧客ID“02”と商品カテゴリ「菓子パン」の組み合わせにおけるこだわり度(本例ではハーフィンダール係数)0.72を算出する。
 0.72=(5/6)+(1/6)
 また、顧客“03”が、「菓子パン」という商品カテゴリにおいて、海崎パンから菓子パンを購買した数は2であり、山谷パンから購買した数は9である(図20参照)。従って、「菓子パン」という商品カテゴリにおいて、顧客“03”による海崎パンの購買シェア、山谷パンの購買シェアは、それぞれ“2/11”、“9/11”である。よって、購買傾向算出手段3は、以下に示す計算によって、顧客ID“03” と商品カテゴリ「菓子パン」の組み合わせにおけるこだわり度(本例ではハーフィンダール係数)0.70を算出する。
 0.70=(2/11)+(9/11)
 購買傾向算出手段3は、同様に、顧客IDと商品カテゴリの組み合わせ毎に、こだわり度(xc,i)を算出する。
 なお、購買傾向算出手段3は、購買傾向指標値xc,iの分布の種別として、例えば、正規分布を指定する。
 具体例7をアパレルの商品カテゴリに適用した場合、グルーピングの結果によって、例えば、靴やアクセサリ等に関しては特定のメーカの商品を購買するが、下着や靴下に関してはメーカにこだわらない顧客層や、あらゆる商品カテゴリに関して特定のメーカの商品を購買する顧客層等を明らかにすることができる。
 なお、既に述べたように、上記のようにこだわり度を算出する際、メーカの代わりに、商品のブランド等を適用してもよい。
 図21は、本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004とを備える。
 各実施形態のグルーピングシステムは、コンピュータ1000に実装される。グルーピングシステムの動作は、プログラム(グルーピングプログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、そのプログラムに従って上記の処理を実行する。
 補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000がそのプログラムを主記憶装置1002に展開し、上記の処理を実行してもよい。
 また、プログラムは、前述の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで前述の処理を実現する差分プログラムであってもよい。
 次に、本発明の概要について説明する。図22は、本発明の概要の例を示すブロック図である。グルーピングシステム1は、購買傾向算出手段3と、グルーピング手段4とを備える。
 購買傾向算出手段3は、顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項(例えば、商品カテゴリ)の組み合わせ毎に、顧客が商品を購買する傾向を算出する。グルーピング手段4は、その傾向およびその傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定める。
 具体的には、購買傾向算出手段3は、顧客の商品購買状況を示す購買データに基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を示す指標値である購買傾向指標値を算出する。グルーピング手段4は、購買傾向指標値および購買傾向指標値の分布のパラメータに基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定める。
 そのような構成により、似た購買傾向を有する顧客のグループを精度よく定めるとともに、購買傾向の観点で類似した商品または商品に関連する事項のグループを精度よく定めることができる。なお、図22に示す例において、グルーピングシステム1は、サービスのグループまたはサービス関連事項(例えば、サービスのカテゴリ)のグループを定めてもよい。
 図23は、本発明の概要の他の例を示すブロック図である。グルーピングシステム11は、特徴量算出手段13と、グルーピング手段14とを備える。
 特徴量算出手段13は、商品毎に商品の特徴量を算出する。
 グルーピング手段14は、顧客および商品の組み合わせ毎に得られる商品購買実績と、商品購買実績の分布と、商品毎の特徴量と、特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定める。具体的には、グルーピング手段14は、顧客および商品の組み合わせ毎に得られる、商品購買実績を示す指標値である購買実績指標値と、購買実績指標値の分布のパラメータと、商品毎の特徴量と、特徴量の分布のパラメータとに基づいて、顧客のグループおよび商品のグループを定める。
 そのような構成によっても、上記の効果を得ることができる。なお、図23に示す例において、グルーピングシステム11は、サービスのグループを定めてもよい。
 上記の各実施形態は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。
(付記1)顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出する購買傾向算出手段と、前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定めるグルーピング手段とを備えることを特徴とするグルーピングシステム。
(付記2)購買傾向算出手段は、顧客の商品購買状況を示す購買データに基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を示す指標値である購買傾向指標値を算出し、グルーピング手段は、前記購買傾向指標値および前記購買傾向指標値の分布のパラメータに基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定める付記1に記載のグルーピングシステム。
(付記3)グルーピング手段は、顧客のグループと、商品のグループまたは商品関連事項のグループと、購買傾向指標値の分布のパラメータとを組み合わせて得られる複数の組の尤度を用いて、顧客のグループと、商品のグループまたは商品関連事項のグループとを定める付記2に記載のグルーピングシステム。
(付記4)購買傾向算出手段は、顧客および商品の組み合わせ毎に価格弾力性を購買傾向指標値として算出し、グルーピング手段は、顧客のグループおよび商品のグループを定める付記2または付記3に記載のグルーピングシステム。
(付記5)購買傾向算出手段は、顧客および商品の組み合わせ毎に、商品の広告日から顧客が商品を購買するまでの日数の程度を示す値を購買傾向指標値として算出し、グルーピング手段は、顧客のグループおよび商品のグループを定める付記2または付記3に記載のグルーピングシステム。
(付記6)購買傾向算出手段は、顧客および商品の組み合わせ毎に、商品の発売日から顧客が商品を購買するまでの日数の程度を示す値を購買傾向指標値として算出し、グルーピング手段は、顧客のグループおよび商品のグループを定める付記2または付記3に記載のグルーピングシステム。
(付記7)購買傾向算出手段は、顧客および商品の組み合わせ毎に、商品が店舗に陳列されてから顧客が商品を購買するまでの日数の程度を示す値を購買傾向指標値として算出し、グルーピング手段は、顧客のグループおよび商品のグループを定める付記2または付記3に記載のグルーピングシステム。
(付記8)購買傾向算出手段は、顧客および商品の組み合わせ毎に平均購買間隔を購買傾向指標値として算出し、グルーピング手段は、顧客のグループおよび商品のグループを定める付記2または付記3に記載のグルーピングシステム。
(付記9)購買傾向算出手段は、顧客および商品カテゴリの組み合わせ毎に、商品カテゴリ内の個別の商品への顧客のこだわり度を購買傾向指標値として算出し、グルーピング手段は、顧客のグループを定めるとともに、商品関連事項のグループとして商品カテゴリのグループを定める付記2または付記3に記載のグルーピングシステム。
(付記10)購買傾向算出手段は、顧客および商品カテゴリの組み合わせ毎に、商品カテゴリ内の商品の個別のメーカへの顧客のこだわり度を購買傾向指標値として算出し、グルーピング手段は、顧客のグループを定めるとともに、商品関連事項のグループとして商品カテゴリのグループを定める付記2または付記3に記載のグルーピングシステム。
(付記11)購買傾向算出手段は、顧客および商品カテゴリの組み合わせ毎に、商品カテゴリ内の商品の個別のブランドへの顧客のこだわり度を購買傾向指標値として算出し、グルーピング手段は、顧客のグループを定めるとともに、商品関連事項のグループとして商品カテゴリのグループを定める付記2または付記3に記載のグルーピングシステム。
(付記12)グルーピング手段は、一人の顧客が1つのグループのみに属し、1つの商品が1つのグループのみに属するように、顧客のグループおよび商品のグループを定める付記1から付記8のうちのいずれかに記載のグルーピングシステム。
(付記13)グルーピング手段は、一人の顧客が複数のグループに属すること、および、1つの商品が複数のグループに属することを許容して、顧客のグループおよび商品のグループを定める付記1から付記8のうちのいずれかに記載のグルーピングシステム。
(付記14)グルーピング手段は、一人の顧客が1つのグループのみに属し、1つの商品関連事項が1つのグループのみに属するように、顧客のグループおよび商品関連事項のグループを定める付記1、2、3、9、10、11のうちのいずれかに記載のグルーピングシステム。
(付記15)グルーピング手段は、一人の顧客が複数のグループに属すること、および、1つの商品関連事項が複数のグループに属することを許容して、顧客のグループおよび商品関連事項のグループを定める付記1、2、3、9、10、11のうちのいずれかに記載のグルーピングシステム。
(付記16)商品毎に商品の特徴量を算出する特徴量算出手段と、顧客および商品の組み合わせ毎に得られる商品購買実績と、前記商品購買実績の分布と、商品毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定めるグルーピング手段とを備えることを特徴とするグルーピングシステム。
(付記17)グルーピング手段は、顧客および商品の組み合わせ毎に得られる、商品購買実績を示す指標値である購買実績指標値と、前記購買実績指標値の分布のパラメータと、商品毎の特徴量と、前記特徴量の分布のパラメータとに基づいて、顧客のグループおよび商品のグループを定める付記16に記載のグルーピングシステム。
(付記18)グルーピング手段は、顧客のグループと、商品のグループと、購買実績指標値の分布のパラメータと、商品の特徴量の分布のパラメータとを組み合わせて得られる複数の組の尤度を用いて、顧客のグループおよび商品のグループを定める付記17に記載のグルーピングシステム。
(付記19)特徴量算出手段は、商品毎に、商品の特徴量として商品の相対価格を算出する付記16から付記18のうちのいずれかに記載のグルーピングシステム。
(付記20)グルーピング手段は、一人の顧客が1つのグループのみに属し、1つの商品が1つのグループのみに属するように、顧客のグループおよび商品のグループを定める付記16から付記19のうちのいずれかに記載のグルーピングシステム。
(付記21)グルーピング手段は、一人の顧客が複数のグループに属すること、および、1つの商品が複数のグループに属することを許容して、顧客のグループおよび商品のグループを定める付記16から付記19のうちのいずれかに記載のグルーピングシステム。
(付記22)顧客のサービス購買状況に基づいて、顧客およびサービスの組み合わせ毎、または、顧客および、サービスに関連する事項であるサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を算出する購買傾向算出手段と、前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定めるグルーピング手段とを備えることを特徴とするグルーピングシステム。
(付記23)サービス毎にサービスの特徴量を算出する特徴量算出手段と、顧客およびサービスの組み合わせ毎に得られるサービス購買実績と、前記サービス購買実績の分布と、サービス毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよびサービスのグループを定めるグルーピング手段とを備えることを特徴とするグルーピングシステム。
(付記24)顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出し、前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定めることを特徴とするグルーピング方法。
(付記25)商品毎に商品の特徴量を算出し、顧客および商品の組み合わせ毎に得られる商品購買実績と、前記商品購買実績の分布と、商品毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定めることを特徴とするグルーピング方法。
(付記26)顧客のサービス購買状況に基づいて、顧客およびサービスの組み合わせ毎、または、顧客および、サービスに関連する事項であるサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を算出し、前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定めることを特徴とするグルーピング方法。
(付記27)サービス毎にサービスの特徴量を算出し、顧客およびサービスの組み合わせ毎に得られるサービス購買実績と、前記サービス購買実績の分布と、サービス毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよびサービスのグループを定めることを特徴とするグルーピング方法。
(付記28)コンピュータに、顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出する購買傾向算出処理、および、前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定めるグルーピング処理を実行させるためのグルーピングプログラム。
(付記29)コンピュータに、商品毎に商品の特徴量を算出する特徴量算出処理、および、顧客および商品の組み合わせ毎に得られる商品購買実績と、前記商品購買実績の分布と、商品毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定めるグルーピング処理を実行させるためのグルーピングプログラム。
(付記30)コンピュータに、顧客のサービス購買状況に基づいて、顧客およびサービスの組み合わせ毎、または、顧客および、サービスに関連する事項であるサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を算出する購買傾向算出処理、および、前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定めるグルーピング処理を実行させるためのグルーピングプログラム。
(付記31)コンピュータに、サービス毎にサービスの特徴量を算出する特徴量算出処理、および、顧客およびサービスの組み合わせ毎に得られるサービス購買実績と、前記サービス購買実績の分布と、サービス毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよびサービスのグループを定めるグルーピング処理を実行させるためのグルーピングプログラム。
 また、前述の第1の実施形態(図1参照)では、購買傾向算出手段3が、顧客および商品の組み合わせ毎、または、顧客および商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向(具体的には、購買傾向指標値)を算出する場合を示した。グルーピングシステムが、顧客が商品を購買する傾向(購買傾向指標値)を外部から取得する構成であってもよい。この場合のグルーピングシステムの構成例を図24に示す。
 図24に示すグルーピングシステム90は、購買傾向取得手段95と、グルーピング手段4とを備える。
 購買傾向取得手段95は、顧客および商品の組み合わせ毎、または、顧客および商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向(購買傾向指標値)を取得する。このとき、購買傾向取得手段95は、その購買傾向指標値の分布の種別の情報も合わせて取得する。例えば、グルーピングシステム90の外部に設けられたサーバに、顧客および商品の組み合わせ毎、または、顧客および商品関連事項の組み合わせ毎に定められた購買傾向指標値と、その購買傾向指標値の分布の種別の情報を予め管理者が記憶させておく。購買傾向取得手段95は、通信ネットワークを介して、そのサーバから、各購買傾向指標値および、その購買傾向指標値の分布の種別の情報を取得すればよい。なお、購買傾向取得手段95が外部から購買傾向指標値等を取得する態様は、上記の態様に限定されず、他の態様であってもよい。例えば、購買傾向取得手段95は、外部から入力される各購買傾向指標値およびその分布の種別の情報を受け付けてもよい。
 購買傾向取得手段95が取得する購買傾向指標値は、第1の実施形態において、購買傾向算出手段3が算出する購買傾向指標値と同様である。
 グルーピング手段4は、顧客が商品を購買する傾向およびその分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定める。この動作は、第1の実施形態のグルーピング手段4の動作と同様である。
 購買傾向取得手段95およびグルーピング手段4は、例えば、コンピュータのCPUによって実現される。この場合、CPUは、コンピュータのプログラム記憶装置(図24において図示略)等のプログラム記録媒体からグルーピングプログラムを読み込み、そのグルーピングプログラムに従って、購買傾向取得手段95およびグルーピング手段4として動作すればよい。また、各手段が、それぞれ別々のハードウェアで実現されていてもよい。
 この場合、グルーピングプログラムは、コンピュータに、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を取得する購買傾向取得処理、および、その傾向およびその傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定めるグルーピング処理を実行させるためのプログラムであるということができる。
 購買傾向取得手段95は、顧客およびサービスの組み合わせ毎、または、顧客およびサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を取得してもよい。この場合、グルーピング手段4は、顧客がサービスを購買する傾向およびその分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定めればよい。
 また、前述の第2の実施形態(図5参照)では、特徴量算出手段13が、商品毎に商品の特徴量を算出し、グルーピング手段14が、顧客と商品の組み合わせ毎に商品購買実績(具体的には、商品購買実績値)を算出する場合を示した。グルーピングシステムが、商品の特徴量、および、商品購買実績(商品購買実績値)を外部から取得する構成であってもよい。この場合のグルーピングシステムの構成例を図25に示す。
 図25に示すグルーピングシステム91は、情報取得手段96と、グルーピング手段97とを備える。
 情報取得手段96は、商品毎に商品の特徴量を取得する。このとき、情報取得手段96は、その特徴量の分布の種別の情報も合わせて取得する。
 さらに、情報取得手段96は、顧客と商品の組み合わせ毎に商品購買実績値も取得する。このとき、情報取得手段96は、その商品購買実績値の分布の種別の情報も合わせて取得する。
 例えば、管理者が、グルーピングシステム91の外部に設けられたサーバに、商品毎に定められた商品の特徴量と、その特徴量の分布の種別の情報を予め記憶させておく。さらに、その管理者は、そのサーバに、顧客と商品の組み合わせ毎に定められた商品購買実績値と、その商品購買実績値の分布の種別の情報を予め記憶させておく。情報取得手段96は、通信ネットワークを介して、そのサーバから、各商品の特徴量およびその特徴量の分布の種別の情報と、各商品購買実績値およびその商品購買実績値の分布の種別の情報とを取得すればよい。なお、情報取得手段96がこれらの情報を取得する態様は、上記の態様に限定されず、他の態様であってもよい。例えば、情報取得手段96が、外部から入力される各商品の特徴量およびその特徴量の分布の種別の情報、各商品購買実績値およびその商品購買実績値の分布の種別の情報を受け付けてもよい。
 情報取得手段96が取得する商品の特徴量は、第2の実施形態において、特徴量算出手段13が算出する商品の特徴量と同様である。また、情報取得手段96が取得する商品購買実績値は、第2の実施形態において、グルーピング手段14が算出する商品購買実績値と同様である。
 グルーピング手段97は、顧客と商品の組み合わせ毎に定められた商品購買実績値と、その商品購買実績値の分布と、商品毎の特徴量と、その特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定める。この動作は、第2の実施形態において、グルーピング手段14が顧客のグループおよび商品のグループを定める動作と同様である。
 情報取得手段96およびグルーピング手段97は、例えば、コンピュータのCPUによって実現される。この場合、CPUは、コンピュータのプログラム記憶装置(図25において図示略)等のプログラム記録媒体からグルーピングプログラムを読み込み、そのグルーピングプログラムに従って、情報取得手段96およびグルーピング手段97として動作すればよい。また、各手段が、それぞれ別々のハードウェアで実現されていてもよい。
 この場合、グルーピングプログラムは、コンピュータに、商品毎に商品の特徴量を取得する情報取得処理、および、顧客と商品の組み合わせ毎に定められた商品購買実績と、その商品購買実績の分布と、商品毎の特徴量と、その特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定めるグルーピング処理を実行させるためのプログラムであるということができる。
 情報取得手段96は、サービス毎に定められたサービスの特徴量と、その特徴量の分布の種別の情報と、顧客とサービスの組み合わせ毎に定められたサービス購買実績と、そのサービス購買実績の分布の種別の情報とを取得してもよい。この場合、グルーピング手段97は、顧客およびサービスの組み合わせ毎に得られたサービス購買実績と、そのサービス購買実績の分布と、サービス毎の特徴量と、その特徴量との分布とに基づいて、顧客のグループおよびサービスのグループを定めればよい。
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2014年12月10日に出願された日本出願特願2014-249953を基礎とする優先権を主張し、その開示の全てをここに取り込む。
産業上の利用の可能性
 本発明は、顧客をグルーピングするとともに、商品もしくは商品に関連する事項またはサービスもしくはサービスに関連する事項をグルーピングするグルーピングシステムに好適に適用される。
 1,11 グルーピングシステム
 2,12 データ記憶手段
 3 購買傾向算出手段
 4,14 グルーピング手段
 13 特徴量算出手段

Claims (31)

  1.  顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出する購買傾向算出手段と、
     前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定めるグルーピング手段とを備える
     ことを特徴とするグルーピングシステム。
  2.  購買傾向算出手段は、顧客の商品購買状況を示す購買データに基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を示す指標値である購買傾向指標値を算出し、
     グルーピング手段は、前記購買傾向指標値および前記購買傾向指標値の分布のパラメータに基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定める
     請求項1に記載のグルーピングシステム。
  3.  グルーピング手段は、
     顧客のグループと、商品のグループまたは商品関連事項のグループと、購買傾向指標値の分布のパラメータとを組み合わせて得られる複数の組の尤度を用いて、顧客のグループと、商品のグループまたは商品関連事項のグループとを定める
     請求項2に記載のグルーピングシステム。
  4.  購買傾向算出手段は、顧客および商品の組み合わせ毎に価格弾力性を購買傾向指標値として算出し、
     グルーピング手段は、顧客のグループおよび商品のグループを定める
     請求項2または請求項3に記載のグルーピングシステム。
  5.  購買傾向算出手段は、顧客および商品の組み合わせ毎に、商品の広告日から顧客が商品を購買するまでの日数の程度を示す値を購買傾向指標値として算出し、
     グルーピング手段は、顧客のグループおよび商品のグループを定める
     請求項2または請求項3に記載のグルーピングシステム。
  6.  購買傾向算出手段は、顧客および商品の組み合わせ毎に、商品の発売日から顧客が商品を購買するまでの日数の程度を示す値を購買傾向指標値として算出し、
     グルーピング手段は、顧客のグループおよび商品のグループを定める
     請求項2または請求項3に記載のグルーピングシステム。
  7.  購買傾向算出手段は、顧客および商品の組み合わせ毎に、商品が店舗に陳列されてから顧客が商品を購買するまでの日数の程度を示す値を購買傾向指標値として算出し、
     グルーピング手段は、顧客のグループおよび商品のグループを定める
     請求項2または請求項3に記載のグルーピングシステム。
  8.  購買傾向算出手段は、顧客および商品の組み合わせ毎に平均購買間隔を購買傾向指標値として算出し、
     グルーピング手段は、顧客のグループおよび商品のグループを定める
     請求項2または請求項3に記載のグルーピングシステム。
  9.  購買傾向算出手段は、顧客および商品カテゴリの組み合わせ毎に、商品カテゴリ内の個別の商品への顧客のこだわり度を購買傾向指標値として算出し、
     グルーピング手段は、顧客のグループを定めるとともに、商品関連事項のグループとして商品カテゴリのグループを定める
     請求項2または請求項3に記載のグルーピングシステム。
  10.  購買傾向算出手段は、顧客および商品カテゴリの組み合わせ毎に、商品カテゴリ内の商品の個別のメーカへの顧客のこだわり度を購買傾向指標値として算出し、
     グルーピング手段は、顧客のグループを定めるとともに、商品関連事項のグループとして商品カテゴリのグループを定める
     請求項2または請求項3に記載のグルーピングシステム。
  11.  購買傾向算出手段は、顧客および商品カテゴリの組み合わせ毎に、商品カテゴリ内の商品の個別のブランドへの顧客のこだわり度を購買傾向指標値として算出し、
     グルーピング手段は、顧客のグループを定めるとともに、商品関連事項のグループとして商品カテゴリのグループを定める
     請求項2または請求項3に記載のグルーピングシステム。
  12.  グルーピング手段は、一人の顧客が1つのグループのみに属し、1つの商品が1つのグループのみに属するように、顧客のグループおよび商品のグループを定める
     請求項1から請求項8のうちのいずれか1項に記載のグルーピングシステム。
  13.  グルーピング手段は、一人の顧客が複数のグループに属すること、および、1つの商品が複数のグループに属することを許容して、顧客のグループおよび商品のグループを定める
     請求項1から請求項8のうちのいずれか1項に記載のグルーピングシステム。
  14.  グルーピング手段は、一人の顧客が1つのグループのみに属し、1つの商品関連事項が1つのグループのみに属するように、顧客のグループおよび商品関連事項のグループを定める
     請求項1、2、3、9、10、11のうちのいずれか1項に記載のグルーピングシステム。
  15.  グルーピング手段は、一人の顧客が複数のグループに属すること、および、1つの商品関連事項が複数のグループに属することを許容して、顧客のグループおよび商品関連事項のグループを定める
     請求項1、2、3、9、10、11のうちのいずれか1項に記載のグルーピングシステム。
  16.  商品毎に商品の特徴量を算出する特徴量算出手段と、
     顧客および商品の組み合わせ毎に得られる商品購買実績と、前記商品購買実績の分布と、商品毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定めるグルーピング手段とを備える
     ことを特徴とするグルーピングシステム。
  17.  グルーピング手段は、顧客および商品の組み合わせ毎に得られる、商品購買実績を示す指標値である購買実績指標値と、前記購買実績指標値の分布のパラメータと、商品毎の特徴量と、前記特徴量の分布のパラメータとに基づいて、顧客のグループおよび商品のグループを定める
     請求項16に記載のグルーピングシステム。
  18.  グルーピング手段は、
     顧客のグループと、商品のグループと、購買実績指標値の分布のパラメータと、商品の特徴量の分布のパラメータとを組み合わせて得られる複数の組の尤度を用いて、顧客のグループおよび商品のグループを定める
     請求項17に記載のグルーピングシステム。
  19.  特徴量算出手段は、商品毎に、商品の特徴量として商品の相対価格を算出する
     請求項16から請求項18のうちのいずれか1項に記載のグルーピングシステム。
  20.  グルーピング手段は、一人の顧客が1つのグループのみに属し、1つの商品が1つのグループのみに属するように、顧客のグループおよび商品のグループを定める
     請求項16から請求項19のうちのいずれか1項に記載のグルーピングシステム。
  21.  グルーピング手段は、一人の顧客が複数のグループに属すること、および、1つの商品が複数のグループに属することを許容して、顧客のグループおよび商品のグループを定める
     請求項16から請求項19のうちのいずれか1項に記載のグルーピングシステム。
  22.  顧客のサービス購買状況に基づいて、顧客およびサービスの組み合わせ毎、または、顧客および、サービスに関連する事項であるサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を算出する購買傾向算出手段と、
     前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定めるグルーピング手段とを備える
     ことを特徴とするグルーピングシステム。
  23.  サービス毎にサービスの特徴量を算出する特徴量算出手段と、
     顧客およびサービスの組み合わせ毎に得られるサービス購買実績と、前記サービス購買実績の分布と、サービス毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよびサービスのグループを定めるグルーピング手段とを備える
     ことを特徴とするグルーピングシステム。
  24.  顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出し、
     前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定める
     ことを特徴とするグルーピング方法。
  25.  商品毎に商品の特徴量を算出し、
     顧客および商品の組み合わせ毎に得られる商品購買実績と、前記商品購買実績の分布と、商品毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定める
     ことを特徴とするグルーピング方法。
  26.  顧客のサービス購買状況に基づいて、顧客およびサービスの組み合わせ毎、または、顧客および、サービスに関連する事項であるサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を算出し、
     前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定める
     ことを特徴とするグルーピング方法。
  27.  サービス毎にサービスの特徴量を算出し、
     顧客およびサービスの組み合わせ毎に得られるサービス購買実績と、前記サービス購買実績の分布と、サービス毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよびサービスのグループを定める
     ことを特徴とするグルーピング方法。
  28.  コンピュータに、
     顧客の商品購買状況に基づいて、顧客および商品の組み合わせ毎、または、顧客および、商品に関連する事項である商品関連事項の組み合わせ毎に、顧客が商品を購買する傾向を算出する購買傾向算出処理、および、
     前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、商品のグループまたは商品関連事項のグループを定めるグルーピング処理
     を実行させるためのグルーピングプログラム。
  29.  コンピュータに、
     商品毎に商品の特徴量を算出する特徴量算出処理、および、
     顧客および商品の組み合わせ毎に得られる商品購買実績と、前記商品購買実績の分布と、商品毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよび商品のグループを定めるグルーピング処理
     を実行させるためのグルーピングプログラム。
  30.  コンピュータに、
     顧客のサービス購買状況に基づいて、顧客およびサービスの組み合わせ毎、または、顧客および、サービスに関連する事項であるサービス関連事項の組み合わせ毎に、顧客がサービスを購買する傾向を算出する購買傾向算出処理、および、
     前記傾向および前記傾向の分布に基づいて、顧客のグループを定めるとともに、サービスのグループまたはサービス関連事項のグループを定めるグルーピング処理
     を実行させるためのグルーピングプログラム。
  31.  コンピュータに、
     サービス毎にサービスの特徴量を算出する特徴量算出処理、および、
     顧客およびサービスの組み合わせ毎に得られるサービス購買実績と、前記サービス購買実績の分布と、サービス毎の前記特徴量と、前記特徴量の分布とに基づいて、顧客のグループおよびサービスのグループを定めるグルーピング処理
     を実行させるためのグルーピングプログラム。
PCT/JP2015/005926 2014-12-10 2015-11-27 グルーピングシステム、グルーピング方法およびグルーピングプログラム WO2016092767A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US15/534,273 US20180260829A1 (en) 2014-12-10 2015-11-27 Grouping system, grouping method, and grouping program
JP2016563402A JP6662298B2 (ja) 2014-12-10 2015-11-27 グルーピングシステム、グルーピング方法およびグルーピングプログラム
EP15866581.0A EP3232390A4 (en) 2014-12-10 2015-11-27 Grouping system, grouping method, and grouping program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014249953 2014-12-10
JP2014-249953 2014-12-10

Publications (1)

Publication Number Publication Date
WO2016092767A1 true WO2016092767A1 (ja) 2016-06-16

Family

ID=56106995

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/005926 WO2016092767A1 (ja) 2014-12-10 2015-11-27 グルーピングシステム、グルーピング方法およびグルーピングプログラム

Country Status (4)

Country Link
US (1) US20180260829A1 (ja)
EP (1) EP3232390A4 (ja)
JP (1) JP6662298B2 (ja)
WO (1) WO2016092767A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11188568B2 (en) 2016-11-14 2021-11-30 Nec Corporation Prediction model generation system, method, and program
US11301763B2 (en) 2016-11-14 2022-04-12 Nec Corporation Prediction model generation system, method, and program

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331628A (ja) * 2000-05-24 2001-11-30 Just Syst Corp マーケティング調査システム及び方法、装置並びに記録媒体
JP2002073946A (ja) * 2000-08-29 2002-03-12 Ikeda Keiei Design Kenkyusho:Kk 販売促進支援方法および販売促進支援装置
JP2007272571A (ja) * 2006-03-31 2007-10-18 Nomura Research Institute Ltd マーケティングリサーチ支援サーバ及び方法
JP2008516355A (ja) * 2004-10-13 2008-05-15 ダンハンビー リミテッド 小売店における製品の価格を決定するための方法
JP2008186413A (ja) * 2007-01-31 2008-08-14 Ntt Data Corp 需要予測装置、需要予測方法、及び、需要予測プログラム
JP2009134487A (ja) * 2007-11-30 2009-06-18 Hitachi Software Eng Co Ltd 消費財購入情報提供システム
JP2014078179A (ja) * 2012-10-11 2014-05-01 Dentsu Inc 情報処理装置、情報処理プログラム及び情報処理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331628A (ja) * 2000-05-24 2001-11-30 Just Syst Corp マーケティング調査システム及び方法、装置並びに記録媒体
JP2002073946A (ja) * 2000-08-29 2002-03-12 Ikeda Keiei Design Kenkyusho:Kk 販売促進支援方法および販売促進支援装置
JP2008516355A (ja) * 2004-10-13 2008-05-15 ダンハンビー リミテッド 小売店における製品の価格を決定するための方法
JP2007272571A (ja) * 2006-03-31 2007-10-18 Nomura Research Institute Ltd マーケティングリサーチ支援サーバ及び方法
JP2008186413A (ja) * 2007-01-31 2008-08-14 Ntt Data Corp 需要予測装置、需要予測方法、及び、需要予測プログラム
JP2009134487A (ja) * 2007-11-30 2009-06-18 Hitachi Software Eng Co Ltd 消費財購入情報提供システム
JP2014078179A (ja) * 2012-10-11 2014-05-01 Dentsu Inc 情報処理装置、情報処理プログラム及び情報処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3232390A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11188568B2 (en) 2016-11-14 2021-11-30 Nec Corporation Prediction model generation system, method, and program
US11301763B2 (en) 2016-11-14 2022-04-12 Nec Corporation Prediction model generation system, method, and program

Also Published As

Publication number Publication date
JPWO2016092767A1 (ja) 2017-10-05
EP3232390A4 (en) 2018-04-18
EP3232390A1 (en) 2017-10-18
US20180260829A1 (en) 2018-09-13
JP6662298B2 (ja) 2020-03-11

Similar Documents

Publication Publication Date Title
JP6424225B2 (ja) 小売施設内で消費者の位置を予測するシステム及び方法
Bustos-Reyes et al. Store and store format loyalty measures based on budget allocation
JP6352798B2 (ja) マーケティング施策最適化装置、方法、及びプログラム
US20160189177A1 (en) Determination of a Purchase Recommendation
JP2009205365A (ja) 商品の在庫管理および販売の最適化システム、その最適化方法、及びその最適化プログラム
Casado et al. Consumer price sensitivity in the retail industry: latitude of acceptance with heterogeneous demand
Lee et al. Consumers' choice for fresh food at online shopping in the time of covid19
Bockholdt et al. Private label shoppers between fast fashion trends and status symbolism–A customer characteristics investigation
Herstein et al. Private and national brand consumers' images of fashion stores
Stan Antecedents of customer loyalty in the retailing sector: the impact of switching costs
Deka Factors Influencing Consumers' Choice of Retail Store Format in Assam, India.
Hillen Psychological pricing in online food retail
Jung et al. A meta-analysis of correlations between market share and other brand performance metrics in FMCG markets
Sebri et al. Estimating umbrella-branding spillovers: a retailer perspective
WO2016092767A1 (ja) グルーピングシステム、グルーピング方法およびグルーピングプログラム
JP6699652B2 (ja) グルーピングシステム、方法、およびプログラム
Smith et al. Predictive analytics improves sales forecasts for a pop-up retailer
JP2016081199A (ja) 広告配信システム
JP6287280B2 (ja) 情報処理方法、プログラム、及び情報処理装置
Atulkar et al. Adoption of retailer centric philosophy in organizing buying process: a case study on Indian buying systems
Chowdhury et al. Antecedents and consequences of customer satisfaction: An empirical study on retail store in Bangladesh
Zhuang et al. Consumer Choice of Private Label or National Brand: The case of organic and non-organic milk
Verhelst et al. Implicit contracts and price stickiness: evidence from customer-level scanner data
Jacob et al. The Determinant Factors that Influence Repurchase Intention of Samsung Smartphone in Jabodetabek
US11948181B2 (en) Systems and methods for using SKU vector information

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15866581

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016563402

Country of ref document: JP

Kind code of ref document: A

REEP Request for entry into the european phase

Ref document number: 2015866581

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 15534273

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE