WO2023120126A1 - 販売数量予測システム、販売数量予測方法 - Google Patents
販売数量予測システム、販売数量予測方法 Download PDFInfo
- Publication number
- WO2023120126A1 WO2023120126A1 PCT/JP2022/044664 JP2022044664W WO2023120126A1 WO 2023120126 A1 WO2023120126 A1 WO 2023120126A1 JP 2022044664 W JP2022044664 W JP 2022044664W WO 2023120126 A1 WO2023120126 A1 WO 2023120126A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- sales volume
- data
- sales
- forecasting system
- store
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 33
- 230000008569 process Effects 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 25
- 238000013277 forecasting method Methods 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 95
- 238000005259 measurement Methods 0.000 description 38
- 238000004364 calculation method Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 230000002123 temporal effect Effects 0.000 description 10
- 238000012937 correction Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 238000013480 data collection Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 240000004050 Pentaglottis sempervirens Species 0.000 description 4
- 235000004522 Pentaglottis sempervirens Nutrition 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Definitions
- the present invention relates to a sales volume forecasting system and a sales volume forecasting method.
- Patent Literature 1 discloses a technique of predicting sales, etc. of a target store using data of a plurality of stores including data of other stores.
- Patent Document 1 a plurality of past visitor number data are used as teacher data (training data), and multiple regression analysis is performed to calculate the visitor number prediction value for a target store. Calculate the regression constant a and the regression coefficients b1 and b2 of the formula (calculation formula with y as the objective variable and x as the explanatory variable), and multiply the predicted number of customers predicted by this formula by the customer unit price to predict sales. A technique for calculating the value is disclosed. In addition to multiple regression analysis, Patent Document 1 applies methods such as random forests, neural networks, generalized linear models, generalized additive models, ensemble learning models, and SVC alone or in combination. is also included in the present invention.
- the manager should take into account the differences in the products handled by each store and the sales (based on the relationships between
- existing prediction systems do not make much use of the relationship between data from multiple stores for prediction.
- the present invention aims to provide a sales volume forecasting system and a sales volume forecasting method that are capable of grasping the relationship between data of a plurality of stores from a bird's-eye view and predicting the sales volume of a more appropriate product. aim.
- the sales quantity forecast system includes a processor.
- the processor uses a trained model that predicts the sales volume of the product generated based on the data on the sales volume of the product of each store, which may partially differ in the products handled by the stores, to predict the sales volume of the product of the target store. Predict sales volume.
- the sales volume forecasting method is a sales volume forecasting method that uses a processor. Then, this sales volume prediction method includes: (1) generating a trained model for predicting the sales volume of the product based on the data on the sales volume of the product of each store, in which the products handled by the stores may be partially different; (2) Using the learned model, predict the sales volume of the product of the target store.
- a sales volume forecasting system and a sales volume forecasting method are provided that are capable of grasping the relationship between data of multiple stores from a bird's-eye view and predicting the sales volume of a more appropriate product.
- FIG. 4 is a diagram showing an example of the configuration of a model of a neural network
- the sales volume prediction system can predict the sales volume of the product (that is, the sales volume of the product) of the target store using a trained model for predicting the sales volume of the product.
- the sales volume forecasting system is not limited to this example, and the sales volume forecasting system, for example, estimates the sales volume based on the data obtained by measuring the sales volume in a situation where there are no partial differences in the products handled by multiple stores. You can predict.
- the sales volume forecasting system may forecast the sales volume based on the data acquired in a predetermined period.
- the sales volume forecasting system is not limited to use for forecasting the sales volume for the next day, and may be used, for example, for forecasting the sales volume for a certain time period.
- the sales volume forecasting system 1 includes a sales volume measurement unit 101 and a controller unit 102.
- the controller unit 102 includes a measurement data collection unit 103, a measurement data interpolation unit 104, a statistic calculation unit 105, a correlation matrix calculation unit 106, a correlation coefficient correction unit 107, a graph generation unit 108, an attribute A data addition unit 109 , a temporal feature amount processing unit 110 , a graph feature amount processing unit 111 , a feature amount integration processing unit 112 , and a prediction result output unit 113 are provided.
- the various configurations (103 to 113) described above are programs and stored in an appropriate storage device.
- programs (110, 111, 112) constitute a deep learning unit 114 that expresses functions related to execution of deep learning in the learning phase.
- the sales volume measurement unit 101 cooperates with the POS (Point of Sale) system installed in each store, etc., to determine the product classification such as detergent and confectionery and the model number (the product name is also unique to each product) for the sold products. If so, it will be regarded as the model number), the sales volume, and the date and time of sale.
- the data measured by the sales volume measurement unit 101 is transmitted to the controller unit 102 .
- the controller unit 102 is located at the headquarters of a chain store (that is, the center that manages multiple stores as a whole).
- the controller unit 102 collects the data measured by the sales volume measurement unit 101 from each store, learns sales volume prediction based on the collected data, and processes sales volume prediction based on the learning results.
- the measurement data collection unit 103 performs processing for collecting data measured by the sales volume measurement unit 101 via the Internet or the like.
- the measurement data interpolating unit 104 performs processing for interpolating time-series data of the sales volume of products that are not commonly handled by a plurality of stores.
- the statistic calculation unit 105 performs a process of calculating statistics such as the average value, standard deviation, kurtosis, and skewness for each time-series data of the sales volume of each product in each store.
- the correlation matrix calculation unit 106 performs processing for calculating the correlation of the sales volume between stores using the time-series data of the sales volume of each product of each store.
- Correlation matrix correction section 107 selects a correlation matrix from among a plurality of correlation matrices along the time series, selects a correlation coefficient that is a matrix element from the selected correlation matrix, and converts the correlation coefficient responsible for modifying the value of
- the graph generation unit 108 performs processing for generating a graph that expresses stores as nodes and expresses relationships between stores as edges.
- the attribute data addition unit 109 performs processing for assigning the aforementioned statistic as attribute data to nodes of the generated graph.
- the temporal feature amount processing unit 110 is used to process feature amounts for time-series data of the sales volume of each product in each store.
- the graph feature quantity processing unit 111 is used to process the feature quantity of the generated graph, and in the framework of deep learning, learns and extracts the feature quantity of the graph.
- the feature amount integration processing unit 112 uses both the graph feature amount and the temporal feature amount of the time-series data, and in the framework of deep learning, performs processing for learning about product sales volume prediction, and based on the learning result It is responsible for the process of predicting the sales volume of products.
- the prediction result output unit 113 performs processing for outputting the result predicted by the deep learning unit 114, such as displaying it on a screen.
- the sales volume measurement unit 101 can be configured by, for example, a computer installed in each store.
- each hardware configuration is connected via a bus, and the sales volume measurement unit 101 includes a control unit 201 , a storage device 202 and a communication unit 203 .
- the control unit 201 can be, for example, a CPU (Central Processing Unit), and is an entity that implements predetermined processing by executing a program that causes the sales volume measurement unit 101 to operate.
- data such as programs executed by the control unit 201 of the sales volume measurement unit 101 are stored in the storage device 202, and the storage device 202 uses a HDD (Hard Disk Drive), a ROM (Read Only Memory), or the like.
- HDD Hard Disk Drive
- ROM Read Only Memory
- the sales volume measurement unit 101 may include a RAM (Random Access Memory) 204, and the control unit 201 may read data into the RAM 204 and perform processing.
- a communication unit 203 is an interface used for communication with the controller unit 102 , and communication with the controller unit 102 is performed via the communication unit 203 .
- each hardware configuration is connected via a bus, and the controller section 102 includes a processor 251 , a storage device 252 and a communication section 253 .
- the processor 251 is a main body that executes a program stored in the storage device 252 and realizes predetermined processing.
- the storage device 252 can be appropriately configured using a ROM, HDD, or the like, and stores data used for processing such as programs as appropriate.
- the controller unit 102 may also include a RAM 254, and the processor 251 may read data into the RAM 254 and perform processing.
- the controller unit 102 includes a display unit 255 .
- the display unit 255 is configured as an appropriate display device, and can display prediction results and the like.
- the controller unit 102 also includes an input unit 256 configured as an input device used when the user performs a predetermined operation (for example, when the user starts learning processing or outputs a prediction result). good too.
- the input unit 256 may be omitted, and the sales volume prediction system 1 may be configured to automatically execute a predetermined task without intervention of the user's operation in the controller unit 102 .
- the display unit 255 and the input unit 256 may be external components connected to the controller unit 102 .
- FIG. 3 is a flowchart showing an example of the flow of processing in the learning phase in the controller unit (an example of feature extraction processing by graph convolution and action value learning processing).
- This measurement data log records the history of the product classification of the products sold, the model number unique to each product, the quantity sold, and the date and time of sale for a specified period.
- An example of the obtained time-series data is shown in FIG. In FIG. 4, the horizontal axis corresponds to the date and time, and the vertical axis corresponds to the sales volume. Examples are given.
- the sales volume data corresponding to the five stores are represented by 401 to 405, respectively (that is, the sales volume data of a certain product common to the five stores are represented by 401 to 405, respectively). 405), but it is assumed that there are actually more stores, and similar time-series data is obtained for each product handled in each store.
- FIG. 5 shows the flow of this processing.
- FIG. 5 is a flowchart illustrating an example of time-series data interpolation processing.
- processing is performed to find the average value of the time-series data of the sales volume of the product whose sales volume is to be predicted (S502).
- a process of obtaining the same number of noises as the time-series data is performed (S503).
- the noise can be, for example, a statistic related to the time-series data of the product sales volume for the store group obtained in S501 described above, and the time-series data of the product for each store. A statistic is obtained as noise.
- the noise here is a value obtained stochastically within the normal distribution range based on, for example, the standard deviation of the time-series data.
- each noise obtained is added to each value of the time-series data already obtained (that is, the average value of the time-series data obtained in S502) to generate new time-series data. is done. Interpolation is performed by assigning the generated time-series data as the time-series data of stores that do not handle the prediction target product (S504).
- the correlation of the sales volume between stores is calculated using the time-series data of the sales volume of each product of each store.
- a process is performed (S305). This process is a process of generating a correlation matrix by finding the correlation coefficients for the sales volume of each product (each product with a unique model number) in a combination of all stores.
- a plurality of correlation matrices for each fixed period and for each product can be obtained by performing the process of generating the correlation matrix for each fixed period of the time-series data of the sales volume.
- FIG. 6 shows the flow of this processing.
- FIG. 6 is a flowchart showing an example of correlation coefficient correction processing (an example of over-learning reduction processing by edge cutting).
- a plurality of correlation matrices for each fixed time period and for each product obtained in the correlation matrix calculation process are input and passed to the correlation matrix selection process.
- a plurality of correlation matrices are randomly selected from among a plurality of correlation matrices so as to have a specified ratio with respect to the total number of correlation matrices (S601).
- a plurality of correlation coefficients are randomly selected in each of the selected plurality of correlation matrices so as to have a specified ratio with respect to the total number of correlation coefficients. (S602).
- processing is performed to generate a graph that expresses the relationships between shops using edges as nodes (S307).
- the processor 251 Based on the fact that the correlation coefficient contained in the already calculated correlation matrix represents the correlation of sales volume between stores, if the absolute value of the correlation coefficient is above the threshold, there is a relationship between stores.
- the processor 251 generates a graph by performing an operation (processing) for connecting edges between the nodes of the stores concerned.
- FIG. 7 shows an example of a graph showing the relationship between stores when focusing on a certain product.
- reference numeral 701 denotes a node representing a store
- reference numeral 702 denotes an edge indicating a relationship between stores.
- the length of the edge is related to the magnitude of the correlation coefficient.
- the above-described statistic (the statistic obtained in S304) is assigned as attribute data to the nodes of the generated graph. Processing is performed (S308). In other words, this process uses the already calculated mean, standard deviation, kurtosis, and skewness data as statistical data for the time-series data of the sales volume of each product. This is done by linking to the node corresponding to the store.
- FIG. 8 shows an example of the neural network model configuration for this learning.
- This model is roughly composed of a temporal feature amount processing layer 801 (a temporal feature amount processing layer in the figure), a graph feature amount processing layer 802 and a feature amount integration processing layer 803 .
- the feature amount integration processing layer 803 is composed of a feature amount connection layer 804 , a batch normalization layer 805 , a dropout layer 806 and a full connection layer 807 .
- time-series data is input to the temporal feature amount processing layer 801 .
- the temporal feature amount processing layer 801 an LSTM (Long Short Term Memory) is assumed here, and the feature amount of chronological changes in sales volume is learned by using this.
- Processing related to learning and extraction of feature amounts of time-series data is realized by the processor 251 executing the temporal feature amount processing unit 110 .
- graphs are input to the graph feature amount processing layer 802 .
- a GCN Graph Convolutional Network
- graph feature amounts are learned. Processing related to learning and extraction of graph feature amounts is realized by the processor 251 executing the graph feature amount processing unit 802 .
- This process follows the GCN framework, and for each node that forms the graph, it is performed by a convolution operation in which the attribute data of the node connected to each node is weighted and added. For example, focusing on node 703 in the graph of FIG. As a result, the attribute data (node attribute 705 in FIG. 7) of the nodes connected to the node 703 (nodes other than the reference numeral 703 inside the range 704) are reflected in the attribute data of the node 703, and the characteristics around the node 703 are reflected. quantity is obtained. If such convolution processing is performed once, the attribute data of nodes directly connected to the node of interest will be convoluted. , the attribute data of distant nodes that are not directly connected to the node of interest are also convoluted, and a wider range of feature values centered on the node of interest can be obtained.
- the features obtained by the temporal feature amount processing layer 801 and the graph feature amount processing layer 802 are input to the feature amount integration processing layer 803 and first combined in the feature amount combination layer 804 .
- the combined features pass through a batch normalization layer 805, a dropout layer 806, and a fully connected layer 807 to output a predicted sales volume.
- the difference (error) between the predicted sales volume and the actual sales volume obtained from the measurement data is calculated, and the weight parameters of the neural network included in the model are updated so that this difference becomes small. be.
- time-series data and graphs of common times are used for learning. Processing related to learning and prediction is realized by the processor 251 executing the feature quantity integration processing unit 112 .
- the process is almost the same as the flow of processing in the learning phase in Fig. 3, but the measurement data up to the day before the day you want to predict the sales volume is obtained, and the sales volume is predicted using the learned model. It will be done.
- the measurement data collection processing that is, the processing of S302
- the time-series data and graph learning process the time-series data and graph are input to the model without learning, and the forecast value of the sales volume is output (that is, instead of the processing related to S309 to S310, the learned point at which the predicted value is output using the model).
- processor 251 executes prediction result output unit 113 to implement processing related to the output of the sales volume prediction value.
- the sales volume prediction system 1 it is possible to grasp the relationship between the data of a plurality of stores from a bird's-eye view, and to predict the sales volume of a more appropriate product. Then, the user can make an appropriate business plan based on the prediction of the sales volume of the product that captures the relationship between the data from a bird's-eye view, so the sales volume prediction system 1 contributes to resource saving (for example, It can also contribute to the reduction of product loss, etc.
- the processor 251 can cause the display unit 255 to display data related to the predicted sales volume of the product by executing an appropriate program (for example, the prediction result output unit 113).
- the display mode is not particularly limited, and for example, a display that shows changes in sales volume over time may be performed in a graph format, a table format, or the like. Also, a display that emphasizes a time period during which a predetermined sales volume can be expected may be performed.
- the processor 251 may perform output or display on a display device or the like connected to the outside of the system.
- the sales volume forecasting system 1 of this embodiment has been described in detail, the present invention is not limited to the embodiment and includes various modifications. For example, it is possible to add, delete, or replace some of the configurations of the embodiments with other configurations.
- the sales volume measurement unit 101 is installed in each store, and the controller unit 102 is installed in a center that manages the entire plurality of stores.
- the controller unit 102 may be located at any store.
- the controller unit 102 may be installed in each store, and each store may collect data of other stores to learn and predict the sales volume.
- the sales volume measurement unit 101 may be a computer that measures data such as the sales volume of a product and transmits the measured data to the controller unit 102.
- the sales volume measurement unit 101 may have a server function for accumulating or collecting data in the store. may be a computer having
- the sales volume measurement unit 101 measures the data such as the sales volume of the product using the data of the day directly input by the store clerk or the like after the store is closed, and sends the measured data to the controller unit 102. It may also be a computer (for example, a personal computer for business use) that transmits to.
- the timing at which the sales volume measurement unit 101 transmits data and the timing at which the controller unit 102 collects data may be set as appropriate. For example, data may be transmitted and received at predetermined time intervals, or at intervals of one day or several days.
- the sales volume measurement unit 101 measures data such as the sales volume of a product and transmits the result to the controller unit 102 .
- metering such as the number of items sold, may be performed.
- the configurations, programs, etc. of the sales volume measurement unit 101 and the controller unit 102 may be changed as appropriate.
- attribute data is added to edges in processing by the attribute data addition unit 109, and attribute data is added to edges in processing by the graph feature amount processing unit 111. may be processed.
- pooling and dropout layers may be combined with the temporal feature amount processing layer 801 and graph feature amount processing layer 802 .
- the controller unit 102 can be configured to have the same functions as a PC (personal computer).
- the controller unit 102 includes, for example, a CPU, a memory, a communication device, a user interface for handling basic operations and display of processing results, basic hardware such as a power supply and wiring, and controls them. It can be assumed that the OS, various firmware, basic software such as drivers, etc. necessary for operating each part are provided.
- the control unit 201 and the processor 251 can be CPUs, but they may be main bodies that execute predetermined processing, and may be other semiconductor devices (for example, GPU: Graphics Processing Unit).
- each part (103 to 113) of the controller 102 is assumed to be implemented as software here, but all or part of them may be implemented as hardware.
- each unit (103 to 113) may be located at a remote location, for example, if communication is possible.
- the hardware and software constituting the above units (103 to 113) may be selected according to the embodiment.
- the learned model may be generated at a remote location where communication is possible, and the controller unit 102 may use the learned model generated at a remote location where communication is possible to predict the sales volume of the product. . Also, as an example, the controller unit 102 may download and use a trained model generated by a method similar to that described herein in an appropriate manner.
- a trained model may be generated using time-series data that has an appropriate relationship. For example, from the perspective of the store, a trained model may be generated using time-series data in which stores have a common area. As a result, it is possible to more comprehensively predict the sales volume of products in a predetermined store opening area based on the store's point of view.
- the store opening area may use data common in units such as Region, District, State, etc., or data common in units such as municipalities, prefectures, municipalities, etc. may be used.
- a trained model may be generated using time-series data with a common purchaser group from the viewpoint of purchaser group (for example, gender, age, occupation, etc.). As a result, it is possible to make a more comprehensive prediction based on the purchaser's point of view.
- interpolation may be performed based on data having the same scale. By performing interpolation using such data, more appropriate interpolation can be performed.
- S303 for example, based on the data of stores that are close to each other, the data of stores that have the same store opening area, the data of stores that are close to the purchasing demographic (for example, the data of stores that have a similar distribution of age and gender, etc.) Then, a condition may be set that interpolation is performed. That is, in S303, complementary processing may be performed based on data common to at least one of the distances between stores, store opening areas, and purchase demographics.
- the sales volume prediction system 1 can be used for chain stores such as convenience stores, drug stores, car dealers, and clothing stores, but is not limited to these.
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
販売数量予測システムは、プロセッサを備えている。前記のプロセッサは、店舗間で扱う商品が部分的に異なり得る各店舗の商品の売り上げ数量に関するデータに基づいて生成される商品の売り上げ数量を予測する学習済みモデルを用いて、対象となる店舗の商品の売り上げ数量を予測する。
Description
本発明は、販売数量予測システム、および、販売数量予測方法に関する。
従来より、適宜のモデルを用いて商品の販売数量等を予測する技術について知られている。特許文献1は、対象の店舗の売り上げ等を予測する際に、他の店舗のデータも含めた複数の店舗のデータを用いて予測を行う技術を開示している。
すなわち、特許文献1は、複数の過去の来店客数データを教師データ(訓練データ)として、重回帰分析することにより、対象となった店舗の来店客数予測値を計算するための来店客数予測の計算式(yを目的変数として、xを説明変数とする計算式)の回帰定数a、回帰係数b1、b2を計算し、この計算式により予測された来店客数予測値に客単価を乗じて売上予測値を計算する技術を開示する。また、特許文献1は、予測計算は重回帰分析以外にも、ランダムフォレスト、ニューラルネットワーク、一般化線形モデル、一般化加法モデル、アンサンブル学習モデル、SVCなどの手法を単独で、もしくは組み合わせて適用することも本発明に含まれると開示する。
例えば、チェーンストアなど複数の店舗のデータがある場合には、経営者などは、各店舗で扱われている商品と売れ行きの相違等を加味して(すなわち、俯瞰的に捉えた複数店舗のデータ間の関係性を踏まえて)、販売数量の予測を行うと考えられる。しかしながら、既存の予測システムでは、複数店舗のデータの関係性が予測にあまり活用されていないことが考えられる。
そこで、本発明は、複数店舗のデータ間の関係性を俯瞰的に捉え、より適切な商品の販売数量の予測を行うことができる販売数量予測システム、および、販売数量予測方法を提供することを目的とする。
本発明の第1の態様によれば、下記の販売数量予測システムが提供される。すなわち、販売数量予測システムは、プロセッサを備える。プロセッサは、店舗間で扱う商品が部分的に異なり得る各店舗の商品の売り上げ数量に関するデータに基づいて生成される商品の売り上げ数量を予測する学習済みモデルを用いて、対象となる店舗の商品の売り上げ数量を予測する。
本発明の第2の態様によれば、下記の販売数量予測方法が提供される。すなわち、販売数量予測方法は、プロセッサを用いて行う販売数量予測方法である。そして、この販売数量予測方法は、(1)店舗間で扱う商品が部分的に異なり得る各店舗の商品の売り上げ数量に関するデータに基づいて、商品の売り上げ数量を予測する学習済みモデルを生成し、(2)前記学習済みモデルを用いて、対象となる店舗の商品の売り上げ数量を予測する。
本発明によれば、複数店舗のデータ間の関係性を俯瞰的に捉え、より適切な商品の販売数量の予測を行うことができる販売数量予測システム、および、販売数量予測方法が提供される。なお、前述した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
図を参照しながら、販売数量予測システムについて説明する。販売数量予測システムは、商品の販売数量を予測するための学習済みモデルを用いて、対象となる店舗の商品の販売数量(すなわち、商品の売り上げ数量)を予測することができる。
本実施形態では、チェーンストアをなす複数の店舗で扱われる商品に部分的な差異がある状況において、各店舗の各商品の販売数量などを計測し、計測を行った日までのデータをもとにした翌日の販売数量を予測することをタスクとして、このタスクを実行する販売数量予測システムの構成と処理について述べる。しかしながら、この例に限定されるものではなく、販売数量予測システムは、例えば、複数の店舗で扱われる商品に部分的な差異がない状況において販売数量などを計測したデータをもとに販売数量を予測してもよい。また、販売数量予測システムは、所定の期間において取得したデータをもとにして、販売数量の予測を行ってもよい。また、販売数量予測システムは、翌日の販売数量を予測する使用に限定されず、例えば、ある時間帯の販売数量の予測に用いられてもよい。
図1に示すように、販売数量予測システム1は、販売数量計測部101と、コントローラ部102と、を備える。また、コントローラ部102は、計測データ収集部103と、計測データ補間部104と、統計量算出部105と、相関行列算出部106と、相関係数修正部107と、グラフ生成部108と、属性データ付加部109と、時間的特徴量処理部110と、グラフ特徴量処理部111と、特徴量統合処理部112と、予測結果出力部113と、を備える。ここで、上記した各種の構成(103~113)は、プログラムであり、適宜の記憶装置に記憶される。また、コントローラ部102において、プログラム(110、111、112)により、学習フェーズにおいて深層学習の実行に関する機能を表現する深層学習部114が構成されている。
販売数量計測部101は、各店舗に設置されたPOS(Point оf Sale)システムなどとの連携により、販売された商品について、洗剤や菓子といった商品分類と個々の商品固有の型番(商品名も固有であれば型番とみなすものとする)、販売数量、販売された日時の各データを計測する処理を担う。そして、販売数量計測部101により計測されたデータは、コントローラ部102に送信される。
コントローラ部102は、一例として、チェーンストアの本部(すなわち、複数ある店舗全体を管理するセンタ)に配置される。コントローラ部102は、販売数量計測部101で計測されたデータを各店舗から収集し、これに基づく販売数量の予測についての学習、ならびに学習結果に基づいた販売数量の予測を行う処理を担う。
各プログラム(103~113)について説明する。ここで、各プログラム(103~113)の処理の主体は、コントローラ部102のプロセッサである。計測データ収集部103は、販売数量計測部101で計測されたデータを、インターネットなどを介して収集する処理を担う。計測データ補間部104は、複数の店舗で共通に扱われていない商品の販売数量の時系列データについて補間する処理を担う。統計量算出部105は、各店舗の各商品の販売数量の時系列データ毎に、平均値、標準偏差、尖度、歪度などの統計量を算出する処理を担う。相関行列算出部106は、各店舗の各商品の販売数量の時系列データを用いて、店舗間における販売数量の相関を算出する処理を担う。相関行列修正部107は、時系列に沿って複数ある相関行列の中から、相関行列を選択し、また、選択した相関行列の中から、行列要素である相関係数を選択し、相関係数の値を修正する処理を担う。グラフ生成部108は、店舗をノードとして表現し、店舗間の関係をエッジで表現するグラフを生成する処理を担う。属性データ付加部109は、生成されているグラフのノードに、前述の統計量を属性データとして割り当てる処理を担う。時間的特徴量処理部110は、各店舗の各商品の販売数量の時系列データについての特徴量の処理に用いられ、深層学習の枠組みでは、時系列データの特徴量を学習し、抽出できるようにする処理を担う。グラフ特徴量処理部111は、生成したグラフについての特徴量の処理に用いられ、深層学習の枠組みでは、グラフの特徴量を学習し、抽出できるようにする処理を担う。特徴量統合処理部112は、グラフ特徴量と時系列データの時間的特徴量の両方を用いて、深層学習の枠組みでは、商品の販売数量の予測に関する学習を行う処理、および、学習結果に基づいて商品の販売数量を予測する処理を担う。予測結果出力部113は、深層学習部114で予測された結果を画面への表示など、出力する処理を担う。
次に、図2を参照しながら、販売数量予測システムのハードウェア構成の一例について説明する。
先ず、販売数量計測部101について説明する。販売数量計測部101は、一例として、各店舗に配置されるコンピュータにより構成することができる。販売数量計測部101において、各ハードウェア構成はバスを介して接続されており、販売数量計測部101は、制御部201と、記憶装置202と、通信部203と、を備える。制御部201は、一例として、CPU(Central Processing Unit)とすることができ、販売数量計測部101を動作させるプログラムを実行することにより、所定の処理を実現する主体である。ここで、販売数量計測部101の制御部201により実行されるプログラム等のデータは、記憶装置202に記憶され、記憶装置202は、HDD(Hard Disk Drive)やROM(Read Only Memory)等を用いて適宜に構成することができる。また、販売数量計測部101は、RAM(Random Access Memory)204を備えてもよく、制御部201は、RAM204にデータを読み込んで処理を行ってもよい。通信部203は、コントローラ部102との通信に用いるインタフェースであり、通信部203を介してコントローラ部102との通信が行われる。
次に、コントローラ部102について説明する。コントローラ部102において、各ハードウェア構成はバスを介して接続されており、コントローラ部102は、プロセッサ251と、記憶装置252と、通信部253と、を備える。プロセッサ251は、記憶装置252に記憶されるプログラムを実行して、所定の処理を実現する主体である。記憶装置252は、ROMやHDD等を用いて適宜に構成することができ、プログラム等の処理に用いるデータを適宜に記憶する。また、コントローラ部102は、RAM254を備えてもよく、プロセッサ251は、RAM254にデータを読み込んで処理を行ってもよい。
また、本実施形態では、コントローラ部102は、表示部255を備える。表示部255は、適宜の表示装置として構成され、予測結果などの表示を行うことができる。また、コントローラ部102は、ユーザが所定の操作を行う際(例えば、ユーザが、学習処理を開始させる際や予測結果を出力させる際)に用いられる入力装置として構成される入力部256を備えてもよい。ただし、入力部256が省略され、販売数量予測システム1は、コントローラ部102におけるユーザの操作を介さずに、所定のタスクを自動で実行する構成であってもよい。また、表示部255や入力部256は、コントローラ部102に接続される外部の構成であってもよい。
次に、図3を参照しながら、コントローラ部102における処理の流れについて述べる。コントローラ部102での処理は学習フェーズの処理と予測フェーズの処理とに分けられるが、ここではまず学習フェーズでの処理について述べる。図3は、コントローラ部における学習フェーズの処理の流れの一例(グラフ畳み込みによる特徴抽出処理と行動価値の学習処理の一例)を示すフローチャートである。
コントローラ部102が処理を開始すると、まず、初期化処理によって、学習用のパラメータなどが初期値に設定される(S301)。
次に、プロセッサが計測データ収集部103を実行して実現される計測データ収集処理にて、販売数量計測部101からインターネットなどを介してコントローラ部102に送られてくる計測データのログの収集が行われる(S302)。
この計測データのログには、販売された商品の商品分類と個々の商品固有の型番、販売数量、販売された日時のそれぞれについて、指定した期間の履歴が記録されている。ここで、得られた時系列データの一例を、図4に示す。図4において、横軸は日時に、また、縦軸は販売数量に対応しており、この例では、ある商品分類におけるある商品に着目した場合に、店舗毎に得られた販売数量のデータの例が示されている。なお、同図では、簡単のため、5つの店舗に対応する販売数量のデータをそれぞれ401~405で表現しているが(すなわち、5つの店舗で共通するある商品の売り上げ数量に関するデータをそれぞれ401~405で表現しているが)、実際はより多くの店舗があり、また、店舗で扱われる商品毎に、同様の時系列データが得られているものとする。
次に、プロセッサ251が計測データ補間部104を実行して実現される計測データ補間処理にて、販売数量の予測を行う対象となっている商品が、店舗間で共通に扱われていない場合に、販売数量の時系列データを補間する処理が行われる(S303)。この処理の流れを図5に示す。図5は、時系列データの補間処理の一例を示すフローチャートである。
ここで、この例では、ある1つの店舗のみが販売数量の予測対象の商品を扱っておらず、他の店舗は扱っているものとする。この状況で、まず、計測データに含まれる商品分類のデータをもとに、扱っている商品の構成が近い店舗群を求める処理が実行される(S501)。この店舗群は、商品分類の項目の一致数が閾値以上となる店舗を探索することで求められる。
次に、扱っている商品の構成が近い店舗群の中で、販売数量の予測を行いたい商品の販売数量の時系列データについての平均値を求める処理が行われる(S502)。次に、時系列データと同数のノイズを求める処理が行われる(S503)。なお、ここでのノイズは、一例として、上記したS501において求められた店舗群についての商品の販売数量の時系列データに関する統計量とすることができ、それぞれの店舗分の商品の時系列データの統計量が、ノイズとして求められる。なお、ここでのノイズは、例えば時系列データの標準偏差を求め、これをもとにした正規分布の範囲で確率的に得られる値とする。
次に、求めたそれぞれのノイズを、既に求めている時系列データの各値(すなわち、S502で求められた時系列データについての平均値)に加算して、新規の時系列データを生成する処理が行われる。このようにして、生成した時系列データを、予測対象の商品を扱っていない店舗の時系列データとして割り当てることで、補間が行われる(S504)。
プロセッサ251が統計量算出部105を実行して実現される統計量算出処理にて、各店舗の各商品の販売数量の時系列データ毎に、平均値、標準偏差、尖度、歪度などの統計量を算出する処理が行われる(S304)。
次に、プロセッサ251が相関行列算出部106を実行して実現される相関行列算出処理にて、各店舗の各商品の販売数量の時系列データを用いて、店舗間における販売数量の相関を算出する処理が行われる(S305)。この処理は、商品毎(固有の型番の商品毎)に、その販売数量について、すべての店舗間の組合せでの相関係数を求めて相関行列を生成する処理となる。相関行列を生成する処理を、販売数量の時系列データの一定期間毎に行うことで、一定期間毎の、また、商品毎の複数の相関行列が得られる。
次に、プロセッサ251が相関行列修正部107を実行して実現される相関係数修正処理が行われる(S306)。この処理の流れを図6に示す。図6は、相関係数の修正処理の一例(エッジカットによる過学習低減処理の一例)を示すフローチャートである。
ここでは、まず、相関行列算出処理にて得られた、一定時間毎の、また、商品毎の複数の相関行列が入力され、相関行列の選択処理に渡される。ここで、複数ある相関行列から、相関行列の全体の数に対して指定した割合となるように、複数の相関行列がランダムに選択される(S601)。
次に、相関係数の選択処理として、選択済みの複数の相関行列のそれぞれにおいて、相関係数の全体の数に対して指定した割合となるように、複数の相関係数がランダムに選択される(S602)。
次に、選択済みの複数の相関行列における選択済みの複数の相関係数のそれぞれについて、相関係数の大きさの判定処理が行われ(S603)、その絶対値が閾値以上の場合は相関係数を0とするような相関係数の変更処理が行われる(S604)。次のグラフ生成処理では(すなわち、S307では)、相関係数の大きさによってエッジを張る処理が行われることから、この相関係数を0とする操作はエッジを削除する操作に相当するが、これは特定の店舗間の関係性を後で詳しく説明する学習で重視し過ぎないようにすることを意図している。
プロセッサ251がグラフ生成部108を実行して実現されるグラフ生成処理にて、店舗をノードとして、また、店舗間の関係をエッジで表現するグラフを生成する処理が行われる(S307)。既に算出されている相関行列に含まれる相関係数が、店舗間の販売数量の相関を表すことを踏まえ、相関係数の絶対値が閾値以上の場合、店舗と店舗の間に関係があるものとみなし、該当する店舗のノードとノードの間にエッジを張る操作(処理)を行うことで、プロセッサ251はグラフを生成する。ここで、ある商品に着目したときの店舗間の関係を表すグラフの例を、図7に示す。ここでは、店舗を表すノードが符号701で、また、店舗と店舗の間に関係があることを示すエッジが符号702で表現されている。また、グラフにおいて、エッジの長さは、相関係数の大きさに関係している。
次に、プロセッサ251が属性データ付加部109を実行して実現される属性データ付加処理にて、生成済みのグラフのノードに、前述の統計量(S304で求めた統計量)を属性データとして割り当てる処理が行われる(S308)。すなわち、この処理は、商品毎の販売数量の時系列データの統計量のデータとして、既に算出されている平均値、標準偏差、尖度、歪度の各データを、その時系列データが得られた店舗に該当するノードに紐づけることで行われる。
次に、プロセッサ251が深層学習部114に係るプログラムを実行することにより実現される時系列データとグラフの学習処理が行われる(S309)。ここで、この学習に関するニューラルネットワークのモデルの構成の一例を図8に示す。このモデルは、大きくは時間的特徴量処理層801(図では時系的特徴量処理層)、グラフ特徴量処理層802、特徴量統合処理層803から構成される。また、特徴量統合処理層803は、特徴量結合層804、バッチノーマライゼーション層805、ドロップアウト層806、全結合層807から構成される。
ここで、モデルに入力されるデータのうち、時系列データは、時間的特徴量処理層801に入力される。時間的特徴量処理層801としては、ここではLSTM(Long Short Term Memory)を想定し、これを用いることで販売数量の時系列変化の特徴量が学習されるとする。なお、時系列データの特徴量の学習および抽出に関する処理は、プロセッサ251が時間的特徴量処理部110を実行することで実現される。
また、モデルに入力されるデータのうち、グラフは、グラフ特徴量処理層802に入力される。グラフ特徴量処理層802としては、ここではGCN(Graph Convolutional Network)を想定し、グラフの特徴量が学習されるとする。なお、グラフの特徴量の学習および抽出に関する処理は、プロセッサ251がグラフ特徴量処理部802を実行することで実現される。
この処理は、GCNの枠組みに従い、グラフをなす各ノードについて、各ノードに接続されているノードの属性データに重みを掛けて加算する畳み込み演算によって行われる。例えば、図7のグラフにおいて、ノード703に着目すると、これに接続されているノード(範囲704の内側のノード)の属性データがノード703の属性データに畳み込まれる。これによって、ノード703に接続されているノード(範囲704の内側で符号703以外のノード)の属性データ(図7において、ノード属性705)がノード703の属性データに反映され、ノード703周辺の特徴量が得られる。このような畳み込み処理を1回行うと、着目しているノードに直接接続されているノードの属性データが畳み込まれるが、グラフ特徴量処理層802を複数接続して畳み込み処理を複数回行うことで、着目しているノードに直接接続されていない、離れたノードの属性データも畳み込まれ、着目しているノードを中心により広い範囲の特徴量が得られる。
時間的特徴量処理層801とグラフ特徴量処理層802によって得られた特徴は、特徴量統合処理層803に入力され、まず、特徴量結合層804にて結合される。結合された特徴量は、バッチノーマライゼーション層805、ドロップアウト層806、全結合層807を通して、販売数量の予測値を出力する。学習フェーズにおいては、この販売数量の予測値と計測データより得られる販売数量の実績値との差(誤差)が求められ、これが小さくなるようにモデルに含まれるニューラルネットワークの重みのパラメータが更新される。なお、学習処理では、一例として、共通する時間の時系列データおよびグラフが学習に用いられる。また、学習および予測に関する処理は、プロセッサ251が特徴量統合処理部112を実行することで実現される。
以上の処理を通して学習は進められ、プロセッサが適宜のプログラムを実行して実現される学習完了判定処理にて、誤差の変化率が閾値より小さくなった場合は学習完了、そうでない場合は学習未完了との判定が行われる(S310)。
学習が完了の場合は、予測フェーズとなる。この場合、図3の学習フェーズの処理の流れとほぼ同様の処理となるが、販売数量を予測したい日より前の日までの計測データを得て、学習済みのモデルを用いて販売数量を予測することとなる。図3での処理の流れとのより詳細な違いは、計測データ収集の処理(つまり、S302の処理)では予測する日より前の日のデータを受信する点となる。また、時系列データとグラフの学習処理では学習を行わずにモデルに時系列データとグラフを入力することで販売数量の予測値を出力する点(すなわち、S309~S310に関する処理の代わりに学習済みモデルを用いて予測値を出力する点)となる。なお、販売数量の予測値の出力に関する処理は、プロセッサ251が予測結果出力部113を実行することにより実現される。
以上により、時系列データとグラフの特徴量を学習し、販売数量の予測が可能となる。従って、販売数量予測システム1によれば、複数店舗のデータ間の関係性を俯瞰的に捉え、より適切な商品の販売数量の予測を行うことができる。そして、ユーザは、データ間の関係性を俯瞰的に捉えた商品の販売数量の予測に基づいて、適切な事業計画を行うことができるので、販売数量予測システム1は、省資源化(例えば、商品ロスの低減)などに寄与することもできる。
ここで、プロセッサ251は、適宜のプログラム(例えば、予測結果出力部113)を実行することで、商品の販売数量の予測値に関するデータなどを表示部255に表示させることができる。表示態様は特に限定されず、例えば、グラフ形式やテーブル形式などにより、時間の推移による販売数量の変化が分かるような表示が行われてもよい。また、所定の販売数量を見込める時間帯を強調した表示などが行われてもよい。また、プロセッサ251は、システム外部に接続される表示装置などに、出力または表示を実行してもよい。
本実施形態の販売数量予測システム1について詳しく説明したが、本発明は実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、実施形態の構成の一部について、他の構成の追加、削除、置換をすることが可能である。
例えば、以上の説明においては、販売数量計測部101は各店舗に設置されており、コントローラ部102は複数ある店舗全体を管理するセンタに設置されている状況を想定した上で説明しているが、コントローラ部102はいずれかの店舗にあってもよい。また、コントローラ部102が各店舗に設置されていて、各店舗で他店舗のデータを収集して販売数量について学習や予測するような構成としてもよい。
例えば、販売数量計測部101は、商品の販売数量等のデータを計測し、計測したデータをコントローラ部102に送信するコンピュータであればよく、一例として、店内においてデータを蓄積または収集するサーバ機能を有するコンピュータとされてもよい。
また、販売数量計測部101は、一例として、閉店後などにおいて店員などにより直接的に入力されるその日のデータを用いて、商品の販売数量等のデータを計測し、計測したデータをコントローラ部102に送信するコンピュータ(例えば、業務用のパーソナルコンピュータ)であってもよい。
販売数量計測部101がデータを送信するタイミングやコントローラ部102がデータを収集するタイミングは、適宜に設定されてもよい。例えば、所定時間ごとに、あるいは、1日又は複数日ごとに、データの送受信が行われてもよい。
販売数量計測部101が商品の販売数量等のデータを計測し、その結果をコントローラ部102に送信する例について説明されたが、販売数量計測部101から送信されるデータを利用して、コントローラ部102において、商品の販売数量等の計測が実行されてもよい。この場合、販売数量計測部101およびコントローラ部102の構成やプログラム等を、適宜に変更してもよい。
実施形態において、ノードとエッジのうち、ノードのみに属性データが付加されているグラフについて畳み込みによって処理する例が示されたが、この限りでない。販売数量予測システム1は、属性データ付加部109による処理において、エッジにも属性データが付加され、グラフ特徴量処理部111による処理において、エッジにも属性データが付加されているグラフについて、畳み込みによって処理するようにしてもよい。
実施形態において、特徴抽出についてGCNによる畳み込み処理を用いる例が示されたが、この限りでない。GCN以外の畳み込み処理が用いられてもよい。
また、プーリングやドロップアウト層を、時間的特徴量処理層801やグラフ特徴量処理層802に組み合わせてもよい。
コントローラ部102は、PC(パーソナルコンピュータ)と同様の機能を有している構成とすることができる。コントローラ部102は、例えば、CPUやメモリ、通信用デバイス、基本的な操作と処理結果の表示などに対応するためのユーザインターフェイス、電源や配線等の基本的なハードウェア、また、それらを制御するためのOSや各種ファームウェア、ドライバ等の基本的なソフトウェアなど、各部を動作させるために必要なものは備わっているものとすることができる。
制御部201やプロセッサ251は、CPUとすることができるが、所定の処理を実行する主体であればよく、その他の半導体デバイス(例えば、GPU:Graphics Processing Unit)であってもよい。
また、コントローラ102の各部(103~113)については、ソフトウェアとしての実装をここでは想定しているが、それらのすべてまたは一部をハードウェアとして実装してもよい。また、各部(103~113)については、通信が可能ならば、例えば遠隔地にあっても良い。また、以上の各部(103~113)をなすハードウェアやソフトウェアは、実施形態に応じて取捨選択を行なっても良い。
学習済みモデルは、通信可能な遠隔地などにおいて生成されてもよく、コントローラ部102は、通信可能な遠隔地などにおいて生成された学習済みモデルを用いて商品の販売数量の予測を行ってもよい。また、コントローラ部102は、一例として、本明細書で説明された同様の方法により生成された学習済みモデルを、適宜の手法でダウンロードして用いてもよい。
また、実施形態においては、一例として、チェーンストアをなす各店舗における商品の販売数量を予測するシステムについて述べたが、複数の拠点で得られる時系列データをもとに時系列データの予測を行うものであれば、他のアプリケーションを扱うシステムであってもよい。
適宜の関係性がある時系列データを用いて学習済みモデルが生成されてもよい。例えば、店舗側の観点から、出店地域が共通する時系列データを用いて、学習済みモデルが生成されてもよい。これにより、店舗側の観点に基づいて、所定の出店地域における商品の販売数量について、より俯瞰的に予測することができる。
例えば、出店地域が関東地区で共通する店舗の時系列データに限ることで、関東地区における商品の販売数量を、より俯瞰的に予測することができるようになる。なお、ここで出店地域として地方区分の単位で共通する例について説明したが、共通する出店地域の範囲は、この例に限定されない。例えば、出店地域が、地域(Region)、地区(Divisiоn)、州(State)などの単位で共通するデータが用いられてもよいし、自治体、都道府県、市区町村などの単位で共通するデータが用いられてもよい。
また、この条件に代えて若しくは加えて、購買層(例えば、性別や年齢、職業など)の観点から、購買層が共通する時系列データを用いて、学習済みモデルが生成されてもよい。これにより、購買層の観点に基づいて、より俯瞰的な予測を行うことができる。
S303で実行される共通に扱われていない商品のデータの補間処理において、同じ尺度を有するデータに基づいて補間が実行されてもよい。このようなデータを用いて補間することで、より適切な補間を行うことができる。ここで、S303では、例えば、距離が近い店舗のデータ、店舗の出店地域が同じ店舗のデータ、購買層が近い店舗のデータ(一例として、年齢や性別の分布が近い店舗のデータ等)に基づいて、補間が行われるという条件が設定されてもよい。すなわち、S303では、店舗間の距離、店舗の出店地域、および、購買層のうちの少なくとも一つの観点で共通するデータに基づいて、補完処理が行われてもよい。
販売数量予測システム1は、一例として、例えば、コンビニエンスストア、ドラッグストア、自動車等のディーラー、衣料品店などに関するチェーンストアを対象に用いることができるが、これらに限定されるものではない。
1 販売数量予測システム
101 販売数量計測部
102 コントローラ部
103 計測データ収集部
104 計測データ補間部
105 統計量算出部
106 相関行列算出部
107 相関係数修正部
108 グラフ生成部
109 属性データ付加部
110 時間的特徴量処理部
111 グラフ特徴量処理部
112 特徴量統合処理部
113 予測結果出力部
101 販売数量計測部
102 コントローラ部
103 計測データ収集部
104 計測データ補間部
105 統計量算出部
106 相関行列算出部
107 相関係数修正部
108 グラフ生成部
109 属性データ付加部
110 時間的特徴量処理部
111 グラフ特徴量処理部
112 特徴量統合処理部
113 予測結果出力部
Claims (15)
- プロセッサを備え、
前記プロセッサは、
店舗間で扱う商品が部分的に異なり得る各店舗の商品の売り上げ数量に関するデータに基づいて生成される商品の売り上げ数量を予測する学習済みモデルを用いて、対象となる店舗の商品の売り上げ数量を予測する、
ことを特徴とする販売数量予測システム。 - 請求項1に記載の販売数量予測システムであって、
前記学習済みモデルは、
店舗間で扱う商品が部分的に異なる場合、各店舗で共通する商品のデータに基づいて、生成される、
ことを特徴とする販売数量予測システム。 - 請求項1に記載の販売数量予測システムであって、
前記学習済みモデルは、
店舗間で扱う商品が部分的に異なる場合、店舗間で共通しない商品の売り上げ数量に関するデータが他の店舗間で共通する同じ商品の売り上げ数量に関するデータを用いて補間されたデータを用いて生成される、
ことを特徴とする販売数量予測システム。 - 請求項2に記載の販売数量予測システムであって、
前記学習済みモデルは、
店舗間における同一の商品の売り上げ数量に関する相関行列、および、店舗の前記商品の売り上げ数量に関する統計量を求め、前記相関行列における店舗をノードとして前記相関行列の相関係数をエッジに関連させたグラフを生成し、前記店舗に関する前記統計量を前記ノードに属性データとして割り当て、前記統計量を割り当てた前記グラフを畳み込むことにより抽出される特徴量に基づいて、生成される、
ことを特徴とする販売数量予測システム。 - 請求項3に記載の販売数量予測システムであって、
前記学習済みモデルは、
店舗間における同一の商品の売り上げ数量に関する相関行列、および、店舗の前記商品の売り上げ数量に関する統計量を求め、前記相関行列における店舗をノードとして前記相関行列の相関係数をエッジに関連させたグラフを生成し、前記店舗に関する前記統計量を前記ノードに属性データとして割り当て、前記統計量を割り当てた前記グラフを畳み込むことにより抽出される特徴量に基づいて、生成される、
ことを特徴とする販売数量予測システム。 - 請求項4に記載の販売数量予測システムであって、
前記学習済みモデルは、
前記相関行列をランダムに選択し、選択した前記相関行列から相関係数をランダムに選択し、選択した前記相関係数が閾値以上であった場合に0とする処理を実行しながら学習をすることにより、生成される、
ことを特徴とする販売数量予測システム。 - 請求項5に記載の販売数量予測システムであって、
前記学習済みモデルは、
前記相関行列をランダムに選択し、選択した前記相関行列から相関係数をランダムに選択し、選択した前記相関係数が閾値以上であった場合に0とする処理を実行しながら学習をすることにより、生成される、
ことを特徴とする販売数量予測システム。 - 請求項2に記載の販売数量予測システムであって、
前記学習済みモデルは、
出店地域が共通する店舗の商品の売り上げ数量に関するデータ、および/または、購買層が共通する商品の売り上げ数量に関するデータに基づいて、生成される、
ことを特徴とする販売数量予測システム。 - 請求項3に記載の販売数量予測システムであって、
前記学習済みモデルは、
出店地域が共通する店舗の商品の売り上げ数量に関するデータ、および/または、購買層が共通する商品の売り上げ数量に関するデータに基づいて、生成される、
ことを特徴とする販売数量予測システム。 - 請求項3に記載の販売数量予測システムであって、
前記の店舗間で共通しない商品の売り上げ数量に関するデータは、
店舗間の距離、店舗の出店地域、および、購買層のうちの少なくとも一つの観点で共通するデータに基づいて補間される、
ことを特徴とする販売数量予測システム。 - 請求項3に記載の販売数量予測システムであって、
前記の店舗間で共通しない商品の売り上げ数量に関するデータは、
商品構成が類似する店舗を探索し、探索したそれぞれの店舗の商品の売り上げ数量に関するデータに基づいて、商品の売り上げ数量の平均値を算出し、探索したそれぞれの店舗の商品の売り上げ数量に関するデータのノイズを求め、算出した前記平均値に前記ノイズを加えることにより、補間される、
ことを特徴とする販売数量予測システム。 - 請求項11に記載の販売数量予測システムであって、
前記ノイズは、
探索したそれぞれの店舗の商品の販売数量に関するデータから求められる統計量に関する、
ことを特徴とする販売数量予測システム。 - 請求項1に記載の販売数量予測システムであって、
前記プロセッサは、
予測した結果に関する情報を表示部に表示させる、
ことを特徴とする販売数量予測システム。 - プロセッサを用いて行う販売数量予測方法であって、
(1)店舗間で扱う商品が部分的に異なり得る各店舗の商品の売り上げ数量に関するデータに基づいて、商品の売り上げ数量を予測する学習済みモデルを生成し、
(2)前記学習済みモデルを用いて、対象となる店舗の商品の売り上げ数量を予測する、
ことを特徴とする販売数量予測方法。 - 請求項14に記載の販売数量予測方法を前記プロセッサに実行させるプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021-206537 | 2021-12-20 | ||
JP2021206537A JP2023091669A (ja) | 2021-12-20 | 2021-12-20 | 販売数量予測システム、販売数量予測方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023120126A1 true WO2023120126A1 (ja) | 2023-06-29 |
Family
ID=86902157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2022/044664 WO2023120126A1 (ja) | 2021-12-20 | 2022-12-05 | 販売数量予測システム、販売数量予測方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2023091669A (ja) |
WO (1) | WO2023120126A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117557289A (zh) * | 2023-11-20 | 2024-02-13 | 大头(广州)软件技术有限公司 | 一种基于智能营销场景的餐饮数据建模方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004348256A (ja) * | 2003-05-20 | 2004-12-09 | Toshiba Tec Corp | 商品発注予測装置、プログラム及び記憶媒体 |
JP2021043477A (ja) * | 2017-12-27 | 2021-03-18 | パナソニックIpマネジメント株式会社 | 需要予測装置、需要予測方法、及びプログラム |
-
2021
- 2021-12-20 JP JP2021206537A patent/JP2023091669A/ja active Pending
-
2022
- 2022-12-05 WO PCT/JP2022/044664 patent/WO2023120126A1/ja unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004348256A (ja) * | 2003-05-20 | 2004-12-09 | Toshiba Tec Corp | 商品発注予測装置、プログラム及び記憶媒体 |
JP2021043477A (ja) * | 2017-12-27 | 2021-03-18 | パナソニックIpマネジメント株式会社 | 需要予測装置、需要予測方法、及びプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117557289A (zh) * | 2023-11-20 | 2024-02-13 | 大头(广州)软件技术有限公司 | 一种基于智能营销场景的餐饮数据建模方法及系统 |
CN117557289B (zh) * | 2023-11-20 | 2024-04-16 | 大头(广州)软件技术有限公司 | 一种基于智能营销场景的餐饮数据建模方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP2023091669A (ja) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11769194B2 (en) | Method and system for presenting items in online environment based on previous item selections | |
US10181138B2 (en) | System and method for determining retail-business-rule coefficients from current prices | |
JP2002279279A (ja) | 商品推薦装置、商品推薦方法、及び商品推薦プログラム | |
EP2904560A1 (en) | Systems and methods for determining a fair price range for commodities | |
US20130238399A1 (en) | Computer-Implemented Systems and Methods for Scenario Analysis | |
CN102156932A (zh) | 一种客户再次购买意向预测方法及装置 | |
JP2008152321A (ja) | 顧客セグメント推定装置 | |
JP7107222B2 (ja) | 商品需要予測システム、商品需要予測方法および商品需要予測プログラム | |
CN115053240A (zh) | 使用库存数据来测量和预测产品的可用性并优化配搭的系统和方法 | |
JP5251217B2 (ja) | 販売数予測システム、販売数予測システムの動作方法および販売数予測プログラム | |
JP2007317082A (ja) | リコメンド装置、リコメンド方法、リコメンドプログラムおよびそのプログラムを記録した記録媒体 | |
JPWO2019159772A1 (ja) | モデル生成装置、需要予測装置、需要予測方法、及びプログラム | |
WO2023120126A1 (ja) | 販売数量予測システム、販売数量予測方法 | |
JP4386973B2 (ja) | 階層的予測モデル構築装置及びその方法 | |
US10467654B2 (en) | Forecasting customer channel choice using cross-channel loyalty | |
US11348146B2 (en) | Item-specific value optimization tool | |
JP2015187773A (ja) | データ解析装置、データ解析プログラム及びデータ解析方法 | |
JP6473194B2 (ja) | 売り上げ推計システム | |
CN114626660A (zh) | 用于激增调整预报的方法和装置 | |
JP5860828B2 (ja) | 行動確率推定装置、方法、及びプログラム | |
WO2011163390A1 (en) | Systems and methods for impact analysis in a computer network | |
Mohamad et al. | Sales Analytics Dashboard with ARIMA and SARIMA Time Series Model | |
JP6449578B2 (ja) | 購買予測分析システム及びそのプログラム | |
JP2020115276A (ja) | 情報処理方法、情報処理装置、プログラム及び学習済みモデルの生成方法 | |
US20240257165A1 (en) | System and method for estimating in-store demand based on online demand |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22910840 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |