WO2023058080A1 - 情報処理装置、情報処理方法、及び、プログラム - Google Patents

情報処理装置、情報処理方法、及び、プログラム Download PDF

Info

Publication number
WO2023058080A1
WO2023058080A1 PCT/JP2021/036575 JP2021036575W WO2023058080A1 WO 2023058080 A1 WO2023058080 A1 WO 2023058080A1 JP 2021036575 W JP2021036575 W JP 2021036575W WO 2023058080 A1 WO2023058080 A1 WO 2023058080A1
Authority
WO
WIPO (PCT)
Prior art keywords
variable
candidate
explanatory variable
error
prediction
Prior art date
Application number
PCT/JP2021/036575
Other languages
English (en)
French (fr)
Inventor
航平 廣松
康 洲鎌
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP2023542671A priority Critical patent/JP7375990B2/ja
Priority to PCT/JP2021/036575 priority patent/WO2023058080A1/ja
Publication of WO2023058080A1 publication Critical patent/WO2023058080A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Definitions

  • the present disclosure relates to an information processing device, an information processing method, and a program.
  • the purpose is to improve the prediction accuracy of the prediction model.
  • the prediction model may be updated using new explanatory variables.
  • Patent Document 1 discloses reducing the time required to acquire new explanatory variables used to update the prediction model by presenting the user with candidates for new explanatory variables used to update the prediction model.
  • the present disclosure has been made to solve the problems described above, and aims to reduce the operator's annoyance with the task of selecting new explanatory variables to be used for updating the prediction model.
  • the information processing device uses a prediction model constructed by learning the relationship between the explanatory variable that is the cause of the causal relationship and the outcome variable that is the result of the causal relationship in the prediction target. output the predicted value of the outcome variable corresponding to the input explanatory variable.
  • an information processing apparatus includes an acquisition unit that acquires an explanatory variable input to a prediction model and a predicted value that is output from the prediction model, and a result variable corresponding to the explanatory variable acquired by the acquisition unit.
  • a candidate explanatory variable acquisition unit that acquires candidate explanatory variables that are candidates, and a target that is similar to the prediction target and has no error caused by the candidate explanatory variables acquired by the candidate explanatory variable acquisition unit, The larger the difference between the similar prediction target acquisition unit that acquires the similar prediction target, the actual value of the result variable corresponding to the candidate explanatory variable in the prediction target, and the actual value of the result variable corresponding to the candidate explanatory variable in the similar prediction target and an evaluation unit that calculates a high influence value of the candidate explanatory variable.
  • FIG. 2 is a diagram illustrating an example of a hardware configuration of an information processing apparatus according to Embodiment 1;
  • FIG. 1 is an example of a functional block diagram of an information processing device 1.
  • FIG. 10 is a diagram showing a selection screen for candidate explanatory variables for updating a prediction model; It is a flowchart figure which shows a prediction model update process. It is a flowchart figure which shows the prediction model update process in 2nd Embodiment.
  • FIG. 10 is a diagram showing a selection screen for candidate explanatory variables for updating a prediction model;
  • the information processing apparatus includes a variable that is a cause having a causal relationship (hereinafter referred to as an explanatory variable) and a variable that is a result of the cause (hereinafter referred to as a result variable ), using a prediction model built by learning the relationship of (.), it has a function of outputting a prediction value of the result variable corresponding to the input explanatory variable.
  • the information processing apparatus determines whether there is an error between the predicted value of the result variable corresponding to the input explanatory variable and the actual value of the result variable corresponding to the previously input explanatory variable. For the purpose of improving the prediction accuracy of the prediction model, it has a function of updating the prediction model using new explanatory variables.
  • the information processing device may predict demand for tickets not only for products sold at stores, but also for accommodation facilities, leisure facilities, airplanes, railroads, performances, and games. Further, the information processing apparatus may output the predicted value by using, for example, the effect and/or the change when the countermeasure is taken as the result variable, not limited to the demand amount. In other words, the information processing apparatus should at least output a predicted value of the other variable based on the input value of one variable based on a prediction model that has learned the relationship between the two variables having a causal relationship.
  • FIG. 1 is a diagram showing an example of a hardware configuration of an information processing device 1 according to Embodiment 1. As shown in FIG. The information processing device 1 is connected to a store terminal 2 installed in each store via a network 3 such as the Internet or a LAN (Local Area Network).
  • a network 3 such as the Internet or a LAN (Local Area Network).
  • the store terminal 2 stores, for example, purchase history data including product data (product name, price, selling time, store name, discount data, coupon data, etc.) related to the product at the store where the product was sold and paid for. is entered.
  • Purchase history data is input to store terminal 2, for example, by reading a bar code attached to a product with a scanner at a cash register and/or selecting a product with a touch panel or keyboard.
  • the purchase history data is not limited to product data, and may include, for example, purchaser data (age, gender, number of people) regarding purchasers who purchased the product.
  • the purchase history data may also include data that can be used to predict the amount of demand for products, such as congestion data indicating the degree of congestion in a store acquired from a sensor installed in the store.
  • the information processing device 1 uses a prediction model built by learning the purchase history data obtained from the store terminal 2 to predict demand for products sold at the store.
  • the information processing device 1 does not need to acquire the purchase history data from the store terminal 2, and may acquire it from an EC (electronic commerce) site that sells products and services, for example.
  • EC electronic commerce
  • the information processing device 1 includes a processor 11 , a memory 12 , a communication interface 13 , a display section 14 , an operation section 15 and a storage section 16 .
  • the processor 11 is, for example, a CPU (Central Processing Unit) or GPU (Graphic Processing Unit), processes data input from the memory 12, the communication interface 13, and the operation unit 15, and outputs the processing result to the memory 12, communication The data is output to the interface 13, the display unit 14, and the like.
  • a CPU Central Processing Unit
  • GPU Graphic Processing Unit
  • the memory 12 is, for example, a DRAM (Dynamic Random Access Memory) that functions as a main storage device. And/or data indicating the processing result of the processor 11 is temporarily stored, and the data is output in response to a request from the processor 11 .
  • DRAM Dynamic Random Access Memory
  • the display unit 14 is, for example, a display, and displays data output from the processor 11 .
  • the operation unit 15 is, for example, a mouse or a keyboard, and receives operations from the user.
  • the information processing apparatus 1 may be provided with a touch panel display having the functions of the display unit 14 and the operation unit 15 instead of being provided separately. Further, the information processing apparatus 1 may have an external configuration without the display unit 14 and/or the operation unit 15 .
  • the communication interface 13 is, for example, a LAN adapter or a wireless LAN transceiver.
  • the communication interface 13 connects with the store terminal 2 via the network 3 .
  • the storage unit 16 is, for example, an HDD (Hard Disk Drive) or SSD (Solid State Drive) that functions as an auxiliary storage device.
  • the storage unit 16 stores programs executed by the processor 11 and data used in the programs.
  • the storage unit 16 stores data for the information processing device 1 to process, such as store data, SNS (Social networking service) data, search data, weather data, and/or purchase history data.
  • store data, SNS data, search data, weather data, and purchase history data stored in the storage unit 16 will be referred to as data sets unless it is necessary to distinguish them from each other.
  • the data included in the data set is not limited to these, and may include political/economic data, transportation data, and the like.
  • the storage unit 16 stores the prediction model M.
  • the predictive model M is constructed by learning the relationship between explanatory variables that are causes having a causal relationship and outcome variables that are the results of the causes.
  • the prediction model M outputs predicted values of outcome variables corresponding to the input explanatory variables.
  • the prediction model M may be constructed using well-known techniques such as multiple regression equations, neural networks, random forests, gradient boosting decision trees, and the like.
  • Store data includes, for example, inventory data of each store (products handled, prices of products handled, number of products in stock), campaign data (discounts, coupon distribution), customer attribute data (number of people, customer unit price, gender , age), store attribute data (business hours, closed days, location, access method, surrounding environment, and/or parking lot data).
  • SNS data includes, for example, post data posted by retailers (headquarters and/or each store), number of posts (number of posts), number of posts viewed (number of views), number of posts shared. (number of shares), etc.
  • SNS data is not limited to post data posted by retailers.
  • post data posted by users including character strings related to products handled by each store and / or campaigns, number of posts, and / or , share numbers, etc.
  • the SNS data may include posted data that is not directly related to products handled by each store, such as posted data related to events held around each store.
  • the SNS data may be acquired using a known technique such as using an API (Application Programming Interface) provided by the SNS management side.
  • API Application Programming Interface
  • Search data includes, for example, the number of views of pages introducing products handled by each store, the number of campaign views, the number of campaign applications, the number of coupon views, acquired from websites operated and/or managed by retailers. and/or the number of coupon downloads, etc. Also, the search data may include user identification information that identifies the user who browsed the website.
  • Meteorological data includes, for example, weather forecast data published by government agencies and companies from the past to the present, and/or precipitation, wind, temperature, snow, and disasters actually observed from the past to the present.
  • weather observation data including the situation of Also, the weather data may include, for example, posted data on the weather around the location of each store posted by the user on an SNS or the like.
  • the prediction model M is constructed by learning the causal relationship between the explanatory variable "distribution of coupons that discount the price of a certain product" and the result variable "increase in demand for a certain product". be done. Note that the combination of explanatory variables that are causal and result variables that have a causal relationship is not limited to this.
  • the information processing device 1 may not include the storage unit 16 and may be configured as an external device. That is, the information processing device 1 stores some or all of the various data necessary for the processing of the information processing device 1, such as store data, SNS data, search data, weather data, purchase history data, and/or prediction models. , may be acquired via the network 3 from an external storage medium (not shown).
  • FIG. 2 is an example of a functional block diagram of the information processing device 1.
  • the processor 11 of the information processing device 1 implements functions of a prediction processing unit 20 and a prediction model updating unit 30 by executing programs and the like stored in the memory 12 .
  • the information processing apparatus 1 has a configuration in which the storage unit 16 is externally attached. However, the information processing apparatus 1 may be configured to include part or all of the storage unit 16 .
  • the information processing apparatus 1 executes prediction processing by the prediction processing unit 20 .
  • the prediction processing unit 20 uses a prediction model M constructed by learning the relationship between explanatory variables that are causes that have a causal relationship and result variables that are the results of the causes, using the input output the predicted value of the outcome variable corresponding to the explanatory variable
  • the prediction processing unit 20 has an input unit 21 , a prediction unit 22 and an output unit 23 .
  • the input unit 21 outputs explanatory variables input from the store terminal 2 or the operation unit 15 to the prediction unit 22 .
  • the explanatory variable input to the input unit 21 is, for example, "distribution of coupons for discounting the price of a certain product".
  • the prediction unit 22 outputs the explanatory variables input from the input unit 21 to the prediction model M.
  • the prediction model M also outputs predicted values of outcome variables corresponding to the input explanatory variables.
  • the prediction unit 22 outputs the predicted value of the result variable input from the prediction model M to the output unit 23 .
  • the prediction unit 22 associates the explanatory variables output to the prediction model M with the predicted values of the result variables input from the prediction model M, and outputs them to the acquisition unit 31 of the prediction model updating unit 30. do.
  • the predicted value of the result variable may be the value of the result variable predicted the day after the execution date of the prediction process, the next week, the next month, or the next year.
  • the predicted value of the result variable may be a predicted value of the result variable at any date or time specified by the user.
  • the predicted value of the result variable is the value of the result variable in a period arbitrarily specified by the user (N hours, N days, N months, or N years, where N is any natural number). There may be.
  • the acquisition unit 31 of the prediction model update unit 30 should be able to acquire at least the predicted value of the result variable predicted by the prediction unit 22 of the prediction processing unit 20 .
  • the prediction unit 22 of the prediction processing unit 20 may store the predicted value of the result variable in the storage unit 16 instead of outputting it to the acquisition unit 31 of the prediction model update unit 30 . Then, the acquisition unit 31 of the prediction model update unit 30 may acquire the predicted value of the result variable stored in the storage unit 16 .
  • the predicted value of the result variable output from the prediction unit 22 is, for example, "increase in demand for a certain product (250)".
  • the output unit 23 outputs the predicted value of the result variable input from the prediction unit 22 to the display unit 14 and/or the store terminal 2 . Further, the output unit 23 may output the explanatory variables input to the prediction model M and the predicted values of the result variables output from the prediction model M in association with each other. For example, when the explanatory variables and the predicted values of the result variables are output from the output unit 23 to the display unit 14, the display unit 14 displays coupon distribution (explanatory variables) for discounting the price of a certain product. Along with this, it will be displayed that an increase in the quantity demanded of a certain product (250) (predicted value of the result variable) is predicted.
  • the predictive model updating unit 30 of the information processing device 1 executes predictive model update processing in order to reduce the annoyance of the update operator for the task of selecting new explanatory variables to be used for updating the predictive model M. do.
  • the predictive model update unit 30 reduces the operator's annoyance with the work of selecting new explanatory variables to be used for updating the predictive model M, and For the purpose of improving the prediction accuracy of the prediction model M, candidates for new explanatory variables for updating the prediction model M (hereinafter referred to as candidate explanatory variables), and influence values that serve as indicators for selecting the candidate explanatory variables.
  • candidate explanatory variables candidates for new explanatory variables for updating the prediction model M
  • influence values that serve as indicators for selecting the candidate explanatory variables.
  • the predictive model updating unit 30 updates the predictive model using the candidate explanatory variables and the candidate explanatory variables selected based on the influence values of the candidate explanatory variables.
  • the influence value for selecting the candidate explanatory variable should be at least a value that indicates the degree of contribution to the improvement of the prediction accuracy of the prediction model.
  • the prediction model update unit 30 has an acquisition unit 31, an error calculation unit 32, a candidate explanatory variable acquisition unit 33, a similar prediction target acquisition unit 34, an evaluation unit 35, and an update unit 36.
  • the acquisition unit 31 acquires from the prediction unit 22 explanatory variables that are input from the store terminal 2 or the operation unit 15 to the input unit 21 and output from the prediction unit 22 to the prediction model M. In addition, the acquisition unit 31 obtains the predicted value of the result variable input from the prediction model M to the prediction unit 22 and the result variable output from the output unit 23 to the display unit 14 and/or the store terminal 2. A predicted value is obtained from the prediction unit 22 . Furthermore, the acquisition unit 31 stores the explanatory variables input from the store terminal 2 or the operation unit 15 to the input unit 21 and the actual values of the result variables corresponding to the explanatory variables in the data set stored in the storage unit 16. Get from the prediction unit 22 explanatory variables that are input from the store terminal 2 or the operation unit 15 to the input unit 21 and output from the prediction unit 22 to the prediction model M. In addition, the acquisition unit 31 obtains the predicted value of the result variable input from the prediction model M to the prediction unit 22 and the result variable output from the output unit 23 to the display unit 14 and/or the store terminal 2. A predicted value
  • the explanatory variable in the present disclosure is, for example, "distribution of coupons that discount the price of a certain product”. Then, the predicted value of the result variable corresponding to the explanatory variable in the present disclosure is, for example, "increase in demand for a certain product (250)", while the actual value of the result variable corresponding to this explanatory variable is, for example, , ⁇ increase in demand for a certain product (500)''.
  • the error calculation unit 32 calculates the predicted value of the result variable corresponding to the explanatory variable acquired by the acquisition unit 31 from the prediction unit 22 and the actual value of the result variable corresponding to the explanatory variable acquired by the acquisition unit 31 from the storage unit 16. Calculate the error.
  • the error calculation unit 32 in the present disclosure calculates the corresponding error as 250.
  • the candidate explanatory variable acquisition unit 33 acquires a candidate explanatory variable that is a candidate for the explanatory variable that causes the error. Any value, ratio, or the like may be set as the threshold value. Specifically, the candidate explanatory variable acquisition unit 33 obtains data that changes before or after a predetermined period (hereinafter referred to as an error occurrence period) from the timing at which the error calculated by the error calculation unit 32 is determined to be equal to or greater than the threshold. is obtained from the data set stored in the storage unit 16 as a candidate explanatory variable.
  • a predetermined period hereinafter referred to as an error occurrence period
  • the candidate explanatory variable acquisition unit 33 determines that the error calculated by the error calculation unit 32 is equal to or greater than the threshold and the timing that the error calculated by the error calculation unit 32 is less than the threshold.
  • the data may be acquired from the data set stored in the storage unit 16 as candidate explanatory variables.
  • the change here means that the number, nature, or state of the events indicated by the data has changed over time to another number, another nature, or another state with a difference of a threshold or more. say.
  • the candidate explanatory variable acquisition unit 33 acquires, for example, inventory data, campaign data, user attribute data, and store attribute data that changed before and after the error occurrence period as candidate explanatory variables. to get as
  • the candidate explanatory variable acquisition unit 33 acquires, as candidate explanatory variables, data indicated by the number of posts, the number of views, or the number of shares that changed before and after the error occurrence period, for example. do.
  • the candidate explanatory variable acquisition unit 33 acquires, as candidate explanatory variables, data indicated by the number of views, the number of applications, or the number of downloads that changed before and after the error occurrence period, for example. do. Further, when the attribute data of the user who browses the website is known, the candidate explanatory variable acquisition unit 33 may acquire data filtered by the attribute data as candidate explanatory variables.
  • the similar prediction target acquisition unit 34 selects a target that is similar to the prediction target and has no error caused by the candidate explanatory variables acquired by the candidate explanatory variable acquisition unit 33 as a similar prediction target.
  • the "prediction target” is a target, such as store a, in which an event having a causal relationship occurs and for which the predicted value of the result variable corresponding to the explanatory variable is calculated.
  • the similar prediction target acquisition unit 34 acquires a target similar to the prediction target in at least one of the explanatory variables, the candidate explanatory variables, the actual values of the result variables, and the attributes, as the similar prediction target.
  • specific patterns for specifying similarity prediction targets will be described, but each pattern may be combined.
  • ⁇ Pattern 1 A pattern that identifies similar predictors based on the actual values of explanatory variables, candidate explanatory variables, and outcome variables.
  • the similar prediction target acquiring unit 34 obtains candidate explanations that influence fluctuations in the actual value of the result variable, in addition to the candidate explanatory variables determined to influence the error between the actual value of the result variable and the predicted value of the result variable. Identify targets with no variables as similar predictors.
  • the similar prediction target acquisition unit 34 selects a candidate explanatory variable that affects the fluctuation of the actual value of the result variable, but the direction of the fluctuation of the actual value of the result variable is similar to the prediction target. Identify as
  • a similar prediction target acquisition unit 34 determines a target that does not cause an error as a similar prediction target if the timing of fluctuations in the actual value of the result variable is similar to the target that causes an error before and after the error occurrence period and the target that does not cause an error. Identify.
  • the similar prediction target acquisition unit 34 identifies a target having an attribute that is the same as or similar to the attribute of the prediction target as a similar prediction target. For example, when the prediction target is a store, the similar prediction target acquisition unit 34 identifies stores (targets) with similar customer attribute data, store attribute data, etc. included in the store data as similar prediction targets. .
  • FIG. 3 is a diagram for explaining a mode of specifying a similar prediction target.
  • Store terminal 2 connected to information processing device 1 is provided at store a, store b, and store c. It is assumed that the storage unit 16 of the information processing device 1 stores data sets relating to the store a, the store b, and the store c.
  • a method of specifying store a as a prediction target and specifying either store b or store c as a similarity prediction target will be described.
  • FIG. 3(A) is a diagram showing changes in the discount rate of store a, store b, and store c. As shown in FIG. 3(A), at time T1, the discount rate for the products at store a is increased from 10% to 30%, and the discount rates for the products at stores b and c remain unchanged at 10%. .
  • FIG. 3(C) is a diagram showing changes in the actual demand amount of store a, store b, and store c. As shown in FIG. 3(C), in the time after time T1, the actual value of demand for the product at store a is greater than the actual values for the demand for products at stores b and c.
  • the similarity prediction target acquisition unit 34 acquires the store b as the similarity prediction target of the store a, which is the prediction target.
  • FIG. 3(B) is a diagram showing holiday information for store a, store b, and store c.
  • the holiday information of store a, store b, and store c is the same.
  • the transition of the holiday demand amount of the store c is different from the transition of the holiday demand amounts of the stores a and b. This can occur, for example, due to differences in store attribute data.
  • the store c is located in an office district, and the stores a and b are located in a residential district. That is, store b satisfies pattern 3 conditions, but store c does not satisfy pattern 3 conditions. Therefore, the similarity prediction target acquisition unit 34 acquires the store b as a similarity prediction target similar to the store a, which is the prediction target.
  • the similarity prediction target acquisition unit 34 uses known Euclidean distance and/or cosine similarity to calculate the difference between the time-series data before the discount rate of store a is raised, as a numerical value.
  • Stores similar to (prediction target) may be acquired as similar prediction targets.
  • the similar prediction target acquisition unit 34 may narrow down to only similar prediction targets having attributes common to the prediction target. Further, when the number of similar prediction targets specified by the above process is smaller than the threshold value indicating the lower limit, the similar prediction target acquisition unit 34 determines that the candidate explanatory variable acquired by the candidate explanatory variable acquisition unit 33 is the cause. The criteria for judging that no error has occurred may be relaxed.
  • the evaluation unit 35 calculates the influence value of the candidate explanatory variable.
  • the evaluation unit 35 determines that the greater the difference between the actual value of the result variable corresponding to the candidate explanatory variable in the prediction target and the actual value of the result variable not affected by the candidate explanatory variable in the prediction target, the greater the influence of the candidate explanatory variable. Calculate the value higher.
  • the evaluation unit 35 uses a known counterfactual technique to replace the actual value of the result variable that is not affected by the candidate explanatory variable in the prediction target, and the result corresponding to the candidate explanatory variable in the similar prediction target Adopt the actual value of the variable. That is, the evaluation unit 35 refers to the data set of the similarity prediction target (store b) acquired by the similarity prediction target acquisition unit 34 to acquire the actual value of the result variable corresponding to the candidate explanatory variable.
  • the evaluation unit 35 evaluates the effect of the candidate explanatory variable as the difference between the actual value of the result variable corresponding to the candidate explanatory variable in the prediction target and the actual value of the result variable corresponding to the candidate explanatory variable in the similar prediction target increases.
  • the influence value of the candidate explanatory variable may be calculated by using an evaluation model that calculates a high value.
  • the evaluation unit 35 calculates the absolute value of the difference (error) between the predicted value and the actual value, and the mean absolute error (MAE: Mean Absolute Error) indicated by the value obtained by dividing the sum by the number of data as an influence value good too.
  • the evaluation unit 35 uses a virtual model constructed by learning data acquired from a data set related to a similar prediction target to obtain actual values (virtual actual values ) may be calculated.
  • the virtual model may be constructed using known techniques such as the propensity score method, the matching method, and the difference analysis method.
  • the update unit 36 uses the data of the candidate explanatory variables selected from among the one or more candidate explanatory variables acquired by the candidate explanatory variable acquisition unit 33 based on the influence value selection criteria calculated by the evaluation unit 35. to update the prediction model M. More specifically, the updating unit 36 selects a candidate explanatory variable with the highest influence value or an influence value equal to or greater than a threshold, adds the candidate explanatory variable to the explanatory variables of the prediction model M, and creates a new explanatory variable. do. Then, the updating unit 36 updates the prediction model M based on the actual values of the candidate explanatory variables and the result variables.
  • the selection criterion is to select the candidate explanatory variable with the highest influence value or the candidate explanatory variable whose influence value is equal to or greater than the threshold, but it is not limited to this.
  • the update unit 36 associates one or more candidate explanatory variables acquired by the candidate explanatory variable acquisition unit 33 with the influence values of the candidate explanatory variables calculated by the evaluation unit 35 without providing selection criteria.
  • the prediction model M may be updated using the data of the candidate explanatory variables selected and operated by the operator.
  • FIG. 4 is a diagram showing a selection screen for candidate explanatory variables for updating a prediction model.
  • the evaluation unit 35 displays on the display unit 14 a selection screen G1 showing candidate explanatory variables for updating the prediction model M and influence values serving as indices for selecting the candidate explanatory variables.
  • the selection screen G1 displays a list R1 in which numbers, input configurations, influence values, and selection buttons are associated with each other.
  • the input configuration includes candidate explanatory variables to be learned by the prediction model M (candidate explanatory variables) as well as explanatory variables already learned by the prediction model M (learned explanatory variables).
  • MAE is shown as an influence value. The smaller the MAE number, the smaller the error, that is, the higher the prediction accuracy.
  • FIG. 4 is a diagram showing a selection screen for candidate explanatory variables for updating a prediction model.
  • the evaluation unit 35 displays on the display unit 14 a selection screen G1 showing candidate explanatory variables for updating the prediction model M and influence values serving as indices for selecting
  • the shaded input configuration indicates explanatory variables that have been learned by the prediction model M.
  • the numbers indicate input configuration, influence value, and information for identifying the selection button.
  • Number 1 of list R1 includes "discount rate” as a candidate explanatory variable, "previous day's demand”, “previous day's number of visitors", “forecast temperature” as learned explanatory variables, and "12.35” is shown.
  • Number 4 in the list R1 includes "number of shares of SNS advertisements” as a candidate explanatory variable, "previous day's demand”, “previous day's number of visitors” and “forecast temperature” as learned explanatory variables, and "9.28” is shown. In this case, number 4 with a small MAE value of the candidate explanatory variable is selected, and the prediction model is updated using the candidate explanatory variable "number of shared SNS advertisements". can also improve the prediction accuracy of the prediction model M.
  • the updater of the prediction model of the information processing device 1 can refer to the influence values shown in the list R1 and select the selection button associated with the desired number. Independently, new explanatory variables can be selected for updating the prediction model. Therefore, the update operator is less burdened with the work of selecting new explanatory variables to be used for updating the prediction model. In other words, the information processing apparatus 1 displays the influence value that serves as an index for selecting explanatory variables, thereby reducing the burden of selecting new explanatory variables to be used for updating the prediction model. Become.
  • the information processing apparatus 1 may be able to display explanatory variables and/or numbers (not shown) by receiving operation inputs to the horizontal scroll bar H and vertical scroll bar V.
  • the information processing apparatus 1 shows the learned explanatory variables with shading, it is not limited to this display mode, and any mode can be used as long as it is possible to identify that the predictive model M has been learned. good.
  • FIG. 5 is a flowchart showing prediction model update processing.
  • the acquisition unit 31 acquires explanatory variables input to the prediction model M and prediction values output from the prediction model M.
  • step S ⁇ b>101 the error calculation unit 32 calculates the error between the actual value of the result variable corresponding to the explanatory variable acquired by the acquisition unit 31 and the predicted value acquired by the acquisition unit 31 .
  • step S102 the error calculator 32 determines whether the absolute value of the calculated error is greater than or equal to the threshold.
  • the threshold is a natural number. If the absolute value of the error is less than the threshold, the error calculator 32 determines that there is no need to update the prediction model, and terminates the process (step S102: NO). On the other hand, when the absolute value of the error is equal to or greater than the threshold, the error calculation unit 32 assumes that the prediction model needs to be updated, and proceeds to step S103.
  • step S103 when the error calculated by the error calculation unit 32 is equal to or greater than the threshold (step S102: YES), the candidate explanatory variable acquisition unit 33 determines the cause of the error from the data set stored in the storage unit 16. Acquire the candidate explanatory variables that are candidates for the explanatory variables that are
  • step S ⁇ b>104 the similar prediction target acquisition unit 34 selects a target similar to the prediction target and for which an error caused by the candidate explanatory variables acquired by the candidate explanatory variable acquisition unit 33 does not occur as a similar prediction target. to get as
  • step S105 the evaluation unit 35 determines that the larger the difference between the actual value of the result variable corresponding to the candidate explanatory variable in the prediction target and the actual value of the result variable corresponding to the candidate explanatory variable in the similar prediction target, the more the candidate explanatory variable Calculates a high influence value (MAE) of
  • step S106 the update unit 36 selects candidate explanatory variables from among one or more candidate explanatory variables acquired by the candidate explanatory variable acquisition unit 33 based on the influence value selection criteria calculated by the evaluation unit 35. is used to update the prediction model M.
  • the update unit 36 causes the one or more candidate explanatory variables acquired by the candidate explanatory variable acquisition unit 33 and the candidate explanatory variable influence value (MAE) calculated by the evaluation unit 35 to be displayed in association with each other,
  • the prediction model M is updated using the selected candidate explanatory variables.
  • the information processing apparatus 1 can indicate an index for selecting a new explanatory variable, such as the degree of contribution to the improvement of the prediction accuracy of the prediction model. It is possible to reduce the operator's annoyance with the task of selecting a new explanatory variable to be used for .
  • the aspect which updates a prediction model is not restricted to 1st Embodiment.
  • a store c prediction target
  • a store d prediction similarity target
  • the error calculation unit 32 uses the influence value calculated at the store d to You may update the prediction model M of c.
  • FIG. 6 is a flowchart showing predictive model update processing in the second embodiment.
  • the processing of steps S100, S101, and S103 to S108 is the same as the processing of each step shown in FIG. 5, so description thereof will be omitted.
  • step S102' the error calculator 32 determines whether the absolute value of the error calculated in step S101 is greater than or equal to the threshold value.
  • the error calculator 32 determines that the error of the store c is less than the threshold.
  • a threshold is a natural number. The error calculator 32 determines that the absolute value of the error is less than the threshold, and proceeds to step S201. If the absolute value of the error is greater than or equal to the threshold, the error calculator 32 proceeds to step S103.
  • step S201 the similarity prediction target acquisition unit 34 acquires at least one target similar to the prediction target (store c) as a similarity prediction target (store d). Note that the process of acquiring a similar prediction target (store d) similar to the prediction target (store c) may be the same as the process of step S104 shown in FIG.
  • step S202 the error calculation unit 32 calculates the error between the predicted value and the actual value of the result variable corresponding to the explanatory variable of the similar prediction target store d acquired by the similar prediction target acquisition unit 34.
  • step S203 the error calculator 32 determines whether the absolute value of the calculated error is greater than or equal to the threshold.
  • the threshold is assumed to be a natural number. If the absolute value of the error is less than the threshold, the error calculation unit 32 determines that the prediction model M does not need to be updated, and terminates the process (step S203: NO). On the other hand, when the absolute value of the error is equal to or greater than the threshold, the error calculator 32 assumes that the prediction model M needs to be updated, and proceeds to step S204 (step S203: YES).
  • step S204 the candidate explanatory variable acquisition unit 33 acquires candidate explanatory variables that are candidates for explanatory variables that cause the error calculated in step S202.
  • step S205 the evaluation unit 35 calculates the influence value of the candidate explanatory variable acquired in step S204. Specifically, the evaluation unit 35 calculates the actual value of the result variable corresponding to the candidate explanatory variable in the prediction target (store c) and the actual value of the result variable corresponding to the candidate explanatory variable in the similar prediction target (store d). The greater the difference in , the higher the influence value of the candidate explanatory variable is calculated.
  • step S206 the update unit 36 updates the prediction model M of the store c using the candidate explanatory variables selected based on the selection criteria for the influence values calculated in step S205.
  • the information processing device 1 according to Embodiment 2 can indicate an index for selecting a new explanatory variable, such as the extent to which it contributes to improving the prediction accuracy of the prediction model M.
  • the information processing apparatus 1 according to the second embodiment has the effect of reducing the operator's annoyance in selecting new explanatory variables to be used for updating the prediction model M.
  • the prediction model is updated using only the influence value within the error period given by the candidate explanatory variable as an index, but the evaluation unit 35 determines that the error calculated by the error calculation unit 32 is equal to or greater than the threshold and the timing at which the error calculated by the error calculating unit 32 is determined to be less than the threshold.
  • the evaluation unit 35 may display and output the influence values of the candidate explanatory variables calculated at respective timings on the candidate explanatory variable selection screen.
  • MAE which is an example of the influence value.
  • the influence value of the candidate explanatory variable calculated within the error period will be referred to as the MAE within the error period
  • the influence value of the candidate explanatory variable calculated outside the error period will be referred to as the MAE outside the error period.
  • FIG. 7 is a diagram showing a selection screen for candidate explanatory variables for updating a prediction model.
  • the evaluation unit 35 corresponds to the candidate explanatory variables calculated in each of the period in which an error caused by the candidate explanatory variable (candidate explanatory variable) to be learned by the prediction model M does not occur and the period in which an error occurs. Influence values (MAE within error period, MAE outside error period) are calculated based on the magnitude of the difference between the actual values of the result variables.
  • the evaluation unit 35 determines the candidate explanatory variables, the explanatory variables that have been learned in the prediction model M (learned explanatory variables), and the influence values (MAE within the error period, MAE outside the error period, ), a graph, and selection buttons are displayed on the display unit 14 .
  • the graph includes at least the actual value of the result variable in the prediction target and the transition of the predicted value.
  • number 1 of the selection screen G2 changes in the actual value 84 (solid line) and the predicted value 83 (dashed line) of the demand amount at the prediction target (store a) when "discount rate" is selected as the candidate explanatory variable are shown.
  • the MAE within the error period (9.87) and the MAE outside the error period (16.37" are shown.
  • number 1 of the selection screen G2 shows the actual value of the demand amount in the forecast target and A graph showing changes in predicted values, a graph showing changes in discount rates, and a graph showing changes in demand on the previous day are shown in the same time series.
  • a graph showing changes in the actual value and the predicted value of the demand amount at the prediction target stores a) when "the number of shares of the SNS advertisement" is selected as the candidate explanatory variable. , MAE within the error period (6.54), and MAE outside the error period (9.91).
  • a graph showing changes in the actual and predicted values of demand for the prediction target a graph showing changes in the number of shared SNS advertisements, and a graph showing changes in demand on the previous day. are shown in the same chronological order.
  • the update operator can improve the prediction accuracy of the prediction model within the error period and outside the error period. Makes it easier to select candidate explanatory variables.
  • the updating operator can easily visually recognize the influence of the candidate explanatory variables on the prediction model. That is, the information processing apparatus 1 can improve the prediction accuracy of the prediction model as compared with the first embodiment, while reducing the troublesomeness of selecting new explanatory variables to be used for updating the prediction model. becomes.
  • the information processing apparatus 1 may be able to display explanatory variables and/or numbers (not shown) by receiving operation inputs to the vertical scroll bars V1 and V2.
  • the candidate explanatory variables displayed in FIG. 7 correspond to the candidate explanatory variables displayed in FIG. No. in FIG. 2, No. 3 shows the same candidate explanatory variables, but by scrolling the vertical scroll bar V2, candidate explanatory variables not shown are displayed.
  • the similar prediction target acquisition unit 34 acquires a target similar to the prediction target in at least one of the explanatory variables, the candidate explanatory variables, the actual values of the result variables, and the attribute as the similar prediction target. bottom. Then, the evaluation unit 35 determines that the larger the difference between the actual measurement value of the result variable corresponding to the candidate explanatory variable in the prediction target and the actual value of the result variable not affected by the candidate explanatory variable in the prediction target, the more the candidate explanatory variable was calculated to be high.
  • the similar prediction target obtained and evaluated in this manner may include the influence of the candidate explanatory variables obtained by the candidate explanatory variable obtaining unit 33 .
  • the similar prediction target acquisition unit 34 selects the acquired similar prediction targets as a similar prediction target store affected by the candidate explanatory variable (hereinafter referred to as an affected similar store b1) and a similar prediction target store not affected ( hereinafter referred to as unaffected similar store b2).
  • the similar prediction target acquiring unit 34 selects the affected similar store B1 as the store that runs the same campaign at the same time as the store a that is the prediction target, and selects the store that runs a different campaign at the same time as the store a that is the prediction target. It may be classified as the unaffected similar store B2.
  • the evaluation unit 35 may calculate the influence value of the candidate explanatory variable to be higher as the difference between the actual value of the affected similar store b1 and the actual value of the unaffected similar store b2 is larger.
  • the processing performed by the information processing device 1 described above may be configured as a program for causing a computer to function.
  • 1 information processing device 2 store terminal, 3 network, 11 processor, 12 memory, 13 communication interface, 14 display unit, 15 operation unit, 16 storage unit, 20 prediction processing unit, 21 input unit, 22 prediction unit, 23 output 30 prediction model update unit 31 acquisition unit 32 error calculation unit 33 candidate explanatory variable acquisition unit 34 similar prediction target acquisition unit 35 evaluation unit 36 update unit.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

情報処理装置1は、予測対象において、説明変数及び結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する。また、情報処理装置1は、予測モデルに入力された説明変数及び予測モデルから出力された予測値を取得する取得部31と、説明変数に対応した結果変数の実績値と予測値の誤差を算出する誤差算出部32と、誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得部33と、予測対象に類似する対象であって、候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得部34と、予測対象における候補説明変数に対応する結果変数の実績値と、類似予測対象における候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する評価部36とを備える。

Description

情報処理装置、情報処理方法、及び、プログラム
 本開示は、情報処理装置、情報処理方法、及び、プログラムに関する。
 従来から、因果関係を有する原因となっている変数(以降、説明変数と称する。)と、その原因を受けて発生した結果となっている変数(以降、結果変数と称する。)の関係を学習して構築された予測モデルを用いて、所望の説明変数に対応した結果変数の予測値を導出する技術がある。
 そして、入力された説明変数に対応した結果変数の予測値と、過去に入力された説明変数に対応した結果変数の実績値との間に誤差がある場合、予測モデルの予測精度の向上を目的として、新たな説明変数を用いて予測モデルを更新することがある。
特許文献1には、予測モデルの更新に用いる新たな説明変数の候補を利用者に提示することで、予測モデルの更新に用いる新たな説明変数の獲得に要する時間を削減することが開示されている。
特許第6603600号
 しかしながら、特許文献1に開示された技術においては、例えば、予測モデルの予測精度の向上に寄与する程度といった、新たな説明変数を選択するための指標が示されていないため、予測モデルの更新に用いる新たな説明変数の選択は操作者の知見に依存していた。そのため、特許文献1に開示された技術においては、予測モデルの更新に用いる新たな説明変数を選択する作業に対して操作者が煩わしさを感じてしまうという課題があった。
 本開示は、前述のような問題点を解決するためになされたものであり、予測モデルの更新に用いる新たな説明変数を選択する作業に対する操作者の煩わしさを低減することを目的とする。
 この開示に係る情報処理装置は、予測対象において、因果関係の原因となっている説明変数、及び、当該因果関係の結果となっている結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する。また、この開示に係る情報処理装置は、予測モデルに入力された説明変数、及び、予測モデルから出力された予測値を取得する取得部と、取得部で取得された説明変数に対応した結果変数の実績値と、取得部で取得された予測値の誤差を算出する誤差算出部と、誤差算出部で算出された誤差が閾値以上である場合に、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得部と、予測対象に類似する対象であって、候補説明変数取得部で取得された候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得部と、予測対象における候補説明変数に対応する結果変数の実績値と、類似予測対象における候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する評価部とを備えることを特徴とする。
 本開示によれば、予測モデルの更新に用いる新たな説明変数を選択する作業に対する操作者の煩わしさを低減することができる。
実施の形態1に係る情報処理装置のハードウェア構成の一例を示す図である。 情報処理装置1の機能ブロック図の一例である。 類似予測対象を特定する態様を説明するための図である。 予測モデルを更新する候補説明変数の選択画面を示す図である。 予測モデル更新処理を示すフローチャート図である。 第2の実施形態における予測モデル更新処理を示すフローチャート図である。 予測モデルを更新する候補説明変数の選択画面を示す図である。
 本開示に係る情報処理装置は、因果関係を有する原因となっている変数(以降、説明変数と称する。)と、その原因を受けて発生した結果となっている変数(以降、結果変数と称する。)の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応した結果変数の予測値を出力する機能を有するものである。
 また、本開示に係る情報処理装置は、入力された説明変数に対応した結果変数の予測値と、過去に入力された説明変数に対応した結果変数の実績値との間に誤差がある場合、予測モデルの予測精度の向上を目的として、新たな説明変数を用いて予測モデルを更新する機能を有するものである。
 本開示においては、複数の店舗を有する小売業者が、各店舗で販売する商品の需要量を予測するために情報処理装置を用いる例について説明する。なお、情報処理装置は、店舗で販売する商品に限らず、例えば、宿泊施設、レジャー施設、飛行機、鉄道、公演、観戦などのチケットの需要量を予測してもよい。また、情報処理装置は、需要量に限らず、例えば、対策を講じた際の効果、及び/又は、変化を結果変数として、その予測値を出力してもよい。即ち、情報処理装置は、少なくとも、因果関係を有する2つの変数の関係を学習した予測モデルに基づいて、一方の変数の入力値から他方の変数の予測値を出力すればよい。
 以下に図面を参照して、本開示に係る情報処理装置、情報処理方法、及び、プログラムの実施の形態について詳細に説明する。
・実施の形態1
 図1は、実施の形態1に係る情報処理装置1のハードウェア構成の一例を示す図である。
 情報処理装置1は、インターネット又はLAN(Local Area Network)などのネットワーク3を介して各店舗に設置された販売店端末2に接続される。
 販売店端末2は、例えば、商品の販売・支払いが行われた店舗で、その商品に関する商品データ(商品名、価格、売れた時間、店舗名、割引データ、クーポンデータなど)を含む購買履歴データが入力される。また、販売店端末2は、例えば、商品につけられたバーコードをレジのスキャナーで読み取ること、及び/又は、タッチパネルやキーボードで商品を選択することにより、購買履歴データが入力される。購買履歴データは、商品データに限らず、例えば、その商品を購入した購入者に関する購入者データ(年齢、性別、人数)を含んでいても良い。また、購買履歴データは、例えば、店舗に設置されたセンサから取得した店舗の混雑度を示す混雑データなど、商品の需要量を予測するために活用可能なデータを含んでいてもよい。
 情報処理装置1は、販売店端末2から取得した購買履歴データなどを学習して構築された予測モデルを用いて、店舗で販売する商品の需要量などを予測する。なお、情報処理装置1は、購買履歴データを販売店端末2から取得する必要はなく、例えば、商品やサービスを販売するEC(electronic commerce)サイトから取得してもよい。
 情報処理装置1は、プロセッサ11、メモリ12、通信インタフェース13、表示部14、操作部15、及び、記憶部16を備えている。
 プロセッサ11は、例えば、CPU(Central Processing Unit)又はGPU(Graphic Processing Unit)であり、メモリ12、通信インタフェース13、操作部15から入力されたデータを処理して、その処理結果をメモリ12、通信インタフェース13、表示部14などに出力する。
 メモリ12は、例えば、主記憶装置として機能するDRAM(Dynamic Random Access Memoryである。メモリ12は、例えば、通信インタフェース13や操作部15から入力されたデータ、プロセッサ11で実行されるプログラムやデータ、及び/又は、プロセッサ11の処理結果を示すデータなどが一時的に記憶され、それらのデータをプロセッサ11の要求に応じて出力する。
 表示部14は、例えば、ディスプレイであり、プロセッサ11から出力されたデータを表示する。操作部15は、例えば、マウスやキーボードであり、利用者からの操作を受け付ける。なお、情報処理装置1は、表示部14及び操作部15を個別に備えるのではなく、夫々の機能を有するタッチパネルディスプレイを備えていてもよい。また、情報処理装置1は、表示部14及び/又は操作部15を備えず、外付けの構成としてもよい。
 通信インタフェース13は、例えば、LANアダプタや無線LAN送受信機である。通信インタフェース13は、ネットワーク3を介して、販売店端末2と接続する。
 記憶部16は、例えば、補助記憶装置として機能するHDD(Hard Disk Drive)やSSD(Solid State Drive)である。記憶部16は、プロセッサ11で実行されるプログラム、及び、プログラムで使用されるデータを記憶する。記憶部16は、例えば、販売店データ、SNS(Social networking service)データ、検索データ、気象データ、及び/又は、購買履歴データといった、情報処理装置1が処理を行うためのデータを記憶する。以降、記憶部16に記憶された販売店データ、SNSデータ、検索データ、気象データ、及び、購買履歴データを夫々区別して説明する必要が無い場合には、データセットと称する。なお、データセットに含まれるデータは、これらに限らず、政治・経済に関するデータ、交通機関に関するデータなどを含んでいてもよい。
 また、記憶部16は、予測モデルMを記憶する。予測モデルMは、因果関係を有する原因となっている説明変数と、その原因を受けて発生した結果となっている結果変数の関係を学習することで構築される。予測モデルMは、入力された説明変数に対応した結果変数の予測値を出力する。予測モデルMは、例えば、重回帰式、ニューラルネットワーク、ランダムフォレスト、勾配ブースティング決定木など、周知の技術を用いることで構築されればよい。
 販売店データは、例えば、各店舗の在庫データ(取り扱い商品、取り扱い商品の価格、取り扱い商品の在庫数)、キャンペーンデータ(割引、クーポンの配付)、利用客の属性データ(人数、客単価、性別、年齢)、店舗の属性データ(営業時間、定休日、所在地、アクセス方法、周辺環境、及び/又は、駐車場データ)などを含む。
 SNSデータは、例えば、小売業者側(本部、及び/又は、各店舗)が投稿した投稿データ、投稿の数(投稿数)、投稿が閲覧された数(閲覧数)、投稿が共有された数(共有数)などを含む。また、SNSデータは、小売業者側が投稿した投稿データに限らず、例えば、利用者側が投稿した、各店舗の取り扱い商品、及び/又は、キャンペーンに関する文字列を含む投稿データ、投稿数、及び/又は、共有数などを含んでいてもよい。また、SNSデータは、各店舗の周辺で開催されるイベントに関する投稿データなど、各店舗の取り扱い商品とは直接関わりのない投稿データを含んでいてもよい。なお、SNSデータは、SNSの運営側から提供されるAPI(Application Programming Interface)を用いるなど、周知の技術を用いることで取得されればよい。
 検索データは、例えば、小売業者側が運用及び/又は管理するウェブサイトから取得された、各店舗の取り扱い商品を紹介するページの閲覧数、キャンペーンの閲覧数、キャンペーンの応募数、クーポンの閲覧数、及び/又は、クーポンのダウンロード数などを含む。また、検索データは、ウェブサイトを閲覧したユーザを識別するユーザ識別情報を含んでいても良い。
 気象データは、例えば、政府機関や企業によって過去から現在に至るまでに公表された気象予報データ、及び/又は、過去から現在に至るまでに実際に観測された 降水・風・気温・雪・災害の状況を含む気象観測データを含む。また、気象データは、例えば、利用者側がSNSなどに投稿した、各店舗の所在地周辺の気象に関する投稿データを含んでいてもよい。
 ここで、本開示においては、或る商品の価格を値引きするクーポンの配布と、或る商品の売り上げ(需要量)との間に因果関係があるものとする。具体的には、或る商品の価格を値引きするクーポンを配布しない場合の需要量が100であるのに対し、価格を値引きするクーポンを配布した場合の需要量が250に増加するという因果関係があるものとする。この場合、予測モデルMは、「或る商品の価格を値引きするクーポンの配布」を説明変数、「或る商品の需要量の増加」を結果変数として、夫々の因果関係を学習することで構築される。なお、因果関係を有する原因となる説明変数、及び、結果変数の組み合わせはこれに限らない。
 なお、情報処理装置1は、記憶部16を備えず、外付けの構成としてもよい。即ち、情報処理装置1は、販売店データ、SNSデータ、検索データ、気象データ、購買履歴データ、及び/又は、予測モデルといった、情報処理装置1の処理に必要な各種データの一部又は全部を、図示せぬ外部の記憶媒体からネットワーク3を介して取得してもよい。
 図2は、情報処理装置1の機能ブロック図の一例である。
 情報処理装置1のプロセッサ11は、メモリ12に格納されたプログラムなどを実行することにより、予測処理部20と予測モデル更新部30という各機能を実現する。なお、図2において情報処理装置1は、記憶部16を外付けの構成としている。ただし、情報処理装置1は、記憶部16の一部又は全部を備える構成としてもよい。
・予測処理部20により実行される予測処理について
 情報処理装置1は、予測処理部20により予測処理を実行する。予測処理部20は、因果関係を有する原因となっている説明変数と、その原因を受けて発生した結果となっている結果変数の関係を学習して構築された予測モデルMを用いて、入力された説明変数に対応した結果変数の予測値を出力する。
 予測処理部20は、入力部21、予測部22、及び、出力部23を有する。
 入力部21は、販売店端末2又は操作部15から入力された説明変数を予測部22に出力する。
 ここで、本開示において入力部21に入力された説明変数は、例えば、「或る商品の価格を値引きするクーポンの配布」であるものとする。
 予測部22は、入力部21から入力された説明変数を予測モデルMに対して出力する。また、予測モデルMは、入力された説明変数に対応した結果変数の予測値を出力する。予測部22は、予測モデルMから入力された結果変数の予測値を出力部23に対して出力する。また、予測部22は、予測モデルMに対して出力した説明変数、及び、予測モデルMから入力された結果変数の予測値を対応づけて、予測モデル更新部30の取得部31に対して出力する。
 ここで、結果変数の予測値は、予測処理の実行日の翌日、翌週、翌月、又は、翌年の結果変数の値を予測したものであってもよい。また、結果変数の予測値は、利用者により指定された任意の日付、又は、任意の時刻における結果変数の値を予測したものであってもよい。また、結果変数の予測値は、利用者により任意に指定された期間(N時間、N日、Nか月、又は、N年,Nは任意の自然数)における結果変数の値を予測したものであってもよい。また、予測モデル更新部30の取得部31は、少なくとも、予測処理部20の予測部22で予測された結果変数の予測値を取得できればよい。具体的には、予測処理部20の予測部22は、結果変数の予測値を、予測モデル更新部30の取得部31に対して出力するのではなく、記憶部16に記憶させてもよい。そして、予測モデル更新部30の取得部31は、記憶部16に記憶された結果変数の予測値を取得してもよい。
 ここで、本開示において予測部22から出力された結果変数の予測値は、例えば、「或る商品の需要量の増加(250)」であるものとする。
 出力部23は、予測部22から入力された結果変数の予測値を、表示部14、及び/又は、販売店端末2に対して出力する。また、出力部23は、予測モデルMに入力された説明変数、及び、予測モデルMから出力された結果変数の予測値を対応づけて出力してもよい。例えば、出力部23から表示部14に対して説明変数、及び、結果変数の予測値が出力された場合、表示部14には、或る商品の価格を値引きするクーポンの配布(説明変数)に伴って、或る商品の需要量の増加(250)(結果変数の予測値)が予測される旨が表示されることになる。
 ところで、クーポンの配布と売り上げの因果関係を学習して構築された予測モデルを用いた場合であっても、説明変数に対応した結果変数の予測値と、説明変数に対応した結果変数の実績値との間に誤差が生じることがある。この誤差の要因としては、例えば、クーポンの割引率の変化、気象の変化、又は、競合店舗の出店など、予測モデルMが学習していない因果関係による影響が考えられる。そして、誤差が生じた場合、予測モデルの予測精度の向上を目的として、販売店データ、気象データなどが示す新たな説明変数を用いて予測モデルを更新することが求められる。しかしながら、予測モデルの更新作業者が、誤差の原因を特定するのは容易ではない。そこで、本開示における情報処理装置1の予測モデル更新部30は、予測モデルMの更新に用いる新たな説明変数を選択する作業に対する更新作業者の煩わしさを低減するために予測モデル更新処理を実行する。
・予測モデル更新部30により実行される予測モデル更新処理について
 予測モデル更新部30は、予測モデルMの更新に用いる新たな説明変数を選択する作業に対する作業者の煩わしさを低減すること、及び、予測モデルMの予測精度の向上を目的として、予測モデルMを更新する新たな説明変数の候補(以降、候補説明変数と称する。)、及び、候補説明変数を選択する際の指標となる影響値を算出する。さらに、予測モデル更新部30は、候補説明変数、及び、候補説明変数の影響値に基づいて選択された候補説明変数を用いて予測モデルを更新する。ここで、候補説明変数を選択するための影響値は、少なくとも、予測モデルの予測精度の向上に寄与する程度を示す値であればよい。
 予測モデル更新部30は、取得部31、誤差算出部32、候補説明変数取得部33、類似予測対象取得部34、評価部35、及び、更新部36を有する。
 取得部31は、販売店端末2又は操作部15から入力部21に入力された説明変数であって、予測部22から予測モデルMに対して出力された説明変数を予測部22から取得する。また、取得部31は、予測モデルMから予測部22に入力された結果変数の予測値であって、出力部23から表示部14及び/又は販売店端末2に対して出力された結果変数の予測値を予測部22から取得する。さらに、取得部31は、販売店端末2又は操作部15から入力部21に入力された説明変数、及び、該当の説明変数に対応した結果変数の実績値を記憶部16に記憶されたデータセットから取得する。
 ここで、本開示における説明変数は、例えば、「或る商品の価格を値引きするクーポンの配布」であるものとする。そして、本開示における説明変数に対応した結果変数の予測値は、例えば、「或る商品の需要量の増加(250)」である一方、この説明変数に対応した結果変数の実績値は、例えば、「或る商品の需要量の増加(500)」であるものとする。
 誤差算出部32は、取得部31が予測部22から取得した説明変数に対応した結果変数の予測値と、取得部31が記憶部16から取得した説明変数に対応した結果変数の実績値との誤差を算出する。ここで、本開示における誤差算出部32は、該当の誤差を250と算出したものとする。
 次に、候補説明変数取得部33は、誤差算出部32で算出した誤差が閾値以上である場合、誤差の原因となっている説明変数の候補である候補説明変数を取得する。閾値は、任意の値、割合などが定められていればよい。具体的には、候補説明変数取得部33は、誤差算出部32で算出した誤差が閾値以上であると判定したタイミングから所定の期間(以降、誤差発生期間と称する)前後に変化があったデータを候補説明変数として、記憶部16に記憶されたデータセットから取得する。また、候補説明変数取得部33は、誤差算出部32で算出した誤差が閾値以上であると判定したタイミング、及び、誤差算出部32で算出した誤差が閾値未満であると判定したタイミングにおいて変化があったデータを候補説明変数として、記憶部16に記憶されたデータセットから取得してもよい。ここでいう変化とは、データが示す事象の数、性質、又は、状態などが、経時的に、閾値以上の差を有する別の数、別の性質、又は、別の状態に遷移したことをいう。
販売店データから候補説明変数を取得する場合、候補説明変数取得部33は、例えば、誤差発生期間前後に変化した、在庫データ、キャンペーンデータ、利用者の属性データ、店舗の属性データを候補説明変数として取得する。
 また、SNSデータから候補説明変数を取得する場合、候補説明変数取得部33は、例えば、誤差発生期間前後に変化した、投稿数、閲覧数、又は、共有数が示すデータを候補説明変数として取得する。
 また、検索データから候補説明変数を取得する場合、候補説明変数取得部33は、例えば、誤差発生期間前後に変化した、閲覧数、応募数、又は、ダウンロード数が示すデータを候補説明変数として取得する。また、ウェブサイトを閲覧する利用者の属性データを把握している場合、候補説明変数取得部33は、属性データでフィルタを掛けたデータを候補説明変数として取得してもよい。
 次に、類似予測対象取得部34は、予測対象に類似する対象であって、候補説明変数取得部33で取得された候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する。ここで、「予測対象」とは、例えば、店舗aなど、因果関係を有する事象が発生する対象であって、説明変数に対応した結果変数の予測値を算出する対象をいう。また、類似予測対象取得部34は、説明変数、候補説明変数、結果変数の実績値、及び、属性の少なくとも1つ以上が、予測対象に類似する対象を類似予測対象として取得する。次に、類似予測対象を特定する具体的なパターンについて説明するが、夫々のパターンを組み合わせても良い。
・パターン1.説明変数、候補説明変数、結果変数の実績値に基づいて、類似予測対象を特定するパターン。
 類似予測対象取得部34は、結果変数の実績値と結果変数の予測値の誤差に影響を及ぼすと判定された候補説明変数以外に、結果変数の実績値の変動に影響を及ぼすような候補説明変数がない対象を類似予測対象として特定する。
 また、類似予測対象取得部34は、結果変数の実績値の変動に影響を及ぼすような候補説明変数があるが、結果変数の実績値の変動の向きが予測対象と類似する対象を類似予測対象として特定する。
・パターン2.結果変数の実績値に基づいて、類似予測対象を特定するパターン。
 類似予測対象取得部34は、誤差発生期間前後に誤差が生じる予測対象と、誤差が生じない対象で結果変数の実績値の変動のタイミングが類似する場合、誤差が生じない対象を類似予測対象として特定する。
・パターン3.予測対象の属性情報に基づいて、類似予測対象を特定するパターン。
 類似予測対象取得部34は、予測対象の属性と同一又は類似した属性の対象を類似予測対象として特定する。例えば、類似予測対象取得部34は、予測対象が店舗である場合、販売店データに含まれた利用客の属性データ、店舗の属性データなどが類似した店舗(対象)を類似予測対象として特定する。
 図3は、類似予測対象を特定する態様を説明するための図である。
 店舗a、店舗b、及び、店舗cには、情報処理装置1に接続された販売店端末2が設けられているものとする。そして、情報処理装置1の記憶部16には、店舗a、店舗b、及び、店舗cに関するデータセットが記憶されているものとする。ここで、予測対象を店舗aとし、店舗b、店舗cの何れか一方を類似予測対象として特定する方法を説明する。
 図3(A)は、店舗a、店舗b、及び、店舗cの割引率の推移を示す図である。図3(A)に示すように、時間T1において、店舗aの商品の割引率が10%から30%に引き上げられ、店舗b及び店舗cの商品の割引率が10%のまま据え置かれている。
 図3(C)は、店舗a、店舗b、及び、店舗cの需要量の実績値の推移を示す図である。図3(C)に示すように、時間T1以降の時間において、店舗aの商品の需要量の実績値が、店舗b及び店舗cの商品の需要量の実績値よりも増大している。
 ここで、図3(C)の時間T1よりも前の時間において、店舗aの需要量の実績値と、店舗bの需要量の実績値が変動するタイミングが類似している。一方、店舗cは、時間T1よりも前の時間において、店舗aの需要量の実績値が一時的に増加しているときに、店舗cの需要量の実績値が減少している。即ち、店舗bは、パターン2の条件を満たしているが、店舗cは、パターン2の条件を満たしていない。従って、類似予測対象取得部34は、予測対象である店舗aの類似予測対象として店舗bを取得する。
 図3(B)は、店舗a、店舗b、及び、店舗cの休日情報を示す図である。店舗a、店舗b、及び、店舗cの休日情報は同一である。しかしながら、図3(C)に示すように、店舗cの休日の需要量の推移は、店舗a及び店舗bの休日の需要量の推移と相違している。これは、例えば、店舗の属性データの相違によって生じ得る。具体的には、店舗cが、オフィス街に位置し、店舗a及び店舗bは、住宅街に位置するような場合である。即ち、店舗bは、パターン3の条件を満たしているが、店舗cは、パターン3の条件を満たしていない。従って、類似予測対象取得部34は、予測対象である店舗aに類似する類似予測対象として店舗bを取得する。
 なお、類似予測対象取得部34は、公知のユークリッド距離及び/又はコサイン類似度などを用いて、店舗aの割引率を引き上げる前の時系列データ間の差を数値として演算することで、店舗a(予測対象)に類似する店舗を類似予測対象として取得してもよい。
 また、類似予測対象取得部34は、上述の処理により特定された類似予測対象の数が上限値を示す閾値よりも多い場合、予測対象と共通の属性を有する類似予測対象のみに絞り込んでも良い。また、類似予測対象取得部34は、上述の処理により特定された類似予測対象の数が下限値を示す閾値よりも少ない場合、候補説明変数取得部33で取得された候補説明変数を原因とする誤差が生じていないと判定する基準を緩和してもよい。 
 次に、評価部35は、候補説明変数の影響値を算出する。評価部35は、予測対象における候補説明変数に対応する結果変数の実績値と、予測対象における候補説明変数の影響を受けていない結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する。ここで、予測対象における候補説明変数の影響を受けていない結果変数の実績値を取得することは出来ない。そのため、評価部35は、公知の反実仮想の技術を用いて、予測対象における候補説明変数の影響を受けていない結果変数の実績値の代替として、類似予測対象における候補説明変数に対応する結果変数の実績値を採用する。即ち、評価部35は、類似予測対象取得部34で取得された類似予測対象(店舗b)のデータセットを参照することで、候補説明変数に対応する結果変数の実績値を取得する。
 また、評価部35は、予測対象における候補説明変数に対応する結果変数の実績値と、類似予測対象において候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する評価モデルを用いることで、候補説明変数の影響値を算出してもよい。また、評価部35は、予測値と実績値の差(誤差)の絶対値を計算し、その総和をデータ数で割った値で示される平均絶対誤差(MAE:Mean Absolute Error)を影響値としてもよい。
 また、評価部35は、類似予測対象に関するデータセットから取得したデータを学習することで構築された仮想モデルを用いて、類似予測対象において候補説明変数に対応する結果変数の実績値(仮想実績値)を算出してもよい。なお、仮想モデルは、例えば、傾向スコア法、マッチング法、差分の差分析法など、公知の技術を用いて構築されればよい。
 更新部36は、候補説明変数取得部33で取得された1又は複数の候補説明変数の中から、評価部35で算出された影響値の選択基準に基づいて選択した候補説明変数のデータを用いて予測モデルMを更新する。より具体的には、更新部36は、影響値が最も高い又は影響値が閾値以上の候補説明変数を選択し、予測モデルMの説明変数に候補説明変数を追加して新たな説明変数を作成する。そして、更新部36は、候補説明変数及び結果変数の実績値に基づき予測モデルMを更新する。
 ここで、選択基準を、影響値が最も高い候補説明変数、又は、影響値が閾値以上の候補説明変数を選択するものとしたがこれに限られない。例えば、更新部36は、選択基準を設けずに、候補説明変数取得部33で取得された1又は複数の候補説明変数、及び、評価部35で算出された候補説明変数の影響値を対応づけて表示させ、操作者によって選択操作された候補説明変数のデータを用いて予測モデルMを更新してもよい。
 図4は、予測モデルを更新する候補説明変数の選択画面を示す図である。
 評価部35は、予測モデルMを更新する候補説明変数、及び、候補説明変数を選択するための指標となる影響値を示す選択画面G1を表示部14に表示出力する。選択画面G1には、番号、入力構成、影響値、及び、選択ボタンが対応付けられたリストR1が表示されている。ここで、入力構成は、予測モデルMに学習させる候補の説明変数(候補説明変数)の他、予測モデルMに学習済の説明変数(学習済説明変数)を含む。また、影響値として、MAEを示している。MAEは、その数値が小さいほど誤差が小さいこと、即ち、予測の精度が高いことを示す。図4において、網掛けが施された入力構成は、予測モデルMに学習済の説明変数を示す。番号は、入力構成、影響値、及び、選択ボタンを識別するための情報を示す。リストR1の番号1には、候補説明変数として「割引率」、学習済説明変数として「前日の需要量」「前日の来客数」「予報気温」、候補説明変数のMAE(影響値)として「12.35」が示されている。リストR1の番号4には、候補説明変数として「SNS広告の共有数」、学習済説明変数として「前日の需要量」「前日の来客数」、「予報気温」、候補説明変数のMAEとして「9.28」が示されている。この場合、候補説明変数のMAEの値が小さい番号4を選択し、候補説明変数「SNS広告の共有数」を用いて予測モデルを更新Mすることで、番号4以外の番号を選択した場合よりも、予測モデルMの予測精度を向上させることができる。
 このように、情報処理装置1の予測モデルの更新作業者は、リストR1に示された影響値を参照したうえで、所望の番号に対応づけられた選択ボタンを選択できるから、自身の知見に依存することなく、予測モデルの更新に用いる新たな説明変数を選択することができる。従って、更新作業者は、予測モデルの更新に用いる新たな説明変数を選択する作業に対する煩わしさが低減される。即ち、情報処理装置1は、説明変数を選択するための指標となる影響値を表示することにより、予測モデルの更新に用いる新たな説明変数を選択する作業に対する煩わしさを低減することが可能となる。
 なお、情報処理装置1は、水平スクロールバーH、垂直スクロールバーVに対する操作入力を受け付けることにより、図示されていない、説明変数及び/又は番号を表示可能にしてもよい。また、情報処理装置1は、学習済説明変数を網掛けして示しているが、この表示態様に限らず、予測モデルMに学習済である旨が識別可能であれば如何なる態様を用いてもよい。
 図5は、予測モデル更新処理を示すフローチャート図である。
 ステップS100において、取得部31は、予測モデルMに入力された説明変数、及び、予測モデルMから出力された予測値を取得する。
 ステップS101において、誤差算出部32は、取得部31で取得された説明変数に対応した結果変数の実績値と、取得部31で取得された予測値の誤差を算出する。
 ステップS102において、誤差算出部32は、算出した誤差の絶対値が閾値以上であるか、未満であるか判定する。ここで、閾値は、自然数である。誤差算出部32は、誤差の絶対値が閾値未満の場合、予測モデルを更新する必要が無いものとして、処理を終了する(ステップS102:NO)。一方、誤差算出部32は、誤差の絶対値が閾値以上の場合、予測モデルを更新する必要があるものとしてステップS103へと進む。
ステップS103において、候補説明変数取得部33は、誤差算出部32で算出された誤差が閾値以上である場合(ステップS102:YES)、記憶部16に記憶されたデータセットから、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する。
 ステップS104において、類似予測対象取得部34は、予測対象に類似する対象であって、候補説明変数取得部33で取得された候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する。
 ステップS105において、評価部35は、予測対象における候補説明変数に対応する結果変数の実績値と、類似予測対象における候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値(MAE)を高く算出する。
 ステップS106において、更新部36は、候補説明変数取得部33で取得された1又は複数の候補説明変数の中から、評価部35で算出された影響値の選択基準に基づいて選択した候補説明変数を用いて予測モデルMを更新する。また、更新部36は、候補説明変数取得部33で取得された1又は複数の候補説明変数、及び、評価部35で算出された候補説明変数の影響値(MAE)を対応づけて表示させ、選択操作された候補説明変数を用いて予測モデルMを更新する。
 以上のように、実施の形態1における情報処理装置1は、予測モデルの予測精度の向上に寄与する程度といった、新たな説明変数を選択するための指標を示すことができるから、予測モデルの更新に用いる新たな説明変数を選択する作業に対する操作者の煩わしさを低減することができるといった効果を奏する。
・第2の実施形態
 予測モデルを更新する態様は、第1の実施形態に限られない。ここで、店舗c(予測対象)と、店舗cに類似する店舗d(類似予測対象)が情報処理装置1に接続されているものとする。そして、誤差算出部32は、店舗dの誤差が閾値以上であると判定した場合、かつ、店舗cの誤差が閾値未満であると判定した場合に、店舗dで演算した影響値を用いて店舗cの予測モデルMを更新してもよい。
 図6は、第2の実施形態における予測モデル更新処理を示すフローチャート図である。
 ステップS100、S101、S103~S108の処理は、図5に示した各ステップの処理と同じであるため説明を省略する。
 ステップS102′において誤差算出部32は、ステップS101で演算した誤差の絶対値が閾値以上であるか、未満であるか判定する。ここで、誤差算出部32は、店舗cの誤差が閾値未満であると判定する。閾値は、自然数である。誤差算出部32は、誤差の絶対値が閾値未満であるとして、ステップS201に進む。なお、誤差算出部32は、誤差の絶対値が閾値以上である場合には、ステップS103に進む。
ステップS201において、類似予測対象取得部34は、予測対象(店舗c)に類似する少なくとも1つの対象を類似予測対象(店舗d)として取得する。なお、予測対象(店舗c)に類似する類似予測対象(店舗d)を取得する処理は、図5に示したステップS104の処理と同様でよい。
 ステップS202において、誤差算出部32は、類似予測対象取得部34で取得された類似予測対象の店舗dの説明変数に対応した結果変数の予測値と実績値の誤差を算出する。
 ステップS203において、誤差算出部32は、算出した誤差の絶対値が閾値以上であるか、未満であるか判定する。ここで、閾値は、自然数であるものとする。誤差算出部32は、誤差の絶対値が閾値未満である場合、予測モデルMを更新する必要が無いものとして、処理を終了する(ステップS203:NO)。一方、誤差算出部32は、誤差の絶対値が閾値以上である場合、予測モデルMを更新する必要があるものとしてステップS204へと進む(ステップS203:YES)。
 ステップS204において、候補説明変数取得部33は、ステップS202で算出された誤差の原因となっている説明変数の候補である候補説明変数を取得する。
 ステップS205において、評価部35は、ステップS204で取得された候補説明変数の影響値を算出する。具体的には、評価部35は、予測対象(店舗c)における候補説明変数に対応する結果変数の実績値と、類似予測対象(店舗d)における候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する。
 ステップS206において、更新部36は、ステップS205で算出された影響値の選択基準に基づいて選択した候補説明変数を用いて店舗cの予測モデルMを更新する。
 以上のように、実施の形態2における情報処理装置1は、予測モデルMの予測精度の向上に寄与する程度といった、新たな説明変数を選択するための指標を示すことができる。これにより、実施の形態2における情報処理装置1は、予測モデルMの更新に用いる新たな説明変数を選択する作業に対する操作者の煩わしさを低減することができるといった効果を奏する。
・その他の応用例1
 第1の実施形態においては、候補説明変数が与える誤差期間内の影響値のみを指標として予測モデルを更新したが、評価部35は、誤差算出部32で算出した誤差が閾値以上であると判定したタイミング、及び、誤差算出部32で算出した誤差が閾値未満であると判定したタイミングの夫々で、候補説明変数の影響値を算出してもよい。また、評価部35は、夫々のタイミングで算出した候補説明変数の影響値を候補説明変数の選択画面に表示出力してもよい。なお、ここでは、評価部35は、影響値の一例であるMAEを算出するものとする。以降の説明においては、誤差期間内に算出した候補説明変数の影響値を誤差期間内MAE、誤差期間外に算出した候補説明変数の影響値を誤差期間外MAEと称する。
 図7は、予測モデルを更新する候補説明変数の選択画面を示す図である。
 評価部35は、予測モデルMに学習させる候補の説明変数(候補説明変数)を原因とする誤差が生じていない期間、及び、誤差が生じている期間の夫々において算出された候補説明変数に対応する結果変数の実績値の差の大きさに基づいて影響値(誤差期間内MAE、誤差期間外MAE)を算出する。また、評価部35は、候補説明変数、予測モデルMに学習済の説明変数(学習済説明変数)、候補説明変数を選択するための指標となる影響値(誤差期間内MAE、誤差期間外MAE)、グラフ、及び、選択ボタンを含む選択画面G2を表示部14に表示出力する。ここで、グラフは、少なくとも、予測対象における結果変数の実績値、及び、予測値の推移を含むものとする。
 例えば、選択画面G2の番号1には、候補説明変数として「割引率」を選択した場合の予測対象(店舗a)における需要量の実績値84(実線)及び予測値83(破線)の推移を示すグラフ、誤差期間内MAE(9.87)、及び、誤差期間外MAE(16.37」が示されている。さらに、選択画面G2の番号1には、予測対象における需要量の実績値及び予測値の推移を示すグラフ、割引率の推移を示すグラフ、及び、前日の需要量の推移を示すグラフが、夫々同じ時系列に示されている。
 また、例えば、選択画面G2の番号4には、候補説明変数として「SNS広告の共有数」を選択した場合の、予測対象(店舗a)における需要量の実績値及び予測値の推移を示すグラフ、誤差期間内MAE(6.54)、及び、誤差期間外MAE(9.91)で表示される。さらに、選択画面G2の番号4には、予測対象における需要量の実績値及び予測値の推移を示すグラフ、SNS広告の共有数の推移を示すグラフ、及び、前日の需要量の推移を示すグラフが、夫々同じ時系列に示されている。
 このように、誤差期間内MAE、及び、誤差期間外MAEの夫々を算出して表示出力することで、更新作業者は、誤差期間内及び誤差期間外の予測モデルの予測精度が向上するような候補説明変数を選択しやすくなる。また、予測対象における需要量の実績値及び予測値の推移を示すグラフを表示出力することで、更新作業者は、候補説明変数が予測モデルに与える影響を視覚的に視認しやすくなる。即ち、情報処理装置1は、実施の形態1に比べて、予測モデルの予測精度を向上させつつも、予測モデルの更新に用いる新たな説明変数を選択する作業に対する煩わしさを低減することが可能となる。
 なお、情報処理装置1は、垂直スクロールバーV1、V2に対する操作入力を受け付けることにより、図示されていない、説明変数及び/又は番号を表示可能にしてもよい。図7に表示された候補説明変数は、図4に表示された候補説明変数に対応している。図7のNo.2、No.3に同じ候補説明変数が図示されているが、垂直スクロールバーV2をスクロールさせることで、図示されていない候補説明変数が表示される。
・その他の応用例2
 第1の実施形態において、類似予測対象取得部34は、説明変数、候補説明変数、結果変数の実績値、及び、属性の少なくとも1つ以上が、予測対象に類似する対象を類似予測対象として取得した。そして、評価部35は、予測対象における候補説明変数に対応する結果変数の実測値と、予測対象における候補説明変数の影響を受けていない結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出した。しかしながら、このようにして取得及び評価された類似予測対象は、候補説明変数取得部33で取得された候補説明変数による影響を含んでいる恐れがある。
 そこで、類似予測対象取得部34は、取得した類似予測対象を、候補説明変数の影響がある類似予測対象店舗(以下、影響あり類似店舗b1と称する。)と、影響がない類似予測対象店舗(以下、影響なし類似店舗b2と称する。)に分類してもよい。例えば、類似予測対象取得部34は、予測対象である店舗aと同時期に同じキャンペーンを実施する店舗を影響あり類似店舗B1、予測対象である店舗aと同時期に異なるキャンペーンを実施する店舗を影響なし類似店舗B2に分類してもよい。
 更に、評価部35は、影響あり類似店舗b1の実績値、及び、影響なし類似店舗b2の実績値の差が大きいほど、候補説明変数の影響値を高く算出してもよい。
 上述した情報処理装置1が実施する処理は、コンピュータを機能させるためのプログラムとして構成されてもよい。
 1 情報処理装置、2 販売店端末、3 ネットワーク、11 プロセッサ、12 メモリ、13 通信インタフェース、14 表示部、15 操作部、16 記憶部、20 予測処理部、21 入力部、22 予測部、23 出力部、30 予測モデル更新部、31 取得部、32 誤差算出部、33 候補説明変数取得部、34 類似予測対象取得部、35 評価部、36 更新部。

Claims (9)

  1.  予測対象において、因果関係の原因となっている説明変数、及び、当該因果関係の結果となっている結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する情報処理装置であって、
     前記予測モデルに入力された前記説明変数、及び、前記予測モデルから出力された前記予測値を取得する取得部と、
     前記取得部で取得された前記説明変数に対応した結果変数の実績値と、前記取得部で取得された前記予測値の誤差を算出する誤差算出部と、
     前記誤差算出部で算出された前記誤差が閾値以上である場合に、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得部と、
     前記予測対象に類似する対象であって、前記候補説明変数取得部で取得された前記候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得部と、
     前記予測対象における前記候補説明変数に対応する結果変数の実績値と、前記類似予測対象における前記候補説明変数に対応する結果変数の実績値との差が大きいほど、当該候補説明変数の影響値を高く算出する評価部と
     を備えることを特徴とする情報処理装置。
  2.  前記評価部は、
     前記候補説明変数を原因とする誤差が生じていない対象、及び、当該誤差が生じている対象の夫々において算出された当該候補説明変数に対応する結果変数の実績値の差の大きさに基づいて評価すること
     を特徴とする請求項1に情報処理装置。
  3.  前記評価部は、
     前記候補説明変数を原因とする誤差が生じていない期間、及び、当該誤差が生じている期間の夫々において算出された当該候補説明変数に対応する結果変数の実績値の差の大きさに基づいて評価すること
     を特徴とする請求項1又は2に情報処理装置。
  4.  前記情報処理装置は、更に、
     前記候補説明変数取得部で取得された1又は複数の前記候補説明変数の中から、前記評価部で算出された影響値の選択基準に基づいて選択した前記候補説明変数を用いて前記予測モデルを更新する更新部
     を備えることを特徴とする請求項1~3のいずれかに記載の情報処理装置。 
  5.  前記情報処理装置は、更に、
     前記候補説明変数取得部で取得された1又は複数の前記候補説明変数、及び、前記評価部で算出された当該候補説明変数の影響値を対応づけて表示させ、選択操作された候補説明変数を用いて前記予測モデルを更新する更新部
     を備えることを特徴とする請求項1~3のいずれかに記載の情報処理装置。 
  6.  前記類似予測対象取得部は、
     前記説明変数、前記候補説明変数、前記結果変数の実績値、及び、属性の少なくとも1つ以上が、前記予測対象に類似する対象を類似予測対象として取得すること
     を特徴とする請求項1~5のいずれか1項に記載の情報処理装置。
  7.  前記誤差算出部で算出された前記誤差が閾値未満である場合に、前記予測対象に類似する対象であって、前記候補説明変数取得部で取得された前記候補説明変数を原因とする誤差が生じている対象を類似予測対象として取得する類似予測対象取得部と、
     前記予測対象における候補説明変数に対応する結果変数の実績値と、前記類似予測対象における候補説明変数に対応する結果変数の実績値との差が大きいほど、当該候補説明変数の影響値を高く算出する評価部と
     を備えることを特徴とする請求項1~6のいずれか1項に記載の情報処理装置。
  8.  予測対象において、因果関係の原因となっている説明変数、及び、当該因果関係の結果となっている結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する情報処理方法であって、
     前記予測モデルに入力された前記説明変数、及び、前記予測モデルから出力された前記予測値を取得する取得ステップと、
     前記取得ステップで取得された前記説明変数に対応した結果変数の実績値と、前記取得ステップで取得された前記予測値の誤差を算出する誤差算出ステップと、
     前記誤差算出ステップで算出された前記誤差が閾値以上である場合に、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得ステップと、
     前記予測対象に類似する対象であって、前記候補説明変数取得ステップで取得された前記候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得ステップと、
     前記予測対象における前記候補説明変数に対応する結果変数の実績値と、前記類似予測対象における前記候補説明変数に対応する結果変数の実績値との差が大きいほど、当該候補説明変数の影響値を高く算出する評価ステップと
     を備えることを特徴とする情報処理方法。
  9.  予測対象において、因果関係の原因となっている説明変数、及び、当該因果関係の結果となっている結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する情報処理方法であって、
     前記予測モデルに入力された前記説明変数、及び、前記予測モデルから出力された前記予測値を取得する取得ステップと、
     前記取得ステップで取得された前記説明変数に対応した結果変数の実績値と、前記取得ステップで取得された前記予測値の誤差を算出する誤差算出ステップと、
     前記誤差算出ステップで算出された前記誤差が閾値以上である場合に、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得ステップと、
     前記予測対象に類似する対象であって、前記候補説明変数取得ステップで取得された前記候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得ステップと、
     前記予測対象における前記候補説明変数に対応する結果変数の実績値と、前記類似予測対象における前記候補説明変数に対応する結果変数の実績値との差が大きいほど、当該候補説明変数の影響値を高く算出する評価ステップと
     をコンピュータに実行させることを特徴とするプログラム。
PCT/JP2021/036575 2021-10-04 2021-10-04 情報処理装置、情報処理方法、及び、プログラム WO2023058080A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2023542671A JP7375990B2 (ja) 2021-10-04 2021-10-04 情報処理装置、情報処理方法、及び、プログラム
PCT/JP2021/036575 WO2023058080A1 (ja) 2021-10-04 2021-10-04 情報処理装置、情報処理方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/036575 WO2023058080A1 (ja) 2021-10-04 2021-10-04 情報処理装置、情報処理方法、及び、プログラム

Publications (1)

Publication Number Publication Date
WO2023058080A1 true WO2023058080A1 (ja) 2023-04-13

Family

ID=85803242

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/036575 WO2023058080A1 (ja) 2021-10-04 2021-10-04 情報処理装置、情報処理方法、及び、プログラム

Country Status (2)

Country Link
JP (1) JP7375990B2 (ja)
WO (1) WO2023058080A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018180712A (ja) * 2017-04-06 2018-11-15 テンソル・コンサルティング株式会社 モデル変数候補生成装置および方法
JP6603600B2 (ja) * 2015-06-30 2019-11-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 需要予測方法、需要予測装置及び需要予測プログラムを記録したコンピュータ読み取り可能な記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6603600B2 (ja) * 2015-06-30 2019-11-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 需要予測方法、需要予測装置及び需要予測プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2018180712A (ja) * 2017-04-06 2018-11-15 テンソル・コンサルティング株式会社 モデル変数候補生成装置および方法

Also Published As

Publication number Publication date
JPWO2023058080A1 (ja) 2023-04-13
JP7375990B2 (ja) 2023-11-08

Similar Documents

Publication Publication Date Title
Antras et al. The margins of global sourcing: Theory and evidence from us firms
Siganos et al. Divergence of sentiment and stock market trading
JP5963709B2 (ja) 計算機、予測方法、及び、予測プログラム
Berry et al. Bayesian forecasting of many count-valued time series
US12008593B2 (en) System, method and computer program for varying affiliate position displayed by intermediary
JP7120649B2 (ja) 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム
JP5337174B2 (ja) 需要予測装置、及びそのプログラム
US20140200992A1 (en) Retail product lagged promotional effect prediction system
JP6003736B2 (ja) 情報処理プログラム、情報処理方法および情報処理装置
Kargah-Ostadi et al. Developing performance prediction models for pavement management systems in local governments in absence of age data
Hamdi et al. Corruption, FDI, and growth: An empirical investigation into the Tunisian context
Hui et al. The roles of developer’s status and competitive intensity in presale pricing in a residential market: A study of the spatio-temporal model in Hangzhou, China
Keil Explaining the concentration-profitability paradox
CN111768243A (zh) 销量预测方法、预测模型构建方法、装置、设备及介质
WO2020031232A1 (ja) 情報処理システム、情報処理方法、及びプログラム
Kaklauskas et al. Crisis Thermometer for housing market recommendations
WO2023058080A1 (ja) 情報処理装置、情報処理方法、及び、プログラム
US20220374923A1 (en) Computational methods and processor systems for predictive marketing analysis
Pierri et al. Bankruptcy prediction by survival models based on current and lagged values of time-varying financial data
Perevyshin et al. Determinants of price level differences in Russian regions
JP5786001B2 (ja) 需要予測装置およびプログラム
WO2019187968A1 (ja) 情報処理システム、情報処理方法及び記憶媒体
CN111667314A (zh) 商品资源分配方法、装置及电子设备
JP6788765B1 (ja) 生産性指標演算装置
CN111242698A (zh) 一种商品需求预测的神经网络模的方法和系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21959824

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023542671

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE