WO2022190199A1 - 需要予測装置、需要予測方法および予測モデル生成装置 - Google Patents

需要予測装置、需要予測方法および予測モデル生成装置 Download PDF

Info

Publication number
WO2022190199A1
WO2022190199A1 PCT/JP2021/009237 JP2021009237W WO2022190199A1 WO 2022190199 A1 WO2022190199 A1 WO 2022190199A1 JP 2021009237 W JP2021009237 W JP 2021009237W WO 2022190199 A1 WO2022190199 A1 WO 2022190199A1
Authority
WO
WIPO (PCT)
Prior art keywords
demand
forecasting
data
prediction
unit
Prior art date
Application number
PCT/JP2021/009237
Other languages
English (en)
French (fr)
Inventor
祐加子 鷲見
訓 光山
貢一 平岡
久美子 岡田
裕子 土屋
浩子 助田
巌 田沼
奈緒子 牛尾
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2021/009237 priority Critical patent/WO2022190199A1/ja
Publication of WO2022190199A1 publication Critical patent/WO2022190199A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Definitions

  • the present invention relates to a demand prediction device, a demand prediction method, and a prediction model generation device for predicting demand for products and services.
  • Demand for products and services is predicted from past sales results using big data analysis and machine learning technology.
  • a forecasting model is generated from the feature values of data related to demand and past sales performance, and forecasting is performed using the forecasting model from the data related to demand for the forecast target period. is common. The accuracy of prediction depends greatly on the degree to which the data associated with the demand reflects the demand and on the features extracted from the data.
  • the information processing device described in Patent Document 1 predicts transaction prices and transaction periods from property data in real estate transactions.
  • Features extracted from the property data include data of the property itself such as floor area, data of the surrounding environment of the property, and characteristic words included in the property description.
  • Patent Literature 1 uses morphological analysis to extract words that serve as feature amounts from property descriptions, but does not describe what kind of words are to be extracted. It is thought that the demand for products and services is reflected not only by feature amounts related to demand targets themselves, but also by feature amounts related to consumers (purchasers) and social conditions. It is considered that demand can be predicted with higher accuracy by making predictions using such feature amounts.
  • SUMMARY OF THE INVENTION It is an object of the present invention to provide a demand forecasting device, a demand forecasting method, and a forecast model generating device that enable highly accurate demand forecasting.
  • a demand forecasting apparatus provides second text data in which sensitivity information, categories, and economic conditions are added to first text data created by potential customers related to demand forecast targets. and a forecasting unit that predicts the demand amount of the demand forecast target using a forecast model generated using learning data including sales performance data of the demand forecast target.
  • the prediction model generation device includes second text data in which sensitivity information, categories, and economic conditions are added to the first text data created by the potential consumers related to the demand prediction target. and a model generation unit that generates a prediction model using learning data including actual sales data for the demand prediction target.
  • FIG. 4 is a data configuration diagram of a message database according to the embodiment;
  • FIG. 4 is a data configuration diagram of a sensitivity dictionary according to the embodiment;
  • FIG. 4 is a data configuration diagram of a category dictionary according to the embodiment;
  • FIG. 4 is a data configuration diagram of economic index data according to the present embodiment;
  • FIG. 4 is a data configuration diagram of sales performance data according to the embodiment;
  • FIG. It is a figure for demonstrating the one month later prediction model which concerns on this embodiment. It is learning data for generating a prediction model after one month according to the present embodiment.
  • FIG. 4 is a data configuration diagram of a message database according to the embodiment;
  • FIG. 4 is a data configuration diagram of a sensitivity dictionary according to the embodiment;
  • FIG. 4 is a data configuration diagram of a category dictionary according to the embodiment;
  • FIG. 4 is a data configuration diagram of economic index data according to the present embodiment;
  • FIG. 4 is a data configuration diagram of sales performance data according to the embodiment;
  • FIG. 10 is a data configuration diagram of a post-one-month feature value importance database according to the present embodiment; 4 is a data configuration diagram of prediction result data according to the embodiment; FIG. It is a screen configuration diagram of a prediction result screen according to the present embodiment. It is a screen configuration diagram of a prediction result screen according to the present embodiment. It is a screen configuration diagram of a prediction result screen according to the present embodiment. It is a flow chart of prediction model generation processing concerning this embodiment. 4 is a flowchart of prediction processing according to the embodiment; 1 is a diagram showing a recording medium according to this embodiment; FIG.
  • the demand prediction device predicts the demand (sales volume, sales volume) of passenger cars.
  • the data used for prediction includes social media data related to the passenger vehicle, and open data related to economic conditions such as stock price indexes as data related to social conditions. From the social media data, not only specific characteristic words related to passenger cars targeted for demand forecasting but also sensitivity information of consumers (including potential consumers) who are users of social media are extracted. Sensitivity information includes an impression and favorable impression of a target passenger car. In this way, in addition to the feature words included in social media data, the demand forecasting device can forecast demand with a higher degree of accuracy by including the customer's emotional information and data related to the economic situation. .
  • FIG. 1 is a functional block diagram of a demand prediction device 100 according to this embodiment.
  • Demand forecasting device 100 is connected to sales dealer server 410 , social media data providing server 420 , and open data providing server 430 via network 490 .
  • Sales dealer server 410 stores the actual sales of passenger cars.
  • the social media data providing server 420 accumulates text data of social media related to passenger cars.
  • the open data providing server 430 stores open data relating to economic conditions.
  • the demand forecasting device 100 is a computer and includes a control unit 110, a storage unit 130, and an input/output unit 160.
  • User interface devices such as a display, a keyboard, and a mouse are connected to the input/output unit 160 .
  • Input/output unit 160 is also connected to network 490 to transmit and receive communication data with sales dealer server 410 , social media data providing server 420 , and open data providing server 430 .
  • the control unit 110 includes a CPU (Central Processing Unit).
  • the control unit 110 includes a data acquisition unit 111, a sentiment analysis unit 112, a category classification unit 113, a vehicle type analysis unit 114, a data combination unit 115, a model generation unit 116, a prediction basis calculation unit 117, a prediction unit 118, and a regional prediction unit 119. , and a visualization unit 120 .
  • the storage unit 130 is composed of storage devices such as ROM (Read Only Memory), RAM (Random Access Memory), and SSD (Solid State Drive).
  • the storage unit 130 includes a message database 210, a sensitivity dictionary 230, a category dictionary 240, economic index data 250, sales record data 260, a program 138, learning data 300, a prediction model 131 for the month after January, a prediction model for the month after February 132, 3 Monthly prediction model 133, January feature value importance database 310, February feature value importance database 320, March feature value importance database 330, regional ratio prediction model 340, and prediction result data 380 are stored. be done.
  • the program 138 includes descriptions of processing procedures for prediction model generation processing (see FIG. 14) and prediction processing (see FIG. 15), which will be described later.
  • the message database 210, the post-January feature importance database 310, the post-February feature importance database 320, and the post-March feature importance database 330 are message DBs (databases) and 1 Post-month feature value importance DB, post-February feature value importance DB, and post-March feature value importance DB are described.
  • the constituent elements of the control unit 110 and the storage unit 130 will be described below in accordance with the processing order of the demand forecast.
  • Data acquisition unit 111 acquires a message (first text data) posted on social media from social media data providing server 420 (see FIG. 1), and stores it in message database 210 (see FIG. 2 described later).
  • FIG. 2 is a data configuration diagram of the message database 210 according to this embodiment.
  • the message database 210 is tabular data, for example, and one row (record) indicates one message (second text data).
  • the record includes an identification number 211 (denoted as ID (identifier) in FIG. 2), posting date and time 212, poster 213, message 214, vehicle type 215, sentiment 216, sentiment details 217, category 218, household consumption 219, and stock price 220. contains columns (attributes) of
  • the identification number 211 is the identification number of the message.
  • Posting date and time 212 is the date and time when the message was posted on the social media.
  • the poster 213 is identification information of the social media user (potential consumer) who posted the message.
  • a message 214 is a posted message (text data). Other attributes such as vehicle type 215, sentiment 216, sentiment details 217, category 218, household consumption 219, and stock price 220 are described below.
  • the data acquisition unit 111 stores the message acquired from the social media data providing server 420 in the attributes of the identification number 211 , posting date and time 212 , poster 213 , and message 214 of the message database 210 .
  • the sensitivity analysis unit 112 analyzes the sensitivity (contributor's sensitivity/emotion) of the message 214 (see FIG. 2) using the sensitivity dictionary 230 shown in FIG.
  • FIG. 3 is a data configuration diagram of the sensitivity dictionary 230 according to this embodiment.
  • the sensitivity dictionary 230 is a dictionary of words related to feelings/sensitivities such as likes and dislikes and emotions.
  • the kansei dictionary 230 is tabular data, and one row (record) includes columns (attributes) of headwords 231 , kansei 232 , and kansei details 233 .
  • the headword 231 is a headword of the Kansei dictionary 230 .
  • the kansei 232 indicates the kansei of the headword 231, and includes a positive emotion (“favorable”), a negative emotion (“bad”), and neither positive nor negative (“ other”).
  • the kansei details 233 indicate the contents of the kansei 232, such as "fun”, “compliment”, “satisfaction”, “dissatisfaction”, “antipathy”, and “doubt”.
  • Record 239 indicates that the sensibility 232 of the word "severe” is "bad” and means "dissatisfied”.
  • the kansei analysis unit 112 identifies the headword 231 included in the message 214, and stores the kansei 232 and the detailed kansei 233 corresponding to the headword in the kansei 216 and the detailed kansei 217 of the message database 210 (see FIG. 2), respectively. do.
  • the category classification unit 113 classifies the message 214 (see FIG. 2) into categories using the category dictionary 240 shown in FIG.
  • FIG. 4 is a data configuration diagram of the category dictionary 240 according to this embodiment.
  • Category dictionary 240 is a dictionary that indicates (for assigning categories to) categories of words included in message 214 (see FIG. 2).
  • the category dictionary 240 is tabular data, and one row (record) includes pronouns 241, nouns 242, adjectives 243, and category 244 columns (attributes).
  • the category classification unit 113 stores the category 244 of the record in the category 218 of the message database 210 (see FIG. 2).
  • the category classification unit 113 stores multiple categories 244 corresponding to the category 218 .
  • the category classification unit 113 may add a record of the message 214 to the message database 210 and store one category 244 in each of the categories 218 of the plurality of records of the message 214 .
  • FIG. 5 is a data configuration diagram of the economic index data 250 according to this embodiment.
  • the economic index data 250 is tabular data, one row (record) indicates a daily economic index, and includes columns (attributes) of date 251 , household consumption 252 , and stock price 253 .
  • the household consumption 252 is, for example, an amount obtained by prorating the monthly expenditure amount per household.
  • Household consumption 252 may be the amount of weekly or daily spending calculated relative to retail weekly or daily POS data.
  • the stock price 253 indicates, for example, the closing price of the domestic stock market on the date 251 .
  • Data combiner 115 identifies date 251 corresponding to posting date 212 (see FIG. 2), and converts household consumption 252 and stock price 253 corresponding to date 251 into household consumption 219 and stock price 220 in message database 210. , respectively. All attributes of the message database 210 have been described above.
  • the data acquisition unit 111 acquires the monthly sales record as data relating to the passenger car that is the object of demand forecast from the sales dealer server 410 (see FIG. 1), and stores it in the sales record data 260 .
  • FIG. 6 is a data configuration diagram of the sales performance data 260 according to this embodiment.
  • the sales performance data 260 is tabular data, and indicates the sales performance by region and by month.
  • One row (record) shows monthly sales results 262, 264, 266 and percentages 263, 265, 267 in an area 261.
  • the actual result 262 is the actual result for January before December
  • the ratio 263 is the ratio (unit: %) of the actual result 262 in all regions.
  • the sales dealer server 410 acquires the monthly sales results and stores them in the results 262 , 264 and 266
  • the data acquisition unit 111 calculates the ratio of each result and stores them in the ratios 263 , 265 and 267 .
  • Model generation unit 116 uses learning data (see FIG. 8 to be described later) that includes message database 210 (second text data) and includes actual sales data 260 to generate forecast model 131 after January and forecast model 131 after February. 132, and a forecast model 133 after March.
  • the one-month later prediction model 131 will be described below.
  • FIG. 7 is a diagram for explaining the one-month forecast model 131 according to this embodiment.
  • the post-January prediction model 131 is a machine learning model that predicts sales performance 269 for the next month (X+12th month) from data 210A for one year (Xth month to X+11th month) included in the message database 210 (see FIG. 2). is.
  • the predictive model 131 after one month has the data 210A of the message database 210 for one year as input (explanatory variable) and the next month's actual sales 269 as output (objective variable, prediction result).
  • the model generation unit 116 performs learning processing of a machine learning technique using learning data (see FIG. 8 to be described later) to generate a forecast model 131 one month later.
  • the sales performance is the total of the sales performance 262, 264, and 266 in the sales performance data 260 for all regions.
  • FIG. 8 shows learning data 300 for generating the one month later prediction model 131 according to this embodiment.
  • the learning data 300 includes a plurality of pairs of inputs and outputs that are past achievements.
  • a pair 301 is a pair of data (input) of the message database 210 (second text data) for one year from January 2010 and sales performance (correct label, output) in January 2011.
  • the learning data 300 includes 120 pairs generated from the message database 210 data from January 2010 to November 2020 and the sales performance data from January 2011 to December 2020.
  • the model generation unit 116 trains a machine learning model using the learning data 300 as teacher data to generate the prediction model 131 after one month.
  • the generated post-January prediction model 131 is a model for predicting sales results for the next month based on data in the message database 210 for the past year. The same applies to the prediction model 132 after February and the prediction model 133 after March.
  • the post-February prediction model 132 is a model that predicts the sales performance of the month after next (after February) from the data in the message database 210 for the past year.
  • the post-March prediction model 133 is a model that predicts the sales performance after March from the data in the message database 210 for the past year. Note that the forecast model 131 after one month, the forecast model 132 after February, and the forecast model 133 after March are collectively referred to as forecast models.
  • the prediction basis calculation unit 117 calculates the feature amount importance in each prediction model.
  • the feature quantity importance indicates the degree to which the feature quantity is considered important in calculating the prediction result by the prediction model, and is also called Feature Importance or Variable Importance.
  • the prediction basis calculation unit 117 calculates the degree to which the prediction model attaches importance (feature quantity importance) to the feature quantity.
  • the feature amount is an input feature amount, and in this embodiment, it is an attribute value of the message database 210 (see FIG. 2).
  • the prediction basis calculation unit 117 calculates the post-January feature value importance database 310 and the post-February feature value importance database 320 for the post-January prediction model 131, the post-February prediction model 132, and the post-March prediction model 133, respectively. , and after three months feature value importance database 330 is generated.
  • FIG. 9 is a data configuration diagram of the post-1 month feature value importance database 310 according to the present embodiment.
  • the post-1 month feature importance database 310 is tabular data indicating the feature importance of the post-1 month prediction model 131.
  • One row (record) includes a ranking 311, an importance 312, and a feature item. 313, direction of impact 314, and prediction rationale 315 columns (attributes).
  • the ranking 311 indicates the ranking of feature quantity importance.
  • the importance 312 indicates the feature amount importance.
  • the sum of the importance levels 312 is 100.
  • the feature amount item 313 is a value of the feature amount and is indicated by an attribute (attribute name) of the message database 210 and its value. For example, “text: A” indicates that message 214 contains “A”, and "user name: U0031” indicates that poster 213 is "U0031".
  • the direction of influence 314 indicates whether the feature amount item 313 has an influence in the direction of increasing/decreasing the prediction result (sales volume) or has no influence.
  • the prediction basis 315 is text displayed on a prediction result display screen (see FIGS. 11 to 13), which will be described later, and is an explanation for explaining the basis of the prediction result.
  • the prediction unit 118 predicts demand (sales volume) using a prediction model and stores the prediction result in the prediction result data 380 . For example, the prediction unit 118 predicts the next month's sales volume using the one-month later prediction model 131 from the data in the message database 210 for the past year.
  • FIG. 10 is a data configuration diagram of the prediction result data 380 according to this embodiment.
  • the forecast result data 380 shows percentage forecasts and sales forecasts for each region and for all regions.
  • the forecast result data 380 is data in tabular form, and one row (record) shows forecast results of percentage and sales volume in a region or all regions. , 385, 387 columns (attributes).
  • a region 381 indicates a region name or "all regions” which is the sum of all regions.
  • Proportion predictions 382, 384, and 386 are the proportions of the sales volume in the region 381 predicted by the regional prediction unit 119, which will be described later.
  • Proportion predictions 382, 384, and 386 of records whose region 381 is "whole region” are 100, and are indicated as "-”.
  • Sales forecasts 383, 385, and 387 where the area 381 is "all areas” are the forecast results for the next month (after January), the month after the next (after February), and March, which are predicted and stored by the forecasting unit 118.
  • the regional prediction unit 119 predicts sales volume by region.
  • the region-by-region forecasting unit 119 is a region-by-region ratio prediction model 340 that predicts the ratio of the next month, the month after the next, and the month after March from the sales ratio of the past year (see ratios 263, 265, and 267 in FIG. 6) for each region. (see FIG. 1).
  • Various forecasting methods have been proposed for time series analysis, and the regional ratio forecasting model 340 is, for example, the ARIMA model.
  • the region-based prediction unit 119 uses the region-based ratio prediction model 340 to predict the ratios of the next month, the month after next, and the month after March, and stores the ratio predictions 382, 384, and 386 in the prediction result data 380. . Further, the regional prediction unit 119 stores the results of multiplying the sales predictions 383, 385, 387 of "all regions" by the ratio predictions 382, 384, 386 in the sales predictions 383, 385, 387 by region. Sales forecasts 383 , 385 , and 387 are sales forecasts for the next month (after January), the month after next (after February), and March after each region predicted by the region-based prediction unit 119 .
  • the visualization unit 120 generates prediction result screens 510, 520, and 530 (see FIGS. 11 to 13 described later) and outputs them to a display (not shown) connected to the input/output unit 160 (see FIG. 1).
  • FIG. 11 is a screen configuration diagram of a prediction result screen 510 according to this embodiment.
  • Prediction result screen 510 includes graph 511 , pull-down menu 512 , prediction basis 513 , and message 514 .
  • a graph 511 is a bar graph showing the sales results for this month, the sales forecast for January, the sales forecast for February, and the sales forecast for March by region.
  • a pull-down menu 512 is a pull-down menu for selecting a prediction basis display month. "Prediction grounds after March" is selected in the pull-down menu 512 shown in FIG. (see ranking 311 and prediction grounds 315 in the one-month later feature value importance database 310).
  • the message 514 includes the posting date and time 212, the poster 213, and the message 214 of the record in the message database 210 (see FIG. 2) related to the prediction basis specified by the pointer 515.
  • the kansei details 217 specify the prediction grounds of "fun”
  • the message 514 includes a message 214 corresponding to this.
  • the prediction result screen 510 shows a prediction that the vehicle type A is a “fun” car and sales volume will increase.
  • FIG. 12 is a screen configuration diagram of the prediction result screen 520 according to this embodiment.
  • the screen configuration of the prediction result screen 520 is the same as that of the prediction result screen 510 (see FIG. 11).
  • the prediction result screen 520 shows a prediction that the vehicle type B has poor fuel efficiency and sales volume will decrease.
  • FIG. 13 is a screen configuration diagram of a prediction result screen 530 according to this embodiment.
  • the screen structure of the prediction result screen 530 is different from that of the prediction result screen 510, and instead of the message 514, an economic index 534 is displayed. This is because the forecast basis specified by the pointer 535 is related to economic indicators. The most recent monthly average stock price is shown as the economic index 534, together with the actual sales, stock prices (time-series data), and a scatter diagram of the actual sales. This concludes the description of the components of control unit 110 and storage unit 130 . Next, prediction model generation processing and prediction processing will be described.
  • FIG. 14 is a flowchart of prediction model generation processing according to this embodiment.
  • the prediction model generation process is executed at a predetermined timing, for example, every month.
  • the data acquisition unit 111 acquires a posted message from the social media data providing server 420 (see FIG. 1), identifies the message database 210 (see FIG. 2) with the identification number 211, posting date 212, and poster 213. , and message 214 .
  • step S ⁇ b>12 the sentiment analysis unit 112 assigns a sentiment 216 and detailed sentiment 217 to each message 214 using the sentiment dictionary 230 (see FIG. 3).
  • step S13 the category classification unit 113 assigns a category 218 to each message 214 using the category dictionary 240 (see FIG. 4).
  • step S ⁇ b>14 the vehicle type analysis unit 114 specifies the vehicle type included in the message 214 and assigns the vehicle type 215 to each message 214 .
  • step S15 the data acquisition unit 111 acquires economic indicators from the open data providing server 430 (see FIG. 1) and stores them in the economic indicator data 250 (see FIG. 5).
  • step S ⁇ b>16 the data combining unit 115 assigns the household consumption 219 and the stock price 220 to each message 214 in correspondence with the posting date 212 and the date 251 .
  • step S17 the data acquisition unit 111 acquires the monthly sales record as data related to the passenger car targeted for demand forecast from the sales dealer server 410 (see FIG. 1), and stores it in the sales record data 260 (see FIG. 6).
  • step S18 the model generating unit 116 generates the learning data for generating the one month later forecast model 131, the two month later forecast model 132, and the three month later forecast model 133 (the diagram for generating the one month later forecast model 131). 8) are generated respectively.
  • step S19 the model generating unit 116 generates the one month later prediction model 131, the two month later prediction model 132, and the three month later prediction model 133 using the learning data generated in step S18.
  • step S20 the prediction basis calculation unit 117 calculates the feature quantity importance in each of the one month later prediction model 131, the two month later prediction model 132, and the three month later prediction model 133.
  • the calculated feature quantity importance is stored in the feature quantity importance database 310 after one month, the feature quantity importance database 320 after February, and the feature quantity importance database 330 after three months.
  • FIG. 15 is a flowchart of prediction processing according to this embodiment.
  • the data acquisition unit 111 acquires social media data for the past year.
  • the social media data acquired in step S31 is given a feature amount. Specifically, similar to steps S12 to S16 (see FIG. 14), vehicle type 215, sentiment 216, detailed sentiment 217, category 218, household consumption 219, and stock price 220 are provided.
  • step S33 the prediction unit 118 uses the 1 month later prediction model 131, the 2 month later prediction model 132, and the 3 month later prediction model 133 from the data acquired in step S31, and uses the 1 month later prediction model 131, the 3 month later prediction model 132, and the 3 month later prediction model 133.
  • Future sales volume is predicted (calculated) and stored in sales predictions 383, 385, and 387 of record 389 corresponding to "all regions" in prediction result data 380 (see FIG. 10).
  • step S34 the data acquisition unit 111 calculates sales ratios 263, 265, and 267 from the actual sales 262, 264, and 266 of the actual sales data 260 (see FIG. 6).
  • step S35 the region-based prediction unit 119 generates a region-based ratio prediction model 340 (see FIG. 1) that predicts the ratios after one month, two months, and three months from the ratios 263, 265, and 267 of the actual sales data 260. to generate
  • step S36 the region-based prediction unit 119 uses the region-based rate prediction model 340 to predict the rates after one month, two months, and three months, and the rates for the prediction result data 380 (see FIG. 10). Store in predictions 382 , 384 , 386 .
  • step S37 the regional prediction unit 119 stores the results of multiplying the sales predictions 383, 385, and 387 of the record 389 by the ratio predictions 382, 384, and 386 in the sales predictions 383, 385, and 387 by region.
  • step S ⁇ b>38 the visualization unit 120 outputs the prediction result screens 510 , 520 , 530 to the display connected to the input/output unit 160 .
  • the demand prediction device 100 predicts the sales volume (demand, demand volume) after January to March as a predetermined length from data in which information about sensibility, category, and economic situation is added to messages posted on social media. Machine learning technology is used for prediction. Further, the demand forecasting device 100 predicts the ratio of the sales volume after January to March from the ratio of the sales volume by region in the past, and predicts the sales volume by region.
  • the demand prediction device 100 predicts not only the words contained in the message, but also the emotional information contained in the message and the economic situation at the time the message is posted, so the prediction accuracy is improved. Unlike everyday consumer goods, passenger cars are expensive and susceptible to economic conditions. The inclusion of economic conditions in forecasting improves forecasting accuracy.
  • the demand forecasting device 100 displays the forecast results as forecast result screens 510, 520, and 530 (see FIGS. 11 to 13).
  • Prediction result screens 510, 520, and 530 include prediction grounds 513, 523, and 533 in addition to the sales volume, which is the result of prediction.
  • a user of the demand forecasting apparatus 100 can confirm the certainty of the forecast by referring to the forecast grounds and messages related to the forecast grounds.
  • the input (explanatory variable) of the predictive model was the data of the message database 210 for the past year, but it is not limited to one year and may be longer or shorter than one year.
  • the input is a message to which information related to sensibility, category, and economic situation is added, but sales results may be added.
  • the economic data is not limited to household consumption and stock prices, but may be other data such as the consumer price index.
  • the market situation of the demand target may be added.
  • the sales volume of all domestic passenger cars and the sales volume by vehicle type may be added to the input of the prediction model.
  • messages, sentiments, and categories related to competing products to be in demand may be added to the input of the prediction model as market conditions.
  • regional sales volume and economic conditions may be added as inputs to the regional rate prediction model 340 .
  • the demand prediction device 100 assigns the kansei 216 and kansei details 217 to the message 214 (see FIG. 2) using the kansei dictionary (see FIG. 3).
  • Other techniques may be used.
  • the result of Kansei analysis by a model learned by a method such as deep learning may be used as Kansei and Kansei details.
  • the demand prediction device 100 assigns the category 218 to the message 214 (see FIG. 2) using the category dictionary (see FIG. 4).
  • Other techniques may be used.
  • messages may be clustered, classified, and classified as categories, or topics may be analyzed using techniques such as Latent Dirichlet Allocation and Latent Semantic Index, and classified as categories.
  • the program 138 is stored in the storage unit 130 of the demand prediction device 100, which is a computer.
  • a program in a recording medium may be read, loaded into storage unit 130 and executed, or may be installed from a recording medium and executed.
  • FIG. 16 is a diagram showing a recording medium according to this embodiment.
  • the computer 900 can function as the demand forecasting device 100 .
  • the program 138 may be downloaded and installed not only via the recording medium 910 but via a network.
  • the sales volume (demand) of passenger cars is predicted, but the present invention can be used to predict the sales volume (demand) of products and services that are not limited to passenger cars.
  • the demand forecasting device 100 generates a forecast model and forecasts the sales volume using the forecast model. good too.
  • Prediction model generation device 111 Data acquisition unit 112 Sentiment analysis unit 113 Category classification unit 114 Vehicle type analysis unit 115 Data combination unit 116 Model generation unit 117 Prediction base calculation unit 118 Prediction unit 119 Regional prediction unit 120 Visualization unit 131 Forecast model after one month (prediction model) 132 February forecast model (forecast model) 133 March forecast model (forecast model) 138 program 210 message database (second text data) 214 message (first text data) 216 Kansei (kansei information) 217 Kansei Details (Kansei Information) 218 Category 219 Household Consumption (Economic Conditions) 220 Stock Price (Economic Situation) 260 Sales performance data 310 After one month feature value importance database (feature value importance database) 311 rank (order of influence on demand) 312 Importance (degree of impact on demand) 320 February feature value importance database (feature value importance database) 330 March feature value importance database (feature value importance database) 340 Proportion forecast model by region 380 Forecast result data 382,

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

需要予測装置(100)は高精度な需要予測を可能とする。需要予測装置(100)は、需要予測対象に係る潜在需要者が作成した第1のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第2のテキストデータ(メッセージデータベース(210)参照)を含むとともに、需要予測対象の販売実績データ(260)を含む学習データ(300)を用いて生成された予測モデル(1月後予測モデル(131)、2月後予測モデル(132)、3月後予測モデル(133))を用いて、需要予測対象の需要量を予測する予測部(118)を備える。

Description

需要予測装置、需要予測方法および予測モデル生成装置
 本発明は、商品やサービスの需要を予測する需要予測装置、需要予測方法および予測モデル生成装置に関する。
 ビッグデータ解析や機械学習の技術を用いて過去の販売実績から商品やサービスなどの需要(販売量)予測が行われている。予測する手法としては、需要と関連しているデータの特徴量および過去の販売実績から予測モデルを生成し、予測対象の時期の需要と関連しているデータから当該予測モデルを用いて予測するのが一般的である。予測の精度は、需要と関連しているデータが需要を反映している度合い、および当該データから抽出する特徴量に大きく依存する。
 特許文献1に記載の情報処理装置は、不動産売買において物件データから取引価格や取引期間を予測する。物件データから抽出される特徴量としては、床面積など物件そのもののデータの他に、物件の周辺環境のデータ、物件説明文に含まれる特徴的な単語がある。
特開2020-126670号公報
 特許文献1に記載の情報処理装置は、形態素解析を用いて物件説明文から特徴量となる単語を抽出しているが、どのような単語を抽出するのかについては記載されていない。商品やサービスの需要を反映するのは、需要対象そのものに係る特徴量だけではなく、需要者(購入者)に係る特徴量や社会状況に係る特徴量があると考えられる。このような特徴量を用いて予測することで、より高精度に需要が予測できると考えられる。
 本発明は、このような背景を鑑みてなされたものであり、高精度な需要予測を可能とする需要予測装置、需要予測方法および予測モデル生成装置を提供することを課題とする。
 上記した課題を解決するため、本発明に係る需要予測装置は、需要予測対象に係る潜在需要者が作成した第1のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第2のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて生成された予測モデルを用いて、前記需要予測対象の需要量を予測する予測部を備える。
 また、本発明に係る予測モデル生成装置は、需要予測対象に係る潜在需要者が作成した第1のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第2のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて予測モデルを生成するモデル生成部を備える。
 本発明によれば、高精度な需要予測を可能とする需要予測装置、需要予測方法および予測モデル生成装置を提供することができる。上記した以外の課題、構成および効果は、以下の実施形態の説明により明らかにされる。
本実施形態に係る需要予測装置の機能ブロック図である。 本実施形態に係るメッセージデータベースのデータ構成図である。 本実施形態に係る感性辞書のデータ構成図である。 本実施形態に係るカテゴリ辞書のデータ構成図である。 本実施形態に係る経済指標データのデータ構成図である。 本実施形態に係る販売実績データのデータ構成図である。 本実施形態に係る1月後予測モデルを説明するための図である。 本実施形態に係る1月後予測モデルを生成するための学習データである。 本実施形態に係る1月後特徴量重要度データベースのデータ構成図である。 本実施形態に係る予測結果データのデータ構成図である。 本実施形態に係る予測結果画面の画面構成図である。 本実施形態に係る予測結果画面の画面構成図である。 本実施形態に係る予測結果画面の画面構成図である。 本実施形態に係る予測モデル生成処理のフローチャートである。 本実施形態に係る予測処理のフローチャートである。 本実施形態に係る記録媒体を示す図である。
 以下に本発明を実施するための形態(実施形態)における需要予測装置(後記する図1参照)について説明する。本実施形態に係る需要予測装置は、乗用車の需要(販売台数、販売量)を予測する。予測に用いるデータとしては、当該乗用車に係るソーシャルメディアデータの他に、社会状況に係るデータとして株価指標などの経済状況に係るオープンデータを含む。ソーシャルメディアデータからは、需要予測の対象となる乗用車に係る特定の特徴語だけではなく、ソーシャルメディアの利用者である需要者(潜在需要者を含む)の感性情報も抽出される。感性情報としては、対象である乗用車に対する印象や好感度などがある。
 このように、ソーシャルメディアデータに含まれる特徴語の他に、需要者の感性情報や経済状況に係るデータを含めて予測することで、需要予測装置はより高精度に需要を予測できるようになる。
≪需要予測装置の構成≫
 図1は、本実施形態に係る需要予測装置100の機能ブロック図である。需要予測装置100は、ネットワーク490を介して販売ディーラサーバ410、ソーシャルメディアデータ提供サーバ420、およびオープンデータ提供サーバ430と接続されている。販売ディーラサーバ410には乗用車の販売実績が格納されている。また、ソーシャルメディアデータ提供サーバ420には乗用車に係るソーシャルメディアのテキストデータが蓄積されている。オープンデータ提供サーバ430には経済状況に係るオープンデータが蓄積されている。
 需要予測装置100はコンピュータであって、制御部110、記憶部130、および入出力部160を含んで構成される。入出力部160には、ディスプレイやキーボード、マウスなどのユーザインターフェイス機器が接続される。また、入出力部160はネットワーク490に接続され、販売ディーラサーバ410、ソーシャルメディアデータ提供サーバ420、およびオープンデータ提供サーバ430との通信データを送受信する。
 制御部110は、CPU(Central Processing Unit)を含んで構成される。制御部110は、データ取得部111、感性分析部112、カテゴリ分類部113、車種分析部114、データ結合部115、モデル生成部116、予測根拠算出部117、予測部118、地域別予測部119、および可視化部120を備える。
 記憶部130は、ROM(Read Only Memory)やRAM(Random Access Memory)、SSD(Solid State Drive)などの記憶装置から構成される。記憶部130には、メッセージデータベース210、感性辞書230、カテゴリ辞書240、経済指標データ250、販売実績データ260、プログラム138、学習データ300、1月後予測モデル131、2月後予測モデル132、3月後予測モデル133、1月後特徴量重要度データベース310、2月後特徴量重要度データベース320、3月後特徴量重要度データベース330、地域別割合予測モデル340、および予測結果データ380が記憶される。プログラム138は後記する予測モデル生成処理(図14参照)および予測処理(図15参照)の処理手順の記述を含む。
 なお、図1では、メッセージデータベース210、1月後特徴量重要度データベース310、2月後特徴量重要度データベース320、および3月後特徴量重要度データベース330は、それぞれメッセージDB(Database)、1月後特徴量重要度DB、2月後特徴量重要度DB、および3月後特徴量重要度DBと記している。
 以下、需要予測の処理順序に従って制御部110および記憶部130の構成要素を説明する。
≪ソーシャルメディアデータの取得処理≫
 データ取得部111はソーシャルメディアデータ提供サーバ420(図1参照)から、ソーシャルメディアに投稿されたメッセージ(第1のテキストデータ)を取得して、メッセージデータベース210(後記する図2参照)に格納する。図2は、本実施形態に係るメッセージデータベース210のデータ構成図である。メッセージデータベース210は、例えば表形式のデータであって、1つの行(レコード)は1つのメッセージ(第2のテキストデータ)を示す。レコードには、識別番号211(図2ではID(identifier)と記載)、投稿日時212、投稿者213、メッセージ214、車種215、感性216、感性詳細217、カテゴリ218、家計消費219、および株価220の列(属性)が含まれる。
 識別番号211は、メッセージの識別番号である。投稿日時212は、メッセージがソーシャルメディアに投稿された日時である。投稿者213は、メッセージを投稿したソーシャルメディア利用者(潜在需要者)の識別情報である。メッセージ214は、投稿されたメッセージ(テキストデータ)である。他の属性である車種215、感性216、感性詳細217、カテゴリ218、家計消費219、および株価220については後記する。
 データ取得部111は、ソーシャルメディアデータ提供サーバ420から取得したメッセージを、メッセージデータベース210の識別番号211、投稿日時212、投稿者213、およびメッセージ214の属性に格納する。
≪感性分析処理≫
 感性分析部112は図3に記載の感性辞書230を用いながら、メッセージ214(図2参照)の感性(投稿者の感性/感情)を分析する。図3は、本実施形態に係る感性辞書230のデータ構成図である。感性辞書230は、好悪や喜怒哀楽などの感情/感性に係る語の辞書である。感性辞書230は表形式のデータであって、1つの行(レコード)は見出し語231、感性232、および感性詳細233の列(属性)を含む。
 見出し語231は、感性辞書230の見出しとなる語である。感性232は、見出し語231の感性を示し、需要予測対象(乗用車)に対してプラスの感情(「好」)、マイナスの感情(「悪」)、および、プラスとマイナスの何れでもない(「他」)である。感性詳細233は感性232の内容を示し、「楽しい」、「褒め」、「満足」、「不満」、「反感」、「疑問」などである。レコード239は「厳しい」という語の感性232は「悪」であり、「不満」を意味していることを示している。
 感性分析部112は、メッセージ214に含まれる見出し語231を特定し、当該見出し語に対応する感性232および感性詳細233を、メッセージデータベース210(図2参照)の感性216および感性詳細217にそれぞれ格納する。
≪カテゴリ分類処理≫
 カテゴリ分類部113は図4に記載のカテゴリ辞書240を用いながら、メッセージ214(図2参照)をカテゴリに分類する。図4は、本実施形態に係るカテゴリ辞書240のデータ構成図である。カテゴリ辞書240は、メッセージ214(図2参照)に含まれる語のカテゴリを示す(カテゴリを付与するための)辞書である。カテゴリ辞書240は表形式のデータであって、1つの行(レコード)は代名詞241、名詞242、形容詞243、およびカテゴリ244の列(属性)を含む。
 代名詞241、名詞242、および形容詞243の属性の「-」は、メッセージ214に当該品詞の語が含まれないことを示し、「*」は当該品詞の語が含まれることを示す。また、語は当該品詞の当該語が含まれることを示す。レコード249は、メッセージ214に、代名詞241が含まれず、形容詞243が含まれ、名詞242としての「運転」が含まれる場合(パターン)には、当該メッセージ214のカテゴリ244は「乗り心地」となることを示している。
 カテゴリ分類部113は、メッセージ214がカテゴリ辞書240の何れかのレコードが示すパターンに合致する場合には、当該レコードのカテゴリ244をメッセージデータベース210(図2参照)のカテゴリ218に格納する。
 1つのメッセージ214がカテゴリ辞書240にある複数のレコード(パターン)を含む場合には、カテゴリ分類部113はカテゴリ218に該当する複数のカテゴリ244を格納する。または、カテゴリ分類部113はメッセージデータベース210に当該メッセージ214のレコードを追加して、複数の当該メッセージ214のレコードのカテゴリ218それぞれに1つずつカテゴリ244を格納するようにしてもよい。
≪車種分析処理、経済状況データ結合処理≫
 車種分析部114は、メッセージ214に需要予測対象の車種が含まれていれば、当該車種をメッセージデータベース210の車種215に格納する。
 データ取得部111はオープンデータ提供サーバ430(図1参照)から経済状況に係るデータとして家計消費と株価を取得して、経済指標データ250に格納する。図5は、本実施形態に係る経済指標データ250のデータ構成図である。経済指標データ250は表形式のデータであって、1つの行(レコード)は日別の経済指標を示し、年月日251、家計消費252、および株価253の列(属性)を含む。家計消費252は例えば、1世帯当たり1か月間の支出金額を日割りした金額である。家計消費252は、小売業の週別または日別POSデータと比例するように、週別または日別の支出金額を割り出した金額であってもよい。また、株価253は例えば、国内株式市場の年月日251の終値を示す。
 データ結合部115は、投稿日212(図2参照)に対応する年月日251を特定し、当該年月日251に対応する家計消費252および株価253をメッセージデータベース210の家計消費219および株価220にそれぞれ格納する。
 以上でメッセージデータベース210の全ての属性について説明した。
≪モデル生成処理≫
 データ取得部111は販売ディーラサーバ410(図1参照)から需要予測対象である乗用車に係るデータとして月別販売実績を取得して、販売実績データ260に格納する。図6は、本実施形態に係る販売実績データ260のデータ構成図である。販売実績データ260は表形式のデータであって、地域別・月別の販売実績を示す。1つの行(レコード)は地域261における月別の販売の実績262,264,266と、割合263,265,267とを示す。例えば、実績262は12月前の1月の実績であり、割合263は全地域における実績262が占める割合(単位は%)である。データ取得部111は、月別販売実績を販売ディーラサーバ410が取得して実績262,264,266に格納した後に、各実績の割合を計算して割合263,265,267に格納する。
 モデル生成部116は、メッセージデータベース210(第2のテキストデータ)を含むとともに販売実績データ260を含む学習データ(後記する図8参照)を用いて、1月後予測モデル131、2月後予測モデル132、および3月後予測モデル133を生成する。以下、1月後予測モデル131について説明する。
 図7は、本実施形態に係る1月後予測モデル131を説明するための図である。1月後予測モデル131は、メッセージデータベース210(図2参照)に含まれる1年間(第X月~第X+11月)のデータ210Aから翌月(第X+12月)の販売実績269を予測する機械学習モデルである。換言すれば、1月後予測モデル131は、メッセージデータベース210の1年間のデータ210Aを入力(説明変数)とし、翌月の販売実績269を出力(目的変数、予測結果)とする。モデル生成部116は、学習データ(後記する図8参照)を用いて機械学習技術の学習処理を行って1月後予測モデル131を生成する。なお、販売実績とは、販売実績データ260における実績262,264,266の全地域の合計である。
 図8は、本実施形態に係る1月後予測モデル131を生成するための学習データ300である。学習データ300には、過去における実績である入力と出力とのペアが複数含まれる。例えばペア301は、2010年1月から1年間のメッセージデータベース210(第2のテキストデータ)のデータ(入力)と、2011年1月の販売実績(正解ラベル、出力)とのペアである。学習データ300は、2010年1月~2020年11月のメッセージデータベース210のデータ、および2011年1月~2020年12月までの販売実績データから生成された120のペアを含んでいる。
 モデル生成部116は、学習データ300を教師データとして機械学習モデルを訓練して1月後予測モデル131を生成する。生成された1月後予測モデル131は、過去1年間のメッセージデータベース210のデータから、翌月の販売実績を予測するモデルである。2月後予測モデル132、および3月後予測モデル133についても同様である。2月後予測モデル132は、過去1年間のメッセージデータベース210のデータから、翌々月(2月後)の販売実績を予測するモデルである。また3月後予測モデル133は、過去1年間のメッセージデータベース210のデータから、3月後の販売実績を予測するモデルである。なお、1月後予測モデル131、2月後予測モデル132、および3月後予測モデル133を総称して予測モデルとも記す。
≪予測根拠算出処理≫
 予測根拠算出部117は、予測モデルそれぞれにおける特徴量重要度を算出する。特徴量重要度とは、予測モデルによる予測結果の算出にあたり特徴量を重要視している度合いを示し、Feature Importanceまたは Variable Importanceとも呼ばれる。予測根拠算出部117は特徴量について、予測モデルが重要視する度合い(特徴量重要度)を算出する。なお特徴量とは、入力の特徴量であり、本実施形態ではメッセージデータベース210(図2参照)の属性の値である。予測根拠算出部117は、1月後予測モデル131、2月後予測モデル132、および3月後予測モデル133について、それぞれ1月後特徴量重要度データベース310、2月後特徴量重要度データベース320、および3月後特徴量重要度データベース330を生成する。
 図9は、本実施形態に係る1月後特徴量重要度データベース310のデータ構成図である。1月後特徴量重要度データベース310は、1月後予測モデル131の特徴量重要度を示す表形式のデータであって、1つの行(レコード)は、順位311、重要度312、特徴量項目313、影響の方向314、および予測根拠315の列(属性)を含む。
 順位311は特徴量重要度の順位を示す。重要度312は特徴量重要度を示す。重要度312の合計は100となる。特徴量項目313は、特徴量の値であって、メッセージデータベース210の属性(属性名)とその値で示される。例えば「本文:A」はメッセージ214に「A」が含まれることを示し、「ユーザ名:U0031」は投稿者213が「U0031」であることを示す。
 影響の方向314は、特徴量項目313が予測結果(販売量)を増加/減少させる方向に影響するのか、影響がないのかを示す。予測根拠315は、後記する予測結果表示画面(図11~図13参照)に表示されるテキストであり、予測結果の根拠を説明するための説明文である。
≪需要の予測処理≫
 予測部118は、予測モデルを用いて需要(販売量)を予測し、予測結果を予測結果データ380に格納する。例えば予測部118は、過去1年のメッセージデータベース210のデータから1月後予測モデル131を用いて、翌月の販売量を予測する。
 図10は、本実施形態に係る予測結果データ380のデータ構成図である。予測結果データ380は、地域別および全地域での販売量の割合予測および販売予測を示す。予測結果データ380は表形式のデータであって、1つの行(レコード)は地域または全地域における割合と販売量の予測結果を示し、地域381、割合予測382,384,386、および販売予測383,385,387の列(属性)を含む。
 地域381は、地域名または全ての地域の和である「全地域」を示す。割合予測382,384,386は、後記する地域別予測部119が予測する地域381における販売量の割合である。地域381が「全地域」のレコードの割合予測382,384,386は100であり、「-」としている。地域381が「全地域」の販売予測383,385,387は、予測部118が予測して格納した翌月(1月後)、翌々月(2月後)、3月後の予測結果である。
 地域別予測部119は、地域別の販売量を予測する。詳しくは、地域別予測部119は地域別に、過去1年の販売の割合(図6の割合263,265,267参照)から翌月、翌々月および3月後の割合を予測する地域別割合予測モデル340(図1参照)を生成する。時系列分析では種々の予測手法が提案されており、地域別割合予測モデル340は例えばARIMAモデルである。
 続いて、地域別予測部119は、地域別割合予測モデル340を用いて、翌月、翌々月および3月後の割合を予測して、予測結果データの380に割合予測382,384,386に格納する。さらに地域別予測部119は、「全地域」の販売予測383,385,387に割合予測382,384,386を乗じた結果を地域別の販売予測383,385,387に格納する。販売予測383,385,387が、地域別予測部119が予測した地域別の翌月(1月後)、翌々月(2月後)、3月後の販売予測である。
≪予測結果表示処理≫
 可視化部120は、予測結果画面510,520,530(後記する図11~図13参照)を生成して入出力部160(図1参照)に接続されたディスプレイ(不図示)に出力する。図11は、本実施形態に係る予測結果画面510の画面構成図である。予測結果画面510は、グラフ511、プルダウンメニュー512、予測根拠513、およびメッセージ514を含む。
 グラフ511は棒グラフであって、地域別の今月の販売実績と1月後の販売予測と2月後の販売予測と3月後の販売予測とを示す。プルダウンメニュー512は、予測根拠表示月を選択するためのプルダウンメニューである。図11記載のプルダウンメニュー512では「3月後の予測根拠」が選択されており、予測根拠513は、3月後特徴量重要度データベース330(図1参照)における順位および予測根拠(図9記載の1月後特徴量重要度データベース310における順位311および予測根拠315参照)を示している。
 メッセージ514には、ポインタ515で指定された予測根拠に係るメッセージデータベース210(図2参照)のレコードの投稿日時212、投稿者213、およびメッセージ214が含まれる。図11では感性詳細217が「楽しい」という予測根拠が指定されており、これに相当するメッセージ214がメッセージ514に含まれる。予測結果画面510には、車種Aが「楽しい」車であり、販売量が増加する予測が示されている。
 図12は、本実施形態に係る予測結果画面520の画面構成図である。予測結果画面520の画面構成は、予測結果画面510(図11参照)と同様である。予測結果画面520は、車種Bは燃費が悪く、販売量が減少する予測が示されている。
 図13は、本実施形態に係る予測結果画面530の画面構成図である。予測結果画面530の画面構成は予測結果画面510とは異なり、メッセージ514に替わって経済指標534が表示される。これは、ポインタ535が指定する予測根拠が経済指標に係るためである。経済指標534として直近の月平均の株価が示され、合わせて販売実績と、株価(時系列データ)および販売実績の散布図とが示される。
 以上で、制御部110および記憶部130の構成要素の説明を終える。続いて、予測モデルの生成処理および予測処理を説明する。
≪予測モデル生成処理≫
 図14は、本実施形態に係る予測モデル生成処理のフローチャートである。予測モデル生成処理は所定のタイミングで、例えば毎月、実行される。
 ステップS11においてデータ取得部111は、ソーシャルメディアデータ提供サーバ420(図1参照)から投稿されたメッセージを取得して、メッセージデータベース210(図2参照)の識別番号211、投稿日212、投稿者213、およびメッセージ214に格納する。
 ステップS12において感性分析部112は、感性辞書230(図3参照)を用いてメッセージ214それぞれに感性216および感性詳細217を付与する。
 ステップS13においてカテゴリ分類部113は、カテゴリ辞書240(図4参照)を用いてメッセージ214それぞれにカテゴリ218を付与する。
 ステップS14において車種分析部114は、メッセージ214に含まれる車種を特定してメッセージ214それぞれに車種215に付与する。
 ステップS15においてデータ取得部111は、オープンデータ提供サーバ430(図1参照)から経済指標を取得して、経済指標データ250(図5参照)に格納する。
 ステップS16においてデータ結合部115は、投稿日212と年月日251との対応を取って、メッセージ214それぞれに家計消費219と株価220とを付与する。
 ステップS17においてデータ取得部111は販売ディーラサーバ410(図1参照)から需要予測対象である乗用車に係るデータとして月別販売実績を取得して、販売実績データ260(図6参照)に格納する。
 ステップS18においてモデル生成部116は、1月後予測モデル131、2月後予測モデル132、および3月後予測モデル133を生成するための学習データ(1月後予測モデル131を生成するための図8記載の学習データ300参照)をそれぞれ生成する。
 ステップS19においてモデル生成部116は、ステップS18で生成した学習データを用いて1月後予測モデル131、2月後予測モデル132、および3月後予測モデル133を生成する。
 ステップS20において予測根拠算出部117は、1月後予測モデル131、2月後予測モデル132、および3月後予測モデル133それぞれにおける特徴量重要度を算出する。算出した特徴量重要度は、1月後特徴量重要度データベース310、2月後特徴量重要度データベース320、および3月後特徴量重要度データベース330に格納される。
≪予測処理≫
 図15は、本実施形態に係る予測処理のフローチャートである。
 ステップS31においてデータ取得部111は、過去1年分のソーシャルメディアデータを取得する。
 ステップS32において、ステップS31で取得されたソーシャルメディアデータに特徴量が付与される。詳しくは、ステップS12~S16(図14参照)と同様にして、車種215、感性216、感性詳細217、カテゴリ218、家計消費219、および株価220が付与される。
 ステップS33において予測部118は、ステップS31で取得したデータから1月後予測モデル131、2月後予測モデル132、および3月後予測モデル133を用いて、1月後、2月後、3月後の販売量を予測(算出)して、予測結果データ380(図10参照)の「全地域」にあたるレコード389の販売予測383,385,387にそれぞれ格納する。
 ステップS34においてデータ取得部111は、販売実績データ260(図6参照)の販売の実績262,264,266から販売の割合263,265,267を算出する。
 ステップS35において地域別予測部119は、販売実績データ260の割合263,265,267から、1月後、2月後および3月後の割合を予測する地域別割合予測モデル340(図1参照)を生成する。
 ステップS36において地域別予測部119は、地域別割合予測モデル340を用いて、1月後、2月後および3月後の割合を予測して、予測結果データの380(図10参照)に割合予測382,384,386に格納する。
 ステップS37において地域別予測部119は、レコード389の販売予測383,385,387に割合予測382,384,386を乗じた結果を地域別の販売予測383,385,387に格納する。
 ステップS38において可視化部120は、予測結果画面510,520,530を入出力部160に接続されたディスプレイに出力する。
≪需要予測装置の特徴≫
 需要予測装置100はソーシャルメディアに投稿されたメッセージに感性やカテゴリ、経済状況に係る情報を付与したデータから、所定長として1月~3月後の販売量(需要、需要量)を予測する。予測には機械学習技術が用いられる。また、需要予測装置100は過去の地域別の販売量の割合から1月~3月後の販売量の割合を予測して、地域別の販売量を予測する。
 需要予測装置100はメッセージに含まれる語だけではなく、メッセージに含まれる感性情報やメッセージ投稿時の経済状況を含めて予測するため、予測精度が向上する。日々購入される消費財とは異なり、乗用車は高価であり経済状況の影響を受けやすい。予測の材料として経済状況を含めることで予測精度が向上する。
 需要予測装置100は予測結果を予測結果画面510,520,530(図11~図13参照)として表示する。予測結果画面510,520,530には予測結果である販売量の他に、予測根拠513,523,533が含まれる。需要予測装置100の利用者は、予測根拠や予測根拠に関連するメッセージを参照することで、予測の確からしさを確認できるようになる。
≪変形例:入力データ≫
 上記した実施形態では予測モデルの入力(説明変数)は、過去1年のメッセージデータベース210のデータであったが、1年とは限らず1年より長いまたは短い期間であってもよい。また、入力は感性やカテゴリ、経済状況に係る情報が付与されたメッセージであったが、さらに販売実績を加えてもよい。さらに、経済状況に係るデータは家計消費と株価に限らず、例えば消費者物価指数などの他のデータでもよい。
 経済状況の他に、需要対象の市場状況を加えてもよい。上記した実施形態では例えば、国内の乗用車全体の販売台数や車種別の販売台数を予測モデルの入力に加えてもよい。他に需要対象の競合品に係るメッセージや感性、カテゴリを市場状況として予測モデルの入力に加えてもよい。また、地域別割合予測モデル340の入力として地域別の販売台数や経済状況を加えてもよい。
≪変形例:感性分析≫
 上記した実施形態では需要予測装置100は、感性辞書(図3参照)を用いてメッセージ214(図2参照)に感性216、感性詳細217を付与している。他の手法を用いてもよい。例えば、ディープラーニングなどの手法で学習させたモデルによる感性分析結果を感性や感性詳細としてもよい。
≪変形例:カテゴリ≫
 上記した実施形態では需要予測装置100は、カテゴリ辞書(図4参照)を用いてメッセージ214(図2参照)にカテゴリ218を付与している。他の手法を用いてもよい。例えばメッセージをクラスタリングして分類して分類結果をカテゴリとして付与したり、Latent Dirichlet AllocationやLatent Semantic Indexなどの手法を用いてトピックを分析したりしてカテゴリとしてもよい。
≪プログラム≫
 上記した実施形態では、プログラム138は、コンピュータである需要予測装置100の記憶部130に記憶される。記録媒体にあるプログラムが読み込まれて、記憶部130にロードされて実行されてもよいし、記録媒体からインストールされて実行されてもよい。
 図16は、本実施形態に係る記録媒体を示す図である。記録媒体910からコンピュータ900に、インストールを行うことで、コンピュータ900が需要予測装置100として機能することができるようになる。なお、記録媒体910に限らずネットワークを経由してプログラム138がダウンロードされてインストールされてもよい。
≪その他変形例≫
 以上、本発明のいくつかの実施形態について説明したが、これらの実施形態は、例示に過ぎず、本発明の技術的範囲を限定するものではない。例えば上記した実施形態では、乗用車の販売台数(需要)を予測しているが、本発明は乗用車に限らない商品やサービスの販売量(需要)の予測に利用することができる。また、需要予測装置100は、予測モデルを生成して、当該予測モデルを用いて販売量を予測しているが、別の装置(予測モデル生成装置)で生成された予測モデルを用いるようにしてもよい。
 本発明はその他の様々な実施形態を取ることが可能であり、さらに、本発明の要旨を逸脱しない範囲で、省略や置換等種々の変更を行うことができる。これら実施形態やその変形は、本明細書等に記載された発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100 需要予測装置(予測モデル生成装置)
111 データ取得部
112 感性分析部
113 カテゴリ分類部
114 車種分析部
115 データ結合部
116 モデル生成部
117 予測根拠算出部
118 予測部
119 地域別予測部
120 可視化部
131 1月後予測モデル(予測モデル)
132 2月後予測モデル(予測モデル)
133 3月後予測モデル(予測モデル)
138 プログラム
210 メッセージデータベース(第2のテキストデータ)
214 メッセージ(第1のテキストデータ)
216 感性(感性情報)
217 感性詳細(感性情報)
218 カテゴリ
219 家計消費(経済状況)
220 株価(経済状況)
260 販売実績データ
310 1月後特徴量重要度データベース(特徴量重要度データベース)
311 順位(需要量へ影響を与える順番)
312 重要度(需要量へ影響度)
320 2月後特徴量重要度データベース(特徴量重要度データベース)
330 3月後特徴量重要度データベース(特徴量重要度データベース)
340 地域別割合予測モデル
380 予測結果データ
382,384,386 割合予測(販売比率)
383,385,387 販売予測(需要量)

Claims (9)

  1.  需要予測対象に係る潜在需要者が作成した第1のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第2のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて生成された予測モデルを用いて、前記需要予測対象の需要量を予測する予測部を備える
     ことを特徴とする需要予測装置。
  2.  前記予測部が予測する需要量は、所定長の1つ以上の期間それぞれの需要量である
     ことを特徴とする請求項1に記載の需要予測装置。
  3.  地域別の販売実績データから地域別の販売比率を予測し、当該販売比率と前記予測部が予測した需要量とから地域別の需要量を予測する地域別予測部をさらに備える
     ことを特徴とする請求項1に記載の需要予測装置。
  4.  前記第1のテキストデータに付与する感性情報、カテゴリ、および経済状況の前記需要量への影響度、または、前記需要量へ影響を与える順番を含む特徴量重要度データベースが記憶された記憶部を備えるとともに、
     前記需要量と、前記影響度または前記順番が高い前記第2のテキストデータの感性情報、カテゴリ、または経済状況とを出力する可視化部を備える
     ことを特徴とする請求項1に記載の需要予測装置。
  5.  前記可視化部は、出力した前記感性情報または前記カテゴリのなかで指定された感性情報またはカテゴリに係る前記第1のテキストデータを出力する
     ことを特徴とする請求項4に記載の需要予測装置。
  6.  前記可視化部は、出力した前記経済状況のなかで指定された経済状況に対応する時系列データを出力する
     ことを特徴とする請求項4に記載の需要予測装置。
  7.  需要予測装置の需要予測方法であって、
     前記需要予測装置は、
     需要予測対象に係る潜在需要者が作成した第1のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第2のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて生成された予測モデルを用いて、前記需要予測対象の需要量を予測するステップを実行する
     ことを特徴とする需要予測方法。
  8.  需要予測対象に係る潜在需要者が作成した第1のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第2のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて予測モデルを生成するモデル生成部を備える
     ことを特徴とする予測モデル生成装置。
  9.  前記予測モデルを用いて予測される前記需要予測対象の需要量について、前記第2のテキストデータの感性情報、カテゴリ、および経済状況の前記需要量への影響度、または、前記需要量へ影響を与える順番を算出する予測根拠算出部をさらに備える
     ことを特徴とする請求項8に記載の予測モデル生成装置。
PCT/JP2021/009237 2021-03-09 2021-03-09 需要予測装置、需要予測方法および予測モデル生成装置 WO2022190199A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/009237 WO2022190199A1 (ja) 2021-03-09 2021-03-09 需要予測装置、需要予測方法および予測モデル生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/009237 WO2022190199A1 (ja) 2021-03-09 2021-03-09 需要予測装置、需要予測方法および予測モデル生成装置

Publications (1)

Publication Number Publication Date
WO2022190199A1 true WO2022190199A1 (ja) 2022-09-15

Family

ID=83226409

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/009237 WO2022190199A1 (ja) 2021-03-09 2021-03-09 需要予測装置、需要予測方法および予測モデル生成装置

Country Status (1)

Country Link
WO (1) WO2022190199A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014229252A (ja) * 2013-05-27 2014-12-08 株式会社日立製作所 計算機、予測方法、及び、予測プログラム
JP2017102849A (ja) * 2015-12-04 2017-06-08 株式会社ニコン 電子機器
JP2020149468A (ja) * 2019-03-14 2020-09-17 株式会社日立製作所 商品管理システムおよび商品管理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014229252A (ja) * 2013-05-27 2014-12-08 株式会社日立製作所 計算機、予測方法、及び、予測プログラム
JP2017102849A (ja) * 2015-12-04 2017-06-08 株式会社ニコン 電子機器
JP2020149468A (ja) * 2019-03-14 2020-09-17 株式会社日立製作所 商品管理システムおよび商品管理方法

Similar Documents

Publication Publication Date Title
Keller et al. Measuring brand equity
Gao et al. Follow the herd or be myself? An analysis of consistency in behavior of reviewers and helpfulness of their reviews
Lilien et al. Principles of marketing engineering
Piris et al. Customer satisfaction and natural language processing
Rao Applied conjoint analysis
Du et al. Where did all that money go? Understanding how consumers allocate their consumption budget
Lilien et al. Marketing engineering: computer-assisted marketing analysis and planning
Verhoef Understanding the effect of customer relationship management efforts on customer retention and customer share development
Tang et al. A longitudinal exploration of the relations between electronic word-of-mouth indicators and firms’ profitability: Findings from the banking industry
US20050144106A1 (en) Method of and system for defining and measuring the real options of a commercial enterprise
Winter A cost-benefit approach to market segmentation
WO2015056360A1 (ja) 顧客データ分析・検証システム
JP2003524221A (ja) 刺激に対する人間の反応のシミュレーション方法
Lilien et al. Principles of marketing engineering and analytics
Grigsby Marketing analytics: A practical guide to real marketing science
Hong et al. Measuring product type with dynamics of online product review variances: A theoretical model and the empirical applications
Nandagopal et al. Research methods in business
Finlay Towards profitability: A utility approach to the credit scoring problem
Hazarika et al. Are numeric ratings true representations of reviews? A study of inconsistency between reviews and ratings
Tannady et al. Analysis of Service Quality to Increase Customer Satisfaction of Libro Café
WO2022190199A1 (ja) 需要予測装置、需要予測方法および予測モデル生成装置
Kang Advertising allocation and impact of advertising on event ticket sales: Which product, where, and when
Tekin et al. Big data concept in small and medium enterprises: how big data effects productivity
Kudyba Information creation through analytics
Ngobo et al. The influence of consumer confidence on inter-format competition: An analysis based on the French Consumer Confidence Index

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21930056

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21930056

Country of ref document: EP

Kind code of ref document: A1