WO2024014073A1 - モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラム - Google Patents

モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラム Download PDF

Info

Publication number
WO2024014073A1
WO2024014073A1 PCT/JP2023/014655 JP2023014655W WO2024014073A1 WO 2024014073 A1 WO2024014073 A1 WO 2024014073A1 JP 2023014655 W JP2023014655 W JP 2023014655W WO 2024014073 A1 WO2024014073 A1 WO 2024014073A1
Authority
WO
WIPO (PCT)
Prior art keywords
model
areas
area
candidate
model generation
Prior art date
Application number
PCT/JP2023/014655
Other languages
English (en)
French (fr)
Inventor
凜 利根川
茂樹 西村
剛志 八川
Original Assignee
住友電気工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 住友電気工業株式会社 filed Critical 住友電気工業株式会社
Publication of WO2024014073A1 publication Critical patent/WO2024014073A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B29/00Maps; Plans; Charts; Diagrams, e.g. route diagram

Definitions

  • the present disclosure relates to a model generation device, a model generation method, a demand prediction device, and a computer program.
  • Patent Document 1 describes a display control method for demand forecast information.
  • information regarding demand prediction for vehicle allocation in a target area is acquired for each address, and the acquired information regarding demand prediction for vehicle allocation is superimposed and displayed on a map screen for each address in the target area.
  • Patent Document 2 describes a device that predicts demand for taxis.
  • a prediction model used for taxi demand prediction is determined based on the number of people for each mesh at a plurality of times.
  • Patent Document 3 describes a demand prediction device for shared vehicles.
  • the demand forecasting device of Patent Document 3 uses reservation data indicating the reservation status, movement data indicating the area where the end user actually boarded and alighted on the day of operation, and boarding/alighting factor data that may be a factor in the occurrence of boarding and alighting by the end user on the day of operation.
  • boarding/alighting factor data may be a factor in the occurrence of boarding and alighting by the end user on the day of operation.
  • JP2020-71658A WO2018/154958 JP2020-30726A
  • the present disclosure aims to make it possible to generate multiple types of candidate models that differ in the range of areas where vehicle allocation can occur or in the total number of areas.
  • a device is a model generation device, and includes a first memory that stores instructions based on a user's input operation, and creates a candidate model used for vehicle dispatch demand prediction based on the instructions.
  • the instructions include area settings that allow the user to specify a range of areas where vehicle allocation can occur and a total number of the areas; In response to at least one of the range and the total number of areas being changed, the candidate model is created that is different from before the change.
  • the present disclosure can be realized not only as a system and a device having the above-described characteristic configurations, but also as a program for causing a computer to execute such characteristic configurations. Further, the present disclosure can be realized as a semiconductor integrated circuit that realizes part or all of a system and a device.
  • FIG. 1 is a block diagram showing an example of a demand forecasting system.
  • FIG. 2 is an explanatory diagram showing data exchange in the demand forecast model generation process.
  • FIG. 3 is a flowchart showing an example of the processing procedure of the model generation server.
  • FIG. 4 is an explanatory diagram illustrating an example of a method for evaluating the prediction accuracy of a candidate model.
  • FIG. 5 is a flowchart illustrating an example of model data creation processing.
  • FIG. 6 is a flowchart illustrating an example of candidate model creation processing.
  • a device is a model generation device, and includes a first memory that stores instructions based on a user's input operation, and candidates used for vehicle dispatch demand prediction based on the instructions. a first processor that creates a model; the instructions include area settings that allow the user to specify a range of areas where vehicle allocation can occur and a total number of the areas; In response to at least one of the range of the area and the total number of areas being changed, the candidate model that is different from before the change is created.
  • the first processor creates a candidate model that is different from before the change in response to at least one of the area range and the total number of areas being changed by the area setting. It is possible to generate multiple types of candidate models that differ in the range of areas or the total number of areas where vehicle allocation can occur. Therefore, by evaluating the prediction accuracy of the plurality of generated candidate models, the user can determine the influence of the range of areas or the total number of areas on the prediction accuracy.
  • the instruction includes a model type that allows the user to specify the type of algorithm of the candidate model, and the first processor specifies the algorithm type according to the model type.
  • the candidate model may be created that is different from before the change.
  • the first processor creates a different candidate model from before the change in response to the change in algorithm type depending on the model type, so it is possible to generate multiple types of candidate models with different algorithm types. . Therefore, by evaluating the prediction accuracy of the plurality of generated candidate models, the user can determine the influence that the type of model algorithm has on the prediction accuracy.
  • the first processor evaluates and evaluates the prediction accuracy of the plurality of candidate models having different ranges of the areas, total number of areas, or types of the algorithms. Based on the results, it may be determined which model to adopt among the plurality of candidate models. In this way, for example, by employing a candidate model with a good evaluation result and not employing a candidate model with a poor evaluation result, it is possible to prevent deterioration in prediction accuracy due to the employment of a candidate model with a poor evaluation result.
  • the area setting may be an input method that specifies a place name or lot number on an administrative division. If the above input method is adopted, the area range can be easily specified by simply inputting, for example, a place name or lot number on a command line.
  • the area setting may be an input method of specifying a range surrounded by manual input using a GUI on the digital map. good. If the above input method is adopted, the range of the area can be easily specified, for example, by handwriting using a mouse pointer or touch panel operation.
  • the input information for the plurality of candidate models having different ranges of the area, total number of areas, or types of the algorithm may include boarding time
  • the information may include identification information of the area including the boarding position, a time of getting off the vehicle, and identification information of the area including the getting off position. This is because this information is the minimum required information when forecasting demand for vehicle allocation.
  • input information for a plurality of candidate models having different ranges of areas, total number of areas, or types of algorithms may include climate and day of the week. It may include at least one of the following. This is because this information is considered to be a factor that can affect demand for vehicle dispatch.
  • a device is a demand forecasting device, and includes a second memory that stores a model used for forecasting demand for vehicle dispatch, and a second memory that performs the demand forecast using the stored model.
  • the model is created by the model generation device according to any one of (2) to (7) above, and has a plurality of models that differ in the range of the area, the total number of the areas, or the type of the algorithm. Among the candidate models, this is the model that is suitable for evaluating prediction accuracy.
  • the second processor selects one of the plurality of candidate models created by the model generation device according to any one of (2) to (7) above that is suitable for evaluation of prediction accuracy. Since the demand for vehicle allocation is predicted using the model, the demand for vehicle allocation can be predicted with higher accuracy than when an unsuitable model is used.
  • a method according to one aspect of the present embodiment is a model generation method executed by the model generation device according to any one of (1) to (7) above. Therefore, the model generation method of this embodiment has the same effects as any of the model generation apparatuses (1) to (7) described above.
  • a computer program according to one aspect of the present embodiment is a computer program for causing a computer to function as the model generation device according to any one of (1) to (7) above. Therefore, the computer program of this embodiment has the same effects as any of the model generation devices described in (1) to (7) above.
  • FIG. 1 is a block diagram showing an example of a demand forecasting system 100.
  • the demand prediction system 100 of this embodiment includes a model generation server 1, a vehicle allocation server 2, and an external server 3 other than these.
  • the external server 3 includes, for example, a weather server 31, a map server 32, an analysis server 33, and the like.
  • the model generation server 1 is a server that generates a model that can perform demand forecasting according to the request of an orderer, and provides the generated model to the orderer.
  • the operating entity (contractor) of the model generation server 1 is, for example, an IT (Information Technology) company that undertakes program creation including generation of a demand prediction model.
  • the model generation server 1 may be operated in either an on-premises server or a cloud server.
  • the orderer who requests generation of a demand forecasting model is the operator of the dispatch service. Further, it is assumed that the demand prediction model that the operating entity (order recipient) of the model generation server 1 generates as a product for the orderer is a model for predicting demand for dispatch of taxis and other business vehicles.
  • the vehicle allocation server 2 is a server that provides a vehicle allocation service for business vehicles.
  • the operating entity (orderer) of the vehicle dispatch server 2 is, for example, a company that performs vehicle dispatch operations such as a taxi company or a luggage transportation company, or an IT company that conducts an information provision business that includes agency of vehicle dispatch operations.
  • the operation format of the vehicle allocation server 2 may be either an on-premises server or a cloud server.
  • the weather server 31 is a server that can provide weather information such as current and future weather, temperature, and humidity.
  • the map server 32 is a server that can provide a digital map including node and link data corresponding to an actual road network.
  • the analysis server 33 is, for example, a server that provides academic numerical analysis software including machine learning such as MATLAB (registered trademark).
  • the model generation server 1 includes a control section 11, a storage section 12, a communication section 13, a source database (DB) 14, a general-purpose database (DB) 15, and a model database (DB) 16.
  • These databases 14, 15, and 16 are electronic data constructed in the storage unit 12 in a predetermined data arrangement. However, a part or all of these databases 14, 15, and 16 may be constructed in an external storage device (not shown) connected to the model generation server 1.
  • the control unit 11 is an arithmetic processing device including a first processor 11A and a volatile first memory 11B.
  • the first processor 11A includes one or more CPUs (Central Processing Units).
  • the first processor 11A may include an FPGA (Field-Programmable Gate Array) or the like.
  • the first processor 11A reads the computer program 17 stored in the storage unit 12 into the first memory 11B, and executes various information processing according to the program 17. This information processing includes the generation of a model for predicting demand for vehicle dispatch.
  • the control unit 11 of the model generation server 1 has a function as a "model generation device” that generates a model for predicting demand for vehicle allocation.
  • the storage unit 12 is, for example, an auxiliary storage device including nonvolatile memory such as an HDD (Hard Disk Drive) and an SSD (Solid State Drive).
  • the storage unit 12 may include a flash ROM (Read Only Memory), a USB (Universal Serial Bus) memory, an SD card, or the like.
  • the storage unit 12 may be composed of at least one recording medium exemplified above.
  • the communication unit 13 is a communication interface that allows communication via the public communication network 4 including the Internet, a mobile communication network, and the like.
  • the communication unit 13 receives performance data of business vehicles from the dispatch server 2, it inputs the received performance data to the control unit 11.
  • the control unit 11 records the input performance data in the source database 14 as source data.
  • control unit 11 When the control unit 11 generates a demand prediction model that is a model for predicting vehicle allocation demand, it outputs the generated demand prediction model and a data conversion tool to the communication unit 13.
  • the data conversion tool is a program for converting actual data into model data that can be applied to a demand forecasting model.
  • the demand forecast model and data conversion tool as a whole will be referred to as the "product program.”
  • the communication unit 13 transmits the input product program to the vehicle dispatch server 2.
  • the plurality of databases 14, 15, and 16 include the source database 14, the general-purpose database 15, and the model database 16.
  • the source database 14 records performance data provided from the vehicle allocation server 2. Actual data includes, for example, boarding time, alighting time, boarding position, alighting position, number of passengers, day of the week, mileage, toll rate, toll payment form, boarding fee, surcharge, tax amount, toll road toll, and surcharge. , surcharges, and total payment amount.
  • the general-purpose database 15 records general-purpose data that is considered to be commonly necessary for vehicle allocation demand forecasting, regardless of differences in model algorithms.
  • the general-purpose data recorded in the general-purpose database 15 includes, for example, boarding time, alighting time, boarding position, alighting position, day of the week, and weather (see FIG. 2).
  • the boarding position and the disembarking position are defined by latitude/longitude, for example. If the weather (rainy/sunny/cloudy/snow, etc.) does not exist in the performance data, it may be acquired from the weather server 31.
  • the model database 16 records different model data for each of a plurality of models.
  • the model data is, for example, data obtained by converting the general-purpose data boarding position and alighting position into identification information of a user-defined area including the position.
  • the vehicle allocation server 2 includes a control section 21, a storage section 22, a communication section 23, a performance database (DB) 24, and a model database (DB) 25.
  • These databases 24 and 25 are electronic data constructed in the storage unit 22 in a predetermined data arrangement. However, a part or all of these databases 24 and 25 may be constructed in an external storage device (not shown) connected to the vehicle allocation server 2.
  • the control unit 21 is an arithmetic processing device including a second processor 21A and a volatile second memory 21B.
  • the second processor 21A includes one or more CPUs.
  • the second processor 21A may include an FPGA or the like.
  • the second processor 21A reads the computer program 26 stored in the storage unit 22 into the second memory 21B, and executes various information processing according to the program 26. This information processing includes demand forecasting for vehicle dispatch using a demand forecasting model.
  • the control unit 21 of the vehicle allocation server 2 has a function as a "demand prediction device" that uses the model provided by the model generation server 1 to predict demand for vehicle allocation.
  • the storage unit 22 is, for example, an auxiliary storage device including nonvolatile memory such as an HDD and an SSD.
  • the storage unit 22 may include a flash ROM, a USB memory, an SD card, or the like.
  • the storage unit 22 may be composed of at least one recording medium exemplified above.
  • the communication unit 23 is a communication interface that allows communication via the public communication network 4 including the Internet, a mobile communication network, and the like.
  • the communication unit 23 receives performance data from a plurality of business vehicles (not shown) to be managed, the communication unit 23 transfers the received performance data to the control unit 21 .
  • the control unit 21 records the transferred performance data in the performance database 24.
  • the communication unit 23 Upon receiving the data request message from the model generation server 1, the communication unit 23 outputs the received message to the control unit 21. If the data request message includes a specified period, the control unit 11 instructs the communication unit 23 to read the performance data for the specified period from the performance database 24 and send the read performance data to the model generation server 1. do. As a result, performance data representing the dispatch performance of a plurality of business vehicles managed by the vehicle dispatch server 2 is provided to the contractor.
  • the communication unit 23 Upon receiving the product program from the model generation server 1, the communication unit 23 outputs the received product program to the control unit 21.
  • the control unit 11 stores the input product program in the storage unit 22 as a computer program 26 for predicting vehicle dispatch demand.
  • the product program includes demand forecasting models and data conversion tools.
  • the plurality of databases 24 and 25 include the performance database 24 and the model database 25.
  • the performance database 24 records performance data of all business vehicles to be managed. Actual data includes, for example, boarding time, alighting time, boarding position, alighting position, number of passengers, day of the week, mileage, toll rate, toll payment form, boarding fee, surcharge, tax amount, toll road toll, and surcharge. , surcharges, and total payment amount.
  • the model database 25 records model data generated by the data conversion tool. Specifically, the control unit 21 converts the performance data read from the performance database 24 into model data using a data conversion tool, and records the converted model data in the model database 25. Then, the control unit 21 executes prediction of vehicle allocation demand by inputting the model data read from the model database 25 into the demand prediction model.
  • FIG. 2 is an explanatory diagram showing the exchange of data in the process of generating a demand prediction model suitable for prediction of vehicle allocation demand by the vehicle allocation server 2.
  • the processes included in the "Model Generation Server” column are the processes performed by the first processor 11A of the control unit 11.
  • Devices included in the "other servers” column indicate servers other than the model generation server 1.
  • FIG. 3 is a flowchart showing an example of the processing procedure of the model generation server 1. As shown in FIG. 3, the processes executed by the first processor 11A of the model generation server 1 include the following six processes.
  • step ST11 Data storage (step ST11) 2) Data conversion (step ST12) 3) Creation of model data (step ST13) 4) Creation of candidate model (step ST14) 5) Training of candidate model (step ST15) 6) Evaluation of candidate models (step ST16)
  • step ST11 to ST16 processes with the same step numbers in FIG. 2 as well.
  • FIGS. 2 and 3 a description will be given of a demand prediction model generation process performed in cooperation with the model generation server 1, other servers, and users.
  • the processes included in the "input operation" column in FIG. 2 indicate instructions by the user's setting input using a command line, GUI (Graphical User Interface), or the like.
  • the user's instructions include, for example, item selection, area setting, model selection, training conditions, and evaluation period. These instructions are once stored in the first memory 11B, and the first processor 11A reads out the stored instructions from the first memory 11B and executes them.
  • the first processor 11A of the control unit 11 is the actual execution entity of the processing described with the control unit 11 as the subject.
  • step ST11 This process is a process of storing the performance data of business vehicles received from the dispatch server 2 in the source database 14 as is.
  • step ST12 This process is a process of converting performance data into general-purpose data GD and storing it in the general-purpose database 15. Specifically, the control unit 11 causes the first memory 11B to store data of the type specified by "item selection". Item selection means specifying an item of the general-purpose data GD from a plurality of items included in the source data 14, which is performance data.
  • the control unit 11 reads data of the stored type from the source database 14 and stores the data of the read type in the general-purpose database 15.
  • the items of the general-purpose data GD recorded in the general-purpose database 15 include, for example, boarding time, alighting time, boarding position, alighting position, day of the week, and weather.
  • the control unit 11 acquires the weather at the time corresponding to the boarding time from the weather server 31 and includes it in the general-purpose data GD.
  • step ST13 This process is a process of creating model data TD, which is data to be applied to a model candidate (hereinafter referred to as "candidate model M") for performing demand forecasting, from general-purpose data GD.
  • the identification information in this case, an identification number
  • the control unit 11 determines the total number n of the plurality of areas A in the digital map and the identification information j according to the input contents of the "area setting", and stores them in the first memory 11B.
  • Area A is a geographical range arbitrarily designated by the user as a unit in which the number of vehicles dispatched (for example, the same as the "number of passengers") can be aggregated, that is, a unit in which vehicle dispatch can occur.
  • a method for setting area Aj for example, any of the following methods may be adopted.
  • Setting method 1 Area setting using administrative divisions Setting method 1 is an input method that specifies place names or lot numbers in administrative divisions such as prefectures (states etc. overseas), cities, towns, villages, wards, and special wards. It is. In this case, the control unit 11 automatically assigns the identification number j of area A to a plurality of specified place names or lot numbers (for example, 23 wards of Tokyo, etc.).
  • the control unit 11 assigns the identification number j of the area Aj to the boarding position and the disembarking position of the general-purpose data GD, and creates model data TDi. Therefore, the model data TDi includes the boarding time, the alighting time, the boarding area ID, the alighting area ID, the day of the week, and the weather.
  • the boarding area ID is the identification number j of the area Aj that includes the boarding position
  • the alighting area ID is the identification number j of the area Aj that includes the boarding position.
  • the correspondence between the position and the area Aj is determined, for example, by map matching.
  • step ST14 This process is a process of determining the type of algorithm of the candidate model Mi in accordance with the type specified by "model selection”. Specifically, the control unit 11 acquires a specified type of model (learning device) from the analysis server 33, and stores it in the first memory 11B.
  • Model types that can be selected by model selection are not particularly limited as long as they can be used for demand forecasting, but for example, connected structure learning devices such as gradient boosting, neural networks, and random forests may be used. be able to.
  • the candidate model Mi created by the control unit 11 is a model whose input layer is model data TDi, and whose output layer is a predicted value of the number of vehicles dispatched for each area Aj that occurs during a predetermined period specified by the user.
  • the control unit 11 executes a training process (step ST15) for the candidate model Mi.
  • This process is a process of training the created candidate model Mi using the model data TDi.
  • the control unit 11 executes training of the candidate model Mi according to the contents of "training conditions" specified by the user.
  • the specified training conditions include the period of the model data TDi used for training the candidate model Mi (for example, the most recent three months from today).
  • the control unit 11 inputs data included in the period in which the boarding time and the disembarking time are specified out of the model data TDi included in the database 16 to the candidate model Mi, and trains the candidate model Mi.
  • the training conditions that can be specified may include specifying input nodes other than time and position (in this embodiment, day of the week and weather) among the input nodes of candidate model Mi. For example, if the weather is specified, the control unit 11 includes the weather in the input node of the candidate model Mi.
  • the control unit 11 continues training using an algorithm such as gradient descent or ensemble learning until the weights between the nodes constituting the candidate model Mi converge. Thereby, the candidate model Mi becomes a trained model.
  • control unit 11 executes evaluation processing (step ST16) for the candidate model Mi.
  • This process is a process of evaluating the prediction accuracy of the trained candidate model Mi based on predetermined evaluation criteria.
  • FIG. 4 is an explanatory diagram showing an example of a method for evaluating the prediction accuracy of the candidate model Mi.
  • the prediction accuracy of the candidate model Mi is evaluated, for example, by a "SMAPE (Symmetric Mean Absolute Percentage Error) value" defined by the illustrated calculation formula.
  • the control unit 11 drives the candidate models Mi on a trial basis for a period specified by the "evaluation period" (for example, the most recent week from today to the past), and calculates the SMAPE value of each candidate model Mi. calculate.
  • step ST17 determines that the candidate model Mi is suitable (step ST17), and ends the process. Conversely, if the SMAPE value exceeds the predetermined threshold, the control unit 11 determines that the candidate model Mi is unsuitable (step ST17), and returns the process to before step ST13.
  • the predetermined threshold TH for example, 3%
  • control unit 11 repeats the processing from step ST13 to step ST16 until a trained candidate model Mi whose evaluation in step ST16 is suitable is obtained.
  • a trained candidate model Mi whose evaluation in step ST16 is suitable is obtained.
  • the control unit 11 outputs at least one of the plurality of candidate models Mi that has been evaluated as suitable as a demand prediction model to be provided to the orderer.
  • the control unit 11 also generates a data conversion tool for converting actual data into model data TDi.
  • the demand prediction model provided to the orderer includes at least the candidate model Mi with the highest prediction accuracy. However, the candidate model Mi having the second or lower prediction accuracy may be included in the demand prediction model according to the request of the orderer.
  • Figures are shown for the actual number of dispatched vehicles and the predicted number of dispatched vehicles.
  • area A8 is a small island connected to the mainland by one bridge with area A7, so the traffic situation is very different from other areas A1, A2, A3, A4, A5, A6, and A7. It will be done. Therefore, in the case of an area including a small island or remote island that has a different traffic situation from the mainland, it is preferable to adopt an area setting where the small island or remote island is separated from the mainland and create a separate candidate model M2.
  • a candidate model M1 for the mainland whose target area is areas A1, A2, A3, A4, A5, A6, and A7 belonging to the mainland, and a candidate model M2 for the small island whose target area is area A8 of the small island. You can separate them and train both separately. In this way, the candidate model M2 for the small island will be trained in accordance with the traffic conditions unique to the small island, so each candidate model will be Models M1 and M2 can be trained appropriately.
  • FIG. 5 is a flowchart illustrating an example of a process for creating model data TDi.
  • the control unit 11 of the model generation server 1 determines whether or not the user has input area settings (step ST21), and if there is an input, the range and total number of areas A that have been input are determined.
  • the identification number j of area A is determined according to (step ST22).
  • the control unit 11 divides the six areas Aj included in the predetermined area B1 into A1, A2, A3, A4, Let them be A5 and A6. Furthermore, as in pattern 2, when an area Aj that divides the predetermined area B1 into a total of four areas is specified, the control unit 11 divides the four areas Aj included in the predetermined area B1 into A1, A2, A3, and A4. do.
  • the control unit 11 assigns area IDs to the boarding position P1 and the disembarking position P2 of the general-purpose data GD, and creates model data TDi (step ST23).
  • the area ID of the boarding position P1 is "1" and the area ID of the disembarking position P2 is "6".
  • the area ID of the boarding position P1 is "1” and the area ID of the disembarking position P2 is "4".
  • FIG. 6 is a flowchart illustrating an example of the candidate model Mi creation process.
  • the control unit 11 of the model generation server 1 determines whether there is an input for model selection by the user (step ST31), and if there is an input, the control unit 11 analyzes the learning device of the selected algorithm. server 33 (step ST32).
  • control unit 11 determines the input layer and output layer of the acquired learning device, and sets the determined learning device as the candidate model Mi (step ST33).
  • the input layer of the candidate model Mi is model data TDi
  • the output layer is a predicted value of the number of dispatched vehicles for each area Aj that occurs during a predetermined period specified by the user.
  • control unit 21 of the vehicle allocation server 2 may execute the generation of the demand prediction model by the control unit 11 of the model generation server 1.
  • the control unit 21 of the vehicle dispatch server 2 becomes a device that has both a vehicle dispatch function and a function as a model generation device.
  • Model generation server Vehicle allocation server 3 External server 4 Public communication network 11 Control unit (model generation device) 11A First processor 11B First memory 12 Storage unit 13 Communication unit 14 Source database 15 General-purpose database 16 Model database 17 Computer program 21 Control unit (demand prediction device) 21A Second processor 21B Second memory 22 Storage unit 23 Communication unit 24 Performance database 25 Model database 26 Computer program 31 Weather server 32 Map server 33 Analysis server 100 Demand prediction system

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本開示の一態様に係る装置は、モデル生成装置であって、ユーザの入力操作に基づく指示を記憶する第1メモリと、前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第1プロセッサと、を備え、前記指示は、配車が発生し得るエリアの範囲と総数を前記ユーザが指定可能なエリア設定を含み、前記第1プロセッサは、前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも1つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する。

Description

モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラム
 本開示は、モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラムに関する。
 特許文献1には、需要予測情報の表示制御方法が記載されている。
 特許文献1の表示制御方法では、対象地域における配車の需要予測に関する情報が番地単位で取得され、取得した配車の需要予測に関する情報が、対象地域の番地単位で地図画面に重畳表示される。
 特許文献2には、タクシーの需要予測を行う装置が記載されている。
 特許文献2の需要予測装置では、複数の時刻におけるメッシュごとの人数情報に基づいて、タクシーの需要予測に用いる予測モデルが決定される。
 特許文献3には、乗合車両用の需要予測装置が記載されている。
 特許文献3の需要予測装置では、予約状況を示す予約データと、運行当日にエンドユーザが実際に乗降したエリアを示す移動データと、運行当日におけるエンドユーザの乗降の発生要因になり得る乗降要因データと、を入力データとして機械学習させたニューラルネットワークを有するモデルを採用する。
特開2020-71658号公報 WO2018/154958 特開2020-30726号公報
 上述の特許文献では、配車が発生し得るエリアの範囲又はエリアの総数をユーザが変更できないため、エリアの範囲又はエリアの総数を変更した別のモデル(学習器)の予測精度を試すことは想定されていない。
 従って、例えば本土と離島を包含する地域、或いは、都市部と過疎地を包含する地域など、交通事情が異なる地域を画一的なエリアで区画するモデルを採用すると、予測精度が悪化するという問題がある。
 本開示は、かかる従来の問題点に鑑み、配車が発生し得るエリアの範囲又はエリアの総数が異なる複数種類の候補モデルを生成できるようにすることを目的とする。
 本開示の一態様に係る装置は、モデル生成装置であって、ユーザの入力操作に基づく指示を記憶する第1メモリと、前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第1プロセッサと、を備え、前記指示は、配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含み、前記第1プロセッサは、前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも1つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する。
 本開示は、上記のような特徴的な構成を備えるシステム及び装置として実現できるだけでなく、かかる特徴的な構成をコンピュータに実行させるためのプログラムとして実現することができる。また、本開示は、システム及び装置の一部又は全部を実現する半導体集積回路として実現することができる。
 本開示によれば、配車が発生し得るエリアの範囲又はエリアの総数が異なる複数種類の候補モデルを生成することができる。
図1は、需要予測システムの一例を示すブロック図である。 図2は、需要予測モデルの生成処理におけるデータのやり取りを示す説明図である。 図3は、モデル生成サーバの処理手順の一例を示すフローチャートである。 図4は、候補モデルの予測精度の評価方法の一例を示す説明図である。 図5は、モデル用データの作成処理の一例を示すフローチャートである。 図6は、候補モデルの作成処理の一例を示すフローチャートである。
<本開示の実施形態の概要> 
 以下、本開示の実施形態の概要を列記して説明する。
 (1) 本実施形態の一態様に係る装置は、モデル生成装置であって、ユーザの入力操作に基づく指示を記憶する第1メモリと、前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第1プロセッサと、を備え、前記指示は、配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含み、前記第1プロセッサは、前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも1つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する。
 本実施形態のモデル生成装置によれば、第1プロセッサが、エリア設定によりエリアの範囲とエリア総数のうちの少なくとも1つが変更されたことに応じて、変更前と異なる候補モデルを作成するので、配車が発生し得るエリアの範囲又はエリアの総数が異なる複数種類の候補モデルを生成することができる。
 従って、生成された複数種類の候補モデルの予測精度を評価することにより、エリアの範囲又はエリアの総数が予測精度に与える影響をユーザが判断することができる。
 (2) 上述の(1)のモデル生成装置において、前記指示は、前記候補モデルのアルゴリズムの種別を前記ユーザが指定可能なモデル種別を含み、前記第1プロセッサは、前記モデル種別により前記アルゴリズムの種別が変更されたことに応じて、変更前と異なる前記候補モデルを作成してもよい。
 この場合、第1プロセッサが、モデル種別によりアルゴリズムの種別が変更されたことに応じて、変更前と異なる候補モデルを作成するので、アルゴリズムの種別が異なる複数種類の候補モデルを生成することができる。
 従って、生成された複数種類の候補モデルの予測精度を評価することにより、モデルのアルゴリズムの種別が予測精度に与える影響をユーザが判断することができる。
 (3) 上述の(2)のモデル生成装置において、前記第1プロセッサは、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルの予測精度をそれぞれ評価し、評価結果に基づいて複数の前記候補モデルのうちのどのモデルを採用するかを決定してもよい。
 このようにすれば、例えば評価結果が良い候補モデルを採用し、評価結果が悪い候補モデルを採用しないことにより、評価結果が悪い候補モデルを採用することによる予測精度の悪化を防止できる。
 (4) 上述の(1)から(3)のいずれかのモデル生成装置において、前記エリア設定は、行政区画上の地名又は地番を指定する入力方式であってもよい。
 上記の入力方式を採用すれば、例えば地名又は地番をコマンドラインなどで入力するだけで、エリアの範囲を簡単に指定することができる。
 (5) 上述の(1)から(4)のいずれかのモデル生成装置において、前記エリア設定は、前記デジタル地図にGUIを用いた手入力により取り囲まれた範囲を指定する入力方式であってもよい。
 上記の入力方式を採用すれば、例えばマウスのポインタ又はタッチパネル操作によって手書きするだけで、エリアの範囲を簡単に指定することができる。
 (6) 上述の(2)から(5)のいずれかのモデル生成装置において、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルに対する入力情報は、乗車時刻、乗車位置を含む前記エリアの識別情報、降車時刻、及び、降車位置を含む前記エリアの識別情報を含んでもよい。
 これらの情報は、配車の需要予測を行う場合に最小限必要な情報だからである。
 (7) 上述の(2)から(6)のいずれかのモデル生成装置において、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルに対する入力情報は、気候及び曜日のうちの少なくとも1つを含んでもよい。
 これらの情報は、配車の需要に影響し得る要因と考えられるからである。
 (8) 本実施形態の別態様に係る装置は、需要予測装置であって、配車の需要予測に用いられるモデルを記憶する第2メモリと、記憶した前記モデルを用いて前記需要予測を行う第2プロセッサと、を備え、前記モデルは、上述の(2)から(7)のいずれかの前記モデル生成装置により作成された、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の候補モデルのうち、予測精度の評価に適合するモデルである。
 本実施形態の需要予測装置によれば、第2プロセッサが、上述の(2)から(7)のいずれかのモデル生成装置により作成された複数の候補モデルのうち、予測精度の評価に適合するモデルを用いて配車の需要予測を行うので、不適合のモデルを用いる場合に比べて、配車の需要予測を高精度で行うことができる。
 (9) 本実施形態の一態様に係る方法は、上述の(1)から(7)のいずれかのモデル生成装置が実行するモデル生成方法である。
 従って、本実施形態のモデル生成方法は、上述の(1)から(7)のいずれかのモデル生成装置と同様の作用効果を奏する。
 (10) 本実施形態の一態様に係るコンピュータプログラムは、上述の(1)から(7)のいずれかのモデル生成装置として、コンピュータを機能させるためのコンピュータプログラムである。
 従って、本実施形態のコンピュータプログラムは、上述の(1)から(7)のいずれかのモデル生成装置と同様の作用効果を奏する。
<本開示の実施形態の詳細>
 以下、図面を参照して、本開示の実施形態の詳細を説明する。なお、以下に記載する実施形態の少なくとも一部を任意に組み合わせてもよい。
 〔システムの構成例〕
 図1は、需要予測システム100の一例を示すブロック図である。
 図1に示すように、本実施形態の需要予測システム100は、モデル生成サーバ1、配車サーバ2、及びこれら以外の外部サーバ3を含む。外部サーバ3には、例えば気象サーバ31、マップサーバ32、及び解析用サーバ33などが含まれる。
 モデル生成サーバ1は、発注者の要望に応じた需要予測を実行可能なモデルを生成し、生成したモデルを発注者に提供するサーバである。
 モデル生成サーバ1の運用主体(受注者)は、例えば、需要予測モデルの生成を含むプログラム作成を請け負うIT(Information Technology)企業である。モデル生成サーバ1の運用形式は、オンプレミスサーバ及びクラウドサーバのいずれであってもよい。
 本実施形態では、需要予測モデルの生成を依頼する発注者は、配車サービスの運用主体であるとする。また、モデル生成サーバ1の運用主体(受注者)が発注者に製品として生成する需要予測モデルは、タクシーその他の業務車両に関する配車の需要予測を行うモデルであるとする。
 配車サーバ2は、業務車両の配車サービスを提供するサーバである。
 配車サーバ2の運用主体(発注者)は、例えば、タクシー会社又は荷物運送会社などの配車業務を行う企業、或いは、配車業務の代行を含む情報提供事業を行うIT企業などである。配車サーバ2の運用形式は、オンプレミスサーバ及びクラウドサーバのいずれであってもよい。
 気象サーバ31は、現時点及び将来の天候、気温及び湿度などの気象情報を提供可能なサーバである。マップサーバ32は、実際の道路網と対応するノードとリンクのデータを含むデジタル地図を提供可能なサーバである。
 解析用サーバ33は、例えば、MATLAB(登録商標)などの機械学習を含む学術用の数値解析ソフトウェアを提供するサーバである。
 〔モデル生成サーバの構成例〕
 図1に示すように、モデル生成サーバ1は、制御部11、記憶部12、通信部13、ソースデータベース(DB)14、汎用データベース(DB)15、及びモデル用データベース(DB)16を備える。
 これらのデータベース14,15,16は、記憶部12に所定のデータ配列で構築される電子データである。もっとも、これらのデータベース14,15,16の一部又は全部をモデル生成サーバ1に接続された外部記憶装置(図示せず)に構築してもよい。
 制御部11は、第1プロセッサ11Aと揮発性の第1メモリ11Bを含む演算処理装置である。第1プロセッサ11Aは、1又は複数のCPU(Central Processing Unit)を含む。第1プロセッサ11Aは、FPGA(Field-Programmable Gate Array)などを含んでよい。
 第1プロセッサ11Aは、記憶部12に格納されたコンピュータプログラム17を第1メモリ11Bに読み出し、当該プログラム17に従って各種の情報処理を実行する。この情報処理には、配車の需要予測のためのモデルの生成などが含まれる。
 従って、モデル生成サーバ1の制御部11は、配車の需要予測のためのモデルを生成する「モデル生成装置」としての機能を有する。
 記憶部12は、例えば、HDD(Hard Disk Drive)及びSSD(Solid State Drive)などの不揮発性メモリを含む補助記憶装置である。
 記憶部12は、フラッシュROM(Read Only Memory)、USB(Universal Serial Bus)メモリ、又はSDカードなどを含んでもよい。記憶部12は、上記に例示した少なくとも1つの記録媒体から構成されてもよい。
 通信部13は、インターネット及び移動体通信網などを含む公衆通信網4を介した通信が可能な通信インタフェースである。
 通信部13は、業務車両の実績データを配車サーバ2から受信すると、受信した実績データを制御部11に入力する。制御部11は、入力された実績データをソースデータとしてソースデータベース14に記録する。
 制御部11は、配車需要を予測するためのモデルである需要予測モデルを生成すると、生成した需要予測モデルとデータ変換ツールを通信部13に出力する。
 データ変換ツールは、実績データを需要予測モデルに適用可能なモデル用データに変換するためのプログラムである。以下、需要予測モデルとデータ変換ツールの総体を「製品プログラム」という。通信部13は、入力された製品プログラムを配車サーバ2に送信する。
 上述の通り複数のデータベース14,15,16には、ソースデータベース14、汎用データベース15、及びモデル用データベース16が含まれる。
 ソースデータベース14には、配車サーバ2から提供された実績データが記録される。実績データには、例えば、乗車時刻、降車時刻、乗車位置、降車位置、乗客数、曜日、走行距離、料金レート、料金支払い形態、乗車料金、追加料金、税額、有料道路の通行料金、割増し料金、サーチャージ、及び支払い総額などが含まれ得る。
 汎用データベース15には、ソースデータベース14に含まれるデータ種別のうち、モデルのアルゴリズムの相違に関係なく、配車の需要予測に共通して必要と考えられる汎用的な種別のデータが記録される。
 本実施形態では、汎用データベース15に記録される汎用データには、例えば、乗車時刻、降車時刻、乗車位置、降車位置、曜日、及び天候が含まれる(図2参照)。
 乗車位置と降車位置は、例えば緯度/経度で定義される。天候(雨/晴れ/曇り/雪など)が実績データに存在しない場合は、気象サーバ31から取得すればよい。
 モデル用データベース16には、複数のモデルごとにそれぞれ異なるモデル用データが記録される。モデル用データは、例えば、汎用データの乗車位置及び降車位置を、当該位置を含むユーザ定義によるエリアの識別情報に変換したデータである。
 〔配車サーバの構成例〕
 図1に示すように、配車サーバ2は、制御部21、記憶部22、通信部23、実績データベース(DB)24、及びモデル用データベース(DB)25を備える。
 これらのデータベース24,25は、記憶部22に所定のデータ配列で構築される電子データである。もっとも、これらのデータベース24,25の一部又は全部を配車サーバ2に接続された外部記憶装置(図示せず)に構築してもよい。
 制御部21は、第2プロセッサ21Aと揮発性の第2メモリ21Bを含む演算処理装置である。第2プロセッサ21Aは、1又は複数のCPUを含む。第2プロセッサ21Aは、FPGAなどを含んでよい。
 第2プロセッサ21Aは、記憶部22に格納されたコンピュータプログラム26を第2メモリ21Bに読み出し、当該プログラム26に従って各種の情報処理を実行する。この情報処理には、需要予測モデルを用いた配車の需要予測などが含まれる。
 従って、配車サーバ2の制御部21は、モデル生成サーバ1から提供されたモデルを用いて配車の需要予測を行う「需要予測装置」としての機能を有する。
 記憶部22は、例えば、HDD及びSSDなどの不揮発性メモリを含む補助記憶装置である。記憶部22は、フラッシュROM、USBメモリ、又はSDカードなどを含んでもよい。記憶部22は、上記に例示した少なくとも1つの記録媒体から構成されてもよい。
 通信部23は、インターネット及び移動体通信網などを含む公衆通信網4を介した通信が可能な通信インタフェースである。
 通信部23は、管理対象である複数の業務車両(図示せず)から実績データを受信すると、受信した実績データを制御部21に転送する。制御部21は、転送された実績データを実績データベース24に記録する。
 通信部23は、モデル生成サーバ1からデータ要求のメッセージを受信すると、受信したメッセージを制御部21に出力する。
 データ要求のメッセージに指定期間が含まれる場合、制御部11は、指定期間分の実績データを実績データベース24から読み出し、読み出した実績データをモデル生成サーバ1宛てに送信するように通信部23に指示する。これにより、配車サーバ2が管理する複数の業務車両の配車実績を表す実績データが受注者に提供される。
 通信部23は、モデル生成サーバ1から製品プログラムを受信すると、受信した製品プログラムを制御部21に出力する。
 この場合、制御部11は、入力された製品プログラムを配車需要の予測のためのコンピュータプログラム26として記憶部22に格納する。前述の通り、製品プログラムには、需要予測モデルとデータ変換ツールが含まれる。
 上述の通り、複数のデータベース24,25には、実績データベース24、及びモデル用データベース25が含まれる。
 実績データベース24には、管理対象のすべての業務車両の実績データが記録される。実績データには、例えば、乗車時刻、降車時刻、乗車位置、降車位置、乗客数、曜日、走行距離、料金レート、料金支払い形態、乗車料金、追加料金、税額、有料道路の通行料金、割増し料金、サーチャージ、及び支払い総額などが含まれ得る。
 モデル用データベース25には、データ変換ツールにより生成されたモデル用データが記録される。具体的には、制御部21は、実績データベース24から読み出した実績データをデータ変換ツールによりモデル用データに変換し、変換したモデル用データをモデル用データベース25に記録する。
 そして、制御部21は、モデル用データベース25から読み出したモデル用データを需要予測モデルに入力することにより、配車需要の予測を実行する。
 〔需要予測モデルの生成処理〕
 図2は、配車サーバ2による配車需要の予測に適した、需要予測モデルの生成処理におけるデータのやり取りを示す説明図である。
 図2において、「モデル生成サーバ」のコラムに含まれる処理は、制御部11の第1プロセッサ11Aが行う処理である。「他のサーバ」のコラムに含まれる装置は、モデル生成サーバ1以外のサーバを示す。
 図3は、モデル生成サーバ1の処理手順の一例を示すフローチャートである。
 図3に示すように、モデル生成サーバ1の第1プロセッサ11Aが実行する処理には、以下の6つの処理が含まれる。
 1)データ格納(ステップST11)
 2)データ変換(ステップST12)
 3)モデル用データの作成(ステップST13)
 4)候補モデルの作成(ステップST14)
 5)候補モデルの訓練(ステップST15)
 6)候補モデルの評価(ステップST16)
 図2及び図3を参照すれば明らかな通り、図3の上記の6つの処理(ステップST11からステップST16)は、図2においても同じステップ符号を付した処理として記載されている。
 以下、図2及び図3を参照しつつ、モデル生成サーバ1、他のサーバ、及びユーザにより協働して行われる、需要予測モデルの生成処理について説明する。
 図2における「入力操作」のコラムに含まれる処理は、コマンドライン又はGUI(Graphical User Interface)などを用いたユーザの設定入力による指示を示す。
 図2に示すように、ユーザによる指示には、例えば、項目選択、エリア設定、モデル選択、訓練条件、及び評価期間などが含まれる。これらの指示は、いったん第1メモリ11Bが記憶し、記憶された当該指示を第1プロセッサ11Aが第1メモリ11Bから読み出して実行する。なお、以下の説明において、制御部11を主語として記述される処理の実際の実行主体は、制御部11の第1プロセッサ11Aである。
 図2及び図3に示すように、モデル生成サーバ1の制御部11は、まず、データ格納処理(ステップST11)を実行する。
 この処理は、配車サーバ2から受信した業務車両の実績データを、ソースデータベース14にそのままの状態で格納する処理である。
 次に、制御部11は、データ変換処理(ステップST12)を実行する。
 この処理は、実績データを汎用データGDに変換して汎用データベース15に格納する処理である。具体的には、制御部11は、「項目選択」により指定された種別のデータを、第1メモリ11Bに記憶させる。項目選択とは、実績データであるソースデータ14に含まれる複数の項目から汎用データGDの項目を指定することである。
 従って、制御部11は、記憶した種別のデータをソースデータベース14から読み出し、読み出した種別のデータを汎用データベース15に格納する。ここでは、汎用データベース15に記録される汎用データGDの項目には、例えば、乗車時刻、降車時刻、乗車位置、降車位置、曜日、及び天候が含まれるものとする。
 なお、制御部11は、実績データに天候が含まれない場合は、例えば乗車時刻に対応する時点の天候を、気象サーバ31から取得して汎用データGDに含める。
 次に、制御部11は、モデル用データの作成処理(ステップST13)を実行する。
 この処理は、需要予測を行うモデルの候補(以下、「候補モデルM」という。)に適用するデータであるモデル用データTDを、汎用データGDから作成する処理である。
 以下、制御部11が作成する候補モデルMとモデル用データTDの識別情報(ここでは識別番号とする。)を「i」(i=1,2……m)とする。
 制御部11は、「エリア設定」の入力内容に応じて、デジタル地図における複数のエリアAの総数nと識別情報jを決定し、第1メモリ11Bに記憶させる。エリアAは、車両の配車数(例えば「乗者数」と同じ。)を集計可能な単位、すなわち、配車が発生し得る単位としてユーザが任意に指定する地理的範囲のことである。
 以下、エリアAの識別情報(ここでは識別番号とする。)を「j」(j=1,2……n)とする。エリアAjの設定方法としては、例えば以下の方法のいずれかを採用し得る。
 設定方法1:行政区画を利用したエリア設定
 設定方法1は、都道府県(海外では州など)、市、町、村、区、及び特別区などの行政区画上の地名又は地番を指定する入力方式である。
 この場合、制御部11は、指定された複数の地名又は地番(例えば東京都の23区など)に、エリアAの識別番号jを自動的に割り当てる。
 設定方法2:マップを用いたエリア設定
 マップサーバ32のデジタル地図に、GUIを用いた手入力にて取り囲まれた範囲を指定する入力方式である。この場合、制御部11は、地図上に指定された所定地域を区画する複数のエリアAに自動的に識別番号jを割り当てる。
 複数のエリアAjの設定が完了すると、制御部11は、汎用データGDの乗車位置と降車位置に、それぞれエリアAjの識別番号jを割り当てて、モデル用データTDiを作成する。従って、モデル用データTDiは、乗車時刻、降車時刻、乗車エリアID、降車エリアID、曜日、及び天候を含む。乗車エリアIDは、乗車位置を包含するエリアAjの識別番号jであり、降車エリアIDは、降車位置を包含するエリアAjの識別番号jである。位置とエリアAjの対応関係は、例えばマップマッチングにより決定される。
 次に、制御部11は、候補モデルの作成処理(ステップST14)を実行する。
 この処理は、「モデル選択」による種別の指定に応じて、候補モデルMiのアルゴリズムの種別を決定する処理である。
 具体的には、制御部11は、指定された種別のモデル(学習器)を解析用サーバ33から取得し、第1メモリ11Bに記憶させる。
 モデル選択により選択可能なモデル種別(アルゴリズムの種別)は、需要予測に使用可能であれば特に限定されないが、例えば、勾配ブースティング、ニューラルネットワーク、及びランダムフォレストなどの接続構造の学習器を採用することができる。
 制御部11が作成する候補モデルMiは、モデル用データTDiを入力層とし、ユーザが指定する所定期間において発生したエリアAjごとの配車数の予測値を出力層とするモデルである。
 次に、制御部11は、候補モデルMiの訓練処理(ステップST15)を実行する。
 この処理は、作成した候補モデルMiをモデル用データTDiにより訓練する処理である。具体的には、制御部11は、ユーザが指定する「訓練条件」の内容に応じて、候補モデルMiの訓練を実行する。指定される訓練条件には、候補モデルMiの訓練に使用するモデル用データTDiの期間(例えば、本日から過去に遡った直近3カ月間など)が含まれる。
 この場合、制御部11は、データベース16に含まれるモデル用データTDiのうち、乗車時刻及び降車時刻が指定された期間に含まれるデータを候補モデルMiに入力し、候補モデルMiを訓練する。
 指定可能な訓練条件には、候補モデルMiの入力ノードのうち、時刻と位置以外の入力ノード(本実施形態では曜日と天候)の指定が含まれていてもよい。例えば、天候が指定された場合、制御部11は、候補モデルMiの入力ノードに天候を含める。
 制御部11は、勾配降下法又はアンサンブル学習などのアルゴリズムにより、候補モデルMiを構成するノード間の重みなどが収束するまで訓練を継続する。これにより、候補モデルMiが学習済みのモデルとなる。
 次に、制御部11は、候補モデルMiの評価処理(ステップST16)を実行する。
 この処理は、訓練済みの候補モデルMiの予測精度を、所定の評価基準に基づいて評価する処理である。
 図4は、候補モデルMiの予測精度の評価方法の一例を示す説明図である。
 図4に示すように、候補モデルMiの予測精度は、例えば図示の算出式にて定義される「SMAPE(Symmetric mean absolute percentage error)値」により評価される。
 この場合、制御部11は、「評価期間」により指定された期間(例えば、本日から過去に遡った直近1週間など)だけ候補モデルMiを試験的に駆動し、各候補モデルMiのSMAPE値を算出する。
 図3に示すように、制御部11は、SMAPE値が所定の閾値TH(例えば3%)以下である場合は、候補モデルMiを適合と判定し(ステップST17)、処理を終了する。
 逆に、制御部11は、SMAPE値が所定の閾値を超える場合は、候補モデルMiを不適合と判定し(ステップST17)、処理をステップST13の前に戻す。
 従って、制御部11は、ステップST16の評価が適合となる学習済みの候補モデルMiが得られるまで、ステップST13からステップST16の処理を繰り返す。
 この場合、エリア設定によりエリアAjの範囲又は総数が変更されたり、或いは、モデル種別によりモデルの種別が変更されたりすると、異なる候補モデルMiが作成されるので、作成された異なる候補モデルMiに対する評価が繰り返されることになる。
 制御部11は、評価が適合である複数の候補モデルMiのうちの少なくとも1つを、発注者に提供する需要予測モデルとして出力する。
 また、制御部11は、需要予測モデルに加えて、実績データをモデル用データTDiに変換するためのデータ変換ツールを生成する。発注者に提供する需要予測モデルには、少なくとも、予測精度が最も高い候補モデルMiが含まれる。もっとも、発注者の求めに応じて、予測精度が2番目以下の候補モデルMiを需要予測モデルに含めてもよい。
 図4では、本土に属するエリアA1,A2,A3,A4,A5,A6,A7と離島に属するエリアA8を1つの対象地域とする候補モデルM1の場合における、エリアAj(j=1~8)ごとの実際の配車数と配車の予測数の数値が示されている。
 上記の候補モデルM1では、例えば、エリアA1の配車数R1(=100)と予測数Q1(=98)はほぼ等しく、エリアA3の配車数R3(=90)と予測数Q3(=95)もほぼ等しい。これに対し、エリアA8については、配車数R3(=30)と予測数Q3(=70)の差が大きい。
 その原因は、エリアA8は、エリアA7と1本の橋梁で本土と繋がる小島であるため、他のエリアA1,A2,A3,A4,A5,A6,A7とは交通事情が大きく異なるからと考えられる。
 従って、このような本土とは交通事情が異なる小島や離島などを含む地域の場合には、小島又は離島を本土と分離したエリア設定を採用して別個の候補モデルM2とすることが好ましい。
 具体的には、本土に属するエリアA1,A2,A3,A4,A5,A6,A7を対象地域とする本土用の候補モデルM1と、小島のエリアA8を対象地域とする小島用の候補モデルM2とに分離し、両者を個別に訓練すれば良い。
 このようにすれば、小島用の候補モデルM2は、小島特有の交通事情に応じた学習を行うことになるので、小島のエリアA8を本土側と区別しないエリア設定の場合に比べて、各候補モデルM1,M2を適切に訓練することができる。
 〔モデル用データの作成〕
 図5は、モデル用データTDiの作成処理の一例を示すフローチャートである。
 図5に示すように、モデル生成サーバ1の制御部11は、ユーザによるエリア設定の入力の有無を判定しており(ステップST21)、入力があった場合、入力されたエリアAの範囲と総数に応じてエリアAの識別番号jを決定する(ステップST22)。
 例えば、パターン1のように、所定地域B1を合計6つに区画するエリアAjが指定された場合、制御部11は、所定地域B1に含まれる6つのエリアAjをA1,A2,A3,A4,A5,A6とする。
 また、パターン2のように、所定地域B1を合計4つに区画するエリアAjが指定された場合、制御部11は、所定地域B1に含まれる4つのエリアAjをA1,A2,A3,A4とする。
 次に、制御部11は、汎用データGDの乗車位置P1と降車位置P2にエリアIDを割り当てて、モデル用データTDiを作成する(ステップST23)。
 この場合、例えばパターン1の場合は、乗車位置P1のエリアIDは「1」となり、降車位置P2のエリアIDは「6」となる。また、パターン2の場合は、乗車位置P1のエリアIDは「1」となり、降車位置P2のエリアIDは「4」となる。
 〔候補モデルの作成〕
 図6は、候補モデルMiの作成処理の一例を示すフローチャートである。
 図6に示すように、モデル生成サーバ1の制御部11は、ユーザによるモデル選択の入力の有無を判定しており(ステップST31)、入力があった場合、選択されたアルゴリズムの学習器を解析用サーバ33から取得する(ステップST32)。
 次に、制御部11は、取得した学習器の入力層と出力層を決定し、決定した学習器を候補モデルMiとする(ステップST33)。
 なお、候補モデルMiの入力層はモデル用データTDiであり、出力層は、ユーザが指定する所定期間において発生したエリアAjごとの配車数の予測値である。
 〔その他の変形例〕
 上述の実施形態(変形例を含む。)は、すべての点で例示であって制限的なものではない。本開示の権利範囲は請求の範囲によって示され、請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。
 例えば、上述の実施形態において、モデル生成サーバ1の制御部11による需要予測モデルの生成を配車サーバ2の制御部21が実行してもよい。この場合、配車サーバ2の制御部21は、配車機能とモデル生成装置としての機能を併有した装置となる。
 1 モデル生成サーバ
 2 配車サーバ
 3 外部サーバ
 4 公衆通信網
 11 制御部(モデル生成装置)
 11A 第1プロセッサ
 11B 第1メモリ
 12 記憶部
 13 通信部
 14 ソースデータベース
 15 汎用データベース
 16 モデル用データベース
 17 コンピュータプログラム
 21 制御部(需要予測装置)
 21A 第2プロセッサ
 21B 第2メモリ
 22 記憶部
 23 通信部
 24 実績データベース
 25 モデル用データベース
 26 コンピュータプログラム
 31 気象サーバ
 32 マップサーバ
 33 解析用サーバ
 100 需要予測システム

Claims (10)

  1.  モデル生成装置であって、
     ユーザの入力操作に基づく指示を記憶する第1メモリと、
     前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第1プロセッサと、を備え、
     前記指示は、
     配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含み、
     前記第1プロセッサは、
     前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも1つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する、モデル生成装置。
  2.  前記指示は、
     前記候補モデルのアルゴリズムの種別を前記ユーザが指定可能なモデル種別を含み、
     前記第1プロセッサは、
     前記モデル種別により前記アルゴリズムの種別が変更されたことに応じて、変更前と異なる前記候補モデルを作成する、請求項1に記載のモデル生成装置。
  3.  前記第1プロセッサは、
     前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルの予測精度をそれぞれ評価し、評価結果に基づいて複数の前記候補モデルのうちから少なくとも1つのモデルを選択する、請求項2に記載のモデル生成装置。
  4.  前記エリア設定は、
     行政区画上の地名又は地番を指定する入力方式である、請求項1から請求項3のいずれか1項に記載のモデル生成装置。
  5.  前記エリア設定は、
     デジタル地図にGUIを用いた手入力により取り囲まれた範囲を指定する入力方式である、請求項1から請求項4のいずれか1項に記載のモデル生成装置。
  6.  前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルに対する入力情報は、
     乗車時刻、乗車位置を含む前記エリアの識別情報、降車時刻、及び、降車位置を含む前記エリアの識別情報を含む、請求項2から請求項5のいずれか1項に記載のモデル生成装置。
  7.  前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルに対する入力情報は、
     気候及び曜日のうちの少なくとも1つを含む、請求項2から請求項6のいずれか1項に記載のモデル生成装置。
  8.  需要予測装置であって、
     配車の需要予測に用いられるモデルを記憶する第2メモリと、
     記憶した前記モデルを用いて前記需要予測を行う第2プロセッサと、を備え、
     前記モデルは、
     請求項2から請求項7のいずれか1項に記載の前記モデル生成装置により作成された、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の候補モデルのうち、予測精度の評価に適合するモデルである、需要予測装置。
  9.  モデル生成装置が実行するモデル生成方法であって、
     ユーザの入力操作に基づく指示であって、配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含む前記指示を記憶するステップと、
     前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成するステップと、
     前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも1つが変更されたことに応じて、変更前と異なる前記候補モデルを作成するステップと、を含む、モデル生成方法。
  10.  ユーザの入力操作に基づく指示を記憶する第1メモリと、
     前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第1プロセッサと、を備えるモデル生成装置として、コンピュータを機能させるためのコンピュータプログラムであって、
     前記指示は、
     配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含み、
     前記第1プロセッサは、
     前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも1つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する、コンピュータプログラム。
PCT/JP2023/014655 2022-07-14 2023-04-11 モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラム WO2024014073A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022-113089 2022-07-14
JP2022113089 2022-07-14

Publications (1)

Publication Number Publication Date
WO2024014073A1 true WO2024014073A1 (ja) 2024-01-18

Family

ID=89536463

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/014655 WO2024014073A1 (ja) 2022-07-14 2023-04-11 モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラム

Country Status (1)

Country Link
WO (1) WO2024014073A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017520068A (ja) * 2014-05-23 2017-07-20 データロボット, インコーポレイテッド 予測データ分析のためのシステムおよび技術
JP2019057310A (ja) * 2018-11-26 2019-04-11 シャープ株式会社 情報処理装置及び情報処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017520068A (ja) * 2014-05-23 2017-07-20 データロボット, インコーポレイテッド 予測データ分析のためのシステムおよび技術
JP2019057310A (ja) * 2018-11-26 2019-04-11 シャープ株式会社 情報処理装置及び情報処理方法

Similar Documents

Publication Publication Date Title
Iacono et al. A Markov chain model of land use change
Chiu et al. Dynamic traffic assignment: A primer (transportation research circular e-c153)
US20150269491A1 (en) Predicting arrival times of vehicles based upon observed schedule adherence
JP6895325B2 (ja) 交通需要予測装置、交通需要予測方法、及び交通需要予測プログラム
Si et al. A multi‐class transit assignment model for estimating transit passenger flows—a case study of Beijing subway network
JP6922132B2 (ja) 生成装置、生成方法及び生成プログラム
Sloboden et al. Traffic analysis toolbox volume xiv: Guidebook on the utilization of dynamic traffic assignment in modeling
Tavassoli et al. Calibrating a transit assignment model using smart card data in a large-scale multi-modal transit network
Saha et al. Network model for rural roadway tolling with pavement deterioration and repair
Jung et al. Assessment of the transit ridership prediction errors using AVL/APC data
WO2024014073A1 (ja) モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラム
Young et al. An automated online tool to forecast demand for new railway stations and analyse potential abstraction effects
Kamijo et al. Required simulated population ratios for valid assessment of shared autonomous vehicles’ impact using agent-based models
Huntsinger Transportation systems planning
Banos et al. Geographical information and urban transport systems
Nnene et al. BRT network design for transit cost reduction in Cape Town, South Africa
US20230289680A1 (en) Predicting and indexing infrastructure project requirements
JP4860273B2 (ja) デジタル道路地図におけるリンクの沿道状況区分判定方法及びプログラム
Jeihani et al. Transportation network modeling and calibration
Ocalir-Akunal A Web Based Decision Support System (DSS) for Individuals' Urban Travel Alternatives
Li et al. Effects of the built environment on travel distance in bus-oriented, medium-sized cities in China
Ma et al. Integration of Travel Demand Models with Operational Analysis Tools
Mirchandani et al. Model-based transportation policy analysis
Lieu A Roadmap for the Research, Development and Deployment of Traffic Estimation and Prediction Systems for Real-Time and Off-Line Applications
Morozov et al. Generative Methods for Planning Public Transportation Systems

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23839251

Country of ref document: EP

Kind code of ref document: A1