WO2024014073A1

WO2024014073A1 - モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラム

Info

Publication number: WO2024014073A1
Application number: PCT/JP2023/014655
Authority: WO
Inventors: 凜利根川; 茂樹西村; 剛志八川
Original assignee: 住友電気工業株式会社
Priority date: 2022-07-14
Filing date: 2023-04-11
Publication date: 2024-01-18

Abstract

本開示の一態様に係る装置は、モデル生成装置であって、ユーザの入力操作に基づく指示を記憶する第１メモリと、前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第１プロセッサと、を備え、前記指示は、配車が発生し得るエリアの範囲と総数を前記ユーザが指定可能なエリア設定を含み、前記第１プロセッサは、前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも１つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する。

Description

モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラム

　本開示は、モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラムに関する。

　特許文献１には、需要予測情報の表示制御方法が記載されている。
　特許文献１の表示制御方法では、対象地域における配車の需要予測に関する情報が番地単位で取得され、取得した配車の需要予測に関する情報が、対象地域の番地単位で地図画面に重畳表示される。

　特許文献２には、タクシーの需要予測を行う装置が記載されている。
　特許文献２の需要予測装置では、複数の時刻におけるメッシュごとの人数情報に基づいて、タクシーの需要予測に用いる予測モデルが決定される。

　特許文献３には、乗合車両用の需要予測装置が記載されている。
　特許文献３の需要予測装置では、予約状況を示す予約データと、運行当日にエンドユーザが実際に乗降したエリアを示す移動データと、運行当日におけるエンドユーザの乗降の発生要因になり得る乗降要因データと、を入力データとして機械学習させたニューラルネットワークを有するモデルを採用する。

特開２０２０－７１６５８号公報ＷＯ２０１８／１５４９５８特開２０２０－３０７２６号公報

　上述の特許文献では、配車が発生し得るエリアの範囲又はエリアの総数をユーザが変更できないため、エリアの範囲又はエリアの総数を変更した別のモデル（学習器）の予測精度を試すことは想定されていない。
　従って、例えば本土と離島を包含する地域、或いは、都市部と過疎地を包含する地域など、交通事情が異なる地域を画一的なエリアで区画するモデルを採用すると、予測精度が悪化するという問題がある。

　本開示は、かかる従来の問題点に鑑み、配車が発生し得るエリアの範囲又はエリアの総数が異なる複数種類の候補モデルを生成できるようにすることを目的とする。

　本開示の一態様に係る装置は、モデル生成装置であって、ユーザの入力操作に基づく指示を記憶する第１メモリと、前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第１プロセッサと、を備え、前記指示は、配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含み、前記第１プロセッサは、前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも１つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する。

　本開示は、上記のような特徴的な構成を備えるシステム及び装置として実現できるだけでなく、かかる特徴的な構成をコンピュータに実行させるためのプログラムとして実現することができる。また、本開示は、システム及び装置の一部又は全部を実現する半導体集積回路として実現することができる。

　本開示によれば、配車が発生し得るエリアの範囲又はエリアの総数が異なる複数種類の候補モデルを生成することができる。

図１は、需要予測システムの一例を示すブロック図である。図２は、需要予測モデルの生成処理におけるデータのやり取りを示す説明図である。図３は、モデル生成サーバの処理手順の一例を示すフローチャートである。図４は、候補モデルの予測精度の評価方法の一例を示す説明図である。図５は、モデル用データの作成処理の一例を示すフローチャートである。図６は、候補モデルの作成処理の一例を示すフローチャートである。

＜本開示の実施形態の概要＞　
　以下、本開示の実施形態の概要を列記して説明する。
　（１）　本実施形態の一態様に係る装置は、モデル生成装置であって、ユーザの入力操作に基づく指示を記憶する第１メモリと、前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第１プロセッサと、を備え、前記指示は、配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含み、前記第１プロセッサは、前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも１つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する。

　本実施形態のモデル生成装置によれば、第１プロセッサが、エリア設定によりエリアの範囲とエリア総数のうちの少なくとも１つが変更されたことに応じて、変更前と異なる候補モデルを作成するので、配車が発生し得るエリアの範囲又はエリアの総数が異なる複数種類の候補モデルを生成することができる。
　従って、生成された複数種類の候補モデルの予測精度を評価することにより、エリアの範囲又はエリアの総数が予測精度に与える影響をユーザが判断することができる。

　（２）　上述の（１）のモデル生成装置において、前記指示は、前記候補モデルのアルゴリズムの種別を前記ユーザが指定可能なモデル種別を含み、前記第１プロセッサは、前記モデル種別により前記アルゴリズムの種別が変更されたことに応じて、変更前と異なる前記候補モデルを作成してもよい。

　この場合、第１プロセッサが、モデル種別によりアルゴリズムの種別が変更されたことに応じて、変更前と異なる候補モデルを作成するので、アルゴリズムの種別が異なる複数種類の候補モデルを生成することができる。
　従って、生成された複数種類の候補モデルの予測精度を評価することにより、モデルのアルゴリズムの種別が予測精度に与える影響をユーザが判断することができる。

　（３）　上述の（２）のモデル生成装置において、前記第１プロセッサは、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルの予測精度をそれぞれ評価し、評価結果に基づいて複数の前記候補モデルのうちのどのモデルを採用するかを決定してもよい。
　このようにすれば、例えば評価結果が良い候補モデルを採用し、評価結果が悪い候補モデルを採用しないことにより、評価結果が悪い候補モデルを採用することによる予測精度の悪化を防止できる。

　（４）　上述の（１）から（３）のいずれかのモデル生成装置において、前記エリア設定は、行政区画上の地名又は地番を指定する入力方式であってもよい。
　上記の入力方式を採用すれば、例えば地名又は地番をコマンドラインなどで入力するだけで、エリアの範囲を簡単に指定することができる。

　（５）　上述の（１）から（４）のいずれかのモデル生成装置において、前記エリア設定は、前記デジタル地図にＧＵＩを用いた手入力により取り囲まれた範囲を指定する入力方式であってもよい。
　上記の入力方式を採用すれば、例えばマウスのポインタ又はタッチパネル操作によって手書きするだけで、エリアの範囲を簡単に指定することができる。

　（６）　上述の（２）から（５）のいずれかのモデル生成装置において、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルに対する入力情報は、乗車時刻、乗車位置を含む前記エリアの識別情報、降車時刻、及び、降車位置を含む前記エリアの識別情報を含んでもよい。
　これらの情報は、配車の需要予測を行う場合に最小限必要な情報だからである。

　（７）　上述の（２）から（６）のいずれかのモデル生成装置において、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルに対する入力情報は、気候及び曜日のうちの少なくとも１つを含んでもよい。
　これらの情報は、配車の需要に影響し得る要因と考えられるからである。

　（８）　本実施形態の別態様に係る装置は、需要予測装置であって、配車の需要予測に用いられるモデルを記憶する第２メモリと、記憶した前記モデルを用いて前記需要予測を行う第２プロセッサと、を備え、前記モデルは、上述の（２）から（７）のいずれかの前記モデル生成装置により作成された、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の候補モデルのうち、予測精度の評価に適合するモデルである。

　本実施形態の需要予測装置によれば、第２プロセッサが、上述の（２）から（７）のいずれかのモデル生成装置により作成された複数の候補モデルのうち、予測精度の評価に適合するモデルを用いて配車の需要予測を行うので、不適合のモデルを用いる場合に比べて、配車の需要予測を高精度で行うことができる。

　（９）　本実施形態の一態様に係る方法は、上述の（１）から（７）のいずれかのモデル生成装置が実行するモデル生成方法である。
　従って、本実施形態のモデル生成方法は、上述の（１）から（７）のいずれかのモデル生成装置と同様の作用効果を奏する。

　（１０）　本実施形態の一態様に係るコンピュータプログラムは、上述の（１）から（７）のいずれかのモデル生成装置として、コンピュータを機能させるためのコンピュータプログラムである。
　従って、本実施形態のコンピュータプログラムは、上述の（１）から（７）のいずれかのモデル生成装置と同様の作用効果を奏する。

＜本開示の実施形態の詳細＞
　以下、図面を参照して、本開示の実施形態の詳細を説明する。なお、以下に記載する実施形態の少なくとも一部を任意に組み合わせてもよい。

　〔システムの構成例〕
　図１は、需要予測システム１００の一例を示すブロック図である。
　図１に示すように、本実施形態の需要予測システム１００は、モデル生成サーバ１、配車サーバ２、及びこれら以外の外部サーバ３を含む。外部サーバ３には、例えば気象サーバ３１、マップサーバ３２、及び解析用サーバ３３などが含まれる。

　モデル生成サーバ１は、発注者の要望に応じた需要予測を実行可能なモデルを生成し、生成したモデルを発注者に提供するサーバである。
　モデル生成サーバ１の運用主体（受注者）は、例えば、需要予測モデルの生成を含むプログラム作成を請け負うＩＴ（Information Technology）企業である。モデル生成サーバ１の運用形式は、オンプレミスサーバ及びクラウドサーバのいずれであってもよい。

　本実施形態では、需要予測モデルの生成を依頼する発注者は、配車サービスの運用主体であるとする。また、モデル生成サーバ１の運用主体（受注者）が発注者に製品として生成する需要予測モデルは、タクシーその他の業務車両に関する配車の需要予測を行うモデルであるとする。

　配車サーバ２は、業務車両の配車サービスを提供するサーバである。
　配車サーバ２の運用主体（発注者）は、例えば、タクシー会社又は荷物運送会社などの配車業務を行う企業、或いは、配車業務の代行を含む情報提供事業を行うＩＴ企業などである。配車サーバ２の運用形式は、オンプレミスサーバ及びクラウドサーバのいずれであってもよい。

　気象サーバ３１は、現時点及び将来の天候、気温及び湿度などの気象情報を提供可能なサーバである。マップサーバ３２は、実際の道路網と対応するノードとリンクのデータを含むデジタル地図を提供可能なサーバである。
　解析用サーバ３３は、例えば、ＭＡＴＬＡＢ（登録商標）などの機械学習を含む学術用の数値解析ソフトウェアを提供するサーバである。

　〔モデル生成サーバの構成例〕
　図１に示すように、モデル生成サーバ１は、制御部１１、記憶部１２、通信部１３、ソースデータベース（ＤＢ）１４、汎用データベース（ＤＢ）１５、及びモデル用データベース（ＤＢ）１６を備える。
　これらのデータベース１４，１５，１６は、記憶部１２に所定のデータ配列で構築される電子データである。もっとも、これらのデータベース１４，１５，１６の一部又は全部をモデル生成サーバ１に接続された外部記憶装置（図示せず）に構築してもよい。

　制御部１１は、第１プロセッサ１１Ａと揮発性の第１メモリ１１Ｂを含む演算処理装置である。第１プロセッサ１１Ａは、１又は複数のＣＰＵ（Central Processing Unit）を含む。第１プロセッサ１１Ａは、ＦＰＧＡ（Field-Programmable Gate Array）などを含んでよい。
　第１プロセッサ１１Ａは、記憶部１２に格納されたコンピュータプログラム１７を第１メモリ１１Ｂに読み出し、当該プログラム１７に従って各種の情報処理を実行する。この情報処理には、配車の需要予測のためのモデルの生成などが含まれる。

　従って、モデル生成サーバ１の制御部１１は、配車の需要予測のためのモデルを生成する「モデル生成装置」としての機能を有する。
　記憶部１２は、例えば、ＨＤＤ（Hard Disk Drive）及びＳＳＤ（Solid State Drive）などの不揮発性メモリを含む補助記憶装置である。
　記憶部１２は、フラッシュＲＯＭ（Read Only Memory）、ＵＳＢ（Universal Serial Bus）メモリ、又はＳＤカードなどを含んでもよい。記憶部１２は、上記に例示した少なくとも１つの記録媒体から構成されてもよい。

　通信部１３は、インターネット及び移動体通信網などを含む公衆通信網４を介した通信が可能な通信インタフェースである。
　通信部１３は、業務車両の実績データを配車サーバ２から受信すると、受信した実績データを制御部１１に入力する。制御部１１は、入力された実績データをソースデータとしてソースデータベース１４に記録する。

　制御部１１は、配車需要を予測するためのモデルである需要予測モデルを生成すると、生成した需要予測モデルとデータ変換ツールを通信部１３に出力する。
　データ変換ツールは、実績データを需要予測モデルに適用可能なモデル用データに変換するためのプログラムである。以下、需要予測モデルとデータ変換ツールの総体を「製品プログラム」という。通信部１３は、入力された製品プログラムを配車サーバ２に送信する。

　上述の通り複数のデータベース１４，１５，１６には、ソースデータベース１４、汎用データベース１５、及びモデル用データベース１６が含まれる。
　ソースデータベース１４には、配車サーバ２から提供された実績データが記録される。実績データには、例えば、乗車時刻、降車時刻、乗車位置、降車位置、乗客数、曜日、走行距離、料金レート、料金支払い形態、乗車料金、追加料金、税額、有料道路の通行料金、割増し料金、サーチャージ、及び支払い総額などが含まれ得る。

　汎用データベース１５には、ソースデータベース１４に含まれるデータ種別のうち、モデルのアルゴリズムの相違に関係なく、配車の需要予測に共通して必要と考えられる汎用的な種別のデータが記録される。
　本実施形態では、汎用データベース１５に記録される汎用データには、例えば、乗車時刻、降車時刻、乗車位置、降車位置、曜日、及び天候が含まれる（図２参照）。

　乗車位置と降車位置は、例えば緯度／経度で定義される。天候（雨／晴れ／曇り／雪など）が実績データに存在しない場合は、気象サーバ３１から取得すればよい。
　モデル用データベース１６には、複数のモデルごとにそれぞれ異なるモデル用データが記録される。モデル用データは、例えば、汎用データの乗車位置及び降車位置を、当該位置を含むユーザ定義によるエリアの識別情報に変換したデータである。

　〔配車サーバの構成例〕
　図１に示すように、配車サーバ２は、制御部２１、記憶部２２、通信部２３、実績データベース（ＤＢ）２４、及びモデル用データベース（ＤＢ）２５を備える。
　これらのデータベース２４，２５は、記憶部２２に所定のデータ配列で構築される電子データである。もっとも、これらのデータベース２４，２５の一部又は全部を配車サーバ２に接続された外部記憶装置（図示せず）に構築してもよい。

　制御部２１は、第２プロセッサ２１Ａと揮発性の第２メモリ２１Ｂを含む演算処理装置である。第２プロセッサ２１Ａは、１又は複数のＣＰＵを含む。第２プロセッサ２１Ａは、ＦＰＧＡなどを含んでよい。
　第２プロセッサ２１Ａは、記憶部２２に格納されたコンピュータプログラム２６を第２メモリ２１Ｂに読み出し、当該プログラム２６に従って各種の情報処理を実行する。この情報処理には、需要予測モデルを用いた配車の需要予測などが含まれる。

　従って、配車サーバ２の制御部２１は、モデル生成サーバ１から提供されたモデルを用いて配車の需要予測を行う「需要予測装置」としての機能を有する。
　記憶部２２は、例えば、ＨＤＤ及びＳＳＤなどの不揮発性メモリを含む補助記憶装置である。記憶部２２は、フラッシュＲＯＭ、ＵＳＢメモリ、又はＳＤカードなどを含んでもよい。記憶部２２は、上記に例示した少なくとも１つの記録媒体から構成されてもよい。

　通信部２３は、インターネット及び移動体通信網などを含む公衆通信網４を介した通信が可能な通信インタフェースである。
　通信部２３は、管理対象である複数の業務車両（図示せず）から実績データを受信すると、受信した実績データを制御部２１に転送する。制御部２１は、転送された実績データを実績データベース２４に記録する。

　通信部２３は、モデル生成サーバ１からデータ要求のメッセージを受信すると、受信したメッセージを制御部２１に出力する。
　データ要求のメッセージに指定期間が含まれる場合、制御部１１は、指定期間分の実績データを実績データベース２４から読み出し、読み出した実績データをモデル生成サーバ１宛てに送信するように通信部２３に指示する。これにより、配車サーバ２が管理する複数の業務車両の配車実績を表す実績データが受注者に提供される。

　通信部２３は、モデル生成サーバ１から製品プログラムを受信すると、受信した製品プログラムを制御部２１に出力する。
　この場合、制御部１１は、入力された製品プログラムを配車需要の予測のためのコンピュータプログラム２６として記憶部２２に格納する。前述の通り、製品プログラムには、需要予測モデルとデータ変換ツールが含まれる。

　上述の通り、複数のデータベース２４，２５には、実績データベース２４、及びモデル用データベース２５が含まれる。
　実績データベース２４には、管理対象のすべての業務車両の実績データが記録される。実績データには、例えば、乗車時刻、降車時刻、乗車位置、降車位置、乗客数、曜日、走行距離、料金レート、料金支払い形態、乗車料金、追加料金、税額、有料道路の通行料金、割増し料金、サーチャージ、及び支払い総額などが含まれ得る。

　モデル用データベース２５には、データ変換ツールにより生成されたモデル用データが記録される。具体的には、制御部２１は、実績データベース２４から読み出した実績データをデータ変換ツールによりモデル用データに変換し、変換したモデル用データをモデル用データベース２５に記録する。
　そして、制御部２１は、モデル用データベース２５から読み出したモデル用データを需要予測モデルに入力することにより、配車需要の予測を実行する。

　〔需要予測モデルの生成処理〕
　図２は、配車サーバ２による配車需要の予測に適した、需要予測モデルの生成処理におけるデータのやり取りを示す説明図である。
　図２において、「モデル生成サーバ」のコラムに含まれる処理は、制御部１１の第１プロセッサ１１Ａが行う処理である。「他のサーバ」のコラムに含まれる装置は、モデル生成サーバ１以外のサーバを示す。

　図３は、モデル生成サーバ１の処理手順の一例を示すフローチャートである。
　図３に示すように、モデル生成サーバ１の第１プロセッサ１１Ａが実行する処理には、以下の６つの処理が含まれる。

　１）データ格納（ステップＳＴ１１）
　２）データ変換（ステップＳＴ１２）
　３）モデル用データの作成（ステップＳＴ１３）
　４）候補モデルの作成（ステップＳＴ１４）
　５）候補モデルの訓練（ステップＳＴ１５）
　６）候補モデルの評価（ステップＳＴ１６）

　図２及び図３を参照すれば明らかな通り、図３の上記の６つの処理（ステップＳＴ１１からステップＳＴ１６）は、図２においても同じステップ符号を付した処理として記載されている。
　以下、図２及び図３を参照しつつ、モデル生成サーバ１、他のサーバ、及びユーザにより協働して行われる、需要予測モデルの生成処理について説明する。

　図２における「入力操作」のコラムに含まれる処理は、コマンドライン又はＧＵＩ（Graphical User Interface）などを用いたユーザの設定入力による指示を示す。
　図２に示すように、ユーザによる指示には、例えば、項目選択、エリア設定、モデル選択、訓練条件、及び評価期間などが含まれる。これらの指示は、いったん第１メモリ１１Ｂが記憶し、記憶された当該指示を第１プロセッサ１１Ａが第１メモリ１１Ｂから読み出して実行する。なお、以下の説明において、制御部１１を主語として記述される処理の実際の実行主体は、制御部１１の第１プロセッサ１１Ａである。

　図２及び図３に示すように、モデル生成サーバ１の制御部１１は、まず、データ格納処理（ステップＳＴ１１）を実行する。
　この処理は、配車サーバ２から受信した業務車両の実績データを、ソースデータベース１４にそのままの状態で格納する処理である。

　次に、制御部１１は、データ変換処理（ステップＳＴ１２）を実行する。
　この処理は、実績データを汎用データＧＤに変換して汎用データベース１５に格納する処理である。具体的には、制御部１１は、「項目選択」により指定された種別のデータを、第１メモリ１１Ｂに記憶させる。項目選択とは、実績データであるソースデータ１４に含まれる複数の項目から汎用データＧＤの項目を指定することである。

　従って、制御部１１は、記憶した種別のデータをソースデータベース１４から読み出し、読み出した種別のデータを汎用データベース１５に格納する。ここでは、汎用データベース１５に記録される汎用データＧＤの項目には、例えば、乗車時刻、降車時刻、乗車位置、降車位置、曜日、及び天候が含まれるものとする。
　なお、制御部１１は、実績データに天候が含まれない場合は、例えば乗車時刻に対応する時点の天候を、気象サーバ３１から取得して汎用データＧＤに含める。

　次に、制御部１１は、モデル用データの作成処理（ステップＳＴ１３）を実行する。
　この処理は、需要予測を行うモデルの候補（以下、「候補モデルＭ」という。）に適用するデータであるモデル用データＴＤを、汎用データＧＤから作成する処理である。
　以下、制御部１１が作成する候補モデルＭとモデル用データＴＤの識別情報（ここでは識別番号とする。）を「ｉ」（ｉ＝１，２……ｍ）とする。

　制御部１１は、「エリア設定」の入力内容に応じて、デジタル地図における複数のエリアＡの総数ｎと識別情報ｊを決定し、第１メモリ１１Ｂに記憶させる。エリアＡは、車両の配車数（例えば「乗者数」と同じ。）を集計可能な単位、すなわち、配車が発生し得る単位としてユーザが任意に指定する地理的範囲のことである。
　以下、エリアＡの識別情報（ここでは識別番号とする。）を「ｊ」（ｊ＝１，２……ｎ）とする。エリアＡｊの設定方法としては、例えば以下の方法のいずれかを採用し得る。

　設定方法１：行政区画を利用したエリア設定
　設定方法１は、都道府県（海外では州など）、市、町、村、区、及び特別区などの行政区画上の地名又は地番を指定する入力方式である。
　この場合、制御部１１は、指定された複数の地名又は地番（例えば東京都の２３区など）に、エリアＡの識別番号ｊを自動的に割り当てる。

　設定方法２：マップを用いたエリア設定
　マップサーバ３２のデジタル地図に、ＧＵＩを用いた手入力にて取り囲まれた範囲を指定する入力方式である。この場合、制御部１１は、地図上に指定された所定地域を区画する複数のエリアＡに自動的に識別番号ｊを割り当てる。

　複数のエリアＡｊの設定が完了すると、制御部１１は、汎用データＧＤの乗車位置と降車位置に、それぞれエリアＡｊの識別番号ｊを割り当てて、モデル用データＴＤｉを作成する。従って、モデル用データＴＤｉは、乗車時刻、降車時刻、乗車エリアＩＤ、降車エリアＩＤ、曜日、及び天候を含む。乗車エリアＩＤは、乗車位置を包含するエリアＡｊの識別番号ｊであり、降車エリアＩＤは、降車位置を包含するエリアＡｊの識別番号ｊである。位置とエリアＡｊの対応関係は、例えばマップマッチングにより決定される。

　次に、制御部１１は、候補モデルの作成処理（ステップＳＴ１４）を実行する。
　この処理は、「モデル選択」による種別の指定に応じて、候補モデルＭｉのアルゴリズムの種別を決定する処理である。
　具体的には、制御部１１は、指定された種別のモデル（学習器）を解析用サーバ３３から取得し、第１メモリ１１Ｂに記憶させる。

　モデル選択により選択可能なモデル種別（アルゴリズムの種別）は、需要予測に使用可能であれば特に限定されないが、例えば、勾配ブースティング、ニューラルネットワーク、及びランダムフォレストなどの接続構造の学習器を採用することができる。
　制御部１１が作成する候補モデルＭｉは、モデル用データＴＤｉを入力層とし、ユーザが指定する所定期間において発生したエリアＡｊごとの配車数の予測値を出力層とするモデルである。

　次に、制御部１１は、候補モデルＭｉの訓練処理（ステップＳＴ１５）を実行する。
　この処理は、作成した候補モデルＭｉをモデル用データＴＤｉにより訓練する処理である。具体的には、制御部１１は、ユーザが指定する「訓練条件」の内容に応じて、候補モデルＭｉの訓練を実行する。指定される訓練条件には、候補モデルＭｉの訓練に使用するモデル用データＴＤｉの期間（例えば、本日から過去に遡った直近３カ月間など）が含まれる。

　この場合、制御部１１は、データベース１６に含まれるモデル用データＴＤｉのうち、乗車時刻及び降車時刻が指定された期間に含まれるデータを候補モデルＭｉに入力し、候補モデルＭｉを訓練する。
　指定可能な訓練条件には、候補モデルＭｉの入力ノードのうち、時刻と位置以外の入力ノード（本実施形態では曜日と天候）の指定が含まれていてもよい。例えば、天候が指定された場合、制御部１１は、候補モデルＭｉの入力ノードに天候を含める。

　制御部１１は、勾配降下法又はアンサンブル学習などのアルゴリズムにより、候補モデルＭｉを構成するノード間の重みなどが収束するまで訓練を継続する。これにより、候補モデルＭｉが学習済みのモデルとなる。

　次に、制御部１１は、候補モデルＭｉの評価処理（ステップＳＴ１６）を実行する。
　この処理は、訓練済みの候補モデルＭｉの予測精度を、所定の評価基準に基づいて評価する処理である。

　図４は、候補モデルＭｉの予測精度の評価方法の一例を示す説明図である。
　図４に示すように、候補モデルＭｉの予測精度は、例えば図示の算出式にて定義される「ＳＭＡＰＥ（Symmetric mean absolute percentage error）値」により評価される。
　この場合、制御部１１は、「評価期間」により指定された期間（例えば、本日から過去に遡った直近１週間など）だけ候補モデルＭｉを試験的に駆動し、各候補モデルＭｉのＳＭＡＰＥ値を算出する。

　図３に示すように、制御部１１は、ＳＭＡＰＥ値が所定の閾値ＴＨ（例えば３％）以下である場合は、候補モデルＭｉを適合と判定し（ステップＳＴ１７）、処理を終了する。
　逆に、制御部１１は、ＳＭＡＰＥ値が所定の閾値を超える場合は、候補モデルＭｉを不適合と判定し（ステップＳＴ１７）、処理をステップＳＴ１３の前に戻す。

　従って、制御部１１は、ステップＳＴ１６の評価が適合となる学習済みの候補モデルＭｉが得られるまで、ステップＳＴ１３からステップＳＴ１６の処理を繰り返す。
　この場合、エリア設定によりエリアＡｊの範囲又は総数が変更されたり、或いは、モデル種別によりモデルの種別が変更されたりすると、異なる候補モデルＭｉが作成されるので、作成された異なる候補モデルＭｉに対する評価が繰り返されることになる。

　制御部１１は、評価が適合である複数の候補モデルＭｉのうちの少なくとも１つを、発注者に提供する需要予測モデルとして出力する。
　また、制御部１１は、需要予測モデルに加えて、実績データをモデル用データＴＤｉに変換するためのデータ変換ツールを生成する。発注者に提供する需要予測モデルには、少なくとも、予測精度が最も高い候補モデルＭｉが含まれる。もっとも、発注者の求めに応じて、予測精度が２番目以下の候補モデルＭｉを需要予測モデルに含めてもよい。

　図４では、本土に属するエリアＡ１，Ａ２，Ａ３，Ａ４，Ａ５，Ａ６，Ａ７と離島に属するエリアＡ８を１つの対象地域とする候補モデルＭ１の場合における、エリアＡｊ（ｊ＝１～８）ごとの実際の配車数と配車の予測数の数値が示されている。
　上記の候補モデルＭ１では、例えば、エリアＡ１の配車数Ｒ１（＝１００）と予測数Ｑ１（＝９８）はほぼ等しく、エリアＡ３の配車数Ｒ３（＝９０）と予測数Ｑ３（＝９５）もほぼ等しい。これに対し、エリアＡ８については、配車数Ｒ３（＝３０）と予測数Ｑ３（＝７０）の差が大きい。

　その原因は、エリアＡ８は、エリアＡ７と１本の橋梁で本土と繋がる小島であるため、他のエリアＡ１，Ａ２，Ａ３，Ａ４，Ａ５，Ａ６，Ａ７とは交通事情が大きく異なるからと考えられる。
　従って、このような本土とは交通事情が異なる小島や離島などを含む地域の場合には、小島又は離島を本土と分離したエリア設定を採用して別個の候補モデルＭ２とすることが好ましい。

　具体的には、本土に属するエリアＡ１，Ａ２，Ａ３，Ａ４，Ａ５，Ａ６，Ａ７を対象地域とする本土用の候補モデルＭ１と、小島のエリアＡ８を対象地域とする小島用の候補モデルＭ２とに分離し、両者を個別に訓練すれば良い。
　このようにすれば、小島用の候補モデルＭ２は、小島特有の交通事情に応じた学習を行うことになるので、小島のエリアＡ８を本土側と区別しないエリア設定の場合に比べて、各候補モデルＭ１，Ｍ２を適切に訓練することができる。

　〔モデル用データの作成〕
　図５は、モデル用データＴＤｉの作成処理の一例を示すフローチャートである。
　図５に示すように、モデル生成サーバ１の制御部１１は、ユーザによるエリア設定の入力の有無を判定しており（ステップＳＴ２１）、入力があった場合、入力されたエリアＡの範囲と総数に応じてエリアＡの識別番号ｊを決定する（ステップＳＴ２２）。

　例えば、パターン１のように、所定地域Ｂ１を合計６つに区画するエリアＡｊが指定された場合、制御部１１は、所定地域Ｂ１に含まれる６つのエリアＡｊをＡ１，Ａ２，Ａ３，Ａ４，Ａ５，Ａ６とする。
　また、パターン２のように、所定地域Ｂ１を合計４つに区画するエリアＡｊが指定された場合、制御部１１は、所定地域Ｂ１に含まれる４つのエリアＡｊをＡ１，Ａ２，Ａ３，Ａ４とする。

　次に、制御部１１は、汎用データＧＤの乗車位置Ｐ１と降車位置Ｐ２にエリアＩＤを割り当てて、モデル用データＴＤｉを作成する（ステップＳＴ２３）。
　この場合、例えばパターン１の場合は、乗車位置Ｐ１のエリアＩＤは「１」となり、降車位置Ｐ２のエリアＩＤは「６」となる。また、パターン２の場合は、乗車位置Ｐ１のエリアＩＤは「１」となり、降車位置Ｐ２のエリアＩＤは「４」となる。

　〔候補モデルの作成〕
　図６は、候補モデルＭｉの作成処理の一例を示すフローチャートである。
　図６に示すように、モデル生成サーバ１の制御部１１は、ユーザによるモデル選択の入力の有無を判定しており（ステップＳＴ３１）、入力があった場合、選択されたアルゴリズムの学習器を解析用サーバ３３から取得する（ステップＳＴ３２）。

　次に、制御部１１は、取得した学習器の入力層と出力層を決定し、決定した学習器を候補モデルＭｉとする（ステップＳＴ３３）。
　なお、候補モデルＭｉの入力層はモデル用データＴＤｉであり、出力層は、ユーザが指定する所定期間において発生したエリアＡｊごとの配車数の予測値である。

　〔その他の変形例〕
　上述の実施形態（変形例を含む。）は、すべての点で例示であって制限的なものではない。本開示の権利範囲は請求の範囲によって示され、請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。

　例えば、上述の実施形態において、モデル生成サーバ１の制御部１１による需要予測モデルの生成を配車サーバ２の制御部２１が実行してもよい。この場合、配車サーバ２の制御部２１は、配車機能とモデル生成装置としての機能を併有した装置となる。

　１　モデル生成サーバ
　２　配車サーバ
　３　外部サーバ
　４　公衆通信網
　１１　制御部（モデル生成装置）
　１１Ａ　第１プロセッサ
　１１Ｂ　第１メモリ
　１２　記憶部
　１３　通信部
　１４　ソースデータベース
　１５　汎用データベース
　１６　モデル用データベース
　１７　コンピュータプログラム
　２１　制御部（需要予測装置）
　２１Ａ　第２プロセッサ
　２１Ｂ　第２メモリ
　２２　記憶部
　２３　通信部
　２４　実績データベース
　２５　モデル用データベース
　２６　コンピュータプログラム
　３１　気象サーバ
　３２　マップサーバ
　３３　解析用サーバ
　１００　需要予測システム

Claims

　モデル生成装置であって、
　ユーザの入力操作に基づく指示を記憶する第１メモリと、
　前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第１プロセッサと、を備え、
　前記指示は、
　配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含み、
　前記第１プロセッサは、
　前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも１つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する、モデル生成装置。
　前記指示は、
　前記候補モデルのアルゴリズムの種別を前記ユーザが指定可能なモデル種別を含み、
　前記第１プロセッサは、
　前記モデル種別により前記アルゴリズムの種別が変更されたことに応じて、変更前と異なる前記候補モデルを作成する、請求項１に記載のモデル生成装置。
　前記第１プロセッサは、
　前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルの予測精度をそれぞれ評価し、評価結果に基づいて複数の前記候補モデルのうちから少なくとも１つのモデルを選択する、請求項２に記載のモデル生成装置。
　前記エリア設定は、
　行政区画上の地名又は地番を指定する入力方式である、請求項１から請求項３のいずれか１項に記載のモデル生成装置。
　前記エリア設定は、
　デジタル地図にＧＵＩを用いた手入力により取り囲まれた範囲を指定する入力方式である、請求項１から請求項４のいずれか１項に記載のモデル生成装置。
　前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルに対する入力情報は、
　乗車時刻、乗車位置を含む前記エリアの識別情報、降車時刻、及び、降車位置を含む前記エリアの識別情報を含む、請求項２から請求項５のいずれか１項に記載のモデル生成装置。
　前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の前記候補モデルに対する入力情報は、
　気候及び曜日のうちの少なくとも１つを含む、請求項２から請求項６のいずれか１項に記載のモデル生成装置。
　需要予測装置であって、
　配車の需要予測に用いられるモデルを記憶する第２メモリと、
　記憶した前記モデルを用いて前記需要予測を行う第２プロセッサと、を備え、
　前記モデルは、
　請求項２から請求項７のいずれか１項に記載の前記モデル生成装置により作成された、前記エリアの範囲、前記エリアの総数又は前記アルゴリズムの種別が異なる複数の候補モデルのうち、予測精度の評価に適合するモデルである、需要予測装置。
　モデル生成装置が実行するモデル生成方法であって、
　ユーザの入力操作に基づく指示であって、配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含む前記指示を記憶するステップと、
　前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成するステップと、
　前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも１つが変更されたことに応じて、変更前と異なる前記候補モデルを作成するステップと、を含む、モデル生成方法。
　ユーザの入力操作に基づく指示を記憶する第１メモリと、
　前記指示に基づいて、配車の需要予測に用いられる候補モデルを作成する第１プロセッサと、を備えるモデル生成装置として、コンピュータを機能させるためのコンピュータプログラムであって、
　前記指示は、
　配車が発生し得るエリアの範囲と前記エリアの総数を前記ユーザが指定可能なエリア設定を含み、
　前記第１プロセッサは、
　前記エリア設定により前記エリアの範囲と前記エリアの総数のうちの少なくとも１つが変更されたことに応じて、変更前と異なる前記候補モデルを作成する、コンピュータプログラム。