WO2018207878A1

WO2018207878A1 - 需要予測装置

Info

Publication number: WO2018207878A1
Application number: PCT/JP2018/018148
Authority: WO
Inventors: 慎石黒; 悠菊地; 佑介深澤; 健榎園
Original assignee: 株式会社Ｎｔｔドコモ
Priority date: 2017-05-11
Filing date: 2018-05-10
Publication date: 2018-11-15
Also published as: JPWO2018207878A1; JP6802916B2; US20190332977A1

Abstract

一実施形態に係るサーバ１０は、予測対象エリアについての過去期間に関連付けられる特徴を表す第１統計量を取得する第１統計量取得部１３と、予測対象エリアとは大きさが異なり、予測対象エリアを包囲する、少なくとも１つの関連エリアを抽出するエリア抽出部１４と、関連エリアの特徴を表す第２統計量を取得する第２統計量取得部１５と、第１統計量と第２統計量とを予め用意された予測モデルに入力することにより、予測対象エリアの需要予測値を取得する需要予測部１６と、を備える。

Description

需要予測装置

　本発明の一側面は、需要予測装置に関する。

　特許文献１には、あるメッシュ（エリア）のタクシー需要（乗車数）を予測する需要予測システムが記載されている。上記システムは、まず、複数のメッシュの各々について、メッシュ毎の需要実績値に基づいて第１の回帰式を生成し、当該第１の回帰式を用いて中間的な需要予測値（メッシュ毎の予測乗車数）を算出する。続いて、上記システムは、当該複数のメッシュのうちの１つを予測対象エリアとして選択し、予測対象エリアと相関のあるメッシュを相関エリアとして抽出し、当該相関エリアの需要実績値に基づいて第２の回帰式を生成し、当該第２の回帰式を用いて予測対象エリアの最終的な需要予測値を算出する。

特開２０１２－０５０２４１号公報

　上記特許文献１に記載されている手法は、複数のエリアの各々について個別の予測モデル（第１の回帰式）を生成するとともに、予測対象エリア毎にも個別の予測モデル（第２の回帰式）を生成する。このようにエリア毎に個別に予測モデルを生成する場合、予測対象となるエリアの数が増える程処理が煩雑となり得る。

　複数の予測対象エリアに対して共通の予測モデルを利用できれば、上記問題の発生を回避し得る。また、共通の予測モデルを用いる場合においても、上記特許文献１に記載されているように、予測対象エリア以外のエリアの統計データにも基づいて需要予測を行うことにより、予測精度を向上させ得る。しかしながら、このような統計データとして、予測対象エリアとの単純な位置関係を有するエリア（例えば予測対象メッシュに対して特定の方向（例えば右上）に位置するメッシュ等）の統計データを利用した場合、以下のような問題を生じ得る。すなわち、右上のメッシュと相関のあるエリアについては需要を精度良く予測できる一方で、右上のメッシュと相関のないエリアについては需要を精度良く予測できないといったように、エリア毎の予測精度のバラツキが生じ得る。

　そこで、本発明の一側面は、複数のエリアに共通の予測モデルを用いた場合において、エリア毎の予測精度のバラツキを抑制できる需要予測装置を提供することを目的とする。

　本発明の一側面に係る需要予測装置は、所定のサービスの需要の予測対象となる予測対象エリアについての過去期間に関連付けられる特徴を表す第１統計量を取得する第１統計量取得部と、予測対象エリアとは大きさが異なり、予測対象エリアを包囲する、少なくとも１つの関連エリアを抽出するエリア抽出部と、関連エリアの特徴を表す第２統計量を取得する第２統計量取得部と、第１統計量と第２統計量とを予め用意された予測モデルに入力することにより、予測対象エリアの需要予測値を取得する需要予測部と、を備える。

　本発明の一側面に係る需要予測装置は、予測対象エリアの統計量（第１統計量）と共に、予測対象エリアとは大きさが異なり、予測対象エリアを包囲する関連エリアの統計量（第２統計量）に基づいて、当該予測対象エリアの需要予測値を算出する。このような関連エリアの第２統計量は、どのエリアを予測対象エリアとして選択するかによらず、予測対象エリアの需要予測の精度を高めるために有用なデータとなり得る。したがって、上記需要予測装置によれば、複数のエリアに共通の予測モデルを用いた場合において、エリア毎の予測精度のバラツキを抑制できる。

　本発明の一側面によれば、複数のエリアに共通の予測モデルを用いた場合において、エリア毎の予測精度のバラツキを抑制できる需要予測装置を提供することができる。

一実施形態に係る需要予測装置を含むサーバの機能構成を示す図である。メッシュ（エリア）毎の統計データの一例を示す図である。第１メッシュ及び第２メッシュの例を表す図である。第１メッシュ及び第２メッシュの例を表す図である。第１メッシュ及び第２メッシュの例を表す図である。相関分析により決定される時間差について説明するための図である。図１のサーバが予測モデルを生成するための処理手順を示すフローチャートである。図１のサーバが予測対象エリアの需要予測値を取得するための処理手順を示すフローチャートである。図１のサーバのハードウェア構成を示す図である。

　以下、添付図面を参照して、本発明の一実施形態について詳細に説明する。なお、図面の説明において同一又は相当要素には同一符号を付し、重複する説明を省略する。

　図１は、一実施形態に係る需要予測装置を含むサーバ１０の機能構成を示す図である。サーバ１０は、所定のサービスの需要の予測対象として選択される予測対象エリアの需要を予測するコンピュータシステムである。本実施形態では、サーバ１０は、予測対象エリアにおけるタクシー需要（タクシーの乗客数）を予測する。より具体的には、一例として、サーバ１０は、現時点（需要予測の実行時点）から３０分間に予測対象エリアで発生するタクシー需要の予測値を算出する。

　図１に示されるように、サーバ１０は、記憶部１１と、モデル生成部１２と、第１統計量取得部１３と、エリア抽出部１４と、第２統計量取得部１５と、需要予測部１６と、を備える。

　記憶部１１は、サーバ１０の処理に必要となる各種情報を記憶する。例えば、記憶部１１は、メッシュ毎の各種統計データを格納する統計データ管理テーブル（図２参照）を記憶する。メッシュは、予め設定された地理的な区画であり、例えば５００ｍ四方の正方形状の領域である。記憶部１１に記憶された各種情報は、モデル生成部１２、第１統計量取得部１３、エリア抽出部１４、第２統計量取得部１５、及び需要予測部１６からアクセス可能となっている。

　モデル生成部１２は、予測対象エリアのタクシー需要を予測するための予測モデルを生成する。モデル生成部１２は、第１学習用統計量取得部１２１と、第２エリア抽出部１２２と、第２学習用統計量取得部１２３と、生成部１２４と、を有する。

　第１学習用統計量取得部１２１は、少なくとも１つの第１エリアについて、所定の対象期間に関連付けられる第１エリアの特徴を表す第１学習用統計量と、上記対象期間よりも後の期間に関連付けられる第１エリアの需要実績値とを取得する。第１学習用統計量は、予測モデルの説明変数に対応する。第１エリアの需要実績値は、予測モデルの目的変数に対応する。例えば、第１学習用統計量取得部１２１は、メッシュ毎の各種統計データを格納する統計データ管理テーブル（図２）を参照することにより、第１学習用統計量及び需要実績値を取得する。第１エリアは、例えばメッシュ１つ分の領域である。

　図２は、あるメッシュについての各種統計データを格納する統計データ管理テーブルの一例を表す。この例では、統計データ管理テーブルに格納される統計データＳＴは、集計開始時刻が１０分毎ずらされた単位期間（ここでは３０分）毎の各種統計情報を含んでいる。本実施形態では、統計データＳＴは、人口データＳＴ１、天候データＳＴ２、及びタクシーデータＳＴ３を含んでいる。

　人口データＳＴ１は、メッシュ内の滞在人口（例えば単位期間内の平均人口）に関する統計情報である。人口データＳＴ１は、全体人口（「人口」列）及び季節性に起因する人口成分（「人口季節成分」列）等の情報を含んでいる。人口の変動要因は、例えば、傾向変動成分（Ｔｒｅｎｄ）、循環変動成分（Ｃｙｃｌｅ）、季節変動成分（Ｓｅａｓｏｎａｌ）、及び不規則変動成分（Ｉｒｒｅｇｕｌａｒ，Ｎｏｉｓｅ）等に分解され得る。このような要因分解は、例えば公知のアルゴリズム等により実行され得る。傾向変動成分は、比較的長いサイクルで周期的に変動する数値である。循環変動成分は、比較的短いサイクルで周期的に変動する数値である。季節変動成分は、大型連休及び正月等のイベントによって変動する数値である。不規則変動成分は、傾向変動成分、循環変動成分、及び季節変動成分には含まれない成分であり、不定期に変動する数値である。人口データＳＴ１に含まれる人口季節成分は、上述した季節変動成分に相当する。ただし、人口データＳＴ１の内訳は上記例に限られない。例えば、人口データＳＴ１は、男女別人口、年代別人口、及び居住地別人口等の人口に関する様々な情報を含んでもよい。また、人口データＳＴ１は、上述した傾向変動成分、循環変動成分、及び不規則変動成分等を含んでもよい。

　天候データＳＴ２は、メッシュ内の天候に関する統計情報である。天候データＳＴ２は、雨量及び風量等の情報を含んでいる。ただし、天候データＳＴ２の内訳は上記例に限られない。例えば、天候データＳＴ２は、気温、湿度、風量、風向、及び気圧等の情報を含んでもよい。

　タクシーデータＳＴ３は、メッシュ内のタクシー利用に関する統計情報である。タクシーデータＳＴ３は、乗車数及び降車数等の情報を含んでいる。ただし、タクシーデータＳＴ３の内訳は上記例に限られない。例えば、タクシーデータＳＴ３は、タクシーの空車数等の情報を含んでもよい。空車数（空車量）は、単位期間においてメッシュ内を空車状態で通過したタクシーの台数である。

　まず、第１学習用統計量取得部１２１は、例えばオペレータによる入力を受け付けることにより、第１エリア及び対象期間を設定する。対象期間は、任意の期間（例えば２０１５年８月２日１０時００分から同日１６時００分までの６時間）であってよい。そして、第１学習用統計量取得部１２１は、第１エリアの統計データＳＴを参照することにより、対象期間の統計データＳＴを、第１学習用統計量として取得する。

　第１学習用統計量取得部１２１は、対象期間よりも後の期間（例えば対象期間の終了時点である２０１５年８月２日１６時００分から同日１６時３０分までの３０分間）の乗車数（図２の例では「２」）を、第１エリアの需要実績値として取得する。

　なお、第１エリアは、必ずしも１つのメッシュからなる領域でなくてもよい。例えば、第１エリアは、円形領域（後述する図４の（Ｂ）の第１エリアＡ１参照）等であってもよい。この場合、第１学習用統計量取得部１２１は、第１エリアに含まれるメッシュの統計データＳＴを第１学習用統計量として取得してもよい。第１エリアに複数のメッシュが含まれる場合、第１学習用統計量取得部１２１は、当該複数のメッシュの各々の統計データＳＴに対して同じ期間及び同じ種類に関連付けられる統計量同士に対して所定の演算（例えば和又は平均を求める演算）を行ってもよい。そして、第１学習用統計量取得部１２１は、当該演算により得られた統計量（例えば和及び平均値等）を、各期間及び各種類に対応する第１学習用統計量として取得してもよい。このとき、第１学習用統計量取得部１２１は、第１エリアに完全に含まれるメッシュのみを第１エリアに含まれるメッシュとして特定してもよい。或いは、第１学習用統計量取得部１２１は、第１エリアに完全に含まれないメッシュについては、例えばメッシュ全体の面積に対する第１エリアに含まれるメッシュ部分の割合（第１エリアに含まれるメッシュ部分の面積／メッシュ全体の面積）を当該メッシュに関する統計データＳＴの各値に乗じた値を用いて、上述の計算を行ってもよい。

　第２エリア抽出部１２２は、第１エリアとは大きさが異なり、第１エリアを包囲する、少なくとも１つの第２エリアを抽出する。以下、第１エリア及び第２エリアのいくつかの例について説明する。第１～第３の抽出例は、第１エリアからの距離に基づいて第２エリアを抽出する例である。また、第４の抽出例は、第１エリアとの間の移動に要する移動時間に基づいて第２エリアを抽出する例である。

（第１の抽出例）
　第１エリアは、地理的な区画として予め設定されたメッシュ１つ分の領域であり、第２エリア抽出部１２２は、複数のメッシュからなる領域を第２エリアとして抽出してもよい。図３の（Ａ）は、複数のエリアＡ（メッシュ）のうちから選択された１つの第１エリアＡ１を表している。図３の（Ｂ）は、第１エリアＡ１に対応する１つ目の第２エリアＡ２１を表しており、図３の（Ｃ）は、第１エリアＡ１に対応する２つ目の第２エリアＡ２２を表している。図３に示されるように、第２エリア抽出部１２２は、第１エリアＡ１からの距離が等しいメッシュ群をひとまとめにしたエリアを、第２エリアＡ２として抽出してもよい。ここでの「距離」は、第１エリアＡ１との間に存在するメッシュ数により表現され得る。第２エリアＡ２１は、第１エリアＡ１に隣接する８個のメッシュからなる四角枠状のエリア（第１エリアＡ１との間に存在するメッシュ数が０であるメッシュをひとまとめにしたエリア）である。第２エリアＡ２２は、第２エリアＡ２１の外側を囲う四角枠状のエリア（第１エリアＡ１との間に存在するメッシュ数が１である１６個のメッシュをひとまとめにしたエリア）である。抽出される第２エリアＡ２の個数は１つでもよいし、３つ以上であってもよい。例えば、第２エリア抽出部１２２は、第１エリアＡ１との間に存在するメッシュ数を１つずつ増やしていき、それぞれのメッシュ数に対応するエリア（例えば２４個のメッシュからなるエリア、及び３２個のメッシュからなるエリア等）を第２エリアＡ２として抽出してもよい。

（第２の抽出例）
　第２エリア抽出部１２２は、第１エリアＡ１からの距離（すなわち、第１エリアＡ１との間に存在するメッシュの数）が多くなる程、ひとまとめにするメッシュ数（ここでは、枠状に形成されるエリアの枠幅）が多くなるように、第２エリアＡ２を抽出してもよい。例えば、図４の（Ａ）に示されるように、第１エリアＡ１との間に存在するメッシュ数が１である第２エリアＡ２２（Ａ２）は、メッシュ２つ分の枠幅を有する四角枠状のエリアであってもよい。一般に、第１エリアＡ１から離れたエリアほど、第１エリアＡ１との相関が低くなる傾向がある。したがって、この例によれば、第１エリアＡ１との関係において重要度がそれほど高くない第２エリアＡ２に含まれるメッシュ数を増やすことにより、より多くのメッシュに関する統計データＳＴを考慮しつつ、第２エリアＡ２の個数を減らすことができる。その結果、需要予測のために必要となる説明変数の個数（具体的には後述する第２学習用統計量の次元数）を削減し得る。このように説明変数の個数を減らすことにより、計算量の削減及びメモリ使用量の低減等を図ることができる。すなわち、プロセッサ、メモリ等のハードウェア資源の処理負荷及び使用料を低減できる。

（第３の抽出例）
　第１エリアＡ１及び第２エリアＡ２は、メッシュ状でなくてもよい。例えば、図４の（Ｂ）に示されるように、第１エリアＡ１は、円形領域として設定されてもよい。この場合、第２エリア抽出部１２２は、第１エリアＡ１の中心からの距離が所定範囲内に含まれるリング状の領域を、第２エリアＡ２として抽出してもよい。例えば、半径５００ｍの円形領域が第１エリアＡ１として設定されている場合について考える。この場合、第２エリア抽出部１２２は、第１エリアＡ１の中心からの距離ｄが「５００ｍ≦ｄ≦１０００ｍ」の範囲に収まるリング状のエリアを第２エリアＡ２１として抽出してもよい。また、第２エリア抽出部１２２は、上記中心からの距離ｄが「１０００ｍ≦ｄ≦１５００ｍ」の範囲に収まるリング状のエリアを第２エリアＡ２２として抽出してもよい。

（第４の抽出例）
　第２エリア抽出部１２２は、第１エリアＡ１との間の移動に要する移動時間に基づいて、第２エリアを抽出してもよい。ここで、「第１エリアＡ１との間の移動に要する移動時間」とは、例えば、第１エリアＡ１の代表位置（例えば重心）を終点として、想定される移動手段（例えば、車、電車、徒歩等）を用いて上記代表位置に到達するために必要な時間である。或いは、「第１エリアＡ１との間の移動に要する移動時間」は、第１エリアＡ１の代表位置を起点として、上記想定される移動手段を用いて第１エリアＡ１の代表位置から到達するために必要な時間であってもよい。

　例えば、第１エリアＡ１及び第２エリアＡ２に設けられた道路、路線、及び駅等の情報は、記憶部１１に予め記憶されている。第２エリア抽出部１２２は、これらの情報を参照し、公知の最短経路検索アルゴリズム等を実行することにより、第１エリアＡ１の代表位置と任意の位置との間の最短経路（移動手段を含む）、及び当該最短経路の移動にかかる時間を算出してもよい。このような処理によれば、例えば、第１エリアＡ１の代表位置に到達するまでに必要な時間ｔｄが「１０分≦ｔｄ≦２０分」の範囲に収まるエリアを第２エリアＡ２１として抽出し、時間ｔｄが「２０分≦ｔｄ≦３０分」の範囲に収まるエリアを第２エリアＡ２２として抽出すること等が可能となる。

　図５は、上述のように抽出された２つの第２エリアＡ２１，Ａ２２の例を表す図である。図５に示されるように、移動時間に基づいて抽出される第２エリアＡ２の形状は、第１エリアＡ１の周辺の設備の状況（設けられている道路の種別及び法定速度等、並びに駅からの距離及び路線の運行間隔等）に応じて異なり得る。

　第２学習用統計量取得部１２３は、第２エリアＡ２の特徴を表す第２学習用統計量を取得する。以下、第２学習用統計量のいくつかの取得例について説明する。第２学習用統計量は、上述した第１学習用統計量と同様に、予測モデルの説明変数に対応する。

（第１の取得例）
　第２学習用統計量取得部１２３は、第２エリアＡ２に含まれる複数のメッシュの各々に関連付けられる統計データＳＴのうち、第１学習用統計量の取得対象期間として設定された対象期間（本実施形態では、２０１５年８月２日１０時００分から同日１６時００分までの６時間）と同じ期間についての統計データＳＴを取得してもよい。

　そして、第２学習用統計量取得部１２３は、当該複数のメッシュの各々の統計データＳＴに対して同じ期間及び同じ種類に関連付けられる統計量同士に対して所定の演算を行うことで得られる一以上の統計量を、各期間についての第２学習用統計量として取得する。一以上の統計量は、例えば、平均値、最大値、最小値、中央値、及び分散等の所定の演算により得られる値である。なお、第２エリアＡ２に部分的に含まれるメッシュの統計データＳＴの取扱いは、上述した第１学習用統計量を取得する処理における、第１エリアＡ１に部分的に含まれるメッシュの統計データＳＴの取扱いと同様である。

（第２の取得例）
　第２学習用統計量取得部１２３は、第１学習用統計量の取得対象期間として設定された対象期間と所定の時間差を有する期間についての統計量を、第２学習用統計量として取得してもよい。具体的には、第２学習用統計量取得部１２３は、第１エリアＡ１と第２エリアＡ２との間の移動に要する移動時間（上記第４の抽出例において説明した移動時間と同様）に基づいて、所定の時間差を決定してもよい。ある時点に第２エリアＡ２に滞在する人が第１エリアＡ１でタクシーに乗る可能性があるのは（すなわち、ある時点の第２エリアＡ２の滞在人口が第１エリアＡ１のタクシー需要に影響を及ぼす可能性があるのは）、当該時点から少なくとも上記移動時間後であると考えられる。したがって、第２エリアＡ２についての統計データＳＴの取得対象期間を、対象期間（第１エリアＡ１の統計データＳＴの取得対象期間）よりも上記移動時間だけ前にずらすことにより、第１エリアＡ１のタクシー需要を予測する上で、より意味のある（有益な）データを説明変数とすることが可能となる。

　例えば、図３の（Ｂ）に示される第２エリアＡ２１から第１エリアＡ１の代表位置に到達するまでに必要な移動時間の平均値が３０分である場合、第２学習用統計量取得部１２３は、第２エリアＡ２１に関して、３０分を所定の時間差として決定してもよい。この場合、第２学習用統計量取得部１２３は、第２エリアＡ２１に含まれる複数のメッシュの各々に関連付けられる統計データＳＴのうち、上記対象期間よりも３０分だけ前にずらした時間帯（本実施形態では、２０１５年８月２日０９時３０分から同日１５時３０分までの６時間）についての統計データＳＴを取得してもよい。第２エリアＡ２１に含まれる複数のメッシュの各々に関連付けられる統計データＳＴを取得した後の処理は、上述した第１の取得例と同様である。第２エリアＡ２が複数存在する場合には、上述した第２の取得例の処理は、各第２エリアＡ２について個別に実行される。

（第３の取得例）
　第２学習用統計量取得部１２３は、第１エリアＡ１の需要実績値と第２エリアＡ２の滞在人口との関係に基づいて、所定の時間差を決定してもよい。ある時点の第２エリアＡ２の滞在人口が第１エリアＡ１のタクシー需要に影響を及ぼすのは、必ずしも当該時点から上記移動時間後とは限らない。そこで、第２学習用統計量取得部１２３は、過去の実績値（統計データＳＴ）に基づいて、第１エリアＡ１の需要実績値（乗車数）と第２エリアＡ２の滞在人口（本実施形態では、前時間帯からの人口差分）との相関が最大となるような時間差を求める。

　図６は、１時間毎に区切られた時間帯毎の、第１エリアＡ１の乗車数、第２エリアＡ２の滞在人口、及び第２エリアＡ２の前時間帯からの人口差分の例を表している。このようなデータは、第１エリアＡ１に含まれる各メッシュの統計データＳＴ及び第２エリアＡ２に含まれる各メッシュの統計データＳＴから得られる。第２学習用統計量取得部１２３は、下記式により表される相関φが最大となる時間差τを所定の時間差として決定する。

　ｘ［ｋ］は時間帯ｋ（例えば１５時から１６時までの時間帯についてはｋ＝１５）における第１エリアＡ１の乗車数である。ｙ［ｋ］は時間帯ｋにおける第２エリアＡ２の人口差分である。図６の例では、「τ＝－２（時間）」のときに相関φは最大となるため、第２学習用統計量取得部１２３は、２時間を所定の時間差として決定する。すなわち、第２学習用統計量取得部１２３は、第２エリアＡ２についての統計データＳＴの取得対象期間を、上記対象期間よりも２時間だけ前にずらす。第２エリアＡ２１に含まれる複数のメッシュの各々に関連付けられる統計データＳＴを取得した後の処理は、上述した第１の取得例と同様である。第２エリアＡ２が複数存在する場合には、上述した第３の取得例の処理は、各第２エリアＡ２について個別に実行される。

（第４の取得例）
　例えば、各時間帯の人口差分（前時間帯からの人口差分）を説明変数として用いる場合であって、第２エリアＡ２で開催されるイベント（例えば、コンサート及びスポーツ観戦等）の開催期間（例えば開始時刻及び終了時刻）が予め把握されている場合について考える。ここでは特に、イベントの終了時刻から第２の取得例で説明した移動時間だけ経過した時刻が、第１学習用統計量取得部１２１が第１エリアＡ１の需要実績値の取得対象期間に含まれる場合について考える。この場合、第１エリアＡ１の需要実績値は、イベントによる集客数（すなわち、イベント開始時における第２エリアＡ２の人口増分）と相関があると考えられる。したがって、このような場合には、第２学習用統計量取得部１２３は、イベント開始からイベント終了までのイベント開催時間（例えば２時間）と上記移動時間との和による求まる時間差を、所定の時間差としてもよい。

　上述した第１学習用統計量取得部１２１、第２エリア抽出部１２２、及び第２学習用統計量取得部１２３の処理により、予測モデルを生成するために必要な学習データが生成される。１つの学習データは、第１学習用統計量及び第２学習用統計量を説明変数とし、第１エリアＡ１の需要実績値を目的変数とするデータである。第１学習用統計量取得部１２１、第２エリア抽出部１２２、及び第２学習用統計量取得部１２３は、複数のエリア及び複数の対象期間（第１学習用統計量の取得対象期間）の組み合わせについて、上述の処理を実行してもよい。これにより、様々なバリエーションの学習データが得られる。なお、１つの予測モデルを生成する際には、同一の基準によって取得された説明変数を含む複数の学習データが利用され得る。すなわち、１つの学習データを生成するために利用される複数の学習データは、第２エリアＡ２の抽出及び第２学習用統計量の取得の両方において共通の手法を用いることにより得られた学習データである。

　生成部１２４は、第１学習用統計量及び第２学習用統計量と第１エリアＡ１の需要実績値とを関連付けたデータを学習データとして用いた機械学習を実行することにより、予測モデルを生成する。生成部１２４は、上述のように生成された複数の学習データを用いることにより、予測モデルを生成する。予測モデルは、第１エリアに対応する予測対象エリアについての第１学習用統計量及び第２学習用統計量に対応する入力データを説明変数として受け付けた場合に、予測対象エリアの需要予測値を目的変数として出力するモデルである。生成部１２４により生成された予測モデルは、記憶部１１に記憶される。

　予測モデルの生成に用いられる機械学習の具体的な手法は限定されないが、生成部１２４は、例えば、所謂ディープラーニングの手法を用いることにより、予測モデルを生成してもよい。このような予測モデルは、例えば予測処理を行う従来のニューラルネットワークに加えて、その前段の処理として特徴量（説明変数）の抽象化を実行する積層自己符号器（Stacked　Auto-Encoder）等を含み得る。

　以上説明したモデル生成部１２の処理により、予測対象エリアのタクシー需要（乗客数）を予測するための予測モデルが用意される。続いて、当該予測モデルを用いて実際に需要予測を行うための各機能要素について説明する。

　第１統計量取得部１３は、所定のサービスの需要（本実施形態ではタクシー需要）の予測対象となる予測対象エリアについての過去期間に関連付けられる特徴を表す第１統計量を取得する。例えば、第１統計量取得部１３は、オペレータからの入力を受け付けることにより、予測対象エリア（例えば１メッシュ）を把握する。そして、第１統計量取得部１３は、当該予測対象エリアの現時点から３０分間のタクシー需要を予測するために必要な第１統計量を取得する。

　ここで、予測対象エリア及び第１統計量は、モデル生成部１２により扱われる第１エリア及び第１学習用統計量に対応する。したがって、第１統計量取得部１３は、第１エリアに対する第１学習用統計量を取得する処理（第１学習用統計量取得部１２１の処理）と同様の処理により、予測対象エリアに対する第１統計量を取得できる。例えば本実施形態では、第１学習用統計量として、第１エリアの需要実績値に対応する期間の直前６時間分についての第１エリアに含まれるメッシュの統計データＳＴが取得される。この場合、第１統計量取得部１３は、予測モデル生成時における処理と同様に、現時点の直前６時間分についての予測対象エリアに含まれるメッシュの統計データＳＴを、第１統計量として取得すればよい。

　エリア抽出部１４は、予測対象エリアとは大きさが異なり、予測対象エリアを包囲する、少なくとも１つの関連エリアを抽出する。

　ここで、関連エリアは、モデル生成部１２により扱われる第２エリアに対応する。したがって、エリア抽出部１４は、第１エリアに対する第２エリアを抽出する処理（第２エリア抽出部１２２の処理）と同様の処理により、予測対象エリアに対する関連エリアを取得できる。例えば上述した第１の抽出例では、１メッシュにより構成される第１エリアＡ１に対して、当該第１エリアＡ１を包囲する８メッシュからなる第２エリアＡ２１及び１６メッシュからなるＡ２２が抽出された。このような抽出手法により得られた学習データを用いて生成された予測モデルを用いる場合、エリア抽出部１４は、予測モデル生成時における処理と同様に、１メッシュにより構成される予測対象エリアを包囲する８メッシュからなる関連エリア及び１６メッシュからなる関連エリアを抽出すればよい。すなわち、予測モデルを生成する際の第２エリアＡ２の抽出手法として上述した第１～第３の抽出例が採用されている場合、エリア抽出部１４は、上述した第２エリア抽出部１２２による処理と同様に、予測対象エリアからの距離に基づいて関連エリアを抽出する。一方、予測モデルを生成する際の第２エリアＡ２の抽出手法として上述した第４の抽出例が採用されている場合、エリア抽出部１４は、上述した第２エリア抽出部１２２による処理と同様に、予測対象エリアとの間の移動に要する移動時間に基づいて関連エリアを抽出する。

　第２統計量取得部１５は、関連エリアの特徴を表す第２統計量を取得する。

　ここで、第２統計量は、モデル生成部１２により扱われる第２学習用統計量に対応する。したがって、第２統計量取得部１５は、第２エリアに対する第２学習用統計量を取得する処理（第２学習用統計量取得部１２３の処理）と同様の処理により、関連エリアに対する第２統計量を取得できる。

　予測モデルについて上述した第２の取得例が採用されている場合について考える。この場合、第２統計量取得部１５は、過去期間（第１統計量の取得対象とされた期間）と所定の時間差を有する期間についての統計量であって、関連エリアの滞在人口に関する情報を含む統計量を、第２統計量として取得する。具体的には、第２統計量取得部１５は、予測対象エリアとの間の移動に要する移動時間に基づいて、所定の時間差を決定する。この場合、第２統計量取得部１５は、上述した第２の取得例において、第１学習用統計量、第２学習用統計量、第１エリア、及び第２エリアを、第１統計量、第２統計量、予測対象エリア、及び関連エリアと読み替えた場合の処理を実行すればよい。

　予測モデルについて上述した第３の取得例が採用されている場合について考える。この場合、第２統計量取得部１５は、予測対象エリアの需要実績値と関連エリアの滞在人口との関係に基づいて、所定の時間差を決定する。この場合、第２統計量取得部１５は、上述した第３の取得例において、第２学習用統計量、第１エリア、及び第２エリアを、第２統計量、予測対象エリア、及び関連エリアと読み替えた場合の処理を実行すればよい。

　予測モデルについて上述した第４の取得例が採用されている場合について考える。この場合、第２統計量取得部１５は、上述した第４の取得例において、第２学習用統計量、第１エリア、及び第２エリアを、第２統計量、予測対象エリア、及び関連エリアと読み替えた場合の処理を実行すればよい。

　需要予測部１６は、第１統計量と第２統計量とを予め用意された予測モデル（モデル生成部１２により生成された予測モデル）に入力することにより、予測対象エリアの需要予測値（タクシー乗客数の予測値）を取得する。具体的には、需要予測部１６は、予測モデルによる出力結果を、予測対象エリアの需要予測値として取得する。このようにして取得された需要予測値は様々な用途に用いられ得る。例えば、需要予測部１６は、需要予測値をディスプレイ等に表示することで、オペレータに予測結果を提示してもよい。また、上述した第１統計量取得部１３、エリア抽出部１４、第２統計量取得部１５、及び需要予測部１６は、複数の異なる予測対象エリアについて処理を実行してもよい。この場合に得られる各エリアの需要予測値は、例えばタクシーの各エリアへの効率的な配車を実現するための配車制御等に利用されてもよい。

　図７に示されるフローチャートを参照して、モデル生成部１２の処理手順について説明する。

　ステップＳ１において、第１学習用統計量取得部１２１は、例えばオペレータによる入力を受け付けることにより、第１エリア及び対象期間を設定する。例えば、メッシュ１つ分のエリアが第１エリアとして設定され得る。対象期間は、統計データＳＴが記憶されている期間のうちから任意に抽出された期間（例えば６時間）である。

　ステップＳ２において、第１学習用統計量取得部１２１は、第１エリアＡ１の対象期間における第１学習用統計量を取得する。また、第１学習用統計量取得部１２１は、対象期間よりも後の期間（例えば対象期間の終了時点から３０分間）に関連付けられた第１エリアＡ１の需要実績値（乗車数）を取得する。

　ステップＳ３において、第２エリア抽出部１２２は、第１エリアＡ１とは大きさが異なり、第１エリアＡ１を包囲する、少なくとも１つの第２エリアＡ２を抽出する。第２エリア抽出部１２２は、例えば上述した第１～第４の抽出例のいずれかの手法により、第２エリアＡ２を抽出する。

　ステップＳ４において、第２学習用統計量取得部１２３は、第２エリアＡ２の第２学習用統計量を取得する。第２学習用統計量取得部１２３は、例えば上述した第１～第４の取得例のいずれかの手法により、第２学習用統計量の取得対象期間（第１学習用統計量の取得対象期間である対象期間と同一又は対象期間よりも前の期間）を決定する。

　ステップＳ５において、モデル生成部１２は、第１学習統計量及び需要実績値と第２学習用統計量とに基づいて、一組の学習データ（説明変数としての第１学習用統計量及び第２学習用統計量と目的変数としての第１エリアＡ１の需要実績値とを含むデータ）を生成する。

　ステップＳ６において、モデル生成部１２は、他の学習データを生成するか否かを判定する。例えば、モデル生成部１２は、予測モデルを生成するために適切な数（例えば予めオペレータにより設定される数）の学習データが得られたと判定できるまで、学習データの生成処理（ステップＳ１～Ｓ５）を繰り返し実行してもよい（ステップＳ６：ＮＯ）。一方、モデル生成部１２は、適切な数の学習データが得られたと判定できた場合（ステップＳ６：ＹＥＳ）、ステップＳ７の処理に進む。

　ステップＳ７において、生成部１２４は、ステップＳ５において生成された学習データを用いた機械学習を実行することにより、予測モデルを生成する。生成された予測モデルは、例えば記憶部１１に記憶される。

　図８に示されるフローチャートを参照して、予測対象エリアの需要予測値を実際に予測するための処理手順について説明する。

　ステップＳ１１において、第１統計量取得部１３は、例えばオペレータによる入力を受け付けることにより、需要予測の対象となる予測対象エリアを選択する。

　ステップＳ１２において、第１統計量取得部１３は、予測対象エリアについての過去期間（現時点の直前６時間）に関連付けられる特徴を表す第１統計量を取得する。より具体的には、第１統計量取得部１３は、第１エリアＡ１に対する第１学習用統計量を取得する処理（第１学習用統計量取得部１２１の処理）と同様の処理により、予測対象エリアに対する第１統計量を取得する。

　ステップＳ１３において、エリア抽出部１４は、予測対象エリアとは大きさが異なり、予測対象エリアを包囲する、少なくとも１つの関連エリアを抽出する。より具体的には、エリア抽出部１４は、第１エリアＡ１に対する第２エリアＡ２を抽出する処理（第２エリア抽出部１２２の処理）と同様の処理により、予測対象エリアに対する関連エリアを取得する。

　ステップＳ１４において、第２統計量取得部１５は、関連エリアの第２統計量を取得する。より具体的には、第２統計量取得部１５は、第２エリアに対する第２学習用統計量を取得する処理（第２学習用統計量取得部１２３の処理）と同様の処理により、関連エリアに対する第２統計量を取得する。

　ステップＳ１５において、需要予測部１６は、第１統計量と第２統計量とを予め用意された予測モデル（モデル生成部１２により生成された予測モデル）に入力することにより、予測対象エリアの需要予測値を取得する。

　以上述べたサーバ１０は、予測対象エリアの統計量（第１統計量）と共に、予測対象エリアとは大きさが異なり、予測対象エリアを包囲する、関連エリアの統計量（第２統計量）に基づいて、当該予測対象エリアの需要予測値を算出する。このような関連エリアの第２統計量は、どのエリアを予測対象エリアとして選択するかによらず、予測対象エリアの需要予測の精度を高めるために有用なデータとなり得る。したがって、サーバ１０によれば、複数のエリアに共通の予測モデルを用いた場合において、エリア毎の予測精度のバラツキを抑制できる。その結果、各予測対象エリアの需要予測の精度を向上させることができ、各予測対象エリアにおけるサービス提供（本実施形態では、タクシーの適切な配車）を円滑に行うことが可能となる。

　予測対象エリアは、地理的な区画として予め設定されたメッシュ１つ分の領域であり、関連エリアは、複数のメッシュからなる領域であってもよい。例えば、予測対象エリア及び関連エリアは、上述した第１又は第２の抽出例における第１エリアＡ１及び第２エリアＡ２と同様に設定されてもよい。このように予測対象エリアの周囲の複数のメッシュをひとまとめにした領域を関連エリアとして設定することにより、上述した効果を奏すると共に、各メッシュを個別に扱う場合と比較して説明変数（第２統計量）を削減することができる。

　エリア抽出部１４は、予測対象エリアからの距離に基づいて、関連エリアを抽出してもよい。例えば、エリア抽出部１４は、上述した第１～第３の抽出例における処理と同様の処理により、関連エリアを抽出してもよい。この場合、予測対象エリアの将来需要に与える影響度（すなわち、距離が近い程影響度が大きい）に基づいて、関連エリアを設定できる。

　エリア抽出部１４は、予測対象エリアとの間の移動に要する移動時間に基づいて、関連エリアを抽出してもよい。例えば、エリア抽出部１４は、上述した第４の抽出例における処理と同様の処理により、関連エリアを抽出してもよい。この場合、予測対象エリアの将来需要に与える影響度（すなわち、移動時間が短い程影響度が大きい）に基づいて、関連エリアを設定できる。

　第２統計量取得部１５は、過去期間と所定の時間差を有する期間についての統計量であって、関連エリアの滞在人口に関する情報を含む統計量を、第２統計量として取得してもよい。第２統計量取得部１５は、予測対象エリアと関連エリアとの間の移動に要する移動時間に基づいて、所定の時間差を決定してもよい。例えば、所定の時間差は、上述した第２の取得例における処理と同様の処理により決定されてもよい。このように、関連エリアの滞在人口が予測対象エリアにおけるタクシー需要に影響を与えるまでの時間差を考慮して、第２統計量の取得対象期間を第１統計量の取得対象期間より過去にずらすことにより、より意味のある（有益な）データを説明変数とすることが可能となる。

　第２統計量取得部１５は、予測対象エリアの需要実績値と関連エリアの滞在人口との関係に基づいて、所定の時間差を決定してもよい。例えば、所定の時間差は、上述した第３の取得例における処理と同様の処理により決定されてもよい。このように、予測対象エリアの需要実績値と関連エリアの滞在人口との関係（本実施形態では、需要実績値と人口差分との相関）に基づいて時間差を決定することにより、より一層意味のある（有益な）データを説明変数とすることが可能となる。

　サーバ１０は、モデル生成部１２を備える。モデル生成部１２は、少なくとも１つの第１エリアＡ１について、所定の対象期間に関連付けられる第１エリアＡ１の特徴を表す第１学習用統計量と、対象期間よりも後の期間に関連付けられる第１エリアＡ１の需要実績値とを取得する第１学習用統計量取得部１２１と、第１エリアＡ１とは大きさが異なり、第１エリアＡ１を包囲する、少なくとも１つの第２エリアＡ２を抽出する第２エリア抽出部１２２と、第２エリアＡ２の特徴を表す第２学習用統計量を取得する第２学習用統計量取得部１２３と、第１学習用統計量及び第２学習用統計量と第１エリアＡ１の需要実績値とを関連付けたデータを学習データとして用いた機械学習を実行することにより、予測モデルを生成する生成部１２４と、を有する。このようなモデル生成部１２により、エリア毎の予測精度のバラツキを抑制できる予測モデルを生成できる。

　なお、本発明は上記実施形態に限定されない。例えば、予測モデルの説明変数には、上記例示した統計量以外の特徴量が含まれてもよい。例えば、エリア内に含まれる施設（例えば駅等）の個数等の、期間に依存しない特徴量が、説明変数に加えられてもよい。また、同一曜日かつ同一時間帯の平均需要（タクシー乗車数の平均）等の、周期的に繰り返される時期的な関連性に基づく特徴量が、説明変数に加えられてもよい。また、上記実施形態では、タクシーの乗客数を予測対象としたが、予測対象となる需要はこれに限定されず、本発明は様々なサービスの需要の予測に適用可能である。例えば、本発明は商品の売上の予測（目的変数は売上の個数又は金額）等にも適用可能である。

　なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック（構成部）は、ハードウェア及び／又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び／又は論理的に結合した１つの装置により実現されてもよいし、物理的及び／又は論理的に分離した２つ以上の装置を直接的及び／又は間接的に（例えば、有線及び／又は無線で）接続し、これら複数の装置により実現されてもよい。

　例えば、上記実施形態におけるサーバ１０は、上記実施形態のサーバ１０の処理を行うコンピュータとして機能してもよい。図９は、本実施形態に係るサーバ１０のハードウェア構成の一例を示す図である。上述のサーバ１０は、物理的には、プロセッサ１００１、メモリ１００２、ストレージ１００３、通信装置１００４、入力装置１００５、出力装置１００６、及びバス１００７等を含むコンピュータ装置として構成されてもよい。

　なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニット等に読み替えてもよい。サーバ１０のハードウェア構成は、図９に示された各装置を１つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。

　サーバ１０における各機能は、プロセッサ１００１、メモリ１００２等のハードウェア上に所定のソフトウェア（プログラム）を読み込ませることで、プロセッサ１００１が演算を行い、通信装置１００４による通信、メモリ１００２及びストレージ１００３におけるデータの読み出し及び／又は書き込みを制御することで実現される。

　プロセッサ１００１は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ１００１は、周辺装置とのインターフェース、制御装置、演算装置、レジスタ等を含む中央処理装置（ＣＰＵ：Central　Processing　Unit）で構成されてもよい。

　また、プロセッサ１００１は、プログラム（プログラムコード）、ソフトウェアモジュール、及び／又はデータを、ストレージ１００３及び／又は通信装置１００４からメモリ１００２に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、サーバ１０の需要予測部１６は、メモリ１００２に格納され、プロセッサ１００１で動作する制御プログラムによって実現されてもよく、図１に示した他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、１つのプロセッサ１００１で実行される旨を説明してきたが、２以上のプロセッサ１００１により同時又は逐次に実行されてもよい。プロセッサ１００１は、１以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されてもよい。

　メモリ１００２は、コンピュータ読み取り可能な記録媒体であり、例えば、ＲＯＭ（Read　Only　Memory）、ＥＰＲＯＭ（Erasable　Programmable　ＲＯＭ）、ＥＥＰＲＯＭ（Electrically　Erasable　Programmable　ＲＯＭ）、ＲＡＭ（Random　Access　Memory）等の少なくとも１つで構成されてもよい。メモリ１００２は、レジスタ、キャッシュ、メインメモリ（主記憶装置）等と呼ばれてもよい。メモリ１００２は、上記実施形態に係る情報処理方法（図７又は図８のフローチャートに示される手順等）を実施するために実行可能なプログラム（プログラムコード）、ソフトウェアモジュール等を保存できる。

　ストレージ１００３は、コンピュータ読み取り可能な記録媒体であり、例えば、ＣＤ－ＲＯＭ（Compact　Disc　ＲＯＭ）等の光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク（例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク）、スマートカード、フラッシュメモリ（例えば、カード、スティック、キードライブ）、フロッピー（登録商標）ディスク、磁気ストリップ等の少なくとも１つで構成されてもよい。ストレージ１００３は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ１００２及び／又はストレージ１００３を含むデータベース、サーバ、その他の適切な媒体であってもよい。

　通信装置１００４は、有線及び／又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア（送受信デバイス）であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュール等ともいう。

　入力装置１００５は、外部からの入力を受け付ける入力デバイス（例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサ等）である。出力装置１００６は、外部への出力を実施する出力デバイス（例えば、ディスプレイ、スピーカー、ＬＥＤランプ等）である。なお、入力装置１００５及び出力装置１００６は、一体となった構成（例えば、タッチパネル）であってもよい。

　また、プロセッサ１００１及びメモリ１００２等の各装置は、情報を通信するためのバス１００７で接続される。バス１００７は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。

　また、サーバ１０は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ：Digital　Signal　Processor）、ＡＳＩＣ（Application　Specific　Integrated　Circuit）、ＰＬＤ（Programmable　Logic　Device）、ＦＰＧＡ（Field　Programmable　Gate　Array）等のハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ１００１は、これらのハードウェアの少なくとも１つで実装されてもよい。

　以上、本発明について詳細に説明したが、当業者にとっては、本発明が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本発明は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更された態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本発明に対して何ら制限的な意味を有するものではない。

　本明細書で説明した各態様／実施形態の処理手順、フローチャート等は、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。

　入出力された情報等は特定の場所（例えば、メモリ）に保存されてもよいし、管理テーブルで管理されてもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。

　判定は、１ビットで表される値（０か１か）によって行われてもよいし、真偽値（Boolean：true又はfalse）によって行われてもよいし、数値の比較（例えば、所定の値との比較）によって行われてもよい。

　本明細書で説明した各態様／実施形態は単独で用いられてもよいし、組み合わせて用いられてもよいし、実行に伴って切り替えて用いられてもよい。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）によって行われてもよい。

　ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能等を意味するよう広く解釈されるべきである。

　また、ソフトウェア、命令等は、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線（ＤＳＬ）等の有線技術及び／又は赤外線、無線及びマイクロ波等の無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び／又は無線技術は、伝送媒体の定義内に含まれる。

　本明細書で説明した情報及び信号等は、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップ等は、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。

　なお、本明細書で説明した用語及び／又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。

　本明細書で使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。

　また、本明細書で説明した情報、パラメータ等は、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。

　上述したパラメータに使用される名称はいかなる点においても限定的なものではない。さらに、これらのパラメータを使用する数式等は、本明細書で明示的に開示したものと異なる場合もある。

　本明細書で使用する「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「決定」は、例えば、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)（例えば、テーブル、データベースまたは別のデータ構造での探索）、確認(ascertaining)した事を「決定」したとみなす事などを含み得る。また、「決定」は、受信(receiving)（例えば、情報を受信すること）、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)（例えば、メモリ中のデータにアクセスすること）した事を「決定」したとみなす事などを含み得る。また、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「決定」したとみなす事を含み得る。つまり、「決定」は、何らかの動作を「決定」したとみなす事を含み得る。

　本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」との両方を意味する。

　本明細書で使用する「第１の」、「第２の」等の呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定するものではない。これらの呼称は、２つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第１及び第２の要素への参照は、２つの要素のみがそこで採用され得ること、又は何らかの形で第１の要素が第２の要素に先行しなければならないことを意味しない。

　「含む（including）」、「含んでいる（including）」、及びそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「又は（or）」は、排他的論理和ではないことが意図される。

　本明細書において、文脈又は技術的に明らかに１つのみしか存在しない装置であることが示されていなければ、複数の装置をも含むものとする。

　本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。

　１０…サーバ、１１…記憶部、１２…モデル生成部、１３…第１統計量取得部、１４…エリア抽出部、１５…第２統計量取得部、１６…需要予測部、１２１…第１学習用統計量取得部、１２２…第２エリア抽出部、１２３…第２学習用統計量取得部、１２４…生成部、１００１…プロセッサ、１００２…メモリ、１００３…ストレージ、１００４…通信装置、１００５…入力装置、１００６…出力装置。

Claims

　所定のサービスの需要の予測対象となる予測対象エリアについての過去期間に関連付けられる特徴を表す第１統計量を取得する第１統計量取得部と、
　前記予測対象エリアとは大きさが異なり、前記予測対象エリアを包囲する、少なくとも１つの関連エリアを抽出するエリア抽出部と、
　前記関連エリアの特徴を表す第２統計量を取得する第２統計量取得部と、
　前記第１統計量と前記第２統計量とを予め用意された予測モデルに入力することにより、前記予測対象エリアの需要予測値を取得する需要予測部と、
を備える、需要予測装置。
　前記予測対象エリアは、地理的な区画として予め設定されたメッシュ１つ分の領域であり、
　前記関連エリアは、複数の前記メッシュからなる領域である、
請求項１に記載の需要予測装置。
　前記エリア抽出部は、前記予測対象エリアからの距離に基づいて、前記関連エリアを抽出する、
請求項１又は２に記載の需要予測装置。
　前記エリア抽出部は、前記予測対象エリアとの間の移動に要する移動時間に基づいて、前記関連エリアを抽出する、
請求項１又は２に記載の需要予測装置。
　前記第２統計量取得部は、前記過去期間と所定の時間差を有する期間についての統計量であって、前記関連エリアの滞在人口に関する情報を含む前記統計量を、前記第２統計量として取得する、
請求項１～４のいずれか一項に記載の需要予測装置。
　前記第２統計量取得部は、前記予測対象エリアと前記関連エリアとの間の移動に要する移動時間に基づいて、前記所定の時間差を決定する、
請求項５に記載の需要予測装置。
　前記第２統計量取得部は、前記予測対象エリアの需要実績値と前記滞在人口との関係に基づいて、前記所定の時間差を決定する、
請求項５に記載の需要予測装置。
　前記予測モデルを生成するモデル生成部を更に備え、
　前記モデル生成部は、
　少なくとも１つの第１エリアについて、所定の対象期間に関連付けられる前記第１エリアの特徴を表す第１学習用統計量と、前記対象期間よりも後の期間に関連付けられる前記第１エリアの需要実績値とを取得する第１学習用統計量取得部と、
　前記第１エリアとは大きさが異なり、前記第１エリアを包囲する、少なくとも１つの第２エリアを抽出する第２エリア抽出部と、
　前記第２エリアの特徴を表す第２学習用統計量を取得する第２学習用統計量取得部と、
　前記第１学習用統計量及び前記第２学習用統計量と前記第１エリアの前記需要実績値とを関連付けたデータを学習データとして用いた機械学習を実行することにより、前記予測モデルを生成する生成部と、
を有する、請求項１～７のいずれか一項に記載の需要予測装置。