以下、図面と共に本発明に係る渋滞予測モデル作成装置の実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
図1は、本実施形態に係る渋滞予測モデル作成装置100を示す。渋滞予測モデル作成装置100は、学習用人口データと学習用渋滞データとに基づいて、交通渋滞の予測に用いる渋滞予測モデルを作成する。渋滞予測モデル作成装置100は、作成された渋滞予測モデルを用いて、人口データを入力として交通渋滞を予測する。以下では、予め定められた期間(以下、「サンプリング期間」という)内にサンプリングされた元データに基づいて渋滞予測モデルを構築し、当日の全国の地域メッシュごとの人口データを入力として、当日の交通渋滞を予測する場合を例に説明するが、これに限定されない。
人口データとは、ある時刻にある地域にどれくらい人が存在したかを示すデータである。本実施形態では、人口データは、サンプリング時刻と、人の位置(たとば、地域メッシュなど)と、人の属性(例えば、性別、年代、居住地など)とに応じて分類された複数のグループの各々に属する人口を示している。サンプリング時刻は、データのサンプリングを行った時刻である。人の位置及び属性は、データのサンプリングの対象者(以下、単に「サンプリング対象者」という)の位置及び属性である。例えば、人口データは、外部のデータベース等に保存されている、予め携帯端末の定期的にサンプリングされた位置情報と当該携帯端末のユーザの属性についての登録情報とから生成される。本実施形態では、人口データは、図2に示したように、「時刻」、「位置識別番号」、「性別」、「年代」、「居住地」、及び「人口」の項目で構成される。
「時刻」では、データのサンプリングを行った日付と時刻が示される。「位置識別番号」では、サンプリング対象者の位置を識別する番号が示される。例えば、「位置識別番号」として、「JIS X 0410 地域メッシュコード」が用いられる。「位置識別番号」には、第2次メッシュ、第3次メッシュ、又は2分の1地域メッシュ等の地域メッシュコードが用いられてもよいし、居住地の都道府県コード又は市区町村コードが用いられてもよい。本実施形態では、「位置識別番号」として2分の1地域メッシュが用いられるため、位置識別番号は約150万種類に分類されている。
「性別」では、サンプリング対象者の性別が示される。「年代」では、サンプリングの対象者の年齢区分が示される。本実施形態では、「年代」は、20歳以下、21〜25歳、26〜30歳、31〜35歳、36〜40歳、41〜45歳、46〜50歳、51〜55歳、56〜60歳、61〜65歳、66〜70歳、71〜75歳、76歳以上の13種類に分類されている。「居住地」では、サンプリングの対象者の居住地が示される。「居住地」には、第2次メッシュ、第3次メッシュ、又は2分の1地域メッシュ等の地域メッシュコードが用いられてもよいし、居住地の都道府県コード又は市区町村コードが用いられてもよい。本実施形態では、「居住地」として、約2000個に分類された市区町村コードが用いられる。
本実施形態では、人口データは、人の位置に相当する「位置識別番号」と、人の属性に相当する、「性別」、「年代」、及び「居住地」とに応じて複数のグループに分類される。このため、人口データは、約150万×2×13×約2000のグループに分類され得る。すなわち、人の位置及び属性の組み合わせを変数とする空間は、理論上、約800億次元に及ぶ。
渋滞データとは、位置に応じた渋滞状況を示すデータであり、渋滞情報を管理する外部のデータベースに予め保存されている。例えば、渋滞データは、道路(例えば、全国の主要な道路)が予め区分けされた区間(いわゆるリンク)ごとに、図3に示したように、「渋滞発生日付」、「開始時刻」、「終了時刻」、「最大渋滞長」、及び「渋滞ピーク時刻」の項目で構成されている。本実施形態では、上述した予め区分けされた区間(以下、単に「位置」という)が予測の対象とされる。「渋滞発生日付」では、対象の位置で渋滞が発生した日付が示される。「開始時刻」では、対象の位置で渋滞が発生した時刻が示される。「終了時刻」では、対象の位置で渋滞が終了した時刻が示される。「最大渋滞長」では、対象の位置で発生した渋滞が開始時刻から終了時刻までの間で、最大となった渋滞の長さが示される。「渋滞ピーク時刻」では、最大渋滞長に達した時刻が示される。
学習用人口データ取得部111は、渋滞予測モデル作成装置100の外部から、渋滞予測モデルの構築に用いられる学習用の人口データ(以下、「学習用人口データ」という)を取得する。学習用人口データ取得部111は、予め定められたサンプリング期間内にサンプリングされた学習用人口データを渋滞予測に用いる元データとして取得する。学習用人口データは、例えば、外部のデータベースに記録された全国の過去の人口データであり、サンプリング時刻と人の位置と人の属性とに応じて分類された複数のグループに分かれている。本実施形態では、学習用人口データ取得部111は、日毎に正午にサンプリングされた学習用人口データのみを取得する。学習用人口データ格納部112は、学習用人口データ取得部111に入力された学習用人口データを格納する。
学習用渋滞データ取得部113は、渋滞予測モデル作成装置100の外部から、渋滞予測モデルの構築に用いられる学習用の渋滞データ(以下、「学習用渋滞データ」という)を取得する。学習用渋滞データ取得部113は、予め定められたサンプリング期間内にサンプリングされた、渋滞予測位置における学習用渋滞データを渋滞予測に用いる元データとして取得する。学習用渋滞データは、例えば、外部のデータベースに記録された過去の渋滞データのうち、交通渋滞を予測する渋滞予測位置に応じた渋滞状況を示す。学習用渋滞データ格納部114は、学習用渋滞データ取得部113に入力された学習用渋滞データを格納する。
渋滞予測モデル構築部115は、学習用人口データ格納部112及び学習用渋滞データ格納部114を参照して、位置ごとに、交通渋滞の予測に用いる渋滞予測モデルを構築する。渋滞予測モデル構築部115は、変数選択部116、次元圧縮部117、予測用回帰式作成部118を有する。
以下、渋滞予測モデル構築部115が、ある渋滞予測位置について、学習用渋滞データの「渋滞発生日付」、「開始時刻」、「終了時刻」、「最大渋滞長」、及び「渋滞ピーク時刻」の項目のそれぞれに基づいて、渋滞予測モデルを構築する例について説明する。具体的には、渋滞予測モデル構築部115は、当該渋滞予測位置についての「渋滞発生日付」ごとの学習用渋滞データに基づいて渋滞予測対象となる日の渋滞の有無を予測する渋滞予測モデルを構築する。また、渋滞予測モデル構築部115は、当該渋滞予測位置についての「開始時刻」に基づいて渋滞の開始時刻を予測する渋滞予測モデルを構築する。また、渋滞予測モデル構築部115は、当該渋滞予測位置についての「終了時刻」に基づいて渋滞の終了時刻を予測する渋滞予測モデルを構築する。また、渋滞予測モデル構築部115は、「最大渋滞長」に基づいて渋滞の最大渋滞長を予測する渋滞予測モデルを構築する。また、渋滞予測モデル構築部115は、「渋滞ピーク時刻」に基づいて渋滞ピーク時刻を予測する渋滞予測モデルを構築する。即ち、渋滞予測モデル構築部115は、渋滞予測位置ごとに5つの渋滞予測モデルを構築する。
渋滞予測モデル構築部115では、渋滞予測位置における学習用渋滞データの上述した各項目の値に基づいて求めた数値を用いて、渋滞予測モデルを構築する。例えば、渋滞の有無を予測する渋滞予測モデルを構築する場合には、渋滞予測モデル構築部115は、上記サンプリング期間内のうち、学習用渋滞データにおいて渋滞予測位置に渋滞があったと判断される日付(当該渋滞予測位置についての学習用渋滞データがある日付)における渋滞の有無を示す数値を「1」とし、学習用渋滞データにおいて渋滞予測位置に渋滞がなかったと判断される日付(当該渋滞予測位置についての学習用渋滞データがない日付)における渋滞の有無を示す数値を「0」として取り扱う。渋滞の開始時刻を予測する渋滞予測モデルを構築する場合には、渋滞予測モデル構築部115は、サンプリング期間内の渋滞予測位置における学習用渋滞データの「開始時刻」の値を周知の手法で数値化する。渋滞の終了時刻を予測する渋滞予測モデルを構築する場合には、渋滞予測モデル構築部115は、サンプリング期間内の渋滞予測位置における学習用渋滞データの「終了時刻」の値を周知の手法で数値化する。渋滞の最大渋滞長を予測する渋滞予測モデルを構築する場合には、渋滞予測モデル構築部115は、サンプリング期間内の渋滞予測位置における学習用渋滞データの「最大渋滞長」の値を上記数値として取り扱う。渋滞ピーク時刻を予測する渋滞予測モデルを構築する場合には、渋滞予測モデル構築部115は、サンプリング期間内の渋滞予測位置における学習用渋滞データの「渋滞ピーク時刻」の値を周知の手法で数値化する。
変数選択部116は、学習用人口データ格納部112に格納されている学習用人口データ(例えば、地域メッシュごとの全国の学習用人口データ)から渋滞と関連のあるグループの学習用人口データ(説明変数)を選択する。以下に、変数選択部116が行う処理を具体的に説明する。
変数選択部116は、まず、サンプリング期間内の学習用人口データをグループごとに正規化する。例えば、変数選択部116は、学習用人口データの各グループにおける人口を、上記サンプリング期間内の全時刻に関し、各グループにおいて平均が0で分散が1となる値に変換する。学習用人口データを正規化することによって、各グループの普段の人口の規模に応じた、人口の増減の割合が適切に判断され得る。
以降、正規化された学習用人口データを、単に「学習用人口データ」という。渋滞の有無を示す数値、「開始時刻」を示す数値、「終了時刻」を示す数値、「最大渋滞長」を示す数値、及び「渋滞ピーク時刻」を示す数値を纏めて、単に「学習用渋滞データ」という。
変数選択部116は、グループごとの学習用人口データを説明変数とし、学習用渋滞データを目的変数とするロジスティック回帰を行う。変数選択部116は、構築する渋滞予測モデルごとに、互いに同日の情報を示す学習用人口データと学習用渋滞データとを1セットとして、サンプリング期間の複数セットを用いて、ロジスティック回帰を行う。例えば、変数選択部116は、「開始時刻」を示す数値を目的変数としてロジスティック回帰を行う。変数選択部116は、ロジスティック回帰の結果において、上位n位までの係数の絶対値が大きい説明変数を選択する。nは、パラメータであり、ユーザが任意に変更できる。nは、例えば、数百に設定される。変数選択部116が行われる変数選択は、上述したロジスティック回帰を用いた手法に限定されない。例えば、lasso回帰などのパラメトリックな回帰を用いてもよいし、相関係数の値によって選択してもよい。
次元圧縮部117は、変数選択部116で選択されたグループの学習用人口データを説明変数とし、学習用渋滞データを目的変数として、PLS回帰によって座標変換を行う。次元圧縮部117は、構築する渋滞予測モデルごとに、互いに同日の情報を示す変数選択部116で選択された学習用人口データと学習用渋滞データとを1セットとして、サンプリング期間の複数セットを用いて、PLS回帰を行う。例えば、次元圧縮部117は、「開始時刻」を示す数値を目的変数としてPLS回帰を行う。これによって、次元圧縮部117は、目的変数に対する寄与度が上位m位の説明変数に次元圧縮を行う。mは、パラメータであり、ユーザが任意に変更できる。mは、例えば、5〜100程度に設定される。この結果、変数選択部116で選択された説明変数で似た動きをする説明変数が組み合わされて低次元のデータに変換されるため、予測用回帰式作成部118において、次元の呪いによる精度悪化を防ぐことができる。次元圧縮部117で用いられる回帰は、PLS回帰に限られない。PLS回帰の代わりに、例えば、PCA、NMFなどを用いてもよい。
予測用回帰式作成部118は、次元圧縮部117で次元圧縮を行った学習用人口データと学習用渋滞データとに基づいて、渋滞予測に用いる予測用回帰式(渋滞予測モデル)を作成する。予測用回帰式作成部118は、次元圧縮部117で変換された変数を説明変数とし、学習用渋滞データを目的変数として、渋滞予測モデルを作成する。予測用回帰式作成部118は、構築する渋滞予測モデルごとに、互いに同日の情報を示す次元圧縮部117で変換された変数の値と学習用渋滞データとを1セットとして、サンプリング期間の複数セットを用いて、渋滞予測モデルを作成する。例えば、予測用回帰式作成部118は、次元圧縮部117で次元圧縮を行った学習用人口データと「開始時刻」を示す数値とに基づいて、渋滞の開始時刻を予測する予測用回帰式(渋滞予測モデル)を作成する。すなわち、渋滞予測モデル構築部115は、低次元化されたデータから渋滞の値を予測するための渋滞予測モデルを作成する。具体的には、予測用回帰式作成部118は、最近傍のサンプルの距離による重み付平均を用いたk近傍回帰を行う。
最近傍点の数は、パラメータであり、ユーザが任意に変更できる。最近傍点の数は、例えば、2〜100程度に設定される。予測用回帰式作成部118で用いられる回帰は、k近傍回帰に限られない。k近傍回帰の代わりに、例えば、線形回帰、SVR回帰などのパラメトリックな手法を用いてもよいし、決定木などノンパラメトリックな手法を用いてもよい。なお、人口データと渋滞データとの関係は非線形であるため、k近傍回帰などのノンパラメトリックな手法で回帰分析を行うことで、パラメトリックな手法を用いるよりも高い精度で渋滞予測を行うことが可能な渋滞予測モデルを作成できる。
渋滞予測モデル格納部119は、渋滞予測モデル構築部115によって構築された渋滞予測モデルを格納する。本実施形態では、渋滞予測モデル格納部119は、渋滞予測位置ごとに、渋滞予測対象となる日の渋滞の有無を予測する渋滞予測モデル、渋滞の開始時刻を予測する渋滞予測モデル、渋滞の終了時刻を予測する渋滞予測モデル、渋滞の最大渋滞長を予測する渋滞予測モデル、及び渋滞ピーク時刻を予測する渋滞予測モデルを格納する。渋滞予測モデル格納部119は、渋滞予測モデルごとに、変数選択部116によって選択されたグループと、次元圧縮部117で行われた座標変換を行うための情報とを格納する。
以上のように、渋滞予測モデル構築部115は、グループごとの学習用人口データを説明変数とし、学習用渋滞データを目的変数とする回帰分析を行う。これによって、渋滞予測モデル構築部115は、複数のグループの中から、渋滞予測位置における渋滞データに対する寄与度が相対的に高いグループの学習用人口データを選択する。渋滞予測モデル構築部115は、選択された人口データと渋滞予測位置における渋滞データとに基づいて、回帰分析で渋滞予測モデルを構築する。
渋滞予測位置取得部120は、渋滞予測モデル作成装置100の外部から渋滞予測位置を取得する。渋滞予測位置取得部120は、不図示の入力デバイスによって、ユーザが入力した渋滞予測位置を取得してもよい。
予測用人口データ取得部121は、交通渋滞の予測に用いる予測用人口データを取得する。予測用人口データは、予め決められた所定日時の人口データであり、例えば、取得可能な人口データのうち最新の人口データ、当日の所定時刻の人口データ等である。本実施形態では、予測用人口データ取得部121は、渋滞予測を行う当日の正午にサンプリングされた人口データを取得する。
交通渋滞予測部122は、渋滞予測モデル格納部119に格納されている渋滞予測モデル、並びに、渋滞予測位置取得部120及び予測用人口データ取得部121によって取得された各データを用いて交通渋滞を予測する。交通渋滞予測部122は、渋滞予測位置取得部120によって取得された渋滞予測位置に対応する渋滞予測モデルを渋滞予測モデル格納部119から取得する。本実施形態では、交通渋滞予測部122は、予測用人口データ(例えば、当日の人口データ)を入力とし、渋滞予測モデル格納部119から取得された渋滞予測モデルを用いて、渋滞予測時間における渋滞予測位置の渋滞予測結果を出力する。渋滞予測対象となる日の渋滞の有無を予測する渋滞予測モデル、渋滞の開始時刻を予測する渋滞予測モデル、渋滞の終了時刻を予測する渋滞予測モデル、渋滞の最大渋滞長を予測する渋滞予測モデル、及び渋滞ピーク時刻を予測する渋滞予測モデルの各々に対して予測用人口データを当て嵌めることで、各渋滞予測が行われる。例えば、交通渋滞予測部122は、予測用人口データにおける複数のグループのうち、変数選択部116によって選択された学習用人口データのグループに対応するグループを選択し、次元圧縮部117で行われた座標変換と同様の座標変換を行い、予測用回帰式作成部118で作成された回帰式に代入する。
交通渋滞予測部122は、例えば、渋滞予測対象となる日の渋滞の有無を予測する渋滞予測モデルに予測用人口データを当て嵌めることで予測値を得る。予測値は、予測用回帰式作成部118で作成された回帰式から得られる0〜1の数値である。交通渋滞予測部122は、得られた予測値が予め定められた閾値以上である場合に渋滞ありと判断し、当該予測値が予め定められた閾値未満である場合に渋滞なしと判断する。
交通渋滞予測部122は、渋滞ありと判断した場合に、渋滞の開始時刻を予測する渋滞予測モデル、渋滞の終了時刻を予測する渋滞予測モデル、渋滞の最大渋滞長を予測する渋滞予測モデル、及び渋滞ピーク時刻を予測する渋滞予測モデルに、予測用人口データを当て嵌めることで予測値を得る。図4(a)は、渋滞ありと判断された場合における、交通渋滞予測部122からの予測結果の出力例を示している。例えば、図4(a)に示されているように、「渋滞発生有無」の項目については「渋滞あり」を示す値が出力され、「開始時刻」、「終了時刻」、「最大渋滞長」、及び「渋滞ピーク時刻」の項目についてはそれぞれ導出された結果を出力する。
交通渋滞予測部122は、渋滞なしと判断した場合に、「開始時刻」、「終了時刻」、「最大渋滞長」、及び「渋滞ピーク時刻」の予測を行わない。図4(b)は、渋滞なしと判断された場合における、交通渋滞予測部122からの予測結果の出力例を示している。例えば、図4(b)に示されているように、「渋滞発生有無」の項目については「渋滞なし」を示す値が出力され、予測を行っていない「開始時刻」、「終了時刻」、「最大渋滞長」、及び「渋滞ピーク時刻」の項目はNULLとなる。
交通渋滞予測結果表示部123は、交通渋滞予測部122によって予測された交通渋滞の予測結果をディスプレイ124に表示する。図5(a)は、渋滞ありと判断され図4(a)に示した値が交通渋滞予測部122から出力された場合にディスプレイ124に表示される表示例を示している。図5(b)は、渋滞なしと判断された場合にディスプレイ124に表示される表示例を示している。
次に、図6を参照して、本実施形態に係る渋滞予測モデル作成装置100の動作について説明する。図6は、渋滞予測モデル作成装置100が行う処理を示すフローチャートである。
ステップS101において、渋滞予測モデル作成装置100は、渋滞予測位置取得部120によって渋滞予測位置を取得する。続いて、渋滞予測モデル作成装置100は、ステップS102に処理を進める。
ステップS102において、渋滞予測モデル作成装置100は、予測用人口データ取得部121によって予測用人口データを取得する。続いて、渋滞予測モデル作成装置100は、ステップS103に処理を進める。
ステップS103において、渋滞予測モデル作成装置100は、ステップS101で取得された渋滞予測位置に対応する渋滞予測モデルが渋滞予測モデル格納部119に存在するか判定する。ステップS101で取得された渋滞予測位置に対応する渋滞予測モデルが渋滞予測モデル格納部119に存在する場合(ステップS103でYES)、渋滞予測モデル作成装置100は、ステップS105に処理を進める。ステップS101で取得された渋滞予測位置に対応する渋滞予測モデルが渋滞予測モデル格納部119に存在しない場合(ステップS103でNO)、渋滞予測モデル作成装置100は、ステップS104に処理を進める。
ステップS104において、渋滞予測モデル作成装置100は、後述する渋滞予測モデル構築処理を行う。続いて、渋滞予測モデル作成装置100は、ステップS105に処理を進める。
ステップS105において、渋滞予測モデル作成装置100は、ステップS101で取得された渋滞予測位置と、ステップS102で取得された予測用人口データと、渋滞予測モデル格納部119に格納されている渋滞予測モデルとから、渋滞予測位置における交通渋滞の予測を行う。続いて、渋滞予測モデル作成装置100は、ステップS106に処理を進める。
ステップS106において、渋滞予測モデル作成装置100は、ステップS105において行った交通渋滞の予測結果をディスプレイ124に表示する。渋滞予測モデル作成装置100は、ステップS106が終了すると、全体の処理を終了する。
次に、図7を参照して、ステップS104における渋滞予測モデル構築処理について説明する。図7は、渋滞予測モデル作成装置100が行う渋滞予測モデル構築処理を示すフローチャートである。
ステップS111において、渋滞予測モデル作成装置100は、学習用人口データが学習用人口データ格納部112に存在するか判定する。学習用人口データが学習用人口データ格納部112に存在する場合(ステップS111でYES)、渋滞予測モデル作成装置100は、ステップS114に処理を進める。学習用人口データが学習用人口データ格納部112に存在しない場合(ステップS111でNO)、渋滞予測モデル作成装置100は、ステップS112に処理を進める。
ステップS112において、渋滞予測モデル作成装置100は、学習用人口データ取得部111によって予め定められたサンプル期間内にサンプリングされた学習用人口データを取得し、ステップS113に処理を進める。
ステップS113において、渋滞予測モデル作成装置100は、ステップS112で取得した学習用人口データを学習用人口データ格納部112に格納し、ステップS114に処理を進める。
ステップS114において、渋滞予測モデル作成装置100は、ステップS101で取得した渋滞予測位置の学習用渋滞データが学習用渋滞データ格納部114に存在するか判定する。渋滞予測モデル作成装置100は、ステップS101で取得した渋滞予測位置の学習用渋滞データが学習用渋滞データ格納部114に存在する場合(ステップS114でYES)、ステップS117に処理を進める。渋滞予測モデル作成装置100は、ステップS101で取得した渋滞予測位置の学習用渋滞データが学習用渋滞データ格納部114に存在しない場合(ステップS114でNO)、ステップS115に処理を進める。
ステップS115において、渋滞予測モデル作成装置100は、学習用渋滞データ取得部113によって、予め定められたサンプリング期間内にサンプリングされた、ステップS101で取得した渋滞予測位置における学習用渋滞データを取得し、ステップS116に処理を進める。
ステップS116において、渋滞予測モデル作成装置100は、ステップS115で取得した学習用渋滞データを学習用渋滞データ格納部114に格納し、ステップS117に処理を進める。
ステップS117において、渋滞予測モデル作成装置100は、学習用人口データ格納部112からサンプリング期間内の学習用人口データを取得し、学習用渋滞データ格納部114からサンプリング期間内の渋滞予測位置における学習用渋滞データを取得する。続いて、渋滞予測モデル作成装置100は、ステップS118に処理を進める。
ステップS118において、渋滞予測モデル作成装置100は、変数選択部116で回帰分析を行うことで、渋滞予測位置における渋滞データに対する寄与度が相対的に高いグループの学習用人口データを選択する。続いて、渋滞予測モデル作成装置100は、ステップS119に処理を進める。
ステップS119において、渋滞予測モデル作成装置100は、次元圧縮部117で回帰分析を行うことで、次元圧縮を行う。続いて、渋滞予測モデル作成装置100は、ステップS120に処理を進める。
ステップS120において、渋滞予測モデル作成装置100は、次元圧縮部117で次元圧縮を行った学習用人口データと学習用渋滞データとに基づいて、渋滞予測モデルである予測用回帰式を作成する。続いて、渋滞予測モデル作成装置100は、ステップS121に処理を進める。
ステップS121において、渋滞予測モデル作成装置100は、変数選択、次元圧縮、予測用回帰式の作成の3つのステップ(ステップS118、ステップS119、ステップS120)で構築された渋滞予測モデルを渋滞予測モデル格納部119に格納する。渋滞予測モデル作成装置100は、ステップS121が終了すると、渋滞予測モデル構築処理を終了する。
次に、本実施形態に係る渋滞予測モデル作成装置100の作用及び効果について説明する。
渋滞予測モデル作成装置100は、人口データと渋滞データとに基づいて、回帰分析で渋滞予測モデルを構築する。人口データを用いることで、交通渋滞の様々な要因に対応し得る。このため、渋滞予測の誤差を低減することができる。例えば、人口データは、現在走行状態にないが予測時刻に走行状態になる自動車の数にも相関している。渋滞予測モデル作成装置100は、上記渋滞予測モデルと交通渋滞の予測に用いる予測用人口データとに基づいて交通渋滞を予測するため、渋滞予測の誤差を低減して渋滞予測の精度が向上され得る。
また、上述したように、本実施形態では、人の位置に相当する「位置識別番号」と、人の属性に相当する、「性別」、「年代」、及び「居住地」とに応じてグループを分類する。本実施形態では、「位置識別番号」は約150万通り、「性別」は2通り、「年代」は13通り、及び「居住地」は約2000通りある。この場合、人口データは、約150万×2×13×約2000のグループに分類され得る。すなわち、人の位置及び属性の組み合わせを変数とする空間は、理論上、約800億次元に及ぶ。これらのグループの人口データの多くは、予測対象位置の渋滞への影響が非常に小さく予測のノイズとなる。
渋滞予測モデル作成装置100は、回帰分析を用いて、渋滞予測位置における渋滞データに対する寄与度が高いグループの人口データを選択し、選択された人口データと渋滞データとに基づいて回帰分析で渋滞予測モデルを構築する。すなわち、渋滞予測モデル作成装置100は、渋滞に関連のあるグループの人口データ(説明変数)を選択する。このため、渋滞予測の精度が確保されながら、渋滞予測モデルの構築に要する演算量の増加が抑制され得る。例えば、東京の道路の渋滞に沖縄にいる人はほとんど影響しないため、人の位置が沖縄であるグループ以外の人口データを選択することで、渋滞予測モデルの構築に要する演算量を低減できる。以上のように、渋滞予測モデル作成装置100では、渋滞予測精度の向上と演算量の増加の抑制とが両立され得る。
人口データにおける人の属性は、当該人(サンプリング対象者)の居住地を含んでいる。この場合、居住地に帰る人によって生じる渋滞、すなわち、所謂Uターンラッシュの予測を行うことができる。例えば、お昼に木更津のアウトレットモールにいる東京及び神奈川に居住の人の人口から、アクアラインの夕方の渋滞を予測することができる。
渋滞予測モデル作成装置100は、渋滞予測位置を取得し、取得された渋滞予測位置に対応する渋滞予測モデルが渋滞予測モデル格納部119に存在しない場合に、取得された渋滞予測位置に対応する渋滞予測モデルを構築する。すなわち、必要に応じて渋滞予測モデルを構築するため、渋滞予測モデルを構築する演算量が低減され得る。また、最新の学習用人口データを用いて、渋滞予測モデルを構築することができる。
人口の増減数が同じでも、普段の人口の規模が大きい地域ほど、人口の増減数と渋滞との関連性は低いと考えられる。例えば、普段の人口が10000人の地域と普段の人口が500人の地域とでは、500人の増減があった場合の渋滞発生への影響度合いは異なると想定される。変数選択部116は、学習用人口データの各グループにおける人口を、上記サンプリング期間内の全時刻に関し、各グループにおいて平均が0で分散が1となる値に変換する。このように、上記サンプリング期間内の学習用人口データをグループごとに正規化することよって、各グループの普段の人口の規模に応じた人口の増減の割合が適切に判断され得る。したがって、上述したように学習用人口データを正規化した後に、変数選択を行うことで、各グループの普段の人口の規模を考慮して渋滞予測の精度を更に向上することができる。
なお、上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
例えば、本発明の一実施の形態における渋滞予測モデル作成装置は、本実施形態における処理を行うコンピュータとして機能してもよい。図8は、本発明の一実施の形態に係る渋滞予測モデル作成装置のハードウェア構成の一例を示す図である。上述した渋滞予測モデル作成装置100は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。渋滞予測モデル作成装置100のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
渋滞予測モデル作成装置100における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。例えば、変数選択部116、次元圧縮部117、予測用回帰式作成部118、交通渋滞予測部122、渋滞予測結果表示部123などは、プロセッサ1001で実現されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、変数選択部116、次元圧縮部117、予測用回帰式作成部118、交通渋滞予測部122、渋滞予測結果表示部123は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本発明の一実施の形態に係る方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD−ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu−ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。
通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。例えば、学習用人口データ取得部111、学習用渋滞データ取得部113、渋滞予測位置取得部120、予測用人口データ取得部121などは、通信装置1004で実現されてもよい。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
また、渋滞予測モデル作成装置100は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
以上、本発明について詳細に説明したが、当業者にとっては、本発明が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本発明は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本発明に対して何ら制限的な意味を有するものではない。
例えば、上述した実施形態では、渋滞予測モデル作成装置100は、渋滞予測モデルを作成し、当該渋滞予測モデルを用いて交通渋滞の予測を行うことで交通渋滞予測装置として機能する。しかし、渋滞予測モデルの作成と交通渋滞の予測とを別の装置で行う構成であってもよい。
学習用人口データ及び予測用人口データは、現実の人口データであってもよいし、架空の人口データであってもよい。
上述した実施形態では、学習用人口データ取得部111が、外部から学習用人口データを取得し、学習用人口データ格納部112に格納する構成について説明したが、これに限定されない。例えば、学習用人口データ格納部112が予め学習用人口データを格納しており、学習用人口データ取得部111が学習用人口データ格納部112から学習用人口データを取得して渋滞予測モデル構築部115に当該データを渡す構成であってもよい。
上述した実施形態では、学習用渋滞データ取得部113が、外部から学習用渋滞データを取得し、学習用渋滞データ格納部114に格納する構成について説明したが、これに限定されない。例えば、学習用渋滞データ格納部114が予め渋滞データを格納しており、学習用渋滞データ取得部113が学習用渋滞データ格納部114から学習用渋滞データを取得して渋滞予測モデル構築部115に当該データを渡す構成であってもよい。
上述した実施形態では、学習用人口データ取得部111は、各日で正午にサンプリングされた人口データを取得するが、数日置きの人口データを取得してもよいし、各日で複数の時刻にサンプリングされた人口データを取得してもよい。学習用人口データ取得部111が各日で複数の時刻にサンプリングされた人口データを取得する場合、人口データが分類され得るグループの数は更に増加する。この場合であっても、渋滞予測モデル作成装置100は、渋滞に関連のあるグループの人口データを選択するため、渋滞予測モデルの構築に要する演算量の増加が抑制され得る。
予測用人口データ取得部121によって取得される人口データのサンプリング時刻は、学習用人口データ取得部111によって取得された人口データのサンプリング時刻に対応していればよい。したがって、予測用人口データ取得部121によって取得される人口データは、正午にサンプリングされた人口データに限定されない。
上述した、渋滞予測モデル構築部115は、予測日の交通渋滞を予測するものであるとしたが、それ以外の予め定めた所定時間幅内における交通渋滞を予測する渋滞予測モデルを構築するように構成されてもよい。この場合、変数選択部116、次元圧縮部117、予測用回帰式作成部118では、当該所定時間幅に応じた渋滞データを学習用渋滞データとして用いる。
上述した実施形態では、渋滞予測モデル構築部115は、次元圧縮部117によって次元圧縮を行った。しかし、渋滞予測モデル構築部115が次元圧縮部117を有していなくともよく、次元圧縮は行われなくてもよい。
上述した実施形態では、変数選択部116は、学習用人口データをグループごとに正規化した後に、変数選択を行った。しかし、学習用人口データの正規化は、行われなくてもよい。
渋滞予測モデル作成装置100は、渋滞予測位置を取得する度に、取得された渋滞予測位置に対応する渋滞予測モデルを構築してもよい。これによって、毎回、最新の学習用人口データを用いて、渋滞予測モデルを構築することができる。
本明細書で説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE−A(LTE-Advanced)、SUPER 3G、IMT−Advanced、4G、5G、FRA(Future Radio Access)、W−CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi−Fi)、IEEE 802.16(WiMAX)、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及び/又はこれらに基づいて拡張された次世代システムに適用されてもよい。
本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本明細書で説明したデータは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
また、本明細書で説明したデータ、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。例えば、無線リソースはインデックスで指示されるものであってもよい。上述したパラメータに使用する名称はいかなる点においても限定的なものではない。
本明細書で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
「含む(include)」、「含んでいる(including)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。