JP5946394B2 - 複数種類のデータソースを用いた経路の始点・終点の統計的推測手法、コンピュータ・プログラム及びコンピュータ。 - Google Patents

複数種類のデータソースを用いた経路の始点・終点の統計的推測手法、コンピュータ・プログラム及びコンピュータ。 Download PDF

Info

Publication number
JP5946394B2
JP5946394B2 JP2012247403A JP2012247403A JP5946394B2 JP 5946394 B2 JP5946394 B2 JP 5946394B2 JP 2012247403 A JP2012247403 A JP 2012247403A JP 2012247403 A JP2012247403 A JP 2012247403A JP 5946394 B2 JP5946394 B2 JP 5946394B2
Authority
JP
Japan
Prior art keywords
area
point
learning
prediction model
landmark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012247403A
Other languages
English (en)
Other versions
JP2014096039A (ja
Inventor
哲郎 森村
哲郎 森村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2012247403A priority Critical patent/JP5946394B2/ja
Priority to US14/057,142 priority patent/US9292800B2/en
Publication of JP2014096039A publication Critical patent/JP2014096039A/ja
Priority to US14/977,842 priority patent/US20160110654A1/en
Application granted granted Critical
Publication of JP5946394B2 publication Critical patent/JP5946394B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/0112Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Traffic Control Systems (AREA)

Description

本発明は、情報処理技術に関係し、より詳しくは、複数種類のデータソースを用い、経路の始点・終点を統計的に推定する技術に係る。
都市レベルの広範な地域で精度の良い交通シミュレーションを行うためには、広域かつ粒度の細かい(例えば、交差点単位)クルマや人の移動経路の始点・終点(OD)を得る必要がある。
特開平6−266993号公報 特開2008−282161号公報
しなしながら、センサスデータを用いる既存の広域OD推定手法はその粒度が地区レベル(例えば、数百交差点単位)の推定に限られる。一方、プローブデータを用いれば、その粒度が交差点単位のODを推定することは可能であるが、一般に、広域のプローブデータはその入手が困難であり、結果として、対象は比較的狭い領域(例えば、交差点数~数千)に限られる。
本発明はこのような課題に鑑みてなされたものであり、その目的は、広域で入手が比較的容易なランドマーク情報を用いて、限られた地域のプローブデータを汎化し、広域において粒度の細かい始点・終点(OD)を推定する技術を提供することにある。さらに、センサスデータを用いることで、その学習精度、予測精度を高める技術を提供することにある。
すなわち本発明は、コンピュータにより未知の経路の始点及び終点を予測する方法であり、第二領域に含まれる既知の目印の種類及びその位置を含む第二目印情報の入力を受け付けるステップと、前記第二目印情報に基づいて、前記第二領域に含まれる各地点の第二特徴ベクトルを生成するステップと、第一領域に含まれる既知の目印の種類及びその位置を含む第一目印情報と前記第一領域に含まれる既知の始点及び終点の情報とに基づいて得られる予測モデルと、前記第二特徴ベクトルとに基づいて、前記第二領域に含まれる各地点が前記始点及び前記終点となる確率を予測するステップとを備えるものである。
ここで、第一領域に含まれる既知の目印の種類及びその位置を含む第一目印情報と前記第一領域に含まれる既知の始点及び終点の情報とに基づいて予測モデルを学習するステップを更に備えることもできる。この前記予測モデルを学習するステップは、前記第一領域に含まれる既知の目印の種類及びその位置を含む第一目印情報の入力を受け付けるステップと、前記第一目的情報に基づいて、前記第一領域に含まれる各地点の第一特徴ベクトルを生成するステップとを更に備えることもできる。また、前記予測モデルを学習するステップは、緯度経度の時系列データを複数含むプローブデータの入力を受け付けるステップと、前記各時系列データの開始時及び終了時に対応する緯度経度に基づいて、前記第一領域に含まれる各地点が前記始点又は前記終点となった数をカウントするステップとを更に備えることができる。
また、前記予測モデルは、前記第一特徴ベクトルを説明変数とし、前記第一領域に含まれる各地点が前記始点又は前記終点となった数を目的変数として回帰するものとすることができる。この予測モデルは、前記各地点について、前記始点となる前記経路数がoである確率モデルと、前記終点となる前記経路数がdである確率モデルとそれぞれ異なる態様でモデル化することができる。また、前記予測モデルは、前記各地点について、地点iが前記始点で、地点jが前記終点となる前記経路数がdijである確率モデルとしてモデル化することもできる。
さらに、前記予測モデルは、前記各地点について、前記始点又は前記終点となる経路数がnである確率がポアソン分布に従うものとしてモデル化することができる。また、前記予測モデルを学習するステップは、前記第一領域に含まれる既知の目印の種類及びその位置を含む第一目印情報の入力を受け付けるステップと、前記第一目的情報に基づいて、前記第一領域に含まれる各地点の第一特徴ベクトルを生成するステップとを更に備え、前記予測モデルは、前記ポアソン分布のパラメータμの対数を、前記第一特徴ベクトルで線形近似することができる。その線形近似式は、各地点iでの前記ポアソン分布のパラメータμi、第一特徴ベクトルφi、学習パラメータθ、ベースラインbとして、
logμi(θ)=ωTφi+bと表すことができる。
また、前記予測モデルを学習するステップは、前記第一領域に含まれ、複数の地点を包含する既知の前記経路の始エリア及び終エリアの第一エリア情報の入力を受け付けるステップと、前記第一エリア情報に基づいて、前記ベースラインを調整するステップとを更に備えることができる。
また、前記予測モデルを学習するステップは、負の対数尤度を目的関数として最小化することで、パラメータθを学習するステップを更に備えることができる。また、前記予測モデルを学習するステップは、正則化項付き負の対数尤度を目的関数として最小化することで、パラメータθを学習するステップを更に備えることができる。
また、前記予測モデルを学習するステップは、前記目的関数を現在のパラメータ推定値周りで二次のテイラー近似を行うステップと、前記二次のテイラー近似を行った目的関数Lを最小にする値にパラメータを更新するステップとを備えることができる。
また、前記第二領域に含まれる各地点が前記始点及び前記終点となる確率を予測するステップは、前記第二領域に含まれ、複数の地点を包含する既知の前記経路の始エリア及び終エリアの第二エリア情報の入力を受け付けるステップと、前記第二エリア情報に基づいて、各エリアでの始エリア発生数確率及び終エリア発生確率を求めるステップと、前記始エリア発生数確率及び終エリア発生確率に基づいて、各地点が前記始点及び前記終点となる確率を予測するステップを更に備えることができる。
また、前記経路は、自動車又は人による経路であり、前記地点は、道路上の交差点でもよい。また、前記第二領域は、前記第一領域に比べて広域とすることができる。前記第二領域は、前記第一領域を含んでもよいし、含まなくてもよい。
本発明コンピュータ・プログラム、コンピュータ・システムとして把握した場合にも、上述した本発明を方法として把握した場合と実質的に同一の技術的特徴を備える事ができる。
本発明によれば、広域で入手が比較的容易なランドマークデータを用いて、限られた地域のプローブデータを汎化し、広域において粒度の細かい始点・終点(OD)を推定する技術を提供することができる。さらに、センサスデータを用いることで、その学習精度や推定精度を高めることができる。
コンピュータのハードウェア構成を説明するブロック図 コンピュータの機能を説明するブロック図 コンピュータの処理を模式化した図 コンピュータが実行する基本的処理を示すフローチャート 学習フェーズを説明するフローチャート 予測フェーズを説明するフローチャート
実施形態
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて(特段の断りのない限り)同じ要素には同じ番号を付している。
図1は、本実施形態に係るパーソナル・コンピュータ(コンピュータ)1のハードウェア構成を説明するブロック図である。コンピュータ1のハードウェア構成は、(低速及び高速の)バス10、バス10に接続されるCPU(演算制御装置)11、RAM(ランダム・アクセス・メモリ:記憶装置)12、ROM(リード・オンリ・メモリ:記憶装置)13、HDD(ハード・ディスク・ドライブ:記憶装置)14、通信インタフェース15、入出力インタフェース16を備えている。さらに、入出力インタフェース16に接続されるマウス17、フラット・パネル・ディスプレイ(表示装置)18、キーボード19等を備えている。なお、コンピュータ1は一般的なパーソナル・コンピュータ・アーキテクチャを採用するものとして説明したが、例えば、より高いデータ処理能力や可用性を求めて、CPU11やHDD14等を多重化することができる。また、デスクトップ型の他、様々なタイプのコンピュータ・システムを採用することができる。
このコンピュータ1のソフトウェア構成は、基本的な機能を提供するオペレーティング・システム(OS)と、OSの機能を利用するアプリケーション・ソフトウェアと、入出力装置のドライバ・ソフトウェアとを備えている。これらの各ソフトウェアは、各種データと共にRAM12上にロードされ、CPU11等により実行され、コンピュータ1は全体として、図2に示す機能モジュールとして機能し、図4から図6に示す処理を実行する。図4は、基本的な処理を示すフローチャートであり、図5は、図4の学習フェーズを示すフローチャートであり、図6は、図4の予測フェーズを示すフローチャートである。
図2は、実施形態に係るコンピュータ1の機能モジュールを説明するブロック図である。コンピュータ1は、全体として、前処理モジュール(入力手段、生成手段)101、学習モジュール(学習手段)102、予測モジュール(予測手段)103として機能する。なお、各モジュールの具体的な機能については、後述する。
図3は、実施形態に係るコンピュータの処理を模式的に示したものである。本実施形態では、限られた領域におけるプローブデータのOD情報(既知の始点及び終点の情報)を、広範囲案領域のランドマークデータ(目印情報)を介して汎化する。ここで、プローブデータは、車載GPS等により収集された緯度経度の時系列の集合であり、一般に、限られた地域しか取得できず、また希少である。一方、ランドマークデータは、駅やホテル、市役所などの建造物や施設がその種類と緯度経度として記録されているデータであり、広域で比較的入手が容易である。なお、図示しないが、道路交通センサス(正式名称は「全国道路・街路交通情勢調査」)データ(以下、単に「センサスデータ」という)を利用することができる。センサスデータは、ゾーン(およそ日本の行政区分の町レベル、数キロ程度)毎のOD情報含み、日本の国土交通省が数年ごとに全国の道路交通量を調査し、発表するものであり、その入手は容易である。
モデル構築
本実施態様では、各交差点iにおけるOD(O:Origin(始点)、D:Distination(終点)発生確率のモデル化にポアソン分布を利用している。ポアソン分布では、ある時間当たりに起こる事象の数nの分布は、式(1)で表される。ここで、ポアソン分布のパラメータは、
μ=平均E(n)=E[(n-μ)2](>0)となる。
つまり、各交差点iでのポアソン分布のパラメータμiの大きさを調整することで、OD発生確率を調整することができる。ここでは、パラメータμiの対数を、ランドマークデータから得られる特徴ベクトルφi(後述する)で式(2)に示すとおり、線形近似する(μiに関する対数線形モデル)。なお、θ=[ωT,b]Tは学習パラメータであり、ωは線形結合パラメータと呼ばれ、bはベースラインと呼ばれる。また、OD発生確率のモデルとしては、ポアソン分布に限らず、例えば、ガンマ分布、対数正規分布等を採用することもできる。
本実施形態では、(特徴ベクトルがφi、学習パラメータがθoであるとの前提の元)交差点iが始点の経路数がoiである確率p(oiio)を式(3)として、(特徴ベクトルがφij、学習パラメータがθdであるとの前提の元)交差点iが始点で、交差点jが終点である経路数がdijである確率p(dijijd)を式(4)として、それぞれ異なる態様(特徴ベクトルとその線形結合パラメータが異なる)でモデル化している。本実施形態のようにある経路の始点と終点との関係を考慮してモデル化してもよいし、ある経路の始点と終点との関係を考慮せず、始点と終点とは独立の事象としてモデル化してもよい。
学習(ステップS1)
前処理モジュール101は、トレーニング・データ(第一情報)の前処理を行う(ステップS11)。ここで、トレーニング・データとしては、日本の東京都心エリアのプローブデータ(第一領域に含まれる既知の始点及び終点の情報)、同エリアのランドマークデータ(第一目印情報)である。また、プローブデータの偏りを補正するために、選択的に同エリアのセンサスデータ(第一エリア情報)を利用することもできる。また、基本となる地図データには各交差点iとその緯度経度とが対応付けられて保存されている。なお、各トレーニング・データ、地図データ、(後述の)テスト・データは、予めハードディスク14上に保存されており、各モジュールから必要に応じてアクセス可能である。
都心エリアのプローブデータから始点・終点の抽出を行い、各交差点iの目的変数oi:交差点iが経路の始点となった数(始点発生数)、di:交差点iが経路の終点となった数(終点発生数)を算出する。なお、プローブデータは、GPS緯度経路の時系列の集合であり、複数台のプローブカーと呼ばれる自動車に搭載されるGPSからの緯度経度時系列を長期間収集して構成される。
具体的な算出方法は以下の通りである。まず、各交差点iの目的変数(oi,di)を(0,0)と初期化する。次に、各GPS時系列について、以下を繰り返す。一のGPS時系列の最初の時刻に対応するポイント(位置)から、最近傍の交差点を検索し、その交差点の始点発生数に1を加える。同一のGPS時系列の最後の時刻に対応するポイントから、最近傍の交差点を検索し、その交差点の終点発生数に1を加える。これをすべてのGPS時系列について繰り返す。目的変数の算出方法は、他の方法を採用してもよい。例えば、GPSポイントからK(所定距離)近傍の交差点を列挙し、GPSポイントからの相対距離に応じて目的変数に加える値を決定することもできる。
東京都心エリアのランドマークデータから、都心エリアに含まれる各交差点iの説明変数(特徴ベクトル)ψi, ψijを算出する。なお、ランドマークデータは、様々な施設がその種類と緯度経度とが対応付けられて記録されているデータである。施設の種類としては、例えば、ホテル、駅、銀行、郵便局、役所、公民館、病院、バス停、コンビニエンスストア、ショッピングモール、デパートメントストア、ファストフードショップ、市民ホール等を挙げることができる。
具体的な算出方法は以下の通りである。まず、各交差点iの基本特徴ベクトルliを初期化する。つまり、想定するランドマークの総種類数がLならば、L次元の全要素が0のベクトルを各交差点iの基本特徴ベクトルliとする。次に、各ランドマーク標本について、以下を繰り返す。一のランドマーク標本について、最近傍の交差点を検索し、その交差点の特徴ベクトルの対応するランドマーク要素に1を加える。これをすべてのランドマーク標本について繰り返す。基本特徴ベクトルliの算出方法は、他の方法を採用してもよい。例えば、交差点からK(所定距離:例えば、100m)近傍のランドマークを列挙し、その基本特徴ベクトルの対応する各要素に1加えることもできる。そして、交差点iを始点とする特徴ベクトルφiは式(5)により、交差点iを始点として、交差点jを終点とする特徴ベクトルφijは式(6)により、それぞれ得ることができる。なお、終点モデルが始点を考慮しないものであれば、交差点iを終点とする特徴ベクトルと交差点iを終点とする特徴ベクトルは同じ(例えば、式(5))となる。この場合でも、始点と終点モデルで目的変数oi,djが異なるので、パラメータθoとθdは異なるものになり、その結果として、同じ交差点でも異なる始点と終点の発生確率は異なる。
次に、学習モジュール102は、パラメータの初期化を行い(ステップS12)、パラメータを学習する(ステップS13)。本実施形態では、始点について式(7)、終点について式(8)にそれぞれ示すL1正則化付きの負の対数尤度を目的関数として最小化することで、パラメータθ(始点用パラメータ:θo=[ωo T,bo]T,終点用パラメータ:θd=[ωd T,bd]T)を学習する。
パラメータθの初期化は、例えば、ωTo Td=0(ベクトル)、b=bo=bd=1(スカラー)とすることができる。また、式(7)や式(8)の正則化パラメータλ(>0)は、複数のλの候補を用意して、交差検定法により初期値を決定することができる。
固定的なベースラインb=1とする代わりに、ベースラインbをセンサスデータに基づいてゾーン毎に調整し、プローブデータの収集地域の潜在的な偏りを補正することもできる。つまり、プローブカーは限られた台数の自動車のため、その収集地域に偏りが生じることある。その結果、プローブデータからODが観測されていない地域は、本当にODが発生していないのではなく、偶然、その地域にプローブカーが走行していなかったに過ぎない場合がある。反対に、プローブデータから多数のODが観測されている地域でも、観測時に偶然、その地域に多くのプローブカーが走行していたに過ぎない場合もある。そこで、センサスデータのゾーン毎にプローブデータの偏りを調整するベースラインを導入することが好ましい。各ゾーンは、複数の交差点を含み、各交差点がいずれのゾーンに含まれるかは、(例えば、前処理として)予め対応付けておく。その結果、ベースライン b をゾーン毎に調整することができる。すなわち、始点のベースラインbo=bi=bψiとして、式(9)のように調整することができる。同様に、終点のベースラインbd=bij= bψijとして、式(9)のψiに式(10)のψijを代入して、bd=bijを得ることができる。
ここで、ω=0(ベクトル)、b=1の時、ポアソン分布モデルの平均値は、式(11)に示すとおり、(一様分布を仮定した際の)属するゾーンziに含まれる交差点のプローブカー期待発生数の期待値に一致する。
パラメータ初期化の後、学習モジュール102は、パラメータを学習する(ステップS13)。ここで、解析的にパラメータの最適解を求めることは困難であり、以下の通り、目的関数の凸性を利用して、逐次最適化を行う。すなわち、式(7)、式(8)の目的関数Lを現在のパラメータ推定値周りで二次近似し、二次近似した関数はLasso回帰の同型になり、劣勾配法によりパラメータを更新する。パラメータの学習は、上記逐次最適化を複数回数繰り返して、終了する。終了条件としては、具体的な回数は交差点の数に依存するが、例えば、最大繰り返し回数を300回と設定し、それまでに所定の収束条件(例えば、パラメータの更新量(‖θnew - θold‖1 や ‖θnew - θold‖2; θold は各繰り返しの更新前のパラメータ、θnewは更新後のパラメータ)がある閾値(例えば、0.01)未満)より小さくなる)を満たせば、終了するように設定することができる。
予測(ステップS2)
パラメータ学習の後、前処理モジュール101は、テスト・データ(第二情報)の前処理を行う(ステップS21)。ここで、テスト・データとしては、日本の東京都心エリアを含み、それよりも広域である日本の関東エリアのランドマークデータ(第二目印情報)である。また、予測精度を高めるために、選択的に同エリアのセンサスデータ(第二エリア情報)を利用することもできる。
前処理モジュール101は、関東エリアのランドマークデータから、関東エリアに含まれる各交差点iの説明変数(特徴ベクトル)φi, φijを算出する。その具体的な方法は、既に述べたので、ここでは省略する。
センサスデータを用いない場合には、予測モジュール103は、学習に用いたプローブデータに収集地域の潜在的な偏りがあることを考慮し、学習に用いたベースラインを0にする(θoとθdのベースラインboとbdを0(スカラーゼロ)にする)。そして、式(12)の始点発生確率poに従い、始点交差点oを選択し、式(13)の終発生確率pdに従い、終点交差点dを選択する。
一方、センサスデータのOD情報により、ゾーンからゾーン(zo->zd)へのOD発生確率pz(Zo,Zd)が既知の場合には、予測精度を高めるため、予測モジュール103は、pzからODのゾーン組(zo,zd)を選択し、式(14)のpo|z に従い、ゾーンzo 内の交差点から始点交差点oを選択し、式(15)のpd|o,z に従い、ゾーンzd 内の交差点から終点交差点dを選択する。
本実施態様では、東京都心エリアのランドマークデータを用いて、東京都心エリアのプローブデータを汎化し、(東京都心エリアを含む)関東エリア全域において交差点レベルの始点・終点(OD)の発生確率を予測することができる。さらに、センサスデータを用いることで、その学習精度や推定精度を高めることができる。なお、交差点レベルの始点・終点(OD)の発生確率は、ディスプレイ18等に表示することができる。また、例えば、東京都心エリアのランドマークデータを用いて、東京都心エリアのプローブデータを汎化し、(東京都心エリアを含まない)関西エリア全域において交差点レベルの始点・終点(OD)の発生確率を予測することも同様に可能である。
本発明は、全体がハードウェアの実施形態、全体がソフトウェアの実施形態、またはハードウェアおよびソフトウェア両方のエレメントを包含する実施形態の形を取ることができる。ある好適な実施形態において、本発明は、以下に限らないが、ファームウェア、常駐ソフトウェア、マイクロコード、構文解析ピココードなどを含めた、ソフトウェアに実装される。
さらに、本発明は、コンピュータまたは任意の命令実行システムによってまたはこれに関連させて使用するプログラム・コードを備えるコンピュータ・プログラム、コンピュータ可読媒体の形態を採ることもできる。本説明目的の上で、コンピュータ可読媒体は、任意の命令実行システム、装置、またはデバイスによってまたはこれに関連させて使用するためのプログラムを、収容、格納、通信、伝搬、または伝送できる任意の装置であり得る。具体的には、前述の構文解析制御モジュールは、この意味で命令実行システム、または「コンピュータ」を構成する。
媒体は、電子的、磁気的、光学的、電磁気的、赤外的、または半導体のシステム(もしくは装置もしくはデバイス)または伝搬媒体とすることができる。コンピュータ可読媒体の例には、半導体または固体メモリ、磁気テープ、着脱可能コンピュータ・ディスケット、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read−only memory)、剛体磁気ディスク、および光ディスクが含まれる。光ディスクの現時点での例には、コンパクト・ディスク読み取り専用メモリ(CD−ROM:compact disk read only memory)、コンパクト・ディスク読み取り/書き込み(CD−R/W:compact disk read/write)メモリ、およびDVDが含まれる。
プログラム・コードを格納もしくは実行またはその両方を行うのに適したデータ処理システムは、システム・バスを介して直接的または間接的にメモリ・エレメントに連結された少なくとも一つのプロセッサを含み得る。このメモリ・エレメントには、プログラム・コードの実際の実行の過程で使われるローカル・メモリ、バルク記憶装置、および、実行中にバルク記憶装置から読み出さねばならない回数を低減するために、少なくとも一部のプログラム・コードに一時的保管を提供するキャッシュ・メモリを含めることができる。
1…パーソナル・コンピュータ、
11…CPU(演算制御装置)
12…RAM(ランダム・アクセス・メモリ:記憶装置)
13…ROM(リード・オンリ・メモリ:記憶装置)
14…HDD(ハード・ディスク・ドライブ:記憶装置)
15…通信インタフェース
16…入出力インタフェース
17…マウス
18…フラット・パネル・ディスプレイ(表示装置)
101…前処理モジュール(入力手段、前処理手段)
102…学習モジュール(学習手段)
103…予測モジュール(予測手段)

Claims (20)

  1. コンピュータにより未知の経路の始点及び終点を予測する方法であり、
    第二領域に含まれる既知の目印の種類及びその位置を含む第二目印情報の入力を受け付けるステップと、
    前記第二目印情報に基づいて、前記第二領域に含まれる各地点の第二特徴ベクトルを生成するステップと、
    第一領域に含まれる既知の目印の種類及びその位置を含む第一目印情報と前記第一領域に含まれる既知の始点及び終点の情報とに基づいて得られる予測モデルと、前記第二特徴ベクトルとに基づいて、前記第二領域に含まれる各地点が前記始点及び前記終点となる確率を予測するステップと
    を備える方法。
  2. 第一領域に含まれる既知の目印の種類及びその位置を含む第一目印情報と前記第一領域に含まれる既知の始点及び終点の情報とに基づいて予測モデルを学習するステップ
    を更に備える請求項1に記載の方法。
  3. 前記予測モデルを学習するステップは、
    前記第一領域に含まれる既知の目印の種類及びその位置を含む第一目印情報の入力を受け付けるステップと、
    前記第一目情報に基づいて、前記第一領域に含まれる各地点の第一特徴ベクトルを生成するステップと
    を更に備える請求項2に記載の方法。
  4. 前記予測モデルを学習するステップは、
    緯度経度の時系列データを複数含むプローブデータの入力を受け付けるステップと、
    前記各時系列データの開始時及び終了時に対応する緯度経度に基づいて、前記第一領域に含まれる各地点が前記始点又は前記終点となった数をカウントするステップと
    を更に備える請求項3に記載の方法。
  5. 前記予測モデルは、
    前記第一特徴ベクトルを説明変数とし、前記第一領域に含まれる各地点が前記始点又は前記終点となった数を目的変数として回帰する請求項4に記載の方法。
  6. 前記予測モデルは、前記各地点について、前記始点となる前記経路数がoである確率モデルと、前記終点となる前記経路数がdである確率モデルとそれぞれ異なる態様でモデル化されている請求項1に記載の方法。
  7. 前記予測モデルは、前記各地点について、地点iが前記始点で、地点jが前記終点となる前記経路数がdijである確率モデルとしてモデル化される請求項1に記載の方法。
  8. 前記予測モデルは、前記各地点について、前記始点又は前記終点となる経路数がnである確率がポアソン分布に従うものとしてモデル化されている請求項1に記載の方法。
  9. 前記予測モデルを学習するステップは、
    前記第一領域に含まれる既知の目印の種類及びその位置を含む第一目印情報の入力を受け付けるステップと、
    前記第一目情報に基づいて、前記第一領域に含まれる各地点の第一特徴ベクトルを生成するステップと
    を更に備え、
    前記予測モデルは、前記ポアソン分布のパラメータμの対数を、前記第一特徴ベクトルで線形近似する請求項8に記載の方法。
  10. 前記線形近似式は、
    各地点iでの前記ポアソン分布のパラメータμi、第一特徴ベクトルφi、学習パラメータθ、ベースラインbとして、
    logμi(θ)=ωTφi+b
    と表す請求項9に記載の方法。
  11. 前記予測モデルを学習するステップは、
    前記第一領域に含まれ、複数の地点を包含する既知の前記経路の始エリア及び終エリアの第一エリア情報の入力を受け付けるステップと、
    前記第一エリア情報に基づいて、前記ベースラインを調整するステップと
    を更に備える請求項10に記載の方法。
  12. 前記予測モデルを学習するステップは、
    負の対数尤度を目的関数として最小化することで、パラメータθを学習するステップ
    を更に備える請求項10に記載の方法。
  13. 前記予測モデルを学習するステップは、
    正則化項付き負の対数尤度を目的関数として最小化することで、パラメータθを学習するステップ
    を更に備える請求項10に記載の方法。
  14. 前記予測モデルを学習するステップは、
    前記目的関数を現在のパラメータ推定値周りで二次のテイラー近似を行うステップと、
    前記二次のテイラー近似を行った目的関数Lを最小にする値にパラメータを更新するステップと
    を備える請求項12又は13に記載の方法。
  15. 前記第二領域に含まれる各地点が前記始点及び前記終点となる確率を予測するステップは、
    前記第二領域に含まれ、複数の地点を包含する既知の前記経路の始エリア及び終エリアの第二エリア情報の入力を受け付けるステップと、
    前記第二エリア情報に基づいて、各エリアでの始エリア発生数確率及び終エリア発生確率を求めるステップと
    前記始エリア発生数確率及び終エリア発生確率に基づいて、各地点が前記始点及び前記終点となる確率を予測するステップ
    を更に備える請求項1に記載の方法。
  16. 前記経路は、自動車による経路であり、前記地点は、道路上の交差点である請求項1に記載の方法。
  17. 前記第二領域は、前記第一領域に比べて広域である請求項1に記載の方法。
  18. 前記第二領域は、前記第一領域を含まない請求項1に記載の方法。
  19. コンピュータにより実行されることにより、前記コンピュータに請求項1乃至18のいずれかに記載の方法を実行させるコンピュータ・プログラム。
  20. 未知の経路の始点及び終点を予測するコンピュータであり、
    第二領域に含まれる既知の目印の種類及びその位置を含む第二目印情報の入力を受け付ける手段と、
    前記第二目印情報に基づいて、前記第二領域に含まれる各地点の第二特徴ベクトルを生成する手段と、
    第一領域に含まれる既知の目印の種類及びその位置を含む第一目印情報と前記第一領域に含まれる既知の始点及び終点の情報とに基づいて得られる予測モデルと、前記第二特徴ベクトルとに基づいて、前記第二領域に含まれる各地点が前記始点及び前記終点となる確率を予測する手段と
    を備えるコンピュータ。
JP2012247403A 2012-11-09 2012-11-09 複数種類のデータソースを用いた経路の始点・終点の統計的推測手法、コンピュータ・プログラム及びコンピュータ。 Active JP5946394B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012247403A JP5946394B2 (ja) 2012-11-09 2012-11-09 複数種類のデータソースを用いた経路の始点・終点の統計的推測手法、コンピュータ・プログラム及びコンピュータ。
US14/057,142 US9292800B2 (en) 2012-11-09 2013-10-18 Statistical estimation of origin and destination points of trip using plurality of types of data sources
US14/977,842 US20160110654A1 (en) 2012-11-09 2015-12-22 Statistical estimation of origin and destination points of trip using plurality of types of data sources

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012247403A JP5946394B2 (ja) 2012-11-09 2012-11-09 複数種類のデータソースを用いた経路の始点・終点の統計的推測手法、コンピュータ・プログラム及びコンピュータ。

Publications (2)

Publication Number Publication Date
JP2014096039A JP2014096039A (ja) 2014-05-22
JP5946394B2 true JP5946394B2 (ja) 2016-07-06

Family

ID=50682695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012247403A Active JP5946394B2 (ja) 2012-11-09 2012-11-09 複数種類のデータソースを用いた経路の始点・終点の統計的推測手法、コンピュータ・プログラム及びコンピュータ。

Country Status (2)

Country Link
US (2) US9292800B2 (ja)
JP (1) JP5946394B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9355560B2 (en) * 2014-01-31 2016-05-31 Here Global B.V. Differentiation of probe reports based on quality
CN106779214B (zh) * 2016-12-15 2020-08-28 南开大学 一种基于主题模型的多因素融合民航旅客出行预测方法
CN110299063B (zh) * 2018-03-22 2022-01-25 阿里巴巴集团控股有限公司 轨迹数据的可视化展示方法及装置
CN109447149B (zh) 2018-10-25 2021-11-02 腾讯医疗健康(深圳)有限公司 一种检测模型的训练方法、装置及终端设备
CN110782652B (zh) 2018-11-07 2020-10-16 滴图(北京)科技有限公司 速度预测系统和方法
CN109461307B (zh) * 2018-11-16 2021-09-24 中电科新型智慧城市研究院有限公司 一种预估路段平均车辆流量和od需求的方法
CN110264719A (zh) * 2019-06-27 2019-09-20 武汉理工大学 一种基于多源数据的机动车动态od矩阵估计方法
CN110555992B (zh) * 2019-09-11 2021-05-28 中国矿业大学(北京) 一种基于gps轨迹数据的出租车行驶路径信息提取方法
CN111275965B (zh) * 2020-01-20 2021-02-05 交通运输部科学研究院 一种基于互联网大数据的实时交通仿真分析系统与方法
CN112529294B (zh) * 2020-12-09 2023-04-14 中国科学院深圳先进技术研究院 个体随机出行目的地预测模型的训练方法、介质和设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266993A (ja) 1993-03-11 1994-09-22 Hitachi Ltd 道路交通制御装置
JP3485774B2 (ja) * 1997-11-07 2004-01-13 株式会社豊田中央研究所 交通流シミュレーションシステム
US7155376B2 (en) * 2001-06-22 2006-12-26 Caliper Corporation Traffic data management and simulation system
JP4715555B2 (ja) * 2006-03-01 2011-07-06 日産自動車株式会社 車載ナビゲーション装置及びルート編集方法
JP2008146127A (ja) * 2006-12-06 2008-06-26 Toyota Central R&D Labs Inc 寄与度解析装置、寄与度解析方法及びプログラム
JP4598798B2 (ja) 2007-05-09 2010-12-15 日本電信電話株式会社 旅行時間推計方法,旅行時間推計装置,その方法を実装した旅行時間推計プログラム及びそのプログラムを格納した記録媒体、旅行時間予測方法,旅行時間予測装置,その方法を実装した旅行時間予測プログラム及びそのプログラムを格納した記録媒体
JP5246248B2 (ja) * 2010-11-29 2013-07-24 株式会社デンソー 予測装置

Also Published As

Publication number Publication date
JP2014096039A (ja) 2014-05-22
US9292800B2 (en) 2016-03-22
US20160110654A1 (en) 2016-04-21
US20140136453A1 (en) 2014-05-15

Similar Documents

Publication Publication Date Title
JP5946394B2 (ja) 複数種類のデータソースを用いた経路の始点・終点の統計的推測手法、コンピュータ・プログラム及びコンピュータ。
CN107111794B (zh) 预测和利用地图服务中出行时间的可变性
US10551199B2 (en) Utilizing artificial neural networks to evaluate routes based on generated route tiles
Bierlaire et al. A probabilistic map matching method for smartphone GPS data
Yang et al. Travel cost inference from sparse, spatio temporally correlated time series using markov models
CN109215372B (zh) 路网信息更新方法、装置及设备
TWI619036B (zh) 交通時間預測系統、交通時間預測方法以及交通模型建立方法
US9904932B2 (en) Analyzing semantic places and related data from a plurality of location data reports
EP3186662B1 (en) Measuring traffic speed in a road network
Zeng et al. Application of Lagrangian relaxation approach to α-reliable path finding in stochastic networks with correlated link travel times
US9984544B2 (en) Device layout optimization for surveillance devices
US11030905B2 (en) Stop purpose classification for vehicle fleets
Ozdemir et al. A hybrid HMM model for travel path inference with sparse GPS samples
Yang et al. A novel approach for estimation of dynamic from static origin–destination matrices
Mukheja et al. Smartphone‐based crowdsourcing for position estimation of public transport vehicles
JP6813527B2 (ja) 推定装置、推定方法及びプログラム
Zhang et al. Travel-mode classification for optimizing vehicular travel route planning
CN109508749A (zh) 一种基于深度知识表达的聚类分析系统及方法
Tiwari et al. User category based estimation of location popularity using the road GPS trajectory databases
Sun et al. Deep learning-based probability model for traffic information estimation
JP2016048508A (ja) 交通シミュレーション装置、交通シミュレーションシステム
US11609344B2 (en) Systems and methods for utilizing a machine learning model to determine a determined location of a vehicle based on a combination of a geographical location and a visual positioning system location
JP2019211984A (ja) 学習装置、予測装置、方法、及びプログラム
JP6723967B2 (ja) 推定装置、推定方法及びプログラム
Pelekis et al. Modeling and acquiring mobility data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160531

R150 Certificate of patent or registration of utility model

Ref document number: 5946394

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150