JP2012108748A - データ処理装置、データ処理方法、およびプログラム - Google Patents

データ処理装置、データ処理方法、およびプログラム Download PDF

Info

Publication number
JP2012108748A
JP2012108748A JP2010257485A JP2010257485A JP2012108748A JP 2012108748 A JP2012108748 A JP 2012108748A JP 2010257485 A JP2010257485 A JP 2010257485A JP 2010257485 A JP2010257485 A JP 2010257485A JP 2012108748 A JP2012108748 A JP 2012108748A
Authority
JP
Japan
Prior art keywords
data
state
node
unit
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010257485A
Other languages
English (en)
Inventor
Naoki Ide
直紀 井手
Masato Ito
真人 伊藤
Kotaro Sabe
浩太郎 佐部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010257485A priority Critical patent/JP2012108748A/ja
Priority to EP11841735.1A priority patent/EP2642431A4/en
Priority to PCT/JP2011/075541 priority patent/WO2012066951A1/ja
Priority to US13/878,920 priority patent/US9589082B2/en
Priority to CN201180054421.7A priority patent/CN103201754B/zh
Publication of JP2012108748A publication Critical patent/JP2012108748A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/3453Special cost functions, i.e. other than distance or default speed limit of road segments
    • G01C21/3484Personalized, e.g. from learned user behaviour or user-defined profiles
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3617Destination input or retrieval using user history, behaviour, conditions or preferences, e.g. predicted or inferred from previous use or current movement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/0009Transmission of position information to remote stations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data

Abstract

【課題】リアルタイムに取得される現在地のデータに欠落があった場合でも、予測ができるようにする。
【解決手段】学習メインプロセス部23は、学習用データとしての移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める。予測メインプロセス部33は、学習により得られた確率モデルを用いて、リアルタイムに取得される移動履歴データから、ユーザの現在地を推定する。リアルタイムに取得される移動履歴データにデータ欠落部分がある場合に、予測メインプロセス部33は、そのデータ欠落部分を補間処理により生成し、補間された予測用データに対応する状態ノード系列を推定する。状態ノード系列の推定において、補間データについては、実データよりもデータの寄与の少ない観測確率が用いられる。本発明は、例えば、移動履歴データから目的地を予測するデータ処理装置に適用できる。
【選択図】図1

Description

本発明は、データ処理装置、データ処理方法、およびプログラムに関し、特に、リアルタイムに取得される現在地のデータに欠落があった場合でも、予測ができるようにするデータ処理装置、データ処理方法、およびプログラムに関する。
近年、ユーザが身に着けられるセンサであるウェアラブルセンサから得られる時系列データを用いてユーザの状態をモデル化して学習し、学習により得られたモデルを用いてユーザの現在の状態を認識する研究が盛んである(例えば、特許文献1,2、非特許文献1)。
本出願人は、未来の所望の時刻におけるユーザの活動状態の複数の可能性を確率的に予測する方法を、特願2009−180780号(以下、先願1という)として先に提案している。先願1の方法では、時系列データからユーザの活動状態を確率的状態遷移モデルとして学習し、学習した確率的状態遷移モデルを用いて現在の活動状態を認識し、「所定時間後」のユーザの活動状態を確率的に予測することができる。先願1では、「所定時間後」のユーザの活動状態の予測の一例として、ユーザの移動履歴の時系列データ(移動履歴データ)を学習した確率的状態遷移モデルを用いて、ユーザの現在の位置を認識し、所定時間後のユーザの行き先(場所)を予測する例が示されている。
さらに、本出願人は、先願1を発展させ、「所定時間後」という現在時刻からの経過時間の指定がない場合であっても、複数の目的地への到達確率、経路、時間を予測する方法を、特願2009−208064号(以下、先願2という)として提案した。先願2の方法では、確率的状態遷移モデルを構成する状態ノードに、”移動状態”かまたは”滞在状態”の属性が付与された。そして、確率的状態遷移モデルを構成する状態ノードの中から、目的地の状態ノードとして”滞在状態”の状態ノードを見つけることで、目的地の候補を自動的に検出することができた。
そして、本出願人は、特願2010−141946号(以下、先願3という)として、先願2の学習モデル(確率的状態遷移モデル)を、新たな移動経路の移動履歴データが追加されたときに発達させることができるようにして、効率的な学習ができるようにした。
特開2006−134080号公報 特開2008−204040号公報
"Life Patterns: structure from wearable sensors",Brian Patrick Clarkson, Doctor Thesis, MIT, 2002
しかしながら、先願3の方法では、リアルタイムに取得される現在の移動履歴データに基づいて、現在値(現在状態)を推定したうえで目的地を予測するが、現在地のデータを取得できない場合には、現在状態を推定できず、目的地の予測もできなかった。
本発明は、このような状況に鑑みてなされたものであり、リアルタイムに取得される現在地のデータに欠落があった場合でも、予測ができるようにするものである。
本発明の一側面のデータ処理装置は、
学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める学習手段と、
前記学習手段により求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算する予測用データ生成手段と、
前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
探索された前記目的地への到達確率と所要時間を算出する算出手段と
を備える。
本発明の一側面のデータ処理方法は、
ユーザの移動履歴データを処理するデータ処理装置の、
学習手段が、学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求め、
目的地経由地推定手段が、求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定し、
予測用データ生成手段が、前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算し、
現在地推定手段が、前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定し、
探索手段が、推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索し、
算出手段が、探索された前記目的地への到達確率と所要時間を算出する
ステップを含む。
本発明の一側面のプログラムは、
コンピュータを、
学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める学習手段と、
前記学習手段により求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算する予測用データ生成手段と、
前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
探索された前記目的地への到達確率と所要時間を算出する算出手段
として機能させるプログラムである。
本発明の一側面においては、学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータが求められ、求められたパラメータを用いた確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードが推定される。そして、学習用データとは別の、現在から所定時間以内のユーザの移動履歴データが予測用データとして取得され、取得された予測用データにデータ欠落部分がある場合に、そのデータ欠落部分が補間処理により生成され、生成された補間データに対する実データとの仮想誤差が計算される。データ欠落部分が補間された予測用データを、学習により得られたパラメータを用いた確率モデルに入力して、データ欠落部分が補間された予測用データに対応する状態ノード系列を推定する状態ノード系列の推定において、補間データについては、状態ノードの観測確率として、仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、ユーザの現在地に相当する現在地ノードが推定される。推定された目的地ノードおよび経由地ノード並びに現在地ノードについての情報と、学習により得られた確率モデルとを用いて、ユーザの現在地から目的地までの経路が探索され、探索された目的地への到達確率と所要時間が算出される。
本発明の一側面によれば、リアルタイムに取得される現在地のデータに欠落があった場合でも、予測ができる。
本発明を適用した予測システムの一実施の形態の構成例を示すブロック図である。 予測システムのハードウエア構成例を示すブロック図である。 移動履歴データの例を示す図である。 HMMの例を示す図である。 left-to-right型のHMMの例を示す図である。 スパース制約を与えたHMMの例を示す図である。 学習プリプロセス部の詳細構成例を示すブロック図である。 学習プリプロセス部の処理について説明する図である。 学習プリプロセス部の処理について説明する図である。 移動属性識別付与部の詳細構成例を示すブロック図である。 移動属性識別部の学習器の構成例を示すブロック図である。 行動状態をカテゴリごとに分類する場合の分類例を示す図である。 行動状態ラベリング部の処理例を説明する図である。 行動状態ラベリング部の処理例を説明する図である。 図11の行動状態学習部の構成例を示すブロック図である。 移動属性識別部の詳細構成例を示すブロック図である。 移動属性識別部の学習器のその他の構成例を示すブロック図である。 移動属性識別部のその他の構成例を示すブロック図である。 学習プリプロセス部の処理を説明するフローチャートである。 図1の学習メインプロセス部の詳細構成例を示すブロック図である。 既知未知判定部の詳細な構成例を示すブロック図である。 未知状態ノード追加部による未知状態追加モデルの構築処理を説明するフローチャートである。 未知状態追加モデルの初期確率テーブルを説明する図である。 未知状態追加モデルの遷移確率テーブルを説明する図である。 未知状態追加モデルの中心値テーブルを説明する図である。 未知状態追加モデルの分散値テーブルを説明する図である。 線形補間処理における仮想誤差のイメージ図である。 観測尤度計算処理を説明する説明するフローチャートである。 既知未知判定処理を説明する説明するフローチャートである。 新規モデル生成部の詳細な構成例を示すブロック図である。 通常のHMMによる学習モデルと、新規モデル学習部が行う学習モデルの違いについて説明する図である。 通常のHMMによる学習モデルと、新規モデル学習部が行う学習モデルの違いについて説明する図である。 新規モデル学習部の学習モデルをグラフィカルモデルで表した図である。 新規モデル学習部の新規モデル学習処理を説明するフローチャートである。 パラメータ再計算部のパラメータ再計算処理を説明するフローチャートである。 新規モデル生成部が行う新規モデル生成処理全体のフローチャートである。 新規モデル結合部によるトポロジー更新モデル生成処理を説明するフローチャートである。 トポロジー更新モデルの初期確率テーブルを説明する図である。 トポロジー更新モデルの遷移確率テーブルを説明する図である。 トポロジー更新モデルの遷移確率テーブルを説明する図である。 トポロジー更新モデルの遷移確率テーブルを説明する図である。 トポロジー更新モデルの中心値テーブルを説明する図である。 トポロジー更新モデルの分散値テーブルを説明する図である。 パラメータ更新部が行うパラメータ更新処理全体のフローチャートである。 既存モデルの初期確率テーブルを説明する図である。 既存モデルの遷移確率テーブルを説明する図である。 既存モデルの遷移確率テーブルを説明する図である。 既存モデルの遷移確率テーブルを説明する図である。 既存モデルの中心値テーブルを説明する図である。 既存モデルの分散値テーブルを説明する図である。 学習メインプロセス部全体の学習メインプロセス処理のフローチャートである。 目的地経由地検出部の処理について説明する図である。 学習ブロック全体の処理を説明するフローチャートである。 予測プリプロセス部の詳細構成例を示すブロック図である。 ホールド補間処理における仮想誤差のイメージ図である。 補間処理後の移動履歴データと仮想誤差系列データを示す図である。 移動手段に応じた仮想誤差のイメージ図である。 予測用データ生成部による予測用データ生成処理を説明するフローチャートである。 予測メインプロセス部の詳細構成例を示すブロック図である。 ツリー探索処理を説明するフローチャートである。 ツリー探索処理をさらに説明する図である。 ツリー探索処理をさらに説明する図である。 ツリー探索処理における探索結果リストの例を示す図である。 代表経路選択処理を説明するフローチャートである。 予測ブロック全体の処理を説明するフローチャートである。 本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
[予測システムの構成例]
図1は、本発明を適用した予測システムの一実施の形態の構成例を示している。
図1の予測システム1は、学習ブロック11、ユーザ別モデルパラメータ記憶部12、および予測ブロック13により構成される。
学習ブロック11には、GPS (Global Positioning System)センサなどのセンサデバイス(不図示)において、所定の期間に取得された、所定の時刻におけるユーザの位置(緯度と経度)を示す時系列データが供給される。即ち、学習ブロック11には、一定時間間隔(たとえば、15秒間隔)で順次取得された位置(緯度および経度)のデータと、そのときの時刻の3次元からなる、ユーザの移動経路を示す時系列データ(以下、移動履歴データという。)が供給される。なお、時系列データを構成する、緯度、経度、および時刻の1組のデータを、適宜、3次元データともいう。
学習ブロック11は、ユーザの移動履歴データを用いて、ユーザの活動モデル(ユーザの行動・活動パターンを表した状態モデル)を、確率的状態遷移モデルとして学習する学習処理を行う。
学習に使用される確率的状態遷移モデルとしては、例えば、エルゴディックHMM(Hidden Markov Model)などの、隠れ状態を含む確率モデルを採用することができる。予測システム1では、確率的状態遷移モデルとして、エルゴディックHMMにスパース制約を与えたものを採用する。なお、スパース制約を与えたエルゴディックHMM、エルゴディックHMMのパラメータの算出方法等については、図4乃至図6を参照して後述する。
ユーザ別モデルパラメータ記憶部12は、学習ブロック11の学習により得られた、ユーザの活動モデルを表すパラメータを記憶する。
予測ブロック13は、学習ブロック11の学習により得られたユーザ活動モデルのパラメータをユーザ別モデルパラメータ記憶部12から取得する。そして、予測ブロック13は、新たに取得されたユーザの移動履歴データに対し、学習により得られたパラメータによるユーザ活動モデルを用いて、ユーザの現在地を推定し、さらに現在地からの移動の目的地を予測する。さらに、予測ブロック13は、予測した目的地までの到達確率、経路、および到達時間(所要時間)も算出する。なお、目的地は1つだけとは限らず、複数の目的地が予測されることもある。
学習ブロック11および予測ブロック13の詳細について説明する。
学習ブロック11は、履歴データ蓄積部21、学習プリプロセス部22、学習メインプロセス部23、学習ポストプロセス部24、および目的地経由地検出部25により構成される。
履歴データ蓄積部21は、センサデバイスから供給される、ユーザの移動履歴データを、学習用データとして蓄積(記憶)する。履歴データ蓄積部21は、移動履歴データを、必要に応じて学習プリプロセス部22に供給する。
学習プリプロセス部22は、センサデバイスから生じる課題を解決する。具体的には、学習プリプロセス部22は、移動履歴データを整形するとともに、一時的なデータの欠落を補間処理等を行うことで補間する。また、学習プリプロセス部22は、移動履歴データを構成する3次元データそれぞれに対し、同一場所に滞在(停止)している”滞在状態”か、または、移動している”移動状態”のいずれかの移動属性を付与する。移動属性付与後の移動履歴データが、学習メインプロセス部23と目的地経由地検出部25に供給される。
学習メインプロセス部23は、ユーザの移動履歴をユーザ活動モデルとしてモデル化する。即ち、学習メインプロセス部23は、ユーザの移動履歴データをユーザ活動モデルにモデル化したときのパラメータを求める。学習により得られたユーザ活動モデルのパラメータは、学習ポストプロセス部24とユーザ別モデルパラメータ記憶部12に供給される。
また、学習メインプロセス部23は、ユーザの移動履歴データをユーザ活動モデルとして学習した後、新たな学習用データとしての移動履歴データが供給された場合、現在のユーザ活動モデルのパラメータをユーザ別モデルパラメータ記憶部12から取得し、更新する。
具体的には、最初に、学習メインプロセス部23は、新たな学習用データとしての移動履歴データが既知の経路の移動履歴データであるか、または、未知の経路の移動履歴データであるかを判定する。そして、新たな学習用データが既知の経路の移動履歴データであると判定された場合、学習メインプロセス部23は、既存のユーザ活動モデル(以下、単に、既存モデルと称する。)のパラメータを更新する。一方、新たな学習用データが未知の経路の移動履歴データである場合、学習メインプロセス部23は、未知の経路の移動履歴データに対応する新規モデルとしてのユーザ活動モデルのパラメータを求める。そして、学習メインプロセス部23は、既存モデルのパラメータと、新規モデルのパラメータを合成することで、既存モデルと新規モデルを結合した更新モデルを生成する。
なお、以下において、既知の経路の移動履歴データにより更新されたユーザ活動モデルは、パラメータ更新モデルと称する。一方、未知の経路の移動履歴データによりパラメータが更新されたユーザ活動モデルは、未知の経路の拡張に応じてトポロジーも更新されることから、トポロジー更新モデルと称する。また、以下では、既知の経路の移動履歴データ、および、未知の経路の移動履歴データを、単に、既知の移動履歴データ、および、未知の移動履歴データとも称する。
パラメータ更新モデルまたはトポロジー更新モデルのパラメータは、学習ポストプロセス部24とユーザ別モデルパラメータ記憶部12に供給され、後段では、更新後のユーザ活動モデルを用いて処理が行われる。
学習ポストプロセス部24は、学習メインプロセス部23の学習により得られたユーザ活動モデルを用いて、移動履歴データを構成する各3次元データを、ユーザ活動モデルの状態ノードに変換する。即ち、学習ポストプロセス部24は、移動履歴データに対応する、ユーザ活動モデルの状態ノードの時系列データ(ノード系列データ)を生成する。学習ポストプロセス部24は、変換後のノード系列データを目的地経由地検出部25に供給する。
目的地経由地検出部25は、学習プリプロセス部22から供給された移動属性付与後の移動履歴データと、学習ポストプロセス部24から供給されたノード系列データとを対応付ける。即ち、目的地経由地検出部25は、移動履歴データを構成する各3次元データに、ユーザ活動モデルの状態ノードを割り当てる。
そして、目的地経由地検出部25は、ノード系列データの各状態ノードのうち、移動属性が”滞在状態”の3次元データに対応する状態ノードに、目的地または経由地の属性を付与する。これにより、ユーザの移動履歴内の所定の場所(に対応する状態ノード)が、目的地かまたは経由地に割り当てられる。目的地経由地検出部25により、状態ノードに付与された目的地、経由地の属性についての情報は、ユーザ別モデルパラメータ記憶部12に供給され、記憶される。
予測ブロック13は、バッファリング部31、予測プリプロセス部32、予測メインプロセス部33、および、予測ポストプロセス部34により構成される。
バッファリング部31は、予測処理のためのリアルタイムに取得される移動履歴データをバッファリングする(記憶する)。なお、予測処理のための移動履歴データとしては、学習処理時の移動履歴データよりも短い期間のデータ、例えば、100ステップ程度の移動履歴データがあれば十分である。バッファリング部31は、常に、所定期間分の最新の移動履歴データを記憶するようにし、新たなデータが取得されたとき、記憶されているデータのうち最も古いデータを消去する。
予測プリプロセス部32は、学習プリプロセス部22と同様、センサデバイスから生じる課題を解決する。即ち、予測プリプロセス部32は、移動履歴データを整形するとともに、一時的なデータの欠落を補間処理等を行うことで補間する。
予測メインプロセス部33には、ユーザ別モデルパラメータ記憶部12から、学習ブロック11の学習により得られた、ユーザ活動モデルを表すパラメータが供給される。
予測メインプロセス部33は、予測プリプロセス部32から供給される移動履歴データと、学習ブロック11の学習により得られたユーザ活動モデルを用いて、ユーザの現在地に対応する状態ノード(現在地ノード)を推定する。状態ノードの推定には、ビタビ最尤推定や軟判定ビタビ推定を採用することができる。
さらに、予測メインプロセス部33は、推定した現在地ノードから遷移可能な複数の状態ノードでなるツリー構造において、目的地の状態ノード(目的地ノード)までのノード系列とその生起確率を算出する。なお、目的地の状態ノードへのノード系列(経路)には経由地のノードが含まれる場合もあるので、予測メインプロセス部33は、目的地と同時に経由地も予測する。
予測ポストプロセス部34は、同一目的地までの複数の経路の選択確率(生起確率)の和を目的地への到達確率として求める。また、予測ポストプロセス部34は、目的地への経路のうち代表となる1以上の経路(以下、代表経路という。)を選択し、代表経路の所要時間を算出する。そして、予測ポストプロセス部34は、予測した目的地までの代表経路、到達確率、および所要時間を予測結果として出力する。なお、経路の生起確率の代わりに頻度、目的地への到達確率の代わりに到達頻度を、予測結果として出力してもよい。
[予測システムのハードウエア構成例]
以上のように構成される予測システム1は、例えば、図2に示されるハードウエア構成を採用することができる。即ち、図2は、予測システム1のハードウエア構成例を示すブロック図である。
図2において、予測システム1は、3台のモバイル端末51−1乃至51−3とサーバ52とにより構成されている。モバイル端末51−1乃至51−3は、同一機能を有する同型のモバイル端末51であるが、モバイル端末51−1乃至51−3では、それを所有するユーザが異なる。従って、図2では、3台のモバイル端末51−1乃至51−3のみが示されているが、実際には、ユーザ数に応じた数のモバイル端末51が存在する。
モバイル端末51は、無線通信及びインターネット等のネットワークを介した通信により、サーバ52とデータの授受を行うことができる。サーバ52は、モバイル端末51から送信されてくるデータを受信し、受信したデータに対し所定の処理を行う。そして、サーバ52は、データ処理の処理結果を無線通信等によりモバイル端末51に送信する。
従って、モバイル端末51とサーバ52は、無線または有線による通信を行う通信部を少なくとも有する。
さらに、モバイル端末51が、図1の予測ブロック13を備え、サーバ52が、図1の学習ブロック11とユーザ別モデルパラメータ記憶部12を備える構成を採用することができる。
この構成が採用される場合、例えば、学習処理において、モバイル端末51のセンサデバイスにより取得された移動履歴データがサーバ52に送信される。サーバ52は、受信した学習用の移動履歴データに基づき、ユーザ活動モデルを学習し、記憶する。そして、予測処理において、モバイル端末51が、学習により得られたユーザ活動モデルのパラメータを取得し、リアルタイムに取得される移動履歴データから、ユーザの現在地ノードを推定し、さらに、目的地ノードと、そこまでの到達確率、代表経路、および所要時間を算出する。そして、モバイル端末51は、予測結果を図示せぬ液晶ディスプレイ等の表示部に表示する。
以上のようなモバイル端末51とサーバ52との間の役割分担は、それぞれのデータ処理装置としての処理能力や通信環境に応じて、適宜、決定することができる。
学習処理は、処理に要する1回あたりの時間は非常に長いが、それほど頻繁に処理する必要はない。従って、一般的には、携行可能なモバイル端末51よりもサーバ52の方が処理能力が高いので、サーバ52に、一日に一回程度蓄積された移動履歴データに基づいて学習処理(パラメータの更新)を行わせるようにすることができる。
一方、予測処理は、時々刻々とリアルタイムに更新される移動履歴データに対応させて迅速に処理し、表示することが望ましいので、モバイル端末51で処理を行う方が望ましい。通信環境がリッチであれば、サーバ52に予測処理も行わせ、予測結果のみをサーバ52から受信する方が、携行可能な小型化が要求されるモバイル端末51の負荷が軽減され、望ましい。
また、モバイル端末51単独で、データ処理装置として学習処理および予測処理を高速に行うことが可能である場合には、図1の予測システム1の構成すべてをモバイル端末51が備えるようにすることも勿論可能である。
[入力される移動履歴データの例]
図3は、予測システム1で取得された移動履歴データの例を示している。図3において、横軸は経度を表し、縦軸は緯度を表している。
図3に示される移動履歴データは、実験者の1ヶ月半程度の期間に蓄積された移動履歴データを示している。図3に示されるように、移動履歴データは、主に、自宅周辺と、勤務先などの4か所の外出先を移動したデータとなっている。なお、この移動履歴データには、人工衛星を捕捉できず、位置が飛んでいるデータも含まれている。
[エルゴディックHMMについて]
次に、予測システム1が、学習モデルとして採用するエルゴディックHMMについて説明する。
図4は、HMMの例を示している。
HMMは、状態ノードと状態ノード間遷移とを有する状態遷移モデルである。
図4は、3状態のHMMの例を示している。
図4において(以降の図においても同様)、丸印は、状態ノードを表し、矢印は、状態ノードの遷移を表す。なお、以下において、状態ノードは、単に、ノードまたは状態ともいう。
また、図4において、si(図4では、i=1,2,3)は、状態を表し、aijは、状態siから状態sjへの状態遷移確率を表す。さらに、bj(x)は、状態sjへの状態遷移時に、観測値xが観測される出力確率密度関数を表し、πiは、状態siが初期状態である初期確率を表す。
なお、出力確率密度関数bj(x)としては、例えば、正規確率分布等が用いられる。
ここで、HMM(連続HMM)は、状態遷移確率aij、出力確率密度関数bj(x)、及び初期確率πiによって定義される。これらの状態遷移確率aij、出力確率密度関数bj(x)、及び初期確率πiを、HMMのパラメータλ={aij,bj(x), πi,i=1,2,・・・,M,j=1,2,・・・,M}という。Mは、HMMの状態数を表す。
HMMのパラメータλを推定する方法としては、Baum-Welchの最尤推定法が広く利用されている。Baum-Welchの最尤推定法は、EMアルゴリズム(EM(Expectation-Maximization) algorithm)に基づくパラメータの推定方法である。
Baum-Welchの最尤推定法によれば、観測される時系列データx=x1,x2,・・・,xTに基づき、その時系列データが観測(生起)される確率である生起確率から求まる尤度を最大化するように、HMMのパラメータλの推定が行われる。ここで、xtは、時刻tに観測される信号(サンプル値)を表し、Tは、時系列データの長さ(サンプル数)を表す。
Baum-Welchの最尤推定法については、例えば、“パターン認識と機械学習(下)”,C.M.ビショップ著,P. 333(英語原書:“Pattern Recognition and Machine Learning (Information Science and Statistics) ”,Christopher M. BishopSpringer, New York, 2006.)(以下、文献Aと称する)に記載されている。
なお、Baum-Welchの最尤推定法は、尤度最大化に基づくパラメータ推定方法ではあるが、最適性を保証するものではなく、HMMの構造やパラメータλの初期値によっては、局所解(ローカルミニマム)に収束することがある。
HMMは、音声認識で広く利用されているが、音声認識で利用されるHMMでは、一般に、状態の数や状態遷移の仕方等はあらかじめ決定される。
図5は、音声認識で利用されるHMMの例を示している。
図5のHMMは、left-to-right型と呼ばれる。
図5では、状態数は3になっており、状態遷移は、自己遷移(状態siから状態siへの状態遷移)と、左から右隣の状態への状態遷移とのみを許す構造に制約されている。
図5のHMMのように、状態遷移に制約があるHMMに対して、図4に示した、状態遷移に制約がないHMM、すなわち、任意の状態siから任意の状態sjへの状態遷移が可能なHMMは、エルゴディック(Ergodic)HMMと呼ばれる。
エルゴディックHMMは、構造としては最も自由度の高いHMMであるが、状態数が多くなると、パラメータλの推定が困難となる。
例えば、エルゴディックHMMの状態数が、1000である場合、状態遷移の数は、100万(=1000×1000)となる。
したがって、この場合、パラメータλのうちの、例えば、状態遷移確率aijについては、100万個の状態遷移確率aijを推定することが必要となる。
そこで、状態に対して設定する状態遷移には、例えば、スパース(Sparse)な構造であるという制約(スパース制約)をかけることができる。
ここで、スパースな構造とは、任意の状態から任意の状態への状態遷移が可能なエルゴディックHMMのような密な状態遷移ではなく、ある状態から状態遷移することができる状態が非常に限定されている構造である。なお、ここでは、スパースな構造であっても、他の状態への状態遷移は、少なくとも1つ存在し、また、自己遷移は存在することとする。
図6は、スパース制約を与えたHMMを示している。
ここで、図6では、2つの状態を結ぶ双方向の矢印は、その2つの状態の一方から他方への状態遷移と、他方から一方への状態遷移とを表す。また、図6において、各状態は、自己遷移が可能であり、その自己遷移を表す矢印の図示は、省略されている。
図6では、16個の状態が、2次元空間上に格子状に配置されている。すなわち、図6では、横方向に、4個の状態が配置され、縦方向にも、4個の状態が配置されている。
いま、横方向に隣接する状態どうしの距離、及び、縦方向に隣接する状態どうしの距離を、いずれも1とすると、図6Aは、距離が1以下の状態への状態遷移は可能とし、他の状態への状態遷移はできないというスパース制約を与えたHMMを示している。
また、図6Bは、距離が√2以下の状態への状態遷移は可能とし、他の状態への状態遷移はできないというスパース制約を与えたHMMを示している。
図1の例では、予測システム1に、移動履歴データx=x1,x2,・・・,xTが供給され、学習ブロック11は、移動履歴データx=x1,x2,・・・,xTを用い、ユーザ活動モデルを表すHMMのパラメータλを推定する。
即ち、ユーザの移動軌跡を表す各時刻の位置(緯度経度)のデータが、HMMの状態siのいずれかに対応する地図上の一点から、所定の分散値の広がりを持って正規分布した確率変数の観測データであると考える。学習ブロック11は、各状態siに対応する地図上の一点(中心値μi)とその分散値σi 、および状態遷移確率aijを最適化する。
なお、状態siの初期確率πiは、一様な値に設定することができる。例えば、M個の状態siそれぞれの初期確率πiが、1/Mに設定される。
予測メインプロセス部33は、学習により得られたユーザ活動モデル(HMM)に対して、ビタビアルゴリズムを適用し、移動履歴データx=x1,x2,・・・,xTが観測される尤度を最も大にする状態遷移の過程(状態の系列)(パス)(以下、最尤パスともいう)を求める。これにより、ユーザの現在地に対応する状態siが認識される。
ここで、ビタビアルゴリズムとは、各状態siを始点とする状態遷移のパスの中で、時刻tに、状態siから状態sjに状態遷移する状態遷移確率aijと、その状態遷移において、移動履歴データx=x1,x2,・・・,xTのうちの時刻tのサンプル値xtが観測される確率(出力確率密度関数bj(x)から求められる出力確率)とを、処理後時系列データxの長さTに亘って累積した値(生起確率)を最大にするパス(最尤パス)を決定するアルゴリズムである。ビタビアルゴリズムの詳細については上述の文献AのP.347に記載されている。
[学習プリプロセス部22の構成例]
図7は、学習ブロック11の学習プリプロセス部22の詳細構成例を示すブロック図である。
学習プリプロセス部22は、データ接続分割部71、データ異常除去部72、再サンプリング処理部73、移動属性識別付与部74、および滞在状態加工部75により構成される。
データ接続分割部71は、移動履歴データの接続および分割の処理を行う。データ接続分割部71には、移動履歴データが、センサデバイスから、1日単位などの所定の単位でログファイルとして供給される。従って、本来、ある目的地への移動途中で連続すべき移動履歴データが、日付を跨いだために分割されて取得されることがある。データ接続分割部71は、そのような分割された移動履歴データを接続する。具体的には、データ接続分割部71は、1つのログファイル内の最後の3次元(緯度、経度、時刻)データと、そのログファイルの次に作成されたログファイル内の最初の3次元データの時間差が所定の時間内であれば、それらのファイル内の移動履歴データを接続する。
また、例えば、GPSセンサは、トンネルや地下では人工衛星を捕捉することができないため、移動履歴データの取得間隔が長くなることがある。移動履歴データが長い時間欠落している場合には、ユーザがどこにいたかを推定することが難しくなる。そこで、データ接続分割部71は、取得された移動履歴データにおいて、前後の取得時刻の間隔が所定の時間間隔(以下、欠落閾値時間という。)以上ある場合に、その間隔の前後で移動履歴データを分割する。ここで、欠落閾値時間は、例えば、5分、10分、1時間などである。
データ異常除去部72は、移動履歴データの明らかな異常を除去する処理を行う。例えば、ある時刻の位置のデータが、その前後の位置と100m以上も離れていて、跳躍している場合、その位置のデータは異常である。そこで、データ異常除去部72は、ある時刻の位置のデータが、その前後の両方の位置と所定の距離以上離れている場合、その3次元データを移動履歴データから除去する。
再サンプリング処理部73は、後段の処理部(学習メインプロセス部23など)に適応する一定の時間間隔に移動履歴データをリサンプリングする。なお、取得される時間間隔が既に所望の時間間隔と一致する場合には、この処理は省略される。
また、取得される時間間隔が欠落閾値時間以上である場合には、データ接続分割部71により、移動履歴データが分割されるが、欠落閾値時間未満のデータの欠落は残っている。そこで、再サンプリング処理部73は、欠落閾値時間未満の欠落データを、リサンプリング後の時間間隔で線形補間により生成(穴埋め)する。
例えば、データ欠落の直前の時刻Tにおける3次元データをxreal T1、データ取得が復活した最初の時刻Tにおける3次元データをxreal T2とするとき、時刻Tから時刻Tまでのデータ欠落中の時刻tの3次元データxvirtual tは、次式(1)のように計算することができる。
Figure 2012108748
また、再サンプリング処理部73は、移動履歴データを構成する3次元データのそれぞれが、線形補間により生成された補間データであるか否かを示す補間フラグ(補間情報)の時系列データでなる補間フラグ系列データも生成する。
移動属性識別付与部74は、移動履歴の3次元データそれぞれが、同一場所に滞在(停止)している”滞在状態”か、または、移動している”移動状態”のいずれであるかの移動属性を識別し、付与する。これにより、移動履歴データの各3次元データに移動属性が付与された、移動属性付き移動履歴データが生成される。
滞在状態加工部75は、移動属性識別付与部74から供給される移動属性付き移動履歴データに基づいて、移動属性が”滞在状態”の3次元データを加工する。より具体的には、滞在状態加工部75は、”滞在状態”の移動属性が所定時間(以下、滞在閾値時間という。)以上継続している場合、その前後で移動履歴データを分割する。また、滞在状態加工部75は、”滞在状態”の移動属性が滞在閾値時間未満で継続している場合には、その滞在閾値時間以内の所定時間続く、”滞在状態”の複数の3次元データの位置のデータをホールドする(同一位置のデータに修正する)。これにより、同一の目的地や経由地の移動履歴データに対して複数の”滞在状態”ノードが割り当てられることを防止することができる。換言すれば、同一の目的地や経由地を複数のノードで表現することを防止することができる。
以上のように構成される学習プリプロセス部22から、後段の学習メインプロセス部23および目的地経由地検出部25には、所定の長さに分割された移動履歴データと、それに対応する補間フラグ系列データが供給される。
[学習プリプロセス部22の処理]
図8は、学習プリプロセス部22の移動属性識別付与部74と滞在状態加工部75の処理を概念的に示している。なお、図8の移動履歴データには補間データは含まれていないものとして、補間フラグ系列データは省略している。
図8上段に示される、再サンプリング処理部73から供給された移動履歴データ81に対して、移動属性識別付与部74が、”滞在状態”または”移動状態”の移動属性を識別し、付与する。その結果、図8中段に示される、移動属性付き移動履歴データ82が生成される。
図8中段の移動属性付き移動履歴データ82において、”m”および”m”は、”移動状態”の移動属性を表し、”u”は、”滞在状態”の移動属性を表す。なお、”m”と”m”は、同じ”移動状態”でも、移動手段(車、バス、電車、徒歩など)が異なる。
そして、図8中段の、移動属性付き移動履歴データ82に対して、滞在状態加工部75により、移動履歴データを分割およびホールドする処理が実行され、図8下段の、移動属性付き移動履歴データ83(83Aおよび83B)が生成される。
移動属性付き移動履歴データ83では、移動属性付き移動履歴データ82において2回目に発生した”移動状態”の箇所(3次元データ)で分割処理が行われ、移動属性付き移動履歴データ83Aと83Bに分割されている。
分割処理では、最初に、移動属性付き移動履歴データ82の2回目に発生した”移動状態”までと、それ以降の複数の3次元データとで分割され、2つの移動属性付き移動履歴データ83Aおよび83Bとされる。次に、分割後の移動属性付き移動履歴データ83Aおよび83Bのうち、時間的に早い移動属性付き移動履歴データ83Aの最後の滞在閾値時間以上の複数の”移動状態”の3次元データが、1つの”滞在状態”の3次元データにまとめられる。これにより、不要な移動履歴データが削除されるので、学習時間を短縮することができる。
なお、図8の例では、移動属性付き移動履歴データ82の3回目に発生した” 複数の移動状態”の3次元データも滞在閾値時間以上の”移動状態”が続くデータであり、同様の分割処理が行われている。しかし、分割後の後ろの3次元データが存在しないため、滞在閾値時間以上の複数の”移動状態”の3次元データが、1つの”滞在状態”の3次元データにまとめられるのみとなっている。
一方、移動属性付き移動履歴データ83Aのうち、1回目の”移動状態”の移動履歴データでは、ホールド処理が実行されている。ホールド処理後は、3つの”移動状態”の3次元データ{(tk−1,xk−1,yk−1),(t,x,y),(tk+1,xk+1,yk+1)}が、{(tk−1,xk−1,yk−1),(t,xk−1,yk−1),(tk+1,xk−1,yk−1)}となっている。即ち、位置のデータが”移動状態”の最初の位置のデータに修正されている。なお、ホールド処理では、位置のデータは、”移動状態”の最初の位置のデータに変更するのではなく、位置の平均値、”移動状態”の期間の真ん中の時刻の位置のデータ等に変更してもよい。
図9は、学習プリプロセス部22の再サンプリング処理部73が行う、線形補間処理と補間フラグ系列データの生成について説明する図である。
図9上段に示される、移動履歴データ84のうち、黒色で示される部分が、3次元データが取得できなかったデータ欠落部分である。
再サンプリング処理部73は、移動履歴データ84のデータ欠落部分を、線形補間により生成した補間データで穴埋めする。また、再サンプリング処理部73は、移動履歴データを構成する3次元データそれぞれに、補間データであるか否かを示す補間フラグ(補間情報)を付与する。図9の例では、補間データの3次元データには”1”を、補間データではない3次元データには”0”を付した補間フラグ系列データが生成されている。
そして、補間処理後の移動履歴データ85に対して、移動属性識別付与部74により移動属性が付与される。このとき、移動属性識別付与部74は、図9下段に示すように、補間データに対しては正確に移動属性を識別できないため、補間データの移動属性を”LOST”として、移動属性の識別をしていない。
[移動属性識別付与部74の構成例]
図10は、移動属性識別付与部74の詳細構成例を示すブロック図である。
移動属性識別付与部74は、移動速度演算部91、移動属性識別部92、および移動属性付与部93により構成される。
移動速度演算部91は、供給される移動履歴データから移動速度を演算する。
具体的には、一定の時間間隔でkステップ目(k個目)に得られるときの3次元データを、時刻t、経度y、緯度xと表すと、kステップ目のx方向の移動速度vxおよびy方向の移動速度vyは、次式(2)により計算することができる。
Figure 2012108748
式(2)では、緯度経度のデータをそのまま利用しているが、緯度経度を距離に変換したり、速度を時速や分速で表すように変換するなどの処理は、必要に応じて適宜行うことができる。
また、移動速度演算部91は、式(2)で得られる移動速度vxおよびvyからさらに、式(3)で表されるkステップ目の移動速度vと進行方向の変化θを求め、これを利用することができる。
Figure 2012108748
式(3)で表される移動速度vと進行方向の変化θを利用する方が、式(2)の移動速度vxおよびvyよりも以下の点で、特徴をうまく取り出すことができる。
1.移動速度vxおよびvyのデータの分布は、緯度経度軸に対して偏りが生じるため、同じ移動手段(電車や徒歩など)であっても角度が異なった場合に識別できない可能性があるが、移動速度vであればそのような可能性が少ない。
2.移動速度の絶対的な大きさ(|v|)だけで学習すると、機器のノイズによって生じる|v|のため、徒歩と滞在を区別できない。進行方向の変化も考慮することで、ノイズの影響を軽減することができる。
3.移動している場合は進行方向の変化が少ないが、滞在している場合は進行方向が定まらないので、進行方向の変化を使うと移動と滞在の識別がしやすい。
以上の理由から、本実施の形態では、移動速度演算部91は、移動速度のデータとして、式(3)で表される移動速度vと進行方向の変化θを求め、移動属性識別部92に供給する。
移動速度演算部91は、移動速度vと進行方向の変化θの演算を行う前に、ノイズ成分を除去するため、移動平均によるフィルタリング処理(前処理)を行うことができる。
なお、センサデバイスのなかには、移動速度を出力できるものも存在する。そのようなセンサデバイスが採用されている場合、移動速度演算部91を省略し、センサデバイスが出力する移動速度をそのまま利用することができる。以下では、進行方向の変化θを、進行方向θと略記する。
移動属性識別部92は、供給される移動速度に基づいて移動属性を識別し、認識結果を移動属性付与部93に供給する。より具体的には、移動属性識別部92は、ユーザの行動状態(移動状態)を確率的状態遷移モデル(HMM)として学習し、学習により得られた確率的状態遷移モデルを用いて移動属性を識別する。移動属性としては、少なくとも”滞在状態”と”移動状態”が存在する必要がある。本実施の形態では、図12等を参照して後述するように、移動属性識別部92は、”移動状態”を、さらに徒歩、自転車、車など、複数の移動手段によって分類した移動属性を出力する。
移動属性付与部93は、再サンプリング処理部73からの、移動履歴データを構成する3次元データそれぞれに対し、移動属性識別部92で認識された移動属性を付与し、移動属性付き移動履歴データを生成して、滞在状態加工部75に出力する。
次に、図11乃至図18を参照して、移動属性識別部92で使用される、ユーザの行動状態を表した確率的状態遷移モデルのパラメータの求め方について説明する。
[移動属性識別部92の学習器の第1の構成例]
図11は、カテゴリHMMにより、移動属性識別部92で使用される確率的状態遷移モデルのパラメータを学習する学習器100Aの構成例を示している。
カテゴリHMMでは、学習する教師データが予めどのカテゴリ(クラス)に属するデータであるのかが既知であり、カテゴリごとにHMMのパラメータが学習される。
学習器100Aは、移動速度データ記憶部101、行動状態ラベリング部102、および行動状態学習部103により構成される。
移動速度データ記憶部101は、学習用データとしての移動速度の時系列データを記憶する。
行動状態ラベリング部102は、移動速度データ記憶部101から時系列に順次供給される移動速度のデータに対し、ユーザの行動状態をラベル(カテゴリ)として付与する。行動状態ラベリング部102は、移動速度のデータに行動状態が対応付けられたラベル済み移動速度データを行動状態学習部103に供給する。例えば、kステップ目の移動速度vと進行方向θに対して、行動状態を表すラベルMを付与したデータが行動状態学習部103に供給される。
行動状態学習部103は、行動状態ラベリング部102から供給されるラベル済み移動速度データを、カテゴリごとに分類し、カテゴリ単位で、ユーザ活動モデル(HMM)のパラメータを学習する。学習の結果得られたカテゴリ毎のパラメータは移動属性識別部92に供給される。
[行動状態の分類例]
図12は、行動状態をカテゴリごとに分類する場合の分類例を示している。
図12に示されるように、まず、ユーザの行動状態は、滞在状態と移動状態に分類することができる。本実施の形態では、移動属性識別部92が認識するユーザの行動状態としては、上述したように、少なくとも滞在状態と移動状態が存在する必要があるので、この2つに分類することは必須である。
さらに、移動状態は、移動手段によって、電車、車(バスなども含む)、自転車、徒歩に分類することができる。電車は、さらに、特急、快速、ローカルなどに分類することができ、車は、さらに、高速、一般道などに分類することができる。また、徒歩は、走る、普通、散歩などに分類することができる。
本実施の形態では、ユーザの行動状態を、図12において斜線で示される“滞在”、“電車(快速)”、“電車(ローカル)”、“車(高速)”、“車(一般道)”、“自転車”、および“徒歩”に分類することとする。なお、“電車(特急)”は、学習用データが得られなかったため省略した。
なお、カテゴリの分類の仕方が図12に示した例に限定されるものではないことは言うまでもない。また、移動手段による移動速度の変化はユーザによって大きく異なるものではないので、学習用データとしての移動速度の時系列データは、認識対象のユーザのものである必要はない。
[行動状態ラベリング部102の処理例]
次に、図13および図14を参照して、行動状態ラベリング部102の処理例について説明する。
図13は、行動状態ラベリング部102に供給される移動速度の時系列データの例を示している。
図13では、行動状態ラベリング部102から供給される移動速度のデータ(v,θ)を、(t,v)および(t,θ)の形で示している。図13において、四角(■)のプロットは移動速度vを表し、丸(●)のプロットは進行方向θを表している。また、横軸は時間tを表し、右側の縦軸は進行方向θを、左側の縦軸は移動速度vを表す。
図13の時間軸の下方に示されている“電車(ローカル)”、“徒歩”、“滞在”の文字は、説明のため付加したものである。図13の時系列データの最初は、ユーザが電車(ローカル)で移動中である場合の移動速度のデータであり、次が“徒歩”で移動中である場合、その次が“滞在”である場合の移動速度のデータとなっている。
ユーザが“電車(ローカル)”で移動している場合、電車が駅で停車し、出発するとき加速し、再度減速して駅に停車することを繰り返すので、移動速度vのプロットが繰り返し上下に振れるという特徴が表れている。なお、電車が停止している場合でも移動速度が0になっていないのは、移動平均によるフィルタリング処理を行っているためである。
また、ユーザが“徒歩”で移動している場合と“滞在”している場合は、最も区別しにくい状態であるが、移動平均によるフィルタリング処理により、移動速度vに明らかな違いが見られる。また、“滞在”では、進行方向θが瞬時に大きく変化する特徴がみられ、“徒歩”との差別化が容易であることがわかる。このように、移動平均によるフィルタリング処理、および、ユーザの移動を移動速度vと進行方向θで表すことにより、“徒歩”と“滞在”の区別が容易になっていることがわかる。
なお、“電車(ローカル)”と“徒歩”の間の部分は、フィルタリング処理のため、行動の切り替わり点がはっきりしない部分である。
図14は、図13に示した時系列データに対して、ラベル付けを行う例を示している。
例えば、行動状態ラベリング部102は、図13に示した移動速度のデータをディスプレイに表示する。そして、ユーザは、ディスプレイに表示された移動速度のデータのうち、ラベル付けをしたい部分を矩形の領域で囲む操作を、マウスなどにより行う。また、ユーザは、指定したデータに対して付与するラベルをキーボードなどから入力する。行動状態ラベリング部102は、ユーザによって指定された矩形領域に含まれる移動速度のデータに、入力されたラベルを付与することにより、ラベル付けを行う。
図14では、“徒歩”に相当する部分の移動速度のデータを矩形の領域で指示した例が示されている。なお、このとき、フィルタリング処理のため、行動の切り替わり点がはっきりしない部分については、指示する領域に含めないようにすることができる。時系列データの長さは、行動の違いが時系列データに明確に出る長さから決める。例えば、20ステップ(15秒×20ステップ=300秒)程度とすることができる。
[行動状態学習部103の構成例]
図15は、図11の行動状態学習部103の構成例を示すブロック図である。
行動状態学習部103は、分類部121とHMM学習部122乃至122により構成される。
分類部121は、行動状態ラベリング部102から供給されるラベル済み移動速度データのラベルを参照し、ラベルに対応するHMM学習部122乃至122のいずれかに供給する。即ち、行動状態学習部103では、ラベル(カテゴリ)ごとにHMM学習部122が用意されており、行動状態ラベリング部102から供給されるラベル済み移動速度データが、ラベルごとに分類されて、供給される。
HMM学習部122乃至122それぞれは、供給されるラベル済み移動速度データを用いて、学習モデル(HMM)を学習する。そして、HMM学習部122乃至122それぞれは、学習により得られるHMMのパラメータλを、図10の移動属性識別部92に供給する。
HMM学習部122は、ラベルが“滞在”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“徒歩”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“自転車”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“電車(ローカル)”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“車(一般道)”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“電車(快速)”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“車(高速)”である場合の、学習モデル(HMM)を学習する。
[移動属性識別部92の第1の構成例]
図16は、学習器100Aで学習されたパラメータを利用する場合の移動属性識別部92である、移動属性識別部92Aの構成例を示すブロック図である。
移動属性識別部92Aは、尤度計算部141乃至141と尤度比較部142とにより構成されている。
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91(図10)から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“滞在”である尤度を計算する。
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“徒歩”である尤度を計算する。
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“自転車”である尤度を計算する。
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“電車(ローカル)”である尤度を計算する。
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“車(一般道)”である尤度を計算する。
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“電車(快速)”である尤度を計算する。
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“車(高速)”である尤度を計算する。
尤度比較部142は、尤度計算部141乃至141それぞれから供給される尤度を比較し、尤度の最も高い行動状態を選択し、移動属性として出力する。
[移動属性識別部92の学習器の第2の構成例]
図17は、マルチストリームHMMにより、移動属性識別部92で使用されるユーザ活動モデルのパラメータを学習する学習器100Bの構成例を示している。
学習器100Bは、移動速度データ記憶部101、行動状態ラベリング部161、および行動状態学習部162により構成される。
行動状態ラベリング部161は、移動速度データ記憶部101から時系列に順次供給される移動速度のデータに対し、ユーザの行動状態をラベル(行動モード)として付与する。行動状態ラベリング部161は、移動速度の時系列データ(v,θ)と、それと関連付けられた行動モードMの時系列データを行動状態学習部162に供給する。
行動状態学習部162は、マルチストリームHMMにより、ユーザの行動状態を学習する。
ここで、マルチストリームHMMは、通常のHMMと同様な遷移確率を有する状態ノードから、複数の異なる確率法則に従うデータが出力されるようなHMMである。マルチストリームHMMでは、パラメータλのうち、出力確率密度関数bj(x)が時系列データごとに別々に用意される。マルチストリームHMMでは、異なる種類の時系列データ(ストリーム)を関連付けながら学習することができる。
行動状態学習部162には、連続量である移動速度vと進行方向θの時系列データと、離散量である行動モードMの時系列データが供給される。行動状態学習部162は、各状態ノードから出力される移動速度の分布パラメータと、行動モードの確率を学習する。学習により得られたマルチストリームHMMによれば、例えば、移動速度の時系列データから、現在の状態ノードが求められる。そして、求められた状態ノードから、行動モードを認識することができる。
カテゴリHMMを用いた第1の構成例では、HMMをカテゴリごとに7個用意する必要があるが、マルチストリームHMMでは1個のHMMで十分である。ただし、状態ノードの数は、第1の構成例において7個のカテゴリで使用された状態ノードの総数と同程度用意する必要がある。
[移動属性識別部92の第2の構成例]
図18は、学習器100Bで学習されたパラメータを利用する場合の移動属性識別部92である、移動属性識別部92Bの構成例を示すブロック図である。
移動属性識別部92Bは、状態ノード認識部181と行動モード認識部182により構成される。
状態ノード認識部181は、学習器100Bで学習されたマルチストリームHMMのパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データから、マルチストリームHMMの状態ノードを認識する。状態ノード認識部181は、認識された現在の状態ノードのノード番号を行動モード認識部182に供給する。
行動モード認識部182は、状態ノード認識部181で認識された状態ノードで、最も確率の高い行動モードを、移動属性として出力する。
[学習プリプロセス部22の処理]
図19は、学習プリプロセス部22による学習プリプロセス処理のフローチャートである。
学習プリプロセス処理では、最初に、ステップS1において、データ接続分割部71が、移動履歴データの接続および分割の処理を行う。
ステップS2において、データ異常除去部72が、移動履歴データの明らかな異常を除去する処理を行う。
ステップS3において、再サンプリング処理部73が、取得時刻の時間間隔が滞在閾値時間未満の欠落データを、線形補間により生成する処理を行う。
ステップS4において、再サンプリング処理部73が、移動履歴データを構成する各3次元データが線形補間により生成された補間データであるか否かに基づいて、補間フラグ系列データを生成する。
ステップS5において、移動属性識別付与部74が、移動履歴の3次元データそれぞれに対し、”滞在状態”かまたは”移動状態”の移動属性を識別し、付与する。なお、線形補間により生成した3次元データには、”LOST”の移動属性が付与される。
ステップS6において、滞在状態加工部75は、移動属性が”滞在状態”の3次元データを加工する。そして、滞在状態加工部75は、加工処理後の移動履歴データを、補間フラグ系列データとともに、学習メインプロセス部23に出力して、処理を終了する。
以上のように、学習プリプロセス部22では、移動履歴データが、必要に応じて分割等された後、データ欠落部分に補間データが生成され、移動属性が識別される。そして、”滞在状態”の3次元データに加工処理(ホールド処理)が行われ、加工処理後の移動履歴データが、補間フラグ系列データとともに、学習メインプロセス部23に供給される。
なお、上述した学習プリプロセス部22の学習プリプロセス処理では、補間データに対しては”LOST”の移動属性を付与したが、補間処理を先に行っているので、補間データに対しても移動属性を識別して付与してもよい。
[学習メインプロセス部23の詳細構成例]
図20は、学習ブロック11の学習メインプロセス部23の詳細構成例を示すブロック図である。
学習メインプロセス部23は、既知未知判定部201、新規モデル生成部202、新規モデル結合部203、パラメータ更新部204、および更新モデル整理部205により構成される。
学習プリプロセス部22(図1)からの移動履歴データ及び補間フラグ系列データは、既知未知判定部201に供給される。また、少なくとも1回以上、学習メインプロセス部23による学習が既に行われている場合、ユーザ別モデルパラメータ記憶部12(図1)から、先の学習により得られたユーザ活動モデルのパラメータが、既存モデルのパラメータとして取得される。既存モデルのパラメータは、既知未知判定部201、新規モデル結合部203、およびパラメータ更新部204に供給される。
既知未知判定部201は、学習プリプロセス部22から供給された移動履歴データが既知の経路の移動履歴データであるか否かを判定する。なお、2回目以降の学習では、供給された移動履歴データの一部が未知の経路の移動履歴データで、残りの一部が既知の経路の移動履歴データとなっていることもある。既知未知判定部201は、既知と判定された移動履歴データについては、移動履歴データの各3次元データが既存モデルのどの状態ノードに相当するか推定する。そして、既知未知判定部201は、既知の移動履歴データと、それに対応するノード系列データをパラメータ更新部204に供給する。
一方、既知未知判定部201は、供給された移動履歴データが未知の経路の移動履歴データであると判定した場合、未知の経路の移動履歴データを新規モデル生成部202に供給する。また、未知の経路の移動履歴データが既知の経路の移動履歴データと接続されている場合、既知未知判定部201は、未知の経路の移動履歴データの接続先となる、前後の既知の移動履歴データに対応する既存モデルの状態ノードを新規モデル生成部202に供給する。なお、未知の移動履歴データの後の既存モデルの状態ノードが存在しない場合、例えば、既知の経路から未知の経路を通って未知の目的地へ到達し、戻ってくるような場合には、前の既存モデルの状態ノードのみが新規モデル生成部202に供給される。
1回目の学習では、学習プリプロセス部22から供給された移動履歴データすべてが未知の移動履歴データとして新規モデル生成部202に供給される。また、1回目の学習では、前後の既存モデルの状態ノードは存在しないので、新規モデル生成部202への供給はない。
新規モデル生成部202は、既知未知判定部201から供給された未知の移動履歴データを用いてユーザ活動モデルを学習する。即ち、新規モデル生成部202は、未知の移動履歴データを確率的状態遷移モデルでモデル化したときのパラメータを求め、新規モデル結合部203に供給する。ここで学習されたユーザ活動モデルが、先の学習により得られている既存モデルとは別の、新規モデルとなる。なお、1回目の学習と2回目以降の学習は、学習対象の未知の移動履歴データのデータ量が異なるのみであり、同一の学習により、ユーザ活動モデルのパラメータを求めることができる。
新規モデル生成部202は、学習により得られた新規モデルのパラメータを、新規モデル結合部203に供給する。また、新規モデル生成部202は、前後の既存モデルの状態ノードが既知未知判定部201から供給された場合には、その前後の既存モデルの状態ノードも、新規モデル結合部203に供給する。
新規モデル結合部203は、2回目以降の学習において、未知の移動履歴データに基づいて、先の学習により得られている既存モデルを更新する。即ち、新規モデル結合部203は、未知の移動履歴データの前後の既存モデルの状態ノードに基づいて、既存モデルに、新規モデル生成部202からの新規モデルを結合し、更新後のユーザ活動モデルを生成する。新規モデル結合部203により更新されたユーザ活動モデルは、未知の移動履歴データに応じて状態ノードが追加されたトポロジー更新モデルである。
なお、新規モデル結合部203において、新規モデル生成部202からの新規モデルと結合される既存モデルは、学習メインプロセス部23に供給された移動履歴データに既知の経路の移動履歴データが全く含まれていない場合には、ユーザ別モデルパラメータ記憶部12(図1)から取得された既存モデルとなる。一方、学習メインプロセス部23に供給された移動履歴データに既知の経路の移動履歴データが一部含まれている場合には、新規モデルと結合される既存モデルは、パラメータ更新部204で更新された既存モデルとなる。
パラメータ更新部204は、既知の移動履歴データと、それに対応するノード系列データに基づいて、先の学習により得られている既存モデルを更新する。更新された既存モデルのパラメータは、新規モデル結合部203と更新モデル整理部205に出力される。パラメータ更新部204による更新では、上述したように状態ノードの追加はない。
更新モデル整理部205は、新規モデル結合部203により更新されたトポロジー更新モデル、または、パラメータ更新部204により更新されたパラメータ更新モデルのなかで、自己遷移のみで、他の状態ノードからの遷移が無い状態ノードを消去し、更新モデルを整理する。整理後の更新モデルのパラメータが、学習(更新学習)により得られたユーザ活動モデルのパラメータとして、学習ポストプロセス部24とユーザ別モデルパラメータ記憶部12に供給される。
[既知未知判定部201の詳細構成例]
次に、既知未知判定部201の詳細についてさらに説明する。
図21は、既知未知判定部201の詳細な構成例を示すブロック図である。
学習メインプロセス部23によって、少なくとも1回は学習処理が実行されている場合、既存モデルのパラメータがユーザ別モデルパラメータ記憶部12(図1)から既存モデル構築部221に供給される。既存モデル構築部221は、供給された既存モデルのパラメータに基づいて、既存モデルを構築し、未知状態ノード追加部222に供給する。
なお、1回も学習処理が実行されていない状態においては、既存モデル構築部221には、既存モデルの初期パラメータが予め設定されている。既存モデルの初期パラメータは、ノード数が1で、その1個の状態ノードの遷移確率が自己遷移のみ、中心値が3次元データ(時刻、経度、緯度)の取り得る範囲外の値、分散値が分散最小値、ノード頻度が1に設定されている。少なくとも1回の学習処理が実行され、ユーザ別モデルパラメータ記憶部12(図1)から既存モデルのパラメータが供給されることで、既存モデルの初期パラメータが上書きされ、消去される。
未知状態ノード追加部222は、既存モデル構築部221で構築された既存モデルに、未知の移動履歴データを引き受ける一つの状態ノード(以下、未知状態ノードと称する。)を追加する。これにより、既存モデルに1つの状態ノードが追加された学習モデル(以下、未知状態追加モデルと称する。)が構築され、状態ノード推定部223に供給される。
状態ノード推定部223は、未知状態ノード追加部222から供給された未知状態追加モデルを用いたビタビアルゴリズムにより、供給された移動履歴データの各3次元データに対応する未知状態追加モデルの状態ノードを推定する。未知状態追加モデルには、未知の移動履歴データを引き受ける1つのノードが追加されているので、入力された移動履歴データが未知の移動履歴データであっても、ビタビ推定が破綻なく行われる。仮に、移動履歴データを引き受ける1つのノードが追加されていない場合には、未知の移動履歴データに対しては、対応する状態ノードが見つからず、ビタビ推定が破綻する。
サンプル別尤度計算部224は、既知未知判定に用いる指標としての観測尤度の期待値を計算する。時刻tにおける観測尤度の期待値はL(t)で求められる。移動履歴データが既知の経路のデータである場合、観測尤度の期待値L(t)は大きくなり、移動履歴データが未知の経路のデータである場合、観測尤度の期待値L(t)は小さくなる。
既知未知判定部226は、観測尤度の期待値L(t)の時系列データ(観測尤度系列データ)に対して、既知未知モデル記憶部225に記憶されている、既知未知の二状態モデルを用いたビタビ判定を行うことで、既知または未知の判定を行う。
既知未知ポスト処理部227は、状態ノード推定部223が未知と推定した状態ノードで、既知未知判定部226が既知と判定したものを、未知に修正する。即ち、未知の判定は、状態ノード推定部223による推定結果が優先される。
また、既知未知ポスト処理部227は、修正後の判定結果を参照して学習プリプロセス部22(図1)から供給される移動履歴データを、新規モデル生成部202またはパラメータ更新部204に出力する。即ち、既知未知ポスト処理部227は、判定結果が既知である移動履歴データを、それに対応するノード系列データとともにパラメータ更新部204(図19)に供給する。一方、既知未知ポスト処理部227は、判定結果が未知である移動履歴データを、新規モデル生成部202に供給する。未知の移動履歴データが既知の移動履歴データと接続されている場合には、既知未知ポスト処理部227は、未知の移動履歴データの接続先となる、前後の既知の移動履歴データに対応する既存モデルの状態ノードも新規モデル生成部202に供給する。
[未知状態追加モデルの構築処理]
図22のフローチャートを参照して、未知状態ノード追加部222による未知状態追加モデルの構築処理について説明する。
初めに、ステップS21において、未知状態ノード追加部222は、未知状態追加モデルの各状態ノードの初期確率を格納した、未知状態追加モデルの初期確率テーブルを生成する。
初期確率テーブルは、図23に示すように、既存モデルのM個の状態ノードに未知の移動履歴データを引き受ける1個の状態ノードを追加した(M+1)行1列のテーブルで、各状態ノードの初期確率は、例えば、等確率の1/(M+1)に設定される。
ステップS22において、未知状態ノード追加部222は、未知状態追加モデルの各状態ノードの遷移確率を格納した、未知状態追加モデルの遷移確率テーブルを生成する。
遷移確率テーブルは、図24に示すように、(M+1)行(M+1)列のテーブルで構成される。遷移確率テーブルでは、第1行第1列乃至第M行第M列の既存モデルの各状態間の状態遷移確率aijに(1−eps)が乗算される。また、遷移確率テーブルの第(M+1)列の各要素には、一番下の(M+1)行を除いて、epsが設定され、第(M+1)行の各要素には、一番下の(M+1)行を除いて、epsが設定される。ここで、epsは、例えば、1.0E-8程度の、1より十分小さい所定の値であり、既存モデルの状態ノード間の遷移確率のどれよりも低い。この未知状態追加モデルでは、既存モデルの各状態ノードから未知状態ノードへの遷移確率がepsで、未知状態ノードから既存モデルの各状態ノードへの遷移確率もepsに設定されたことを表す。また、第(M+1)行第(M+1)列の要素は未知状態ノードの自己遷移確率を表し、(1−M×eps)である。図24の未知状態追加モデルでは、各行の総和が1となる。
ステップS23において、未知状態ノード追加部222は、未知状態追加モデルの各状態ノードの観測確率の中心値μsi(d)を格納した、未知状態追加モデルの中心値テーブルを生成する。
図25は、ステップS23で生成される未知状態追加モデルの中心値テーブルを示している。未知状態追加モデルの中心値テーブルの列数は、移動履歴データの次元数Dに対応し、行数は状態ノードの数に対応する。従って、本実施の形態では、未知状態追加モデルの中心値テーブルは、(M+1)行3列で構成される。そして、未知状態追加モデルの中心値テーブルは、既存モデルのM行D列の中心値テーブルに、第(M+1)行目として、未知状態ノードの中心値μsM+1(1)=E1,μsM+1(2)=E2,μsM+1(3)=E3の1行が追加された形となっている。
ここで、E1,E2,E3それぞれには、任意の値を設定することができる。例えば、E1は、時刻の取り得る値(0時から24時)の中心値である「12」、E2およびE3は、緯度、経度の取り得る値(−180から180まで)の中心値である0とすることができる。また例えば、E1、E2、およびE3それぞれは、既存モデルのM個の中心値μs1(d)乃至μsM(d)の平均値とすることができる。
ステップS24において、未知状態ノード追加部222は、未知状態追加モデルの各状態ノードの観測確率の分散値σsi(d)’2を格納した、未知状態追加モデルの分散値テーブルを生成する。
図26は、ステップS24で生成される未知状態追加モデルの分散値テーブルを示している。未知状態追加モデルの分散値テーブルの列数は、移動履歴データの次元数Dに対応し、行数は状態ノードの数に対応する。従って、本実施の形態では、未知状態追加モデルの分散値テーブルは、(M+1)行3列で構成される。そして、未知状態追加モデルの分散値テーブルは、既存モデルのM行D列の分散値テーブルに、第(M+1)行目として、未知状態ノードの分散値σsM+1(1)=V1,σsM+1(2)=V2,σsM+1(3)=V3の1行が追加された形となっている。
ここで、V1,V2,V3それぞれには、任意の値を設定することができるが大きい値であることが望ましい。例えば、V1は、0時から24時の取り得る範囲を網羅できるように、「12」の二乗より大きい値に設定する。V2およびV3は、−180から180までの緯度、経度の取り得る範囲を網羅できるように、180の二乗より大きい値に設定する。
以上の処理により、未知状態追加モデルの各パラメータが設定され、未知状態追加モデルが構築される。
[状態ノード推定部223の処理]
次に、状態ノード推定部223の処理について説明する。
状態ノード推定部223は、未知状態ノード追加部222から供給された未知状態追加モデルを用いたビタビアルゴリズムにより、供給された移動履歴データの各3次元データに対応する未知状態追加モデルの状態ノードを推定する。換言すれば、状態ノード推定部223は、ビタビアルゴリズムにより、各時刻の状態ノードの確率を取得する。
ビタビアルゴリズムは、時系列データの各時刻における観測確率とモデルの遷移確率を用いて、各時刻の状態ノードの確率を算出し、また、最も尤度が高くなるような状態遷移の系列(状態ノード系列)を算出するアルゴリズムである。
時刻tにおける状態ノードsiの確率δ(si,t)は、次式(4)及び(5)により、逐次的に求められる。
Figure 2012108748
式(4)は、時刻t=0では、どの状態も等しい確率で出現していたことを仮定している。(M+1)は、未知状態ノードが追加された後の全状態の個数である。式(5)のaijは、状態ノードsiからsjへの遷移確率である。また、P(ot−1|si)は、時刻t−1に状態ノードsiから3次元データoが観測される確率である。より具体的には、状態ノードsiに対して決められたパラメータμi、σiをそれぞれ中心、分散とする正規分布の確率密度である。式(5)は、状態ノードsjに関する規格化は省略されている。
ビタビアルゴリズムでは、式(5)において、状態ノードsjに至るいくつかの状態ノードsiの中で、式(5)の関数内の値が最大になる状態ノードsiが選ばれる。その状態ノードsi(simax)が各時刻tの各状態ノードsjに対して記憶される。
そして、時系列の最後の時刻tについて式(5)を満たす状態ノードsiが選ばれた後、次式(6)を、時系列を逆向きにたどっていくことで、最も尤度の高い状態ノード系列が算出される。
Figure 2012108748
以上の一般的なビタビアルゴリズムに対し、状態ノード推定部223では、時系列データの各時刻における観測確率に、次式(7)を採用する。換言すれば、式(5)及び式(6)のP(ot−1|si)として、次式(7)が採用される。
Figure 2012108748
ここで、etは、時刻tに観測される3次元データotが補間データであるときの誤差(仮想誤差)であり、式(7)は、予測システム1がその誤差範囲を出力しているのであれば、その値を直接的に用いるものである。仮想誤差etは、例えば、次式(8)で計算することができる。
Figure 2012108748
式(8)は、仮想誤差etが、補間データxと、データ欠落直前の時刻Tにおける3次元データxreal T1との間の距離か、または、補間データxと、データ復活直後の時刻Tにおける3次元データxreal T2との間の距離のいずれか小さい方とされることを表す。
図27は、式(8)で計算される仮想誤差etのイメージ図である。
図27において、破線の矢印が実際の移動経路を示し、楕円形の破線はパラメータμi、σiで表される状態ノードsiを示している。
また、図27では、時刻t21から時刻t33までの3次元データ(移動履歴データ)x21乃至x33が図示されている。このうち、白抜きの星印(☆)で示される3次元データx21乃至x24及びx30乃至x33はセンサデバイスで実際に取得された実データである。
一方、黒の星印(★)で示される3次元データxvirtual 25乃至xvirtual 29は、データ欠落部分であって線形補間により生成された補間データである。この補間データxvirtual 25乃至xvirtual 29に対して、式(8)で計算された仮想誤差e25乃至e29が太線の円で示されている。
式(8)では、実データから離れるほど、仮想誤差etが大きく設定される。
取得すべき時系列データ(3次元データ)が欠落していると、欠落した時刻tにおける状態ノードsiの確率δ(si,t)が生成できないので、ビタビアルゴリズムが実行できないことになる。しかし、欠落した3次元データを線形補間したデータで埋めることで、状態ノードsiの確率δ(si,t)が生成できない問題自体は解決できる。
しかしながら、線形補間でデータ自体は存在しても、その生成したデータが正しい経路からずれていて、確率モデル(学習モデル)で表現しきれない場合が考えられる。つまり、線形補間で生成したデータは、確率モデル中のどの状態ノードsiにも近くないため、観測確率P(ot−1|si)がどの状態ノードでも小さい(指数関数的に小さい)値になってしまう場合が考えられる。その結果、最尤状態遷移を選択できず、ビタビアルゴリズムが破綻して状態ノード系列そのものを出力することも出来なくなってしまう。
このことは、図27の例において、補間データxvirtual 25乃至xvirtual 29が実際の移動経路から離れているのみならず、行動モデルを表した状態ノードの楕円からも大きく外れていることからもわかる。
そこで、状態ノード推定部223は、補間された3次元データxに対して仮想誤差etを計算し、式(7)の仮想誤差etを用いた観測確率P(o,e|si)を採用している。この結果、仮に線形補間による補間データoが、実際に該当する状態ノードsiの中心μiから大きく離れていたとしても、そのときの仮想誤差eが大きいので、式(7)の指数関数内の値の絶対値は小さくなる。その結果、線形補間による補間データoが実際の状態ノードsiの中心μiから大きく外れていても、指数関数的に小さくなることはないので、データ欠落部分に関する最尤状態遷移を推定することができるようになっている。
図27の例においては、仮想誤差etを用いる効果は、仮想誤差etが示す円が実際の移動経路に対応する状態ノードの楕円に入ってきていることで表されている。
なお、上述した例では、仮想誤差etをデータ欠落前後の実データに基づく式(8)により求めたが、仮想誤差etの計算方法はこれに限定されるものではない。
[サンプル別尤度計算部224の観測尤度の計算]
次に、サンプル別尤度計算部224が行う観測尤度の計算について説明する。
サンプル別尤度計算部224は、既知未知判定に用いる指標としての観測尤度の期待値L(t)を計算する。観測尤度の期待値L(t)は、ビタビ推定された状態ノードの尤度を表す次式(9)により計算することができる。
Figure 2012108748
また、観測尤度の期待値L(t)は、計算速度、作業メモリなどの計算リソースを節約する目的で、式(9)を変更した式(10)を用いてもよい。式(10)は、ビタビ推定された状態ノードの尤度の期待値と言える。
Figure 2012108748
式(9)、及び、式(10)に含まれる観測確率P(o,e|si)は、上述した式(7)で計算されるものである。しかしながら、式(7)の観測確率P(o,e|si)は、分母に通常の分散σi の他に、仮想誤差et が加算されているため、通常の値よりもかなり大きくなる。換言すれば、データ欠落部分の観測確率P(o,e|si)は、3次元データが状態ノードの分布範囲内にある場合には、むしろ小さくなる傾向にある。
その結果、データ欠落部分の3次元データに対して、本来は適合する状態ノードがあったとしても、観測尤度の期待値L(t)が小さくなり、未知と判定されてしまう事態が発生する。
そこで、サンプル別尤度計算部224は、本来、既知であるデータ欠落部分の観測尤度の期待値L(t)が未知と判定されないようにするための補正を行う。換言すれば、サンプル別尤度計算部224は、データ欠落部分については実データよりも観測尤度が大きくなるように補正した観測尤度を採用する。
例えば、サンプル別尤度計算部224は、式(10)に代えて、次式(11)で表される観測尤度の期待値L1(t)を計算する。式(11)の観測尤度の期待値L1(t)は、仮想誤差et があることで観測確率P(o,e|si)が小さく作用する分母の仮想誤差et が省略された形となっている。
Figure 2012108748
あるいは、サンプル別尤度計算部224は、上述した式(9)または式(10)に、仮想誤差etに対して単調増加の補正項(a+b・et)を乗算したものを採用する。即ち、サンプル別尤度計算部224は、式(12)または式(13)で表される観測尤度の期待値L2(t)またはL3(t)を用いる。
Figure 2012108748
式(9)や式(10)の代わりに、式(11)乃至式(13)のいずれかの観測尤度の期待値を使用することで、仮想誤差etによって観測確率P(o,e|si)が低下しても、未知と判定されにくくすることができる。以下において、観測尤度の期待値L1(t)乃至L3(t)を特に区別しない場合には、観測尤度の期待値L(t)’と記述する。
式(11)乃至式(13)のいずれかにより計算される観測尤度の期待値L(t)’は、未知状態追加モデルが観測データを十分に説明できるのであれば大きくなる。一方、未知状態追加モデルが観測データを十分に説明できない場合と、観測データが未知状態ノードで説明される場合には、観測尤度の期待値L(t)’は小さくなる。従って、観測尤度の期待値L(t)’の大きさで、既知または未知の判定を行うことができる。なお、以下では、観測尤度の期待値L(t)’を、単に、観測尤度L(t)’と称する。
[サンプル別尤度計算部224の観測尤度計算処理]
図28は、サンプル別尤度計算部224による観測尤度計算処理のフローチャートである。
初めに、ステップS31において、サンプル別尤度計算部224は、データ欠落部分の観測確率P(o,e|si)を状態ノードごとに算出する。
ステップS32において、サンプル別尤度計算部224は、状態ノードごとの観測確率P(o,e|si)と確率δ(si,t)から、状態ノードsiに関する観測尤度L(t)を求める。ここでは、状態ノードsiに関する観測尤度L(t)として、例えば、式(9)で表される観測尤度L(t)を求めることとする。
ステップS33において、サンプル別尤度計算部224は、式(9)で表される観測尤度L(t)に補正項(a+bet)を乗算することにより、観測尤度L(t)’=L2(t)を求める。得られた観測尤度L(t)’は、後段の既知未知判定部226に供給され、処理は終了する。
[既知未知判定部226の既知未知判定処理]
次に、図29のフローチャートを参照して、サンプル別尤度計算部224で計算された観測尤度L(t)’を用いて既知または未知の判定を行う、既知未知判定部226の既知未知判定処理について説明する。
初めに、ステップS41において、既知未知判定部226は、ノード系列データに対応する観測尤度L(t)’の時系列データを、サンプル別尤度計算部224から取得する。そして、既知未知判定部226は、観測尤度L(t)’の時系列データのそれぞれを、対数尤度logL(t)’に変換する。即ち、既知未知判定部226は、各時刻tの観測尤度L(t)’の対数を計算する。
ステップS42において、既知未知判定部226は、対数尤度logL(t)’を飽和させた飽和対数尤度を求める処理を行う。具体的には、既知未知判定部226は、対数尤度logL(t)’から、所定のオフセット(閾値)を減算して所定の値で除算した結果を、tanh関数に入力することで、対数尤度logL(t)’を飽和させる。ステップS41およびS42の処理により、観測尤度L(t)’が、−1から1までの範囲を取るパラメータに変換される。
ステップS43において、既知未知判定部226は、既知と未知の二状態で構成されるHMMを用いてビタビ判定を行うことにより、飽和対数尤度に対し既知未知判定を行う。
既知状態と未知状態の二状態で構成されるHMMは、次式(14)で表される。
Figure 2012108748
即ち、既知状態と未知状態の初期確率πはともに同確率(0.5)である。また、ユーザの移動履歴を考えた場合、既知状態と未知状態が頻繁に入れ替わることは考えにくく、既知の経路を移動している場合も未知の経路を移動している場合も切り替わった後はある程度連続して続くと考えられる。従って、遷移確率Aは、1より非常に小さいな所定の値をεとして、既知状態と未知状態のそれぞれで自己遷移する確率が大きくなるように設定される。観測確率としては、既知状態が1、未知状態が−1を中心に分布し、分散値として1が設定されている。
[新規モデル生成部202の詳細構成例]
次に、新規モデル生成部202の詳細について説明する。
図30は、新規モデル生成部202の詳細な構成例を示すブロック図である。
新規モデル生成部202は、新規モデル初期化部241、新規モデル制約部242、新規モデル学習部243、ノード系列判定部244、パラメータ再計算部245、および新規モデル整理部246により構成される。
新規モデル生成部202には、既知未知判定部201から、未知の移動履歴データが供給される。また、未知の移動履歴データが既知の移動履歴データと接続されている場合には、未知の移動履歴データの前後の既存モデルの状態ノードも供給される。既知未知判定部201から供給される未知の移動履歴データと前後の既存モデルの状態ノードは、新規モデル生成部202の各部が必要に応じて取得することができる。
新規モデル初期化部241は、供給された未知の移動履歴データのサンプル数と同数の状態ノード数のHMMを、新規モデルとして宣言する(メモリ確保して生成する)。
新規モデル制約部242は、新規モデル初期化部241で宣言した新規モデルに、left-to-rightの制約を設定する。これは、一回の移動行動は、強い一方向性の制約があること、また、仮に移動方向に一方向性がなくても、時間は常に一方向性があることによる。
新規モデル学習部243は、未知の移動履歴データを用いて新規モデルを学習する。即ち、新規モデル学習部243は、既知未知判定部201から供給された未知の移動履歴データを用いて、新規モデルを表すleft-to-rightの制約が与えられたHMMのパラメータを求める。
ノード系列判定部244は、新規モデル学習部243の学習により得られた新規モデルを用いて、未知の移動履歴データの3次元データそれぞれを、新規モデルの状態ノードsiに変換したノード系列データを生成し、パラメータ再計算部245に供給する。具体的には、ノード系列判定部244は、新規モデル学習部243から供給されたパラメータに基づく新規モデルから、入力されたユーザの時刻、緯度、および経度に対応するユーザの現在の状態ノードsiを認識する処理を、未知の移動履歴データの最初のステップから最後のステップまで繰り返す。
パラメータ再計算部245は、ノード系列判定部244から供給されるノード系列データを基に、移動履歴データのHMMのパラメータに対応するノード系列データのパラメータを計算する。即ち、パラメータ再計算部245は、未知の移動履歴データのHMMの初期確率πi、状態遷移確率aij、および観測確率(中心値μiと分散値σi )に対応する、ノード系列データの初期確率<πi>、状態遷移確率<aij>、および観測確率(中心値<μi>と分散値<σi >)を計算する。以下において、”< >”で囲まれた初期確率πi、状態遷移確率aij、および観測確率(中心値μiと分散値σi )は、ノード系列データで再計算されたパラメータを表す。
また、パラメータ再計算部245は、各状態遷移の遷移頻度<trans_cntij>と各状態ノードsiの状態頻度<cnt_alli>と状態初期頻度<cnt_starti>を計算しておく。
ここで、遷移頻度<trans_cntij>は、状態ノードsiから状態ノードsjに遷移する頻度(カウント値)を表し、i=1乃至N,j=1乃至N(Nは、時系列データの最後のノード番号(=ノード数))である。状態頻度<cnt_alli>は、全てのノード系列データにおける状態ノードsiの総数であり、状態初期頻度<cnt_starti>は、ノード系列データの先頭が状態ノードsiである個数である。
一般に、更新後の初期確率πi_update、状態遷移確率aij_update、および観測確率の中心値μi_updateと分散値σi_update は、次のように表すことができる。
Figure 2012108748
πi_current、aij_current、並びにμi_current及びσi_current は、既存のノード系列データの状態ノードsiの初期確率、状態遷移確率、並びに観測確率の中心値および分散値である。また、πi_new、aij_new、並びにμi_new及びσi_new は、追加分のノード系列データの状態ノードsiの初期確率、状態遷移確率、並びに観測確率の中心値および分散値である。ni_currentとni_newは、ノード系列データの状態ノードsiの既存部分のノード数と追加部分のノード数である。
従って、パラメータ再計算部245が各状態遷移の遷移頻度<trans_cntij>と各状態ノードsiの状態頻度<cnt_alli>と状態初期頻度<cnt_starti>を計算して記憶しておくことで、次の更新の計算が容易になる。
なお、頻度を計算して記憶する代わりに、頻度を確率的にカウントして、非整数の成分を扱ってもよい。さらに、頻度の代わりに、頻度×平均値、頻度×分散値のようなパラメータを記憶してもよい。
パラメータ再計算部245は、状態初期頻度<cnt_starti>とともに、ノード系列判定部244から供給されるノード系列データの総数であるノード系列データ数<seq_cnt>も計算しておく。
新規モデル整理部246は、新規モデル初期化部241が宣言した新規モデルとしてのHMMの各状態ノードsiのなかで、使用されない状態ノードを消去することで、新規モデルを整理する。具体的には、新規モデル整理部246は、パラメータ再計算部245で計算された状態頻度<cnt_alli>が0の状態ノードsiを消去する。新規モデル整理部246により整理された後の新規モデル(のパラメータ)が、新規モデル結合部203に出力される。また、未知の移動履歴データの前後の既存モデルの状態ノードも既知未知判定部201から供給されていた場合には、それも、併せて新規モデル結合部203に出力される。
[新規モデル学習部243の学習処理]
次に、図31乃至図34を参照して、新規モデル学習部243の学習処理について説明する。
初めに、図31および図32を参照して、通常のHMMによる学習モデルと、新規モデル学習部243が行う学習モデルの違いについて説明する。
ユーザの移動履歴をHMMのように離散状態でモデル化する場合、通常、移動経路を一定の時間間隔でサンプルしたデータをモデル化する。移動履歴のデータを取得する際に、省電力の要請などの理由からサンプリング間隔を細かくできず、十分なサンプルが得られない場合、サンプル数とノード数があまり変わらないか、ノード数に比べてサンプル数が少ない状況が起こり得る。このような状況で、観測されるデータが所定の位置の周囲に正規分布する状態ノードを仮定する場合、一つのサンプルを一つのノードでモデル化することがある。この場合、ノードの分散値は非常に小さい値(あるいは0)に収束し、サンプルの近傍はモデル化されないことになる。従って、サンプリングされたサンプル間の経路はモデル化されない。
図31は、移動履歴を通常のHMMによりモデル化したときの概念図を示している。図31の直線(線分)はユーザの実際の移動経路を示し、バツ印(×)が移動履歴データとして取得されたサンプル、サンプルを囲む丸(○)がノードを示している。
図31に示すように、近くにサンプルが得られなかった場所(領域)はモデル化されないので、例えば、電車のような速い移動速度で移動しているような場合、サンプルとサンプルの間の経路はモデル化されない。一方、徒歩のような遅い移動速度で移動している場合、一つのノードで複数のサンプルをモデル化する場合がある。このような場合には、移動履歴をノードで適切に表現できていないことがある。
また、同一の移動経路を二回通過した場合に、ノードの分散値が非常に小さい値(あるいは0)に収束していると、二回目の通過した位置は、一回目の通過のときに表現されたノードでモデル化されず、異なるノードが割り当てられることがある。
このような問題を回避するためには、ノードの分散値に下限を設定し、サンプルから所定の領域の経路を必ずモデル化するようにさせることが考えられる。
しかし、分散値を大きくすると、異なる経路を同一の経路とみなす可能性も高くなる。例えば、平行に進む異なる経路を同一の経路とみなすおそれが生じる。さらに、分散値を大きくすると、移動速度の遅いときの移動履歴データを高い精度で再現することが難しくなる。逆に、分散値が小さくしすぎると、移動速度が速いときの移動履歴データを同一の経路と認識できなくなる。実際の移動履歴データのサンプルは、移動速度の違いで様々な距離感覚となるため、全てに適したノードの分散値の下限を決定するのは困難である。
そこで、新規モデル学習部243は、図32に示すように、一つの状態ノードが連続するサンプル二つ分を必ず反映するようなモデルを仮定することで、サンプルとサンプルの間の経路をモデル化する。新規モデル全体では、新規モデル学習部243は、各ノードが二つの連続するサンプルを順次つないだモデル化を行う。これにより、鎖で繋がれるように、経路全体の領域がもれなく新規モデルで表現することができる。
また、サンプルとサンプルの間隔が長くても、二つのサンプル間を含むようにモデル化しているので、ノードの分散値は小さく設定することができる。逆に、サンプルとサンプルの間隔が短い場合も同様にモデル化できるため、スケールフリーなモデル化を実現することができる。
なお、後述するように、新規モデル学習部243は、一つの状態ノードが連続する3つ以上のサンプルを反映するようにモデル化することも可能であり、一つの状態ノードがいくつのサンプルを反映するようにモデル化するかは、適宜、決定することができる。
図33は、新規モデル学習部243の学習モデルをグラフィカルモデルで表したものである。
図33Aの学習モデルは、現在のある状態ノードが、現在のデータと、一つ前(一つ後ろ)の2つのサンプルを観測するモデルである。図33Aでは、一つの状態ノードからの矢印が、下と右下にあるが、下と左下に向かう矢印のあるモデルでもよい。
なお、本実施の形態では、図32に示したように、一つの状態ノードが二つの連続するサンプルを表現するモデルを採用するが、一つの状態ノードが3以上の連続するサンプルを表現するモデルを採用することもできる。図33Bのモデルは、一つの状態ノードが3つの連続するサンプルを表現するモデルのグラフィカルモデルである。
[新規モデル学習部243の新規モデル学習処理]
次に、図34のフローチャートを参照して、新規モデル学習部243の新規モデル学習処理について説明する。
初めに、ステップS51において、新規モデル学習部243は、未知の移動履歴データに対する各状態の尤度を計算する。具体的には、新規モデル学習部243は、ユーザ活動モデルを表すHMMの状態siへの遷移時に、移動履歴データの2つのサンプル、時刻tの位置のデータxtと時刻t+1の位置のデータxt+1が出力されると仮定した観測尤度P(xt,xt+1|si)を、次式(15)により計算する。
Figure 2012108748
なお、時刻tは、時系列データの測定時刻ではなく、時系列データの順番(ステップ数)を表し、1からT(時系列データのサンプル数)までの値をとる。また、式(15)のxt(1)、xt(2)、xt(3)は、それぞれ移動履歴データxtの時刻、緯度、経度を表すものとする。さらに、式(5)のN()は、単一正規分布を表し、μsi(1)、σsi(1)は、時刻の単一正規分布の中心値および分散値を表す。また、μsi(2)、σsi(2)は、緯度の単一正規分布の中心値および分散値を表し、μsi(3)、σsi(3)は、経度の単一正規分布の中心値および分散値を表すものとする。
観測尤度P(xt,xt+1|si)は、元の時系列データと、一つずれた時系列データの同時分布なので、それぞれの観測系列の分布の積となっている。
なお、一つの状態ノードがW個以上の連続するサンプルを表現するモデルの観測尤度P(xt,・・・,xt+W|si)は、次式(16)で表すことができる。勿論、時系列データの次元数Dも3より大きい値に一般化することも可能である。
Figure 2012108748
ステップS51では、全ての状態siと3次元データxtの組み合わせについて、式(15)による観測尤度P(xt,xt+1|si)が、新規モデル学習部243によって計算される。
次に、ステップS52において、新規モデル学習部243は、各時刻tにおける全ての状態siのフォワード尤度αt(si)を計算する。即ち、新規モデル学習部243は、次の式(17)および式(18)により、時刻tにおける状態siのフォワード尤度αt(si)を時刻1から最終の時刻Tまで順番に計算する。
Figure 2012108748
なお、式(17)のπsiは、状態siの初期確率を表す。また、式(18)のajiは、状態sjから状態siへの状態遷移確率を表す。なお、初期確率πsiおよび状態遷移確率ajiの初期値は、例えば、外部から与えられる。
ステップS53において、新規モデル学習部243は、各時刻tにおける全ての状態siのバックワード尤度βt(si)を計算する。即ち、新規モデル学習部243は、次の式(19)および式(20)により、時刻tにおける状態siのバックワード尤度βt(si)を、最終の時刻Tから時刻1まで逆順に計算する。
Figure 2012108748
式(19)では、時刻Tに各状態siである確率が全て等しいものとされている。
このように、ステップS51乃至S53の処理により、移動履歴データに対する隠れマルコフモデルの各種の尤度が計算される。
ステップS54において、新規モデル学習部243は、初期確率、状態遷移確率を更新する。即ち、新規モデル学習部243は、各状態siの初期確率πsi、各状態間の状態遷移確率aijを、次の式(21)および式(22)で求まる初期確率πsi’、状態遷移確率aij’にそれぞれ更新する。
Figure 2012108748
式(21)および式(22)は、Baum-Welchの最尤推定法で一般的に用いられる式に、観測尤度P(xt,xt+1|si)を適用したものである。
ステップS55において、新規モデル学習部243は、観測確率を更新する。即ち、新規モデル学習部243は、各状態siの観測確率(確率分布)の中心値μsi(d)、分散値σsi(d)2を、次の式(23)および式(24)で求まる中心値μsi(d)’、分散値σsi(d)’2にそれぞれ更新する。
Figure 2012108748
式(23)および式(24)のdは、データの次元Dに対応し、1,2、または3のいずれかとなる。
一つの状態ノードがW個以上の連続するサンプルを表現するモデルで、次元数がDである場合の観測確率の中心値μsi(d)’および分散値σsi(d)’2は、次の式(25)および式(26)で求めることができる。
Figure 2012108748
式(23)および式(25)の中心値μsi(d)’、並びに、式(24)および式(26)の分散値σsi(d)’2は、尤度を最小化する式を解くことで、容易に算出することができる。
ステップS56において、新規モデル学習部243は、パラメータの更新を終了するか否かを判定する。例えば、各尤度の増分が所定の値以下となり、パラメータの更新の収束条件を満たした場合、新規モデル学習部243は、パラメータの更新を終了すると判定する。あるいは、ステップS51乃至S55の処理を規定の回数繰り返し実行した場合、パラメータの更新を終了すると判定するとしてもよい。
ステップS56で、パラメータの更新を終了しないと判定された場合、処理はステップS51に戻る。
ステップS51では、新規モデル学習部243は、更新されたパラメータに基づいて、各状態の尤度が計算される。即ち、ステップS54およびS55の処理で更新された、各状態siの初期確率πsi’、中心値μsi(d)’および分散値σsi(d)’2、並びに、各状態間の状態遷移確率aij’を示すデータに基づいて、各状態の尤度が計算される。
その後、同様にステップS52乃至S55の処理が実行される。これにより、状態siの系列の各種の尤度、すなわち、観測尤度P(xt,xt+1|si)、フォワード尤度αt(si)、バックワード尤度βt(si)が次第に増加し、最終的に最大になるように、HMMのパラメータの更新が行われる。そして、ステップS56において、再度、パラメータの更新を終了するか否かが判定される。
ステップS56で、パラメータの更新を終了すると判定された場合、処理はステップS57に進む。
ステップS57において、新規モデル学習部243は、最終的なパラメータをノード系列判定部244に出力する。即ち、新規モデル学習部243は、最終的に求められた、各状態siの初期確率πsi’、中心値μsi(d)’および分散値σsi(d)’2、並びに、各状態間の状態遷移確率aij’を示すデータをノード系列判定部244に出力して、処理を終了する。
[パラメータ再計算部245のパラメータ再計算処理]
次に、図35のフローチャートを参照して、パラメータ再計算部245のパラメータ再計算処理について説明する。
初めに、ステップS71において、パラメータ再計算部245は、ノード系列判定部244から供給される全てのノード系列データを対象として、各状態遷移の遷移頻度<trans_cntij>(i=1乃至N,j=1乃至N,Nは、時系列データの最後のノード番号(=ノード数))をカウントする。
ステップS72において、パラメータ再計算部245は、ノード系列判定部244から供給される全てのノード系列データを対象として、各状態ノードsiの状態頻度<cnt_alli>、状態初期頻度<cnt_starti>、およびノード系列データ数<seq_cnt>をカウントする。
ステップS73において、パラメータ再計算部245は、ノード系列データの初期確率<πi>’と状態遷移確率<aij>’を計算(更新)する。ノード系列データの初期確率<πi>’および状態遷移確率<aij>’は、次の式(27)および式(28)により計算することができる。
Figure 2012108748
ステップS74において、パラメータ再計算部245は、ノード系列データの観測確率、即ち、各状態ノードsiの中心値<μj>’と分散値<σj >’を計算(更新)する。各状態ノードsiの中心値<μj>’と分散値<σj >’は、次の式(29)および式(30)により計算することができる。
Figure 2012108748
式(29)及び式(30)において、xt_kは、移動履歴データの3次元データxtのうち、状態ノードsiに対応する3次元データを表す。従って、xt_kの個数は、状態ノードsiの状態頻度<cnt_alli>と等しくなる。
なお、一つの状態ノードがW個以上の連続するサンプルを表現するモデルでは、各状態ノードsiの中心値<μj>’と分散値<σj >’は、次の式(31)および式(32)により計算することができる。
Figure 2012108748
以上で、パラメータ再計算部245によるパラメータ再計算処理は終了する。
なお、図33のグラフィカルモデルを用いていることが、図30の新規モデル学習部243(式(15),式(16)、式(23)乃至式(26))と、パラメータ再計算部245(式(29)乃至式(32))に反映されている。従って、例えば、処理を簡略化する要請があるならば、図30のパラメータ再計算部245のみに、図33のグラフィカルモデルを反映しただけの実施例でもよい。この場合、図30の新規モデル学習部243には、通常のバウムウエルチアルゴリズムによる学習を採用することができる。また、さらに簡略化するならば、通常のバウムウエルチアルゴリズムの代わりに、取得した移動履歴データに対して、前から順に番号を割り振って、これを状態ノードの番号とするような処理に変更してもよい。この場合、図7の移動属性識別付与部74で与えられた移動属性を見て、現在の移動履歴の3次元データの移動属性が滞在状態でなければ、一つ前の3次元データに割り振られた番号を1大きくした番号が、状態ノードの番号として割り振られる。一方、現在の移動履歴の3次元データの移動属性が滞在状態であれば、一つ前の3次元データに割り振られた番号と同じ番号が状態ノードの番号として割り振られる。
[新規モデル生成部202の新規モデル生成処理]
図36は、新規モデル生成部202が行う新規モデル生成処理全体のフローチャートである。
初めに、ステップS91において、新規モデル初期化部241は、既知未知判定部201から供給された未知の移動履歴データを取得し、それに対応する新規モデルを生成する。即ち、新規モデル初期化部241は、取得した未知の移動履歴データのサンプル数と同数の状態ノード数のHMMを生成する。
ステップS92において、新規モデル制約部242は、新規モデル初期化部241で生成したHMMにleft-to-rightの制約を設定する。
ステップS93において、新規モデル学習部243は、未知の移動履歴データを用いて新規モデルを学習する。即ち、ステップS93では、新規モデルは、図32に示したように、一つの状態ノードが連続するサンプル二つ分を必ず反映するようなモデルとして、図34を参照して説明した新規モデル学習処理が実行される。
ステップS94において、ノード系列判定部244は、ステップS93の新規モデル学習処理により得られた新規モデルを用いて、未知の移動履歴データに対応するノード系列データを生成し、パラメータ再計算部245に供給する。
ステップS95において、パラメータ再計算部245は、ノード系列判定部244から供給されるノード系列データを基に、移動履歴データのHMMのパラメータに対応するノード系列データのパラメータを計算する。より具体的には、パラメータ再計算部245は、ノード系列データの初期確率<πi>’、状態遷移確率<aij>’、および各状態ノードsiの中心値<μj>’と分散値<σj >’を計算する。また、パラメータ再計算部245は、各状態ノードsiの状態頻度<cnt_alli>と状態初期頻度<cnt_starti>も計算する。
ステップS96において、新規モデル整理部246は、生成した新規モデルとしてのHMMの各状態ノードsiのなかで、使用されない状態ノードを消去することで、新規モデルを整理する。そして、新規モデル整理部246は、整理後の新規モデルのパラメータと、未知の移動履歴データの前後の既存モデルの状態ノードも既知未知判定部201から供給されていた場合には、それも、新規モデル結合部203に出力して、処理を終了する。
[新規モデル結合部203のトポロジー更新モデル生成処理]
次に、先の学習により得られている既存モデルと、未知の移動履歴データにより生成された新規モデルを結合し、トポロジー更新モデルを生成する新規モデル結合部203のトポロジー更新モデル生成処理について説明する。
まず、説明の前提として、以下の変数を定義する。
既存モデル :xhmm
新規モデル :yhmm
トポロジー更新モデル:zhmm
既存モデルxhmm、新規モデルyhmm、トポロジー更新モデルzhmmそれぞれは、次の変数を有する。なお、以下のhmmは、学習モデル(HMM)に共通の表記であり、既存モデルのときはxhmmと、新規モデルのときはyhmmと、トポロジー更新モデルのときはzhmmと読み替える。
状態ノード数 :hmm.node
既存モデルxhmmの状態ノード数xhmm.node=M
新規モデルyhmmの状態ノード数yhmm.node=N
トポロジー更新モデルzhmmの状態ノード数zhmm.node=M+N
学習対象の時系列データの次元数D :hmm.D
各状態ノードの初期確率πi :hmm.pi(i)
hmm全体の初期確率hmm.piは、hmm.node行1列のテーブル(初期確率テーブル)となる。
各状態ノードの遷移確率aij :hmm.a(i,j)
hmm全体の遷移確率hmm.aは、hmm.node行hmm.node列のテーブル(遷移確率テーブル)となる。
各状態ノードの確率分布の中心値μi :hmm.mu(i)
hmm全体の確率分布の中心値hmm.muは、hmm.node行hmm.D列のテーブル(中心値テーブル)となる。
各状態ノードの確率分布の分散値σi :hmm.sigma2(i)
hmm全体の確率分布の分散値hmm.sigma2は、hmm.node行hmm.D列のテーブル(分散値テーブル)となる。
学習した時系列データの数seq_cnt :hmm.seq_cnt
各状態ノードの状態頻度cnt_alli :hmm.cnt_all(i)
hmm全体の状態頻度hmm.cnt_allは、hmm.node行1列のテーブル(状態頻度テーブル)となる。
図37のフローチャートを参照して、新規モデル結合部203によるトポロジー更新モデル生成処理について説明する。
初めに、ステップS101において、新規モデル結合部203は、トポロジー更新モデルの初期確率zhmm.piを計算する。
ステップS101では、まず、新規モデル結合部203は、既存モデルがM個、新規モデルがN個の状態ノードからなるので、図38Aに示すように、初期確率zhmm.piとしての(M+N)行1列の初期確率テーブルを生成する。
そして、新規モデル結合部203は、トポロジー更新モデルの初期確率テーブルの第1行乃至第M行の第m行に(m=1,2,・・,M)は、図38Aに示すように、既存モデルの初期確率xhmm.pi(m)に、既存モデルの時系列データ数xhmm.seq_cntを乗算した値を設定する。また、トポロジー更新モデルの初期確率テーブルの第(M+1)行乃至第(M+N)行の第(M+n)行(n=1,2,・・・,N)には、新規モデルの初期確率yhmm.pi(n)に、新規モデルの時系列データ数yhmm.seq_cntを乗算した値を設定する。
そして、図38Bに示されるように、トポロジー更新モデルの初期確率テーブルの各行が、初期確率テーブルの全要素の総和SUM_piで除算されることで規格化され、トポロジー更新モデルの初期確率テーブルzhmm.piの生成が終了する。
次に、ステップS102において、新規モデル結合部203は、トポロジー更新モデルの時系列データ数zhmm.seq_cntを計算する。具体的には、新規モデル結合部203は、既存モデルの時系列データ数xhmm.seq_cntと、新規モデルの時系列データ数yhmm.seq_cntの和を計算し、トポロジー更新モデルの時系列データ数zhmm.seq_cntとする。
ステップS103において、新規モデル結合部203は、トポロジー更新モデルの遷移確率zhmm.aと状態頻度zhmm.cnt_allを計算する。
ステップS103では、まず、新規モデル結合部203は、既存モデルがM個、新規モデルがN個の状態ノードからなるので、図39に示すように、(M+N)行(M+N)列の遷移確率テーブルを生成する。なお、遷移確率テーブルの第1行第1列から第M行M列を左上領域、第(M+1)行第(M+1)列から第(M+N)行(M+N)列を右下領域、第1行第(M+1)列から第M行(M+N)列を右上領域、第(M+1)行第1列から第(M+N)行M列を左下領域という。
そして、新規モデル結合部203は、生成した遷移確率テーブルの左上領域の各要素に、既存モデルの状態ノードsmの遷移確率xhmm.a(m,j)に、既存モデルの状態ノードsmの状態頻度xhmm.cnt_all(m)を乗算した値を設定する(j=1,・・・,M)。
また、新規モデル結合部203は、生成した遷移確率テーブルの右下領域の各要素に、新規モデルの状態ノードsmの遷移確率yhmm.a(m,j)に、新規モデルの状態ノードsmの状態頻度yhmm.cnt_all(m)を乗算した値を設定する(j=1,・・・,M)。
なお、図39では、紙面の制約上、xhmm.a(m,j)×xhmm.cnt_all(m)、yhmm.a(m,j)×yhmm.cnt_all(m)と、同一行についてはまとめて図示している。
さらに、新規モデル結合部203は、生成した遷移確率テーブルの右上領域の各要素については、基本的に”0”を代入する。ただし、未知の移動履歴データの前の既存モデルの状態ノードが、新規モデル生成部202から供給され、新規モデルが既存モデルのノード系列データの後に接続される場合、その接続先の状態ノードに対応する要素のみ、”1”が代入される。具体的には、接続先の状態ノードがsである場合、第i行第(M+1)列の要素に、”1”が設定される。
同様に、新規モデル結合部203は、生成した遷移確率テーブルの左下領域の各要素については、基本的に”0”を代入する。ただし、未知の移動履歴データの後の既存モデルの状態ノードが、新規モデル生成部202から供給され、新規モデルの後に既存モデルのノード系列データが接続される場合、その接続先の状態ノードに対応する要素のみ、”1”が代入される。具体的には、接続先の状態ノードがsである場合、第(M+N)行第j列の要素に、”1”が設定される。
次に、新規モデル結合部203は、図40に示すように、生成した遷移確率テーブルの左上領域と右下領域について、行方向の和を演算することにより、トポロジー更新モデルの状態頻度zhmm.cnt_allを計算する。図40の状態頻度テーブルは、(M+N)行1列のテーブルによりなる。
最後に、新規モデル結合部203は、図41に示すように、図39の遷移確率テーブルの左上領域と右下領域の各行を、トポロジー更新モデルの状態頻度テーブルの各行zhmm.cnt_all(i)で除算して、規格化する。以上で、トポロジー更新モデルの遷移確率テーブルの生成が終了する。
そして、処理はステップS104に進み、新規モデル結合部203は、トポロジー更新モデルの確率分布の中心値zhmm.muおよび分散値zhmm.sigma2を計算する。
ステップS104では、既存モデルがM個、新規モデルがN個の状態ノードからなるので、トポロジー更新モデルの中心値zhmm.muに対応する中心値テーブルは、(M+N)行D列で構成される。
図42に示すように、(M+N)行D列の中心値テーブルの第1行から第M行の各行には、既存モデルの中心値xhmm.mu(i,1),xhmm.mu(i,2),xhmm.mu(i,3)が代入される(i=1,・・・,M)。また、(M+N)行D列の中心値テーブルの第(M+1)行から第(M+N)行の各行には、新規モデルの中心値yhmm.mu(i,1),yhmm.mu(i,2),yhmm.mu(i,3)が代入される(i=1,・・・,N)。ここで、xhmm.mu(i,1)及びyhmm.mu(i,1)は、移動履歴データの時刻の中心値であり、xhmm.mu(i,2)及びyhmm.mu(i,2)は、移動履歴データの緯度の中心値であり、xhmm.mu(i,3)及びyhmm.mu(i,3)は、移動履歴データの経度の中心値である。
同様に、トポロジー更新モデルの確率分布の分散値zhmm.sigma2に対応する分散値テーブルも、(M+N)行D列で構成される。
図43に示すように、(M+N)行D列の分散値テーブルの第1行から第M行の各行には、既存モデルの分散値xhmm.sigma2(i,1),xhmm.sigma2(i,2),xhmm.sigma2(i,3)が代入される(i=1,・・・,M)。また、(M+N)行D列の分散値テーブルの第(M+1)行から第(M+N)行の各行には、新規モデルの分散値yhmm.sigma2(i,1),yhmm.sigma2(i,2),yhmm.sigma2(i,3)が代入される(i=1,・・・,N)。ここで、xhmm.sigma2(i,1)及びyhmm.sigma2(i,1)は、移動履歴データの時刻の分散値であり、xhmm.sigma2(i,2)及びyhmm.sigma2(i,2)は、移動履歴データの緯度の分散値であり、xhmm.sigma2(i,3)及びyhmm.sigma2(i,3)は、移動履歴データの経度の分散値である。
そして、処理はステップS105に進み、新規モデル結合部203は、トポロジー更新モデルのパラメータを更新モデル整理部205に出力する。即ち、トポロジー更新モデルの初期確率zhmm.pi、時系列データ数zhmm.seq_cnt、遷移確率zhmm.a、状態頻度zhmm.cnt_all、並びに、確率分布の中心値zhmm.muおよび分散値zhmm.sigma2が更新モデル整理部205に出力される。以上で、トポロジー更新モデル生成処理は終了する。
[パラメータ更新部204のパラメータ更新処理]
次に、パラメータ更新部204によるパラメータ更新処理について説明する。
図44は、パラメータ更新部204が行うパラメータ更新処理全体のフローチャートである。
初めに、ステップS121において、パラメータ更新部204は、既知未知判定部201から供給された、既知の移動履歴データと、それに対応するノード系列データ及び補間フラグ系列データを取得する。以下では、説明を簡単にするため、1個の既知の移動履歴データと、それに対応するノード系列データ及び補間フラグ系列データが取得されたとして説明する。
ステップS122において、パラメータ更新部204は、既存モデルの初期確率xhmm.piを更新する。
ステップS122では、まず、初期確率xhmm.piとしてのM行1列の初期確率テーブルの、取得された状態ノード系列の先頭ノードに対応する初期確率xhmm.pi(i)に1が加算される。図45Aでは、状態ノード系列の先頭ノードが状態ノードs18である例として、xhmm.pi(18)に1が加算されている。
そして、確率の条件を満たすため、図45Bに示すように、初期確率テーブルの各行が、全要素の総和SUM_piで除算されることで規格化され、既存モデルの初期確率xhmm.piの更新が終了する。
次に、ステップS123において、パラメータ更新部204は、既存モデルの時系列データ数xhmm.seq_cntを更新する。時系列データ数は一つ増加するだけであるので、現在のxhmm.seq_cntに1を加算したものが更新後の既存モデルの時系列データ数xhmm.seq_cntとされる。
ステップS124において、パラメータ更新部204は、既存モデルの遷移確率xhmm.aと状態頻度xhmm.cnt_allを更新する。
ステップS124では、まず、取得された状態ノード系列で発生している状態遷移に対応する遷移確率テーブルの各要素に、1が加算される。例えば、図46の例では、状態ノードs18から状態ノードsへの遷移と、状態ノードsMから状態ノードsへの遷移が、少なくとも発生し、xhmm.a(18,2)×xhmm.cnt_all(18)とxhmm.a(M,2)×xhmm.cnt_all(M)のそれぞれに、1が加算されている。
また、取得された状態ノード系列の最後尾の状態ノードについては、自己遷移に対応する遷移確率テーブルの要素に、1が加算される。例えば、図46では、状態ノード系列の最後尾の状態ノードがsである例として、xhmm.a(2,2)×xhmm.cnt_all(2)に、1が加算されている。
次に、パラメータ更新部204は、図47に示すように、1を加算後の遷移確率テーブルに対し、行方向の和を演算することで、既存モデルの状態頻度xhmm.cnt_allを計算(更新)する。
最後に、パラメータ更新部204は、図48に示すように、1を加算後の遷移確率テーブルの各行を、更新後の既存モデルの状態頻度xhmm.cnt_all(i)で除算して、規格化する。以上の計算により、既存モデルの遷移確率テーブルが更新される。
そして、処理はステップS125に進み、パラメータ更新部204は、補間フラグ系列データに基づいて、状態ノードに対応する3次元データが補間データであるかを、状態ノードそれぞれについて判定する。
ステップS125で、状態ノードに対応する3次元データが補間データではない(実データである)と判定された場合には、その状態ノードに対して、次のステップS126の処理が実行される。一方、ステップS125で、状態ノードに対応する3次元データが補間データであると判定された場合には、ステップS126の処理がスキップされる。
ステップS126では、パラメータ更新部204は、既存モデルの確率分布の中心値xhmm.muおよび分散値xhmm.sigma2を更新する。
一般に、既存モデルにおいて状態ノードsiがM個出現し、その平均値がμsiである場合において、M+1番目の状態ノードsiと認識される新しいサンプルxM+1が増えたときの更新前の平均値μsi (M)と更新後のμsi (M+1)との間には、次の関係がある。
Figure 2012108748
式(33)および式(34)において、右肩の括弧付きの文字は状態ノードsiの出現回数を表す。
そこで、パラメータ更新部204は、図49に示すように、M行D列の中心値テーブルの各行の要素に、上述したステップS124で状態頻度xhmm.cnt_all(i)を更新する前の、1つ前の状態頻度xhmmOLD.cnt_all(i)を乗算する(i=1,・・・,M)。従って、1つ前の状態頻度xhmmOLD.cnt_all(i)は、ステップS124の処理を行う前に、所定の場所に格納しておく必要がある。
次に、パラメータ更新部204は、新しいサンプルxM+1に対応する状態ノードに対応する中心値テーブルの行に、新しいサンプルxM+1としての既知の移動履歴データ(補間データではない3次元データのそれぞれ)を加算する。
さらに、パラメータ更新部204は、M行D列の中心値テーブルの各行の要素を、上述したステップS124で更新した状態頻度xhmm.cnt_all(i)で除算する。以上で、既存モデルの確率分布の中心値xhmm.muの更新が終了する。
一方、既存モデルにおいて状態ノードsiがM個出現し、その平均値がμsi、分散値がσsi である場合において、M+1番目の状態ノードsiと認識される新しいサンプルxM+1が増えたときの更新前の平均値σsi 2(M)と更新後のσsi 2(M+1)との間には、次の関係がある。
Figure 2012108748
式(35)および式(36)において、右肩の括弧付きの文字は状態ノードsiの出現回数を表す。
そこで、パラメータ更新部204は、M行D列の分散値テーブルの各行の要素に、既存モデルの確率分布の中心値xhmm.muを更新する前の、1つ前の中心値xhmm OLD.muの二乗を加算する(i=1,・・・,M)。従って、1つ前の中心値xhmm OLD.muも、上述の更新を行う前に、所定の場所に格納しておく必要がある。
次に、パラメータ更新部204は、1つ前の中心値xhmm OLD.muの二乗加算後のM行D列の分散値テーブルの各行の要素に、1つ前の状態頻度xhmmOLD.cnt_all(i)を乗算する。
図50は、状態頻度xhmmOLD.cnt_all(i)を乗算後の分散値テーブルを示している。
さらに、パラメータ更新部204は、新しいサンプルxM+1に対応する状態ノードに対応する中心値テーブルの行に、新しいサンプルxM+1としての既知の移動履歴データ(補間データではない3次元データのそれぞれ)の二乗を加算する。
最後に、パラメータ更新部204は、M行D列の中心値テーブルの各行の要素を、上述したステップS124で更新した状態頻度xhmm.cnt_all(i)で除算し、かつ、更新後の中心値xhmm.mu(i)の二乗を減算する。以上で、既存モデルの確率分布の分散値xhmm.sigma2の更新が終了する。
そして、処理はステップS127に進み、パラメータ更新部204は、更新された既存モデルのパラメータを新規モデル結合部203と更新モデル整理部205に出力する。即ち、更新された既存モデルの初期確率xhmm.pi、時系列データ数xhmm.seq_cnt、遷移確率xhmm.a、状態頻度xhmm.cnt_all、並びに、確率分布の中心値xhmm.muおよび分散値xhmm.sigma2が出力される。以上で、パラメータ更新処理は終了する。
以上のように、パラメータ更新処理では、既知の移動履歴データのデータ欠落部分(補間データ)については、その経路を通ったという事実(既存モデルの時系列データ数xhmm.seq_cnt)や状態ノードの遷移パラメータ(遷移確率xhmm.a、状態頻度xhmm.cnt_all)のみ更新される。換言すれば、既知の移動履歴データのデータ欠落部分(補間データ)については、状態ノードの確率分布パラメータ(中心値xhmm.muおよび分散値xhmm.sigma2)については更新しない。補間データは、実際の経路からずれている可能性が高いからである。これにより、1回以上は実データを取得したことがあり、何らかの条件で今回取得できなかったような移動履歴データについての状態ノードの確率分布パラメータの信頼度低下を防止することができる。
[学習メインプロセス部23全体の処理]
次に、図51のフローチャートを参照して、学習メインプロセス部23全体の学習メインプロセス処理について説明する。
初めに、ステップS141において、学習メインプロセス部23は、学習プリプロセス部22(図1)から供給される移動履歴データと、ユーザ別モデルパラメータ記憶部12(図1)から供給される、既存モデルのパラメータを取得する。移動履歴データは、既知未知判定部201が取得し、既存モデルのパラメータは、既知未知判定部201、新規モデル結合部203、およびパラメータ更新部204が取得する。
ステップS142において、既知未知判定部201は、供給された移動履歴データが既知の経路の移動履歴データであるか否か判定する既知未知判定処理を行う。
図21乃至図29を参照して説明したように、既知未知判定処理では、既存モデルの状態ノードに未知状態ノードを追加した未知状態追加モデルでビタビ推定を行い、既知未知の二状態モデルによるビタビ判定を行うことで、既知または未知の判定が行われる。
既知未知判定処理において、供給された移動履歴データが既知であると判定された場合、供給された移動履歴データ及び補間フラグ系列データと、それに対応する状態ノードの時系列データであるノード系列データが、パラメータ更新部204に供給される。一方、既知未知判定処理において、供給された移動履歴データが未知であると判定された場合、供給された移動履歴データは新規モデル生成部202に供給される。また、未知の移動履歴データが既知の状態ノード(経路)と接続されている場合には、接続先の状態ノードも新規モデル生成部202に供給される。
ステップS142で既知と判定された場合、処理はステップS143に進み、パラメータ更新部204は、既知の移動履歴データと、それに対応するノード系列データ及び補間フラグ系列データに基づいて、既存モデルのパラメータを更新するパラメータ更新処理を行う。即ち、図44乃至図50を参照して説明した処理が行われる。
一方、ステップS142で未知と判定された場合、処理はステップS144に進み、新規モデル生成部202は、未知の移動履歴データに対応する新規モデルを生成する新規モデル生成処理を行う。換言すれば、新規モデル生成部202は、未知の移動履歴データを表現する新規モデルのパラメータを求める。新規モデル生成処理は、即ち、図30乃至図36を参照して説明した処理である。
ステップS145において、新規モデル結合部203は、既存モデルと新規モデルとを結合し、学習済みの既存モデルに、未知の移動履歴データを取り込んで成長させたトポロジー更新モデルを生成するトポロジー更新処理を行う。即ち、新規モデル結合部203は、図37乃至図43を参照して説明した処理を行う。
ステップS143またはS145の処理後、ステップS146において、更新モデル整理部205は、自己遷移のみで、他の状態ノードからの遷移が無い状態ノードを消去することで、パラメータ更新モデルまたはトポロジー更新モデルを整理する。更新モデル整理部205は、整理後の更新モデルのパラメータを、学習ポストプロセス部24とユーザ別モデルパラメータ記憶部12に供給して、処理を終了する。
[目的地経由地検出部25の処理]
次に、図52を参照して、学習ブロック11の目的地経由地検出部25(図1)の処理について説明する。
上述したように、学習メインプロセス部23は、移動履歴データを分割する処理、線形補間する処理、移動属性識別処理等が行われた後の移動履歴データを学習用データとして、ユーザ活動モデルのパラメータを学習する。そして、学習ポストプロセス部24が、学習により求めたパラメータを用いて、移動履歴データに対応する状態系列データを生成する。
図52Aは、図8下段に示した、学習プリプロセス部22によって移動履歴データの分割およびホールドが行われた後の、移動属性付き移動履歴データ83Aおよび83Bを示している。
図52Bは、図8下段に示した移動属性付き移動履歴データ83Aおよび83Bに、対応する状態系列データを併せて示した図である。
移動属性付き移動履歴データ83Aには、s,s,・・・,s,・・・sの状態系列ノードが対応する。移動属性付き移動履歴データ83Bには、st+1,st+2,・・・,sの状態系列ノードが対応する。
目的地経由地検出部25は、1まとまりの移動属性付き移動履歴データの最後の”滞在状態(u)”の3次元データに対応する状態ノードを検出し、目的地の属性を付与する。図52Bの例では、移動属性付き移動履歴データ83Aの状態ノードsと、移動属性付き移動履歴データ83Bの状態ノードsに対して、目的地の属性が付与される。状態ノードsと状態ノードsは、いずれも滞在状態が滞在閾値時間以上継続していた状態ノードである。このように、目的地経由地検出部25によって、滞在状態が滞在閾値時間以上継続する移動履歴データに対応する状態ノードが、目的地に推定される。
なお、図8を参照して説明した分割処理では、分割した移動履歴データの最後の滞在閾値時間以上の複数の”移動状態”が、1つの”滞在状態”に縮減された。しかしながら、分割処理では、移動履歴データの最後の滞在閾値時間以上の複数の”移動状態”のすべてを、消去するようにしてもよい。図52Aの例で説明すると、移動属性付き移動履歴データ83Aおよび83Bそれぞれの最後の”滞在状態(u)”の3次元データを省略するようにしてもよい。この場合には、目的地経由地検出部25は、1まとまりの移動属性付き移動履歴データの最後の3次元データに対応する状態ノードに、目的地の属性を付与する。図52Bの例で説明すると、移動属性付き移動履歴データ83Aの状態ノードsの1つ前の状態ノードst−1、および、移動属性付き移動履歴データ83Bの状態ノードsの1つ前の状態ノードsT−1を目的地とすればよい。
目的地経由地検出部25は、また、1まとまりの移動属性付き移動履歴データの途中にある”滞在状態(u)”の3次元データに対応する状態ノードを検出し、経由地の属性を付与する。即ち、滞在状態の継続時間が滞在閾値時間未満である移動履歴データに対応する状態ノードが、経由地に推定される。図52Bの例で説明すると、移動属性付き移動履歴データ83Aの状態ノードsが、経由地に決定される。
なお、目的地経由地検出部25は、図52Cに示すように、移動手段が変更されたとき、変更前の最後の状態ノードsにも、経由地の属性を付与するようにしてもよい。
[学習ブロック11の処理]
図53のフローチャートを参照して、学習ブロック11全体の処理について説明する。
初めに、ステップS241において、履歴データ蓄積部21は、センサデバイスから供給される、移動履歴データを、学習用データとして蓄積する。
ステップS242において、学習プリプロセス部22は、図19を参照して説明した、学習プリプロセス処理を実行する。即ち、履歴データ蓄積部21に蓄積されている移動履歴データの接続および分割の処理、データ欠落部分の線形補間処理、”滞在状態”または”移動状態”の移動属性の付与、などを行う。
ステップS243において、学習メインプロセス部23は、図51を参照して説明した、学習メインプロセス処理を実行する。即ち、学習メインプロセス部23は、供給されるユーザの移動履歴データに対して、既知または未知を判定し、判定結果に応じてユーザ活動モデルとしてのHMMのパラメータを更新する。未知の移動履歴データが供給された場合には、移動範囲の拡張に合わせてトポロジーを成長させたHMMのパラメータが求められる。学習メインプロセス処理により得られたユーザ活動モデルのパラメータは、学習ポストプロセス部24とユーザ別モデルパラメータ記憶部12に供給され、ユーザ別モデルパラメータ記憶部12で記憶される。
ステップS244において、学習ポストプロセス部24は、学習により得られたパラメータで表現されるユーザ活動モデルにより、移動履歴データに対応するノード系列データを生成する。
ステップS245において、目的地経由地検出部25は、移動属性付き移動履歴データに対応する状態系列ノードの所定の状態ノードに、目的地の属性を付与する。より具体的には、目的地経由地検出部25は、滞在状態が滞在閾値時間以上継続する移動履歴データに対応する状態ノードに、目的地の属性を付与する。
ステップS246において、目的地経由地検出部25は、移動属性付き移動履歴データに対応する状態系列ノードの所定の状態ノードに、経由地の属性を付与する。より具体的には、目的地経由地検出部25は、滞在状態の継続時間が滞在閾値時間未満である移動履歴データに対応する状態ノードに、経由地の属性を付与する。
ステップS247において、目的地経由地検出部25は、状態ノードに付与された目的地、経由地の属性についての情報を、ユーザ別モデルパラメータ記憶部12に記憶させ、処理を終了する。
[予測プリプロセス部32の構成例]
次に、予測ブロック13が行う処理について説明する。
図54は、予測プリプロセス部32の詳細構成例を示すブロック図である。
予測プリプロセス部32は、予測用データ前処理部301と予測用データ生成部302により構成される。予測用データ前処理部301は、データ分割部311とデータ異常除去部312とからなり、予測用データ生成部302は、補間処理部313、移動属性識別付与部314、及び仮想誤差生成部315とからなる。
データ分割部311は、学習プリプロセス部22のデータ接続分割部71が行う分割処理と同様、取得された移動履歴データに、欠落閾値時間以上のデータ欠落がある場合に、その前後で移動履歴データを分割する。なお、欠落閾値時間は、データ接続分割部71で設定されている欠落閾値時間と同一である必要はない。
データ異常除去部312は、学習プリプロセス部22のデータ異常除去部72と同様、取得された移動履歴データの明らかな異常を除去する処理を行う。
補間処理部313は、学習プリプロセス部22の再サンプリング処理部73と同様、後段の処理部(予測メインプロセス部33など)に適応する一定の時間間隔に移動履歴データをリサンプリングする。
また、補間処理部313は、取得される移動履歴データにデータ欠落部分がある場合に、その部分を補間する補間処理を行う。ここで、データ欠落部分には、(1)現時点ではデータが正常に取得できており、過去の所定期間にデータの欠落がある場合、(2)現時点のデータが取得できず、現時点を含む所定期間、データの未取得が続いている場合、の2通りがある。
(1)現時点のデータが正常に取得できている場合、補間処理部313は、学習プリプロセス部22の再サンプリング処理部73と同様に、過去の所定期間のデータ欠落部分について、式(1)の線形補間による補間処理を行う。
一方、(2)現時点のデータが取得できていない場合、補間処理部313は、現時点を含むデータ欠落部分について、欠落する直前の(取得できた最後の)3次元データが継続して続いているものとして補間する処理(ホールド補間処理)を行う。具体的には、データ欠落の直前の時刻Tにおける3次元データがxreal T1である場合、補間処理部313は、その次の時刻T+1から現時点の時刻tまでの各3次元データを、次式(37)により生成する。
virtual t=xvirtual T1+1=xreal T1 ・・・・・・・・・・(37)
なお、現時点を含むデータ欠落部分に対する補間処理としては、上述したホールド補間の他、センサデバイスが取得できたデータの軌跡を用いた外挿、フィルタリング(カルマンフィルタ)など、その他の処理により求めるようにしてもよいことは言うまでもない。
そして、補間処理部313は、学習プリプロセス部22の再サンプリング処理部73と同様、移動履歴データを構成する各3次元データが補間処理により生成された補間データであるか否かを示す補間フラグの時系列データである補間フラグ系列データも生成する。
移動属性識別付与部314は、学習プリプロセス部22の移動属性識別付与部74と同様の処理を行う。即ち、移動属性識別付与部314は、取得された移動履歴データの各3次元データに対し、”滞在状態”か、または、”移動状態”の移動属性を識別し、付与する。”移動状態”の移動属性については、移動手段(車、バス、電車、徒歩など)もさらに識別するようにしてもよい。
仮想誤差生成部315は、補間処理部313において補間処理により生成された補間データに対して、仮想誤差etを計算する。
より具体的には、(1)現時点のデータを含まない過去の所定期間のデータ欠落部分については、仮想誤差生成部315は、上述した式(8)により、仮想誤差etを計算する。
一方、(2)現時点のデータを含むデータ欠落部分については、式(8)のデータ復活直後の時刻Tにおける3次元データxreal T2が存在しないため、仮想誤差etを式(8)により求めることができない。
そこで、仮想誤差生成部315は、データが欠落してからの経過時間に応じた所定の関数で仮想誤差etを計算する。経過時間に応じた所定の関数としては、例えば、単位時間当たり一定の大きさで増加する関数や、補間データになってから所定時間内までは単位時間当たり一定の大きさで増加し、それ以降は一定値となるような関数を採用することができる。
補間データになってから所定時間内までは一定の大きさで増加し、それ以降は一定値となるような仮想誤差etは、例えば、次式(38)で求めることができる。
Figure 2012108748
式(38)のTBは、補間データになってからの経過時間を表す所定の定数(固定値)であり、γは単位時間当たりの増加量に相当する係数(固定値)である。
なお、仮想誤差etは、データが欠落してからの経過時間に関わらず一定の大きさとすることもできる。
仮想誤差部315は、補間処理後の移動履歴データと、それに対応する補間フラグ系列データ(補間フラグの時系列データ)及び仮想誤差系列データ(仮想誤差の時系列データ)を、後段の予測メインプロセス部33に出力する。
図55は、ホールド補間処理により3次元データが生成されたときの仮想誤差etのイメージ図である。
図55は、時刻tまではセンサデバイスが実際にデータを取得でき、時刻tk+1以降からデータが欠落した場合の例である。
この場合、時刻tk+1以降の3次元データxk+1,xk+2,xk+3,xk+4,・・は、時刻tの3次元データxと同一の値として生成され、その仮想誤差ek+1,ek+2,ek+3,ek+4,・・は、時間の経過とともに一定の大きさで増加している。このようにすることで、データ欠落時以降のユーザの移動履歴を、仮想誤差の範囲内に含まれるようにすることができる。
図56は、補間処理後の移動履歴データと、それに対応する仮想誤差を概念的に示している。
図56において、左右に並ぶ2つの列のうち、左側の列は、予測用データ生成部302が補間処理を行った後の移動履歴データを示し、右側の列は、その移動履歴データに対して計算された仮想誤差系列データを示している。
図56に示される2つの破線枠のうち、上側の破線枠で囲まれている時刻tから時刻tまでの移動履歴データは、線形補間により生成された補間データを示している。即ち、時刻tから時刻tまでの3次元データは、データ欠落の前後の時刻tと時刻tの3次元データを用いて、式(1)により算出されたデータである。そして、時刻tから時刻tまでの3次元歴データに対応する仮想誤差は、式(8)により算出されている。
一方、2つの破線枠のうち、下側の破線枠で囲まれている時刻tk+1から時刻tTまでの移動履歴データは、ホールド補間により生成された補間データを示している。従って、時刻tk+1から時刻tTまでの3次元データの経度と緯度(図56のx,y)は、データ欠落直前の時刻tの経度と緯度と同一の値とされている。そして、時刻tk+1から時刻tTまでの3次元データに対応する仮想誤差は、例えば、式(38)等により算出されている。
なお、補間処理により生成された3次元データのうち、時刻については(リサンプリング後の)実データと同一となるので、その仮想誤差は0となっている。
ところで、図56の例では、補間データではない3次元データの仮想誤差は0としている。これは、センサデバイスが取得した3次元データに誤差はないと想定しているからである。
しかし、センサデバイス自身も誤差を持っていると想定することもできる。例えばGPSセンサの精度(位置精度)は、移動手段(車、バス、電車、徒歩など)によって異なることが多い。具体的には、ユーザが「徒歩」や「自転車」で移動しているような場合、ユーザが身につけているセンサデバイスは屋外にあるため、受信信号の信号品質がよく、誤差は少ないと期待できる。一方、ユーザが「電車」や「車」で移動しているような場合、センサデバイスは電車や車の中(屋内)にあるため、衛星の捕捉状態が悪く、信号品質が悪く、誤差は大きめになる。
そこで、移動属性識別付与部314で”移動状態”が移動手段(車、バス、電車、徒歩など)ごとに識別されている場合には、補間データではない3次元データに対しても、移動手段に応じた仮想誤差etを設定するようにしてもよい。例えば、移動属性が”移動状態”であって、移動手段が「徒歩」や「自転車」である場合には仮想誤差etを「10m」に設定し、移動手段が「電車」や「車」である場合には仮想誤差etを「50m」に設定したりすることができる。
図57は、移動手段に応じて仮想誤差etを設定した場合のイメージ図である。
図57において、白抜きの星印(☆)が、センサデバイスから取得された3次元データを示しており、その周辺の円が、仮想誤差生成部315が移動手段に応じて設定した仮想誤差を示している。移動手段が「電車」と識別された3次元データに対しては、「徒歩」と識別された3次元データよりも大きな仮想誤差が設定されている。
[予測用データ生成処理]
図58は、移動手段に応じた仮想誤差も設定するようにした場合の、予測用データ生成部302による予測用データ生成処理のフローチャートである。
初めに、ステップS261において、補間処理部313は、予測用データ前処理部301から供給された予測用データとしての移動履歴データを取得する。ここで取得される移動履歴データには、まだデータ欠落部分が存在している。
ステップS262において、補間処理部313は、取得された予測用データにデータ欠落部分が存在する場合に、そのデータ欠落部分に対して補間処理を行う。より具体的には、補間処理部313は、現時点を含まない過去の所定期間(所定の区間)の移動履歴データのデータ欠落部分に対しては、上述した式(1)を用いた線形補間による補間処理を行う。一方、現時点を含むデータ欠落部分に対しては、データ欠落直前の(取得できた最後の)3次元データでホールド補間する処理を行う。また、補間処理部313は、補間処理と同時に、補間フラグ系列データも生成する。
ステップS263において、移動属性識別付与部314は、移動履歴データの各3次元データに対し、”滞在状態”か、または、”移動状態”の移動属性を識別し、付与する。また、”移動状態”の移動属性については、移動手段(車、バス、電車、徒歩など)も識別され、移動手段ごとの、移動属性が付与される。
ステップS262とS263の処理により、供給された移動履歴データに対応する、補間データか否かを示す補間フラグ系列データと、移動属性を示す移動属性系列データが生成され、補間処理後の移動履歴データとともに、仮想誤差生成部315に供給される。
ステップS264において、仮想誤差生成部315は、補間処理後の移動履歴データに対応する仮想誤差系列データ用のメモリを確保し、仮想誤差系列データを生成する。ここで生成される仮想誤差系列データには、全ての仮想誤差について、初期値としての「0」が設定されている。
なお、仮想誤差系列データ用のメモリとして確保する量は、補間データのみに対して仮想誤差を設定する場合には、補間データの個数に相当する容量であり、移動手段の仮想誤差も設定する場合には、移動履歴データの3次元データの個数に相当する容量となる。
ステップS265において、仮想誤差生成部315は、仮想誤差系列データに、「徒歩」や「電車」など、移動手段に応じた仮想誤差を設定する。具体的には、仮想誤差生成部315は、移動手段ごとに設定する仮想誤差が記憶されている移動手段別仮想誤差テーブルを有し、移動手段別仮想誤差テーブルを参照し、移動属性系列データが示す各移動手段に応じて仮想誤差系列データの対応する部分に、仮想誤差を設定する。
ステップS266において、仮想誤差生成部315は、仮想誤差系列データに、補間処理に応じた仮想誤差を設定する。具体的には、仮想誤差生成部315は、補間フラグ系列データを参照し、補間データに対応する仮想誤差の部分に、線形補間された補間データには式(8)の仮想誤差を、ホールド補間された補間データには式(38)等の仮想誤差を算出し、加算する。
ステップS267において、仮想誤差部315は、補間処理後の移動履歴データと、それに対応する補間フラグ系列データ及び仮想誤差系列データを、後段の予測メインプロセス部33に出力して、処理を終了する。
上述した処理では、ステップS266において、移動手段に応じた仮想誤差と補間処理に応じた仮想誤差を単純に加算する例を説明したが、単純加算以外の演算によって、移動手段に応じた仮想誤差と補間処理に応じた仮想誤差を合成してもよい。例えば、移動手段に応じた仮想誤差の二乗と、補間処理に応じた仮想誤差の二乗の和の平方根により求めた値を、最終的な仮想誤差としてもよい。
なお、学習ブロック11の学習メインプロセス部23の既知未知判定部201において、仮想誤差を考慮した観測確率P(o,e|si)を求める場合にも、補間処理に応じた仮想誤差だけでなく、上述の移動手段に応じた仮想誤差も含めるようにしてもよい。
[予測メインプロセス部33の処理]
次に、予測メインプロセス部33が行う処理について説明する。
図59は、予測メインプロセス部33の詳細構成例を示すブロック図である。
予測メインプロセス部33は、現在地ノード推定部331、既知未知判定部332、目的地経由地予測部333、及び未知状態処理部334により構成される。
予測プリプロセス部32から供給される移動履歴データ及び仮想誤差系列データと、学習ブロック11の学習により得られたユーザ活動モデル(のパラメータ)は、現在地ノード推定部331、既知未知判定部332、及び目的地経由地予測部333のそれぞれに供給される。
現在地ノード推定部331は、予測プリプロセス部32から供給される移動履歴データ及び仮想誤差系列データと、学習ブロック11の学習により得られたユーザ活動モデルを用いて、ユーザの現在地に対応する状態ノード(現在地ノード)を推定する。
ノード系列データの算出にはビタビアルゴリズムが採用されるが、既知未知判定部201の状態ノード推定部223と同様に、移動履歴データの補間データ部分については、上述した式(7)の、仮想誤差を考慮した観測確率P(o,e|si)が採用される。即ち、補間データ部分については、実データよりもデータの寄与の少ない観測確率が用いられる。これにより、既知未知判定部201の状態ノード推定部223と同様に、補間データが実際に該当する状態ノードsiの中心μiから大きく離れていたとしても、データ欠落部分に関する最尤状態遷移を推定することができる。
なお、本発明は、取得される移動履歴データにデータ欠落部分があっても破綻せずに状態ノード推定ができるようになること、即ち、現在地ノードの推定が行えるようにすることである。そのためには、データ欠落部分に対しても状態ノードの推定において観測確率が計算できるようになっていればよい。換言すれば、補間データや仮想誤差を生成しない方法でも観測確率が計算できればよい。
そこで、例えば、移動履歴データの補間データ部分については、式(7)の仮想誤差を考慮した観測確率P(o,e|si)ではなく、次式(39)で表される観測確率(o|si)を採用してもよい。
Figure 2012108748
式(39)は、状態ノードsiの観測確率が、状態ノードのパラメータ(μi、σi)や補間データの値に関わらず、全ての状態ノードで等しいと仮定した、最も単純な観測確率の生成方法である。この場合には、補間データや仮想誤差の生成は必要なく、補間したことを示す情報、即ち、補間フラグ系列データのみを予測プリプロセス部32からもらえばよい。
既知未知判定部332は、学習メインプロセス部23の既知未知判定部201と同様に、ユーザの現在地に対応する状態ノードが既知かまたは未知かを判定する。なお、既知未知判定部332は、学習メインプロセス部23の既知未知判定部201とは、既知未知ポスト処理部227を備えていない点が異なるが、それ以外は同様の構成とされている。
既知未知判定部332は、現在地に対応する状態ノードが既知である場合、その結果を目的地経由地予測部333に供給する。一方、既知未知判定部332は、現在地に対応する状態ノードが未知である場合、その結果を未知状態処理部334に供給する。
目的地経由地予測部333は、既知と判定された現在地ノードから遷移可能なノード系列とその生起確率を算出する。即ち、目的地経由地予測部333は、現在地ノードから目的地の状態ノード(目的地ノード)までのノード系列とその生起確率を算出する。なお、目的地の状態ノードへのノード系列(経路)には経由地のノードが含まれる場合もあるので、予測メインプロセス部33は、目的地と同時に経由地も予測する。
目的地経由地予測部333は、予測結果としての目的地までの経路(ノード系列)を、予測ポストプロセス部34(図1)に出力する。
一方、現在地ノードが未知である場合に処理を行う未知状態処理部334は、「未知状態です」などのエラーメッセージを出力するなどの未知状態対応処理を実行する。
以上のように、予測メインプロセス部33では、現在地ノードを推定した後、既知未知判定部332によって現在地ノードの既知未知判定を行い、既知の場合にのみ、目的地予測を行うようになされている。
学習ブロック11の学習により得られた確率的状態遷移モデルを用いて推定する現在地ノード推定部331は、仮に、ユーザが全く初めての経路を通っており、現在の状態ノードが未知であっても、推定結果を出力することができる。しかしながら、未知状態の状態ノードに対して、その将来を正確に予測することは難しいからである。
[現在地ノード以降のツリー探索処理]
次に、現在地ノードが既知と判定された場合に、目的地経由地予測部333が行う、現在地ノードから到達可能な目的地ノードとそこまでの経路を探索する処理(現在地ノード以降のツリー探索処理)について説明する。
到達可能な目的地ノードは、現在地ノードから遷移可能なノードで構成されるツリー構造の中に存在する。従って、ツリーを構成する状態ノードのなかから、目的地ノードを探索することで、目的地を予測することができる。また、現在地ノード以降のツリー探索処理において、経由地の属性が付与された状態ノード(以下、経由地ノードという。)が検出された場合には、経由地までの経路も記憶される。
学習により得られたHMMの各状態siは、地図上の所定の点(位置)を表し、状態siと状態sjが結ばれているとき、状態siから状態sjを移動する経路を表していると考えることができる。
この場合、状態siに対応する各点は、端点、通過点、分岐点、ループのいずれかに分類することができる。端点とは、自己遷移以外の確率が極めて小さく(自己遷移以外の確率が所定の値以下であり)、次に移動可能な点がない点である。通過点とは、自己遷移以外に有意な遷移が一つある、換言すれば、次に移動可能な点が一つある点である。分岐点とは、自己遷移以外に有意な遷移が二つ以上ある、換言すれば、次に移動可能な点が二つ以上ある点である。ループとは、これまで通過した経路上のどれかと一致する点である。
目的地への経路を探索する場合、異なる経路がある場合には、それぞれの経路について必要時間等の情報を提示することが望まれる。そこで、可能な経路を過不足なく探索するために、次の条件を設定する。
(1)一度分岐した経路は再度合流した場合でも、別の経路とみなす。
(2)探索中の経路が分岐点に達した場合に、未探索リストを作成し、未探索リストの分岐先の探索を行う。
(3)経路内に端点またはループが現れた場合、その経路の探索を終了する。なお、現在の点から、1つ前の点に経路を逆戻りする場合はループに含む。
図60は、予測メインプロセス部33の目的地経由地予測部333による、現在地ノード以降のツリー探索処理のフローチャートである。
図60の処理では、最初に、ステップS281において、目的地経由地予測部333は、予測メインプロセス部33の現在地ノード推定部331により推定された現在地ノードを取得し、注目するノードである注目ノードに設定する。
ステップS282において、目的地経由地予測部333は、注目ノードに遷移先があるかを判定する。ステップS282で、注目ノードに遷移先がないと判定された場合、処理は後述するステップS291に進む。
一方、ステップS282で、注目ノードに遷移先があると判定された場合、処理はステップS283に進み、目的地経由地予測部333は、遷移先が目的地ノードであるかを判定する。
ステップS283で、遷移先が目的地ノードであると判定された場合、処理はステップS284に進み、目的地経由地予測部333は、これまでの経路(状態ノード系列)を内部メモリの探索結果リストに記憶する。ステップS284の後、処理はステップS291に進む。
一方、ステップS283で、遷移先が目的地ノードではないと判定された場合、処理はステップS285に進み、目的地経由地予測部333は、遷移先が経由地ノードであるかを判定する。
ステップS285で、遷移先が経由地ノードであると判定された場合、処理はステップS285に進み、目的地経由地予測部333は、これまでの経路(状態ノード系列)を内部メモリの探索結果リストに記憶する。
目的地までの代表経路、到達確率、および所要時間を予測結果として出力するためには、探索結果リストには、遷移先が目的地であるときの経路のみを記憶すればよい。しかしながら、遷移先が経由地であるときの経路も記憶することにより、経由地までの経路、確率、および時間が必要になったときに即座に求めることができる。
ステップS285で遷移先が経由地ノードではないと判定された場合、または、ステップS286の後、処理はステップS287に進み、目的地経由地予測部333は、遷移先が分岐点かを判定する。
ステップS287で、遷移先が分岐点であると判定された場合、処理はステップS288に進み、目的地経由地予測部333は、分岐先の2つの状態ノードを内部メモリの未探索リストに記憶する(追加する)。ステップS288の後、処理はステップS291に進む。なお、分岐先が探索中の経路のいずれかの状態ノードである場合はループとなるので、目的地経由地予測部333は、その分岐先の状態ノードについては未探索リストに記憶させない。
ステップS287で、遷移先が分岐点ではないと判定された場合、処理はステップS289に進み、目的地経由地予測部333は、遷移先が端点であるかを判定する。ステップS289で、遷移先が端点であると判定された場合、処理はステップS291に進む。
一方、ステップS289で、遷移先が端点ではないと判定された場合、処理はステップS290に進み、目的地経由地予測部333は、遷移先の状態ノードを注目ノードに設定し、処理をステップS282に戻す。即ち、遷移先が、目的地ノード、経由地ノード、分岐点、および端点のいずれでもない場合には、探索対象の状態ノードが、遷移先の次の状態ノードに進められる。
ステップS284,S288、またはS289の処理の後、処理がステップS291に進められた場合、目的地経由地予測部333は、未探索リストに登録されている状態ノードがあるか、即ち、未探索の分岐先があるかを判定する。
ステップS291で、未探索の分岐先があると判定された場合、処理はステップS292に進み、目的地経由地予測部333は、未探索リストの最上位の分岐先の状態ノードを、注目ノードに設定し、注目ノードまでの経路を読み出す。そして、処理がステップS282に戻される。
一方、ステップS291で、未探索の分岐先がないと判定された場合、ツリー探索処理は終了する。
以上のように、ツリー探索処理では、ユーザの現在地ノードから遷移可能な状態ノードでなるツリー構造において、現在地ノードを出発点として、目的地ノード若しくは遷移先のない終端ノード(端点)になるまで全ての状態ノードを探索する処理が行われる。そして、ユーザの現在地から目的地までの経路が、現在地ノードからの状態ノード系列として、探索結果リストに記憶される。なお、ツリー探索処理は、探索回数が終了条件としての所定の回数を満たすまで探索するようにしてもよい。
[ツリー探索処理の例]
図61を参照して、目的地経由地予測部333のツリー探索処理についてさらに説明する。
図61の例において、状態sが現在地である場合、次のような3通りの経路が少なくとも探索されることになる。1つめの経路は、状態sから状態s,状態s等を経由して状態s10までの経路(以下、経路Aともいう。)である。2つめの経路は、状態sから状態s,状態s11,状態s14,状態s23,状態s29等を経由して状態s26までの経路(以下、経路Bともいう。)である。3つめの経路は、状態sから状態s,状態s11,状態s19,状態s23,状態s29等を経由して状態s26までの経路(以下、経路Cともいう。)である。
目的地経由地予測部333は、探索された各経路が選択される確率(経路の選択確率)を計算する。経路の選択確率は、経路を構成する状態間の遷移確率を順次乗算することで求められる。ただし、次の状態に遷移する場合のみを考慮し、その場所に滞留する場合は考慮する必要がないので、学習により求められた各状態の状態遷移確率aijから、自己遷移確率を除いて規格化された遷移確率[aij]を用いて、経路の選択確率が求められる。
自己遷移確率を除いて規格化された遷移確率[aij]は、次式(40)で表すことができる。
Figure 2012108748
ここで、δは、クロネッカー関数を表し、添え字のiとjが一致するときのみ1となり、それ以外は0となる関数である。
したがって、例えば、図61の状態sの状態遷移確率aijが、自己遷移確率a5,5=0.5,遷移確率a5,6=0.2,遷移確率a5,11=0.3である場合、状態sから状態sまたは状態s11に分岐する場合の遷移確率[a5,6]および遷移確率[a5,11]は、それぞれ、0.4,0.6となる。
探索された経路の状態siのノード番号iが、(y,y,・・・,y)であるとき、この経路の選択確率は、規格化された遷移確率[aij]を用いて、次式(41)で表すことができる。
Figure 2012108748
なお、実際には、通過点での規格化された遷移確率[aij]は1であるので、経路の選択確率は、分岐する際の規格化された遷移確率[aij]を順次乗算すれば足りる。従って、目的地経由地予測部333は、図60のツリー探索処理を実行しながら、同時に、選択された経路の選択確率を式(41)により計算することができる。
図61の例では、経路Aの選択確率は、0.4である。また、経路Bの選択確率は、0.24=0.6×0.4である。経路Cの選択確率は、0.36=0.6×0.6である。そして、計算された経路の選択確率の総和は1=0.4+0.24+0.36であり、過不足ない探索を実現することができることがわかる。
図61の例では、現在地の状態sから注目ノードが順次進められ、状態sが注目ノードであるとき、遷移先の状態sが分岐点であるため、図60のステップS288が実行され、図62Aに示されるように、分岐先の状態s11と状態sが未探索リストに記憶される。ここで、状態s11と状態sでは、状態s11の選択確率が高いため、状態s11が未探索リストの上位に記憶される。
そして、図60のステップS291およびS292が実行され、未探索リストの上位に記憶されている、状態s11が注目ノードに設定され、状態s11以降の経路が探索される。状態s11が注目ノードに設定されたとき、図62Bに示されるように、未探索リストから、状態s11が削除される。
そして、状態s11を注目ノードとして探索が進められると、状態s14と状態s19の分岐先が検出されるので、図60のステップS288が実行され、状態s14と状態s19が未探索リストに記憶される。このとき、状態s14と状態s19は、現在の未探索リストの最上位に記憶され、また、状態s14と状態s19では、状態s19の選択確率が高いため、状態s19が状態s14より上位に記憶される。従って、未探索リストは、図62Cに示されるようになる。
以下同様に、図60のステップS291およびS292が実行され、未探索リストの上位に記憶されている、状態s19が注目ノードに設定され、状態s19以降の経路が探索される。状態s19が注目ノードに設定されたとき、図62Dに示されるように、未探索リストから、状態s19が削除される。
以上のように、目的地経由地予測部333によるツリー探索処理は、検出された分岐先を未探索リストの最上位に記録させることで、分岐先の経路のうち、より選択確率の高い方を先に探索する深さ優先アルゴリズムにより処理が実行される。
なお、探索の深さが深くなる、換言すれば、現在地ノードを最上位として下位の階層が深くなることで、全てを探索することが難しいことも考えられる。そのような場合には、例えば、1)遷移確率の低い分岐先は探索しない、2)生起確率の低い経路は探索しない、3)探索する深さに制限を加える、4)探索する枝の数に制限を加える、などの条件を加えて、途中で探索を終了するようにしてもよい。
図63は、ツリー探索処理における探索結果リストの例を示している。
深さ優先アルゴリズムによりツリー探索処理を行うことにより、探索結果リストには、選択確率の高い経路から順に登録される。
図63の例では、探索結果リストの1番目には、目的地gまでの経路R(r,r,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って目的地gまでにかかる時間がTである。探索結果リストの2番目には、目的地gまでの経路R(r,r,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って目的地gまでにかかる時間がTである。探索結果リストの3番目には、目的地gまでの経路R(r,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って目的地gまでにかかる時間がTである。
探索結果リストの4番目には、経由地wまでの経路R(r,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って経由地wまでにかかる時間がTである。探索結果リストの5番目には、経由地wまでの経路R(r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って経由地wまでにかかる時間がTである。
探索結果リストの6番目には、目的地gまでの経路R(r,r,w,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って目的地gまでにかかる時間がTである。探索結果リストの7番目には、この経路Rが選択される確率はPで、目的地gまでの経路R(r,r10,r11)が登録され、経路Rを使って目的地gまでにかかる時間がTである。
目的地または経由地まで、各経路が選択される確率は、上述した式(41)により計算される。さらに、目的地までの経路が複数存在する場合、その目的地までの複数の経路の選択確率の和が、目的地の到達確率となる。
従って、図63の例では、目的地gへ行くには、経路Rを利用する場合と、経路Rを利用する場合があり得るので、目的地gの到達確率は、は(P+P)となる。同様に、目的地gへ行くには、経路Rを利用する場合と、経路Rを利用する場合があり得るので、目的地gの到達確率は、は(P+P)となる。なお、目的地gの到達確率は、経路Rが選択される確率Pと同一である。
[予測ポストプロセス部34の処理]
次に、予測ポストプロセス部34が行う処理について説明する。
目的地または経由地まで、選択された経路で移動したときにかかる時間の求め方について説明する。
例えば、現在時刻tの現在地が状態sy1であり、時刻(t,t,・・・,t)における決定された経路が(sy1,sy2,・・・,syg)であるとする。換言すれば、決定された経路の状態siのノード番号iが(y,y,・・・,y)であるとする。以下、簡単のため、位置に相当する状態siを、単に、そのノード番号iで表わす場合もある。
現在時刻tでの現在地yは、現在地ノード推定部331により確定しているので、現在時刻tの現在地がyである確率Py1(t)は、
y1(t)=1である。また、現在時刻tにy以外の他の状態にいる確率は0である。
一方、所定の時刻tにノード番号yにいる確率Pyn(t)は、
Figure 2012108748
で表すことができる。式(42)の右辺第一項は、もともとその位置yにいて、自己遷移した場合の確率を表し、右辺第二項は、1つ前の位置yn−1から位置yに遷移してきた場合の確率を表している。式(42)では、経路の選択確率の計算とは異なり、学習により得られた状態遷移確率aijがそのまま利用される。
目的地yへ到達するときの時刻tの予測値<t>は、「その直前の時刻tg−1に目的地yの1つ前の位置yg−1にいて、時刻tに目的地yに移動する確率」を用いて、
Figure 2012108748
と表すことができる。
即ち、予測値<t>は、現在時刻から、「その直前の時刻tg−1に状態sygの1つ前の状態syg−1にいて、時刻tに状態sygに移動するとき」までの時間の期待値で表される。
以上より、所定の目的地または経由地まで、選択された経路で移動したときにかかる時間は、上述した式(43)の予測値<t>により求められる。
図63の例を使用して、目的地までの経路が探索された場合に、代表経路として選択する代表経路選択処理について説明する。
図63のような探索結果リストが得られた場合、探索結果リストには、選択確率が高いものから順に(上位に)登録されるので、選択確率が上位であり、目的地も異なる、探索結果リストの1番目乃至3番目が予測結果として出力される。即ち、経目的地gとその経路R、目的地gとその経路R、目的地gとその経路Rが、目的地とその代表経路として選択される。
次に、探索結果リストの4番目および5番目は経由地までの経路であるためスキップされ、探索結果リストの6番目の、目的地gへ到達するための経路Rを代表経路とするかが検討される。この経路Rは、既に代表経路として選択されている、同一の目的地gの経路Rには含まれていない経由地wを利用するものとなっている。したがって、目的地gへ到達するための経路Rも、代表経路として選択される。
次に、探索結果リストの7番目の、目的地gへ到達するための経路Rを代表経路とするかが検討される。この経路Rは、既に代表経路として選択されている、同一の目的地gと同じく、所定の経由地を経由しないものとなっている。したがって、目的地gへ到達するための経路Rは、代表経路として選択されない。
このように、代表経路選択処理では、ほぼ同一の経路を通る、似たような経路は提示せず、ユーザにとって有益と考えられる、異なる経由地を通る経路は、同一目的地であっても、予測結果として提示することができる。
なお、探索結果リストの6番目の、目的地gへ到達するための経路Rは、[背景技術]に示した先願2の方法では、経由地wで探索が終了されていた。しかしながら、予測システム1によれば、経由地wで終了することなく、経由地wを利用して目的地gへ到達する経路まで探索することが可能となっている。
予測システム1によれば、学習により得られた状態ノードに、目的地と経由地を区別して属性を付与することで、途中の経由地を目的地として予測することを防止することができる。また、同一目的地への経路が複数探索された場合、ほぼ同一の経路を通る、似たような経路は提示せず、ユーザにとって有益と考えられる、異なる経由地を通る経路を提示することができる。
図64は、予測ポストプロセス部34が行う代表経路選択処理のフローチャートである。
初めに、ステップS301において、予測ポストプロセス部34は、目的地経由地予測部333で作成された探索結果リストから、経由地までの経路を除外し、目的地のみの探索結果リストである目的地リストを生成する。
ステップS302において、予測ポストプロセス部34は、目的地リストを目的地別に並び替えた目的地別目的地リストに変更する。このとき、予測ポストプロセス部34は、同一の目的地内における順位を変えないように目的地別目的地リストを生成する。
ステップS303において、予測ポストプロセス部34は、目的地ごとの到達確率を算出する。目的地までの経路が1つしかない場合には、その経路の選択確率が到達確率となり、目的地まで複数の経路が存在する場合には、複数の選択確率(生起確率)の和が、その目的地の到達確率となる。
ステップS304において、予測ポストプロセス部34は、代表経路の選択に経由地を考慮するかを判定する。ステップS304で、経由地を考慮しないと判定された場合、処理はステップS305に進み、予測ポストプロセス部34は、目的地別に、最上位の経路を、各目的地の代表経路として選択し、処理を終了する。その結果、目的地まで複数の経路が存在する場合には、選択確率の高い目的地までの経路が、各目的地の代表経路とされ、その所要時間が、目的地までの所要時間として提示される。なお、目的地が多数ある場合には、上位から、予め設定した個数の目的地のみを提示するようにさせることができる。
一方、ステップS304で、経由地を考慮すると判定された場合、処理はステップS306に進み、予測ポストプロセス部34は、目的地別目的地リストを、経由地なしの目的地別目的地リストと、経由地ありの目的地別目的地リストに分類する。
そして、ステップS307において、予測ポストプロセス部34は、経由地なしの目的地別目的地リストから、目的地別に、最上位の経路を代表経路として選択する。これにより、代表経路としての、目的地ごとの経由地なしの経路が決定される。
次に、ステップS308において、予測ポストプロセス部34は、経由地ありの目的地別目的地リストを、さらに、経由地別に分類する。
ステップS309において、予測ポストプロセス部34は、経由地別の、経由地ありの目的地別目的地リストから、目的地別に、各経由地の最上位の経路を、代表経路として選択する。これにより、代表経路としての、目的地ごとの経由地ありの経路が決定される。その結果、目的地までの経路として、経由地なしの経路と経由地ありの経路が存在する場合には、その両方が、各目的地の代表経路とされ、それぞれの所要時間が、目的地までの所要時間として提示される。
以上により、代表経路選択処理は終了する。このように、目的地への経路が複数存在する場合、生起確率の上位を複数提示するよりも、経由地によって分類して提示する方が、ユーザが実際に感じる予測に近いものとすることができる。
[予測ブロック13全体の処理]
図65のフローチャートを参照して、予測ブロック13全体の処理について説明する。
初めに、ステップS321において、バッファリング部31は、予測処理のため、リアルタイムに取得される移動履歴データ(予測用データ)をバッファリングする。
ステップS322において、予測プリプロセス部32は、予測プリプロセス処理を実行する。具体的には、予測プリプロセス部32は、移動履歴データの分割の処理、移動履歴データの明らかな異常を除去する処理、および、移動履歴データのデータ欠落部分に対して線形補間またはホールド補間を行う補間処理を実行する。ここで、補間処理により求めた3次元データ(補間データ)か否かを示す補間フラグ系列データと、仮想誤差系列データも合わせて作成される。そして、予測プリプロセス部32は、補間処理後の移動履歴データと、それに対応する補間フラグ系列データ及び仮想誤差系列データを予測メインプロセス部33に出力する。
ステップS323において、予測メインプロセス部33は、学習ブロック11の学習により得られたユーザ活動モデルのパラメータを、ユーザ別モデルパラメータ記憶部12から取得する。このパラメータを取得する処理は、図65の処理開始前に予め実行するようにしてもよい。
ステップS324において、予測メインプロセス部33の現在地ノード推定部331は、学習ブロック11の学習により得られたパラメータを用いたユーザ活動モデルにより、ユーザの現在地に対応する状態ノード(現在地ノード)を推定する。より具体的には、現在地ノード推定部331は、学習ブロック11の学習により得られたパラメータを用いたユーザ活動モデルにより、移動履歴データに対応するノード系列データを算出する。算出されたノード系列データの最後の状態ノードが現在地ノードに対応する。
ノード系列データの算出にはビタビアルゴリズムが採用されるが、既知未知判定部201の状態ノード推定部223と同様に、移動履歴データの補間データ部分については、例えば、式(7)の仮想誤差を考慮した観測確率P(o,e|si)が採用される。これにより、既知未知判定部201の状態ノード推定部223と同様に、補間データが実際に該当する状態ノードsiの中心μiから大きく離れていたとしても、データ欠落部分に関する最尤状態遷移を推定することができる。また、上述したように、全ての状態ノードにおいて観測確率が等しいとする式(39)で表される観測確率(o|si)を採用してもよい。
ステップS325において、既知未知判定部332は、推定された現在地ノードが既知状態か、または、未知状態かを判定する既知未知判定処理を実行する。
より詳しく説明すると、既知未知判定部332は、学習メインプロセス部23の既知未知判定部201と基本的に同様の構成とされるから、初めに、学習により得られたパラメータを用いたユーザ活動モデルに対して、1つの未知状態ノードを追加した未知状態追加モデルが構築される。次に、未知状態追加モデルに対して、補間データの仮想誤差を考慮したビタビアルゴリズムを実行することにより、最も尤度の高い状態系列ノードが求められる。そして、仮想誤差に対して単調増加の補正項(a+b・et)を乗算した観測尤度の期待値L(t)’が計算され、この観測尤度の期待値L(t)’を用いて既知未知判定が行われる。
ステップS325の既知未知判定処理の結果、現在地ノードが未知であると判定された場合、処理はステップS326に進み、既知未知判定部332は、その判定結果を未知状態処理部334に供給する。未知状態処理部334は、「未知状態です」などのエラーメッセージを出力するなどの未知状態対応処理を実行して、処理を終了する。
一方、ステップS325の既知未知判定処理の結果、現在地ノードが既知であると判定した場合、処理はステップS327に進み、既知未知判定部332は、その判定結果を目的地経由地予測部333に供給する。ステップS327において、目的地経由地予測部333は、図60を参照して説明した、現在地ノード以降のツリー探索処理を実行する。ツリー探索処理と同時に、目的地および経由地までの経路(ノード系列)の生起確率も、式(41)により求められる。
ステップS328において、予測ポストプロセス部34は、図64を参照して説明した、代表経路の選択処理を実行する。
ステップS329において、予測ポストプロセス部34は、上述した式(43)により、選択された各代表経路の所要時間を算出する。
ステップS330において、予測ポストプロセス部34は、予測した目的地までの代表経路、到達確率、および所要時間を予測結果として出力して、処理を終了する。
以上のように、予測ブロック13の処理では、推定された目的地ノードおよび経由地ノード並びに現在地ノードについての情報と、学習により得られたパラメータで表現されるユーザ活動モデルとを用いて、ユーザの現在地から目的地までの経路が探索される。学習により得られた状態ノードに目的地と経由地の属性が付与されているので、経由地を目的地として予測することを防止することができる。
また、学習により得られた状態ノードに目的地と経由地の属性が付与されているので、同一目的地への経路であっても、経由地なしの経路と、経由地ありの経路を代表経路として出力することができる。
さらに、リアルタイムに取得した現在地を含む移動履歴データにデータ欠落部分があった場合でも、予測ブロック13は、ホールド補間処理により補間データを生成し、仮想誤差を設定する。そして、予測ブロック13は、状態ノード系列の推定において、補間データについては、状態ノードの観測確率として、設定した仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、補間処理後の移動履歴データに対応する状態ノード系列を(補間データにより破綻することなく)求めることができる。これにより、ユーザの現在地に相当する現在地ノードを推定することができ、また、現在地から目的地までの経路を求めることができる。即ち、リアルタイムに取得される現在地のデータに欠落があった場合でも、現在地と目的地の予測ができる。
[コンピュータの構成例]
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図66は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)411,ROM(Read Only Memory)412,RAM(Random Access Memory)413は、バス414により相互に接続されている。
バス414には、さらに、入出力インタフェース415が接続されている。入出力インタフェース415には、入力部416、出力部417、記憶部418、通信部419、ドライブ420、およびGPSセンサ421が接続されている。
入力部416は、キーボード、マウス、マイクロホンなどよりなる。出力部417は、ディスプレイ、スピーカなどよりなる。記憶部418は、ハードディスクや不揮発性のメモリなどよりなる。通信部419は、ネットワークインタフェースなどよりなる。ドライブ420は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体422を駆動する。上述のセンサデバイスとしてのGPSセンサ421は、現在地の位置(緯度および経度)のデータと、そのときの時刻からなる3次元データを出力する。
以上のように構成されるコンピュータでは、CPU411が、例えば、記憶部418に記憶されているプログラムを、入出力インタフェース415及びバス414を介して、RAM413にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU411)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体422に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブル記録媒体422をドライブ420に装着することにより、入出力インタフェース415を介して、記憶部418にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部419で受信し、記憶部418にインストールすることができる。その他、プログラムは、ROM412や記憶部418に、あらかじめインストールしておくことができる。
なお、本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる場合はもちろん、必ずしも時系列的に処理されなくとも、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで実行されてもよい。
本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
1 予測システム, 11 学習ブロック, 13 予測ブロック, 22 学習プリプロセス部, 23 学習メインプロセス部, 24 学習ポストプロセス部, 25 目的地経由地検出部, 32 予測プリプロセス部, 33 予測メインプロセス部, 34 予測ポストプロセス部, 73 再サンプリング処理部, 201 既知未知判定部, 223 状態ノード推定部, 224 サンプル別尤度計算部, 302 予測用データ生成部, 313 補間処理部, 314 移動属性識別付与部, 315 仮想誤差生成部, 331 現在地ノード推定部, 332 既知未知判定部, 333 目的地経由地予測部

Claims (8)

  1. 学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める学習手段と、
    前記学習手段により求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
    前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算する予測用データ生成手段と、
    前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
    推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
    探索された前記目的地への到達確率と所要時間を算出する算出手段と
    を備えるデータ処理装置。
  2. 前記現在地推定手段により得られた前記現在地ノードが既知の状態ノードであるか、または、未知の状態ノードであるかを判定する既知未知判定手段をさらに備え、
    前記探索手段は、前記既知未知判定手段により、前記現在地ノードが既知の状態ノードであると判定された場合に、ユーザの現在地から目的地までの経路を探索する
    請求項1に記載のデータ処理装置。
  3. 前記既知未知判定手段は、前記状態ノードの観測確率から算出される各状態ノードの観測尤度の期待値に基づいて既知未知の判定を行い、前記データ欠落部分については実データによる値よりも大きくなるように補正する補正項を付加した前記観測尤度の期待値を用いる
    請求項2に記載のデータ処理装置。
  4. 前記予測用データ生成手段は、現時点を含まない過去のデータ欠落部分に対しては線形補間、現時点を含むデータ欠落部分に対してはホールド補間による補間処理を行う
    請求項1に記載のデータ処理装置。
  5. 前記予測用データ生成手段は、前記線形補間により補間処理した移動履歴データについては、補間データと、データ欠落直前との距離か、または、データ復活直後の移動履歴データとの距離のいずれか小さい方を、前記仮想誤差として計算し、前記ホールド補間により補間処理した移動データについては、データが欠落してからの経過時間に応じた所定の関数で前記仮想誤差を計算する
    請求項4に記載のデータ処理装置。
  6. 前記学習手段は、
    前記確率モデルのパラメータを一旦求めた後、新たな学習用データとしての移動履歴データが供給され、前記新たな学習用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間データを含む前記新たな学習用データを生成する学習用データ生成手段と、
    前記補間データを含む前記新たな学習用データが、既知の経路の移動履歴データであるか、または、未知の経路の移動履歴データであるかを判定する既知未知判定手段と、
    前記既知未知判定手段において、前記既知の経路の移動履歴データであると判定された前記補間データについては、既に求めた前記確率モデルである既存モデルのパラメータのうち、前記状態ノードの確率分布パラメータの更新をしないようにしたパラメータ更新手段と
    を備える
    請求項1に記載のデータ処理装置。
  7. ユーザの移動履歴データを処理するデータ処理装置の、
    学習手段が、学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求め、
    目的地経由地推定手段が、求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定し、
    予測用データ生成手段が、前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算し、
    現在地推定手段が、前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定し、
    探索手段が、推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索し、
    算出手段が、探索された前記目的地への到達確率と所要時間を算出する
    ステップを含むデータ処理方法。
  8. コンピュータを、
    学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める学習手段と、
    前記学習手段により求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
    前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算する予測用データ生成手段と、
    前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
    推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
    探索された前記目的地への到達確率と所要時間を算出する算出手段
    として機能させるプログラム。
JP2010257485A 2010-11-18 2010-11-18 データ処理装置、データ処理方法、およびプログラム Withdrawn JP2012108748A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2010257485A JP2012108748A (ja) 2010-11-18 2010-11-18 データ処理装置、データ処理方法、およびプログラム
EP11841735.1A EP2642431A4 (en) 2010-11-18 2011-11-07 DATA PROCESSING DEVICE, DATA PROCESSING METHOD, AND PROGRAM
PCT/JP2011/075541 WO2012066951A1 (ja) 2010-11-18 2011-11-07 データ処理装置、データ処理方法、およびプログラム
US13/878,920 US9589082B2 (en) 2010-11-18 2011-11-07 Data processing device that calculates an arrival probability for a destination using a user's movement history including a missing portion
CN201180054421.7A CN103201754B (zh) 2010-11-18 2011-11-07 数据处理设备和数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010257485A JP2012108748A (ja) 2010-11-18 2010-11-18 データ処理装置、データ処理方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2012108748A true JP2012108748A (ja) 2012-06-07

Family

ID=46083886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010257485A Withdrawn JP2012108748A (ja) 2010-11-18 2010-11-18 データ処理装置、データ処理方法、およびプログラム

Country Status (5)

Country Link
US (1) US9589082B2 (ja)
EP (1) EP2642431A4 (ja)
JP (1) JP2012108748A (ja)
CN (1) CN103201754B (ja)
WO (1) WO2012066951A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016166800A (ja) * 2015-03-10 2016-09-15 株式会社東芝 位置状態推定装置及び方法
JP2017501609A (ja) * 2013-10-28 2017-01-12 華為技術有限公司Huawei Technologies Co.,Ltd. モバイルユーザの位置を予測するための方法、および機器
WO2017010317A1 (ja) * 2015-07-16 2017-01-19 ソニー株式会社 表示制御装置、表示制御方法、及び、プログラム
US10102684B2 (en) 2014-02-21 2018-10-16 Mitsubishi Heavy Industries Machinery Systems, Ltd. On-board device and route interpolating method therefor
US11152235B2 (en) 2017-08-24 2021-10-19 Samsung Electronics Co., Ltd. Apparatus and method for manufacture of semiconductor devices
WO2023007921A1 (ja) * 2021-07-30 2023-02-02 株式会社Nttドコモ 時系列データ処理装置

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892350B2 (en) * 2011-12-16 2014-11-18 Toyoda Jidosha Kabushiki Kaisha Journey learning system
WO2013192533A2 (en) 2012-06-22 2013-12-27 Google, Inc. Contextual traffic or transit alerts
KR101630389B1 (ko) 2012-06-22 2016-06-15 구글 인코포레이티드 현재 위치 또는 시간에 관한 정보의 제시
US9097548B2 (en) * 2013-01-07 2015-08-04 Televav, Inc. Content delivery system with natural language mechanism and method of operation thereof
CN103308054A (zh) * 2013-05-20 2013-09-18 江苏新科软件有限公司 一种导航路径旅行时间测算方法
JP5683663B1 (ja) * 2013-09-27 2015-03-11 パナソニックIpマネジメント株式会社 滞留時間測定装置、滞留時間測定システムおよび滞留時間測定方法
CN104050832B (zh) * 2014-05-23 2017-06-20 北京中交兴路信息科技有限公司 位置信息的补全方法和装置
JP5866523B2 (ja) * 2014-07-16 2016-02-17 パナソニックIpマネジメント株式会社 施設利用状況計測装置、施設利用状況計測システムおよび施設利用状況計測方法
CN105307112B (zh) * 2014-08-01 2019-03-26 中国电信股份有限公司 分析获取用户移动轨迹的方法和系统
US9503516B2 (en) 2014-08-06 2016-11-22 Google Technology Holdings LLC Context-based contact notification
EP3885301A1 (en) * 2015-02-24 2021-09-29 KONE Corporation Method and apparatus for predicting floor information for a destination call
WO2016151620A1 (ja) * 2015-03-23 2016-09-29 日本電気株式会社 シミュレートシステム、シミュレート方法およびシミュレート用プログラム
JP6545516B2 (ja) * 2015-04-24 2019-07-17 株式会社オプティム 行動分析サーバ、行動分析方法及び行動分析サーバ用プログラム
JP2016212066A (ja) * 2015-05-13 2016-12-15 富士通株式会社 移動体端末、センサ値補間方法、センサ値補間プログラム、行動認識装置および行動認識システム
US10567306B2 (en) * 2015-10-13 2020-02-18 Nec Corporation Communication management list generation device, communication management list generation method, and storage medium in which communication management list generation program is stored
CN105183659B (zh) * 2015-10-16 2018-07-24 上海通创信息技术有限公司 基于多级模式预测的软件系统行为异常检测方法
CN105512727B (zh) * 2015-11-27 2018-02-13 浙江理工大学 一种基于Markov的个人路径预测方法
CN106885572B (zh) * 2015-12-15 2019-06-21 中国电信股份有限公司 利用时间序列预测的辅助定位方法和系统
CN107153882B (zh) * 2016-03-03 2021-10-15 北京嘀嘀无限科技发展有限公司 乘客打车时刻分布区间的预测方法和系统
CN105679037B (zh) * 2016-03-29 2019-03-08 招商局重庆交通科研设计院有限公司 一种基于用户出行习惯的动态路径规划方法
TR201618011A2 (tr) * 2016-12-07 2018-06-21 Akif Ekin Tam otomati̇k pi̇zza, pi̇de, lahmacun ve benzeri̇ hazirlama ve dağitim si̇stemi̇
CN107133686A (zh) * 2017-03-30 2017-09-05 大连理工大学 基于时空数据模型的城市级pm2.5浓度预测方法
WO2018227325A1 (en) * 2017-06-12 2018-12-20 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for determining an estimated time of arrival
WO2019026703A1 (ja) * 2017-07-31 2019-02-07 株式会社エイシング 学習済モデル統合方法、装置、プログラム、icチップ、及びシステム
CN108038054B (zh) * 2017-12-01 2021-08-03 大唐微电子技术有限公司 一种自动化测试方法及装置、计算机可读存储介质
FR3078176B1 (fr) * 2018-02-19 2020-02-28 IFP Energies Nouvelles Systeme et procede de prediction d'un phenomene physique et/ou chimique au moyen d'un segment de memoire partage
US10743140B2 (en) * 2018-05-16 2020-08-11 International Business Machines Corporation Smart location alert system
CN109275087B (zh) * 2018-09-05 2021-07-23 口碑(上海)信息技术有限公司 一种优惠信息的发放方法以及装置
CN109300315B (zh) * 2018-10-12 2020-09-04 山东交通学院 基于车辆检测概率的地磁数据异常判别方法及系统
CN109272085B (zh) * 2018-10-15 2022-03-11 绵阳金升科技有限公司 基于云端数据的rfid智能工具管理系统
WO2020136770A1 (ja) * 2018-12-26 2020-07-02 三菱電機株式会社 移動体制御装置、移動体制御学習装置、及び移動体制御方法
JP7093057B2 (ja) * 2019-03-11 2022-06-29 トヨタ自動車株式会社 情報処理装置、情報処理方法及びプログラム
CN110162576A (zh) * 2019-04-22 2019-08-23 广东电网有限责任公司信息中心 基于系统指标数据的数据预测方法、系统及电子设备
CN113112030B (zh) * 2019-04-28 2023-12-26 第四范式(北京)技术有限公司 训练模型的方法及系统和预测序列数据的方法及系统
CN110196995B (zh) * 2019-04-30 2022-12-06 西安电子科技大学 一种基于带偏置随机游走的复杂网络特征提取方法
CN109982420B (zh) * 2019-05-07 2021-12-14 肇庆学院 一种基于监测行为规则的无线传感器网络休眠调度方法
CN112866482B (zh) * 2019-11-27 2022-04-15 青岛海信移动通信技术股份有限公司 一种对象行为习惯预测的方法和终端
CN111163072B (zh) * 2019-12-24 2022-06-10 五八有限公司 机器学习模型中特征值的确定方法、装置及电子设备
CN112168162B (zh) * 2020-10-06 2021-08-27 青岛优瑞特电子科技有限公司 一种智能可穿戴设备
CN114944062B (zh) * 2022-05-30 2023-05-26 长安大学 一种隧道平行交通系统构建方法
CN114757589B (zh) * 2022-06-14 2022-10-11 深圳市拓安信计控仪表有限公司 数据处理方法、服务器及存储介质
JP2024001732A (ja) * 2022-06-22 2024-01-10 富士通株式会社 移動手段推定方法及び移動手段推定プログラム
CN116092056B (zh) * 2023-03-06 2023-07-07 安徽蔚来智驾科技有限公司 目标识别方法、车辆控制方法、设备、介质及车辆

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5937384A (en) * 1996-05-01 1999-08-10 Microsoft Corporation Method and system for speech recognition using continuous density hidden Markov models
US7274332B1 (en) * 1996-09-09 2007-09-25 Tracbeam Llc Multiple evaluators for evaluation of a purality of conditions
WO1998010307A1 (en) * 1996-09-09 1998-03-12 Dennis Jay Dupray Location of a mobile station
US6611726B1 (en) * 1999-09-17 2003-08-26 Carl E. Crosswhite Method for determining optimal time series forecasting parameters
US7250907B2 (en) * 2003-06-30 2007-07-31 Microsoft Corporation System and methods for determining the location dynamics of a portable computing device
US7202816B2 (en) * 2003-07-22 2007-04-10 Microsoft Corporation Utilization of the approximate location of a device determined from ambient signals
US7233861B2 (en) * 2003-12-08 2007-06-19 General Motors Corporation Prediction of vehicle operator destinations
JP2006134080A (ja) 2004-11-05 2006-05-25 Ntt Docomo Inc 携帯端末、及び、個人適応型コンテキスト獲得方法
JP4735141B2 (ja) * 2005-09-05 2011-07-27 日本電気株式会社 情報処理システム、情報処理装置、情報処理方法、および情報処理プログラム
US7706965B2 (en) * 2006-08-18 2010-04-27 Inrix, Inc. Rectifying erroneous road traffic sensor data
US7912628B2 (en) * 2006-03-03 2011-03-22 Inrix, Inc. Determining road traffic conditions using data from multiple data sources
US8014936B2 (en) * 2006-03-03 2011-09-06 Inrix, Inc. Filtering road traffic condition data obtained from mobile data sources
US7610151B2 (en) * 2006-06-27 2009-10-27 Microsoft Corporation Collaborative route planning for generating personalized and context-sensitive routing recommendations
US7706964B2 (en) * 2006-06-30 2010-04-27 Microsoft Corporation Inferring road speeds for context-sensitive routing
US7512487B1 (en) * 2006-11-02 2009-03-31 Google Inc. Adaptive and personalized navigation system
US7680749B1 (en) * 2006-11-02 2010-03-16 Google Inc. Generating attribute models for use in adaptive navigation systems
JP5018120B2 (ja) 2007-02-19 2012-09-05 Kddi株式会社 携帯端末、プログラム及び携帯端末への表示画面制御方法
US7991718B2 (en) * 2007-06-28 2011-08-02 Microsoft Corporation Method and apparatus for generating an inference about a destination of a trip using a combination of open-world modeling and closed world modeling
JP5396715B2 (ja) 2008-01-29 2014-01-22 コニカミノルタ株式会社 クリーニング装置及び画像形成装置
JP2009208064A (ja) 2008-02-04 2009-09-17 Nidec Sankyo Corp 洗浄槽および洗浄装置
US20090210276A1 (en) * 2008-02-19 2009-08-20 Microsoft Corporation Ad hoc and opportunistic transportation services
US9846049B2 (en) * 2008-07-09 2017-12-19 Microsoft Technology Licensing, Llc Route prediction
JP5257038B2 (ja) 2008-12-09 2013-08-07 トヨタ自動車株式会社 回転電機
JP5515331B2 (ja) * 2009-03-09 2014-06-11 ソニー株式会社 情報提供サーバ、情報提供システム、情報提供方法及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017501609A (ja) * 2013-10-28 2017-01-12 華為技術有限公司Huawei Technologies Co.,Ltd. モバイルユーザの位置を予測するための方法、および機器
US9906913B2 (en) 2013-10-28 2018-02-27 Huawei Technologies Co., Ltd. Method for predicting position of mobile user, and equipment
US10102684B2 (en) 2014-02-21 2018-10-16 Mitsubishi Heavy Industries Machinery Systems, Ltd. On-board device and route interpolating method therefor
JP2016166800A (ja) * 2015-03-10 2016-09-15 株式会社東芝 位置状態推定装置及び方法
WO2017010317A1 (ja) * 2015-07-16 2017-01-19 ソニー株式会社 表示制御装置、表示制御方法、及び、プログラム
US11152235B2 (en) 2017-08-24 2021-10-19 Samsung Electronics Co., Ltd. Apparatus and method for manufacture of semiconductor devices
WO2023007921A1 (ja) * 2021-07-30 2023-02-02 株式会社Nttドコモ 時系列データ処理装置

Also Published As

Publication number Publication date
CN103201754A (zh) 2013-07-10
EP2642431A4 (en) 2016-01-06
EP2642431A1 (en) 2013-09-25
CN103201754B (zh) 2016-08-17
US9589082B2 (en) 2017-03-07
US20130197890A1 (en) 2013-08-01
WO2012066951A1 (ja) 2012-05-24

Similar Documents

Publication Publication Date Title
WO2012066951A1 (ja) データ処理装置、データ処理方法、およびプログラム
JP2012008659A (ja) データ処理装置、データ処理方法、およびプログラム
JP2011252844A (ja) データ処理装置、データ処理方法、およびプログラム
US8572008B2 (en) Learning apparatus and method, prediction apparatus and method, and program
JP2011059924A (ja) データ処理装置、データ処理方法、およびプログラム
US20110137833A1 (en) Data processing apparatus, data processing method and program
US8229666B2 (en) Generating and using pattern keys in navigation systems to predict user destinations
JP4896981B2 (ja) オープン・ワールド・モデリング法およびクローズド・ワールド・モデリング法を用いて部分的軌跡から目的地を予測する方法
US9285235B2 (en) Information processing device, information processing method, and program
US20110137831A1 (en) Learning apparatus, learning method and program
JP2012003494A (ja) 情報処理装置、情報処理方法及びプログラム
JP2012008771A (ja) 情報処理装置、情報処理システム、情報処理方法およびプログラム
Ozdemir et al. A hybrid HMM model for travel path inference with sparse GPS samples
JP5605918B2 (ja) 交通データ予測装置、交通データ予測方法及びコンピュータプログラム
JP5389688B2 (ja) 場所存在確率算出装置及び方法及びプログラム及びトラベルルート推薦装置及び方法及びプログラム
Murphy et al. Risky planning on probabilistic costmaps for path planning in outdoor environments
CN111256710A (zh) 一种地图匹配方法及系统
Liu et al. Bustime: Which is the right prediction model for my bus arrival time?
JP2010009510A (ja) 局所交通量予測プログラム生成装置、局所交通量予測装置、局所交通量予測プログラム生成方法、局所交通量予測方法及びプログラム
van der Aalst TomTom for business process management (TomTom4BPM)
Irio et al. An adaptive learning-based approach for vehicle mobility prediction
EP3971780A1 (en) Method and system for dynamically predicting vehicle arrival time using a temporal difference learning technique
Amirat et al. MyRoute: A Graph-Dependency Based Model for Real-Time Route Prediction.
Ajani et al. Dynamic path planning approaches based on artificial intelligence and machine learning
Zhu et al. A knowledge-enhanced framework for imitative transportation trajectory generation

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140204