JP2012108748A

JP2012108748A - データ処理装置、データ処理方法、およびプログラム

Info

Publication number: JP2012108748A
Application number: JP2010257485A
Authority: JP
Inventors: Naoki Ide; 直紀井手; Masato Ito; 真人伊藤; Kotaro Sabe; 浩太郎佐部
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-11-18
Filing date: 2010-11-18
Publication date: 2012-06-07
Also published as: CN103201754A; EP2642431A4; EP2642431A1; CN103201754B; US9589082B2; US20130197890A1; WO2012066951A1

Abstract

【課題】リアルタイムに取得される現在地のデータに欠落があった場合でも、予測ができるようにする。
【解決手段】学習メインプロセス部２３は、学習用データとしての移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める。予測メインプロセス部３３は、学習により得られた確率モデルを用いて、リアルタイムに取得される移動履歴データから、ユーザの現在地を推定する。リアルタイムに取得される移動履歴データにデータ欠落部分がある場合に、予測メインプロセス部３３は、そのデータ欠落部分を補間処理により生成し、補間された予測用データに対応する状態ノード系列を推定する。状態ノード系列の推定において、補間データについては、実データよりもデータの寄与の少ない観測確率が用いられる。本発明は、例えば、移動履歴データから目的地を予測するデータ処理装置に適用できる。
【選択図】図１

Description

本発明は、データ処理装置、データ処理方法、およびプログラムに関し、特に、リアルタイムに取得される現在地のデータに欠落があった場合でも、予測ができるようにするデータ処理装置、データ処理方法、およびプログラムに関する。

近年、ユーザが身に着けられるセンサであるウェアラブルセンサから得られる時系列データを用いてユーザの状態をモデル化して学習し、学習により得られたモデルを用いてユーザの現在の状態を認識する研究が盛んである（例えば、特許文献１，２、非特許文献１）。

本出願人は、未来の所望の時刻におけるユーザの活動状態の複数の可能性を確率的に予測する方法を、特願２００９−１８０７８０号（以下、先願１という）として先に提案している。先願１の方法では、時系列データからユーザの活動状態を確率的状態遷移モデルとして学習し、学習した確率的状態遷移モデルを用いて現在の活動状態を認識し、「所定時間後」のユーザの活動状態を確率的に予測することができる。先願１では、「所定時間後」のユーザの活動状態の予測の一例として、ユーザの移動履歴の時系列データ（移動履歴データ）を学習した確率的状態遷移モデルを用いて、ユーザの現在の位置を認識し、所定時間後のユーザの行き先（場所）を予測する例が示されている。

さらに、本出願人は、先願１を発展させ、「所定時間後」という現在時刻からの経過時間の指定がない場合であっても、複数の目的地への到達確率、経路、時間を予測する方法を、特願２００９−２０８０６４号（以下、先願２という）として提案した。先願２の方法では、確率的状態遷移モデルを構成する状態ノードに、”移動状態”かまたは”滞在状態”の属性が付与された。そして、確率的状態遷移モデルを構成する状態ノードの中から、目的地の状態ノードとして”滞在状態”の状態ノードを見つけることで、目的地の候補を自動的に検出することができた。

そして、本出願人は、特願２０１０−１４１９４６号（以下、先願３という）として、先願２の学習モデル（確率的状態遷移モデル）を、新たな移動経路の移動履歴データが追加されたときに発達させることができるようにして、効率的な学習ができるようにした。

特開２００６−１３４０８０号公報特開２００８−２０４０４０号公報

"Life Patterns: structure from wearable sensors",Brian Patrick Clarkson, Doctor Thesis, MIT, 2002

しかしながら、先願３の方法では、リアルタイムに取得される現在の移動履歴データに基づいて、現在値（現在状態）を推定したうえで目的地を予測するが、現在地のデータを取得できない場合には、現在状態を推定できず、目的地の予測もできなかった。

本発明は、このような状況に鑑みてなされたものであり、リアルタイムに取得される現在地のデータに欠落があった場合でも、予測ができるようにするものである。

本発明の一側面のデータ処理装置は、
学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める学習手段と、
前記学習手段により求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算する予測用データ生成手段と、
前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
探索された前記目的地への到達確率と所要時間を算出する算出手段と
を備える。

本発明の一側面のデータ処理方法は、
ユーザの移動履歴データを処理するデータ処理装置の、
学習手段が、学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求め、
目的地経由地推定手段が、求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定し、
予測用データ生成手段が、前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算し、
現在地推定手段が、前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定し、
探索手段が、推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索し、
算出手段が、探索された前記目的地への到達確率と所要時間を算出する
ステップを含む。

本発明の一側面のプログラムは、
コンピュータを、
学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める学習手段と、
前記学習手段により求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算する予測用データ生成手段と、
前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
探索された前記目的地への到達確率と所要時間を算出する算出手段
として機能させるプログラムである。

本発明の一側面においては、学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータが求められ、求められたパラメータを用いた確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードが推定される。そして、学習用データとは別の、現在から所定時間以内のユーザの移動履歴データが予測用データとして取得され、取得された予測用データにデータ欠落部分がある場合に、そのデータ欠落部分が補間処理により生成され、生成された補間データに対する実データとの仮想誤差が計算される。データ欠落部分が補間された予測用データを、学習により得られたパラメータを用いた確率モデルに入力して、データ欠落部分が補間された予測用データに対応する状態ノード系列を推定する状態ノード系列の推定において、補間データについては、状態ノードの観測確率として、仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、ユーザの現在地に相当する現在地ノードが推定される。推定された目的地ノードおよび経由地ノード並びに現在地ノードについての情報と、学習により得られた確率モデルとを用いて、ユーザの現在地から目的地までの経路が探索され、探索された目的地への到達確率と所要時間が算出される。

本発明の一側面によれば、リアルタイムに取得される現在地のデータに欠落があった場合でも、予測ができる。

本発明を適用した予測システムの一実施の形態の構成例を示すブロック図である。予測システムのハードウエア構成例を示すブロック図である。移動履歴データの例を示す図である。 HMMの例を示す図である。 left-to-right型のHMMの例を示す図である。スパース制約を与えたHMMの例を示す図である。学習プリプロセス部の詳細構成例を示すブロック図である。学習プリプロセス部の処理について説明する図である。学習プリプロセス部の処理について説明する図である。移動属性識別付与部の詳細構成例を示すブロック図である。移動属性識別部の学習器の構成例を示すブロック図である。行動状態をカテゴリごとに分類する場合の分類例を示す図である。行動状態ラベリング部の処理例を説明する図である。行動状態ラベリング部の処理例を説明する図である。図１１の行動状態学習部の構成例を示すブロック図である。移動属性識別部の詳細構成例を示すブロック図である。移動属性識別部の学習器のその他の構成例を示すブロック図である。移動属性識別部のその他の構成例を示すブロック図である。学習プリプロセス部の処理を説明するフローチャートである。図１の学習メインプロセス部の詳細構成例を示すブロック図である。既知未知判定部の詳細な構成例を示すブロック図である。未知状態ノード追加部による未知状態追加モデルの構築処理を説明するフローチャートである。未知状態追加モデルの初期確率テーブルを説明する図である。未知状態追加モデルの遷移確率テーブルを説明する図である。未知状態追加モデルの中心値テーブルを説明する図である。未知状態追加モデルの分散値テーブルを説明する図である。線形補間処理における仮想誤差のイメージ図である。観測尤度計算処理を説明する説明するフローチャートである。既知未知判定処理を説明する説明するフローチャートである。新規モデル生成部の詳細な構成例を示すブロック図である。通常のHMMによる学習モデルと、新規モデル学習部が行う学習モデルの違いについて説明する図である。通常のHMMによる学習モデルと、新規モデル学習部が行う学習モデルの違いについて説明する図である。新規モデル学習部の学習モデルをグラフィカルモデルで表した図である。新規モデル学習部の新規モデル学習処理を説明するフローチャートである。パラメータ再計算部のパラメータ再計算処理を説明するフローチャートである。新規モデル生成部が行う新規モデル生成処理全体のフローチャートである。新規モデル結合部によるトポロジー更新モデル生成処理を説明するフローチャートである。トポロジー更新モデルの初期確率テーブルを説明する図である。トポロジー更新モデルの遷移確率テーブルを説明する図である。トポロジー更新モデルの遷移確率テーブルを説明する図である。トポロジー更新モデルの遷移確率テーブルを説明する図である。トポロジー更新モデルの中心値テーブルを説明する図である。トポロジー更新モデルの分散値テーブルを説明する図である。パラメータ更新部が行うパラメータ更新処理全体のフローチャートである。既存モデルの初期確率テーブルを説明する図である。既存モデルの遷移確率テーブルを説明する図である。既存モデルの遷移確率テーブルを説明する図である。既存モデルの遷移確率テーブルを説明する図である。既存モデルの中心値テーブルを説明する図である。既存モデルの分散値テーブルを説明する図である。学習メインプロセス部全体の学習メインプロセス処理のフローチャートである。目的地経由地検出部の処理について説明する図である。学習ブロック全体の処理を説明するフローチャートである。予測プリプロセス部の詳細構成例を示すブロック図である。ホールド補間処理における仮想誤差のイメージ図である。補間処理後の移動履歴データと仮想誤差系列データを示す図である。移動手段に応じた仮想誤差のイメージ図である。予測用データ生成部による予測用データ生成処理を説明するフローチャートである。予測メインプロセス部の詳細構成例を示すブロック図である。ツリー探索処理を説明するフローチャートである。ツリー探索処理をさらに説明する図である。ツリー探索処理をさらに説明する図である。ツリー探索処理における探索結果リストの例を示す図である。代表経路選択処理を説明するフローチャートである。予測ブロック全体の処理を説明するフローチャートである。本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

［予測システムの構成例］
図１は、本発明を適用した予測システムの一実施の形態の構成例を示している。

図１の予測システム１は、学習ブロック１１、ユーザ別モデルパラメータ記憶部１２、および予測ブロック１３により構成される。

学習ブロック１１には、GPS (Global Positioning System)センサなどのセンサデバイス（不図示）において、所定の期間に取得された、所定の時刻におけるユーザの位置（緯度と経度）を示す時系列データが供給される。即ち、学習ブロック１１には、一定時間間隔（たとえば、１５秒間隔）で順次取得された位置（緯度および経度）のデータと、そのときの時刻の３次元からなる、ユーザの移動経路を示す時系列データ（以下、移動履歴データという。）が供給される。なお、時系列データを構成する、緯度、経度、および時刻の１組のデータを、適宜、３次元データともいう。

学習ブロック１１は、ユーザの移動履歴データを用いて、ユーザの活動モデル（ユーザの行動・活動パターンを表した状態モデル）を、確率的状態遷移モデルとして学習する学習処理を行う。

学習に使用される確率的状態遷移モデルとしては、例えば、エルゴディックHMM（Hidden Markov Model）などの、隠れ状態を含む確率モデルを採用することができる。予測システム１では、確率的状態遷移モデルとして、エルゴディックHMMにスパース制約を与えたものを採用する。なお、スパース制約を与えたエルゴディックHMM、エルゴディックHMMのパラメータの算出方法等については、図４乃至図６を参照して後述する。

ユーザ別モデルパラメータ記憶部１２は、学習ブロック１１の学習により得られた、ユーザの活動モデルを表すパラメータを記憶する。

予測ブロック１３は、学習ブロック１１の学習により得られたユーザ活動モデルのパラメータをユーザ別モデルパラメータ記憶部１２から取得する。そして、予測ブロック１３は、新たに取得されたユーザの移動履歴データに対し、学習により得られたパラメータによるユーザ活動モデルを用いて、ユーザの現在地を推定し、さらに現在地からの移動の目的地を予測する。さらに、予測ブロック１３は、予測した目的地までの到達確率、経路、および到達時間（所要時間）も算出する。なお、目的地は１つだけとは限らず、複数の目的地が予測されることもある。

学習ブロック１１および予測ブロック１３の詳細について説明する。

学習ブロック１１は、履歴データ蓄積部２１、学習プリプロセス部２２、学習メインプロセス部２３、学習ポストプロセス部２４、および目的地経由地検出部２５により構成される。

履歴データ蓄積部２１は、センサデバイスから供給される、ユーザの移動履歴データを、学習用データとして蓄積（記憶）する。履歴データ蓄積部２１は、移動履歴データを、必要に応じて学習プリプロセス部２２に供給する。

学習プリプロセス部２２は、センサデバイスから生じる課題を解決する。具体的には、学習プリプロセス部２２は、移動履歴データを整形するとともに、一時的なデータの欠落を補間処理等を行うことで補間する。また、学習プリプロセス部２２は、移動履歴データを構成する３次元データそれぞれに対し、同一場所に滞在（停止）している”滞在状態”か、または、移動している”移動状態”のいずれかの移動属性を付与する。移動属性付与後の移動履歴データが、学習メインプロセス部２３と目的地経由地検出部２５に供給される。

学習メインプロセス部２３は、ユーザの移動履歴をユーザ活動モデルとしてモデル化する。即ち、学習メインプロセス部２３は、ユーザの移動履歴データをユーザ活動モデルにモデル化したときのパラメータを求める。学習により得られたユーザ活動モデルのパラメータは、学習ポストプロセス部２４とユーザ別モデルパラメータ記憶部１２に供給される。

また、学習メインプロセス部２３は、ユーザの移動履歴データをユーザ活動モデルとして学習した後、新たな学習用データとしての移動履歴データが供給された場合、現在のユーザ活動モデルのパラメータをユーザ別モデルパラメータ記憶部１２から取得し、更新する。

具体的には、最初に、学習メインプロセス部２３は、新たな学習用データとしての移動履歴データが既知の経路の移動履歴データであるか、または、未知の経路の移動履歴データであるかを判定する。そして、新たな学習用データが既知の経路の移動履歴データであると判定された場合、学習メインプロセス部２３は、既存のユーザ活動モデル（以下、単に、既存モデルと称する。）のパラメータを更新する。一方、新たな学習用データが未知の経路の移動履歴データである場合、学習メインプロセス部２３は、未知の経路の移動履歴データに対応する新規モデルとしてのユーザ活動モデルのパラメータを求める。そして、学習メインプロセス部２３は、既存モデルのパラメータと、新規モデルのパラメータを合成することで、既存モデルと新規モデルを結合した更新モデルを生成する。

なお、以下において、既知の経路の移動履歴データにより更新されたユーザ活動モデルは、パラメータ更新モデルと称する。一方、未知の経路の移動履歴データによりパラメータが更新されたユーザ活動モデルは、未知の経路の拡張に応じてトポロジーも更新されることから、トポロジー更新モデルと称する。また、以下では、既知の経路の移動履歴データ、および、未知の経路の移動履歴データを、単に、既知の移動履歴データ、および、未知の移動履歴データとも称する。

パラメータ更新モデルまたはトポロジー更新モデルのパラメータは、学習ポストプロセス部２４とユーザ別モデルパラメータ記憶部１２に供給され、後段では、更新後のユーザ活動モデルを用いて処理が行われる。

学習ポストプロセス部２４は、学習メインプロセス部２３の学習により得られたユーザ活動モデルを用いて、移動履歴データを構成する各３次元データを、ユーザ活動モデルの状態ノードに変換する。即ち、学習ポストプロセス部２４は、移動履歴データに対応する、ユーザ活動モデルの状態ノードの時系列データ（ノード系列データ）を生成する。学習ポストプロセス部２４は、変換後のノード系列データを目的地経由地検出部２５に供給する。

目的地経由地検出部２５は、学習プリプロセス部２２から供給された移動属性付与後の移動履歴データと、学習ポストプロセス部２４から供給されたノード系列データとを対応付ける。即ち、目的地経由地検出部２５は、移動履歴データを構成する各３次元データに、ユーザ活動モデルの状態ノードを割り当てる。

そして、目的地経由地検出部２５は、ノード系列データの各状態ノードのうち、移動属性が”滞在状態”の３次元データに対応する状態ノードに、目的地または経由地の属性を付与する。これにより、ユーザの移動履歴内の所定の場所（に対応する状態ノード）が、目的地かまたは経由地に割り当てられる。目的地経由地検出部２５により、状態ノードに付与された目的地、経由地の属性についての情報は、ユーザ別モデルパラメータ記憶部１２に供給され、記憶される。

予測ブロック１３は、バッファリング部３１、予測プリプロセス部３２、予測メインプロセス部３３、および、予測ポストプロセス部３４により構成される。

バッファリング部３１は、予測処理のためのリアルタイムに取得される移動履歴データをバッファリングする（記憶する）。なお、予測処理のための移動履歴データとしては、学習処理時の移動履歴データよりも短い期間のデータ、例えば、１００ステップ程度の移動履歴データがあれば十分である。バッファリング部３１は、常に、所定期間分の最新の移動履歴データを記憶するようにし、新たなデータが取得されたとき、記憶されているデータのうち最も古いデータを消去する。

予測プリプロセス部３２は、学習プリプロセス部２２と同様、センサデバイスから生じる課題を解決する。即ち、予測プリプロセス部３２は、移動履歴データを整形するとともに、一時的なデータの欠落を補間処理等を行うことで補間する。

予測メインプロセス部３３には、ユーザ別モデルパラメータ記憶部１２から、学習ブロック１１の学習により得られた、ユーザ活動モデルを表すパラメータが供給される。

予測メインプロセス部３３は、予測プリプロセス部３２から供給される移動履歴データと、学習ブロック１１の学習により得られたユーザ活動モデルを用いて、ユーザの現在地に対応する状態ノード（現在地ノード）を推定する。状態ノードの推定には、ビタビ最尤推定や軟判定ビタビ推定を採用することができる。

さらに、予測メインプロセス部３３は、推定した現在地ノードから遷移可能な複数の状態ノードでなるツリー構造において、目的地の状態ノード（目的地ノード）までのノード系列とその生起確率を算出する。なお、目的地の状態ノードへのノード系列（経路）には経由地のノードが含まれる場合もあるので、予測メインプロセス部３３は、目的地と同時に経由地も予測する。

予測ポストプロセス部３４は、同一目的地までの複数の経路の選択確率（生起確率）の和を目的地への到達確率として求める。また、予測ポストプロセス部３４は、目的地への経路のうち代表となる１以上の経路（以下、代表経路という。）を選択し、代表経路の所要時間を算出する。そして、予測ポストプロセス部３４は、予測した目的地までの代表経路、到達確率、および所要時間を予測結果として出力する。なお、経路の生起確率の代わりに頻度、目的地への到達確率の代わりに到達頻度を、予測結果として出力してもよい。

［予測システムのハードウエア構成例］
以上のように構成される予測システム１は、例えば、図２に示されるハードウエア構成を採用することができる。即ち、図２は、予測システム１のハードウエア構成例を示すブロック図である。

図２において、予測システム１は、３台のモバイル端末５１−１乃至５１−３とサーバ５２とにより構成されている。モバイル端末５１−１乃至５１−３は、同一機能を有する同型のモバイル端末５１であるが、モバイル端末５１−１乃至５１−３では、それを所有するユーザが異なる。従って、図２では、３台のモバイル端末５１−１乃至５１−３のみが示されているが、実際には、ユーザ数に応じた数のモバイル端末５１が存在する。

モバイル端末５１は、無線通信及びインターネット等のネットワークを介した通信により、サーバ５２とデータの授受を行うことができる。サーバ５２は、モバイル端末５１から送信されてくるデータを受信し、受信したデータに対し所定の処理を行う。そして、サーバ５２は、データ処理の処理結果を無線通信等によりモバイル端末５１に送信する。

従って、モバイル端末５１とサーバ５２は、無線または有線による通信を行う通信部を少なくとも有する。

さらに、モバイル端末５１が、図１の予測ブロック１３を備え、サーバ５２が、図１の学習ブロック１１とユーザ別モデルパラメータ記憶部１２を備える構成を採用することができる。

この構成が採用される場合、例えば、学習処理において、モバイル端末５１のセンサデバイスにより取得された移動履歴データがサーバ５２に送信される。サーバ５２は、受信した学習用の移動履歴データに基づき、ユーザ活動モデルを学習し、記憶する。そして、予測処理において、モバイル端末５１が、学習により得られたユーザ活動モデルのパラメータを取得し、リアルタイムに取得される移動履歴データから、ユーザの現在地ノードを推定し、さらに、目的地ノードと、そこまでの到達確率、代表経路、および所要時間を算出する。そして、モバイル端末５１は、予測結果を図示せぬ液晶ディスプレイ等の表示部に表示する。

以上のようなモバイル端末５１とサーバ５２との間の役割分担は、それぞれのデータ処理装置としての処理能力や通信環境に応じて、適宜、決定することができる。

学習処理は、処理に要する１回あたりの時間は非常に長いが、それほど頻繁に処理する必要はない。従って、一般的には、携行可能なモバイル端末５１よりもサーバ５２の方が処理能力が高いので、サーバ５２に、一日に一回程度蓄積された移動履歴データに基づいて学習処理（パラメータの更新）を行わせるようにすることができる。

一方、予測処理は、時々刻々とリアルタイムに更新される移動履歴データに対応させて迅速に処理し、表示することが望ましいので、モバイル端末５１で処理を行う方が望ましい。通信環境がリッチであれば、サーバ５２に予測処理も行わせ、予測結果のみをサーバ５２から受信する方が、携行可能な小型化が要求されるモバイル端末５１の負荷が軽減され、望ましい。

また、モバイル端末５１単独で、データ処理装置として学習処理および予測処理を高速に行うことが可能である場合には、図１の予測システム１の構成すべてをモバイル端末５１が備えるようにすることも勿論可能である。

［入力される移動履歴データの例］
図３は、予測システム１で取得された移動履歴データの例を示している。図３において、横軸は経度を表し、縦軸は緯度を表している。

図３に示される移動履歴データは、実験者の１ヶ月半程度の期間に蓄積された移動履歴データを示している。図３に示されるように、移動履歴データは、主に、自宅周辺と、勤務先などの４か所の外出先を移動したデータとなっている。なお、この移動履歴データには、人工衛星を捕捉できず、位置が飛んでいるデータも含まれている。

［エルゴディックHMMについて］
次に、予測システム１が、学習モデルとして採用するエルゴディックHMMについて説明する。

図４は、HMMの例を示している。

HMMは、状態ノードと状態ノード間遷移とを有する状態遷移モデルである。

図４は、３状態のHMMの例を示している。

図４において（以降の図においても同様）、丸印は、状態ノードを表し、矢印は、状態ノードの遷移を表す。なお、以下において、状態ノードは、単に、ノードまたは状態ともいう。

また、図４において、s_i（図４では、i=1,2,3）は、状態を表し、a_ijは、状態s_iから状態s_jへの状態遷移確率を表す。さらに、b_j(x)は、状態s_jへの状態遷移時に、観測値xが観測される出力確率密度関数を表し、π_iは、状態s_iが初期状態である初期確率を表す。

なお、出力確率密度関数b_j(x)としては、例えば、正規確率分布等が用いられる。

ここで、HMM（連続HMM）は、状態遷移確率a_ij、出力確率密度関数b_j(x)、及び初期確率π_iによって定義される。これらの状態遷移確率a_ij、出力確率密度関数b_j(x)、及び初期確率π_iを、HMMのパラメータλ={a_ij,b_j(x), π_i,i=1,2,・・・,M，j=1,2,・・・,M}という。Mは、HMMの状態数を表す。

HMMのパラメータλを推定する方法としては、Baum-Welchの最尤推定法が広く利用されている。Baum-Welchの最尤推定法は、EMアルゴリズム(EM(Expectation-Maximization) algorithm)に基づくパラメータの推定方法である。

Baum-Welchの最尤推定法によれば、観測される時系列データx=x₁,x₂,・・・,x_Tに基づき、その時系列データが観測（生起）される確率である生起確率から求まる尤度を最大化するように、HMMのパラメータλの推定が行われる。ここで、x_tは、時刻tに観測される信号（サンプル値）を表し、Tは、時系列データの長さ（サンプル数）を表す。

Baum-Welchの最尤推定法については、例えば、“パターン認識と機械学習（下）”，Ｃ．Ｍ．ビショップ著，P. 333（英語原書：“Pattern Recognition and Machine Learning (Information Science and Statistics) ”，Christopher M. BishopSpringer, New York, 2006.）（以下、文献Ａと称する）に記載されている。

なお、Baum-Welchの最尤推定法は、尤度最大化に基づくパラメータ推定方法ではあるが、最適性を保証するものではなく、HMMの構造やパラメータλの初期値によっては、局所解（ローカルミニマム）に収束することがある。

HMMは、音声認識で広く利用されているが、音声認識で利用されるHMMでは、一般に、状態の数や状態遷移の仕方等はあらかじめ決定される。

図５は、音声認識で利用されるHMMの例を示している。

図５のHMMは、left-to-right型と呼ばれる。

図５では、状態数は３になっており、状態遷移は、自己遷移（状態s_iから状態s_iへの状態遷移）と、左から右隣の状態への状態遷移とのみを許す構造に制約されている。

図５のHMMのように、状態遷移に制約があるHMMに対して、図４に示した、状態遷移に制約がないHMM、すなわち、任意の状態s_iから任意の状態s_jへの状態遷移が可能なHMMは、エルゴディック(Ergodic)HMMと呼ばれる。

エルゴディックHMMは、構造としては最も自由度の高いHMMであるが、状態数が多くなると、パラメータλの推定が困難となる。

例えば、エルゴディックHMMの状態数が、１０００である場合、状態遷移の数は、１００万（＝１０００×１０００）となる。

したがって、この場合、パラメータλのうちの、例えば、状態遷移確率a_ijについては、１００万個の状態遷移確率a_ijを推定することが必要となる。

そこで、状態に対して設定する状態遷移には、例えば、スパース(Sparse)な構造であるという制約（スパース制約）をかけることができる。

ここで、スパースな構造とは、任意の状態から任意の状態への状態遷移が可能なエルゴディックHMMのような密な状態遷移ではなく、ある状態から状態遷移することができる状態が非常に限定されている構造である。なお、ここでは、スパースな構造であっても、他の状態への状態遷移は、少なくとも１つ存在し、また、自己遷移は存在することとする。

図６は、スパース制約を与えたHMMを示している。

ここで、図６では、２つの状態を結ぶ双方向の矢印は、その２つの状態の一方から他方への状態遷移と、他方から一方への状態遷移とを表す。また、図６において、各状態は、自己遷移が可能であり、その自己遷移を表す矢印の図示は、省略されている。

図６では、１６個の状態が、２次元空間上に格子状に配置されている。すなわち、図６では、横方向に、４個の状態が配置され、縦方向にも、４個の状態が配置されている。

いま、横方向に隣接する状態どうしの距離、及び、縦方向に隣接する状態どうしの距離を、いずれも１とすると、図６Ａは、距離が１以下の状態への状態遷移は可能とし、他の状態への状態遷移はできないというスパース制約を与えたHMMを示している。

また、図６Ｂは、距離が√２以下の状態への状態遷移は可能とし、他の状態への状態遷移はできないというスパース制約を与えたHMMを示している。

図１の例では、予測システム１に、移動履歴データx=x₁,x₂,・・・,x_Tが供給され、学習ブロック１１は、移動履歴データx=x₁,x₂,・・・,x_Tを用い、ユーザ活動モデルを表すHMMのパラメータλを推定する。

即ち、ユーザの移動軌跡を表す各時刻の位置（緯度経度）のデータが、HMMの状態s_iのいずれかに対応する地図上の一点から、所定の分散値の広がりを持って正規分布した確率変数の観測データであると考える。学習ブロック１１は、各状態s_iに対応する地図上の一点（中心値μ_i）とその分散値σ_i ^２、および状態遷移確率a_ijを最適化する。

なお、状態s_iの初期確率π_iは、一様な値に設定することができる。例えば、M個の状態s_iそれぞれの初期確率π_iが、1/Mに設定される。

予測メインプロセス部３３は、学習により得られたユーザ活動モデル（HMM）に対して、ビタビアルゴリズムを適用し、移動履歴データx=x₁,x₂,・・・,x_Tが観測される尤度を最も大にする状態遷移の過程（状態の系列）（パス）（以下、最尤パスともいう）を求める。これにより、ユーザの現在地に対応する状態s_iが認識される。

ここで、ビタビアルゴリズムとは、各状態s_iを始点とする状態遷移のパスの中で、時刻tに、状態s_iから状態s_jに状態遷移する状態遷移確率a_ijと、その状態遷移において、移動履歴データx=x₁,x₂,・・・,x_Tのうちの時刻tのサンプル値x_tが観測される確率（出力確率密度関数b_j(x)から求められる出力確率）とを、処理後時系列データxの長さTに亘って累積した値（生起確率）を最大にするパス（最尤パス）を決定するアルゴリズムである。ビタビアルゴリズムの詳細については上述の文献ＡのP.347に記載されている。

［学習プリプロセス部２２の構成例］
図７は、学習ブロック１１の学習プリプロセス部２２の詳細構成例を示すブロック図である。

学習プリプロセス部２２は、データ接続分割部７１、データ異常除去部７２、再サンプリング処理部７３、移動属性識別付与部７４、および滞在状態加工部７５により構成される。

データ接続分割部７１は、移動履歴データの接続および分割の処理を行う。データ接続分割部７１には、移動履歴データが、センサデバイスから、１日単位などの所定の単位でログファイルとして供給される。従って、本来、ある目的地への移動途中で連続すべき移動履歴データが、日付を跨いだために分割されて取得されることがある。データ接続分割部７１は、そのような分割された移動履歴データを接続する。具体的には、データ接続分割部７１は、１つのログファイル内の最後の３次元（緯度、経度、時刻）データと、そのログファイルの次に作成されたログファイル内の最初の３次元データの時間差が所定の時間内であれば、それらのファイル内の移動履歴データを接続する。

また、例えば、GPSセンサは、トンネルや地下では人工衛星を捕捉することができないため、移動履歴データの取得間隔が長くなることがある。移動履歴データが長い時間欠落している場合には、ユーザがどこにいたかを推定することが難しくなる。そこで、データ接続分割部７１は、取得された移動履歴データにおいて、前後の取得時刻の間隔が所定の時間間隔（以下、欠落閾値時間という。）以上ある場合に、その間隔の前後で移動履歴データを分割する。ここで、欠落閾値時間は、例えば、５分、１０分、１時間などである。

データ異常除去部７２は、移動履歴データの明らかな異常を除去する処理を行う。例えば、ある時刻の位置のデータが、その前後の位置と１００ｍ以上も離れていて、跳躍している場合、その位置のデータは異常である。そこで、データ異常除去部７２は、ある時刻の位置のデータが、その前後の両方の位置と所定の距離以上離れている場合、その３次元データを移動履歴データから除去する。

再サンプリング処理部７３は、後段の処理部（学習メインプロセス部２３など）に適応する一定の時間間隔に移動履歴データをリサンプリングする。なお、取得される時間間隔が既に所望の時間間隔と一致する場合には、この処理は省略される。

また、取得される時間間隔が欠落閾値時間以上である場合には、データ接続分割部７１により、移動履歴データが分割されるが、欠落閾値時間未満のデータの欠落は残っている。そこで、再サンプリング処理部７３は、欠落閾値時間未満の欠落データを、リサンプリング後の時間間隔で線形補間により生成（穴埋め）する。

例えば、データ欠落の直前の時刻Ｔ_１における３次元データをｘ^real _Ｔ１、データ取得が復活した最初の時刻Ｔ_２における３次元データをｘ^real _Ｔ２とするとき、時刻Ｔ_１から時刻Ｔ_２までのデータ欠落中の時刻ｔの３次元データｘ^virtual _tは、次式（１）のように計算することができる。

また、再サンプリング処理部７３は、移動履歴データを構成する３次元データのそれぞれが、線形補間により生成された補間データであるか否かを示す補間フラグ（補間情報）の時系列データでなる補間フラグ系列データも生成する。

移動属性識別付与部７４は、移動履歴の３次元データそれぞれが、同一場所に滞在（停止）している”滞在状態”か、または、移動している”移動状態”のいずれであるかの移動属性を識別し、付与する。これにより、移動履歴データの各３次元データに移動属性が付与された、移動属性付き移動履歴データが生成される。

滞在状態加工部７５は、移動属性識別付与部７４から供給される移動属性付き移動履歴データに基づいて、移動属性が”滞在状態”の３次元データを加工する。より具体的には、滞在状態加工部７５は、”滞在状態”の移動属性が所定時間（以下、滞在閾値時間という。）以上継続している場合、その前後で移動履歴データを分割する。また、滞在状態加工部７５は、”滞在状態”の移動属性が滞在閾値時間未満で継続している場合には、その滞在閾値時間以内の所定時間続く、”滞在状態”の複数の３次元データの位置のデータをホールドする（同一位置のデータに修正する）。これにより、同一の目的地や経由地の移動履歴データに対して複数の”滞在状態”ノードが割り当てられることを防止することができる。換言すれば、同一の目的地や経由地を複数のノードで表現することを防止することができる。

以上のように構成される学習プリプロセス部２２から、後段の学習メインプロセス部２３および目的地経由地検出部２５には、所定の長さに分割された移動履歴データと、それに対応する補間フラグ系列データが供給される。

［学習プリプロセス部２２の処理］
図８は、学習プリプロセス部２２の移動属性識別付与部７４と滞在状態加工部７５の処理を概念的に示している。なお、図８の移動履歴データには補間データは含まれていないものとして、補間フラグ系列データは省略している。

図８上段に示される、再サンプリング処理部７３から供給された移動履歴データ８１に対して、移動属性識別付与部７４が、”滞在状態”または”移動状態”の移動属性を識別し、付与する。その結果、図８中段に示される、移動属性付き移動履歴データ８２が生成される。

図８中段の移動属性付き移動履歴データ８２において、”ｍ_１”および”ｍ_２”は、”移動状態”の移動属性を表し、”ｕ”は、”滞在状態”の移動属性を表す。なお、”ｍ_１”と”ｍ_２”は、同じ”移動状態”でも、移動手段（車、バス、電車、徒歩など）が異なる。

そして、図８中段の、移動属性付き移動履歴データ８２に対して、滞在状態加工部７５により、移動履歴データを分割およびホールドする処理が実行され、図８下段の、移動属性付き移動履歴データ８３（８３Ａおよび８３Ｂ）が生成される。

移動属性付き移動履歴データ８３では、移動属性付き移動履歴データ８２において２回目に発生した”移動状態”の箇所（３次元データ）で分割処理が行われ、移動属性付き移動履歴データ８３Ａと８３Ｂに分割されている。

分割処理では、最初に、移動属性付き移動履歴データ８２の２回目に発生した”移動状態”までと、それ以降の複数の３次元データとで分割され、２つの移動属性付き移動履歴データ８３Ａおよび８３Ｂとされる。次に、分割後の移動属性付き移動履歴データ８３Ａおよび８３Ｂのうち、時間的に早い移動属性付き移動履歴データ８３Ａの最後の滞在閾値時間以上の複数の”移動状態”の３次元データが、１つの”滞在状態”の３次元データにまとめられる。これにより、不要な移動履歴データが削除されるので、学習時間を短縮することができる。

なお、図８の例では、移動属性付き移動履歴データ８２の３回目に発生した” 複数の移動状態”の３次元データも滞在閾値時間以上の”移動状態”が続くデータであり、同様の分割処理が行われている。しかし、分割後の後ろの３次元データが存在しないため、滞在閾値時間以上の複数の”移動状態”の３次元データが、１つの”滞在状態”の３次元データにまとめられるのみとなっている。

一方、移動属性付き移動履歴データ８３Ａのうち、１回目の”移動状態”の移動履歴データでは、ホールド処理が実行されている。ホールド処理後は、３つの”移動状態”の３次元データ｛（ｔ_ｋ−１，ｘ_ｋ−１，ｙ_ｋ−１），（ｔ_ｋ，ｘ_ｋ，ｙ_ｋ），（ｔ_ｋ＋１，ｘ_ｋ＋１，ｙ_ｋ＋１）｝が、｛（ｔ_ｋ−１，ｘ_ｋ−１，ｙ_ｋ−１），（ｔ_ｋ，ｘ_ｋ−１，ｙ_ｋ−１），（ｔ_ｋ＋１，ｘ_ｋ−１，ｙ_ｋ−１）｝となっている。即ち、位置のデータが”移動状態”の最初の位置のデータに修正されている。なお、ホールド処理では、位置のデータは、”移動状態”の最初の位置のデータに変更するのではなく、位置の平均値、”移動状態”の期間の真ん中の時刻の位置のデータ等に変更してもよい。

図９は、学習プリプロセス部２２の再サンプリング処理部７３が行う、線形補間処理と補間フラグ系列データの生成について説明する図である。

図９上段に示される、移動履歴データ８４のうち、黒色で示される部分が、３次元データが取得できなかったデータ欠落部分である。

再サンプリング処理部７３は、移動履歴データ８４のデータ欠落部分を、線形補間により生成した補間データで穴埋めする。また、再サンプリング処理部７３は、移動履歴データを構成する３次元データそれぞれに、補間データであるか否かを示す補間フラグ（補間情報）を付与する。図９の例では、補間データの３次元データには”１”を、補間データではない３次元データには”０”を付した補間フラグ系列データが生成されている。

そして、補間処理後の移動履歴データ８５に対して、移動属性識別付与部７４により移動属性が付与される。このとき、移動属性識別付与部７４は、図９下段に示すように、補間データに対しては正確に移動属性を識別できないため、補間データの移動属性を”LOST”として、移動属性の識別をしていない。

［移動属性識別付与部７４の構成例］
図１０は、移動属性識別付与部７４の詳細構成例を示すブロック図である。

移動属性識別付与部７４は、移動速度演算部９１、移動属性識別部９２、および移動属性付与部９３により構成される。

移動速度演算部９１は、供給される移動履歴データから移動速度を演算する。

具体的には、一定の時間間隔でｋステップ目（ｋ個目）に得られるときの３次元データを、時刻ｔ_ｋ、経度ｙ_ｋ、緯度ｘ_ｋと表すと、ｋステップ目のｘ方向の移動速度ｖｘ_ｋおよびｙ方向の移動速度ｖｙ_ｋは、次式（２）により計算することができる。

式（２）では、緯度経度のデータをそのまま利用しているが、緯度経度を距離に変換したり、速度を時速や分速で表すように変換するなどの処理は、必要に応じて適宜行うことができる。

また、移動速度演算部９１は、式（２）で得られる移動速度ｖｘ_ｋおよびｖｙ_ｋからさらに、式（３）で表されるｋステップ目の移動速度ｖ_ｋと進行方向の変化θ_ｋを求め、これを利用することができる。

式（３）で表される移動速度ｖ_ｋと進行方向の変化θ_ｋを利用する方が、式（２）の移動速度ｖｘ_ｋおよびｖｙ_ｋよりも以下の点で、特徴をうまく取り出すことができる。

１．移動速度ｖｘ_ｋおよびｖｙ_ｋのデータの分布は、緯度経度軸に対して偏りが生じるため、同じ移動手段（電車や徒歩など）であっても角度が異なった場合に識別できない可能性があるが、移動速度ｖ_ｋであればそのような可能性が少ない。
２．移動速度の絶対的な大きさ（｜ｖ｜）だけで学習すると、機器のノイズによって生じる｜ｖ｜のため、徒歩と滞在を区別できない。進行方向の変化も考慮することで、ノイズの影響を軽減することができる。
３．移動している場合は進行方向の変化が少ないが、滞在している場合は進行方向が定まらないので、進行方向の変化を使うと移動と滞在の識別がしやすい。

以上の理由から、本実施の形態では、移動速度演算部９１は、移動速度のデータとして、式（３）で表される移動速度ｖ_ｋと進行方向の変化θ_ｋを求め、移動属性識別部９２に供給する。

移動速度演算部９１は、移動速度ｖ_ｋと進行方向の変化θ_ｋの演算を行う前に、ノイズ成分を除去するため、移動平均によるフィルタリング処理（前処理）を行うことができる。

なお、センサデバイスのなかには、移動速度を出力できるものも存在する。そのようなセンサデバイスが採用されている場合、移動速度演算部９１を省略し、センサデバイスが出力する移動速度をそのまま利用することができる。以下では、進行方向の変化θ_ｋを、進行方向θ_ｋと略記する。

移動属性識別部９２は、供給される移動速度に基づいて移動属性を識別し、認識結果を移動属性付与部９３に供給する。より具体的には、移動属性識別部９２は、ユーザの行動状態（移動状態）を確率的状態遷移モデル（HMM）として学習し、学習により得られた確率的状態遷移モデルを用いて移動属性を識別する。移動属性としては、少なくとも”滞在状態”と”移動状態”が存在する必要がある。本実施の形態では、図１２等を参照して後述するように、移動属性識別部９２は、”移動状態”を、さらに徒歩、自転車、車など、複数の移動手段によって分類した移動属性を出力する。

移動属性付与部９３は、再サンプリング処理部７３からの、移動履歴データを構成する３次元データそれぞれに対し、移動属性識別部９２で認識された移動属性を付与し、移動属性付き移動履歴データを生成して、滞在状態加工部７５に出力する。

次に、図１１乃至図１８を参照して、移動属性識別部９２で使用される、ユーザの行動状態を表した確率的状態遷移モデルのパラメータの求め方について説明する。

［移動属性識別部９２の学習器の第１の構成例］
図１１は、カテゴリHMMにより、移動属性識別部９２で使用される確率的状態遷移モデルのパラメータを学習する学習器１００Aの構成例を示している。

カテゴリHMMでは、学習する教師データが予めどのカテゴリ（クラス）に属するデータであるのかが既知であり、カテゴリごとにHMMのパラメータが学習される。

学習器１００Aは、移動速度データ記憶部１０１、行動状態ラベリング部１０２、および行動状態学習部１０３により構成される。

移動速度データ記憶部１０１は、学習用データとしての移動速度の時系列データを記憶する。

行動状態ラベリング部１０２は、移動速度データ記憶部１０１から時系列に順次供給される移動速度のデータに対し、ユーザの行動状態をラベル（カテゴリ）として付与する。行動状態ラベリング部１０２は、移動速度のデータに行動状態が対応付けられたラベル済み移動速度データを行動状態学習部１０３に供給する。例えば、ｋステップ目の移動速度ｖ_ｋと進行方向θ_ｋに対して、行動状態を表すラベルMを付与したデータが行動状態学習部１０３に供給される。

行動状態学習部１０３は、行動状態ラベリング部１０２から供給されるラベル済み移動速度データを、カテゴリごとに分類し、カテゴリ単位で、ユーザ活動モデル（HMM）のパラメータを学習する。学習の結果得られたカテゴリ毎のパラメータは移動属性識別部９２に供給される。

［行動状態の分類例］
図１２は、行動状態をカテゴリごとに分類する場合の分類例を示している。

図１２に示されるように、まず、ユーザの行動状態は、滞在状態と移動状態に分類することができる。本実施の形態では、移動属性識別部９２が認識するユーザの行動状態としては、上述したように、少なくとも滞在状態と移動状態が存在する必要があるので、この２つに分類することは必須である。

さらに、移動状態は、移動手段によって、電車、車（バスなども含む）、自転車、徒歩に分類することができる。電車は、さらに、特急、快速、ローカルなどに分類することができ、車は、さらに、高速、一般道などに分類することができる。また、徒歩は、走る、普通、散歩などに分類することができる。

本実施の形態では、ユーザの行動状態を、図１２において斜線で示される“滞在”、“電車（快速）”、“電車（ローカル）”、“車（高速）”、“車（一般道）”、“自転車”、および“徒歩”に分類することとする。なお、“電車（特急）”は、学習用データが得られなかったため省略した。

なお、カテゴリの分類の仕方が図１２に示した例に限定されるものではないことは言うまでもない。また、移動手段による移動速度の変化はユーザによって大きく異なるものではないので、学習用データとしての移動速度の時系列データは、認識対象のユーザのものである必要はない。

［行動状態ラベリング部１０２の処理例］
次に、図１３および図１４を参照して、行動状態ラベリング部１０２の処理例について説明する。

図１３は、行動状態ラベリング部１０２に供給される移動速度の時系列データの例を示している。

図１３では、行動状態ラベリング部１０２から供給される移動速度のデータ（ｖ，θ）を、（ｔ，ｖ）および（ｔ，θ）の形で示している。図１３において、四角（■）のプロットは移動速度ｖを表し、丸（●）のプロットは進行方向θを表している。また、横軸は時間ｔを表し、右側の縦軸は進行方向θを、左側の縦軸は移動速度ｖを表す。

図１３の時間軸の下方に示されている“電車（ローカル）”、“徒歩”、“滞在”の文字は、説明のため付加したものである。図１３の時系列データの最初は、ユーザが電車（ローカル）で移動中である場合の移動速度のデータであり、次が“徒歩”で移動中である場合、その次が“滞在”である場合の移動速度のデータとなっている。

ユーザが“電車（ローカル）”で移動している場合、電車が駅で停車し、出発するとき加速し、再度減速して駅に停車することを繰り返すので、移動速度ｖのプロットが繰り返し上下に振れるという特徴が表れている。なお、電車が停止している場合でも移動速度が０になっていないのは、移動平均によるフィルタリング処理を行っているためである。

また、ユーザが“徒歩”で移動している場合と“滞在”している場合は、最も区別しにくい状態であるが、移動平均によるフィルタリング処理により、移動速度ｖに明らかな違いが見られる。また、“滞在”では、進行方向θが瞬時に大きく変化する特徴がみられ、“徒歩”との差別化が容易であることがわかる。このように、移動平均によるフィルタリング処理、および、ユーザの移動を移動速度ｖと進行方向θで表すことにより、“徒歩”と“滞在”の区別が容易になっていることがわかる。

なお、“電車（ローカル）”と“徒歩”の間の部分は、フィルタリング処理のため、行動の切り替わり点がはっきりしない部分である。

図１４は、図１３に示した時系列データに対して、ラベル付けを行う例を示している。

例えば、行動状態ラベリング部１０２は、図１３に示した移動速度のデータをディスプレイに表示する。そして、ユーザは、ディスプレイに表示された移動速度のデータのうち、ラベル付けをしたい部分を矩形の領域で囲む操作を、マウスなどにより行う。また、ユーザは、指定したデータに対して付与するラベルをキーボードなどから入力する。行動状態ラベリング部１０２は、ユーザによって指定された矩形領域に含まれる移動速度のデータに、入力されたラベルを付与することにより、ラベル付けを行う。

図１４では、“徒歩”に相当する部分の移動速度のデータを矩形の領域で指示した例が示されている。なお、このとき、フィルタリング処理のため、行動の切り替わり点がはっきりしない部分については、指示する領域に含めないようにすることができる。時系列データの長さは、行動の違いが時系列データに明確に出る長さから決める。例えば、２０ステップ（１５秒×２０ステップ＝３００秒）程度とすることができる。

［行動状態学習部１０３の構成例］
図１５は、図１１の行動状態学習部１０３の構成例を示すブロック図である。

行動状態学習部１０３は、分類部１２１とHMM学習部１２２_１乃至１２２_７により構成される。

分類部１２１は、行動状態ラベリング部１０２から供給されるラベル済み移動速度データのラベルを参照し、ラベルに対応するHMM学習部１２２_１乃至１２２_７のいずれかに供給する。即ち、行動状態学習部１０３では、ラベル（カテゴリ）ごとにHMM学習部１２２が用意されており、行動状態ラベリング部１０２から供給されるラベル済み移動速度データが、ラベルごとに分類されて、供給される。

HMM学習部１２２_１乃至１２２_７それぞれは、供給されるラベル済み移動速度データを用いて、学習モデル（HMM）を学習する。そして、HMM学習部１２２_１乃至１２２_７それぞれは、学習により得られるHMMのパラメータλを、図１０の移動属性識別部９２に供給する。

HMM学習部１２２_１は、ラベルが“滞在”である場合の、学習モデル（HMM）を学習する。HMM学習部１２２_２は、ラベルが“徒歩”である場合の、学習モデル（HMM）を学習する。HMM学習部１２２_３は、ラベルが“自転車”である場合の、学習モデル（HMM）を学習する。HMM学習部１２２_４は、ラベルが“電車（ローカル）”である場合の、学習モデル（HMM）を学習する。HMM学習部１２２_５は、ラベルが“車（一般道）”である場合の、学習モデル（HMM）を学習する。HMM学習部１２２_６は、ラベルが“電車（快速）”である場合の、学習モデル（HMM）を学習する。HMM学習部１２２_７は、ラベルが“車（高速）”である場合の、学習モデル（HMM）を学習する。

［移動属性識別部９２の第１の構成例］
図１６は、学習器１００Aで学習されたパラメータを利用する場合の移動属性識別部９２である、移動属性識別部９２Aの構成例を示すブロック図である。

移動属性識別部９２Aは、尤度計算部１４１_１乃至１４１_７と尤度比較部１４２とにより構成されている。

尤度計算部１４１_１は、HMM学習部１２２_１の学習により得られたパラメータを用いて、移動速度演算部９１（図１０）から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部１４１_１は、行動状態が“滞在”である尤度を計算する。

尤度計算部１４１_２は、HMM学習部１２２_２の学習により得られたパラメータを用いて、移動速度演算部９１から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部１４１_２は、行動状態が“徒歩”である尤度を計算する。

尤度計算部１４１_３は、HMM学習部１２２_３の学習により得られたパラメータを用いて、移動速度演算部９１から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部１４１_３は、行動状態が“自転車”である尤度を計算する。

尤度計算部１４１_４は、HMM学習部１２２_４の学習により得られたパラメータを用いて、移動速度演算部９１から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部１４１_４は、行動状態が“電車（ローカル）”である尤度を計算する。

尤度計算部１４１_５は、HMM学習部１２２_５の学習により得られたパラメータを用いて、移動速度演算部９１から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部１４１_５は、行動状態が“車（一般道）”である尤度を計算する。

尤度計算部１４１_６は、HMM学習部１２２_６の学習により得られたパラメータを用いて、移動速度演算部９１から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部１４１_６は、行動状態が“電車（快速）”である尤度を計算する。

尤度計算部１４１_７は、HMM学習部１２２_７の学習により得られたパラメータを用いて、移動速度演算部９１から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部１４１_７は、行動状態が“車（高速）”である尤度を計算する。

尤度比較部１４２は、尤度計算部１４１_１乃至１４１_７それぞれから供給される尤度を比較し、尤度の最も高い行動状態を選択し、移動属性として出力する。

［移動属性識別部９２の学習器の第２の構成例］
図１７は、マルチストリームHMMにより、移動属性識別部９２で使用されるユーザ活動モデルのパラメータを学習する学習器１００Bの構成例を示している。

学習器１００Bは、移動速度データ記憶部１０１、行動状態ラベリング部１６１、および行動状態学習部１６２により構成される。

行動状態ラベリング部１６１は、移動速度データ記憶部１０１から時系列に順次供給される移動速度のデータに対し、ユーザの行動状態をラベル（行動モード）として付与する。行動状態ラベリング部１６１は、移動速度の時系列データ（ｖ，θ）と、それと関連付けられた行動モードMの時系列データを行動状態学習部１６２に供給する。

行動状態学習部１６２は、マルチストリームHMMにより、ユーザの行動状態を学習する。

ここで、マルチストリームHMMは、通常のHMMと同様な遷移確率を有する状態ノードから、複数の異なる確率法則に従うデータが出力されるようなHMMである。マルチストリームHMMでは、パラメータλのうち、出力確率密度関数b_j(x)が時系列データごとに別々に用意される。マルチストリームHMMでは、異なる種類の時系列データ（ストリーム）を関連付けながら学習することができる。

行動状態学習部１６２には、連続量である移動速度ｖと進行方向θの時系列データと、離散量である行動モードMの時系列データが供給される。行動状態学習部１６２は、各状態ノードから出力される移動速度の分布パラメータと、行動モードの確率を学習する。学習により得られたマルチストリームHMMによれば、例えば、移動速度の時系列データから、現在の状態ノードが求められる。そして、求められた状態ノードから、行動モードを認識することができる。

カテゴリHMMを用いた第１の構成例では、HMMをカテゴリごとに７個用意する必要があるが、マルチストリームHMMでは１個のHMMで十分である。ただし、状態ノードの数は、第１の構成例において７個のカテゴリで使用された状態ノードの総数と同程度用意する必要がある。

［移動属性識別部９２の第２の構成例］
図１８は、学習器１００Bで学習されたパラメータを利用する場合の移動属性識別部９２である、移動属性識別部９２Bの構成例を示すブロック図である。

移動属性識別部９２Bは、状態ノード認識部１８１と行動モード認識部１８２により構成される。

状態ノード認識部１８１は、学習器１００Bで学習されたマルチストリームHMMのパラメータを用いて、移動速度演算部９１から供給される移動速度の時系列データから、マルチストリームHMMの状態ノードを認識する。状態ノード認識部１８１は、認識された現在の状態ノードのノード番号を行動モード認識部１８２に供給する。

行動モード認識部１８２は、状態ノード認識部１８１で認識された状態ノードで、最も確率の高い行動モードを、移動属性として出力する。

［学習プリプロセス部２２の処理］
図１９は、学習プリプロセス部２２による学習プリプロセス処理のフローチャートである。

学習プリプロセス処理では、最初に、ステップＳ１において、データ接続分割部７１が、移動履歴データの接続および分割の処理を行う。

ステップＳ２において、データ異常除去部７２が、移動履歴データの明らかな異常を除去する処理を行う。

ステップＳ３において、再サンプリング処理部７３が、取得時刻の時間間隔が滞在閾値時間未満の欠落データを、線形補間により生成する処理を行う。

ステップＳ４において、再サンプリング処理部７３が、移動履歴データを構成する各３次元データが線形補間により生成された補間データであるか否かに基づいて、補間フラグ系列データを生成する。

ステップＳ５において、移動属性識別付与部７４が、移動履歴の３次元データそれぞれに対し、”滞在状態”かまたは”移動状態”の移動属性を識別し、付与する。なお、線形補間により生成した３次元データには、”LOST”の移動属性が付与される。

ステップＳ６において、滞在状態加工部７５は、移動属性が”滞在状態”の３次元データを加工する。そして、滞在状態加工部７５は、加工処理後の移動履歴データを、補間フラグ系列データとともに、学習メインプロセス部２３に出力して、処理を終了する。

以上のように、学習プリプロセス部２２では、移動履歴データが、必要に応じて分割等された後、データ欠落部分に補間データが生成され、移動属性が識別される。そして、”滞在状態”の３次元データに加工処理（ホールド処理）が行われ、加工処理後の移動履歴データが、補間フラグ系列データとともに、学習メインプロセス部２３に供給される。

なお、上述した学習プリプロセス部２２の学習プリプロセス処理では、補間データに対しては”LOST”の移動属性を付与したが、補間処理を先に行っているので、補間データに対しても移動属性を識別して付与してもよい。

［学習メインプロセス部２３の詳細構成例］
図２０は、学習ブロック１１の学習メインプロセス部２３の詳細構成例を示すブロック図である。

学習メインプロセス部２３は、既知未知判定部２０１、新規モデル生成部２０２、新規モデル結合部２０３、パラメータ更新部２０４、および更新モデル整理部２０５により構成される。

学習プリプロセス部２２（図１）からの移動履歴データ及び補間フラグ系列データは、既知未知判定部２０１に供給される。また、少なくとも１回以上、学習メインプロセス部２３による学習が既に行われている場合、ユーザ別モデルパラメータ記憶部１２（図１）から、先の学習により得られたユーザ活動モデルのパラメータが、既存モデルのパラメータとして取得される。既存モデルのパラメータは、既知未知判定部２０１、新規モデル結合部２０３、およびパラメータ更新部２０４に供給される。

既知未知判定部２０１は、学習プリプロセス部２２から供給された移動履歴データが既知の経路の移動履歴データであるか否かを判定する。なお、２回目以降の学習では、供給された移動履歴データの一部が未知の経路の移動履歴データで、残りの一部が既知の経路の移動履歴データとなっていることもある。既知未知判定部２０１は、既知と判定された移動履歴データについては、移動履歴データの各３次元データが既存モデルのどの状態ノードに相当するか推定する。そして、既知未知判定部２０１は、既知の移動履歴データと、それに対応するノード系列データをパラメータ更新部２０４に供給する。

一方、既知未知判定部２０１は、供給された移動履歴データが未知の経路の移動履歴データであると判定した場合、未知の経路の移動履歴データを新規モデル生成部２０２に供給する。また、未知の経路の移動履歴データが既知の経路の移動履歴データと接続されている場合、既知未知判定部２０１は、未知の経路の移動履歴データの接続先となる、前後の既知の移動履歴データに対応する既存モデルの状態ノードを新規モデル生成部２０２に供給する。なお、未知の移動履歴データの後の既存モデルの状態ノードが存在しない場合、例えば、既知の経路から未知の経路を通って未知の目的地へ到達し、戻ってくるような場合には、前の既存モデルの状態ノードのみが新規モデル生成部２０２に供給される。

１回目の学習では、学習プリプロセス部２２から供給された移動履歴データすべてが未知の移動履歴データとして新規モデル生成部２０２に供給される。また、１回目の学習では、前後の既存モデルの状態ノードは存在しないので、新規モデル生成部２０２への供給はない。

新規モデル生成部２０２は、既知未知判定部２０１から供給された未知の移動履歴データを用いてユーザ活動モデルを学習する。即ち、新規モデル生成部２０２は、未知の移動履歴データを確率的状態遷移モデルでモデル化したときのパラメータを求め、新規モデル結合部２０３に供給する。ここで学習されたユーザ活動モデルが、先の学習により得られている既存モデルとは別の、新規モデルとなる。なお、１回目の学習と２回目以降の学習は、学習対象の未知の移動履歴データのデータ量が異なるのみであり、同一の学習により、ユーザ活動モデルのパラメータを求めることができる。

新規モデル生成部２０２は、学習により得られた新規モデルのパラメータを、新規モデル結合部２０３に供給する。また、新規モデル生成部２０２は、前後の既存モデルの状態ノードが既知未知判定部２０１から供給された場合には、その前後の既存モデルの状態ノードも、新規モデル結合部２０３に供給する。

新規モデル結合部２０３は、２回目以降の学習において、未知の移動履歴データに基づいて、先の学習により得られている既存モデルを更新する。即ち、新規モデル結合部２０３は、未知の移動履歴データの前後の既存モデルの状態ノードに基づいて、既存モデルに、新規モデル生成部２０２からの新規モデルを結合し、更新後のユーザ活動モデルを生成する。新規モデル結合部２０３により更新されたユーザ活動モデルは、未知の移動履歴データに応じて状態ノードが追加されたトポロジー更新モデルである。

なお、新規モデル結合部２０３において、新規モデル生成部２０２からの新規モデルと結合される既存モデルは、学習メインプロセス部２３に供給された移動履歴データに既知の経路の移動履歴データが全く含まれていない場合には、ユーザ別モデルパラメータ記憶部１２（図１）から取得された既存モデルとなる。一方、学習メインプロセス部２３に供給された移動履歴データに既知の経路の移動履歴データが一部含まれている場合には、新規モデルと結合される既存モデルは、パラメータ更新部２０４で更新された既存モデルとなる。

パラメータ更新部２０４は、既知の移動履歴データと、それに対応するノード系列データに基づいて、先の学習により得られている既存モデルを更新する。更新された既存モデルのパラメータは、新規モデル結合部２０３と更新モデル整理部２０５に出力される。パラメータ更新部２０４による更新では、上述したように状態ノードの追加はない。

更新モデル整理部２０５は、新規モデル結合部２０３により更新されたトポロジー更新モデル、または、パラメータ更新部２０４により更新されたパラメータ更新モデルのなかで、自己遷移のみで、他の状態ノードからの遷移が無い状態ノードを消去し、更新モデルを整理する。整理後の更新モデルのパラメータが、学習（更新学習）により得られたユーザ活動モデルのパラメータとして、学習ポストプロセス部２４とユーザ別モデルパラメータ記憶部１２に供給される。

［既知未知判定部２０１の詳細構成例］
次に、既知未知判定部２０１の詳細についてさらに説明する。

図２１は、既知未知判定部２０１の詳細な構成例を示すブロック図である。

学習メインプロセス部２３によって、少なくとも１回は学習処理が実行されている場合、既存モデルのパラメータがユーザ別モデルパラメータ記憶部１２（図１）から既存モデル構築部２２１に供給される。既存モデル構築部２２１は、供給された既存モデルのパラメータに基づいて、既存モデルを構築し、未知状態ノード追加部２２２に供給する。

なお、１回も学習処理が実行されていない状態においては、既存モデル構築部２２１には、既存モデルの初期パラメータが予め設定されている。既存モデルの初期パラメータは、ノード数が１で、その１個の状態ノードの遷移確率が自己遷移のみ、中心値が３次元データ（時刻、経度、緯度）の取り得る範囲外の値、分散値が分散最小値、ノード頻度が１に設定されている。少なくとも１回の学習処理が実行され、ユーザ別モデルパラメータ記憶部１２（図１）から既存モデルのパラメータが供給されることで、既存モデルの初期パラメータが上書きされ、消去される。

未知状態ノード追加部２２２は、既存モデル構築部２２１で構築された既存モデルに、未知の移動履歴データを引き受ける一つの状態ノード（以下、未知状態ノードと称する。）を追加する。これにより、既存モデルに１つの状態ノードが追加された学習モデル（以下、未知状態追加モデルと称する。）が構築され、状態ノード推定部２２３に供給される。

状態ノード推定部２２３は、未知状態ノード追加部２２２から供給された未知状態追加モデルを用いたビタビアルゴリズムにより、供給された移動履歴データの各３次元データに対応する未知状態追加モデルの状態ノードを推定する。未知状態追加モデルには、未知の移動履歴データを引き受ける１つのノードが追加されているので、入力された移動履歴データが未知の移動履歴データであっても、ビタビ推定が破綻なく行われる。仮に、移動履歴データを引き受ける１つのノードが追加されていない場合には、未知の移動履歴データに対しては、対応する状態ノードが見つからず、ビタビ推定が破綻する。

サンプル別尤度計算部２２４は、既知未知判定に用いる指標としての観測尤度の期待値を計算する。時刻ｔにおける観測尤度の期待値はL(t)で求められる。移動履歴データが既知の経路のデータである場合、観測尤度の期待値L(t)は大きくなり、移動履歴データが未知の経路のデータである場合、観測尤度の期待値L(t)は小さくなる。

既知未知判定部２２６は、観測尤度の期待値L(t)の時系列データ（観測尤度系列データ）に対して、既知未知モデル記憶部２２５に記憶されている、既知未知の二状態モデルを用いたビタビ判定を行うことで、既知または未知の判定を行う。

既知未知ポスト処理部２２７は、状態ノード推定部２２３が未知と推定した状態ノードで、既知未知判定部２２６が既知と判定したものを、未知に修正する。即ち、未知の判定は、状態ノード推定部２２３による推定結果が優先される。

また、既知未知ポスト処理部２２７は、修正後の判定結果を参照して学習プリプロセス部２２（図１）から供給される移動履歴データを、新規モデル生成部２０２またはパラメータ更新部２０４に出力する。即ち、既知未知ポスト処理部２２７は、判定結果が既知である移動履歴データを、それに対応するノード系列データとともにパラメータ更新部２０４（図１９）に供給する。一方、既知未知ポスト処理部２２７は、判定結果が未知である移動履歴データを、新規モデル生成部２０２に供給する。未知の移動履歴データが既知の移動履歴データと接続されている場合には、既知未知ポスト処理部２２７は、未知の移動履歴データの接続先となる、前後の既知の移動履歴データに対応する既存モデルの状態ノードも新規モデル生成部２０２に供給する。

［未知状態追加モデルの構築処理］
図２２のフローチャートを参照して、未知状態ノード追加部２２２による未知状態追加モデルの構築処理について説明する。

初めに、ステップＳ２１において、未知状態ノード追加部２２２は、未知状態追加モデルの各状態ノードの初期確率を格納した、未知状態追加モデルの初期確率テーブルを生成する。

初期確率テーブルは、図２３に示すように、既存モデルのM個の状態ノードに未知の移動履歴データを引き受ける１個の状態ノードを追加した（M+１）行１列のテーブルで、各状態ノードの初期確率は、例えば、等確率の１／（M+１）に設定される。

ステップＳ２２において、未知状態ノード追加部２２２は、未知状態追加モデルの各状態ノードの遷移確率を格納した、未知状態追加モデルの遷移確率テーブルを生成する。

遷移確率テーブルは、図２４に示すように、（M+１）行（M+１）列のテーブルで構成される。遷移確率テーブルでは、第１行第１列乃至第M行第M列の既存モデルの各状態間の状態遷移確率a_ijに（１−eps）が乗算される。また、遷移確率テーブルの第（M+１）列の各要素には、一番下の（M+１）行を除いて、epsが設定され、第（M+１）行の各要素には、一番下の（M+１）行を除いて、epsが設定される。ここで、epsは、例えば、1.0E-8程度の、１より十分小さい所定の値であり、既存モデルの状態ノード間の遷移確率のどれよりも低い。この未知状態追加モデルでは、既存モデルの各状態ノードから未知状態ノードへの遷移確率がepsで、未知状態ノードから既存モデルの各状態ノードへの遷移確率もepsに設定されたことを表す。また、第（M+１）行第（M+１）列の要素は未知状態ノードの自己遷移確率を表し、（１−M×eps）である。図２４の未知状態追加モデルでは、各行の総和が１となる。

ステップＳ２３において、未知状態ノード追加部２２２は、未知状態追加モデルの各状態ノードの観測確率の中心値μ_si（ｄ）を格納した、未知状態追加モデルの中心値テーブルを生成する。

図２５は、ステップＳ２３で生成される未知状態追加モデルの中心値テーブルを示している。未知状態追加モデルの中心値テーブルの列数は、移動履歴データの次元数Dに対応し、行数は状態ノードの数に対応する。従って、本実施の形態では、未知状態追加モデルの中心値テーブルは、（M+１）行３列で構成される。そして、未知状態追加モデルの中心値テーブルは、既存モデルのM行D列の中心値テーブルに、第（M+１）行目として、未知状態ノードの中心値μ_sM+1（１）＝E１，μ_sM+1（２）＝E２，μ_sM+1（３）＝E３の１行が追加された形となっている。

ここで、E１，E２，E３それぞれには、任意の値を設定することができる。例えば、E１は、時刻の取り得る値（０時から２４時）の中心値である「１２」、E２およびE３は、緯度、経度の取り得る値（−１８０から１８０まで）の中心値である０とすることができる。また例えば、E１、E２、およびE３それぞれは、既存モデルのM個の中心値μ_s１（ｄ）乃至μ_sM（ｄ）の平均値とすることができる。

ステップＳ２４において、未知状態ノード追加部２２２は、未知状態追加モデルの各状態ノードの観測確率の分散値σ_si（ｄ）’²を格納した、未知状態追加モデルの分散値テーブルを生成する。

図２６は、ステップＳ２４で生成される未知状態追加モデルの分散値テーブルを示している。未知状態追加モデルの分散値テーブルの列数は、移動履歴データの次元数Dに対応し、行数は状態ノードの数に対応する。従って、本実施の形態では、未知状態追加モデルの分散値テーブルは、（M+１）行３列で構成される。そして、未知状態追加モデルの分散値テーブルは、既存モデルのM行D列の分散値テーブルに、第（M+１）行目として、未知状態ノードの分散値σ_sM+1（１）^２＝V１，σ_sM+1（２）^２＝V２，σ_sM+1（３）^２＝V３の１行が追加された形となっている。

ここで、V１，V２，V３それぞれには、任意の値を設定することができるが大きい値であることが望ましい。例えば、V１は、０時から２４時の取り得る範囲を網羅できるように、「１２」の二乗より大きい値に設定する。V２およびV３は、−１８０から１８０までの緯度、経度の取り得る範囲を網羅できるように、１８０の二乗より大きい値に設定する。

以上の処理により、未知状態追加モデルの各パラメータが設定され、未知状態追加モデルが構築される。

[状態ノード推定部２２３の処理]
次に、状態ノード推定部２２３の処理について説明する。

状態ノード推定部２２３は、未知状態ノード追加部２２２から供給された未知状態追加モデルを用いたビタビアルゴリズムにより、供給された移動履歴データの各３次元データに対応する未知状態追加モデルの状態ノードを推定する。換言すれば、状態ノード推定部２２３は、ビタビアルゴリズムにより、各時刻の状態ノードの確率を取得する。

ビタビアルゴリズムは、時系列データの各時刻における観測確率とモデルの遷移確率を用いて、各時刻の状態ノードの確率を算出し、また、最も尤度が高くなるような状態遷移の系列（状態ノード系列）を算出するアルゴリズムである。

時刻ｔにおける状態ノードs_iの確率δ（s_i，ｔ）は、次式（４）及び（５）により、逐次的に求められる。

式（４）は、時刻ｔ＝０では、どの状態も等しい確率で出現していたことを仮定している。（Ｍ＋１）は、未知状態ノードが追加された後の全状態の個数である。式（５）のａ_ｉｊは、状態ノードs_iからs_jへの遷移確率である。また、Ｐ（ｏ_ｔ−１｜s_i）は、時刻ｔ−１に状態ノードs_iから３次元データｏが観測される確率である。より具体的には、状態ノードs_iに対して決められたパラメータμ_i、σ_iをそれぞれ中心、分散とする正規分布の確率密度である。式（５）は、状態ノードs_jに関する規格化は省略されている。

ビタビアルゴリズムでは、式（５）において、状態ノードs_jに至るいくつかの状態ノードs_iの中で、式（５）の関数内の値が最大になる状態ノードs_iが選ばれる。その状態ノードs_i（s_imax）が各時刻ｔの各状態ノードs_jに対して記憶される。

そして、時系列の最後の時刻ｔについて式（５）を満たす状態ノードs_iが選ばれた後、次式（６）を、時系列を逆向きにたどっていくことで、最も尤度の高い状態ノード系列が算出される。

以上の一般的なビタビアルゴリズムに対し、状態ノード推定部２２３では、時系列データの各時刻における観測確率に、次式（７）を採用する。換言すれば、式（５）及び式（６）のＰ（ｏ_ｔ−１｜s_i）として、次式（７）が採用される。

ここで、e_tは、時刻ｔに観測される３次元データo_tが補間データであるときの誤差（仮想誤差）であり、式（７）は、予測システム１がその誤差範囲を出力しているのであれば、その値を直接的に用いるものである。仮想誤差e_tは、例えば、次式（８）で計算することができる。

式（８）は、仮想誤差e_tが、補間データｘ_ｔと、データ欠落直前の時刻Ｔ_１における３次元データｘ^real _Ｔ１との間の距離か、または、補間データｘ_ｔと、データ復活直後の時刻Ｔ_２における３次元データｘ^real _Ｔ２との間の距離のいずれか小さい方とされることを表す。

図２７は、式（８）で計算される仮想誤差e_tのイメージ図である。

図２７において、破線の矢印が実際の移動経路を示し、楕円形の破線はパラメータμ_i、σ_iで表される状態ノードs_iを示している。

また、図２７では、時刻ｔ_２１から時刻ｔ_３３までの３次元データ（移動履歴データ）ｘ_２１乃至ｘ_３３が図示されている。このうち、白抜きの星印（☆）で示される３次元データｘ_２１乃至ｘ_２４及びｘ_３０乃至ｘ_３３はセンサデバイスで実際に取得された実データである。

一方、黒の星印（★）で示される３次元データｘ^virtual _２５乃至ｘ^virtual _２９は、データ欠落部分であって線形補間により生成された補間データである。この補間データｘ^virtual _２５乃至ｘ^virtual _２９に対して、式（８）で計算された仮想誤差e_２５乃至e_２９が太線の円で示されている。

式（８）では、実データから離れるほど、仮想誤差e_tが大きく設定される。

取得すべき時系列データ（３次元データ）が欠落していると、欠落した時刻ｔにおける状態ノードs_iの確率δ（s_i，ｔ）が生成できないので、ビタビアルゴリズムが実行できないことになる。しかし、欠落した３次元データを線形補間したデータで埋めることで、状態ノードs_iの確率δ（s_i，ｔ）が生成できない問題自体は解決できる。

しかしながら、線形補間でデータ自体は存在しても、その生成したデータが正しい経路からずれていて、確率モデル（学習モデル）で表現しきれない場合が考えられる。つまり、線形補間で生成したデータは、確率モデル中のどの状態ノードs_iにも近くないため、観測確率Ｐ（ｏ_ｔ−１｜s_i）がどの状態ノードでも小さい（指数関数的に小さい）値になってしまう場合が考えられる。その結果、最尤状態遷移を選択できず、ビタビアルゴリズムが破綻して状態ノード系列そのものを出力することも出来なくなってしまう。

このことは、図２７の例において、補間データｘ^virtual _２５乃至ｘ^virtual _２９が実際の移動経路から離れているのみならず、行動モデルを表した状態ノードの楕円からも大きく外れていることからもわかる。

そこで、状態ノード推定部２２３は、補間された３次元データｘ_ｔに対して仮想誤差e_tを計算し、式（７）の仮想誤差e_tを用いた観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）を採用している。この結果、仮に線形補間による補間データｏ_ｔが、実際に該当する状態ノードs_iの中心μ_iから大きく離れていたとしても、そのときの仮想誤差ｅ_ｔが大きいので、式（７）の指数関数内の値の絶対値は小さくなる。その結果、線形補間による補間データｏ_ｔが実際の状態ノードs_iの中心μ_iから大きく外れていても、指数関数的に小さくなることはないので、データ欠落部分に関する最尤状態遷移を推定することができるようになっている。

図２７の例においては、仮想誤差e_tを用いる効果は、仮想誤差e_tが示す円が実際の移動経路に対応する状態ノードの楕円に入ってきていることで表されている。

なお、上述した例では、仮想誤差e_tをデータ欠落前後の実データに基づく式（８）により求めたが、仮想誤差e_tの計算方法はこれに限定されるものではない。

[サンプル別尤度計算部２２４の観測尤度の計算]
次に、サンプル別尤度計算部２２４が行う観測尤度の計算について説明する。

サンプル別尤度計算部２２４は、既知未知判定に用いる指標としての観測尤度の期待値L(t)を計算する。観測尤度の期待値L(t)は、ビタビ推定された状態ノードの尤度を表す次式（９）により計算することができる。

また、観測尤度の期待値L(t)は、計算速度、作業メモリなどの計算リソースを節約する目的で、式（９）を変更した式（１０）を用いてもよい。式（１０）は、ビタビ推定された状態ノードの尤度の期待値と言える。

式（９）、及び、式（１０）に含まれる観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）は、上述した式（７）で計算されるものである。しかしながら、式（７）の観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）は、分母に通常の分散σ_i ^２の他に、仮想誤差e_t ^２が加算されているため、通常の値よりもかなり大きくなる。換言すれば、データ欠落部分の観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）は、３次元データが状態ノードの分布範囲内にある場合には、むしろ小さくなる傾向にある。

その結果、データ欠落部分の３次元データに対して、本来は適合する状態ノードがあったとしても、観測尤度の期待値L(t)が小さくなり、未知と判定されてしまう事態が発生する。

そこで、サンプル別尤度計算部２２４は、本来、既知であるデータ欠落部分の観測尤度の期待値L(t)が未知と判定されないようにするための補正を行う。換言すれば、サンプル別尤度計算部２２４は、データ欠落部分については実データよりも観測尤度が大きくなるように補正した観測尤度を採用する。

例えば、サンプル別尤度計算部２２４は、式（１０）に代えて、次式（１１）で表される観測尤度の期待値L1(t)を計算する。式（１１）の観測尤度の期待値L1(t)は、仮想誤差e_t ^２があることで観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）が小さく作用する分母の仮想誤差e_t ^２が省略された形となっている。

あるいは、サンプル別尤度計算部２２４は、上述した式（９）または式（１０）に、仮想誤差e_tに対して単調増加の補正項（ａ＋ｂ・e_t）を乗算したものを採用する。即ち、サンプル別尤度計算部２２４は、式（１２）または式（１３）で表される観測尤度の期待値L2(t)またはL3(t)を用いる。

式（９）や式（１０）の代わりに、式（１１）乃至式（１３）のいずれかの観測尤度の期待値を使用することで、仮想誤差e_tによって観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）が低下しても、未知と判定されにくくすることができる。以下において、観測尤度の期待値L1(t)乃至L3(t)を特に区別しない場合には、観測尤度の期待値L(t)’と記述する。

式（１１）乃至式（１３）のいずれかにより計算される観測尤度の期待値L(t)’は、未知状態追加モデルが観測データを十分に説明できるのであれば大きくなる。一方、未知状態追加モデルが観測データを十分に説明できない場合と、観測データが未知状態ノードで説明される場合には、観測尤度の期待値L(t)’は小さくなる。従って、観測尤度の期待値L(t)’の大きさで、既知または未知の判定を行うことができる。なお、以下では、観測尤度の期待値L(t)’を、単に、観測尤度L(t)’と称する。

[サンプル別尤度計算部２２４の観測尤度計算処理]
図２８は、サンプル別尤度計算部２２４による観測尤度計算処理のフローチャートである。

初めに、ステップＳ３１において、サンプル別尤度計算部２２４は、データ欠落部分の観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）を状態ノードごとに算出する。

ステップＳ３２において、サンプル別尤度計算部２２４は、状態ノードごとの観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）と確率δ（s_i，ｔ）から、状態ノードs_iに関する観測尤度L(t)を求める。ここでは、状態ノードs_iに関する観測尤度L(t)として、例えば、式（９）で表される観測尤度L(t)を求めることとする。

ステップＳ３３において、サンプル別尤度計算部２２４は、式（９）で表される観測尤度L(t)に補正項（ａ＋ｂe_t）を乗算することにより、観測尤度L(t)’＝L2(t)を求める。得られた観測尤度L(t)’は、後段の既知未知判定部２２６に供給され、処理は終了する。

[既知未知判定部２２６の既知未知判定処理]
次に、図２９のフローチャートを参照して、サンプル別尤度計算部２２４で計算された観測尤度L(t)’を用いて既知または未知の判定を行う、既知未知判定部２２６の既知未知判定処理について説明する。

初めに、ステップＳ４１において、既知未知判定部２２６は、ノード系列データに対応する観測尤度L(t)’の時系列データを、サンプル別尤度計算部２２４から取得する。そして、既知未知判定部２２６は、観測尤度L(t)’の時系列データのそれぞれを、対数尤度logL(t)’に変換する。即ち、既知未知判定部２２６は、各時刻ｔの観測尤度L(t)’の対数を計算する。

ステップＳ４２において、既知未知判定部２２６は、対数尤度logL(t)’を飽和させた飽和対数尤度を求める処理を行う。具体的には、既知未知判定部２２６は、対数尤度logL(t)’から、所定のオフセット（閾値）を減算して所定の値で除算した結果を、tanh関数に入力することで、対数尤度logL(t)’を飽和させる。ステップＳ４１およびＳ４２の処理により、観測尤度L(t)’が、−１から１までの範囲を取るパラメータに変換される。

ステップＳ４３において、既知未知判定部２２６は、既知と未知の二状態で構成されるHMMを用いてビタビ判定を行うことにより、飽和対数尤度に対し既知未知判定を行う。

既知状態と未知状態の二状態で構成されるHMMは、次式（１４）で表される。

即ち、既知状態と未知状態の初期確率πはともに同確率（0.5）である。また、ユーザの移動履歴を考えた場合、既知状態と未知状態が頻繁に入れ替わることは考えにくく、既知の経路を移動している場合も未知の経路を移動している場合も切り替わった後はある程度連続して続くと考えられる。従って、遷移確率Ａは、１より非常に小さいな所定の値をεとして、既知状態と未知状態のそれぞれで自己遷移する確率が大きくなるように設定される。観測確率としては、既知状態が１、未知状態が−１を中心に分布し、分散値として１が設定されている。

[新規モデル生成部２０２の詳細構成例]
次に、新規モデル生成部２０２の詳細について説明する。

図３０は、新規モデル生成部２０２の詳細な構成例を示すブロック図である。

新規モデル生成部２０２は、新規モデル初期化部２４１、新規モデル制約部２４２、新規モデル学習部２４３、ノード系列判定部２４４、パラメータ再計算部２４５、および新規モデル整理部２４６により構成される。

新規モデル生成部２０２には、既知未知判定部２０１から、未知の移動履歴データが供給される。また、未知の移動履歴データが既知の移動履歴データと接続されている場合には、未知の移動履歴データの前後の既存モデルの状態ノードも供給される。既知未知判定部２０１から供給される未知の移動履歴データと前後の既存モデルの状態ノードは、新規モデル生成部２０２の各部が必要に応じて取得することができる。

新規モデル初期化部２４１は、供給された未知の移動履歴データのサンプル数と同数の状態ノード数のHMMを、新規モデルとして宣言する（メモリ確保して生成する）。

新規モデル制約部２４２は、新規モデル初期化部２４１で宣言した新規モデルに、left-to-rightの制約を設定する。これは、一回の移動行動は、強い一方向性の制約があること、また、仮に移動方向に一方向性がなくても、時間は常に一方向性があることによる。

新規モデル学習部２４３は、未知の移動履歴データを用いて新規モデルを学習する。即ち、新規モデル学習部２４３は、既知未知判定部２０１から供給された未知の移動履歴データを用いて、新規モデルを表すleft-to-rightの制約が与えられたHMMのパラメータを求める。

ノード系列判定部２４４は、新規モデル学習部２４３の学習により得られた新規モデルを用いて、未知の移動履歴データの３次元データそれぞれを、新規モデルの状態ノードs_iに変換したノード系列データを生成し、パラメータ再計算部２４５に供給する。具体的には、ノード系列判定部２４４は、新規モデル学習部２４３から供給されたパラメータに基づく新規モデルから、入力されたユーザの時刻、緯度、および経度に対応するユーザの現在の状態ノードs_iを認識する処理を、未知の移動履歴データの最初のステップから最後のステップまで繰り返す。

パラメータ再計算部２４５は、ノード系列判定部２４４から供給されるノード系列データを基に、移動履歴データのHMMのパラメータに対応するノード系列データのパラメータを計算する。即ち、パラメータ再計算部２４５は、未知の移動履歴データのHMMの初期確率π_i、状態遷移確率a_ij、および観測確率（中心値μ_iと分散値σ_i ^２）に対応する、ノード系列データの初期確率<π_i>、状態遷移確率<a_ij>、および観測確率（中心値<μ_i>と分散値<σ_i ^２>）を計算する。以下において、”< >”で囲まれた初期確率π_i、状態遷移確率a_ij、および観測確率（中心値μ_iと分散値σ_i ^２）は、ノード系列データで再計算されたパラメータを表す。

また、パラメータ再計算部２４５は、各状態遷移の遷移頻度<trans_cnt_ｉｊ>と各状態ノードs_iの状態頻度<cnt_all_i>と状態初期頻度<cnt_start_i>を計算しておく。

ここで、遷移頻度<trans_cnt_ｉｊ>は、状態ノードs_iから状態ノードs_jに遷移する頻度（カウント値）を表し、ｉ＝１乃至N，ｊ＝１乃至N（Nは、時系列データの最後のノード番号（＝ノード数））である。状態頻度<cnt_all_i>は、全てのノード系列データにおける状態ノードs_iの総数であり、状態初期頻度<cnt_start_i>は、ノード系列データの先頭が状態ノードs_iである個数である。

一般に、更新後の初期確率π_{i_update}、状態遷移確率a_{ij_update}、および観測確率の中心値μ_{i_update}と分散値σ_{i_update} ^２は、次のように表すことができる。

π_{i_current}、a_{ij_current}、並びにμ_{i_current}及びσ_{i_current} ^２は、既存のノード系列データの状態ノードｓ_iの初期確率、状態遷移確率、並びに観測確率の中心値および分散値である。また、π_{i_new}、a_{ij_new}、並びにμ_{i_new}及びσ_{i_new} ^２は、追加分のノード系列データの状態ノードｓ_iの初期確率、状態遷移確率、並びに観測確率の中心値および分散値である。ｎ_{i_current}とｎ_{i_new}は、ノード系列データの状態ノードｓ_iの既存部分のノード数と追加部分のノード数である。

従って、パラメータ再計算部２４５が各状態遷移の遷移頻度<trans_cnt_ｉｊ>と各状態ノードs_iの状態頻度<cnt_all_i>と状態初期頻度<cnt_start_i>を計算して記憶しておくことで、次の更新の計算が容易になる。

なお、頻度を計算して記憶する代わりに、頻度を確率的にカウントして、非整数の成分を扱ってもよい。さらに、頻度の代わりに、頻度×平均値、頻度×分散値のようなパラメータを記憶してもよい。

パラメータ再計算部２４５は、状態初期頻度<cnt_start_i>とともに、ノード系列判定部２４４から供給されるノード系列データの総数であるノード系列データ数<seq_cnt>も計算しておく。

新規モデル整理部２４６は、新規モデル初期化部２４１が宣言した新規モデルとしてのHMMの各状態ノードs_iのなかで、使用されない状態ノードを消去することで、新規モデルを整理する。具体的には、新規モデル整理部２４６は、パラメータ再計算部２４５で計算された状態頻度<cnt_all_i>が０の状態ノードs_iを消去する。新規モデル整理部２４６により整理された後の新規モデル（のパラメータ）が、新規モデル結合部２０３に出力される。また、未知の移動履歴データの前後の既存モデルの状態ノードも既知未知判定部２０１から供給されていた場合には、それも、併せて新規モデル結合部２０３に出力される。

[新規モデル学習部２４３の学習処理]
次に、図３１乃至図３４を参照して、新規モデル学習部２４３の学習処理について説明する。

初めに、図３１および図３２を参照して、通常のHMMによる学習モデルと、新規モデル学習部２４３が行う学習モデルの違いについて説明する。

ユーザの移動履歴をHMMのように離散状態でモデル化する場合、通常、移動経路を一定の時間間隔でサンプルしたデータをモデル化する。移動履歴のデータを取得する際に、省電力の要請などの理由からサンプリング間隔を細かくできず、十分なサンプルが得られない場合、サンプル数とノード数があまり変わらないか、ノード数に比べてサンプル数が少ない状況が起こり得る。このような状況で、観測されるデータが所定の位置の周囲に正規分布する状態ノードを仮定する場合、一つのサンプルを一つのノードでモデル化することがある。この場合、ノードの分散値は非常に小さい値（あるいは０）に収束し、サンプルの近傍はモデル化されないことになる。従って、サンプリングされたサンプル間の経路はモデル化されない。

図３１は、移動履歴を通常のHMMによりモデル化したときの概念図を示している。図３１の直線（線分）はユーザの実際の移動経路を示し、バツ印（×）が移動履歴データとして取得されたサンプル、サンプルを囲む丸（○）がノードを示している。

図３１に示すように、近くにサンプルが得られなかった場所（領域）はモデル化されないので、例えば、電車のような速い移動速度で移動しているような場合、サンプルとサンプルの間の経路はモデル化されない。一方、徒歩のような遅い移動速度で移動している場合、一つのノードで複数のサンプルをモデル化する場合がある。このような場合には、移動履歴をノードで適切に表現できていないことがある。

また、同一の移動経路を二回通過した場合に、ノードの分散値が非常に小さい値（あるいは０）に収束していると、二回目の通過した位置は、一回目の通過のときに表現されたノードでモデル化されず、異なるノードが割り当てられることがある。

このような問題を回避するためには、ノードの分散値に下限を設定し、サンプルから所定の領域の経路を必ずモデル化するようにさせることが考えられる。

しかし、分散値を大きくすると、異なる経路を同一の経路とみなす可能性も高くなる。例えば、平行に進む異なる経路を同一の経路とみなすおそれが生じる。さらに、分散値を大きくすると、移動速度の遅いときの移動履歴データを高い精度で再現することが難しくなる。逆に、分散値が小さくしすぎると、移動速度が速いときの移動履歴データを同一の経路と認識できなくなる。実際の移動履歴データのサンプルは、移動速度の違いで様々な距離感覚となるため、全てに適したノードの分散値の下限を決定するのは困難である。

そこで、新規モデル学習部２４３は、図３２に示すように、一つの状態ノードが連続するサンプル二つ分を必ず反映するようなモデルを仮定することで、サンプルとサンプルの間の経路をモデル化する。新規モデル全体では、新規モデル学習部２４３は、各ノードが二つの連続するサンプルを順次つないだモデル化を行う。これにより、鎖で繋がれるように、経路全体の領域がもれなく新規モデルで表現することができる。

また、サンプルとサンプルの間隔が長くても、二つのサンプル間を含むようにモデル化しているので、ノードの分散値は小さく設定することができる。逆に、サンプルとサンプルの間隔が短い場合も同様にモデル化できるため、スケールフリーなモデル化を実現することができる。

なお、後述するように、新規モデル学習部２４３は、一つの状態ノードが連続する３つ以上のサンプルを反映するようにモデル化することも可能であり、一つの状態ノードがいくつのサンプルを反映するようにモデル化するかは、適宜、決定することができる。

図３３は、新規モデル学習部２４３の学習モデルをグラフィカルモデルで表したものである。

図３３Ａの学習モデルは、現在のある状態ノードが、現在のデータと、一つ前（一つ後ろ）の２つのサンプルを観測するモデルである。図３３Ａでは、一つの状態ノードからの矢印が、下と右下にあるが、下と左下に向かう矢印のあるモデルでもよい。

なお、本実施の形態では、図３２に示したように、一つの状態ノードが二つの連続するサンプルを表現するモデルを採用するが、一つの状態ノードが３以上の連続するサンプルを表現するモデルを採用することもできる。図３３Ｂのモデルは、一つの状態ノードが３つの連続するサンプルを表現するモデルのグラフィカルモデルである。

[新規モデル学習部２４３の新規モデル学習処理]
次に、図３４のフローチャートを参照して、新規モデル学習部２４３の新規モデル学習処理について説明する。

初めに、ステップＳ５１において、新規モデル学習部２４３は、未知の移動履歴データに対する各状態の尤度を計算する。具体的には、新規モデル学習部２４３は、ユーザ活動モデルを表すHMMの状態ｓ_iへの遷移時に、移動履歴データの２つのサンプル、時刻tの位置のデータｘ_tと時刻t＋１の位置のデータｘ_t＋１が出力されると仮定した観測尤度Ｐ（ｘ_t，ｘ_t＋１｜ｓ_i）を、次式（１５）により計算する。

なお、時刻ｔは、時系列データの測定時刻ではなく、時系列データの順番（ステップ数）を表し、１からＴ（時系列データのサンプル数）までの値をとる。また、式（１５）のｘ_t（１）、ｘ_t（２）、ｘ_t（３）は、それぞれ移動履歴データｘ_tの時刻、緯度、経度を表すものとする。さらに、式（５）のN()は、単一正規分布を表し、μ_si（１）、σ_si（１）^２は、時刻の単一正規分布の中心値および分散値を表す。また、μ_si（２）、σ_si（２）^２は、緯度の単一正規分布の中心値および分散値を表し、μ_si（３）、σ_si（３）^２は、経度の単一正規分布の中心値および分散値を表すものとする。

観測尤度Ｐ（ｘ_t，ｘ_t＋１｜ｓ_i）は、元の時系列データと、一つずれた時系列データの同時分布なので、それぞれの観測系列の分布の積となっている。

なお、一つの状態ノードがW個以上の連続するサンプルを表現するモデルの観測尤度Ｐ（ｘ_t，・・・，ｘ_t＋W｜ｓ_i）は、次式（１６）で表すことができる。勿論、時系列データの次元数Dも３より大きい値に一般化することも可能である。

ステップＳ５１では、全ての状態ｓ_iと３次元データｘ_tの組み合わせについて、式（１５）による観測尤度Ｐ（ｘ_t，ｘ_t＋１｜ｓ_i）が、新規モデル学習部２４３によって計算される。

次に、ステップＳ５２において、新規モデル学習部２４３は、各時刻ｔにおける全ての状態ｓ_iのフォワード尤度α_t（ｓ_i）を計算する。即ち、新規モデル学習部２４３は、次の式（１７）および式（１８）により、時刻ｔにおける状態ｓ_iのフォワード尤度α_t（ｓ_i）を時刻１から最終の時刻Ｔまで順番に計算する。

なお、式（１７）のπ_siは、状態ｓ_iの初期確率を表す。また、式（１８）のa_jiは、状態ｓ_jから状態ｓ_iへの状態遷移確率を表す。なお、初期確率π_siおよび状態遷移確率a_jiの初期値は、例えば、外部から与えられる。

ステップＳ５３において、新規モデル学習部２４３は、各時刻ｔにおける全ての状態ｓ_iのバックワード尤度β_t（ｓ_i）を計算する。即ち、新規モデル学習部２４３は、次の式（１９）および式（２０）により、時刻ｔにおける状態ｓ_iのバックワード尤度β_t（ｓ_i）を、最終の時刻Ｔから時刻１まで逆順に計算する。

式（１９）では、時刻Ｔに各状態ｓ_iである確率が全て等しいものとされている。

このように、ステップＳ５１乃至Ｓ５３の処理により、移動履歴データに対する隠れマルコフモデルの各種の尤度が計算される。

ステップＳ５４において、新規モデル学習部２４３は、初期確率、状態遷移確率を更新する。即ち、新規モデル学習部２４３は、各状態ｓ_iの初期確率π_si、各状態間の状態遷移確率a_ijを、次の式（２１）および式（２２）で求まる初期確率π_si’、状態遷移確率a_ij’にそれぞれ更新する。

式（２１）および式（２２）は、Baum-Welchの最尤推定法で一般的に用いられる式に、観測尤度Ｐ（ｘ_t，ｘ_t＋１｜ｓ_i）を適用したものである。

ステップＳ５５において、新規モデル学習部２４３は、観測確率を更新する。即ち、新規モデル学習部２４３は、各状態ｓ_iの観測確率（確率分布）の中心値μ_si（ｄ）、分散値σ_si（ｄ）²を、次の式（２３）および式（２４）で求まる中心値μ_si（ｄ）’、分散値σ_si（ｄ）’²にそれぞれ更新する。

式（２３）および式（２４）のｄは、データの次元Dに対応し、１，２、または３のいずれかとなる。

一つの状態ノードがW個以上の連続するサンプルを表現するモデルで、次元数がDである場合の観測確率の中心値μ_si（ｄ）’および分散値σ_si（ｄ）’²は、次の式（２５）および式（２６）で求めることができる。

式（２３）および式（２５）の中心値μ_si（ｄ）’、並びに、式（２４）および式（２６）の分散値σ_si（ｄ）’²は、尤度を最小化する式を解くことで、容易に算出することができる。

ステップＳ５６において、新規モデル学習部２４３は、パラメータの更新を終了するか否かを判定する。例えば、各尤度の増分が所定の値以下となり、パラメータの更新の収束条件を満たした場合、新規モデル学習部２４３は、パラメータの更新を終了すると判定する。あるいは、ステップＳ５１乃至Ｓ５５の処理を規定の回数繰り返し実行した場合、パラメータの更新を終了すると判定するとしてもよい。

ステップＳ５６で、パラメータの更新を終了しないと判定された場合、処理はステップＳ５１に戻る。

ステップＳ５１では、新規モデル学習部２４３は、更新されたパラメータに基づいて、各状態の尤度が計算される。即ち、ステップＳ５４およびＳ５５の処理で更新された、各状態ｓ_iの初期確率π_si’、中心値μ_si（ｄ）’および分散値σ_si（ｄ）’²、並びに、各状態間の状態遷移確率a_ij’を示すデータに基づいて、各状態の尤度が計算される。

その後、同様にステップＳ５２乃至Ｓ５５の処理が実行される。これにより、状態ｓ_iの系列の各種の尤度、すなわち、観測尤度Ｐ（ｘ_t，ｘ_t＋１｜ｓ_i）、フォワード尤度α_t（ｓ_i）、バックワード尤度β_t（ｓ_i）が次第に増加し、最終的に最大になるように、HMMのパラメータの更新が行われる。そして、ステップＳ５６において、再度、パラメータの更新を終了するか否かが判定される。

ステップＳ５６で、パラメータの更新を終了すると判定された場合、処理はステップＳ５７に進む。

ステップＳ５７において、新規モデル学習部２４３は、最終的なパラメータをノード系列判定部２４４に出力する。即ち、新規モデル学習部２４３は、最終的に求められた、各状態ｓ_iの初期確率π_si’、中心値μ_si（ｄ）’および分散値σ_si（ｄ）’²、並びに、各状態間の状態遷移確率a_ij’を示すデータをノード系列判定部２４４に出力して、処理を終了する。

[パラメータ再計算部２４５のパラメータ再計算処理]
次に、図３５のフローチャートを参照して、パラメータ再計算部２４５のパラメータ再計算処理について説明する。

初めに、ステップＳ７１において、パラメータ再計算部２４５は、ノード系列判定部２４４から供給される全てのノード系列データを対象として、各状態遷移の遷移頻度<trans_cnt_ｉｊ>（ｉ＝１乃至N，ｊ＝１乃至N，Nは、時系列データの最後のノード番号（＝ノード数））をカウントする。

ステップＳ７２において、パラメータ再計算部２４５は、ノード系列判定部２４４から供給される全てのノード系列データを対象として、各状態ノードs_iの状態頻度<cnt_all_i>、状態初期頻度<cnt_start_i>、およびノード系列データ数<seq_cnt>をカウントする。

ステップＳ７３において、パラメータ再計算部２４５は、ノード系列データの初期確率<π_i>’と状態遷移確率<a_ij>’を計算（更新）する。ノード系列データの初期確率<π_i>’および状態遷移確率<a_ij>’は、次の式（２７）および式（２８）により計算することができる。

ステップＳ７４において、パラメータ再計算部２４５は、ノード系列データの観測確率、即ち、各状態ノードs_iの中心値<μ_j>’と分散値<σ_j ^２>’を計算（更新）する。各状態ノードs_iの中心値<μ_j>’と分散値<σ_j ^２>’は、次の式（２９）および式（３０）により計算することができる。

式（２９）及び式（３０）において、ｘ_{t_k}は、移動履歴データの３次元データｘ_tのうち、状態ノードs_iに対応する３次元データを表す。従って、ｘ_{t_k}の個数は、状態ノードs_iの状態頻度<cnt_all_i>と等しくなる。

なお、一つの状態ノードがW個以上の連続するサンプルを表現するモデルでは、各状態ノードs_iの中心値<μ_j>’と分散値<σ_j ^２>’は、次の式（３１）および式（３２）により計算することができる。

以上で、パラメータ再計算部２４５によるパラメータ再計算処理は終了する。

なお、図３３のグラフィカルモデルを用いていることが、図３０の新規モデル学習部２４３（式（１５），式（１６）、式（２３）乃至式（２６））と、パラメータ再計算部２４５（式（２９）乃至式（３２））に反映されている。従って、例えば、処理を簡略化する要請があるならば、図３０のパラメータ再計算部２４５のみに、図３３のグラフィカルモデルを反映しただけの実施例でもよい。この場合、図３０の新規モデル学習部２４３には、通常のバウムウエルチアルゴリズムによる学習を採用することができる。また、さらに簡略化するならば、通常のバウムウエルチアルゴリズムの代わりに、取得した移動履歴データに対して、前から順に番号を割り振って、これを状態ノードの番号とするような処理に変更してもよい。この場合、図７の移動属性識別付与部７４で与えられた移動属性を見て、現在の移動履歴の３次元データの移動属性が滞在状態でなければ、一つ前の３次元データに割り振られた番号を１大きくした番号が、状態ノードの番号として割り振られる。一方、現在の移動履歴の３次元データの移動属性が滞在状態であれば、一つ前の３次元データに割り振られた番号と同じ番号が状態ノードの番号として割り振られる。

[新規モデル生成部２０２の新規モデル生成処理]
図３６は、新規モデル生成部２０２が行う新規モデル生成処理全体のフローチャートである。

初めに、ステップＳ９１において、新規モデル初期化部２４１は、既知未知判定部２０１から供給された未知の移動履歴データを取得し、それに対応する新規モデルを生成する。即ち、新規モデル初期化部２４１は、取得した未知の移動履歴データのサンプル数と同数の状態ノード数のHMMを生成する。

ステップＳ９２において、新規モデル制約部２４２は、新規モデル初期化部２４１で生成したHMMにleft-to-rightの制約を設定する。

ステップＳ９３において、新規モデル学習部２４３は、未知の移動履歴データを用いて新規モデルを学習する。即ち、ステップＳ９３では、新規モデルは、図３２に示したように、一つの状態ノードが連続するサンプル二つ分を必ず反映するようなモデルとして、図３４を参照して説明した新規モデル学習処理が実行される。

ステップＳ９４において、ノード系列判定部２４４は、ステップＳ９３の新規モデル学習処理により得られた新規モデルを用いて、未知の移動履歴データに対応するノード系列データを生成し、パラメータ再計算部２４５に供給する。

ステップＳ９５において、パラメータ再計算部２４５は、ノード系列判定部２４４から供給されるノード系列データを基に、移動履歴データのHMMのパラメータに対応するノード系列データのパラメータを計算する。より具体的には、パラメータ再計算部２４５は、ノード系列データの初期確率<π_i>’、状態遷移確率<a_ij>’、および各状態ノードs_iの中心値<μ_j>’と分散値<σ_j ^２>’を計算する。また、パラメータ再計算部２４５は、各状態ノードs_iの状態頻度<cnt_all_i>と状態初期頻度<cnt_start_i>も計算する。

ステップＳ９６において、新規モデル整理部２４６は、生成した新規モデルとしてのHMMの各状態ノードs_iのなかで、使用されない状態ノードを消去することで、新規モデルを整理する。そして、新規モデル整理部２４６は、整理後の新規モデルのパラメータと、未知の移動履歴データの前後の既存モデルの状態ノードも既知未知判定部２０１から供給されていた場合には、それも、新規モデル結合部２０３に出力して、処理を終了する。

[新規モデル結合部２０３のトポロジー更新モデル生成処理]
次に、先の学習により得られている既存モデルと、未知の移動履歴データにより生成された新規モデルを結合し、トポロジー更新モデルを生成する新規モデル結合部２０３のトポロジー更新モデル生成処理について説明する。

まず、説明の前提として、以下の変数を定義する。

既存モデル：xhmm
新規モデル：yhmm
トポロジー更新モデル：zhmm

既存モデルxhmm、新規モデルyhmm、トポロジー更新モデルzhmmそれぞれは、次の変数を有する。なお、以下のhmmは、学習モデル（HMM）に共通の表記であり、既存モデルのときはxhmmと、新規モデルのときはyhmmと、トポロジー更新モデルのときはzhmmと読み替える。
状態ノード数：hmm.node
既存モデルxhmmの状態ノード数xhmm.node＝M
新規モデルyhmmの状態ノード数yhmm.node＝N
トポロジー更新モデルzhmmの状態ノード数zhmm.node＝M+N
学習対象の時系列データの次元数D ：hmm.D
各状態ノードの初期確率π_i ：hmm.pi(i)
hmm全体の初期確率hmm.piは、hmm.node行１列のテーブル（初期確率テーブル）となる。
各状態ノードの遷移確率a_ij ：hmm.a(i,j)
hmm全体の遷移確率hmm.aは、hmm.node行hmm.node列のテーブル（遷移確率テーブル）となる。
各状態ノードの確率分布の中心値μ_i ：hmm.mu(i)
hmm全体の確率分布の中心値hmm.muは、hmm.node行hmm.D列のテーブル（中心値テーブル）となる。
各状態ノードの確率分布の分散値σ_i ^２：hmm.sigma2(i)
hmm全体の確率分布の分散値hmm.sigma2は、hmm.node行hmm.D列のテーブル（分散値テーブル）となる。
学習した時系列データの数seq_cnt ：hmm.seq_cnt
各状態ノードの状態頻度cnt_all_i ：hmm.cnt_all(i)
hmm全体の状態頻度hmm.cnt_allは、hmm.node行１列のテーブル（状態頻度テーブル）となる。

図３７のフローチャートを参照して、新規モデル結合部２０３によるトポロジー更新モデル生成処理について説明する。

初めに、ステップＳ１０１において、新規モデル結合部２０３は、トポロジー更新モデルの初期確率zhmm.piを計算する。

ステップＳ１０１では、まず、新規モデル結合部２０３は、既存モデルがM個、新規モデルがN個の状態ノードからなるので、図３８Aに示すように、初期確率zhmm.piとしての(M＋N)行１列の初期確率テーブルを生成する。

そして、新規モデル結合部２０３は、トポロジー更新モデルの初期確率テーブルの第１行乃至第M行の第m行に（m=１，２，・・，M）は、図３８Aに示すように、既存モデルの初期確率xhmm.pi(m)に、既存モデルの時系列データ数xhmm.seq_cntを乗算した値を設定する。また、トポロジー更新モデルの初期確率テーブルの第（M＋１）行乃至第（M＋N）行の第（M+n）行（n=１，２，・・・，N）には、新規モデルの初期確率yhmm.pi(n)に、新規モデルの時系列データ数yhmm.seq_cntを乗算した値を設定する。

そして、図３８Bに示されるように、トポロジー更新モデルの初期確率テーブルの各行が、初期確率テーブルの全要素の総和SUM_piで除算されることで規格化され、トポロジー更新モデルの初期確率テーブルzhmm.piの生成が終了する。

次に、ステップＳ１０２において、新規モデル結合部２０３は、トポロジー更新モデルの時系列データ数zhmm.seq_cntを計算する。具体的には、新規モデル結合部２０３は、既存モデルの時系列データ数xhmm.seq_cntと、新規モデルの時系列データ数yhmm.seq_cntの和を計算し、トポロジー更新モデルの時系列データ数zhmm.seq_cntとする。

ステップＳ１０３において、新規モデル結合部２０３は、トポロジー更新モデルの遷移確率zhmm.aと状態頻度zhmm.cnt_allを計算する。

ステップＳ１０３では、まず、新規モデル結合部２０３は、既存モデルがM個、新規モデルがN個の状態ノードからなるので、図３９に示すように、(M＋N)行(M＋N)列の遷移確率テーブルを生成する。なお、遷移確率テーブルの第１行第１列から第M行M列を左上領域、第(M＋１)行第(M＋１)列から第(M＋N)行(M＋N)列を右下領域、第１行第(M+1)列から第M行(M＋N)列を右上領域、第（M+1）行第１列から第(M＋N)行M列を左下領域という。

そして、新規モデル結合部２０３は、生成した遷移確率テーブルの左上領域の各要素に、既存モデルの状態ノードs_mの遷移確率xhmm.a(m,j)に、既存モデルの状態ノードs_mの状態頻度xhmm.cnt_all(m)を乗算した値を設定する（j=１，・・・，M）。

また、新規モデル結合部２０３は、生成した遷移確率テーブルの右下領域の各要素に、新規モデルの状態ノードs_mの遷移確率yhmm.a(m,j)に、新規モデルの状態ノードs_mの状態頻度yhmm.cnt_all(m)を乗算した値を設定する（j=１，・・・，M）。

なお、図３９では、紙面の制約上、xhmm.a(m,j)×xhmm.cnt_all(m)、yhmm.a(m,j)×yhmm.cnt_all(m)と、同一行についてはまとめて図示している。

さらに、新規モデル結合部２０３は、生成した遷移確率テーブルの右上領域の各要素については、基本的に”０”を代入する。ただし、未知の移動履歴データの前の既存モデルの状態ノードが、新規モデル生成部２０２から供給され、新規モデルが既存モデルのノード系列データの後に接続される場合、その接続先の状態ノードに対応する要素のみ、”１”が代入される。具体的には、接続先の状態ノードがs_ｉである場合、第ｉ行第（M+1）列の要素に、”１”が設定される。

同様に、新規モデル結合部２０３は、生成した遷移確率テーブルの左下領域の各要素については、基本的に”０”を代入する。ただし、未知の移動履歴データの後の既存モデルの状態ノードが、新規モデル生成部２０２から供給され、新規モデルの後に既存モデルのノード系列データが接続される場合、その接続先の状態ノードに対応する要素のみ、”１”が代入される。具体的には、接続先の状態ノードがs_ｊである場合、第(M＋N)行第ｊ列の要素に、”１”が設定される。

次に、新規モデル結合部２０３は、図４０に示すように、生成した遷移確率テーブルの左上領域と右下領域について、行方向の和を演算することにより、トポロジー更新モデルの状態頻度zhmm.cnt_allを計算する。図４０の状態頻度テーブルは、(M＋N)行１列のテーブルによりなる。

最後に、新規モデル結合部２０３は、図４１に示すように、図３９の遷移確率テーブルの左上領域と右下領域の各行を、トポロジー更新モデルの状態頻度テーブルの各行zhmm.cnt_all(i)で除算して、規格化する。以上で、トポロジー更新モデルの遷移確率テーブルの生成が終了する。

そして、処理はステップＳ１０４に進み、新規モデル結合部２０３は、トポロジー更新モデルの確率分布の中心値zhmm.muおよび分散値zhmm.sigma2を計算する。

ステップＳ１０４では、既存モデルがM個、新規モデルがN個の状態ノードからなるので、トポロジー更新モデルの中心値zhmm.muに対応する中心値テーブルは、（M＋N)行D列で構成される。

図４２に示すように、(M＋N)行D列の中心値テーブルの第１行から第M行の各行には、既存モデルの中心値xhmm.mu(i,1)，xhmm.mu(i,2)，xhmm.mu(i,3)が代入される（i=１，・・・，M）。また、(M＋N)行D列の中心値テーブルの第（M+1）行から第（M+N）行の各行には、新規モデルの中心値yhmm.mu(i,1)，yhmm.mu(i,2)，yhmm.mu(i,3)が代入される（i=１，・・・，N）。ここで、xhmm.mu(i,1)及びyhmm.mu(i,1)は、移動履歴データの時刻の中心値であり、xhmm.mu(i,2)及びyhmm.mu(i,2)は、移動履歴データの緯度の中心値であり、xhmm.mu(i,3)及びyhmm.mu(i,3)は、移動履歴データの経度の中心値である。

同様に、トポロジー更新モデルの確率分布の分散値zhmm.sigma2に対応する分散値テーブルも、(M＋N)行D列で構成される。

図４３に示すように、(M＋N)行D列の分散値テーブルの第１行から第M行の各行には、既存モデルの分散値xhmm.sigma2(i,1)，xhmm.sigma2(i,2)，xhmm.sigma2(i,3)が代入される（i=１，・・・，M）。また、(M＋N)行D列の分散値テーブルの第（M+1）行から第（M+N）行の各行には、新規モデルの分散値yhmm.sigma2(i,1)，yhmm.sigma2(i,2)，yhmm.sigma2(i,3)が代入される（i=１，・・・，N）。ここで、xhmm.sigma2(i,1)及びyhmm.sigma2(i,1)は、移動履歴データの時刻の分散値であり、xhmm.sigma2(i,2)及びyhmm.sigma2(i,2)は、移動履歴データの緯度の分散値であり、xhmm.sigma2(i,3)及びyhmm.sigma2(i,3)は、移動履歴データの経度の分散値である。

そして、処理はステップＳ１０５に進み、新規モデル結合部２０３は、トポロジー更新モデルのパラメータを更新モデル整理部２０５に出力する。即ち、トポロジー更新モデルの初期確率zhmm.pi、時系列データ数zhmm.seq_cnt、遷移確率zhmm.a、状態頻度zhmm.cnt_all、並びに、確率分布の中心値zhmm.muおよび分散値zhmm.sigma2が更新モデル整理部２０５に出力される。以上で、トポロジー更新モデル生成処理は終了する。

[パラメータ更新部２０４のパラメータ更新処理]
次に、パラメータ更新部２０４によるパラメータ更新処理について説明する。

図４４は、パラメータ更新部２０４が行うパラメータ更新処理全体のフローチャートである。

初めに、ステップＳ１２１において、パラメータ更新部２０４は、既知未知判定部２０１から供給された、既知の移動履歴データと、それに対応するノード系列データ及び補間フラグ系列データを取得する。以下では、説明を簡単にするため、１個の既知の移動履歴データと、それに対応するノード系列データ及び補間フラグ系列データが取得されたとして説明する。

ステップＳ１２２において、パラメータ更新部２０４は、既存モデルの初期確率xhmm.piを更新する。

ステップＳ１２２では、まず、初期確率xhmm.piとしてのM行１列の初期確率テーブルの、取得された状態ノード系列の先頭ノードに対応する初期確率xhmm.pi(i)に１が加算される。図４５Aでは、状態ノード系列の先頭ノードが状態ノードs_１８である例として、xhmm.pi(18)に１が加算されている。

そして、確率の条件を満たすため、図４５Bに示すように、初期確率テーブルの各行が、全要素の総和SUM_piで除算されることで規格化され、既存モデルの初期確率xhmm.piの更新が終了する。

次に、ステップＳ１２３において、パラメータ更新部２０４は、既存モデルの時系列データ数xhmm.seq_cntを更新する。時系列データ数は一つ増加するだけであるので、現在のxhmm.seq_cntに１を加算したものが更新後の既存モデルの時系列データ数xhmm.seq_cntとされる。

ステップＳ１２４において、パラメータ更新部２０４は、既存モデルの遷移確率xhmm.aと状態頻度xhmm.cnt_allを更新する。

ステップＳ１２４では、まず、取得された状態ノード系列で発生している状態遷移に対応する遷移確率テーブルの各要素に、１が加算される。例えば、図４６の例では、状態ノードs_１８から状態ノードs_２への遷移と、状態ノードs_Mから状態ノードs_２への遷移が、少なくとも発生し、xhmm.a(18,2)×xhmm.cnt_all(18)とxhmm.a(M,2)×xhmm.cnt_all(M)のそれぞれに、１が加算されている。

また、取得された状態ノード系列の最後尾の状態ノードについては、自己遷移に対応する遷移確率テーブルの要素に、１が加算される。例えば、図４６では、状態ノード系列の最後尾の状態ノードがs_２である例として、xhmm.a(2,2)×xhmm.cnt_all(2)に、１が加算されている。

次に、パラメータ更新部２０４は、図４７に示すように、１を加算後の遷移確率テーブルに対し、行方向の和を演算することで、既存モデルの状態頻度xhmm.cnt_allを計算（更新）する。

最後に、パラメータ更新部２０４は、図４８に示すように、１を加算後の遷移確率テーブルの各行を、更新後の既存モデルの状態頻度xhmm.cnt_all(i)で除算して、規格化する。以上の計算により、既存モデルの遷移確率テーブルが更新される。

そして、処理はステップＳ１２５に進み、パラメータ更新部２０４は、補間フラグ系列データに基づいて、状態ノードに対応する３次元データが補間データであるかを、状態ノードそれぞれについて判定する。

ステップＳ１２５で、状態ノードに対応する３次元データが補間データではない（実データである）と判定された場合には、その状態ノードに対して、次のステップＳ１２６の処理が実行される。一方、ステップＳ１２５で、状態ノードに対応する３次元データが補間データであると判定された場合には、ステップＳ１２６の処理がスキップされる。

ステップＳ１２６では、パラメータ更新部２０４は、既存モデルの確率分布の中心値xhmm.muおよび分散値xhmm.sigma2を更新する。

一般に、既存モデルにおいて状態ノードs_iがM個出現し、その平均値がμ_siである場合において、M＋１番目の状態ノードs_iと認識される新しいサンプルx_M＋１が増えたときの更新前の平均値μ_si ^（M）と更新後のμ_si ^{（M＋１）}との間には、次の関係がある。

式（３３）および式（３４）において、右肩の括弧付きの文字は状態ノードs_iの出現回数を表す。

そこで、パラメータ更新部２０４は、図４９に示すように、M行D列の中心値テーブルの各行の要素に、上述したステップＳ１２４で状態頻度xhmm.cnt_all(i)を更新する前の、１つ前の状態頻度xhmm^OLD.cnt_all(i)を乗算する（i=１，・・・，M）。従って、１つ前の状態頻度xhmm^OLD.cnt_all(i)は、ステップＳ１２４の処理を行う前に、所定の場所に格納しておく必要がある。

次に、パラメータ更新部２０４は、新しいサンプルx_M＋１に対応する状態ノードに対応する中心値テーブルの行に、新しいサンプルx_M＋１としての既知の移動履歴データ（補間データではない３次元データのそれぞれ）を加算する。

さらに、パラメータ更新部２０４は、M行D列の中心値テーブルの各行の要素を、上述したステップＳ１２４で更新した状態頻度xhmm.cnt_all(i)で除算する。以上で、既存モデルの確率分布の中心値xhmm.muの更新が終了する。

一方、既存モデルにおいて状態ノードs_iがM個出現し、その平均値がμ_si、分散値がσ_si ^２である場合において、M＋１番目の状態ノードs_iと認識される新しいサンプルx_M＋１が増えたときの更新前の平均値σ_si ^２（M）と更新後のσ_si ^{２（M＋１）}との間には、次の関係がある。

式（３５）および式（３６）において、右肩の括弧付きの文字は状態ノードs_iの出現回数を表す。

そこで、パラメータ更新部２０４は、M行D列の分散値テーブルの各行の要素に、既存モデルの確率分布の中心値xhmm.muを更新する前の、１つ前の中心値xhmm ^OLD.muの二乗を加算する（i=１，・・・，M）。従って、１つ前の中心値xhmm ^OLD.muも、上述の更新を行う前に、所定の場所に格納しておく必要がある。

次に、パラメータ更新部２０４は、１つ前の中心値xhmm ^OLD.muの二乗加算後のM行D列の分散値テーブルの各行の要素に、１つ前の状態頻度xhmm^OLD.cnt_all(i)を乗算する。

図５０は、状態頻度xhmm^OLD.cnt_all(i)を乗算後の分散値テーブルを示している。

さらに、パラメータ更新部２０４は、新しいサンプルx_M＋１に対応する状態ノードに対応する中心値テーブルの行に、新しいサンプルx_M＋１としての既知の移動履歴データ（補間データではない３次元データのそれぞれ）の二乗を加算する。

最後に、パラメータ更新部２０４は、M行D列の中心値テーブルの各行の要素を、上述したステップＳ１２４で更新した状態頻度xhmm.cnt_all(i)で除算し、かつ、更新後の中心値xhmm.mu(i)の二乗を減算する。以上で、既存モデルの確率分布の分散値xhmm.sigma2の更新が終了する。

そして、処理はステップＳ１２７に進み、パラメータ更新部２０４は、更新された既存モデルのパラメータを新規モデル結合部２０３と更新モデル整理部２０５に出力する。即ち、更新された既存モデルの初期確率xhmm.pi、時系列データ数xhmm.seq_cnt、遷移確率xhmm.a、状態頻度xhmm.cnt_all、並びに、確率分布の中心値xhmm.muおよび分散値xhmm.sigma2が出力される。以上で、パラメータ更新処理は終了する。

以上のように、パラメータ更新処理では、既知の移動履歴データのデータ欠落部分（補間データ）については、その経路を通ったという事実（既存モデルの時系列データ数xhmm.seq_cnt）や状態ノードの遷移パラメータ（遷移確率xhmm.a、状態頻度xhmm.cnt_all）のみ更新される。換言すれば、既知の移動履歴データのデータ欠落部分（補間データ）については、状態ノードの確率分布パラメータ（中心値xhmm.muおよび分散値xhmm.sigma2）については更新しない。補間データは、実際の経路からずれている可能性が高いからである。これにより、１回以上は実データを取得したことがあり、何らかの条件で今回取得できなかったような移動履歴データについての状態ノードの確率分布パラメータの信頼度低下を防止することができる。

[学習メインプロセス部２３全体の処理]
次に、図５１のフローチャートを参照して、学習メインプロセス部２３全体の学習メインプロセス処理について説明する。

初めに、ステップＳ１４１において、学習メインプロセス部２３は、学習プリプロセス部２２（図１）から供給される移動履歴データと、ユーザ別モデルパラメータ記憶部１２（図１）から供給される、既存モデルのパラメータを取得する。移動履歴データは、既知未知判定部２０１が取得し、既存モデルのパラメータは、既知未知判定部２０１、新規モデル結合部２０３、およびパラメータ更新部２０４が取得する。

ステップＳ１４２において、既知未知判定部２０１は、供給された移動履歴データが既知の経路の移動履歴データであるか否か判定する既知未知判定処理を行う。

図２１乃至図２９を参照して説明したように、既知未知判定処理では、既存モデルの状態ノードに未知状態ノードを追加した未知状態追加モデルでビタビ推定を行い、既知未知の二状態モデルによるビタビ判定を行うことで、既知または未知の判定が行われる。

既知未知判定処理において、供給された移動履歴データが既知であると判定された場合、供給された移動履歴データ及び補間フラグ系列データと、それに対応する状態ノードの時系列データであるノード系列データが、パラメータ更新部２０４に供給される。一方、既知未知判定処理において、供給された移動履歴データが未知であると判定された場合、供給された移動履歴データは新規モデル生成部２０２に供給される。また、未知の移動履歴データが既知の状態ノード（経路）と接続されている場合には、接続先の状態ノードも新規モデル生成部２０２に供給される。

ステップＳ１４２で既知と判定された場合、処理はステップＳ１４３に進み、パラメータ更新部２０４は、既知の移動履歴データと、それに対応するノード系列データ及び補間フラグ系列データに基づいて、既存モデルのパラメータを更新するパラメータ更新処理を行う。即ち、図４４乃至図５０を参照して説明した処理が行われる。

一方、ステップＳ１４２で未知と判定された場合、処理はステップＳ１４４に進み、新規モデル生成部２０２は、未知の移動履歴データに対応する新規モデルを生成する新規モデル生成処理を行う。換言すれば、新規モデル生成部２０２は、未知の移動履歴データを表現する新規モデルのパラメータを求める。新規モデル生成処理は、即ち、図３０乃至図３６を参照して説明した処理である。

ステップＳ１４５において、新規モデル結合部２０３は、既存モデルと新規モデルとを結合し、学習済みの既存モデルに、未知の移動履歴データを取り込んで成長させたトポロジー更新モデルを生成するトポロジー更新処理を行う。即ち、新規モデル結合部２０３は、図３７乃至図４３を参照して説明した処理を行う。

ステップＳ１４３またはＳ１４５の処理後、ステップＳ１４６において、更新モデル整理部２０５は、自己遷移のみで、他の状態ノードからの遷移が無い状態ノードを消去することで、パラメータ更新モデルまたはトポロジー更新モデルを整理する。更新モデル整理部２０５は、整理後の更新モデルのパラメータを、学習ポストプロセス部２４とユーザ別モデルパラメータ記憶部１２に供給して、処理を終了する。

［目的地経由地検出部２５の処理］
次に、図５２を参照して、学習ブロック１１の目的地経由地検出部２５（図１）の処理について説明する。

上述したように、学習メインプロセス部２３は、移動履歴データを分割する処理、線形補間する処理、移動属性識別処理等が行われた後の移動履歴データを学習用データとして、ユーザ活動モデルのパラメータを学習する。そして、学習ポストプロセス部２４が、学習により求めたパラメータを用いて、移動履歴データに対応する状態系列データを生成する。

図５２Ａは、図８下段に示した、学習プリプロセス部２２によって移動履歴データの分割およびホールドが行われた後の、移動属性付き移動履歴データ８３Ａおよび８３Ｂを示している。

図５２Ｂは、図８下段に示した移動属性付き移動履歴データ８３Ａおよび８３Ｂに、対応する状態系列データを併せて示した図である。

移動属性付き移動履歴データ８３Ａには、ｓ_１，ｓ_２，・・・，ｓ_ｋ，・・・ｓ_ｔの状態系列ノードが対応する。移動属性付き移動履歴データ８３Ｂには、ｓ_ｔ＋１，ｓ_ｔ＋２，・・・，ｓ_Ｔの状態系列ノードが対応する。

目的地経由地検出部２５は、１まとまりの移動属性付き移動履歴データの最後の”滞在状態（ｕ）”の３次元データに対応する状態ノードを検出し、目的地の属性を付与する。図５２Ｂの例では、移動属性付き移動履歴データ８３Ａの状態ノードｓ_ｔと、移動属性付き移動履歴データ８３Ｂの状態ノードｓ_Ｔに対して、目的地の属性が付与される。状態ノードｓ_ｔと状態ノードｓ_Ｔは、いずれも滞在状態が滞在閾値時間以上継続していた状態ノードである。このように、目的地経由地検出部２５によって、滞在状態が滞在閾値時間以上継続する移動履歴データに対応する状態ノードが、目的地に推定される。

なお、図８を参照して説明した分割処理では、分割した移動履歴データの最後の滞在閾値時間以上の複数の”移動状態”が、１つの”滞在状態”に縮減された。しかしながら、分割処理では、移動履歴データの最後の滞在閾値時間以上の複数の”移動状態”のすべてを、消去するようにしてもよい。図５２Ａの例で説明すると、移動属性付き移動履歴データ８３Ａおよび８３Ｂそれぞれの最後の”滞在状態（ｕ）”の３次元データを省略するようにしてもよい。この場合には、目的地経由地検出部２５は、１まとまりの移動属性付き移動履歴データの最後の３次元データに対応する状態ノードに、目的地の属性を付与する。図５２Ｂの例で説明すると、移動属性付き移動履歴データ８３Ａの状態ノードｓ_ｔの１つ前の状態ノードｓ_ｔ−１、および、移動属性付き移動履歴データ８３Ｂの状態ノードｓ_Ｔの１つ前の状態ノードｓ_Ｔ−１を目的地とすればよい。

目的地経由地検出部２５は、また、１まとまりの移動属性付き移動履歴データの途中にある”滞在状態（ｕ）”の３次元データに対応する状態ノードを検出し、経由地の属性を付与する。即ち、滞在状態の継続時間が滞在閾値時間未満である移動履歴データに対応する状態ノードが、経由地に推定される。図５２Ｂの例で説明すると、移動属性付き移動履歴データ８３Ａの状態ノードｓ_ｋが、経由地に決定される。

なお、目的地経由地検出部２５は、図５２Ｃに示すように、移動手段が変更されたとき、変更前の最後の状態ノードｓ_ｈにも、経由地の属性を付与するようにしてもよい。

［学習ブロック１１の処理］
図５３のフローチャートを参照して、学習ブロック１１全体の処理について説明する。

初めに、ステップＳ２４１において、履歴データ蓄積部２１は、センサデバイスから供給される、移動履歴データを、学習用データとして蓄積する。

ステップＳ２４２において、学習プリプロセス部２２は、図１９を参照して説明した、学習プリプロセス処理を実行する。即ち、履歴データ蓄積部２１に蓄積されている移動履歴データの接続および分割の処理、データ欠落部分の線形補間処理、”滞在状態”または”移動状態”の移動属性の付与、などを行う。

ステップＳ２４３において、学習メインプロセス部２３は、図５１を参照して説明した、学習メインプロセス処理を実行する。即ち、学習メインプロセス部２３は、供給されるユーザの移動履歴データに対して、既知または未知を判定し、判定結果に応じてユーザ活動モデルとしてのHMMのパラメータを更新する。未知の移動履歴データが供給された場合には、移動範囲の拡張に合わせてトポロジーを成長させたHMMのパラメータが求められる。学習メインプロセス処理により得られたユーザ活動モデルのパラメータは、学習ポストプロセス部２４とユーザ別モデルパラメータ記憶部１２に供給され、ユーザ別モデルパラメータ記憶部１２で記憶される。

ステップＳ２４４において、学習ポストプロセス部２４は、学習により得られたパラメータで表現されるユーザ活動モデルにより、移動履歴データに対応するノード系列データを生成する。

ステップＳ２４５において、目的地経由地検出部２５は、移動属性付き移動履歴データに対応する状態系列ノードの所定の状態ノードに、目的地の属性を付与する。より具体的には、目的地経由地検出部２５は、滞在状態が滞在閾値時間以上継続する移動履歴データに対応する状態ノードに、目的地の属性を付与する。

ステップＳ２４６において、目的地経由地検出部２５は、移動属性付き移動履歴データに対応する状態系列ノードの所定の状態ノードに、経由地の属性を付与する。より具体的には、目的地経由地検出部２５は、滞在状態の継続時間が滞在閾値時間未満である移動履歴データに対応する状態ノードに、経由地の属性を付与する。

ステップＳ２４７において、目的地経由地検出部２５は、状態ノードに付与された目的地、経由地の属性についての情報を、ユーザ別モデルパラメータ記憶部１２に記憶させ、処理を終了する。

[予測プリプロセス部３２の構成例]
次に、予測ブロック１３が行う処理について説明する。

図５４は、予測プリプロセス部３２の詳細構成例を示すブロック図である。

予測プリプロセス部３２は、予測用データ前処理部３０１と予測用データ生成部３０２により構成される。予測用データ前処理部３０１は、データ分割部３１１とデータ異常除去部３１２とからなり、予測用データ生成部３０２は、補間処理部３１３、移動属性識別付与部３１４、及び仮想誤差生成部３１５とからなる。

データ分割部３１１は、学習プリプロセス部２２のデータ接続分割部７１が行う分割処理と同様、取得された移動履歴データに、欠落閾値時間以上のデータ欠落がある場合に、その前後で移動履歴データを分割する。なお、欠落閾値時間は、データ接続分割部７１で設定されている欠落閾値時間と同一である必要はない。

データ異常除去部３１２は、学習プリプロセス部２２のデータ異常除去部７２と同様、取得された移動履歴データの明らかな異常を除去する処理を行う。

補間処理部３１３は、学習プリプロセス部２２の再サンプリング処理部７３と同様、後段の処理部（予測メインプロセス部３３など）に適応する一定の時間間隔に移動履歴データをリサンプリングする。

また、補間処理部３１３は、取得される移動履歴データにデータ欠落部分がある場合に、その部分を補間する補間処理を行う。ここで、データ欠落部分には、（１）現時点ではデータが正常に取得できており、過去の所定期間にデータの欠落がある場合、（２）現時点のデータが取得できず、現時点を含む所定期間、データの未取得が続いている場合、の２通りがある。

（１）現時点のデータが正常に取得できている場合、補間処理部３１３は、学習プリプロセス部２２の再サンプリング処理部７３と同様に、過去の所定期間のデータ欠落部分について、式（１）の線形補間による補間処理を行う。

一方、（２）現時点のデータが取得できていない場合、補間処理部３１３は、現時点を含むデータ欠落部分について、欠落する直前の（取得できた最後の）３次元データが継続して続いているものとして補間する処理（ホールド補間処理）を行う。具体的には、データ欠落の直前の時刻Ｔ_１における３次元データがｘ^real _Ｔ１である場合、補間処理部３１３は、その次の時刻Ｔ_１＋１から現時点の時刻ｔまでの各３次元データを、次式（３７）により生成する。
ｘ^virtual _t＝ｘ^virtual _Ｔ１＋１＝ｘ^real _Ｔ１・・・・・・・・・・（３７）

なお、現時点を含むデータ欠落部分に対する補間処理としては、上述したホールド補間の他、センサデバイスが取得できたデータの軌跡を用いた外挿、フィルタリング（カルマンフィルタ）など、その他の処理により求めるようにしてもよいことは言うまでもない。

そして、補間処理部３１３は、学習プリプロセス部２２の再サンプリング処理部７３と同様、移動履歴データを構成する各３次元データが補間処理により生成された補間データであるか否かを示す補間フラグの時系列データである補間フラグ系列データも生成する。

移動属性識別付与部３１４は、学習プリプロセス部２２の移動属性識別付与部７４と同様の処理を行う。即ち、移動属性識別付与部３１４は、取得された移動履歴データの各３次元データに対し、”滞在状態”か、または、”移動状態”の移動属性を識別し、付与する。”移動状態”の移動属性については、移動手段（車、バス、電車、徒歩など）もさらに識別するようにしてもよい。

仮想誤差生成部３１５は、補間処理部３１３において補間処理により生成された補間データに対して、仮想誤差e_tを計算する。

より具体的には、（１）現時点のデータを含まない過去の所定期間のデータ欠落部分については、仮想誤差生成部３１５は、上述した式（８）により、仮想誤差e_tを計算する。

一方、（２）現時点のデータを含むデータ欠落部分については、式（８）のデータ復活直後の時刻Ｔ_２における３次元データｘ^real _Ｔ２が存在しないため、仮想誤差e_tを式（８）により求めることができない。

そこで、仮想誤差生成部３１５は、データが欠落してからの経過時間に応じた所定の関数で仮想誤差e_tを計算する。経過時間に応じた所定の関数としては、例えば、単位時間当たり一定の大きさで増加する関数や、補間データになってから所定時間内までは単位時間当たり一定の大きさで増加し、それ以降は一定値となるような関数を採用することができる。

補間データになってから所定時間内までは一定の大きさで増加し、それ以降は一定値となるような仮想誤差e_tは、例えば、次式（３８）で求めることができる。

式（３８）のTBは、補間データになってからの経過時間を表す所定の定数（固定値）であり、γは単位時間当たりの増加量に相当する係数（固定値）である。

なお、仮想誤差e_tは、データが欠落してからの経過時間に関わらず一定の大きさとすることもできる。

仮想誤差部３１５は、補間処理後の移動履歴データと、それに対応する補間フラグ系列データ（補間フラグの時系列データ）及び仮想誤差系列データ（仮想誤差の時系列データ）を、後段の予測メインプロセス部３３に出力する。

図５５は、ホールド補間処理により３次元データが生成されたときの仮想誤差e_tのイメージ図である。

図５５は、時刻ｔ_ｋまではセンサデバイスが実際にデータを取得でき、時刻ｔ_ｋ＋１以降からデータが欠落した場合の例である。

この場合、時刻ｔ_ｋ＋１以降の３次元データｘ_ｋ＋１，ｘ_ｋ＋２，ｘ_ｋ＋３，ｘ_ｋ＋４，・・は、時刻ｔ_ｋの３次元データｘ_ｋと同一の値として生成され、その仮想誤差e_ｋ＋１，e_ｋ＋２，e_ｋ＋３，e_ｋ＋４，・・は、時間の経過とともに一定の大きさで増加している。このようにすることで、データ欠落時以降のユーザの移動履歴を、仮想誤差の範囲内に含まれるようにすることができる。

図５６は、補間処理後の移動履歴データと、それに対応する仮想誤差を概念的に示している。

図５６において、左右に並ぶ２つの列のうち、左側の列は、予測用データ生成部３０２が補間処理を行った後の移動履歴データを示し、右側の列は、その移動履歴データに対して計算された仮想誤差系列データを示している。

図５６に示される２つの破線枠のうち、上側の破線枠で囲まれている時刻ｔ_６から時刻ｔ_８までの移動履歴データは、線形補間により生成された補間データを示している。即ち、時刻ｔ_６から時刻ｔ_８までの３次元データは、データ欠落の前後の時刻ｔ_５と時刻ｔ_９の３次元データを用いて、式（１）により算出されたデータである。そして、時刻ｔ_６から時刻ｔ_８までの３次元歴データに対応する仮想誤差は、式（８）により算出されている。

一方、２つの破線枠のうち、下側の破線枠で囲まれている時刻ｔ_ｋ＋１から時刻ｔ_Tまでの移動履歴データは、ホールド補間により生成された補間データを示している。従って、時刻ｔ_ｋ＋１から時刻ｔ_Tまでの３次元データの経度と緯度（図５６のｘ，ｙ）は、データ欠落直前の時刻ｔ_ｋの経度と緯度と同一の値とされている。そして、時刻ｔ_ｋ＋１から時刻ｔ_Tまでの３次元データに対応する仮想誤差は、例えば、式（３８）等により算出されている。

なお、補間処理により生成された３次元データのうち、時刻については（リサンプリング後の）実データと同一となるので、その仮想誤差は０となっている。

ところで、図５６の例では、補間データではない３次元データの仮想誤差は０としている。これは、センサデバイスが取得した３次元データに誤差はないと想定しているからである。

しかし、センサデバイス自身も誤差を持っていると想定することもできる。例えばGPSセンサの精度（位置精度）は、移動手段（車、バス、電車、徒歩など）によって異なることが多い。具体的には、ユーザが「徒歩」や「自転車」で移動しているような場合、ユーザが身につけているセンサデバイスは屋外にあるため、受信信号の信号品質がよく、誤差は少ないと期待できる。一方、ユーザが「電車」や「車」で移動しているような場合、センサデバイスは電車や車の中（屋内）にあるため、衛星の捕捉状態が悪く、信号品質が悪く、誤差は大きめになる。

そこで、移動属性識別付与部３１４で”移動状態”が移動手段（車、バス、電車、徒歩など）ごとに識別されている場合には、補間データではない３次元データに対しても、移動手段に応じた仮想誤差e_tを設定するようにしてもよい。例えば、移動属性が”移動状態”であって、移動手段が「徒歩」や「自転車」である場合には仮想誤差e_tを「１０ｍ」に設定し、移動手段が「電車」や「車」である場合には仮想誤差e_tを「５０ｍ」に設定したりすることができる。

図５７は、移動手段に応じて仮想誤差e_tを設定した場合のイメージ図である。

図５７において、白抜きの星印（☆）が、センサデバイスから取得された３次元データを示しており、その周辺の円が、仮想誤差生成部３１５が移動手段に応じて設定した仮想誤差を示している。移動手段が「電車」と識別された３次元データに対しては、「徒歩」と識別された３次元データよりも大きな仮想誤差が設定されている。

[予測用データ生成処理]
図５８は、移動手段に応じた仮想誤差も設定するようにした場合の、予測用データ生成部３０２による予測用データ生成処理のフローチャートである。

初めに、ステップＳ２６１において、補間処理部３１３は、予測用データ前処理部３０１から供給された予測用データとしての移動履歴データを取得する。ここで取得される移動履歴データには、まだデータ欠落部分が存在している。

ステップＳ２６２において、補間処理部３１３は、取得された予測用データにデータ欠落部分が存在する場合に、そのデータ欠落部分に対して補間処理を行う。より具体的には、補間処理部３１３は、現時点を含まない過去の所定期間（所定の区間）の移動履歴データのデータ欠落部分に対しては、上述した式（１）を用いた線形補間による補間処理を行う。一方、現時点を含むデータ欠落部分に対しては、データ欠落直前の（取得できた最後の）３次元データでホールド補間する処理を行う。また、補間処理部３１３は、補間処理と同時に、補間フラグ系列データも生成する。

ステップＳ２６３において、移動属性識別付与部３１４は、移動履歴データの各３次元データに対し、”滞在状態”か、または、”移動状態”の移動属性を識別し、付与する。また、”移動状態”の移動属性については、移動手段（車、バス、電車、徒歩など）も識別され、移動手段ごとの、移動属性が付与される。

ステップＳ２６２とＳ２６３の処理により、供給された移動履歴データに対応する、補間データか否かを示す補間フラグ系列データと、移動属性を示す移動属性系列データが生成され、補間処理後の移動履歴データとともに、仮想誤差生成部３１５に供給される。

ステップＳ２６４において、仮想誤差生成部３１５は、補間処理後の移動履歴データに対応する仮想誤差系列データ用のメモリを確保し、仮想誤差系列データを生成する。ここで生成される仮想誤差系列データには、全ての仮想誤差について、初期値としての「０」が設定されている。

なお、仮想誤差系列データ用のメモリとして確保する量は、補間データのみに対して仮想誤差を設定する場合には、補間データの個数に相当する容量であり、移動手段の仮想誤差も設定する場合には、移動履歴データの３次元データの個数に相当する容量となる。

ステップＳ２６５において、仮想誤差生成部３１５は、仮想誤差系列データに、「徒歩」や「電車」など、移動手段に応じた仮想誤差を設定する。具体的には、仮想誤差生成部３１５は、移動手段ごとに設定する仮想誤差が記憶されている移動手段別仮想誤差テーブルを有し、移動手段別仮想誤差テーブルを参照し、移動属性系列データが示す各移動手段に応じて仮想誤差系列データの対応する部分に、仮想誤差を設定する。

ステップＳ２６６において、仮想誤差生成部３１５は、仮想誤差系列データに、補間処理に応じた仮想誤差を設定する。具体的には、仮想誤差生成部３１５は、補間フラグ系列データを参照し、補間データに対応する仮想誤差の部分に、線形補間された補間データには式（８）の仮想誤差を、ホールド補間された補間データには式（３８）等の仮想誤差を算出し、加算する。

ステップＳ２６７において、仮想誤差部３１５は、補間処理後の移動履歴データと、それに対応する補間フラグ系列データ及び仮想誤差系列データを、後段の予測メインプロセス部３３に出力して、処理を終了する。

上述した処理では、ステップＳ２６６において、移動手段に応じた仮想誤差と補間処理に応じた仮想誤差を単純に加算する例を説明したが、単純加算以外の演算によって、移動手段に応じた仮想誤差と補間処理に応じた仮想誤差を合成してもよい。例えば、移動手段に応じた仮想誤差の二乗と、補間処理に応じた仮想誤差の二乗の和の平方根により求めた値を、最終的な仮想誤差としてもよい。

なお、学習ブロック１１の学習メインプロセス部２３の既知未知判定部２０１において、仮想誤差を考慮した観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）を求める場合にも、補間処理に応じた仮想誤差だけでなく、上述の移動手段に応じた仮想誤差も含めるようにしてもよい。

［予測メインプロセス部３３の処理］
次に、予測メインプロセス部３３が行う処理について説明する。

図５９は、予測メインプロセス部３３の詳細構成例を示すブロック図である。

予測メインプロセス部３３は、現在地ノード推定部３３１、既知未知判定部３３２、目的地経由地予測部３３３、及び未知状態処理部３３４により構成される。

予測プリプロセス部３２から供給される移動履歴データ及び仮想誤差系列データと、学習ブロック１１の学習により得られたユーザ活動モデル（のパラメータ）は、現在地ノード推定部３３１、既知未知判定部３３２、及び目的地経由地予測部３３３のそれぞれに供給される。

現在地ノード推定部３３１は、予測プリプロセス部３２から供給される移動履歴データ及び仮想誤差系列データと、学習ブロック１１の学習により得られたユーザ活動モデルを用いて、ユーザの現在地に対応する状態ノード（現在地ノード）を推定する。

ノード系列データの算出にはビタビアルゴリズムが採用されるが、既知未知判定部２０１の状態ノード推定部２２３と同様に、移動履歴データの補間データ部分については、上述した式（７）の、仮想誤差を考慮した観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）が採用される。即ち、補間データ部分については、実データよりもデータの寄与の少ない観測確率が用いられる。これにより、既知未知判定部２０１の状態ノード推定部２２３と同様に、補間データが実際に該当する状態ノードs_iの中心μ_iから大きく離れていたとしても、データ欠落部分に関する最尤状態遷移を推定することができる。

なお、本発明は、取得される移動履歴データにデータ欠落部分があっても破綻せずに状態ノード推定ができるようになること、即ち、現在地ノードの推定が行えるようにすることである。そのためには、データ欠落部分に対しても状態ノードの推定において観測確率が計算できるようになっていればよい。換言すれば、補間データや仮想誤差を生成しない方法でも観測確率が計算できればよい。

そこで、例えば、移動履歴データの補間データ部分については、式（７）の仮想誤差を考慮した観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）ではなく、次式（３９）で表される観測確率（ｏ_ｔ｜s_i）を採用してもよい。

式（３９）は、状態ノードs_iの観測確率が、状態ノードのパラメータ（μ_i、σ_i）や補間データの値に関わらず、全ての状態ノードで等しいと仮定した、最も単純な観測確率の生成方法である。この場合には、補間データや仮想誤差の生成は必要なく、補間したことを示す情報、即ち、補間フラグ系列データのみを予測プリプロセス部３２からもらえばよい。

既知未知判定部３３２は、学習メインプロセス部２３の既知未知判定部２０１と同様に、ユーザの現在地に対応する状態ノードが既知かまたは未知かを判定する。なお、既知未知判定部３３２は、学習メインプロセス部２３の既知未知判定部２０１とは、既知未知ポスト処理部２２７を備えていない点が異なるが、それ以外は同様の構成とされている。

既知未知判定部３３２は、現在地に対応する状態ノードが既知である場合、その結果を目的地経由地予測部３３３に供給する。一方、既知未知判定部３３２は、現在地に対応する状態ノードが未知である場合、その結果を未知状態処理部３３４に供給する。

目的地経由地予測部３３３は、既知と判定された現在地ノードから遷移可能なノード系列とその生起確率を算出する。即ち、目的地経由地予測部３３３は、現在地ノードから目的地の状態ノード（目的地ノード）までのノード系列とその生起確率を算出する。なお、目的地の状態ノードへのノード系列（経路）には経由地のノードが含まれる場合もあるので、予測メインプロセス部３３は、目的地と同時に経由地も予測する。

目的地経由地予測部３３３は、予測結果としての目的地までの経路（ノード系列）を、予測ポストプロセス部３４（図１）に出力する。

一方、現在地ノードが未知である場合に処理を行う未知状態処理部３３４は、「未知状態です」などのエラーメッセージを出力するなどの未知状態対応処理を実行する。

以上のように、予測メインプロセス部３３では、現在地ノードを推定した後、既知未知判定部３３２によって現在地ノードの既知未知判定を行い、既知の場合にのみ、目的地予測を行うようになされている。

学習ブロック１１の学習により得られた確率的状態遷移モデルを用いて推定する現在地ノード推定部３３１は、仮に、ユーザが全く初めての経路を通っており、現在の状態ノードが未知であっても、推定結果を出力することができる。しかしながら、未知状態の状態ノードに対して、その将来を正確に予測することは難しいからである。

［現在地ノード以降のツリー探索処理］
次に、現在地ノードが既知と判定された場合に、目的地経由地予測部３３３が行う、現在地ノードから到達可能な目的地ノードとそこまでの経路を探索する処理（現在地ノード以降のツリー探索処理）について説明する。

到達可能な目的地ノードは、現在地ノードから遷移可能なノードで構成されるツリー構造の中に存在する。従って、ツリーを構成する状態ノードのなかから、目的地ノードを探索することで、目的地を予測することができる。また、現在地ノード以降のツリー探索処理において、経由地の属性が付与された状態ノード（以下、経由地ノードという。）が検出された場合には、経由地までの経路も記憶される。

学習により得られたHMMの各状態s_iは、地図上の所定の点（位置）を表し、状態s_iと状態s_jが結ばれているとき、状態s_iから状態s_jを移動する経路を表していると考えることができる。

この場合、状態s_iに対応する各点は、端点、通過点、分岐点、ループのいずれかに分類することができる。端点とは、自己遷移以外の確率が極めて小さく（自己遷移以外の確率が所定の値以下であり）、次に移動可能な点がない点である。通過点とは、自己遷移以外に有意な遷移が一つある、換言すれば、次に移動可能な点が一つある点である。分岐点とは、自己遷移以外に有意な遷移が二つ以上ある、換言すれば、次に移動可能な点が二つ以上ある点である。ループとは、これまで通過した経路上のどれかと一致する点である。

目的地への経路を探索する場合、異なる経路がある場合には、それぞれの経路について必要時間等の情報を提示することが望まれる。そこで、可能な経路を過不足なく探索するために、次の条件を設定する。
（１）一度分岐した経路は再度合流した場合でも、別の経路とみなす。
（２）探索中の経路が分岐点に達した場合に、未探索リストを作成し、未探索リストの分岐先の探索を行う。
（３）経路内に端点またはループが現れた場合、その経路の探索を終了する。なお、現在の点から、１つ前の点に経路を逆戻りする場合はループに含む。

図６０は、予測メインプロセス部３３の目的地経由地予測部３３３による、現在地ノード以降のツリー探索処理のフローチャートである。

図６０の処理では、最初に、ステップＳ２８１において、目的地経由地予測部３３３は、予測メインプロセス部３３の現在地ノード推定部３３１により推定された現在地ノードを取得し、注目するノードである注目ノードに設定する。

ステップＳ２８２において、目的地経由地予測部３３３は、注目ノードに遷移先があるかを判定する。ステップＳ２８２で、注目ノードに遷移先がないと判定された場合、処理は後述するステップＳ２９１に進む。

一方、ステップＳ２８２で、注目ノードに遷移先があると判定された場合、処理はステップＳ２８３に進み、目的地経由地予測部３３３は、遷移先が目的地ノードであるかを判定する。

ステップＳ２８３で、遷移先が目的地ノードであると判定された場合、処理はステップＳ２８４に進み、目的地経由地予測部３３３は、これまでの経路（状態ノード系列）を内部メモリの探索結果リストに記憶する。ステップＳ２８４の後、処理はステップＳ２９１に進む。

一方、ステップＳ２８３で、遷移先が目的地ノードではないと判定された場合、処理はステップＳ２８５に進み、目的地経由地予測部３３３は、遷移先が経由地ノードであるかを判定する。

ステップＳ２８５で、遷移先が経由地ノードであると判定された場合、処理はステップＳ２８５に進み、目的地経由地予測部３３３は、これまでの経路（状態ノード系列）を内部メモリの探索結果リストに記憶する。

目的地までの代表経路、到達確率、および所要時間を予測結果として出力するためには、探索結果リストには、遷移先が目的地であるときの経路のみを記憶すればよい。しかしながら、遷移先が経由地であるときの経路も記憶することにより、経由地までの経路、確率、および時間が必要になったときに即座に求めることができる。

ステップＳ２８５で遷移先が経由地ノードではないと判定された場合、または、ステップＳ２８６の後、処理はステップＳ２８７に進み、目的地経由地予測部３３３は、遷移先が分岐点かを判定する。

ステップＳ２８７で、遷移先が分岐点であると判定された場合、処理はステップＳ２８８に進み、目的地経由地予測部３３３は、分岐先の２つの状態ノードを内部メモリの未探索リストに記憶する（追加する）。ステップＳ２８８の後、処理はステップＳ２９１に進む。なお、分岐先が探索中の経路のいずれかの状態ノードである場合はループとなるので、目的地経由地予測部３３３は、その分岐先の状態ノードについては未探索リストに記憶させない。

ステップＳ２８７で、遷移先が分岐点ではないと判定された場合、処理はステップＳ２８９に進み、目的地経由地予測部３３３は、遷移先が端点であるかを判定する。ステップＳ２８９で、遷移先が端点であると判定された場合、処理はステップＳ２９１に進む。

一方、ステップＳ２８９で、遷移先が端点ではないと判定された場合、処理はステップＳ２９０に進み、目的地経由地予測部３３３は、遷移先の状態ノードを注目ノードに設定し、処理をステップＳ２８２に戻す。即ち、遷移先が、目的地ノード、経由地ノード、分岐点、および端点のいずれでもない場合には、探索対象の状態ノードが、遷移先の次の状態ノードに進められる。

ステップＳ２８４，Ｓ２８８、またはＳ２８９の処理の後、処理がステップＳ２９１に進められた場合、目的地経由地予測部３３３は、未探索リストに登録されている状態ノードがあるか、即ち、未探索の分岐先があるかを判定する。

ステップＳ２９１で、未探索の分岐先があると判定された場合、処理はステップＳ２９２に進み、目的地経由地予測部３３３は、未探索リストの最上位の分岐先の状態ノードを、注目ノードに設定し、注目ノードまでの経路を読み出す。そして、処理がステップＳ２８２に戻される。

一方、ステップＳ２９１で、未探索の分岐先がないと判定された場合、ツリー探索処理は終了する。

以上のように、ツリー探索処理では、ユーザの現在地ノードから遷移可能な状態ノードでなるツリー構造において、現在地ノードを出発点として、目的地ノード若しくは遷移先のない終端ノード（端点）になるまで全ての状態ノードを探索する処理が行われる。そして、ユーザの現在地から目的地までの経路が、現在地ノードからの状態ノード系列として、探索結果リストに記憶される。なお、ツリー探索処理は、探索回数が終了条件としての所定の回数を満たすまで探索するようにしてもよい。

［ツリー探索処理の例］
図６１を参照して、目的地経由地予測部３３３のツリー探索処理についてさらに説明する。

図６１の例において、状態s_１が現在地である場合、次のような３通りの経路が少なくとも探索されることになる。１つめの経路は、状態s_１から状態s_５，状態s_６等を経由して状態s_１０までの経路（以下、経路Ａともいう。）である。２つめの経路は、状態s_１から状態s_５，状態s_１１，状態s_１４，状態s_２３，状態s_２９等を経由して状態s_２６までの経路（以下、経路Ｂともいう。）である。３つめの経路は、状態s_１から状態s_５，状態s_１１，状態s_１９，状態s_２３，状態s_２９等を経由して状態s_２６までの経路（以下、経路Ｃともいう。）である。

目的地経由地予測部３３３は、探索された各経路が選択される確率（経路の選択確率）を計算する。経路の選択確率は、経路を構成する状態間の遷移確率を順次乗算することで求められる。ただし、次の状態に遷移する場合のみを考慮し、その場所に滞留する場合は考慮する必要がないので、学習により求められた各状態の状態遷移確率a_ijから、自己遷移確率を除いて規格化された遷移確率[a_ij]を用いて、経路の選択確率が求められる。

自己遷移確率を除いて規格化された遷移確率[a_ij]は、次式（４０）で表すことができる。

ここで、δは、クロネッカー関数を表し、添え字のｉとｊが一致するときのみ１となり、それ以外は０となる関数である。

したがって、例えば、図６１の状態s_５の状態遷移確率a_ijが、自己遷移確率a_５，５＝０．５，遷移確率a_５，６＝０．２，遷移確率a_５，１１＝０．３である場合、状態s_５から状態s_６または状態s_１１に分岐する場合の遷移確率[a_５，６]および遷移確率[a_５，１１]は、それぞれ、０．４，０．６となる。

探索された経路の状態s_iのノード番号ｉが、（ｙ_１，ｙ_２，・・・，ｙ_ｎ）であるとき、この経路の選択確率は、規格化された遷移確率[a_ij]を用いて、次式（４１）で表すことができる。

なお、実際には、通過点での規格化された遷移確率[a_ij]は１であるので、経路の選択確率は、分岐する際の規格化された遷移確率[a_ij]を順次乗算すれば足りる。従って、目的地経由地予測部３３３は、図６０のツリー探索処理を実行しながら、同時に、選択された経路の選択確率を式（４１）により計算することができる。

図６１の例では、経路Ａの選択確率は、０．４である。また、経路Ｂの選択確率は、０．２４＝０．６×０．４である。経路Ｃの選択確率は、０．３６＝０．６×０．６である。そして、計算された経路の選択確率の総和は１＝０．４＋０．２４＋０．３６であり、過不足ない探索を実現することができることがわかる。

図６１の例では、現在地の状態s_１から注目ノードが順次進められ、状態s_４が注目ノードであるとき、遷移先の状態s_５が分岐点であるため、図６０のステップＳ２８８が実行され、図６２Ａに示されるように、分岐先の状態s_１１と状態s_６が未探索リストに記憶される。ここで、状態s_１１と状態s_６では、状態s_１１の選択確率が高いため、状態s_１１が未探索リストの上位に記憶される。

そして、図６０のステップＳ２９１およびＳ２９２が実行され、未探索リストの上位に記憶されている、状態s_１１が注目ノードに設定され、状態s_１１以降の経路が探索される。状態s_１１が注目ノードに設定されたとき、図６２Ｂに示されるように、未探索リストから、状態s_１１が削除される。

そして、状態s_１１を注目ノードとして探索が進められると、状態s_１４と状態s_１９の分岐先が検出されるので、図６０のステップＳ２８８が実行され、状態s_１４と状態s_１９が未探索リストに記憶される。このとき、状態s_１４と状態s_１９は、現在の未探索リストの最上位に記憶され、また、状態s_１４と状態s_１９では、状態s_１９の選択確率が高いため、状態s_１９が状態s_１４より上位に記憶される。従って、未探索リストは、図６２Ｃに示されるようになる。

以下同様に、図６０のステップＳ２９１およびＳ２９２が実行され、未探索リストの上位に記憶されている、状態s_１９が注目ノードに設定され、状態s_１９以降の経路が探索される。状態s_１９が注目ノードに設定されたとき、図６２Ｄに示されるように、未探索リストから、状態s_１９が削除される。

以上のように、目的地経由地予測部３３３によるツリー探索処理は、検出された分岐先を未探索リストの最上位に記録させることで、分岐先の経路のうち、より選択確率の高い方を先に探索する深さ優先アルゴリズムにより処理が実行される。

なお、探索の深さが深くなる、換言すれば、現在地ノードを最上位として下位の階層が深くなることで、全てを探索することが難しいことも考えられる。そのような場合には、例えば、１）遷移確率の低い分岐先は探索しない、２）生起確率の低い経路は探索しない、３）探索する深さに制限を加える、４）探索する枝の数に制限を加える、などの条件を加えて、途中で探索を終了するようにしてもよい。

図６３は、ツリー探索処理における探索結果リストの例を示している。

深さ優先アルゴリズムによりツリー探索処理を行うことにより、探索結果リストには、選択確率の高い経路から順に登録される。

図６３の例では、探索結果リストの１番目には、目的地ｇ_１までの経路Ｒ_１（ｒ_１，ｒ_２，ｒ_３，ｒ_４）が登録され、この経路Ｒ_１が選択される確率はＰ_１で、経路Ｒ_１を使って目的地ｇ_１までにかかる時間がＴ_１である。探索結果リストの２番目には、目的地ｇ_２までの経路Ｒ_２（ｒ_１，ｒ_２，ｒ_３，ｒ_５）が登録され、この経路Ｒ_２が選択される確率はＰ_２で、経路Ｒ_２を使って目的地ｇ_２までにかかる時間がＴ_２である。探索結果リストの３番目には、目的地ｇ_３までの経路Ｒ_３（ｒ_１，ｒ_２，ｒ_６）が登録され、この経路Ｒ_３が選択される確率はＰ_３で、経路Ｒ_３を使って目的地ｇ_３までにかかる時間がＴ_３である。

探索結果リストの４番目には、経由地ｗ_２までの経路Ｒ_４（ｒ_１，ｒ_２，ｒ_７）が登録され、この経路Ｒ_４が選択される確率はＰ_４で、経路Ｒ_４を使って経由地ｗ_２までにかかる時間がＴ_４である。探索結果リストの５番目には、経由地ｗ_１までの経路Ｒ_５（ｒ_１，ｒ_８）が登録され、この経路Ｒ_５が選択される確率はＰ_５で、経路Ｒ_５を使って経由地ｗ_１までにかかる時間がＴ_５である。

探索結果リストの６番目には、目的地ｇ_３までの経路Ｒ_６（ｒ_１，ｒ_８，ｗ_１，ｒ_８，ｒ_９）が登録され、この経路Ｒ_６が選択される確率はＰ_６で、経路Ｒ_６を使って目的地ｇ_３までにかかる時間がＴ_６である。探索結果リストの７番目には、この経路Ｒ_７が選択される確率はＰ_７で、目的地ｇ_２までの経路Ｒ_７（ｒ_１，ｒ_１０，ｒ_１１）が登録され、経路Ｒ_７を使って目的地ｇ_２までにかかる時間がＴ_７である。

目的地または経由地まで、各経路が選択される確率は、上述した式（４１）により計算される。さらに、目的地までの経路が複数存在する場合、その目的地までの複数の経路の選択確率の和が、目的地の到達確率となる。

従って、図６３の例では、目的地ｇ_２へ行くには、経路Ｒ_２を利用する場合と、経路Ｒ_７を利用する場合があり得るので、目的地ｇ_２の到達確率は、は（Ｐ_２＋Ｐ_７）となる。同様に、目的地ｇ_３へ行くには、経路Ｒ_３を利用する場合と、経路Ｒ_６を利用する場合があり得るので、目的地ｇ_３の到達確率は、は（Ｐ_３＋Ｐ_６）となる。なお、目的地ｇ_１の到達確率は、経路Ｒ_１が選択される確率Ｐ_１と同一である。

［予測ポストプロセス部３４の処理］
次に、予測ポストプロセス部３４が行う処理について説明する。

目的地または経由地まで、選択された経路で移動したときにかかる時間の求め方について説明する。

例えば、現在時刻ｔ_１の現在地が状態ｓ_ｙ１であり、時刻（ｔ_１，ｔ_２，・・・，ｔ_ｇ）における決定された経路が（ｓ_ｙ１，ｓ_ｙ２，・・・，ｓ_ｙｇ）であるとする。換言すれば、決定された経路の状態s_iのノード番号ｉが（ｙ_１，ｙ_２，・・・，ｙ_ｇ）であるとする。以下、簡単のため、位置に相当する状態s_iを、単に、そのノード番号ｉで表わす場合もある。

現在時刻ｔ_１での現在地ｙ_１は、現在地ノード推定部３３１により確定しているので、現在時刻ｔ_１の現在地がｙ_１である確率Ｐ_ｙ１（ｔ_１）は、
Ｐ_ｙ１（ｔ_１）＝１である。また、現在時刻ｔ_１にｙ_１以外の他の状態にいる確率は０である。

一方、所定の時刻ｔ_ｎにノード番号ｙ_ｎにいる確率Ｐ_ｙｎ（ｔ_ｎ）は、

で表すことができる。式（４２）の右辺第一項は、もともとその位置ｙ_ｎにいて、自己遷移した場合の確率を表し、右辺第二項は、１つ前の位置ｙ_ｎ−１から位置ｙ_ｎに遷移してきた場合の確率を表している。式（４２）では、経路の選択確率の計算とは異なり、学習により得られた状態遷移確率a_ijがそのまま利用される。

目的地ｙ_ｇへ到達するときの時刻ｔ_ｇの予測値<ｔ_ｇ>は、「その直前の時刻ｔ_ｇ−１に目的地ｙ_ｇの１つ前の位置ｙ_ｇ−１にいて、時刻ｔ_ｇに目的地ｙ_ｇに移動する確率」を用いて、

と表すことができる。

即ち、予測値<ｔ_ｇ>は、現在時刻から、「その直前の時刻ｔ_ｇ−１に状態ｓ_ｙｇの１つ前の状態ｓ_ｙｇ−１にいて、時刻ｔ_ｇに状態ｓ_ｙｇに移動するとき」までの時間の期待値で表される。

以上より、所定の目的地または経由地まで、選択された経路で移動したときにかかる時間は、上述した式（４３）の予測値<ｔ_ｇ>により求められる。

図６３の例を使用して、目的地までの経路が探索された場合に、代表経路として選択する代表経路選択処理について説明する。

図６３のような探索結果リストが得られた場合、探索結果リストには、選択確率が高いものから順に（上位に）登録されるので、選択確率が上位であり、目的地も異なる、探索結果リストの１番目乃至３番目が予測結果として出力される。即ち、経目的地ｇ_１とその経路Ｒ_１、目的地ｇ_２とその経路Ｒ_２、目的地ｇ_３とその経路Ｒ_３が、目的地とその代表経路として選択される。

次に、探索結果リストの４番目および５番目は経由地までの経路であるためスキップされ、探索結果リストの６番目の、目的地ｇ_３へ到達するための経路Ｒ_６を代表経路とするかが検討される。この経路Ｒ_６は、既に代表経路として選択されている、同一の目的地ｇ_３の経路Ｒ_３には含まれていない経由地ｗ_１を利用するものとなっている。したがって、目的地ｇ_３へ到達するための経路Ｒ_６も、代表経路として選択される。

次に、探索結果リストの７番目の、目的地ｇ_２へ到達するための経路Ｒ_７を代表経路とするかが検討される。この経路Ｒ_７は、既に代表経路として選択されている、同一の目的地ｇ_２と同じく、所定の経由地を経由しないものとなっている。したがって、目的地ｇ_２へ到達するための経路Ｒ_７は、代表経路として選択されない。

このように、代表経路選択処理では、ほぼ同一の経路を通る、似たような経路は提示せず、ユーザにとって有益と考えられる、異なる経由地を通る経路は、同一目的地であっても、予測結果として提示することができる。

なお、探索結果リストの６番目の、目的地ｇ_３へ到達するための経路Ｒ_６は、［背景技術］に示した先願２の方法では、経由地ｗ_１で探索が終了されていた。しかしながら、予測システム１によれば、経由地ｗ_１で終了することなく、経由地ｗ_１を利用して目的地ｇ_３へ到達する経路まで探索することが可能となっている。

予測システム１によれば、学習により得られた状態ノードに、目的地と経由地を区別して属性を付与することで、途中の経由地を目的地として予測することを防止することができる。また、同一目的地への経路が複数探索された場合、ほぼ同一の経路を通る、似たような経路は提示せず、ユーザにとって有益と考えられる、異なる経由地を通る経路を提示することができる。

図６４は、予測ポストプロセス部３４が行う代表経路選択処理のフローチャートである。

初めに、ステップＳ３０１において、予測ポストプロセス部３４は、目的地経由地予測部３３３で作成された探索結果リストから、経由地までの経路を除外し、目的地のみの探索結果リストである目的地リストを生成する。

ステップＳ３０２において、予測ポストプロセス部３４は、目的地リストを目的地別に並び替えた目的地別目的地リストに変更する。このとき、予測ポストプロセス部３４は、同一の目的地内における順位を変えないように目的地別目的地リストを生成する。

ステップＳ３０３において、予測ポストプロセス部３４は、目的地ごとの到達確率を算出する。目的地までの経路が１つしかない場合には、その経路の選択確率が到達確率となり、目的地まで複数の経路が存在する場合には、複数の選択確率（生起確率）の和が、その目的地の到達確率となる。

ステップＳ３０４において、予測ポストプロセス部３４は、代表経路の選択に経由地を考慮するかを判定する。ステップＳ３０４で、経由地を考慮しないと判定された場合、処理はステップＳ３０５に進み、予測ポストプロセス部３４は、目的地別に、最上位の経路を、各目的地の代表経路として選択し、処理を終了する。その結果、目的地まで複数の経路が存在する場合には、選択確率の高い目的地までの経路が、各目的地の代表経路とされ、その所要時間が、目的地までの所要時間として提示される。なお、目的地が多数ある場合には、上位から、予め設定した個数の目的地のみを提示するようにさせることができる。

一方、ステップＳ３０４で、経由地を考慮すると判定された場合、処理はステップＳ３０６に進み、予測ポストプロセス部３４は、目的地別目的地リストを、経由地なしの目的地別目的地リストと、経由地ありの目的地別目的地リストに分類する。

そして、ステップＳ３０７において、予測ポストプロセス部３４は、経由地なしの目的地別目的地リストから、目的地別に、最上位の経路を代表経路として選択する。これにより、代表経路としての、目的地ごとの経由地なしの経路が決定される。

次に、ステップＳ３０８において、予測ポストプロセス部３４は、経由地ありの目的地別目的地リストを、さらに、経由地別に分類する。

ステップＳ３０９において、予測ポストプロセス部３４は、経由地別の、経由地ありの目的地別目的地リストから、目的地別に、各経由地の最上位の経路を、代表経路として選択する。これにより、代表経路としての、目的地ごとの経由地ありの経路が決定される。その結果、目的地までの経路として、経由地なしの経路と経由地ありの経路が存在する場合には、その両方が、各目的地の代表経路とされ、それぞれの所要時間が、目的地までの所要時間として提示される。

以上により、代表経路選択処理は終了する。このように、目的地への経路が複数存在する場合、生起確率の上位を複数提示するよりも、経由地によって分類して提示する方が、ユーザが実際に感じる予測に近いものとすることができる。

［予測ブロック１３全体の処理］
図６５のフローチャートを参照して、予測ブロック１３全体の処理について説明する。

初めに、ステップＳ３２１において、バッファリング部３１は、予測処理のため、リアルタイムに取得される移動履歴データ（予測用データ）をバッファリングする。

ステップＳ３２２において、予測プリプロセス部３２は、予測プリプロセス処理を実行する。具体的には、予測プリプロセス部３２は、移動履歴データの分割の処理、移動履歴データの明らかな異常を除去する処理、および、移動履歴データのデータ欠落部分に対して線形補間またはホールド補間を行う補間処理を実行する。ここで、補間処理により求めた３次元データ（補間データ）か否かを示す補間フラグ系列データと、仮想誤差系列データも合わせて作成される。そして、予測プリプロセス部３２は、補間処理後の移動履歴データと、それに対応する補間フラグ系列データ及び仮想誤差系列データを予測メインプロセス部３３に出力する。

ステップＳ３２３において、予測メインプロセス部３３は、学習ブロック１１の学習により得られたユーザ活動モデルのパラメータを、ユーザ別モデルパラメータ記憶部１２から取得する。このパラメータを取得する処理は、図６５の処理開始前に予め実行するようにしてもよい。

ステップＳ３２４において、予測メインプロセス部３３の現在地ノード推定部３３１は、学習ブロック１１の学習により得られたパラメータを用いたユーザ活動モデルにより、ユーザの現在地に対応する状態ノード（現在地ノード）を推定する。より具体的には、現在地ノード推定部３３１は、学習ブロック１１の学習により得られたパラメータを用いたユーザ活動モデルにより、移動履歴データに対応するノード系列データを算出する。算出されたノード系列データの最後の状態ノードが現在地ノードに対応する。

ノード系列データの算出にはビタビアルゴリズムが採用されるが、既知未知判定部２０１の状態ノード推定部２２３と同様に、移動履歴データの補間データ部分については、例えば、式（７）の仮想誤差を考慮した観測確率Ｐ（ｏ_ｔ，ｅ_ｔ｜s_i）が採用される。これにより、既知未知判定部２０１の状態ノード推定部２２３と同様に、補間データが実際に該当する状態ノードs_iの中心μ_iから大きく離れていたとしても、データ欠落部分に関する最尤状態遷移を推定することができる。また、上述したように、全ての状態ノードにおいて観測確率が等しいとする式（３９）で表される観測確率（ｏ_ｔ｜s_i）を採用してもよい。

ステップＳ３２５において、既知未知判定部３３２は、推定された現在地ノードが既知状態か、または、未知状態かを判定する既知未知判定処理を実行する。

より詳しく説明すると、既知未知判定部３３２は、学習メインプロセス部２３の既知未知判定部２０１と基本的に同様の構成とされるから、初めに、学習により得られたパラメータを用いたユーザ活動モデルに対して、１つの未知状態ノードを追加した未知状態追加モデルが構築される。次に、未知状態追加モデルに対して、補間データの仮想誤差を考慮したビタビアルゴリズムを実行することにより、最も尤度の高い状態系列ノードが求められる。そして、仮想誤差に対して単調増加の補正項（ａ＋ｂ・e_t）を乗算した観測尤度の期待値L(t)’が計算され、この観測尤度の期待値L(t)’を用いて既知未知判定が行われる。

ステップＳ３２５の既知未知判定処理の結果、現在地ノードが未知であると判定された場合、処理はステップＳ３２６に進み、既知未知判定部３３２は、その判定結果を未知状態処理部３３４に供給する。未知状態処理部３３４は、「未知状態です」などのエラーメッセージを出力するなどの未知状態対応処理を実行して、処理を終了する。

一方、ステップＳ３２５の既知未知判定処理の結果、現在地ノードが既知であると判定した場合、処理はステップＳ３２７に進み、既知未知判定部３３２は、その判定結果を目的地経由地予測部３３３に供給する。ステップＳ３２７において、目的地経由地予測部３３３は、図６０を参照して説明した、現在地ノード以降のツリー探索処理を実行する。ツリー探索処理と同時に、目的地および経由地までの経路（ノード系列）の生起確率も、式（４１）により求められる。

ステップＳ３２８において、予測ポストプロセス部３４は、図６４を参照して説明した、代表経路の選択処理を実行する。

ステップＳ３２９において、予測ポストプロセス部３４は、上述した式（４３）により、選択された各代表経路の所要時間を算出する。

ステップＳ３３０において、予測ポストプロセス部３４は、予測した目的地までの代表経路、到達確率、および所要時間を予測結果として出力して、処理を終了する。

以上のように、予測ブロック１３の処理では、推定された目的地ノードおよび経由地ノード並びに現在地ノードについての情報と、学習により得られたパラメータで表現されるユーザ活動モデルとを用いて、ユーザの現在地から目的地までの経路が探索される。学習により得られた状態ノードに目的地と経由地の属性が付与されているので、経由地を目的地として予測することを防止することができる。

また、学習により得られた状態ノードに目的地と経由地の属性が付与されているので、同一目的地への経路であっても、経由地なしの経路と、経由地ありの経路を代表経路として出力することができる。

さらに、リアルタイムに取得した現在地を含む移動履歴データにデータ欠落部分があった場合でも、予測ブロック１３は、ホールド補間処理により補間データを生成し、仮想誤差を設定する。そして、予測ブロック１３は、状態ノード系列の推定において、補間データについては、状態ノードの観測確率として、設定した仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、補間処理後の移動履歴データに対応する状態ノード系列を（補間データにより破綻することなく）求めることができる。これにより、ユーザの現在地に相当する現在地ノードを推定することができ、また、現在地から目的地までの経路を求めることができる。即ち、リアルタイムに取得される現在地のデータに欠落があった場合でも、現在地と目的地の予測ができる。

［コンピュータの構成例］
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

図６６は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

コンピュータにおいて、CPU（Central Processing Unit）４１１，ROM（Read Only Memory）４１２，RAM（Random Access Memory）４１３は、バス４１４により相互に接続されている。

バス４１４には、さらに、入出力インタフェース４１５が接続されている。入出力インタフェース４１５には、入力部４１６、出力部４１７、記憶部４１８、通信部４１９、ドライブ４２０、およびGPSセンサ４２１が接続されている。

入力部４１６は、キーボード、マウス、マイクロホンなどよりなる。出力部４１７は、ディスプレイ、スピーカなどよりなる。記憶部４１８は、ハードディスクや不揮発性のメモリなどよりなる。通信部４１９は、ネットワークインタフェースなどよりなる。ドライブ４２０は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体４２２を駆動する。上述のセンサデバイスとしてのGPSセンサ４２１は、現在地の位置（緯度および経度）のデータと、そのときの時刻からなる３次元データを出力する。

以上のように構成されるコンピュータでは、CPU４１１が、例えば、記憶部４１８に記憶されているプログラムを、入出力インタフェース４１５及びバス４１４を介して、RAM４１３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU４１１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体４２２に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブル記録媒体４２２をドライブ４２０に装着することにより、入出力インタフェース４１５を介して、記憶部４１８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部４１９で受信し、記憶部４１８にインストールすることができる。その他、プログラムは、ROM４１２や記憶部４１８に、あらかじめインストールしておくことができる。

なお、本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる場合はもちろん、必ずしも時系列的に処理されなくとも、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで実行されてもよい。

本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

１予測システム，１１学習ブロック，１３予測ブロック，２２学習プリプロセス部，２３学習メインプロセス部，２４学習ポストプロセス部，２５目的地経由地検出部，３２予測プリプロセス部，３３予測メインプロセス部，３４予測ポストプロセス部，７３再サンプリング処理部，２０１既知未知判定部，２２３状態ノード推定部，２２４サンプル別尤度計算部，３０２予測用データ生成部，３１３補間処理部，３１４移動属性識別付与部，３１５仮想誤差生成部，３３１現在地ノード推定部，３３２既知未知判定部，３３３目的地経由地予測部

Claims

学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める学習手段と、
前記学習手段により求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算する予測用データ生成手段と、
前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
探索された前記目的地への到達確率と所要時間を算出する算出手段と
を備えるデータ処理装置。
前記現在地推定手段により得られた前記現在地ノードが既知の状態ノードであるか、または、未知の状態ノードであるかを判定する既知未知判定手段をさらに備え、
前記探索手段は、前記既知未知判定手段により、前記現在地ノードが既知の状態ノードであると判定された場合に、ユーザの現在地から目的地までの経路を探索する
請求項１に記載のデータ処理装置。
前記既知未知判定手段は、前記状態ノードの観測確率から算出される各状態ノードの観測尤度の期待値に基づいて既知未知の判定を行い、前記データ欠落部分については実データによる値よりも大きくなるように補正する補正項を付加した前記観測尤度の期待値を用いる
請求項２に記載のデータ処理装置。
前記予測用データ生成手段は、現時点を含まない過去のデータ欠落部分に対しては線形補間、現時点を含むデータ欠落部分に対してはホールド補間による補間処理を行う
請求項１に記載のデータ処理装置。
前記予測用データ生成手段は、前記線形補間により補間処理した移動履歴データについては、補間データと、データ欠落直前との距離か、または、データ復活直後の移動履歴データとの距離のいずれか小さい方を、前記仮想誤差として計算し、前記ホールド補間により補間処理した移動データについては、データが欠落してからの経過時間に応じた所定の関数で前記仮想誤差を計算する
請求項４に記載のデータ処理装置。
前記学習手段は、
前記確率モデルのパラメータを一旦求めた後、新たな学習用データとしての移動履歴データが供給され、前記新たな学習用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間データを含む前記新たな学習用データを生成する学習用データ生成手段と、
前記補間データを含む前記新たな学習用データが、既知の経路の移動履歴データであるか、または、未知の経路の移動履歴データであるかを判定する既知未知判定手段と、
前記既知未知判定手段において、前記既知の経路の移動履歴データであると判定された前記補間データについては、既に求めた前記確率モデルである既存モデルのパラメータのうち、前記状態ノードの確率分布パラメータの更新をしないようにしたパラメータ更新手段と
を備える
請求項１に記載のデータ処理装置。
ユーザの移動履歴データを処理するデータ処理装置の、
学習手段が、学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求め、
目的地経由地推定手段が、求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定し、
予測用データ生成手段が、前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算し、
現在地推定手段が、前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定し、
探索手段が、推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索し、
算出手段が、探索された前記目的地への到達確率と所要時間を算出する
ステップを含むデータ処理方法。
コンピュータを、
学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルとして表したときの確率モデルのパラメータを求める学習手段と、
前記学習手段により求められた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを予測用データとして取得し、取得した前記予測用データにデータ欠落部分がある場合に、そのデータ欠落部分を補間処理により生成し、前記補間処理により生成した補間データに対する実データとの仮想誤差を計算する予測用データ生成手段と、
前記データ欠落部分が補間された前記予測用データを、学習により得られた前記パラメータを用いた前記確率モデルに入力して、前記データ欠落部分が補間された前記予測用データに対応する状態ノード系列を推定する前記状態ノード系列の推定において、前記補間データについては、前記状態ノードの観測確率として、前記仮想誤差を用いて、実データよりもデータの寄与の少ない観測確率を用いることで、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
探索された前記目的地への到達確率と所要時間を算出する算出手段
として機能させるプログラム。