JP5469876B2

JP5469876B2 - 行動予測装置及びプログラム

Info

Publication number: JP5469876B2
Application number: JP2009034008A
Authority: JP
Inventors: 正彬西野; 智広山田; 俊一瀬古; 学茂木
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2009-02-17
Filing date: 2009-02-17
Publication date: 2014-04-16
Anticipated expiration: 2029-02-17
Also published as: JP2010191589A

Description

この発明は、ユーザの現在の滞在地と過去の行動パターンをもとに、当該ユーザの今後の行動を予測する行動予測装置及びプログラムに関する。

従来、時系列データから頻出なパターンを抽出する手法として、系列マイニングの手法が知られている。この手法は、顧客ＩＤと購入した商品及び購入日時を記録した購買記録データベースが存在する場合に、この購買記録データベースに記録された購買データをもとに、顧客による典型的な商品購買パターンを抽出するものである。

また、最近では商品購買パターンの抽出用途に止まらず、ユーザの滞在地の遷移を表す行動パターンを抽出するために、上記系列マイニングの手法を適用する方法が提案されている。この方法は、例えば先ずユーザが所持する端末のＧＰＳ（Global Positioning System）受信データから、マイニング処理によってユーザが滞在した場所を抽出し、さらに滞在場所間の遷移行動をマルコフモデルとして表現して遷移確率を計算することで、ある場所に滞在しているユーザが次に滞在する場所を予測するものである（例えば、非特許文献１を参照。）。

Daniel Ashbrook, Thad Starner, "Using GPS to Learn Significant Locations and Predict Movement across Multiple Users" , Peasonal and Ubiquitous Computing, 2003 7:257-286

ところが、上記従来の方法は滞在地間の遷移確率に基づいて行動予測を行うものとなっており、時刻を考慮していないため、予測を誤るおそれがあった。例えば、ユーザが通勤である駅を使用している場合に、朝にその駅に滞在している状況と、夜に同じ駅に滞在している状況とでは、その人が次に向かう先は異なるのが普通である。しかし、時刻を考慮せずに場所間の遷移確率のみで次の行き先を予測しようとすると、行き先の予測結果が正反対になる可能性がある。

この発明は上記事情に着目してなされたもので、その目的とするところは、ユーザの滞在地と滞在時刻の両方を考慮することでユーザの行動をより高精度に予測できるようにした行動予測装置及びプログラムを提供することにある。

上記目的を達成するためにこの発明の一観点は、ユーザの滞在地及びその滞在時刻を表す情報を含む滞在地データを取得し、この取得された滞在地データの集合を滞在履歴記憶部に格納する手段と、前記滞在履歴記憶部に格納された滞在地データの集合に対し系列マイニングの処理を実行して、前記ユーザの特徴的な遷移行動を滞在地の系列と当該滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値を含む滞在時刻情報とにより表した行動パターン情報を生成し、この生成された行動パターン情報の集合を行動パターン記憶部に格納する行動パターン生成手段と、適合行動パターン選択手段とを備える。そして、この適合行動パターン選択手段により、前記取得された滞在地データと、前記行動パターン記憶部に格納された行動パターン情報の集合に基づいて、前記滞在地データに含まれる滞在地及びその滞在時刻情報と対応する滞在地及びその滞在時刻情報を含む適合行動パターン情報を前記行動パターン情報の集合の中から選択するように構成したものである。
より具体的には、適合行動パターン選択手段として、前記行動パターン記憶部に格納された行動パターン情報の集合の中から、前記取得された滞在地データに含まれる滞在地と等しい滞在地を抽出する手段と、前記抽出された滞在地の各々について、前記取得された滞在地データに含まれる滞在地との一致の度合いを表す尤度を、前記取得された滞在地データに含まれる滞在時刻と、前記抽出された滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値とに基づいて計算する手段と、前記計算された尤度に基づいて、当該尤度が予め設定した条件を満たす滞在地を前記抽出された滞在地の中から選択する手段と、前記選択された滞在地と当該滞在地を含む行動パターンを表す情報を適合行動パターン情報として出力する手段とを備えたものである。

したがってこの発明の一観点によれば、ユーザの現在の滞在地と、当該ユーザの過去の行動パターンの集合とから、ユーザの現在の行動形態に適合する行動パターンを探索する際に、ユーザの滞在地だけでなく当該滞在地におけるユーザの滞在時刻情報も考慮されて行動パターンが探索される。このため、滞在地のみに基づいて行動パターンを選択する場合に比べ、ユーザの現在の行動形態に適合する行動パターンを高精度に選択することが可能となる。

さらに、滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散をもとに、ユーザの現在の滞在地と過去の行動パターン中の滞在地との一致の度合いが尤度として算出され、その算出結果をもとにユーザの現在の行動形態に適合する行動パターンが選択される。このため、ユーザの現在の滞在地及び滞在時刻と滞在地及び時刻が完全一致する行動パターンを選択する場合に比べ、柔軟性の高い選択が可能となる。

また、この発明の一観点は行動予測処理手段をさらに備え、この行動予測処理手段により、適合行動パターン選択手段により選択された適合行動パターン情報に含まれる滞在地の系列及び滞在時刻情報に基づいて、前記ユーザが以後移動する滞在地とその到着時刻を予測し、この予測結果を表す情報を出力することも特徴とする。
このようにすると、ユーザが今後移動する滞在地とその到着時刻が出力され、例えば情報管理者に提示される。このため、ユーザの行動を把握しようとする場合に情報管理者は、行動パターン情報からユーザの目的地と到着時刻を予測する作業が不要となり、これにより作業性の向上と予測精度の向上を図ることができる。

すなわちこの発明によれば、ユーザの滞在地と滞在時刻の両方を考慮することでユーザの行動をより高精度に予測できるようにした行動予測装置及びプログラムを提供することができる。

この発明の一実施形態に係わる行動予測装置のハードウエア及びソフトウエアの構成を示すブロック図である。図１に示した行動予測装置の機能構成を示すブロック図である。図１に示す行動予測装置により得られるユーザの滞在地データの一例を示す図である。図１に示した行動予測装置により得られるユーザの滞在地データの一例を示す図である。図１に示した行動予測装置により得られるユーザの滞在パターンの一例を示す図である。図１に示した行動予測装置による行動パターン生成処理の全体の手順と内容を示すフローチャートである。図２に示した出現頻度しきい値決定手段の機能構成の第１の実施例を示すブロック図である。図７に示した出現頻度しきい値決定手段による、滞在数を用いたしきい値決定処理の手順と内容を示すフローチャートである。滞在パターン集合と滞在地集合との対応関係を一例を示す図である。図８に示した、滞在数を用いたしきい値決定処理のうちの滞在数カウント処理の手順と内容を示すフローチャートである。図８に示した、滞在数を用いたしきい値決定処理のうちの滞在数からのしきい値決定処理の手順と内容を示すフローチャートである。出現頻度と滞在数との関係の一例を示す図である。図２に示した出現頻度しきい値決定手段の機能構成の第２の実施例を示すブロック図である。図１３に示した出現頻度しきい値決定手段による、パターン数を用いた出現頻度しきい値決定処理の手順と内容を示すフローチャートである。出現頻度しきい値とパターン総数及び近似式との関係の一例を示す図である。出現頻度しきい値とパターン総数及び近似誤差との関係の一例を示す図である。図２に示した出現頻度しきい値決定手段の機能構成の第３の実施例を示すブロック図である。図１７に示した出現頻度しきい値決定手段による、被覆率を用いた出現頻度しきい値決定処理の手順と内容を示すフローチャートである。図２に示した行動パターン生成手段により生成される行動パターンの一例を示す図である。図２に示した行動予測処理手段による行動予測処理の全体の手順と内容を示すフローチャートである。図２０に示したフローチャート中の適合行動パターン探索処理の手順と内容を示すフローチャートである。図２０に示したフローチャート中の目的地予測処理の手順と内容を示すフローチャートである。

以下、図面を参照してこの発明に係わる実施形態を説明する。
図１は、この発明の一実施形態に係わる行動予測装置のハードウエア及びソフトウエアの構成を示すブロック図である。
行動予測装置１は、例えばユーザが所持する携帯端末又はパーソナル・コンピュータ等のユーザ端末装置との間で、ＩＰ（Internet Protocol）網等の通信ネットワークを介して通信が可能なサーバ装置からなる。

行動予測装置１は、マイクロプロセッサからなる中央処理ユニット（ＣＰＵ；Central Processing Unit）１１を備え、このＣＰＵ１１にバス１２を介してプログラムメモリ１３及びデータメモリ１４を接続し、さらに通信インタフェース１５及び入出力インタフェース１６を接続している。

通信インタフェース１５は、ＣＰＵ１１の制御の下で、通信ネットワークにより規定される通信プロトコルに従い、ユーザの携帯端末からその滞在地データを受信する。通信プロトコルとしては、例えばＴＣＰ／ＩＰ（Transmission Control Protocol／Internet Protocol）が使用される。

入出力インタフェース１６には、入力デバイス１７及び出力デバイス１８が接続されている。入力デバイス１７は、キーボード及びマウスにより構成される。出力デバイス１８はディスプレイやプリンタからなる。入出力インタフェース１６は、上記入力デバイス１７による操作情報をＣＰＵ１１に伝えると共に、後述する行動予測処理プログラム１３５により得られる、ユーザの次の行動の予測結果を表す情報をＣＰＵ１１の指示に従い上記出力デバイス１８を用いて表示又はプリント出力させる。なお、上記ユーザの次の行動の予測結果を表す情報は、通信インタフェース１５からユーザの端末装置又はユーザから許可されたサービス事業者の端末装置へ送信することも可能である。

データメモリ１４には、この発明を実施するために必要な記憶部として、滞在履歴記憶部１４１と、滞在パターン記憶部１４２と、行動パターン記憶部１４３と、予測結果記憶部１４４が設けられている。滞在履歴記憶部１４１には、ユーザ端末装置から受信した、当該ユーザが滞在した滞在地とその滞在時刻を表す滞在地データの集合が蓄積される。滞在パターン記憶部１４２には、後述する系列マイニング実行プログラムを実行することにより得られる滞在パターンの集合が蓄積される。行動パターン記憶部１４３には、上記蓄積された滞在パターンの集合の中から抽出された、ユーザにとって特徴的（典型的）な行動パターンに対応する滞在パターンが記憶される。予測結果記憶部１４４には、上記記憶された特徴的な滞在パターンの中から選択された、ユーザの現在の滞在地及び滞在時刻と一致する度合いの高い滞在地と、当該滞在地を含む行動パターンの識別情報（行動パターンＩＤ）が記憶される。

プログラムメモリ１３には、この発明を実施するために必要なアプリケーション・プログラムとして、滞在地入力制御プログラム１３１と、系列マイニング実行プログラム１３２と、出現頻度しきい値決定プログラム１３３と、行動パターン決定プログラム１３４と、行動予測処理プログラム１３５が格納されている。

滞在地入力制御プログラム１３１は、図示しないユーザ端末装置からその滞在地データを通信ネットワークを介して通信インタフェース１５により受信させ、受信された滞在地データを上記データメモリ１４内の滞在履歴記憶部１４１に記憶させる処理を、上記ＣＰＵ１１に実行させる。滞在地データは、滞在地の固有名称と滞在時刻情報とから構成される。滞在地の固有名称は、例えばＧＰＳ（Global Positioning System）又はＲＦＩＤ（Radio Frequency IDentification）等の位置センサを用いて得たユーザ端末装置の緯度経度情報をもとに、地図データベースを検索することにより取得可能である。地図データベースはユーザ端末装置に予め記憶されているものを使用してもよいし、記憶されていない場合には地図データサーバで公開されているものを使用してもよい。また滞在時刻情報は、滞在開始時刻及び滞在終了時刻とからなる。なお、滞在地入力制御プログラム１３１は、メモリカード等の外部記憶媒体から滞在地データを読み込んで滞在履歴記憶部１４１に記憶させる処理機能も含まれる。

系列マイニング実行プログラム１３２は、上記滞在履歴記憶部１４１に蓄積された滞在地データの集合を読み出し、この読み出した滞在地データの集合に対し系列マイニングの手法を適用して滞在パターンの集合を作成し、この滞在パターンの集合を上記データメモリ１４内の滞在パターン記憶部１４２に記憶させる処理を、上記ＣＰＵ１１に実行させる。

出現頻度しきい値決定プログラム１３３は、以下のような一連の処理をＣＰＵ１１に実行させる。
(1) 出現頻度しきい値の候補θを０〜１の範囲で一定量ずつ増加させるごとに、上記滞在パターン記憶部１４２に記憶された滞在パターンの集合から出現頻度が当該候補を超える滞在パターンを選択する処理。
(2) 上記選択された滞在パターンの集合から、当該集合に含まれる全ての滞在地を抽出する処理。
(3) 上記滞在履歴記憶部１４１に記憶された滞在地データの集合の中から、上記抽出された滞在地と一致する滞在地の数をカウントする処理。
(4) 上記出現頻度しきい値の各候補についてそれぞれ得られた滞在地のカウント値をもとに、出現頻度しきい値の候補の変化に対し上記カウント値が変化しない区間を求め、この区間に含まれる出現頻度しきい値の候補の中から、上記特徴的な行動パターンの抽出に用いる出現頻度しきい値を選択する処理。

行動パターン決定プログラム１３４は、以下の処理をＣＰＵ１１に実行させる。
(1) 上記出現頻度しきい値決定プログラム１３３の実行により決定された出現頻度しきい値に基づいて、上記滞在パターン記憶部１４２に記憶された滞在パターンの集合から上記出現頻度しきい値を超える滞在パターンを抽出する処理。
(2) 上記抽出された滞在パターンに含まれる滞在地ごとに、平均滞在開始時刻、平均滞在終了時刻、滞在開始時刻の分散及び滞在終了時刻の分散を求める処理。
(3) 上記抽出された滞在パターンと、上記求められた平均滞在開始時刻、平均滞在終了時刻、滞在開始時刻の分散及び滞在終了時刻の分散を、パターンＩＤに対応付けて上記データメモリ１４内の行動パターン記憶部１４３に記憶させる処理。

行動予測処理プログラム１３５は、以下の処理をＣＰＵ１１に実行させる。
(1) 上記滞在地入力制御プログラム１３１の制御の下でユーザの現在の滞在地データが得られた場合に、この滞在地データに含まれる滞在地と名称が一致する滞在地を上記行動パターン記憶部１４３に記憶された特徴的な行動パターンから抽出する処理。
(2) 上記抽出された滞在地の各々について、上記現在の滞在地データとの一致の度合いを表す尤度を計算する処理。この尤度の計算は、平均滞在開始時刻又は平均滞在終了時刻と、滞在開始時刻の分散又は滞在終了時刻の分散の値をもとに行われる。
(3) 上記計算された尤度が予め設定した条件を満たす滞在地を、上記抽出された滞在地の中から選択する処理。
(4) 上記選択された滞在地と、この滞在地を系列に含む滞在パターンと、滞在時刻情報とをもとに、ユーザの次の目的地と当該目的地への到達時刻を予測し、その予測結果を入出力インタフェース１６を介して出力デバイス１８へ出力させる処理。

図２は、図１に示した行動予測装置１の機能構成を示すブロック図である。行動予測装置１の機能は、入力部２１と、記録部２２と、処理部２３と、出力部２４とに大別される。
入力部２１は滞在地入力手段２１１を備える。この滞在地入力手段２１１は、図１に示した滞在地入力制御プログラム１３１及び通信インタフェース１５に対応する。
出力部２４は予測結果出力手段２４１を備える。この予測結果出力手段２４１は、入出力インタフェース１６、出力デバイス１８及び通信インタフェース１５に対応する。

記録部２２は、滞在履歴記憶手段２２１と、滞在パターン記憶手段２２２と、行動パターン記憶手段２２３と、予測結果記憶手段２２４を備える。滞在履歴記憶手段２２１は図１の滞在履歴記憶部１４１に対応し、滞在パターン記憶手段２２２は滞在パターン記憶部１４２に対応する。また、行動パターン記憶手段２２３は図１の行動パターン記憶部１４３に対応し、予測結果記憶手段２２４は予測結果記憶部１４４に対応する。

処理部２３は、行動パターン生成手段２３０と、行動予測処理手段２３４を備える。このうち行動パターン生成手段２３０は、系列マイニング実行手段２３１と、出現頻度しきい値決定手段２３２と、行動パターン決定手段２３３を含む。系列マイニング実行手段２３１は、図１に示した系列マイニング実行プログラム１３２に対応し、出現頻度しきい値決定手段２３２は図１に示した出現頻度しきい値決定プログラム１３３に対応する。行動パターン決定手段２３３は、図１に示した行動パターン決定プログラム１３４に対応する。また、行動予測処理手段２３４は図１に示した行動予測処理プログラム１３５に対応する。

図７は、上記出現頻度しきい値決定手段２３２の機能構成をさらに詳しく示すブロック図である。すなわち、出現頻度しきい値決定手段２３２は、出現頻度しきい値超えパターン選択手段２３２１と、滞在地集合計算手段２３２２と、滞在数カウント手段２３２３と、しきい値決定手段２３２４とから構成される。

次に、以上のように構成された行動予測装置の動作を説明する。図６はその全体の処理手順と処理内容を示すフローチャートである。
（１）滞在地データの入力
ＣＰＵ１１は、ステップＳ５１において滞在地入力制御プログラム１３１を起動する。そして、この滞在地入力制御プログラム１３１に従い、ユーザ端末装置からその滞在地データを通信ネットワークを介して通信インタフェース１５により受信し、この受信された滞在地データをデータメモリ１４内の滞在履歴記憶部１４１に記憶させる。

滞在地データは、ユーザが一定時間以上滞在した滞在地に関するデータであり、例えばユーザ端末装置の滞在地検出機能により生成される。滞在地検出機能は、例えばＧＰＳ又はＲＦＩＤを利用した自端末の位置を計測する機能と、この機能により計測された緯度・経度からなる位置情報をもとに地図データベースからその地点の固有名称を表す情報を検索する機能とから構成される。滞在地データは、滞在地名と、滞在開始時刻と、滞在終了時刻とから構成される。図３はこの滞在地データの一例を示すもので、「家」と「Ａ駅」のデータを示している。

また、上記複数の滞在地をユーザの移動順に配列することにより、滞在系列データを生成することができる。滞在系列データは、滞在地名の列と系列番号とから構成される。このとき、滞在系列をｄ、系列番号をｉとすると、系列番号ｉを持つ滞在系列ｄ_iは、

のように表される。

ここで、ｕ_ijを系列ｉのｊ番目の滞在地（又は滞在）と呼ぶ。ｕ_ijの値はユーザが系列ｉでｊ番目に滞在した地名を表す。Ｍ_iは系列ｉにおける滞在の総数である。図４は、滞在系列記憶部１４１に記憶されたＮ系列分の滞在系列データ集合の一例を示すもので、滞在系列データ集合Ｄは

で表される。

（２）系列マイニング処理
ＣＰＵ１１は、続いてステップＳ５２により系列マイニング実行プログラム１３２を起動する。そして、この系列マイニング実行プログラム１３２に従い、上記滞在履歴記憶部１４１から滞在系列データの集合を読み出し、この滞在系列データの集合に対し系列マイニング処理を実行して滞在パターンの集合を作成する。そして、この滞在パターンの集合を上記データメモリ１４内の滞在パターン記憶部１４２に記憶させる。

系列マイニングとは、滞在系列データの集合を受け取り、この滞在系列データ集合の中から出現回数が一定回数以上、もしくは出現頻度が一定以上の全ての滞在パターンを高速に選択する手法である。なお、出現頻度とは、ある滞在パターンと滞在系列データ集合が与えられたときに、その滞在パターンが出現する滞在系列データ集合中の系列の総数と、滞在系列データ集合に含まれる系列の総数との比率である。なお、系列マイニングの処理については、以下の文献に詳しく述べられている。
Rakesh Agrawal and Ramakrishnan Srikant，“Mining Sequential Patterns”，11^th International Conference on Data Engineering，pp 3−14，1995。

図５は、滞在パターン記憶部１４２に記憶された滞在パターンの一例を示すもので、滞在パターンはパターン番号とその出現回数と滞在の列により構成される。パターン番号は１つの滞在パターンにユニークに割り当てられる番号であり、滞在列は滞在地を並べたものである。このとき、滞在パターンをｐ、パターン番号をｉとすると、あるパターン番号ｉを持つパターンｐiは

と表される。ｖ_ijは滞在パターンｐ_iに出現するｊ番目の滞在地であり、K_iは滞在パターンｐ_iの滞在地の総数である。

出現回数は以下のように定義される。すなわち、パターンの出現は、滞在パターンと滞在系列との間で定義される概念であり、ある滞在パターンｐ_a と滞在系列ｄ_b についてそれぞれｖ_ai＝ｕ_bα(i)となるような１≦α(1)＜α(2)＜…α(K_a)≦Ｍ_bが存在するとき、パターンｐ_aは滞在系列ｄ_bに出現するものと定義される。

例えば、滞在パターン＜家，塾＞は滞在系列＜家，駅，塾＞に出現するが、＜家，駅，学校＞には出現しない。この出現の定義を用いて出現回数を定義する。滞在パターンｐ_j の出現回数は、滞在系列データ記憶部１４１に蓄積されている滞在系列データ集合に含まれる滞在系列データのうち、パターンｐ_j が出現しているものの数を言う。パターンｐ_i の出現回数をＯ(ｐ_i)と表すことにする。

滞在パターンの集合は以下のように定義される。すなわち、図５に示した行数（Ｌ行）は系列マイニング処理により作成された滞在パターンの総数であり、この作成された全ての滞在パターンの集合Ｐは、

のように表される。

（３）出現頻度しきい値の決定処理
ＣＰＵ１１は、次にステップＳ５３により出現頻度しきい値決定プログラム１３３を起動し、この出現頻度しきい値決定プログラム１３３に従い出現頻度しきい値決定処理を実行する。この出現頻度しきい値を決定する方法には３つの方法が考えられる。

（３−１）第１の方法
図８は、この出現頻度しきい値を決定する方法を実現する処理手順と処理内容を示すフローチャートである。
すなわち、ＣＰＵ１１は先ずステップＳ７１により出現頻度しきい値の候補値θを最小値であるθ＝０に設定する。続いてステップＳ７２により、データメモリ１４内の滞在パターン記憶部１４２から滞在パターン集合を読み出し、この読み出した滞在パターン集合に含まれる複数の滞在パターンの中から、上記出現頻度しきい値の候補値θを超える全ての滞在パターンを選択する。

ＣＰＵ１１は、次にステップＳ７３に移行し、上記選択された滞在パターンの集合から滞在地集合を抽出する。滞在地集合は、滞在パターン記憶部１４２に記憶された滞在パターンの集合が与えられたとき、この集合に含まれる滞在パターンに含まれるすべての滞在地を集めた集合として定義される。図９は、その一例を示すもので、与えられた滞在パターンの集合が｛＜家，塾＞，＜家，バス停＞，＜家＞，＜バス停＞｝だった場合に、当該滞在パターンの集合からは滞在地集合として｛家，塾，バス停｝が抽出される。

ＣＰＵ１１は、続いてステップＳ７４に移行し、滞在系列記憶部１４１に記憶された滞在系列データの集合の中から、上記抽出された滞在地と一致する滞在地の数をカウントする処理を以下のように実行する。図１０はその処理手順と処理内容を示すフローチャートである。

すなわち、ＣＰＵ１１は上記ステップＳ７３により抽出された滞在地集合をステップＳ９１において取り込むと共に、ステップＳ９２により上記滞在系列データ記憶部１４２から滞在系列データの集合を取り込み、ステップＳ９３によりカウント値countを０に初期化する。

この状態でＣＰＵ１１は、先ずステップＳ９４において上記滞在系列データの集合に含まれる滞在系列データの１つから滞在地を１つ選択し、この選択した滞在地と等しい要素が上記滞在地集合の中に存在するか否かをステップＳ９５で判定する。この判定の結果、選択した滞在地と等しい要素が上記滞在地集合の中に存在した場合には、ステップＳ９６に移行してカウント値countをインクリメントする。これに対し存在しないと判定された場合には、上記カウント値のインクリメントを行わない。

次にＣＰＵ１１は、ステップＳ９７において上記滞在系列データの集合にまだ調べていない滞在地が残っているか否かを判定し、残っていればステップＳ９４に戻って未選択の滞在地を１つ選択する。そして、この選択した滞在地と等しい要素が上記滞在地集合の中に存在するか否かを上記ステップＳ９５で判定し、存在すればカウント値countをインクリメントする。以後同様に、上記滞在系列データの集合から未選択の滞在地を１つ選択するごとに、当該滞在地と等しい要素が上記滞在地集合の中に存在するか否かを判定し、存在すればカウント値countをインクリメントする処理を繰り返す。

そして、上記滞在系列データの集合に含まれる全ての滞在地について、上記判定処理とその結果に基づくカウント値countのインクリメント処理を終了すると、ＣＰＵ１１はステップＳ９７からステップＳ９８に移行して、上記カウント値countの値、つまり出現頻度しきい値の候補値θ＝０のときの滞在地集合に含まれる各要素が上記滞在系列データ集合中に出現する回数を出力する。そして、この出力された滞在地数のカウント値を、上記出現頻度しきい値の候補値θ＝０と対応付けてデータメモリ１４内の滞在数カウント値記憶部（図示せず）に保存する。

なお、以上述べた滞在数のカウント処理の結果を数式で表すと以下のようになる。すなわち、カウントされた滞在数を出現頻度しきい値θの関数ｓ(θ)とすると、この関数ｓ(θ)は

として表される。

上記出現頻度しきい値の候補値θ＝０のときの滞在数カウント処理が終了すると、ＣＰＵ１１は出現頻度しきい値の候補値θが最大値である１に達したか否かをステップＳ７５で判定する。この判定の結果、θが１に達していなければステップＳ７６により出現頻度しきい値の候補値θを一定量（例えば０．０１）増加させ、ステップＳ７２に戻る。そして、今度はこの増加後の出現頻度しきい値の候補値θを用いて、上記ステップＳ７２〜ステップＳ７４による滞在数カウント処理を実行する。以後同様に、出現頻度しきい値の候補値θが１に達するまで、θを一定量増加させるごとにステップＳ７２〜ステップＳ７４による滞在数カウント処理を繰り返し実行する。
以上の滞在数カウント処理の結果、出現頻度しきい値の候補の変化に対する滞在数の変化を表す情報がデータメモリ１４内の滞在数カウント値記憶部に得られる。図１２はその一例を示すものである。

上記出現頻度しきい値の候補値θが最大値である“１”に達すると、ＣＰＵ１１はステップＳ７７に移行し、上記ステップＳ７２〜ステップＳ７４により得られた出現頻度しきい値の候補θの変化に対する滞在数の変化を表す情報に基づいて、特徴的な滞在パターンの抽出処理に用いる上で最適な出現頻度しきい値を１つ選択する処理を、以下のように実行する。図１１はその処理手順と処理内容を示すフローチャートである。

すなわち、ＣＰＵ１１は先ずステップＳ１０１で上記データメモリ１４内の滞在数カウント値記憶部から、出現頻度しきい値の各候補θ（０〜１）についてそれぞれ得られた滞在数カウント値を読み込む。次にステップＳ１０２において、上記読み込んだ滞在地のカウント値をもとに、出現頻度しきい値の候補θの変化に対し上記滞在数カウント値が変化しない区間をすべて検出する。続いてステップＳ１０３において、上記検出されたすべての区間のうち、出現頻度しきい値の候補θ＝１を含む区間を先ず削除し、残った各区間の中でθの範囲が最長となる区間を１つ選択する。そして、ステップＳ１０４において、上記選択された最長区間内のθの下限値を、特徴的な行動パターンの抽出に用いる出現頻度しきい値として決定する。
例えば、図１２の例ではθ＝０．１〜０．５の区間を最長区間として選択し、この最長区間中の下限値であるθ＝０．１を特徴的な行動パターンの抽出に用いる出現頻度しきい値として決定する。

以上述べたように、出現頻度しきい値を決定する第１の方法では、出現頻度しきい値の候補θを０〜１の範囲で一定量ずつ増加させるごとに、滞在パターン記憶部１４２に記憶された滞在パターンの集合から出現頻度が当該候補を超える滞在パターンを選択して、この選択された滞在パターンの集合から当該集合に含まれる全ての滞在地を抽出し、さらに滞在系列記憶部１４１に記憶された滞在系列データの集合の中から上記抽出された滞在地と一致する滞在地の数をカウントする。そして、出現頻度しきい値の各候補についてそれぞれ得られた滞在地のカウント値をもとに、出現頻度しきい値の候補の変化に対し上記カウント値が変化しない区間を求め、この区間のうちθ＝１を含む区間を除いた最長区間の下限値を、上記特徴的な行動パターンの抽出に用いる出現頻度しきい値として選択するようにしている。

この第１の方法は以下のような利点を有する。すなわち、一般に出現頻度しきい値が低い領域では滞在数の変化が大きくなる傾向があるが、これは出現頻度しきい値以上の出現頻度をもつ滞在パターンの集合の変化が大きいことを反映している。そのような集合に含まれる滞在パターンは、ユーザの日常の行動を反映していないノイズである可能性が高く、ユーザの日常行動の評価に使用するには適さない。一方、出現頻度しきい値が高いと、それだけで得られる頻出パターンの数が少なくなり、ユーザの日常行動をその多様性を考慮して適切に評価することが困難となる。

これに対し上記第１の方法を用いると、先に述べたように出現頻度しきい値の変化に対して滞在数が不変の最長区間、つまり出現する滞在パターンの集合が最も安定しノイズを含む可能性が低い区間から、出現頻度しきい値が選択される。このため、出現頻度しきい値を低く設定される心配がない。また、出現頻度しきい値を０から増加させた場合、出現頻度の変化に対し滞在数が急激に変化する領域の直後に滞在数が不変の最長区間が現れることが多く、本実施形態ではこの区間の下限値に出現頻度しきい値が設定される。このため、出現頻度しきい値が高い値に設定される懸念がない。

すなわち、出現頻度しきい値を決定するための第１の方法によれば、出現頻度しきい値を低すぎずかつ高すぎない適切な値に設定することが可能となり、これによりノイズの影響を最小限度に抑えた上で、ユーザの日常行動を評価する上で必要な滞在パターンを十分抽出することができる。

（３−２）第２の方法
出現頻度しきい値を決定するための第２の方法は、出現頻度しきい値の候補値θを０〜１の範囲で一定量ずつ増加させるごとに当該出現頻度しきい値の候補値θを超える滞在パターン数をカウントし、この滞在パターン数のカウント値を利用して出現頻度しきい値を決定する手段又は方法を使用するものである。

図１３は、この出現頻度しきい値を決定する第２の方法を実施するための出現頻度しきい値決定手段の機能構成を示すブロック図である。なお、同図において前記図７と同一部分には同一符号を付して詳しい説明は省略する。また、行動予測装置のソフトウエア及びハードウエア構成については図１を、また装置全体の機能構成については図２を延用して説明を行う。

出現頻度しきい値決定手段２３２は、図１３に示すように出現頻度しきい値超えパターン選択手段２３２１と、パターン数カウント手段２３２５と、近似誤差計算手段２３２６と、誤差最小しきい値検出手段２３２７とから構成される。
出現頻度しきい値超えパターン選択手段２３２１は、出現頻度しきい値の候補θを０〜１の範囲で一定量ずつ増加させるごとに、上記滞在パターン記憶部１４２に記憶された滞在パターンの集合から出現頻度が当該候補を超える滞在パターンを選択する。
パターン数カウント手段２３２５は、上記各出現頻度しきい値の候補値θごとに、上記出現頻度しきい値超えパターン選択手段２３２１により選択された滞在パターンの数をカウントする。

近似誤差計算手段２３２６は、上記出現頻度しきい値の候補値θの変化に対する上記滞在パターンのカウント値の変化を表す近似式を定義する。
誤差最小しきい値検出手段２３２７は、上記定義された近似式と上記滞在パターンのカウント値との誤差を求め、この近似誤差が最小となるときの出現頻度しきい値の候補値θを特徴的な行動パターンの抽出に用いる出現頻度しきい値として選択する。

次に、以上のように構成された出現頻度しきい値決定手段２３２によるしきい値決定処理動作を説明する。図１４はその処理手順と処理内容を示すフローチャートである。なお、同図において前記図８と同一部分には同一符号を付してある。
すなわち、ＣＰＵ１１は先ずステップＳ７１により出現頻度しきい値の候補値θを最小値であるθ＝０に設定する。続いてステップＳ７２により、データメモリ１４内の滞在パターン記憶部１４２から滞在パターン集合を読み出し、この読み出した滞在パターン集合に含まれる複数の滞在パターンの中から、上記出現頻度しきい値の候補値θを超える全ての滞在パターンを選択する。次にステップＳ１３１に移行し、上記ステップＳ７２により選択された滞在パターンの数をカウントしそのカウント値をデータメモリ１４内に保存する。

上記出現頻度しきい値の候補値θ＝０のときの滞在パターン数の選択とその数をカウントする処理が終了すると、ＣＰＵ１１は出現頻度しきい値の候補値θが最大値である“１”に達したか否かをステップＳ７５で判定する。この判定の結果、θが“１”に達していなければステップＳ７６により出現頻度しきい値の候補値θを一定量（例えば０．０１）増加させ、ステップＳ７２に戻る。そして、今度はこの増加後の出現頻度しきい値の候補値θを用いて、上記ステップＳ７２及びステップＳ１３１による滞在パターンの選択とその数をカウントする処理を実行する。以後同様に、出現頻度しきい値の候補値θが最大値である“１”に達するまで、出現頻度しきい値の候補値θを一定量増加させるごとに、ステップＳ７２及びステップＳ１３１による滞在パターンの選択とその数をカウントする処理を繰り返し実行する。

次にＣＰＵ１１は、ステップＳ１３２により別に設定した変数φを０に初期化したのち、ステップＳ１３３において関数ｆ_φ(x)を定義する。この関数ｆ_φ(x)は、上記ステップＳ１３２までに求めた、各出現頻度しきい値の候補値θに対応する滞在パターンのカウント値をＲ(θ)とすると、３つの点（０，Ｒ(0)），（θ，Ｒ(θ)），（１，Ｒ(1)）を順に線分で結ぶ式として

として定義される。

続いてＣＰＵ１１は、ステップＳ１３４において、上記定義した関数ｆ_φ(x)と上記θごとの滞在パターンのカウント値Ｒ(θ)との近似誤差を求める。パラメータφに対応する近似誤差Ｇ(φ)は、

として定義される。ここで、０＝θ₁ ＜θ₂ ＜…＜θ_T ＝１である。

この近似誤差Ｇ(φ)の意味について、図１５を用いて説明する。図１５は出現頻度しきい値の候補値θと滞在パターンのカウント値の関数Ｒ(θ)と、φ＝０．２のときの関数ｆ_φ(x)とをプロットしたものである。図中の網掛けをした領域が、滞在パターンのカウント値の関数Ｒ(θ)を関数ｆ_φ(x)で近似したときの誤差である。滞在パターンのカウント値は、出現頻度しきい値の候補値θの変化に対して、しきい値が小さい場合には変化が大きく、反対にしきい値が大きい場合には変化が小さくなる傾向がある。このため、滞在パターンのカウント値を関数ｆ_φ(x)で近似すると、滞在パターンのカウント値の変化が大きな部分と小さな部分の境界にθがあるとき誤差は最小となる。換言すれば、誤差が小さくなるということは、パラメータφの値が滞在パターンのカウント値の関数Ｒ(θ)における傾きの変化の境界に近づいていることを意味する。
上記ステップＳ１３４において近似誤差が計算されると、ＣＰＵ１１はステップＳ１３５において、上記計算された近似誤差をφの値に対応付けてデータメモリ１４に一時保存する。

上記パラメータφ＝０のときの滞在数カウント処理が終了すると、ＣＰＵ１１はパラメータφが最大値である１に達したか否かをステップＳ１３６で判定する。この判定の結果、φが１に達していなければステップＳ１３７によりパラメータφを一定量（例えば０．０１）増加させ、ステップＳ１３３に戻る。そして、今度はこの増加後のφを用いて、上記ステップＳ１３３〜ステップＳ１３５による近似誤差の計算処理を実行する。以後同様に、パラメータφが１に達するまで、パラメータφを一定量増加させるごとにステップＳ１３３〜ステップＳ１３５による近似誤差の計算処理を繰り返し実行する。

上記近似誤差の計算処理により、０〜１までのすべてのφに対する近似誤差が計算されると、ＣＰＵ１１はステップＳ１３８において、上記計算されたすべてのφに対する近似誤差の中から最小となる近似誤差を選択し、この誤差が最小となるときのφを特徴パターンの抽出に使用する出現頻度しきい値として出力する。

上記近似誤差が最小となるときのφを出現頻度しきい値として選択する理由は以下のようなものである。図１６は、出現頻度パラメータφを変化させ、それに伴う滞在パターンのカウント値Ｒ(φ)の変化と近似誤差Ｇ(σ)の変化とを同時にプロットした図である。同図から、近似誤差Ｇ(σ)が最小となる出現頻度パラメータφは、滞在パターンのカウント値Ｒ(φ)の変化の境界に近いことが分かる。こうした領域は、滞在パターンが安定な出現頻度しきい値の下限値であると考えることができるため、このφを特徴パターンの抽出に使用する出現頻度しきい値として出力する。

以上述べたように出現頻度しきい値を決定するための第２の方法では、出現頻度しきい値の候補値θを０〜１の範囲で一定量ずつ増加させるごとに当該出現頻度しきい値の候補値θを超える滞在パターン数をカウントする。そして、別途設定した出現頻度パラメータφを０〜１の範囲で一定量ずつ増加させるごとに、上記滞在パターン数のカウント値と近似関数ｆ_φ(x)との近似誤差を求め、この近似誤差が最小となるときの出現頻度パラメータφを特徴パターンの抽出に使用する出現頻度しきい値として選択するようにしている。

したがって、この第２の方法においても、先に述べた第１の方法と同様に、滞在パターンが安定な出現頻度しきい値の下限値に出現頻度しきい値が設定される。このため、出現頻度しきい値を低すぎずかつ高すぎない適切な値に設定することが可能となり、これによりノイズの影響を最小限度に抑えた上で、ユーザの日常行動を評価する上で必要な滞在パターンを十分抽出することができる。

（第３の方法）
出現頻度しきい値を決定するための第３の方法は、出現頻度しきい値の候補値θを０〜１の範囲で一定量ずつ増加させるごとに当該出現頻度しきい値の候補値θを超える滞在パターン数を選択して、この選択された滞在パターンの集合から当該集合に含まれる全ての滞在地を抽出すると共に、滞在系列データの集合に含まれる滞在地の総数に対する上記滞在地のカウント値の割合（被覆率）を求め、この被覆率をもとに出現頻度しきい値を決定するようにしたものである。

図１７は、この第３の方法を実施するための出現頻度しきい値決定手段２３２の機能構成を示すブロック図である。なお、同図において前記図７と同一部分には同一符号を付して詳しい説明は省略する。また、本実施形態においても、行動予測装置のソフトウエア及びハードウエア構成については図１を、また装置全体の機能構成については図２を延用して説明を行う。

出現頻度しきい値決定手段２３２は、図１７に示すように出現頻度しきい値超えパターン選択手段２３２１と、滞在地集合計算手段２２２と、滞在数カウント手段２３２３と、被覆率計算手段２３２８と、しきい値決定手段２３２４とから構成される。
このうち被覆率計算手段２３２８は、滞在系列データ記憶部１４２（滞在系列記憶手段２２１）に記憶された滞在系列データの集合に含まれる滞在地の総数に対する、上記滞在数カウント手段２３２３により得られた滞在地のカウント値の割合を、被覆率として計算する。

次に、以上のように構成された出現頻度しきい値決定手段２３２によるしきい値決定処理動作を説明する。図１８はその処理手順と処理内容を示すフローチャートである。なお、同図において前記図８と同一部分には同一符号を付してある。
すなわち、ＣＰＵ１１は先ずステップＳ７１により出現頻度しきい値の候補値θを最小値であるθ＝０に設定する。続いてステップＳ７２により、データメモリ１４内の滞在パターン記憶部１４２から滞在パターン集合を読み出し、この読み出した滞在パターン集合に含まれる複数の滞在パターンの中から、上記出現頻度しきい値の候補値θを超える全ての滞在パターンを選択する。

ＣＰＵ１１は、次にステップＳ７３に移行し、上記選択された滞在パターンの集合から滞在地集合を抽出する。滞在地集合は、滞在パターン記憶部１４２に記憶された滞在パターンの集合が与えられたとき、この集合に含まれる滞在パターンに含まれるすべての滞在地を集めた集合として定義される。続いてＣＰＵ１１は、ステップＳ７４に移行し、滞在系列記憶部１４１に記憶された滞在系列データの集合の中から、上記抽出された滞在地と一致する滞在地の数をカウントする。

次にＣＰＵ１１は、ステップＳ１６１において、滞在系列データ記憶部１４２に記憶された滞在系列データの集合に含まれる滞在地の総数に対する、上記ステップＳ７２〜Ｓ７４により得られた滞在地のカウント値の割合を被覆率として計算する。いま、被覆率をσ(θ)とすると、被覆率は

のように表される。

次にＣＰＵ１１は、ステップＳ１６２において、上記計算された被覆率σ(θ)をもとに特徴パターンの抽出に使用する出現頻度しきい値を決定する。被覆率は、第１の方法で述べた滞在数と同様に出現頻度しきい値に対して単調非増加である。このため、出現頻度しきい値の候補値を増加させて、その被覆率が一旦ある値を下回ったならば、以降どれだけ候補値を増加させても被覆率がその値を上回ることはない。したがって、被覆率にあるしきい値を設定しておけば、出現頻度しきい値の候補値を増加させていったときに、被覆率が初めてそのしきい値以下になった点を検出することができる。

そこで、被覆率に対して予め例えば０．３という被覆率のしきい値を設定しておく。そして、出現頻度しきい値の候補値を増加させていって、被覆率が上記設定されたしきい値を上回ったとき、このときの出現頻度しきい値の候補値の最大値を、特徴パターンの抽出に使用する出現頻度しきい値として出力する。
このように特徴パターンの抽出に使用する出現頻度しきい値を決定することで、ユーザの滞在系列データの性質によらず、行動のカバー率が一定となるように特徴的な滞在パターンの集合を抽出することが可能となる。

（４）特徴的な行動パターンの抽出処理
上記第１乃至第３の方法のいずれかの方法により出現頻度しきい値が決定されると、ＣＰＵ１１はステップＳ５５に移行し、行動パターン決定プログラム１３４を起動する。そして、この行動パターン決定プログラム１３４に従い、先ず滞在パターン記憶部１４２から滞在パターンの集合を読み出し、この読み出した滞在パターンの集合に含まれる各滞在パターンの中から、上記決定された出現頻度しきい値を超える滞在パターンを抽出する。また、上記抽出された滞在パターンに含まれる滞在地ごとに時刻特徴量を求める。この時刻特徴量は、平均滞在開始時刻、平均滞在終了時刻、滞在開始時刻の分散及び滞在終了時刻の分散からなる。そして、上記抽出された滞在パターンと、上記求められた時刻特徴量を、パターンＩＤに対応付けて上記データメモリ１４内の行動パターン記憶部１４３に記憶させる。

図１９は、以上のようにして行動パターン記憶手段１４３に記憶された行動パターン情報の一例を示すものである。なお、同図では、簡単のため２つの滞在パターンのみを例示し、また時刻特徴量については上記滞在パターン中に出現する一つ目の滞在地１に対応するもののみを示している。

（５）行動予測処理
さて、以上のようにユーザの特徴的な行動パターンが得られると、ＣＰＵ１１は次に行動予測処理プログラム１３５を起動し、この行動予測処理プログラム１３５に従いユーザの次の行動を予測するための処理を以下のように実行する。図２０はその全体の処理手順と処理内容を示すフローチャートである。

ＣＰＵ１１は、先ずステップＳ２０１において、一定時間ごとに、或いはユーザ端末装置から受信した最新の滞在地データが滞在履歴記憶部１４１に記憶されている前回受信した滞在地データに対し変化した場合に、滞在履歴記憶部１４１から最新の滞在地データを、つまりユーザの現在の滞在地を表すデータを読み出す。この最新の滞在地データは、少なくとも滞在開始時刻を含んでいるものとする。また、それと共にＣＰＵ１１は、ステップＳ２０２において、行動パターン記憶部１４３から行動パターン情報の集合を読み出す。この読み出された最新の滞在地データ及び行動パターン情報の集合は、データメモリ１４内の作業用メモリに一旦格納される。

次にＣＰＵ１１は、ステップＳ２０３において、上記読み出した最新の滞在地データに適合する行動パターンを探索するための処理を以下のように実行する。図２１はその処理手順と処理内容を示すフローチャートである。

（５−１）適合行動パターンの探索処理
ＣＰＵ１１は、先ずステップＳ３０１により作業用メモリから最新の滞在地データの滞在地名を読み出し、さらにステップＳ３０２により作業用メモリから行動パターン情報の集合を順に読み出す。そして、ステップＳ３０３において、滞在パターン中に上記最新の滞在地データの滞在地名を含む行動パターンをすべて抽出し、この抽出した行動パターン情報の集合を作業用メモリ上に作成する。例えば、最新の滞在地データの滞在地名（ユーザの現在の滞在地）が「Ａ駅」だったならば、この「Ａ駅」を含む滞在パターンを有する行動パターン情報をすべて抽出する。この抽出処理の結果、抽出した行動パターン情報の集合が「空」であるとステップＳ３０４で判定すると、つまり上記最新の滞在地データの滞在地名を含む行動パターン情報を抽出できなかった場合には、ＣＰＵ１１は適合行動パターンの探索処理を終了する。

一方、上記最新の滞在地データの滞在地名を含む行動パターン情報を抽出できると、ＣＰＵ１１はステップＳ３０５に移行して、上記行動パターン情報の集合から行動パターン情報を１つ取り出す。続いてステップＳ３０６により、上記取り出した行動パターン情報の滞在パターン中から上記最新の滞在地データと名前が同一の滞在地を一つ選択する。そして、ステップＳ３０７において、上記選択した滞在地に対応する滞在開始時刻の平均及び分散の値を用いて、上記最新の滞在地データに含まれる滞在開始時刻の尤度を計算する。この尤度Ｌ(t) は、現在の滞在地の滞在開始時刻をｔ、上記行動パターン情報の滞在パターンから選択された滞在地の滞在開始時刻の平均及び分散の値をそれぞれμ、σ²とすると、

のように定義される。
なお、尤度計算には、現在の滞在地の滞在開始時刻に加え滞在終了時刻を用いてもよい。この場合、滞在終了時刻についても上記式により同様の計算を行い、その計算結果と上記滞在開始時刻についての計算結果との積を求め、その結果を尤度Ｌ(t) とする。

次にＣＰＵ１１は、ステップＳ３０８において、上記尤度Ｌ(t) の計算結果を予め設定したしきい値と比較してしきい値以上であるか否かを判定する。そして、しきい値以上であれば、このときの尤度Ｌ(t) の値がこれまでで最大か否かを判定する。この判定の結果、上記尤度Ｌ(t) の値がしきい値以上でかつこれまでで最大だったとすれば、ＣＰＵ１１はステップＳ３０９により、上記尤度を計算した滞在地の番号と、当該滞在地を滞在パターン中に含む行動パターン情報のパターンＩＤを、ユーザの現在の滞在地が該当する行動パターン情報の候補としてデータメモリ１４の作業用メモリに保存する。そして、ステップＳ３１０に移行する。

これに対し、上記尤度Ｌ(t) の値がしきい値未満か、或いはしきい値以上であってもこれまでで最大ではなければ、ＣＰＵ１１は上記行動パターン情報をユーザの現在の滞在地が該当する候補として保存せずに、ステップＳ３１０に移行する。ステップＳ３１０では、当該行動パターン情報の滞在パターン中に現在の滞在地と名前が同じ滞在地が他にもあるか否かを判定する。この判定の結果、他にもあればステップＳ３０６に戻って、現在の滞在地と名前が同じその他の滞在地を一つ選択し、以後ステップＳ３０７〜ステップＳ３０９により、尤度の計算処理とその計算結果に基づく行動パターン候補とするか否かの判定処理を実行する。

なお、上記尤度に基づく適合行動パターン候補の探索処理では、尤度Ｌ(t) の値がしきい値以上となる滞在地が複数見つかった場合には、この滞在地名と当該滞在地を滞在パターン中に含むすべての行動パターン情報のパターンＩＤを、ユーザの現在の滞在地が該当する行動パターン情報として保存するようにしてもよい。また、しきい値を設けずに、尤度Ｌ(t) の値が最大となる滞在地と当該滞在地を滞在パターン中に含む１つの行動パターン情報のパターンＩＤを、ユーザの現在の滞在地が該当する行動パターン情報として保存するようにしてもよい。

また、上記行動パターン情報の滞在パターン中に含まれる、現在の滞在地と名前が同じすべての滞在地の選択が終了すると、ＣＰＵ１１はステップＳ３１０からステップＳ３１１に移行する。そして、上記ステップＳ３０３において作成した現在の滞在地を含む行動パターン情報の集合の中に、ステップＳ３０５でまだ選択されていない行動パターン情報があるか否かを判定する。この判定の結果、まだ選択されていない行動パターン情報が存在する場合には、ステップＳ３０５に戻って未選択の行動パターン情報を１つ選択する。そして、この選択した行動パターン情報について、上記ステップＳ３０６〜ステップＳ３１０による処理を同様に実行する。

そうして、上記ステップＳ３０３において作成したすべての行動パターン情報について、上記ステップＳ３０５〜ステップＳ３１１による処理が完了すると、ＣＰＵ１１はステップＳ３１１からステップＳ３１２に移行し、上記データメモリ１４内の作業用メモリに候補として最終的に保存されている、滞在地の番号と当該滞在地を滞在パターン中に含む行動パターン情報のパターンＩＤを、適合行動パターンの探索結果として出力する。

（５−２）目的地の予測処理
上記適合行動パターンの探索処理が終了すると、ＣＰＵ１１は次に図２０のステップＳ２０４において、ユーザの現在の滞在地に適合する行動パターン情報が見つかったか否かを判定する。この判定の結果、見つからなければそのまま処理を終了するが、見つかるとステップＳ２０５に移行して目的地予測処理を以下のように実行する。図２２はその処理手順と処理内容を示すフローチャートである。

すなわち、ＣＰＵ１１は先ずステップＳ４０１により、上記適合行動パターン探索処理により最終的に得られた滞在地の番号と当該滞在地を滞在パターン中に含む行動パターン情報のパターンＩＤを、データメモリ１４の作業用メモリから読み出す。そして、ステップＳ４０２において、上記読み出されたパターンＩＤをもとに行動パターン記憶部１４３から該当する行動パターン情報を読み出し、この行動パターン情報に含まれる滞在パターンにおける滞在地の系列と、ユーザの現在の滞在地に該当すると判定された上記滞在地の番号とをもとに、ユーザの次の目的地となる滞在地を予測する。

予測の手法としては、滞在パターンのみにより予測するか、滞在パターンと滞在時刻情報を用いて予測するか、目的地として複数の滞在地の予測を許容するかといった条件に応じて、複数通りの手法が考えられる。複数の目的地の予測が許容されるのならば、単純に、入力されたすべての適合行動パターン情報に対して、その各滞在パターン上でユーザの現在の滞在地に該当する滞在地の次に位置する滞在地をそれぞれ選択し、この選択された滞在地の集合を目的地の集合とする。これに対し１つの目的地の予測しか許さない場合には、例えば上記目的地として選択された滞在地の集合から、滞在開示時刻の平均値が最も早い滞在地を目的地の予測結果とする。また、時刻情報を参照することで、例えば複数の適合行動パターン情報の各滞在パターン中で、ユーザの現在の滞在地に該当する滞在地以降に配列された滞在地のうち、滞在開始時刻の平均値が現在時刻から一定時間以内（例えば３０分以内）であるものをすべて目的地の予測結果とする。この滞在地は、ユーザがパターンに沿って行動をしていると考えられるのならば、当該ユーザが滞在する可能性が高い。

最後にＣＰＵ１１は、ステップＳ２０６（ステップＳ４０３）において、上記のように予測した目的地と、この目的地における滞在開始時刻の平均値を、データメモリ１４内の予測結果記憶部１４４に記憶させると共に、入出力インタフェース１６を介して出力デバイス１８から出力させる。

以上述べたようにこの実施形態では、ユーザの現在の滞在地データと、当該ユーザについて事前に作成された特徴的な行動パターンを表す情報の集合とに基づいて、この行動パターン情報の集合から、ユーザの現在の滞在地と名前が同じ滞在地を含み、かつ当該滞在地の滞在開始時刻又は終了時刻の尤度がしきい値以上でかつ最も高い滞在地と当該滞在地を含む行動パターン情報を選択する。そして、この選択した滞在地と行動パターン情報をもとに、ユーザの次の目的地を予測するようにしている。

したがって、ユーザの滞在地だけでなく当該滞在地におけるユーザの滞在時刻も考慮されて、ユーザの現在の滞在地に適合する行動パターンが探索される。このため、滞在地のみに基づいて行動パターンを選択する場合に比べ、ユーザの現在の行動形態に適合する行動パターンを高精度に選択することが可能となる。

また、滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散をもとに、ユーザの現在の滞在地と過去の行動パターン中の滞在地との一致の度合いが尤度として算出され、その算出結果をもとにユーザの現在の行動形態に適合する行動パターンが選択される。このため、ユーザの現在の滞在地及び滞在時刻と地名及び時刻が完全一致する行動パターンを選択する場合に比べ、柔軟性の高い選択が可能となる。

さらに、ユーザの次の目的地とその到着時刻が出力されて情報管理者に提示される。このため、ユーザの行動を把握しようとする場合に情報管理者は、適合行動パターン情報からユーザの目的地と到着時刻を予測する作業を自身で行う必要がなくなり、これにより作業性の向上と予測精度の向上を図ることができる。

また、この実施形態によれば、滞在数を求める過程で非日常的な滞在地を発見することも可能である。非日常的な滞在地とは、特徴的な滞在パターンのいずれの集合にも含まれない滞在地のことである。出現頻度がある出現頻度しきい値φ以上の出現頻度を持つパターンの集合をＱφ⊆Ｐとすると、ある日の滞在系列ｄiに含まれる非日常的な滞在地の集合Ｅi は、

として定義することができる。非日常的な滞在地を発見することはユーザの行動を理解することにつながる。

なお、この発明は上記実施形態に限定されるものではない。例えば、行動予測装置としての機能をサーバ装置に設けた場合を例にとって説明したが、行動予測装置としての機能をユーザの携帯端末又はパーソナル・コンピュータ等のユーザ端末装置に設けるようにしてもよい。また、行動予測装置を構成する複数の機能、つまり行動パターン生成手段２３０と行動予測処理手段２３４とを分割して、その一部をサーバ装置に、他を携帯端末やパーソナル・コンピュータ等のユーザ端末装置に設けるようにしてもよい。すなわち、行動予測装置を構成する機能を実現する複数の手段はサーバ装置とユーザ端末装置に分散して設けるようにしてもよい。
その他、行動予測装置の種類やその構成、行動パターン生成手段２３０の構成とその処理手順と内容、行動予測処理手段２３４の構成とその処理手順と内容等についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。

要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。

１…行動予測装置、１１…ＣＰＵ、１２…バス、１３…プログラムメモリ、１４…データメモリ、１５…通信インタフェース、１６…入出力インタフェース、１７…入力デバイス、１８…出力デバイス、１３１…滞在地入力制御プログラム、１３２…系列マイニング実行プログラム、１３３…出現頻度しきい値決定プログラム、１３４…行動パターン決定プログラム、１３５…行動予測処理プログラム、１４１…滞在履歴記録部、１４２…滞在パターン記録部、１４３…予測結果記憶部、２１…入力部、２１１…滞在地入力手段、２２…記録部、２２１…滞在履歴記憶手段、２２２…滞在パターン記録手段、２２３…行動パターン記憶手段、２２４…予測結果記憶手段、２３…処理部、２３０…行動パターン生成手段と、２３１…系列マイニング実行手段、２３２…出現頻度しきい値決定手段、２３３…行動パターン決定手段、２３４…行動予測処理手段、２３２１…頻度しきい値超えパターン選択手段、２３２２…滞在地集合計算手段、２３２３…滞在数カウント手段、２３２４…しきい値決定手段、２３２５…パターン数カウント手段、２３２６…近似誤差計算手段、２３２７…誤差最小しきい値検出手段、２３２８…被覆率計算手段、２４１１…しきい値出力手段。

Claims

ユーザの滞在地及びその滞在時刻を表す情報を含む滞在地データを取得し、この取得された滞在地データの集合を滞在履歴記憶部に格納する手段と、
前記滞在履歴記憶部に格納された滞在地データの集合に対し系列マイニングの処理を実行して、前記ユーザの特徴的な遷移行動を滞在地の系列と当該滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値を含む滞在時刻情報とにより表した行動パターン情報を生成し、この生成された行動パターン情報の集合を行動パターン記憶部に格納する行動パターン生成手段と、
前記取得された滞在地データと、前記行動パターン記憶部に格納された行動パターン情報の集合に基づいて、前記滞在地データに含まれる滞在地及びその滞在時刻情報と対応する滞在地及びその滞在時刻情報を含む適合行動パターン情報を前記行動パターン情報の集合の中から選択する適合行動パターン選択手段と
を具備し、
前記適合行動パターン選択手段は、
前記行動パターン記憶部に格納された行動パターン情報の集合の中から、前記取得された滞在地データに含まれる滞在地と等しい滞在地を抽出する手段と、
前記抽出された滞在地の各々について、前記取得された滞在地データに含まれる滞在地との一致の度合いを表す尤度を、前記取得された滞在地データに含まれる滞在時刻と、前記抽出された滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値とに基づいて計算する手段と、
前記計算された尤度に基づいて、当該尤度が予め設定した条件を満たす滞在地を前記抽出された滞在地の中から選択する手段と、
前記選択された滞在地と当該滞在地を含む行動パターンを表す情報を適合行動パターン情報として出力する手段と
を備えることを特徴とする行動予測装置。
前記適合行動パターン選択手段により選択された適合行動パターン情報に含まれる滞在地の系列及び滞在時刻情報に基づいて、前記ユーザが以後移動する滞在地とその到着時刻を予測し、この予測結果を表す情報を出力する行動予測処理手段を
さらに具備することを特徴とする請求項１記載の行動予測装置。
前記請求項１又は２に記載の行動予測装置が具備する各手段に対応する処理を、前記行動予測装置が備えるコンピュータに実行させることを特徴とするプログラム。