JP5469876B2 - 行動予測装置及びプログラム - Google Patents

行動予測装置及びプログラム Download PDF

Info

Publication number
JP5469876B2
JP5469876B2 JP2009034008A JP2009034008A JP5469876B2 JP 5469876 B2 JP5469876 B2 JP 5469876B2 JP 2009034008 A JP2009034008 A JP 2009034008A JP 2009034008 A JP2009034008 A JP 2009034008A JP 5469876 B2 JP5469876 B2 JP 5469876B2
Authority
JP
Japan
Prior art keywords
stay
place
pattern
behavior
appearance frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009034008A
Other languages
English (en)
Other versions
JP2010191589A (ja
Inventor
正彬 西野
智広 山田
俊一 瀬古
学 茂木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009034008A priority Critical patent/JP5469876B2/ja
Publication of JP2010191589A publication Critical patent/JP2010191589A/ja
Application granted granted Critical
Publication of JP5469876B2 publication Critical patent/JP5469876B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

この発明は、ユーザの現在の滞在地と過去の行動パターンをもとに、当該ユーザの今後の行動を予測する行動予測装置及びプログラムに関する。
従来、時系列データから頻出なパターンを抽出する手法として、系列マイニングの手法が知られている。この手法は、顧客IDと購入した商品及び購入日時を記録した購買記録データベースが存在する場合に、この購買記録データベースに記録された購買データをもとに、顧客による典型的な商品購買パターンを抽出するものである。
また、最近では商品購買パターンの抽出用途に止まらず、ユーザの滞在地の遷移を表す行動パターンを抽出するために、上記系列マイニングの手法を適用する方法が提案されている。この方法は、例えば先ずユーザが所持する端末のGPS(Global Positioning System)受信データから、マイニング処理によってユーザが滞在した場所を抽出し、さらに滞在場所間の遷移行動をマルコフモデルとして表現して遷移確率を計算することで、ある場所に滞在しているユーザが次に滞在する場所を予測するものである(例えば、非特許文献1を参照。)。
Daniel Ashbrook, Thad Starner, "Using GPS to Learn Significant Locations and Predict Movement across Multiple Users" , Peasonal and Ubiquitous Computing, 2003 7:257-286
ところが、上記従来の方法は滞在地間の遷移確率に基づいて行動予測を行うものとなっており、時刻を考慮していないため、予測を誤るおそれがあった。例えば、ユーザが通勤である駅を使用している場合に、朝にその駅に滞在している状況と、夜に同じ駅に滞在している状況とでは、その人が次に向かう先は異なるのが普通である。しかし、時刻を考慮せずに場所間の遷移確率のみで次の行き先を予測しようとすると、行き先の予測結果が正反対になる可能性がある。
この発明は上記事情に着目してなされたもので、その目的とするところは、ユーザの滞在地と滞在時刻の両方を考慮することでユーザの行動をより高精度に予測できるようにした行動予測装置及びプログラムを提供することにある。
上記目的を達成するためにこの発明の一観点は、ユーザの滞在地及びその滞在時刻を表す情報を含む滞在地データを取得し、この取得された滞在地データの集合を滞在履歴記憶部に格納する手段と、前記滞在履歴記憶部に格納された滞在地データの集合に対し系列マイニングの処理を実行して、前記ユーザの特徴的な遷移行動を滞在地の系列と当該滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値を含む滞在時刻情報により表した行動パターン情報を生成し、この生成された行動パターン情報の集合を行動パターン記憶部に格納する行動パターン生成手段と、適合行動パターン選択手段とを備える。そして、この適合行動パターン選択手段により、前記取得された滞在地データと、前記行動パターン記憶部に格納された行動パターン情報の集合に基づいて、前記滞在地データに含まれる滞在地及びその滞在時刻情報と対応する滞在地及びその滞在時刻情報を含む適合行動パターン情報を前記行動パターン情報の集合の中から選択するように構成したものである。
より具体的には、適合行動パターン選択手段として、前記行動パターン記憶部に格納された行動パターン情報の集合の中から、前記取得された滞在地データに含まれる滞在地と等しい滞在地を抽出する手段と、前記抽出された滞在地の各々について、前記取得された滞在地データに含まれる滞在地との一致の度合いを表す尤度を、前記取得された滞在地データに含まれる滞在時刻と、前記抽出された滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値とに基づいて計算する手段と、前記計算された尤度に基づいて、当該尤度が予め設定した条件を満たす滞在地を前記抽出された滞在地の中から選択する手段と、前記選択された滞在地と当該滞在地を含む行動パターンを表す情報を適合行動パターン情報として出力する手段とを備えたものである。
したがってこの発明の一観点によれば、ユーザの現在の滞在地と、当該ユーザの過去の行動パターンの集合とから、ユーザの現在の行動形態に適合する行動パターンを探索する際に、ユーザの滞在地だけでなく当該滞在地におけるユーザの滞在時刻情報も考慮されて行動パターンが探索される。このため、滞在地のみに基づいて行動パターンを選択する場合に比べ、ユーザの現在の行動形態に適合する行動パターンを高精度に選択することが可能となる。
さらに、滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散をもとに、ユーザの現在の滞在地と過去の行動パターン中の滞在地との一致の度合いが尤度として算出され、その算出結果をもとにユーザの現在の行動形態に適合する行動パターンが選択される。このため、ユーザの現在の滞在地及び滞在時刻と滞在地及び時刻が完全一致する行動パターンを選択する場合に比べ、柔軟性の高い選択が可能となる。
また、この発明の一観点は行動予測処理手段をさらに備え、この行動予測処理手段により、適合行動パターン選択手段により選択された適合行動パターン情報に含まれる滞在地の系列及び滞在時刻情報に基づいて、前記ユーザが以後移動する滞在地とその到着時刻を予測し、この予測結果を表す情報を出力することも特徴とする。
このようにすると、ユーザが今後移動する滞在地とその到着時刻が出力され、例えば情報管理者に提示される。このため、ユーザの行動を把握しようとする場合に情報管理者は、行動パターン情報からユーザの目的地と到着時刻を予測する作業が不要となり、これにより作業性の向上と予測精度の向上を図ることができる。
すなわちこの発明によれば、ユーザの滞在地と滞在時刻の両方を考慮することでユーザの行動をより高精度に予測できるようにした行動予測装置及びプログラムを提供することができる。
この発明の一実施形態に係わる行動予測装置のハードウエア及びソフトウエアの構成を示すブロック図である。 図1に示した行動予測装置の機能構成を示すブロック図である。 図1に示す行動予測装置により得られるユーザの滞在地データの一例を示す図である。 図1に示した行動予測装置により得られるユーザの滞在地データの一例を示す図である。 図1に示した行動予測装置により得られるユーザの滞在パターンの一例を示す図である。 図1に示した行動予測装置による行動パターン生成処理の全体の手順と内容を示すフローチャートである。 図2に示した出現頻度しきい値決定手段の機能構成の第1の実施例を示すブロック図である。 図7に示した出現頻度しきい値決定手段による、滞在数を用いたしきい値決定処理の手順と内容を示すフローチャートである。 滞在パターン集合と滞在地集合との対応関係を一例を示す図である。 図8に示した、滞在数を用いたしきい値決定処理のうちの滞在数カウント処理の手順と内容を示すフローチャートである。 図8に示した、滞在数を用いたしきい値決定処理のうちの滞在数からのしきい値決定処理の手順と内容を示すフローチャートである。 出現頻度と滞在数との関係の一例を示す図である。 図2に示した出現頻度しきい値決定手段の機能構成の第2の実施例を示すブロック図である。 図13に示した出現頻度しきい値決定手段による、パターン数を用いた出現頻度しきい値決定処理の手順と内容を示すフローチャートである。 出現頻度しきい値とパターン総数及び近似式との関係の一例を示す図である。 出現頻度しきい値とパターン総数及び近似誤差との関係の一例を示す図である。 図2に示した出現頻度しきい値決定手段の機能構成の第3の実施例を示すブロック図である。 図17に示した出現頻度しきい値決定手段による、被覆率を用いた出現頻度しきい値決定処理の手順と内容を示すフローチャートである。 図2に示した行動パターン生成手段により生成される行動パターンの一例を示す図である。 図2に示した行動予測処理手段による行動予測処理の全体の手順と内容を示すフローチャートである。 図20に示したフローチャート中の適合行動パターン探索処理の手順と内容を示すフローチャートである。 図20に示したフローチャート中の目的地予測処理の手順と内容を示すフローチャートである。
以下、図面を参照してこの発明に係わる実施形態を説明する。
図1は、この発明の一実施形態に係わる行動予測装置のハードウエア及びソフトウエアの構成を示すブロック図である。
行動予測装置1は、例えばユーザが所持する携帯端末又はパーソナル・コンピュータ等のユーザ端末装置との間で、IP(Internet Protocol)網等の通信ネットワークを介して通信が可能なサーバ装置からなる。
行動予測装置1は、マイクロプロセッサからなる中央処理ユニット(CPU;Central Processing Unit)11を備え、このCPU11にバス12を介してプログラムメモリ13及びデータメモリ14を接続し、さらに通信インタフェース15及び入出力インタフェース16を接続している。
通信インタフェース15は、CPU11の制御の下で、通信ネットワークにより規定される通信プロトコルに従い、ユーザの携帯端末からその滞在地データを受信する。通信プロトコルとしては、例えばTCP/IP(Transmission Control Protocol/Internet Protocol)が使用される。
入出力インタフェース16には、入力デバイス17及び出力デバイス18が接続されている。入力デバイス17は、キーボード及びマウスにより構成される。出力デバイス18はディスプレイやプリンタからなる。入出力インタフェース16は、上記入力デバイス17による操作情報をCPU11に伝えると共に、後述する行動予測処理プログラム135により得られる、ユーザの次の行動の予測結果を表す情報をCPU11の指示に従い上記出力デバイス18を用いて表示又はプリント出力させる。なお、上記ユーザの次の行動の予測結果を表す情報は、通信インタフェース15からユーザの端末装置又はユーザから許可されたサービス事業者の端末装置へ送信することも可能である。
データメモリ14には、この発明を実施するために必要な記憶部として、滞在履歴記憶部141と、滞在パターン記憶部142と、行動パターン記憶部143と、予測結果記憶部144が設けられている。滞在履歴記憶部141には、ユーザ端末装置から受信した、当該ユーザが滞在した滞在地とその滞在時刻を表す滞在地データの集合が蓄積される。滞在パターン記憶部142には、後述する系列マイニング実行プログラムを実行することにより得られる滞在パターンの集合が蓄積される。行動パターン記憶部143には、上記蓄積された滞在パターンの集合の中から抽出された、ユーザにとって特徴的(典型的)な行動パターンに対応する滞在パターンが記憶される。予測結果記憶部144には、上記記憶された特徴的な滞在パターンの中から選択された、ユーザの現在の滞在地及び滞在時刻と一致する度合いの高い滞在地と、当該滞在地を含む行動パターンの識別情報(行動パターンID)が記憶される。
プログラムメモリ13には、この発明を実施するために必要なアプリケーション・プログラムとして、滞在地入力制御プログラム131と、系列マイニング実行プログラム132と、出現頻度しきい値決定プログラム133と、行動パターン決定プログラム134と、行動予測処理プログラム135が格納されている。
滞在地入力制御プログラム131は、図示しないユーザ端末装置からその滞在地データを通信ネットワークを介して通信インタフェース15により受信させ、受信された滞在地データを上記データメモリ14内の滞在履歴記憶部141に記憶させる処理を、上記CPU11に実行させる。滞在地データは、滞在地の固有名称と滞在時刻情報とから構成される。滞在地の固有名称は、例えばGPS(Global Positioning System)又はRFID(Radio Frequency IDentification)等の位置センサを用いて得たユーザ端末装置の緯度経度情報をもとに、地図データベースを検索することにより取得可能である。地図データベースはユーザ端末装置に予め記憶されているものを使用してもよいし、記憶されていない場合には地図データサーバで公開されているものを使用してもよい。また滞在時刻情報は、滞在開始時刻及び滞在終了時刻とからなる。なお、滞在地入力制御プログラム131は、メモリカード等の外部記憶媒体から滞在地データを読み込んで滞在履歴記憶部141に記憶させる処理機能も含まれる。
系列マイニング実行プログラム132は、上記滞在履歴記憶部141に蓄積された滞在地データの集合を読み出し、この読み出した滞在地データの集合に対し系列マイニングの手法を適用して滞在パターンの集合を作成し、この滞在パターンの集合を上記データメモリ14内の滞在パターン記憶部142に記憶させる処理を、上記CPU11に実行させる。
出現頻度しきい値決定プログラム133は、以下のような一連の処理をCPU11に実行させる。
(1) 出現頻度しきい値の候補θを0〜1の範囲で一定量ずつ増加させるごとに、上記滞在パターン記憶部142に記憶された滞在パターンの集合から出現頻度が当該候補を超える滞在パターンを選択する処理。
(2) 上記選択された滞在パターンの集合から、当該集合に含まれる全ての滞在地を抽出する処理。
(3) 上記滞在履歴記憶部141に記憶された滞在地データの集合の中から、上記抽出された滞在地と一致する滞在地の数をカウントする処理。
(4) 上記出現頻度しきい値の各候補についてそれぞれ得られた滞在地のカウント値をもとに、出現頻度しきい値の候補の変化に対し上記カウント値が変化しない区間を求め、この区間に含まれる出現頻度しきい値の候補の中から、上記特徴的な行動パターンの抽出に用いる出現頻度しきい値を選択する処理。
行動パターン決定プログラム134は、以下の処理をCPU11に実行させる。
(1) 上記出現頻度しきい値決定プログラム133の実行により決定された出現頻度しきい値に基づいて、上記滞在パターン記憶部142に記憶された滞在パターンの集合から上記出現頻度しきい値を超える滞在パターンを抽出する処理。
(2) 上記抽出された滞在パターンに含まれる滞在地ごとに、平均滞在開始時刻、平均滞在終了時刻、滞在開始時刻の分散及び滞在終了時刻の分散を求める処理。
(3) 上記抽出された滞在パターンと、上記求められた平均滞在開始時刻、平均滞在終了時刻、滞在開始時刻の分散及び滞在終了時刻の分散を、パターンIDに対応付けて上記データメモリ14内の行動パターン記憶部143に記憶させる処理。
行動予測処理プログラム135は、以下の処理をCPU11に実行させる。
(1) 上記滞在地入力制御プログラム131の制御の下でユーザの現在の滞在地データが得られた場合に、この滞在地データに含まれる滞在地と名称が一致する滞在地を上記行動パターン記憶部143に記憶された特徴的な行動パターンから抽出する処理。
(2) 上記抽出された滞在地の各々について、上記現在の滞在地データとの一致の度合いを表す尤度を計算する処理。この尤度の計算は、平均滞在開始時刻又は平均滞在終了時刻と、滞在開始時刻の分散又は滞在終了時刻の分散の値をもとに行われる。
(3) 上記計算された尤度が予め設定した条件を満たす滞在地を、上記抽出された滞在地の中から選択する処理。
(4) 上記選択された滞在地と、この滞在地を系列に含む滞在パターンと、滞在時刻情報とをもとに、ユーザの次の目的地と当該目的地への到達時刻を予測し、その予測結果を入出力インタフェース16を介して出力デバイス18へ出力させる処理。
図2は、図1に示した行動予測装置1の機能構成を示すブロック図である。行動予測装置1の機能は、入力部21と、記録部22と、処理部23と、出力部24とに大別される。
入力部21は滞在地入力手段211を備える。この滞在地入力手段211は、図1に示した滞在地入力制御プログラム131及び通信インタフェース15に対応する。
出力部24は予測結果出力手段241を備える。この予測結果出力手段241は、入出力インタフェース16、出力デバイス18及び通信インタフェース15に対応する。
記録部22は、滞在履歴記憶手段221と、滞在パターン記憶手段222と、行動パターン記憶手段223と、予測結果記憶手段224を備える。滞在履歴記憶手段221は図1の滞在履歴記憶部141に対応し、滞在パターン記憶手段222は滞在パターン記憶部142に対応する。また、行動パターン記憶手段223は図1の行動パターン記憶部143に対応し、予測結果記憶手段224は予測結果記憶部144に対応する。
処理部23は、行動パターン生成手段230と、行動予測処理手段234を備える。このうち行動パターン生成手段230は、系列マイニング実行手段231と、出現頻度しきい値決定手段232と、行動パターン決定手段233を含む。系列マイニング実行手段231は、図1に示した系列マイニング実行プログラム132に対応し、出現頻度しきい値決定手段232は図1に示した出現頻度しきい値決定プログラム133に対応する。行動パターン決定手段233は、図1に示した行動パターン決定プログラム134に対応する。また、行動予測処理手段234は図1に示した行動予測処理プログラム135に対応する。
図7は、上記出現頻度しきい値決定手段232の機能構成をさらに詳しく示すブロック図である。すなわち、出現頻度しきい値決定手段232は、出現頻度しきい値超えパターン選択手段2321と、滞在地集合計算手段2322と、滞在数カウント手段2323と、しきい値決定手段2324とから構成される。
次に、以上のように構成された行動予測装置の動作を説明する。図6はその全体の処理手順と処理内容を示すフローチャートである。
(1)滞在地データの入力
CPU11は、ステップS51において滞在地入力制御プログラム131を起動する。そして、この滞在地入力制御プログラム131に従い、ユーザ端末装置からその滞在地データを通信ネットワークを介して通信インタフェース15により受信し、この受信された滞在地データをデータメモリ14内の滞在履歴記憶部141に記憶させる。
滞在地データは、ユーザが一定時間以上滞在した滞在地に関するデータであり、例えばユーザ端末装置の滞在地検出機能により生成される。滞在地検出機能は、例えばGPS又はRFIDを利用した自端末の位置を計測する機能と、この機能により計測された緯度・経度からなる位置情報をもとに地図データベースからその地点の固有名称を表す情報を検索する機能とから構成される。滞在地データは、滞在地名と、滞在開始時刻と、滞在終了時刻とから構成される。図3はこの滞在地データの一例を示すもので、「家」と「A駅」のデータを示している。
また、上記複数の滞在地をユーザの移動順に配列することにより、滞在系列データを生成することができる。滞在系列データは、滞在地名の列と系列番号とから構成される。このとき、滞在系列をd、系列番号をiとすると、系列番号iを持つ滞在系列diは、
Figure 0005469876
のように表される。
ここで、uijを系列iのj番目の滞在地(又は滞在)と呼ぶ。uijの値はユーザが系列iでj番目に滞在した地名を表す。Miは系列iにおける滞在の総数である。図4は、滞在系列記憶部141に記憶されたN系列分の滞在系列データ集合の一例を示すもので、滞在系列データ集合Dは
Figure 0005469876
で表される。
(2)系列マイニング処理
CPU11は、続いてステップS52により系列マイニング実行プログラム132を起動する。そして、この系列マイニング実行プログラム132に従い、上記滞在履歴記憶部141から滞在系列データの集合を読み出し、この滞在系列データの集合に対し系列マイニング処理を実行して滞在パターンの集合を作成する。そして、この滞在パターンの集合を上記データメモリ14内の滞在パターン記憶部142に記憶させる。
系列マイニングとは、滞在系列データの集合を受け取り、この滞在系列データ集合の中から出現回数が一定回数以上、もしくは出現頻度が一定以上の全ての滞在パターンを高速に選択する手法である。なお、出現頻度とは、ある滞在パターンと滞在系列データ集合が与えられたときに、その滞在パターンが出現する滞在系列データ集合中の系列の総数と、滞在系列データ集合に含まれる系列の総数との比率である。なお、系列マイニングの処理については、以下の文献に詳しく述べられている。
Rakesh Agrawal and Ramakrishnan Srikant,“Mining Sequential Patterns”,11th International Conference on Data Engineering,pp 3−14,1995。
図5は、滞在パターン記憶部142に記憶された滞在パターンの一例を示すもので、滞在パターンはパターン番号とその出現回数と滞在の列により構成される。パターン番号は1つの滞在パターンにユニークに割り当てられる番号であり、滞在列は滞在地を並べたものである。このとき、滞在パターンをp、パターン番号をiとすると、あるパターン番号iを持つパターンpiは
Figure 0005469876
と表される。vijは滞在パターンpiに出現するj番目の滞在地であり、Kiは滞在パターンpiの滞在地の総数である。
出現回数は以下のように定義される。すなわち、パターンの出現は、滞在パターンと滞在系列との間で定義される概念であり、ある滞在パターンpa と滞在系列db についてそれぞれvai=ubα(i)となるような1≦α(1)<α(2)<…α(Ka)≦Mbが存在するとき、パターンpa は滞在系列db に出現するものと定義される。
例えば、滞在パターン<家,塾>は滞在系列<家,駅,塾>に出現するが、<家,駅,学校>には出現しない。この出現の定義を用いて出現回数を定義する。滞在パターンpj の出現回数は、滞在系列データ記憶部141に蓄積されている滞在系列データ集合に含まれる滞在系列データのうち、パターンpj が出現しているものの数を言う。パターンpi の出現回数をO(pi)と表すことにする。
滞在パターンの集合は以下のように定義される。すなわち、図5に示した行数(L行)は系列マイニング処理により作成された滞在パターンの総数であり、この作成された全ての滞在パターンの集合Pは、
Figure 0005469876
のように表される。
(3)出現頻度しきい値の決定処理
CPU11は、次にステップS53により出現頻度しきい値決定プログラム133を起動し、この出現頻度しきい値決定プログラム133に従い出現頻度しきい値決定処理を実行する。この出現頻度しきい値を決定する方法には3つの方法が考えられる。
(3−1)第1の方法
図8は、この出現頻度しきい値を決定する方法を実現する処理手順と処理内容を示すフローチャートである。
すなわち、CPU11は先ずステップS71により出現頻度しきい値の候補値θを最小値であるθ=0に設定する。続いてステップS72により、データメモリ14内の滞在パターン記憶部142から滞在パターン集合を読み出し、この読み出した滞在パターン集合に含まれる複数の滞在パターンの中から、上記出現頻度しきい値の候補値θを超える全ての滞在パターンを選択する。
CPU11は、次にステップS73に移行し、上記選択された滞在パターンの集合から滞在地集合を抽出する。滞在地集合は、滞在パターン記憶部142に記憶された滞在パターンの集合が与えられたとき、この集合に含まれる滞在パターンに含まれるすべての滞在地を集めた集合として定義される。図9は、その一例を示すもので、与えられた滞在パターンの集合が{<家,塾>,<家,バス停>,<家>,<バス停>}だった場合に、当該滞在パターンの集合からは滞在地集合として{家,塾,バス停}が抽出される。
CPU11は、続いてステップS74に移行し、滞在系列記憶部141に記憶された滞在系列データの集合の中から、上記抽出された滞在地と一致する滞在地の数をカウントする処理を以下のように実行する。図10はその処理手順と処理内容を示すフローチャートである。
すなわち、CPU11は上記ステップS73により抽出された滞在地集合をステップS91において取り込むと共に、ステップS92により上記滞在系列データ記憶部142から滞在系列データの集合を取り込み、ステップS93によりカウント値countを0に初期化する。
この状態でCPU11は、先ずステップS94において上記滞在系列データの集合に含まれる滞在系列データの1つから滞在地を1つ選択し、この選択した滞在地と等しい要素が上記滞在地集合の中に存在するか否かをステップS95で判定する。この判定の結果、選択した滞在地と等しい要素が上記滞在地集合の中に存在した場合には、ステップS96に移行してカウント値countをインクリメントする。これに対し存在しないと判定された場合には、上記カウント値のインクリメントを行わない。
次にCPU11は、ステップS97において上記滞在系列データの集合にまだ調べていない滞在地が残っているか否かを判定し、残っていればステップS94に戻って未選択の滞在地を1つ選択する。そして、この選択した滞在地と等しい要素が上記滞在地集合の中に存在するか否かを上記ステップS95で判定し、存在すればカウント値countをインクリメントする。以後同様に、上記滞在系列データの集合から未選択の滞在地を1つ選択するごとに、当該滞在地と等しい要素が上記滞在地集合の中に存在するか否かを判定し、存在すればカウント値countをインクリメントする処理を繰り返す。
そして、上記滞在系列データの集合に含まれる全ての滞在地について、上記判定処理とその結果に基づくカウント値countのインクリメント処理を終了すると、CPU11はステップS97からステップS98に移行して、上記カウント値countの値、つまり出現頻度しきい値の候補値θ=0のときの滞在地集合に含まれる各要素が上記滞在系列データ集合中に出現する回数を出力する。そして、この出力された滞在地数のカウント値を、上記出現頻度しきい値の候補値θ=0と対応付けてデータメモリ14内の滞在数カウント値記憶部(図示せず)に保存する。
なお、以上述べた滞在数のカウント処理の結果を数式で表すと以下のようになる。すなわち、カウントされた滞在数を出現頻度しきい値θの関数s(θ)とすると、この関数 s(θ)は
Figure 0005469876
として表される。
上記出現頻度しきい値の候補値θ=0のときの滞在数カウント処理が終了すると、CPU11は出現頻度しきい値の候補値θが最大値である1に達したか否かをステップS75で判定する。この判定の結果、θが1に達していなければステップS76により出現頻度しきい値の候補値θを一定量(例えば0.01)増加させ、ステップS72に戻る。そして、今度はこの増加後の出現頻度しきい値の候補値θを用いて、上記ステップS72〜ステップS74による滞在数カウント処理を実行する。以後同様に、出現頻度しきい値の候補値θが1に達するまで、θを一定量増加させるごとにステップS72〜ステップS74による滞在数カウント処理を繰り返し実行する。
以上の滞在数カウント処理の結果、出現頻度しきい値の候補の変化に対する滞在数の変化を表す情報がデータメモリ14内の滞在数カウント値記憶部に得られる。図12はその一例を示すものである。
上記出現頻度しきい値の候補値θが最大値である“1”に達すると、CPU11はステップS77に移行し、上記ステップS72〜ステップS74により得られた出現頻度しきい値の候補θの変化に対する滞在数の変化を表す情報に基づいて、特徴的な滞在パターンの抽出処理に用いる上で最適な出現頻度しきい値を1つ選択する処理を、以下のように実行する。図11はその処理手順と処理内容を示すフローチャートである。
すなわち、CPU11は先ずステップS101で上記データメモリ14内の滞在数カウント値記憶部から、出現頻度しきい値の各候補θ(0〜1)についてそれぞれ得られた滞在数カウント値を読み込む。次にステップS102において、上記読み込んだ滞在地のカウント値をもとに、出現頻度しきい値の候補θの変化に対し上記滞在数カウント値が変化しない区間をすべて検出する。続いてステップS103において、上記検出されたすべての区間のうち、出現頻度しきい値の候補θ=1を含む区間を先ず削除し、残った各区間の中でθの範囲が最長となる区間を1つ選択する。そして、ステップS104において、上記選択された最長区間内のθの下限値を、特徴的な行動パターンの抽出に用いる出現頻度しきい値として決定する。
例えば、図12の例ではθ=0.1〜0.5の区間を最長区間として選択し、この最長区間中の下限値であるθ=0.1を特徴的な行動パターンの抽出に用いる出現頻度しきい値として決定する。
以上述べたように、出現頻度しきい値を決定する第1の方法では、出現頻度しきい値の候補θを0〜1の範囲で一定量ずつ増加させるごとに、滞在パターン記憶部142に記憶された滞在パターンの集合から出現頻度が当該候補を超える滞在パターンを選択して、この選択された滞在パターンの集合から当該集合に含まれる全ての滞在地を抽出し、さらに滞在系列記憶部141に記憶された滞在系列データの集合の中から上記抽出された滞在地と一致する滞在地の数をカウントする。そして、出現頻度しきい値の各候補についてそれぞれ得られた滞在地のカウント値をもとに、出現頻度しきい値の候補の変化に対し上記カウント値が変化しない区間を求め、この区間のうちθ=1を含む区間を除いた最長区間の下限値を、上記特徴的な行動パターンの抽出に用いる出現頻度しきい値として選択するようにしている。
この第1の方法は以下のような利点を有する。すなわち、一般に出現頻度しきい値が低い領域では滞在数の変化が大きくなる傾向があるが、これは出現頻度しきい値以上の出現頻度をもつ滞在パターンの集合の変化が大きいことを反映している。そのような集合に含まれる滞在パターンは、ユーザの日常の行動を反映していないノイズである可能性が高く、ユーザの日常行動の評価に使用するには適さない。一方、出現頻度しきい値が高いと、それだけで得られる頻出パターンの数が少なくなり、ユーザの日常行動をその多様性を考慮して適切に評価することが困難となる。
これに対し上記第1の方法を用いると、先に述べたように出現頻度しきい値の変化に対して滞在数が不変の最長区間、つまり出現する滞在パターンの集合が最も安定しノイズを含む可能性が低い区間から、出現頻度しきい値が選択される。このため、出現頻度しきい値を低く設定される心配がない。また、出現頻度しきい値を0から増加させた場合、出現頻度の変化に対し滞在数が急激に変化する領域の直後に滞在数が不変の最長区間が現れることが多く、本実施形態ではこの区間の下限値に出現頻度しきい値が設定される。このため、出現頻度しきい値が高い値に設定される懸念がない。
すなわち、出現頻度しきい値を決定するための第1の方法によれば、出現頻度しきい値を低すぎずかつ高すぎない適切な値に設定することが可能となり、これによりノイズの影響を最小限度に抑えた上で、ユーザの日常行動を評価する上で必要な滞在パターンを十分抽出することができる。
(3−2)第2の方法
出現頻度しきい値を決定するための第2の方法は、出現頻度しきい値の候補値θを0〜1の範囲で一定量ずつ増加させるごとに当該出現頻度しきい値の候補値θを超える滞在パターン数をカウントし、この滞在パターン数のカウント値を利用して出現頻度しきい値を決定する手段又は方法を使用するものである。
図13は、この出現頻度しきい値を決定する第2の方法を実施するための出現頻度しきい値決定手段の機能構成を示すブロック図である。なお、同図において前記図7と同一部分には同一符号を付して詳しい説明は省略する。また、行動予測装置のソフトウエア及びハードウエア構成については図1を、また装置全体の機能構成については図2を延用して説明を行う。
出現頻度しきい値決定手段232は、図13に示すように出現頻度しきい値超えパターン選択手段2321と、パターン数カウント手段2325と、近似誤差計算手段2326と、誤差最小しきい値検出手段2327とから構成される。
出現頻度しきい値超えパターン選択手段2321は、出現頻度しきい値の候補θを0〜1の範囲で一定量ずつ増加させるごとに、上記滞在パターン記憶部142に記憶された滞在パターンの集合から出現頻度が当該候補を超える滞在パターンを選択する。
パターン数カウント手段2325は、上記各出現頻度しきい値の候補値θごとに、上記出現頻度しきい値超えパターン選択手段2321により選択された滞在パターンの数をカウントする。
近似誤差計算手段2326は、上記出現頻度しきい値の候補値θの変化に対する上記滞在パターンのカウント値の変化を表す近似式を定義する。
誤差最小しきい値検出手段2327は、上記定義された近似式と上記滞在パターンのカウント値との誤差を求め、この近似誤差が最小となるときの出現頻度しきい値の候補値θを特徴的な行動パターンの抽出に用いる出現頻度しきい値として選択する。
次に、以上のように構成された出現頻度しきい値決定手段232によるしきい値決定処理動作を説明する。図14はその処理手順と処理内容を示すフローチャートである。なお、同図において前記図8と同一部分には同一符号を付してある。
すなわち、CPU11は先ずステップS71により出現頻度しきい値の候補値θを最小値であるθ=0に設定する。続いてステップS72により、データメモリ14内の滞在パターン記憶部142から滞在パターン集合を読み出し、この読み出した滞在パターン集合に含まれる複数の滞在パターンの中から、上記出現頻度しきい値の候補値θを超える全ての滞在パターンを選択する。次にステップS131に移行し、上記ステップS72により選択された滞在パターンの数をカウントしそのカウント値をデータメモリ14内に保存する。
上記出現頻度しきい値の候補値θ=0のときの滞在パターン数の選択とその数をカウントする処理が終了すると、CPU11は出現頻度しきい値の候補値θが最大値である“1”に達したか否かをステップS75で判定する。この判定の結果、θが“1”に達していなければステップS76により出現頻度しきい値の候補値θを一定量(例えば0.01)増加させ、ステップS72に戻る。そして、今度はこの増加後の出現頻度しきい値の候補値θを用いて、上記ステップS72及びステップS131による滞在パターンの選択とその数をカウントする処理を実行する。以後同様に、出現頻度しきい値の候補値θが最大値である“1”に達するまで、出現頻度しきい値の候補値θを一定量増加させるごとに、ステップS72及びステップS131による滞在パターンの選択とその数をカウントする処理を繰り返し実行する。
次にCPU11は、ステップS132により別に設定した変数φを0に初期化したのち、ステップS133において関数fφ(x)を定義する。この関数fφ(x)は、上記ステップS132までに求めた、各出現頻度しきい値の候補値θに対応する滞在パターンのカウント値をR(θ)とすると、3つの点(0,R(0)),(θ,R(θ)),(1,R(1))を順に線分で結ぶ式として
Figure 0005469876
として定義される。
続いてCPU11は、ステップS134において、上記定義した関数fφ(x)と上記θごとの滞在パターンのカウント値R(θ)との近似誤差を求める。パラメータφに対応する近似誤差G(φ)は、
Figure 0005469876
として定義される。ここで、0=θ1 <θ2 <…<θT =1である。
この近似誤差G(φ)の意味について、図15を用いて説明する。図15は出現頻度しきい値の候補値θと滞在パターンのカウント値の関数R(θ)と、φ=0.2のときの関数fφ(x)とをプロットしたものである。図中の網掛けをした領域が、滞在パターンのカウント値の関数R(θ)を関数fφ(x)で近似したときの誤差である。滞在パターンのカウント値は、出現頻度しきい値の候補値θの変化に対して、しきい値が小さい場合には変化が大きく、反対にしきい値が大きい場合には変化が小さくなる傾向がある。このため、滞在パターンのカウント値を関数fφ(x)で近似すると、滞在パターンのカウント値の変化が大きな部分と小さな部分の境界にθがあるとき誤差は最小となる。換言すれば、誤差が小さくなるということは、パラメータφの値が滞在パターンのカウント値の関数R(θ)における傾きの変化の境界に近づいていることを意味する。
上記ステップS134において近似誤差が計算されると、CPU11はステップS135において、上記計算された近似誤差をφの値に対応付けてデータメモリ14に一時保存する。
上記パラメータφ=0のときの滞在数カウント処理が終了すると、CPU11はパラメータφが最大値である1に達したか否かをステップS136で判定する。この判定の結果、φが1に達していなければステップS137によりパラメータφを一定量(例えば0.01)増加させ、ステップS133に戻る。そして、今度はこの増加後のφを用いて、上記ステップS133〜ステップS135による近似誤差の計算処理を実行する。以後同様に、パラメータφが1に達するまで、パラメータφを一定量増加させるごとにステップS133〜ステップS135による近似誤差の計算処理を繰り返し実行する。
上記近似誤差の計算処理により、0〜1までのすべてのφに対する近似誤差が計算されると、CPU11はステップS138において、上記計算されたすべてのφに対する近似誤差の中から最小となる近似誤差を選択し、この誤差が最小となるときのφを特徴パターンの抽出に使用する出現頻度しきい値として出力する。
上記近似誤差が最小となるときのφを出現頻度しきい値として選択する理由は以下のようなものである。図16は、出現頻度パラメータφを変化させ、それに伴う滞在パターンのカウント値R(φ)の変化と近似誤差G(σ)の変化とを同時にプロットした図である。同図から、近似誤差G(σ)が最小となる出現頻度パラメータφは、滞在パターンのカウント値R(φ)の変化の境界に近いことが分かる。こうした領域は、滞在パターンが安定な出現頻度しきい値の下限値であると考えることができるため、このφを特徴パターンの抽出に使用する出現頻度しきい値として出力する。
以上述べたように出現頻度しきい値を決定するための第2の方法では、出現頻度しきい値の候補値θを0〜1の範囲で一定量ずつ増加させるごとに当該出現頻度しきい値の候補値θを超える滞在パターン数をカウントする。そして、別途設定した出現頻度パラメータφを0〜1の範囲で一定量ずつ増加させるごとに、上記滞在パターン数のカウント値と近似関数fφ(x)との近似誤差を求め、この近似誤差が最小となるときの出現頻度パラメータφを特徴パターンの抽出に使用する出現頻度しきい値として選択するようにしている。
したがって、この第2の方法においても、先に述べた第1の方法と同様に、滞在パターンが安定な出現頻度しきい値の下限値に出現頻度しきい値が設定される。このため、出現頻度しきい値を低すぎずかつ高すぎない適切な値に設定することが可能となり、これによりノイズの影響を最小限度に抑えた上で、ユーザの日常行動を評価する上で必要な滞在パターンを十分抽出することができる。
(第3の方法)
出現頻度しきい値を決定するための第3の方法は、出現頻度しきい値の候補値θを0〜1の範囲で一定量ずつ増加させるごとに当該出現頻度しきい値の候補値θを超える滞在パターン数を選択して、この選択された滞在パターンの集合から当該集合に含まれる全ての滞在地を抽出すると共に、滞在系列データの集合に含まれる滞在地の総数に対する上記滞在地のカウント値の割合(被覆率)を求め、この被覆率をもとに出現頻度しきい値を決定するようにしたものである。
図17は、この第3の方法を実施するための出現頻度しきい値決定手段232の機能構成を示すブロック図である。なお、同図において前記図7と同一部分には同一符号を付して詳しい説明は省略する。また、本実施形態においても、行動予測装置のソフトウエア及びハードウエア構成については図1を、また装置全体の機能構成については図2を延用して説明を行う。
出現頻度しきい値決定手段232は、図17に示すように出現頻度しきい値超えパターン選択手段2321と、滞在地集合計算手段222と、滞在数カウント手段2323と、被覆率計算手段2328と、しきい値決定手段2324とから構成される。
このうち被覆率計算手段2328は、滞在系列データ記憶部142(滞在系列記憶手段221)に記憶された滞在系列データの集合に含まれる滞在地の総数に対する、上記滞在数カウント手段2323により得られた滞在地のカウント値の割合を、被覆率として計算する。
次に、以上のように構成された出現頻度しきい値決定手段232によるしきい値決定処理動作を説明する。図18はその処理手順と処理内容を示すフローチャートである。なお、同図において前記図8と同一部分には同一符号を付してある。
すなわち、CPU11は先ずステップS71により出現頻度しきい値の候補値θを最小値であるθ=0に設定する。続いてステップS72により、データメモリ14内の滞在パターン記憶部142から滞在パターン集合を読み出し、この読み出した滞在パターン集合に含まれる複数の滞在パターンの中から、上記出現頻度しきい値の候補値θを超える全ての滞在パターンを選択する。
CPU11は、次にステップS73に移行し、上記選択された滞在パターンの集合から滞在地集合を抽出する。滞在地集合は、滞在パターン記憶部142に記憶された滞在パターンの集合が与えられたとき、この集合に含まれる滞在パターンに含まれるすべての滞在地を集めた集合として定義される。続いてCPU11は、ステップS74に移行し、滞在系列記憶部141に記憶された滞在系列データの集合の中から、上記抽出された滞在地と一致する滞在地の数をカウントする。
次にCPU11は、ステップS161において、滞在系列データ記憶部142に記憶された滞在系列データの集合に含まれる滞在地の総数に対する、上記ステップS72〜S74により得られた滞在地のカウント値の割合を被覆率として計算する。いま、被覆率をσ(θ)とすると、被覆率は
Figure 0005469876
のように表される。
次にCPU11は、ステップS162において、上記計算された被覆率σ(θ)をもとに特徴パターンの抽出に使用する出現頻度しきい値を決定する。被覆率は、第1の方法で述べた滞在数と同様に出現頻度しきい値に対して単調非増加である。このため、出現頻度しきい値の候補値を増加させて、その被覆率が一旦ある値を下回ったならば、以降どれだけ候補値を増加させても被覆率がその値を上回ることはない。したがって、被覆率にあるしきい値を設定しておけば、出現頻度しきい値の候補値を増加させていったときに、被覆率が初めてそのしきい値以下になった点を検出することができる。
そこで、被覆率に対して予め例えば0.3という被覆率のしきい値を設定しておく。そして、出現頻度しきい値の候補値を増加させていって、被覆率が上記設定されたしきい値を上回ったとき、このときの出現頻度しきい値の候補値の最大値を、特徴パターンの抽出に使用する出現頻度しきい値として出力する。
このように特徴パターンの抽出に使用する出現頻度しきい値を決定することで、ユーザの滞在系列データの性質によらず、行動のカバー率が一定となるように特徴的な滞在パターンの集合を抽出することが可能となる。
(4)特徴的な行動パターンの抽出処理
上記第1乃至第3の方法のいずれかの方法により出現頻度しきい値が決定されると、CPU11はステップS55に移行し、行動パターン決定プログラム134を起動する。そして、この行動パターン決定プログラム134に従い、先ず滞在パターン記憶部142から滞在パターンの集合を読み出し、この読み出した滞在パターンの集合に含まれる各滞在パターンの中から、上記決定された出現頻度しきい値を超える滞在パターンを抽出する。また、上記抽出された滞在パターンに含まれる滞在地ごとに時刻特徴量を求める。この時刻特徴量は、平均滞在開始時刻、平均滞在終了時刻、滞在開始時刻の分散及び滞在終了時刻の分散からなる。そして、上記抽出された滞在パターンと、上記求められた時刻特徴量を、パターンIDに対応付けて上記データメモリ14内の行動パターン記憶部143に記憶させる。
図19は、以上のようにして行動パターン記憶手段143に記憶された行動パターン情報の一例を示すものである。なお、同図では、簡単のため2つの滞在パターンのみを例示し、また時刻特徴量については上記滞在パターン中に出現する一つ目の滞在地1に対応するもののみを示している。
(5)行動予測処理
さて、以上のようにユーザの特徴的な行動パターンが得られると、CPU11は次に行動予測処理プログラム135を起動し、この行動予測処理プログラム135に従いユーザの次の行動を予測するための処理を以下のように実行する。図20はその全体の処理手順と処理内容を示すフローチャートである。
CPU11は、先ずステップS201において、一定時間ごとに、或いはユーザ端末装置から受信した最新の滞在地データが滞在履歴記憶部141に記憶されている前回受信した滞在地データに対し変化した場合に、滞在履歴記憶部141から最新の滞在地データを、つまりユーザの現在の滞在地を表すデータを読み出す。この最新の滞在地データは、少なくとも滞在開始時刻を含んでいるものとする。また、それと共にCPU11は、ステップS202において、行動パターン記憶部143から行動パターン情報の集合を読み出す。この読み出された最新の滞在地データ及び行動パターン情報の集合は、データメモリ14内の作業用メモリに一旦格納される。
次にCPU11は、ステップS203において、上記読み出した最新の滞在地データに適合する行動パターンを探索するための処理を以下のように実行する。図21はその処理手順と処理内容を示すフローチャートである。
(5−1)適合行動パターンの探索処理
CPU11は、先ずステップS301により作業用メモリから最新の滞在地データの滞在地名を読み出し、さらにステップS302により作業用メモリから行動パターン情報の集合を順に読み出す。そして、ステップS303において、滞在パターン中に上記最新の滞在地データの滞在地名を含む行動パターンをすべて抽出し、この抽出した行動パターン情報の集合を作業用メモリ上に作成する。例えば、最新の滞在地データの滞在地名(ユーザの現在の滞在地)が「A駅」だったならば、この「A駅」を含む滞在パターンを有する行動パターン情報をすべて抽出する。この抽出処理の結果、抽出した行動パターン情報の集合が「空」であるとステップS304で判定すると、つまり上記最新の滞在地データの滞在地名を含む行動パターン情報を抽出できなかった場合には、CPU11は適合行動パターンの探索処理を終了する。
一方、上記最新の滞在地データの滞在地名を含む行動パターン情報を抽出できると、CPU11はステップS305に移行して、上記行動パターン情報の集合から行動パターン情報を1つ取り出す。続いてステップS306により、上記取り出した行動パターン情報の滞在パターン中から上記最新の滞在地データと名前が同一の滞在地を一つ選択する。そして、ステップS307において、上記選択した滞在地に対応する滞在開始時刻の平均及び分散の値を用いて、上記最新の滞在地データに含まれる滞在開始時刻の尤度を計算する。この尤度L(t) は、現在の滞在地の滞在開始時刻をt、上記行動パターン情報の滞在パターンから選択された滞在地の滞在開始時刻の平均及び分散の値をそれぞれμ、σ2とすると、
Figure 0005469876
のように定義される。
なお、尤度計算には、現在の滞在地の滞在開始時刻に加え滞在終了時刻を用いてもよい。この場合、滞在終了時刻についても上記式により同様の計算を行い、その計算結果と上記滞在開始時刻についての計算結果との積を求め、その結果を尤度L(t) とする。
次にCPU11は、ステップS308において、上記尤度L(t) の計算結果を予め設定したしきい値と比較してしきい値以上であるか否かを判定する。そして、しきい値以上であれば、このときの尤度L(t) の値がこれまでで最大か否かを判定する。この判定の結果、上記尤度L(t) の値がしきい値以上でかつこれまでで最大だったとすれば、CPU11はステップS309により、上記尤度を計算した滞在地の番号と、当該滞在地を滞在パターン中に含む行動パターン情報のパターンIDを、ユーザの現在の滞在地が該当する行動パターン情報の候補としてデータメモリ14の作業用メモリに保存する。そして、ステップS310に移行する。
これに対し、上記尤度L(t) の値がしきい値未満か、或いはしきい値以上であってもこれまでで最大ではなければ、CPU11は上記行動パターン情報をユーザの現在の滞在地が該当する候補として保存せずに、ステップS310に移行する。ステップS310では、当該行動パターン情報の滞在パターン中に現在の滞在地と名前が同じ滞在地が他にもあるか否かを判定する。この判定の結果、他にもあればステップS306に戻って、現在の滞在地と名前が同じその他の滞在地を一つ選択し、以後ステップS307〜ステップS309により、尤度の計算処理とその計算結果に基づく行動パターン候補とするか否かの判定処理を実行する。
なお、上記尤度に基づく適合行動パターン候補の探索処理では、尤度L(t) の値がしきい値以上となる滞在地が複数見つかった場合には、この滞在地名と当該滞在地を滞在パターン中に含むすべての行動パターン情報のパターンIDを、ユーザの現在の滞在地が該当する行動パターン情報として保存するようにしてもよい。また、しきい値を設けずに、尤度L(t) の値が最大となる滞在地と当該滞在地を滞在パターン中に含む1つの行動パターン情報のパターンIDを、ユーザの現在の滞在地が該当する行動パターン情報として保存するようにしてもよい。
また、上記行動パターン情報の滞在パターン中に含まれる、現在の滞在地と名前が同じすべての滞在地の選択が終了すると、CPU11はステップS310からステップS311に移行する。そして、上記ステップS303において作成した現在の滞在地を含む行動パターン情報の集合の中に、ステップS305でまだ選択されていない行動パターン情報があるか否かを判定する。この判定の結果、まだ選択されていない行動パターン情報が存在する場合には、ステップS305に戻って未選択の行動パターン情報を1つ選択する。そして、この選択した行動パターン情報について、上記ステップS306〜ステップS310による処理を同様に実行する。
そうして、上記ステップS303において作成したすべての行動パターン情報について、上記ステップS305〜ステップS311による処理が完了すると、CPU11はステップS311からステップS312に移行し、上記データメモリ14内の作業用メモリに候補として最終的に保存されている、滞在地の番号と当該滞在地を滞在パターン中に含む行動パターン情報のパターンIDを、適合行動パターンの探索結果として出力する。
(5−2)目的地の予測処理
上記適合行動パターンの探索処理が終了すると、CPU11は次に図20のステップS204において、ユーザの現在の滞在地に適合する行動パターン情報が見つかったか否かを判定する。この判定の結果、見つからなければそのまま処理を終了するが、見つかるとステップS205に移行して目的地予測処理を以下のように実行する。図22はその処理手順と処理内容を示すフローチャートである。
すなわち、CPU11は先ずステップS401により、上記適合行動パターン探索処理により最終的に得られた滞在地の番号と当該滞在地を滞在パターン中に含む行動パターン情報のパターンIDを、データメモリ14の作業用メモリから読み出す。そして、ステップS402において、上記読み出されたパターンIDをもとに行動パターン記憶部143から該当する行動パターン情報を読み出し、この行動パターン情報に含まれる滞在パターンにおける滞在地の系列と、ユーザの現在の滞在地に該当すると判定された上記滞在地の番号とをもとに、ユーザの次の目的地となる滞在地を予測する。
予測の手法としては、滞在パターンのみにより予測するか、滞在パターンと滞在時刻情報を用いて予測するか、目的地として複数の滞在地の予測を許容するかといった条件に応じて、複数通りの手法が考えられる。複数の目的地の予測が許容されるのならば、単純に、入力されたすべての適合行動パターン情報に対して、その各滞在パターン上でユーザの現在の滞在地に該当する滞在地の次に位置する滞在地をそれぞれ選択し、この選択された滞在地の集合を目的地の集合とする。これに対し1つの目的地の予測しか許さない場合には、例えば上記目的地として選択された滞在地の集合から、滞在開示時刻の平均値が最も早い滞在地を目的地の予測結果とする。また、時刻情報を参照することで、例えば複数の適合行動パターン情報の各滞在パターン中で、ユーザの現在の滞在地に該当する滞在地以降に配列された滞在地のうち、滞在開始時刻の平均値が現在時刻から一定時間以内(例えば30分以内)であるものをすべて目的地の予測結果とする。この滞在地は、ユーザがパターンに沿って行動をしていると考えられるのならば、当該ユーザが滞在する可能性が高い。
最後にCPU11は、ステップS206(ステップS403)において、上記のように予測した目的地と、この目的地における滞在開始時刻の平均値を、データメモリ14内の予測結果記憶部144に記憶させると共に、入出力インタフェース16を介して出力デバイス18から出力させる。
以上述べたようにこの実施形態では、ユーザの現在の滞在地データと、当該ユーザについて事前に作成された特徴的な行動パターンを表す情報の集合とに基づいて、この行動パターン情報の集合から、ユーザの現在の滞在地と名前が同じ滞在地を含み、かつ当該滞在地の滞在開始時刻又は終了時刻の尤度がしきい値以上でかつ最も高い滞在地と当該滞在地を含む行動パターン情報を選択する。そして、この選択した滞在地と行動パターン情報をもとに、ユーザの次の目的地を予測するようにしている。
したがって、ユーザの滞在地だけでなく当該滞在地におけるユーザの滞在時刻も考慮されて、ユーザの現在の滞在地に適合する行動パターンが探索される。このため、滞在地のみに基づいて行動パターンを選択する場合に比べ、ユーザの現在の行動形態に適合する行動パターンを高精度に選択することが可能となる。
また、滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散をもとに、ユーザの現在の滞在地と過去の行動パターン中の滞在地との一致の度合いが尤度として算出され、その算出結果をもとにユーザの現在の行動形態に適合する行動パターンが選択される。このため、ユーザの現在の滞在地及び滞在時刻と地名及び時刻が完全一致する行動パターンを選択する場合に比べ、柔軟性の高い選択が可能となる。
さらに、ユーザの次の目的地とその到着時刻が出力されて情報管理者に提示される。このため、ユーザの行動を把握しようとする場合に情報管理者は、適合行動パターン情報からユーザの目的地と到着時刻を予測する作業を自身で行う必要がなくなり、これにより作業性の向上と予測精度の向上を図ることができる。
また、この実施形態によれば、滞在数を求める過程で非日常的な滞在地を発見することも可能である。非日常的な滞在地とは、特徴的な滞在パターンのいずれの集合にも含まれない滞在地のことである。出現頻度がある出現頻度しきい値φ以上の出現頻度を持つパターンの集合をQφ⊆Pとすると、ある日の滞在系列diに含まれる非日常的な滞在地の集合Ei は、
Figure 0005469876
として定義することができる。非日常的な滞在地を発見することはユーザの行動を理解することにつながる。
なお、この発明は上記実施形態に限定されるものではない。例えば、行動予測装置としての機能をサーバ装置に設けた場合を例にとって説明したが、行動予測装置としての機能をユーザの携帯端末又はパーソナル・コンピュータ等のユーザ端末装置に設けるようにしてもよい。また、行動予測装置を構成する複数の機能、つまり行動パターン生成手段230と行動予測処理手段234とを分割して、その一部をサーバ装置に、他を携帯端末やパーソナル・コンピュータ等のユーザ端末装置に設けるようにしてもよい。すなわち、行動予測装置を構成する機能を実現する複数の手段はサーバ装置とユーザ端末装置に分散して設けるようにしてもよい。
その他、行動予測装置の種類やその構成、行動パターン生成手段230の構成とその処理手順と内容、行動予測処理手段234の構成とその処理手順と内容等についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
1…行動予測装置、11…CPU、12…バス、13…プログラムメモリ、14…データメモリ、15…通信インタフェース、16…入出力インタフェース、17…入力デバイス、18…出力デバイス、131…滞在地入力制御プログラム、132…系列マイニング実行プログラム、133…出現頻度しきい値決定プログラム、134…行動パターン決定プログラム、135…行動予測処理プログラム、141…滞在履歴記録部、142…滞在パターン記録部、143…予測結果記憶部、21…入力部、211…滞在地入力手段、22…記録部、221…滞在履歴記憶手段、222…滞在パターン記録手段、223…行動パターン記憶手段、224…予測結果記憶手段、23…処理部、230…行動パターン生成手段と、231…系列マイニング実行手段、232…出現頻度しきい値決定手段、233…行動パターン決定手段、234…行動予測処理手段、2321…頻度しきい値超えパターン選択手段、2322…滞在地集合計算手段、2323…滞在数カウント手段、2324…しきい値決定手段、2325…パターン数カウント手段、2326…近似誤差計算手段、2327…誤差最小しきい値検出手段、2328…被覆率計算手段、2411…しきい値出力手段。

Claims (3)

  1. ユーザの滞在地及びその滞在時刻を表す情報を含む滞在地データを取得し、この取得された滞在地データの集合を滞在履歴記憶部に格納する手段と、
    前記滞在履歴記憶部に格納された滞在地データの集合に対し系列マイニングの処理を実行して、前記ユーザの特徴的な遷移行動を滞在地の系列と当該滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値を含む滞在時刻情報とにより表した行動パターン情報を生成し、この生成された行動パターン情報の集合を行動パターン記憶部に格納する行動パターン生成手段と、
    前記取得された滞在地データと、前記行動パターン記憶部に格納された行動パターン情報の集合に基づいて、前記滞在地データに含まれる滞在地及びその滞在時刻情報と対応する滞在地及びその滞在時刻情報を含む適合行動パターン情報を前記行動パターン情報の集合の中から選択する適合行動パターン選択手段と
    を具備し、
    前記適合行動パターン選択手段は、
    前記行動パターン記憶部に格納された行動パターン情報の集合の中から、前記取得された滞在地データに含まれる滞在地と等しい滞在地を抽出する手段と、
    前記抽出された滞在地の各々について、前記取得された滞在地データに含まれる滞在地との一致の度合いを表す尤度を、前記取得された滞在地データに含まれる滞在時刻と、前記抽出された滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値とに基づいて計算する手段と、
    前記計算された尤度に基づいて、当該尤度が予め設定した条件を満たす滞在地を前記抽出された滞在地の中から選択する手段と、
    前記選択された滞在地と当該滞在地を含む行動パターンを表す情報を適合行動パターン情報として出力する手段と
    を備えることを特徴とする行動予測装置
  2. 前記適合行動パターン選択手段により選択された適合行動パターン情報に含まれる滞在地の系列及び滞在時刻情報に基づいて、前記ユーザが以後移動する滞在地とその到着時刻を予測し、この予測結果を表す情報を出力する行動予測処理手段を
    さらに具備することを特徴とする請求項1記載の行動予測装置。
  3. 前記請求項1又は2に記載の行動予測装置が具備する各手段に対応する処理を、前記行動予測装置が備えるコンピュータに実行させることを特徴とするプログラム。
JP2009034008A 2009-02-17 2009-02-17 行動予測装置及びプログラム Expired - Fee Related JP5469876B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009034008A JP5469876B2 (ja) 2009-02-17 2009-02-17 行動予測装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009034008A JP5469876B2 (ja) 2009-02-17 2009-02-17 行動予測装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2010191589A JP2010191589A (ja) 2010-09-02
JP5469876B2 true JP5469876B2 (ja) 2014-04-16

Family

ID=42817590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009034008A Expired - Fee Related JP5469876B2 (ja) 2009-02-17 2009-02-17 行動予測装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5469876B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104833365B (zh) * 2014-02-12 2017-12-08 华为技术有限公司 一种用户目的地点的预测方法及装置
JP6458572B2 (ja) * 2015-03-16 2019-01-30 カシオ計算機株式会社 顧客行動管理装置、顧客行動管理方法およびプログラム
CN112773657B (zh) * 2019-11-08 2022-11-22 上海荣泰健康科技股份有限公司 按摩椅找肩控制方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001056805A (ja) * 1999-08-18 2001-02-27 Sony Corp 行動予測方法及びその装置
JP2007263972A (ja) * 2002-10-10 2007-10-11 Matsushita Electric Ind Co Ltd 情報提示方法および情報提示装置
JP4088218B2 (ja) * 2003-06-12 2008-05-21 株式会社東芝 データ抽出装置、データ抽出方法およびデータ抽出プログラム
JP4220857B2 (ja) * 2003-08-18 2009-02-04 本田技研工業株式会社 携帯端末機器を用いた移動ロボットの画像撮影装置
JP4284301B2 (ja) * 2005-05-13 2009-06-24 ソフトバンクモバイル株式会社 情報配信装置及び情報配信システム
JP4609896B2 (ja) * 2006-11-14 2011-01-12 大日本印刷株式会社 情報提供システム
JP4426563B2 (ja) * 2006-12-25 2010-03-03 大日本印刷株式会社 情報提供システム
JP2009036594A (ja) * 2007-07-31 2009-02-19 Panasonic Corp 移動先予測装置および移動先予測方法

Also Published As

Publication number Publication date
JP2010191589A (ja) 2010-09-02

Similar Documents

Publication Publication Date Title
KR101999471B1 (ko) 정보 추천 방법 및 장치
WO2018040944A1 (zh) 恶意地址/恶意订单的识别系统、方法及装置
CN112612957B (zh) 兴趣点的推荐方法、兴趣点推荐模型的训练方法、装置
CN111639988B (zh) 经纪人推荐方法、装置、电子设备和存储介质
US20110117537A1 (en) Usage estimation device
CN110704603A (zh) 一种通过资讯发掘当前热点事件的方法和装置
CN109961351B (zh) 信息推荐方法、装置、存储介质及计算机设备
CN111666450A (zh) 视频召回方法、装置、电子设备及计算机可读存储介质
US20180005022A1 (en) Method and device for obtaining similar face images and face image information
CN110597965B (zh) 文章的情感极性分析方法、装置、电子设备及存储介质
CN112508638B (zh) 数据处理的方法、装置及计算机设备
CN117235586B (zh) 酒店客户画像构建方法、系统、电子设备及存储介质
JP5235160B2 (ja) 行動予測装置とそのプログラム
JP5469876B2 (ja) 行動予測装置及びプログラム
KR101743169B1 (ko) 얼굴 정보를 이용한 실종 가족 찾기 시스템 및 방법 그리고 이를 구현하는 프로그램을 기록한 기록 매체
JP7015927B2 (ja) 学習モデル適用システム、学習モデル適用方法、及びプログラム
US20200302507A1 (en) Item presentation method, item presentation program, and item presentation apparatus
JP2010108102A (ja) 行動パターン抽出装置、方法及びプログラム
CN110851708A (zh) 负样本的抽取方法、装置、计算机设备和存储介质
CN115907926A (zh) 商品的推荐方法、装置、电子设备及存储介质
KR101832398B1 (ko) 위치기반 서비스 제공업체 추천 방법 및 장치
CN113205189B (zh) 训练预测模型的方法、预测方法及装置
CN115796984A (zh) 物品推荐模型的训练方法、存储介质及相关设备
JP4938367B2 (ja) セキュリティ診断システム
US20160098766A1 (en) Feedback collecting system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120619

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120627

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130308

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130820

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140203

R150 Certificate of patent or registration of utility model

Ref document number: 5469876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees