JP5410462B2 - 行動及び属性推定装置及び方法及びプログラム - Google Patents

行動及び属性推定装置及び方法及びプログラム Download PDF

Info

Publication number
JP5410462B2
JP5410462B2 JP2011025439A JP2011025439A JP5410462B2 JP 5410462 B2 JP5410462 B2 JP 5410462B2 JP 2011025439 A JP2011025439 A JP 2011025439A JP 2011025439 A JP2011025439 A JP 2011025439A JP 5410462 B2 JP5410462 B2 JP 5410462B2
Authority
JP
Japan
Prior art keywords
spot
genre
user
stay area
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011025439A
Other languages
English (en)
Other versions
JP2012164227A (ja
Inventor
将成 藤田
博久 手塚
博 吉川
伸洋 武藤
峰樹 市森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011025439A priority Critical patent/JP5410462B2/ja
Publication of JP2012164227A publication Critical patent/JP2012164227A/ja
Application granted granted Critical
Publication of JP5410462B2 publication Critical patent/JP5410462B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、行動及び属性推定装置及び方法及びプログラムに係り、特に、ユーザの移動履歴(GPS(Global Positioning system)履歴)と、店舗等のスポットに関連付いた属性情報と組み合わせた情報から、ユーザの属性、状況を推定する行動及び属性推定装置及び方法及びプログラムに関する。
ユーザの行動や状況に合わせて適切なサービス・コンテンツをリコメンドする技術が望まれている。このため、書籍通販サイトにて、サイト内での書籍情報閲覧履歴からユーザの興味情報を推定して書籍をリコメンドする等、多様な履歴情報からユーザの趣味嗜好等の属性や状況を推定する技術が提案されている。ここで、このような取り組みにおいてWEB閲覧履歴については入手性が高いこともあり検討があるが、移動履歴については、昨今、携帯電話への搭載等にてGPS移動履歴の入手性は高まっているが比較的取り組みが少ない。ここで、移動履歴を利用する場合については昨今スマートフォン等の普及により日中全時間帯の履歴をとることが安易となっているため、ユーザの状況に適応するコンテキストアウェアなサービスが実現できる可能性もあり潜在的な有用性は高い。
移動履歴での取り組みが少ない理由は、ユーザ属性、状況等を推定するためには、店舗/スポットの訪問を把握することが有効であるが、GPSの誤差により、どの店舗/スポットに訪問したか把握することは技術的難易度が高いためであると考えられる。尚、このGPS誤差は、見通しの良い屋外では1m以下を期待できるが、市街地での店舗への訪問(屋内)を識別したい場合には、数百mの誤差を想定する必要がある。
この課題を解決する方法として、GPS履歴から店舗訪問の可能性が高い履歴として、一定時間の滞留を抽出しエリア化(以降、「滞在エリア」と記す)し、エリア内に存在するスポットに設定されているスポットの属性(キーワード)の出現頻度を元に訪問可能性を考えて統計的にユーザ属性を推定する方法が考えられる。尚、この方法で利用するスポットの情報は、WEB等に広く存在するデータから、各スポットの位置情報(緯度・経度等)とスポット属性(ラーメン屋、焼き肉屋等)を収集する、もしくは市販の店舗情報DBを購入することを想定する。
このようなユーザ履歴における「キーワード出現頻度」から、ユーザ嗜好や属性を推定する点で共通する関連研究が、WEB閲覧履歴に対して行われている(例えば、非特許文献1参照)。
松尾豊、福田隼人、石塚満 ユーザ個人の閲覧履歴からのキーワード抽出によるブラウジング支援 人工知能学会論文誌,Vol 18 No4 pp 203-211,2003
しかしながら、上記の従来技術では、WEB履歴を対象としており、WEB履歴には存在しない強い距離制約のような移動履歴の特徴に対応しておらず利用することができない。
本発明は、上記の点に鑑みなされたもので、GPSの履歴からユーザの滞在エリア内に存在する各スポットに関連付けられた属性、ユーザの行動を精度よく推定することが可能な行動及び属性推定装置及び方法及びプログラムを提供することを目的とする。
上記の課題を解決するため、本発明は、 ユーザの移動履歴とスポットに関連付けられた属性情報からユーザの属性及び行動を推定する行動及び属性推定装置であって、
スポット毎に属性(ジャンル)情報が関連付けられた情報を格納するスポット情報記憶手段と、
ユーザの位置情報収集デバイスから測位時刻、位置情報の時系列データを含む前記ユーザの移動履歴を取得する受信手段と、
前記ユーザの移動履歴から前記ユーザの滞在エリアを特定する滞在エリア特定手段と、
特定された前記滞在エリア内に存在するスポット数とスポットに対応するジャンルの数(スポットジャンル数)の比率からスコアを求めるスコア算出手段と、
前記スコアと所定の条件を比較してユーザの属性及び行動を推定する推定手段と、
を有し、前記スコア算出手段は、
前記滞在エリア特定手段で特定された前記滞在エリアに基づいて前記スポット情報記憶手段を参照して、ユーザの滞在エリア内におけるスポット及びスポットジャンルの地理分布から算出したスポット数とスポットジャンル数の比率の出現確率分布によりジャンル出現希少性の値を求め、該ジャンル出現希少性の値を利用して該滞在エリア内に存在するスポット数とスポットジャンル数の比率をスコアとして計算する手段を含む。
上記のように本発明によれば、ユーザの滞在エリア内に出現する希少性(珍しさ)を考慮した、ユーザが訪問したと思われるスポットのスコアを算出することができ、このスコアを用いてジャンル(つまり、ユーザの嗜好)及びユーザの行動の推定が可能となる。
本発明の処理のイメージである。 本発明の推定処理の概要フローである。 本発明の一実施の形態におけるシステム構成図である。 本発明の一実施の形態における各装置の構成図である。 本発明の一実施の形態におけるシステム全体の処理のフローチャートである。 本発明の一実施の形態におけるGPS情報受信〜滞在エリア抽出処理のフローチャートである。 本発明の一実施の形態におけるGPSログソースデータの例である。 本発明の一実施の形態におけるGPSデータテーブルの例である。 本発明の一実施の形態における滞在エリアデータテーブルの例である。 本発明の一実施の形態におけるスポットデータベースの例である。 本発明の一実施の形態における滞在エリア内ジャンルテーブルの例である。 本発明の一実施の形態における重心からの距離分布による移動モデルを示す図である。 本発明の一実施の形態における3層クラスタによる移動モデルを示す図である。 本発明の一実施の形態におけるユーザ訪問スポット推定結果の例である。 本発明の一実施の形態における訪問スポット推定部の処理のフローチャートである。 本発明の一実施の形態における行動推定部の処理のフローチャートである。 本発明の一実施の形態における属性(嗜好)推定部の処理のフローチャートである。 本発明の一実施の形態における出力される属性リストの例である。 本発明の一実施の形態における推定結果送信部の処理のフローチャートである。 本発明の一実施の形態におけるユーザ促成・状況推定の例である。
以下図面と共に、本発明の実施の形態を説明する。
まず、本発明の概要を説明する。
図1は、本発明の処理のイメージを示す。
ユーザがGPS機能を有する携帯端末等を操作してレストランを検索する状況を考える。
ユーザからの要求が入力されると、本発明の行動・属性推定装置では、GPSの移動履歴を読み込み、ユーザの嗜好(属性)、ユーザの訪問場所(状況)を推定し、ユーザの嗜好、状況に合ったレストランを検索結果として出力する。
図2は、本発明の推定処理の概要フローを示す。
ステップ1) 取得したGPS履歴から測位時刻、位置情報(緯度、経度)の時系列データ+を取得すると共に、周辺地域全てのスポット(例えば、レストラン店舗)に対応するレストラン識別子、ジャンル、緯度、経度をスポットジャンル地理分布データとして読み込む。
ステップ2) GPS履歴から一定時間、一定の場所に滞留する滞在エリアを、既存のDBSCANアルゴリズムを用いて抽出する。データ形式は、中心点、滞在開始時刻、滞在終了時刻、滞在エリア半径からなり、このうち、滞在エリア半径は分析者が入力するパラメータである。抽出された滞在エリアの情報と予め用意されているスポットジャンルと関連付ける。
なお、スポットジャンルは、スポットジャンルが格納されているデータベースまたは、インターネット等から取得するものとする。本実施の形態では、スポットデータベースを用いるものとする。
ステップ3) 滞在エリアにおけるスポットジャンルの出現頻度をスコア化する。このとき、滞在エリア内に出現する希少性(珍しさ)を考慮してユーザが訪問したと思われるスポットのスコアを算出する。
ステップ4) スコアに基づいて、ユーザの訪問スポット、行動、嗜好を推定する。
図3は、本発明の一実施の形態におけるシステム構成を示す。
本発明のシステムは、上記の図2の処理を行う推定処理装置100、利用者1が利用するGPS機能付き携帯端末等の位置情報収集デバイス200、サービス処理装置300から構成され、これらは通信ネットワークを介して接続されている。
推定処理装置100は、位置情報収集デバイス200からGPSログを取得し、推定処理を行い、選好キーワードをサービス処理装置300に出力する。サービス処理装置300は、取得した選好キーワードに基づいて関連するコンテンツリコメンド等を位置情報収集デバイス200に送信する。
以下に、上記のシステムの各装置構成を示す。
図4は、本発明の一実施の形態における各装置の構成を示す。
推定処理装置100は、GPS情報受信部110、GPS履歴前処理部120、スコア算出部130、訪問スポット推定部140、行動推定部150、属性(嗜好)推定部160、推定結果送信部170、スポットデータベース180、記憶部190から構成される。
なお、記憶部190には各種テーブルが格納される。
位置情報収集デバイス200は、GPSログ収集部210、GPS情報を推定処理装置100に送信するGPS情報送信部220、サービス処理装置300からのリコメンド結果を表示するコンテンツ提示部230から構成される。
サービス処理装置300は、リコメンド結果を位置情報収集デバイス200に送信するコンテンツ送信処理部310、リコメンド対象コンテンツ決定処理部320、推定処理装置100から推定結果を取得する推定結果受信部330から構成される。
次に、上記のシステムの全体の動作を説明する。
図5は、本発明の一実施の形態におけるシステム全体の処理のフローチャートである。
ステップ1110) 推定処理装置100のGPS情報受信部110は、位置情報収集デバイス200のGPS情報送信部220からGPS履歴情報を受信する。
ステップ1120) GPS履歴前処理部120は、受信したGPS履歴から位置情報収集デバイス200のユーザの滞在エリアを抽出し、新しい滞在エリアを抽出した場合はステップ1130に移行し、抽出できない場合は、当該処理を終了する。詳細な処理については後述する。
ステップ1130) スコア算出部130において、滞在エリア内の各スポットスコアを求める。詳細な処理については後述する。
ステップ1140) 訪問スポット推定部140は、各スポットのスコア値からユーザの訪問スポットを推定する。
ステップ1150) 行動推定部150は、ユーザの訪問ジャンル、行動を推定する。
ステップ1160) 属性(嗜好)推定部160は、過去の一定期間のスコアを統合し、ユーザ属性を推定する。新しい滞在エリアで閾値を超える等の条件を満たした推定結果(訪問スポット、行動、属性)があるかを判定し、ない場合は当該処理を終了する。
ステップ1170) 推定結果送信部170は、推定結果をサービス処理装置300に送信する。必要であれば、ユーザ属性情報をスコア算出部130に出力し、スコア式に反映する。
なお、上記のステップ1140〜1160処理は不要であれば省略することも可能である。
以下に、上記の処理をステップ毎に詳細に説明する。
<GPS情報受信部、GPS履歴前処理部の処理>
まず、上記のステップ1110〜1120について説明する。
図6は、本発明の一実施の形態におけるGPS情報受信〜滞在エリア抽出処理のフローチャートである。
ステップ1111) GPS受信部110は、位置情報収集デバイス200からGPS情報を受信し、GPS履歴前処理部120に出力する。図7は、受信したGPSデータ形式の例であり、経度、緯度、時間が含まれる。
ステップ1121) GPS履歴前処理部120は、記憶部180の図8に示すGPSデータテーブルに受信した新規GPSデータを保存し、過去時系列のGPSデータを読み出す。
ステップ1122) GPS履歴前処理部120は、GPSデータテーブルから読み出した時系列のGPS履歴データの緯度、経度、測定時刻から一定時間内及び一定範囲内で滞留しているデータ部分を抽出する。滞在エリアの抽出については、例えば、滞留時間閾値と、各点間距離閾値をパラメータとしてクラスタを抽出するDBSCAN法等のアルゴリズムを用いるものとする。抽出された滞在エリアのデータは、記憶部180の図9に示す滞在エリアデータテーブルに保存すると共に、スコア算出部130に送信する。ここで、抽出された滞在エリアのデータは、中心緯度、中心経度、滞在エリア半径、滞留開始時間、滞留終了時間を含む
ステップ1123) GPS履歴前処理部120は、抽出した滞在エリア情報について、中心点から一定半径(分析者が設定するパラメータ)内に存在するスポットとそのスポットに関連付けられたジャンル(例えば、「レストラン」)を関連付けたデータを、スポット識別子に基づいて図10に示すスポットデータベース180を参照することにより作成し、図11に示す滞在エリア内ジャンルテーブルに保存すると共に、スコア算出部130に出力する。
<スコア算出部の処理>
次に、上記のGPS履歴前処理部120から、滞在エリアのデータ及び、スポット及び当該スポットにジャンルを関連付けたデータを取得したスコア算出部130の処理について説明する。
スコア算出部130は、滞在エリアjにおけるジャンルiを持つスポットのスコア(Sijx)を求める。
スコアSijxは、
・現時刻による行動確率;
・滞在エリアとの距離による訪問確率;
・周辺ジャンル分布比較による希少性;
・過去ユーザGPS履歴から抽出した滞在エリアとの比較による現滞在エリア希少性;
の少なくとも1つ、または、いずれか、または、全てを乗じたものである。全てを乗じた場合の計算式は
Figure 0005410462
上記において、スポットxは滞在エリア中心点から一定範囲(滞在エリア内)のスポットである。Xは、滞在エリアj内のスポット総数とする。wは滞在エリアj内の各スポットである。φ-1(x)は累積標準正規分布の逆関数である。右辺の第1項E(t)は、滞在エリアの中心時間におけるジャンルに関連付けられる行動実施率であり、例えば、iが「グルメジャンル」の場合は、時間帯毎の食事行動を行う確率となる。但し「グルメ」は一例であり、技術的には、カラオケや学校等の多様なジャンルがある。このとき、「カラオケ」であれば遊び(交友)、「学校」であれば学習という行動が関連付けられることが考えられる。なお、この確率については、統計庁の社会生活時間調査等の外部情報を元に、時間帯毎の平均的な実施率のデータが公開されており、それら(外部情報)を利用することを想定している。
また、上記の右辺の第2項の分子のDist(x,y)はGPS誤差をy点を中心とし、μ=0,σ=(GPS機器の想定誤差による値)で決定した場合の正規分布によるx地点の出現確率(x,yの距離の出現確率)である。第2項の分母のwは滞在エリアj内における全スポット集合である。loc(x)はスポットxの位置情報であり、n,mは重みパラメータ(乗数)である。右辺の第3項のM(i,j)は滞在エリアjのジャンルiの出現数の珍しさを定量化したものである。詳細については後述する。右辺の第4項のR(i,j)はユーザの過去の履歴内から抽出した滞在エリアから得られる、ユーザ嗜好(意図、属性、行動等)に関する情報は本手法では減衰する考え方でスコアを下げる(例えば、学校、会社、バイト等によるルーティン的な訪問)。R(j)の定義例として、
R(j)=(1-(interval(j)*coverage(j))
とする。ここでinterval(j)は過去の滞在エリア内において現在滞在エリアとの中心点間距離が閾値以下の滞在エリアで、滞在エリアの滞在時刻が近いものがあるほど1に近づき、遠いほど(例えば、2週間以上)0に近づく関数である。Coverage(j)は過去滞在エリア内において現滞在エリアとの中心点距離が近いものがあるほど1に近づき、一定以上遠い場合は0になる関数である。
上記の滞在エリアjのジャンルiの出現数の珍しさM(i,j)の求め方について説明する。
まず、第1のM(i,j)を求める方法は、移動モデルと超機可分布によるスポット選択モデル用いるものである。当該方法は、一定期間の滞在エリア群から作成した移動モデルを利用して抽出した選択候補スポット集合から超機可分布を利用して滞在エリア毎のジャンル出現数の珍しさを以下のように定義する。
Figure 0005410462
上記において、Tjは滞在エリアjに対応する移動範囲内(以降、移動候補エリア)のスポットの数、Lijは滞在エリアjの移動候補エリア内のジャンルiの数、Nijは滞在エリアj内のジャンルiの数、Sjは滞在エリアj内のスポットの数である。
このTj、Lijの決定方法は以下2つある。尚、Tjはユーザの選択候補スポット集合の総数、Lijはその中でのキーワードiを持つスポットの数であると見なせる。この選択候補スポット集合を算出するために移動モデルを定義する。移動モデルとは、ユーザの一定期間の滞在エリアの位置分布の特徴から、ユーザが各滞在エリア(=訪問スポット)の位置を決定する際、候補としたと考える移動候補エリアを決定するモデルである。この移動候補エリア内のスポットが、各滞在エリアについての選択候補スポット集合となる。
Tj、Lij決定方法(1) 重心からの距離分布による移動モデル利用:
第一の移動モデルでは、図12に示すように、各ユーザの一定期間の全滞在エリア中心点から重心を算出して移動候補エリアの中心点とする。この重心を中心として、一定量(例95%)の滞在エリアが含まれる距離を半径とした円エリアを作成する。この円エリアを各滞在エリアの移動候補エリアとして選択候補スポット集合を抽出する。尚、この移動候補エリアに入らない滞在エリアがある場合は、外れ値データとして処理を行わない。
Tj、Lij決定方法(2) 3層クラスタによる移動モデル利用:
第二の移動モデルでは、図13に示すように、各ユーザの一定期間の全滞在エリア中心点に対して、クラスタリング(例えば、DBSCAN法)を3種類のパラメータで段階的に適用することで構造化して移動候補エリアを決定する。この構造化とは、全滞在エリアに対して車や電車などによる「長距離移動クラスタ」と、車や電車を降りた後の徒歩等による「短距離移動クラスタ」、短距離移動クラスタ内にある自宅や職場等の「頻繁訪問地クラスタ」としてクラスタリングする。この構造化は、各移動種別を想定した閾値でDBSCAN法を階層的に適用して作成する。
各クラスタに対する移動候補エリアは、自クラスタの下位クラスタの中で、所属する滞在エリア数最大の下位クラスタの「コアポイント」を中心に、自クラスタに所属する滞在エリアがすべて収まる範囲の円を作成することで決定する。コアポイントとは、各クラスタ内で滞在エリアが集中する地点を移動起点と考えて決定する位置情報である。これは、最小単位である頻繁訪問地クラスタから上位クラスタに向かって順に作成する。尚、最下位の頻繁訪問地クラスタでは、所属する滞在エリアの重心を算出することでコアポイントとする。また、頻繁訪問地クラスタ以外でも下位クラスタがない場合には、自クラスタに所属する滞在エリアの重心をコアポイントとする。
各滞在エリアの移動候補エリアは、滞在エリアが所属するクラスタの移動候補エリアによって決定する。滞在エリアが長距離移動クラスタと短距離移動クラスタ階層に同時に所属する場合は、短距離移動クラスタの移動候補エリアを利用する。尚、頻繁訪問地クラスタについては、短距離移動クラスタのコアポイント算出のためだけに利用し移動候補エリア決定に利用しない。この処理で決定した移動候補エリアにより、滞在エリア毎に選択候補スポット集合を抽出する。
また、V(j)は、滞在エリアjに対応する短距離移動クラスタのコアポイントと滞在エリアの距離による減少関数である。短距離移動クラスタに所属していない滞在エリアについてはV(j)=1とする。また、後述の第2のM(i,j)を求める方法利用時は、V(j)は常に1とする。
Figure 0005410462
但し、dist(x,y)=位置xと位置yの距離を返す関数、corej=滞在エリアjの所属する短距離移動クラスタのコアポイント位置、centerj=滞在エリアjの中心点、core_radiusj=滞在エリアjの所属する短距離移動クラスタの移動候補エリア半径である。
第2のM(i,j)を求める方法は、訪問可能性の距離減衰を反映した確率分布推定による方法である。当該方法は、一定期間の移動範囲の中心点から各スポットに対する距離に対する減衰関数に従い、範囲内のスポットを選択する。以下に示すように、そのスポットの中心にジャンルiのスポット数比の存在率を計算し、分布を作成する。
M(i,j)=Z(Y(Nij,Sj))
上記の各変数は第1の方法と同様である。Y(x,y)は一定期間の滞在エリア群の中心点から各スポットとの距離に応じて減衰する選択確率(選択確率最大は中心点であり、選択確率0となる距離はKとする)でスポットを多数回選択し、選択したスポットから一定範囲(GPS機器誤差から想定するσの2倍範囲等)のスポット群でのスポットとジャンルの比を算出することで推定するジャンル接触数確率分布に対して、引数の滞在エリアでのジャンル出現比(x/y)の上側確率である。Z(x)は
if(x≧0.5) 0、if(x<0.5) x
である。当該一定期間移動で距離減衰するスポット選択モデルによる指標の例を図13に示す。上記の一定期間の滞在エリア群の中心点とKの求め方は、分析対象の全滞在エリア中心点から重心を算出して中心点とする。この重心を中心として、一定量(例95%)の滞在エリアが含まれる距離に重みを掛けた値をKとする。
スコア算出部130は、上記のようにして求められたスコアを訪問スポット推定部140、行動推定部150、属性推定部160に出力する。
<訪問スポット推定部の処理>
次に、図5のステップ1140の訪問スポット推定部140の処理を説明する。
図14は、本発明の一実施の形態における訪問スポット推定部の処理のフローチャートを示す。
ステップ1141) 訪問スポット推定部140は、履歴データ(GPSポイント、抽出滞在エリア数、データ収集期間)が予め設定された閾値を超えているかを判定し、超えている場合はステップ1142に移行し、超えていない場合は当該処理を終了する。
ステップ1142) 訪問スポット推定部140は、スコア算出部130から取得した各スポットxが保持するジャンルiに対するスコアSijxが予め設定された条件を超えているかを判定し、超えている場合はステップ1143に移行し、超えていない場合は当該処理を終了する。条件としては、
・閾値を超えている;
・各滞在エリアjのスポットの中で上位K番目以内;
等を用いる。
ステップ1143) ステップ1142で条件を満たしたスポットを訪問可能性の高いスポットとして推定結果送信部170に出力する。
出力結果は、例えば、図15のようになる。
<行動推定部の処理>
次に、図5のステップ1150の行動推定部150の処理について説明する。
図16は、本発明の一実施の形態における行動推定部の処理のフローチャートである。
ステップ1151) 行動推定部150は、記憶部180のジャンルスコア行動対応付けテーブル(図示せず)からスコアを算出する条件を決定する。当該ジャンルスコア行動対応付けテーブルには、ジャンル(ジャンル組み合わせもあり)、期間等の合算条件、合算時の重み、推定結果としての閾値等の条件、条件を超えたときに推定結果とする行動が設定されている。
ステップ1152) ステップ1151で決定した条件に基づいて、スコア算出部130から取得した、現在の滞在エリア内のジャンル毎、もしくは、複数ジャンルの各スポットのスコアを合算する。
ステップ1153) ステップ1151で決定した条件に基づいて、ステップ11522で算出した滞在エリア毎のスコアを一定期間等で合算する。
なお、上記のステップ1152、1153における合算については、過去期間に応じて、もしくはジャンル組み合わせでは、組み合わせジャンルに応じて重み付けしてもよい。
ステップ1154) 合算したスコアがステップ1151で読み出した以下のような条件を満たしているかを判定し、満たしている場合はステップ1155に移行し、満たしていない場合は当該処理を終了する。
条件)
・閾値を越える、または、下回る。
・比較対象内で上位、または、下位になっている。
ステップ1155) ステップ1151で読み出した条件を満たす行動を合算値と共に推定結果送信部170に出力する。
行動推定部150において、ユーザの行動の特徴を判定する方法として、ジャンルiが所定の閾値より高い場合は、ジャンルiについて訪問している可能性が高い滞在エリアが一定期間に複数回ある場合は、強く珍しいことが起こっているため、ジャンルi嗜好があると考え、また、スコアが高く寄与したスポットは訪問していると判断する。
また、ジャンルiスコアが所定の閾値より低いとき、過去一定期間、ジャンルiに近接していない場合はジャンルiに関連付けられる行動(例えば、飲食)をしていない、または、食事時間(例えば、昼食や夕食時間帯)までにジャンルiも含む全食事系ジャンルに近づいていないのであれば、食事自体をしていないと判断する。
<属性(嗜好)推定部の処理>
次に、図5のステップ1160の属性(嗜好)推定部160の処理を説明する。
図17は、本発明の一実施の形態における嗜好推定部の処理のフローチャートである。
ステップ1161) 属性推定部160は、スコア算出部130から取得した滞在エリア(スポット)毎、ジャンル毎のスコアを取得すると、滞在エリア毎かつジャンル毎にスコアを合算する。
ステップ1162) ステップ1161で合算されたスコアについて、所定の期間分のスコアを合算する。期間分の合算については、単純な合計値の算出以外に、各滞在エリアのジャンル毎スコアについて、確率として結合する方法がある。具体的にStouffer-method(Rosental,R. (1984). Meta-analytic procedures for social research.)を利用した例を以下に示す。
Figure 0005410462
但し、Pi=分析対象とした一定期間の滞在エリアに対するキーワードiのスコア、φ(x):標準正規分布の累積確率密度関数、Xij=滞在エリアjにおけるキーワードiを持つ全スポット、J=一定期間の全滞在エリア、j=滞在エリアの識別子とする。
ステップ1163) 属性推定部160は、合算したスコアが予め設定された以下のような条件を満たすかを判定する。
条件)
・閾値を超える、または、下回る。
・比較対象内で上位、または、下位になっている。
条件を満たす場合はステップ1164に移行し、満たさない場合は当該処理を終了する。
ステップ1164) 上記の条件を満たしたジャンルを推定結果送信部170に出力する。出力される属性リストの例を図18に示す。
ステップ1165) 後述する訪問スポット推定補正を行うために、スコア部130に対して、フィードバックする。
<推定結果送信部の処理>
次に、図5のステップ1170の推定結果送信部170の処理を説明する。
図19は、本発明の一実施の形態における推定結果送信部の処理のフローチャートである。
ステップ1171) 推定結果送信部170は、訪問スポット推定部140、行動推定部150、属性推定部160から送信された訪問スポット、行動、属性の各推定結果が所定の条件を超えているかを判定し、超えている場合はステップ1172に移行し、超えていない場合は当該処理を終了する。
ステップ1172) 条件を超えた項目をHTML、XML、CSV等の各形式に纏めたデータを生成する。
ステップ1173) ステップ1172で生成されたデータをサービス処理装置300に推定結果として出力する。
上記のステップ1165において、属性推定部160から推定結果がスコア算出部130にフィードバックされた場合の処理について説明する。
当該処理は、スポットx(ジャンルi保持)訪問スコアの高精度化を図るものである。
補正する場合の訪問スコアは、現時刻による行動確率、滞在エリアとの距離による訪問確率を乗算した値に、過去の移動履歴からのジャンルiスコアによる補正値、アンケート、Web閲覧履歴等のほかのデータからのジャンルi嗜好による補正値、Web履歴、スケジューラ、メール等の他履歴でのスポットx関連キーワード共起からの補正値、近い時間帯の滞在エリアの各ジャンルスコアからの補正値、嗜好の季節変動、時間帯(例えば、昼食と夕食の違い等)変動、曜日変動からの補正値、支払い、決済行動履歴による補正値のいずれかの補正値を乗算することで求められる。
上記のスコア算出部130、訪問スポット推定部140、行動推定部150、属性(嗜好)推定部160の処理により、図20に示すような例において、ユーザの移動範囲内に、
・ユーザの移動範囲a;
・食事時刻以外の滞在エリアb;
・食事時刻の滞在だが情報が少ないと見做すエリアc;
・食事時刻の滞在エリアd;
を考えるとき、エリアcのように、滞在エリアの中心点から離れすぎる、店舗が多すぎて訪問の特性が判別できない場所はスコアが小さくなる。また、エリアb、エリアc、エリアdが重複している場所は職場である可能性が高く、その中に2回も沖縄料理が入っているため、偶然とは考えにくく、ユーザの嗜好性として沖縄料理が好きであると判断できる。
なお、上記の図4に示す推定処理装置の各構成要素の動作をプログラムとして構築し、推知処理装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
100 推定処理装置
110 GPS情報受信部
120 GPS履歴前処理部
130 スコア算出部
140 訪問スポット推定部
150 行動推定部
160 属性(嗜好)推定部
170 推定結果送信部
180 スポットデータベース
190 記憶部
200 位置情報収集デバイス
210 GPSログ収集部
220 GPS情報送信部
230 コンテンツ提示部
300 サービス処理装置
310 コンテンツ送信処理部
320 リコメンド対象コンテンツ決定処理部
330 推定結果受信部

Claims (10)

  1. ユーザの移動履歴とスポットに関連付けられた属性情報からユーザの属性及び行動を推定する行動及び属性推定装置であって、
    スポット毎に属性(ジャンル)情報が関連付けられた情報を格納するスポット情報記憶手段と、
    ユーザの位置情報収集デバイスから測位時刻、位置情報の時系列データを含む前記ユーザの移動履歴を取得する受信手段と、
    前記ユーザの移動履歴から前記ユーザの滞在エリアを特定する滞在エリア特定手段と、
    特定された前記滞在エリア内に存在するスポット数とスポットに対応するジャンルの数(スポットジャンル数)の比率からスコアを求めるスコア算出手段と、
    前記スコアと所定の条件を比較してユーザの属性及び行動を推定する推定手段と、
    を有し、
    前記スコア算出手段は、
    移動モデルと超幾何分布によるスポット選択モデルを用いる方法、または、訪問可能性の距離減衰を反映した確率分布推定による方法により、滞在エリアのジャンル出現希少性の値を求めるジャンル出現希少性算出手段と、
    前記ジャンル出現希少性の値を利用して該滞在エリア内に存在するスポット数とスポットジャンル数の比率をスコアとして計算する手段を含む
    ことを特徴とする行動及び属性推定装置。
  2. 前記ジャンル出現希少性算出手段は、
    一定期間の滞在エリア群から作成した滞在エリアに対応する移動範囲内(移動候補エリア)のスポットの数と、該滞在エリアの移動候補エリアのジャンルの数を用いて前記ジャンル出現希少性の値を求める第1の手段、
    または、
    訪問可能性として、滞在エリアに対応する短距離移動クラスタのコアポイントと滞在エリアの距離による減少関数に従う確率分布推定により前記ジャンル出現希少性の値を求める第2の手段を有する
    請求項1記載の行動及び属性推定装置。
  3. 前記第1の手段は、
    ユーザの一定期間の全滞在エリアの中心点から重心を算出し、前記移動候補エリアの中心点とし、一定量の滞在エリアが含まれる距離を半径とした円エリアを滞在エリアの移動候補エリアとして前記スポット数を求める手段、
    または、
    ユーザの一定期間の全滞在エリアの中心点に対して、長距離移動クラスタ、短距離移動クラスタ、頻繁訪問地クラスタを段階的に適用して前記移動候補エリアを求め、該移動候補エリアにより滞在エリア毎に前記スポット数を求める手段
    を含む請求項2記載の行動及び属性推定装置。
  4. 前記スコア算出手段は、
    前記スコアに、滞在エリアの中心時間におけるジャンルに関連付けられた行動実施率を乗じた値をスコアとする手段を含む
    請求項1乃至3のいずれか1項に記載の行動及び属性推定装置。
  5. 前記スコア算出手段は、
    前記スコアに、GPS誤差を滞在エリアを中心とした正規分布で仮定した場合のスポットの位置の上側確率を滞在エリア内における全スポット集合で除した値を乗じた値をスコアとする手段を含む
    請求項1乃至4のいずれか1項に記載の行動及び属性推定装置。
  6. 前記スコア算出手段は、
    前記スコアに、ジャンル毎に、前記ユーザの移動履歴から抽出した滞在エリアと比較した場合の地理的または時間的に近いものがないという観点により求められた指標を乗じた値をスコアとする手段を含む
    請求項1乃至5のいずれか1項に記載の行動及び属性推定装置。
  7. ジャンルと行動が対応付けられた条件を取得し、該条件で指定されたジャンルに基づいて現在の滞在エリア内のジャンル毎、または、複数のジャンルの各スポットのスコアを合算し、第1のスポット合算値とし、該第1のスポット合算値を該条件で指定された一定期間内において合算し、第2のスポット合算値とし、該第2のスポット合算値が閾値または所定の順位の条件を満たしている場合に該第2の合算値を行動推定結果として出力するユーザ行動推定手段を更に有する
    請求項1乃至6のいずれか1項に記載の行動及び属性推定装置。
  8. 滞在エリア毎に、前記スコア算出手段で求められたジャンル毎のスコアを合算し第1のジャンル合算値とし、該第1のジャンル合算値を一定期間内における、Stouffer-methodを用いた確率結合により合算し第2のジャンル合算値とし、該第2のジャンル合算値が所定の条件を満たしている場合に該第2のジャンル合算値をユーザ属性として出力するユーザ属性推定手段を更に有する
    請求項1乃至7のいずれか1項に記載の行動及び属性推定装置。
  9. ユーザの移動履歴とスポットに関連付けられた属性情報からユーザの属性及び行動を推定する行動及び属性推定方法であって、
    受信手段が、ユーザの位置情報収集デバイスから測位時刻、位置情報の時系列データを含む前記ユーザの移動履歴を取得する受信ステップと、
    滞在エリア特定手段が、前記ユーザの移動履歴から前記ユーザの滞在エリアを特定する滞在エリア特定ステップと、
    スコア算出手段が、特定された前記滞在エリア内に存在するスポット数とスポットに対応するジャンルの数(スポットジャンル数)の比率をスコアとして求めるスコア算出ステップと、
    推定手段が、前記スコアと所定の条件を比較してユーザの属性及び行動を推定する推定ステップと、
    を行い、
    前記スコア算出ステップにおいて、
    前記滞在エリア特定ステップで特定された前記滞在エリアに基づいて、スポット毎に属性(ジャンル)情報が関連付けられた情報が格納されたスポット情報記憶手段を参照して、ユーザの滞在エリア内におけるスポット及びスポットジャンルの地理分布から算出したスポット数とスポットジャンル数の比率の出現確率分布によりジャンル出現希少性の値を求め、該ジャンル出現希少性の値を利用して該滞在エリア内に存在するスポット数とスポットジャンル数の比率をスコアとして計算する
    ことを特徴とする行動及び属性推定方法。
  10. 請求項1乃至8のいずれか1項に記載の行動及び属性推定装置を構成する各手段としてコンピュータを機能させるための行動及び属性推定プログラム。
JP2011025439A 2011-02-08 2011-02-08 行動及び属性推定装置及び方法及びプログラム Expired - Fee Related JP5410462B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011025439A JP5410462B2 (ja) 2011-02-08 2011-02-08 行動及び属性推定装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011025439A JP5410462B2 (ja) 2011-02-08 2011-02-08 行動及び属性推定装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2012164227A JP2012164227A (ja) 2012-08-30
JP5410462B2 true JP5410462B2 (ja) 2014-02-05

Family

ID=46843542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011025439A Expired - Fee Related JP5410462B2 (ja) 2011-02-08 2011-02-08 行動及び属性推定装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5410462B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8489596B1 (en) * 2013-01-04 2013-07-16 PlaceIQ, Inc. Apparatus and method for profiling users
JP6077349B2 (ja) * 2013-03-19 2017-02-08 国立大学法人 東京大学 分類器構築装置、分類装置、分類器構築方法、分類方法及びプログラム
JP6190331B2 (ja) * 2014-07-04 2017-08-30 日本電信電話株式会社 訪問poi推定装置およびその動作方法
JP6405204B2 (ja) * 2014-11-28 2018-10-17 Kddi株式会社 滞在場所属性特定装置、滞在場所属性特定システム、滞在場所属性特定方法およびプログラム
JP6100810B2 (ja) * 2015-01-29 2017-03-22 キャンバスマップル株式会社 情報提供サーバ、および情報提供プログラム
JP2017021529A (ja) * 2015-07-09 2017-01-26 住友電気工業株式会社 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム
JP6676408B2 (ja) * 2016-02-26 2020-04-08 国立大学法人京都大学 人物移動予測システム
JP6781604B2 (ja) * 2016-10-24 2020-11-04 株式会社Nttドコモ 訪問先推定装置
JP7001508B2 (ja) * 2018-03-16 2022-01-19 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム。
WO2019202785A1 (ja) * 2018-04-18 2019-10-24 株式会社Nttドコモ 訪問先推定装置および訪問先推定方法
WO2019202791A1 (ja) * 2018-04-18 2019-10-24 株式会社Nttドコモ 趣味嗜好推定装置および趣味嗜好推定方法
JP2019200658A (ja) 2018-05-17 2019-11-21 株式会社日立製作所 情報通信システムとその方法およびサーバ
JP2021022243A (ja) 2019-07-29 2021-02-18 富士通株式会社 推薦システム、推薦制御プログラム、および、推薦制御方法
JP7087147B1 (ja) 2021-03-25 2022-06-20 楽天グループ株式会社 推定システム、推定方法、及びプログラム
JP7552896B2 (ja) 2021-05-27 2024-09-18 日本電気株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3998968B2 (ja) * 2001-12-25 2007-10-31 三菱電機株式会社 移動体ナビゲーション装置
JP4735057B2 (ja) * 2005-05-31 2011-07-27 日産自動車株式会社 情報提供装置及び情報提供方法

Also Published As

Publication number Publication date
JP2012164227A (ja) 2012-08-30

Similar Documents

Publication Publication Date Title
JP5410462B2 (ja) 行動及び属性推定装置及び方法及びプログラム
US11468019B2 (en) Apparatus, systems, and methods for analyzing characteristics of entities of interest
EP3278240B1 (en) Venue identification from wireless scan data
CN111538904B (zh) 用于推荐兴趣点的方法和装置
US10474727B2 (en) App recommendation using crowd-sourced localized app usage data
Yin et al. LCARS: A spatial item recommender system
US8612134B2 (en) Mining correlation between locations using location history
Lu et al. Personalized trip recommendation with multiple constraints by mining user check-in behaviors
Chen et al. Effective and efficient user account linkage across location based social networks
JP5536485B2 (ja) ユーザの移動に伴って住所/居所を推定する携帯端末、サーバ、プログラム及び方法
JP5732441B2 (ja) 情報推薦方法、装置及びプログラム
US20150169891A1 (en) Systems, methods, and apparatus for providing content to related compute devices based on obfuscated location data
Yamaguchi et al. Landmark-based user location inference in social media
JP6052806B2 (ja) 携帯端末を所持したユーザの滞在目的を推定する装置、プログラム及び方法
Elbery et al. A carpooling recommendation system based on social vanet and geo-social data
JP2013222278A (ja) 施設評価装置、施設評価システム、施設評価方法およびプログラム
Huang et al. STPR: a personalized next point-of-interest recommendation model with spatio-temporal effects based on purpose ranking
KR101523192B1 (ko) 소셜 검색 시스템 및 기법
EP3036929B1 (en) System and method for communicating information in a location-based system
CN104123281A (zh) 使用位置信息提供建议的方法和系统
Bok et al. A Social Search Scheme Considering User Preferences and Popularities in Mobile Environments
Pipanmekaporn Mining semantic location history for collaborative poi recommendation in online social networks
US20160162809A1 (en) Enhanced searching and selection of rental properties and associated activities based on historic travel-related data
Hongbo et al. Place recommendation from check-in spots on location-based online social networks
KR101942427B1 (ko) 사용자의 니즈가 반영된 유동인구정보 생성 방법 및 이를 위한 서버

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130123

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131106

R150 Certificate of patent or registration of utility model

Ref document number: 5410462

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees