JP5886718B2 - 情報処理方法及び装置 - Google Patents

情報処理方法及び装置 Download PDF

Info

Publication number
JP5886718B2
JP5886718B2 JP2012196878A JP2012196878A JP5886718B2 JP 5886718 B2 JP5886718 B2 JP 5886718B2 JP 2012196878 A JP2012196878 A JP 2012196878A JP 2012196878 A JP2012196878 A JP 2012196878A JP 5886718 B2 JP5886718 B2 JP 5886718B2
Authority
JP
Japan
Prior art keywords
user
data
cluster
processing
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012196878A
Other languages
English (en)
Other versions
JP2013137738A (ja
Inventor
功淳 馬場
功淳 馬場
博章 伊藤
博章 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Colopl Inc
Original Assignee
Colopl Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Colopl Inc filed Critical Colopl Inc
Priority to JP2012196878A priority Critical patent/JP5886718B2/ja
Publication of JP2013137738A publication Critical patent/JP2013137738A/ja
Application granted granted Critical
Publication of JP5886718B2 publication Critical patent/JP5886718B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、位置情報の解析技術に関する。
近年、GPS(Global Positioning System)受信機を備えた携帯電話機の普及により、自身の位置情報を登録することでゲームを行ったり、様々なサービスの提供を受けることができるようになっている。
一方、企業側では、ユーザによって登録された位置情報を用いて様々な分析を行って、広告を含めて新たなサービスを提供することが検討されている。
このため、携帯端末に搭載された測位機能を用いて、住所又は居所を自動的に推定する技術が存在している。具体的には、ユーザの移動に伴って所持される携帯端末は、測位電波を受信する測位部と、測位部を所定時間周期で起動し且つ測位位置を取得する位置取得手段と、時刻に応じた測位位置を蓄積する位置蓄積手段と、位置蓄積手段に蓄積された多数の測位位置を送信する位置送信手段とを有する。そして、当該携帯端末から多数の測位位置を受信する滞在特性推定サーバは、時系列の測位位置の移動に応じて、移動中位置以外の滞留位置のみを抽出する滞留位置抽出手段と、複数の滞留位置を、空間的なクラスタに区分するクラスタリング手段と、クラスタ毎に、滞留位置が1回でも存在する滞在日数を用いて、日属性に基づく滞在率を算出する滞在率算出手段と、日属性に基づく滞在率が高いクラスタについて、当該クラスタの滞在特性を推定する滞在特性推定手段とを有する。
この技術では、定期的に携帯端末の測位部を起動させて定期的に位置情報を取得することが前提となっており、定期的に位置情報を取得できるので、時刻のデータを活用して移動中位置以外の滞留位置を特定でき、さらに滞留位置を用いて住所又は居所に相当するクラスタを特定するようになっている。しかしながら、必ずしも定期的に位置情報を取得できる訳ではない。特に、ゲームなどの場合には、ユーザが指示したタイミングでしか位置情報が登録されないので、時刻の情報は必ずしもそのユーザの行動における特徴を示しているわけではない。例えば、朝会社に出社した後、昼休みに位置情報の登録を行う場合があるが、位置情報そのものには意味があっても、昼休み中の時刻は移動完了時でもなく移動開始時でもないので、時刻を用いて特徴を抽出することは難しい。また、このような位置情報登録だけでは、滞留位置なのか移動中位置なのかは特定できない。上で述べた技術では、このような点については考察されていない。
特開2011−171876号公報 特開2012−85095号公報 特表2012−507760号公報 特開2012−42993号公報 特開2009−36594号公報
従って、本発明の目的は、一側面によれば、不定期で位置情報が登録される場合においても位置情報の属性を特定できるようにする技術を提供することである。
本発明の一態様に係る情報処理方法は、(A)ユーザが指示したタイミングにおける位置のデータとユーザの識別子とを含むデータブロックを複数格納するデータ格納部から、所定の条件を満たすユーザの位置のデータを読み出すステップと、(B)所定の条件を満たす各ユーザについて、当該ユーザの位置を所定個数のクラスタに分類するクラスタリング処理を繰り返し、当該繰り返し毎に位置の所定の集中状態を表す条件を満たす位置を抽出するステップと、(C)所定の条件を満たす各ユーザについて、抽出された位置から最頻出現位置を特定する特定ステップとを含む。そして、クラスタリング処理が、各クラスタについて当該クラスタに属する位置を用いて当該クラスタの重心を算出し、各位置について最も近い重心を有するクラスタに分類し直す処理である。
このような処理を実施することで、位置データの誤差を吸収しつつ、時刻データに依存することなく、ユーザの位置の分布の特徴を強調できるようになる。すなわち、ユーザの本拠地を抽出することができるようになる。位置の所定の集中状態とは、特定のクラスタに偏って分類されている状態であり、例えば1つのクラスタに50%以上の位置が分類されていたり、2つのクラスタを併せると40%以上の位置が分類されている状態である。
また、上で述べた特定ステップが、所定の条件を満たす各ユーザについて、抽出された位置から2番目に頻出する位置を特定するステップを含むようにしても良い。これにより、例えば第2の本拠地を抽出することができるようになる。
さらに、上で述べた特定ステップが、抽出された位置についてヒストグラムを生成するステップを含むようにしても良い。これによれば、簡単な処理で本拠地等を抽出できるようになる。
また、上で述べた特定ステップが、抽出された位置についてのカーネル密度関数のカーブにおいてピークを検出するステップを含むようにしても良い。これによって精度良く本拠地等を抽出することができるようになる。
さらに、上で述べたデータブロックが、タイミングについての時刻をさらに含むようにしても良い。この場合、本情報処理方法は、(D)所定の条件を満たす各ユーザについて、最頻出現位置及び2番目に頻出する位置に該当する第1のデータブロック以外の第2のデータブロック毎に、直前の時刻のデータブロックに含まれる位置及び時刻に対する距離を算出するステップと、算出された距離によって第2のデータブロックを2つにクラスタリングするステップとをさらに含むようにしても良い。そして、上で述べた距離が、時刻又は位置に対して調整係数を乗じた値を用いて算出される場合もある。
このような処理を実施することで、本拠地以外の属性についても設定できるようになる。距離は上で述べたように時間の要素も含むため、ある程度長く滞在した位置(例えば滞留点)、それほど長く滞在していない位置(例えば移動点)といった属性をも特定できるようになる。
なお、上記方法を、コンピュータに実行させるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
一側面によれば、不定期で位置情報が登録される場合においても位置情報の属性を特定できるようになる。
図1は、本発明の実施の形態に係るシステムの一例を示す図である。 図2は、本発明の実施の形態に係る情報処理装置の機能ブロック図を示す図である。 図3は、第1の実施の形態に係るメインの処理フローを示す図である。 図4は、位置データ格納部に格納されるデータの一例を示す図である。 図5は、第1データ格納部に格納されるデータの一例を示す図である。 図6は、本拠地推定処理の処理フローを示す図である。 図7は、クラスタリングの結果の一例を示す図である。 図8は、各クラスタに含まれるレコード数の一例を示す図である。 図9は、本拠地推定処理の処理フローを示す図である。 図10は、第1の評価処理の処理フローを示す図である。 図11は、ヒストグラムの一例を示す図である。 図12は、ヒストグラムの一例を示す図である。 図13は、ユーザ毎の第1本拠地及び第2本拠地のデータの設定例を示す図である。 図14は、レコードに対する第1本拠地及び第2本拠地のラベル設定例を示す図である。 図15は、滞留点及び移動点特定処理の処理フローを示す図である。 図16は、正規化ユークリッド距離の例を示すための図である。 図17は、正規化ユークリッド距離によるクラスタリングを模式的に示すための図である。 図18は、第3データ格納部に格納されるデータの一例を示す図である。 図19は、第2の評価処理の処理フローを示す図である。 図20は、緯度についてのカーネル密度関数のカーブを表す図である。 図21は、経度についてのカーネル密度関数のカーブを表す図である。 図22は、コンピュータの機能ブロック図である。
[実施の形態1]
図1に、本発明の実施の形態に係るシステムの概要を示す。例えば、携帯電話のネットワーク及びインターネットを含むネットワーク1には、基地局BSを介して複数の携帯端末3が接続されており、さらにゲームサーバ5も接続されている。例えば携帯端末3は、ゲームプログラムを実行しており、ゲームサーバ5と通信を行ってゲームを進行させる。さらに、本実施の形態では、携帯端末3は、GPS受信機を備えており、現在位置のデータを取得できるようになっている。そして、本実施の形態では、携帯端末3において実行されているゲームプログラムが現在位置のデータをゲームサーバ5に基地局BS及びネットワーク1を介して送信して、ゲームサーバ5は、現在位置のデータを受信し、位置データ格納部51にユーザ識別子、時刻及び位置を登録することで、ゲームが進行するものとする。ゲームプログラムは一例であって、他のアプリケーションプログラムであってもよい。
一方、ゲームサーバ5は、例えばゲーム会社におけるLAN(Local Area Network)であるネットワーク7にも接続されており、当該ネットワーク7には、本実施の形態における主要な処理を実行する情報処理装置9も接続されている。
図2に、本発明の一実施の形態に係る情報処理装置9の機能ブロック図を示す。情報処理装置9は、位置データ取得部90と、位置データ格納部91と、前処理部92と、設定データ格納部93と、第1データ格納部94と、第1ラベリング部95と、第2データ格納部96と、第2ラベリング部97と、第3データ格納部98とを有する。
位置データ取得部90は、ゲームサーバ5から位置データを取得して、位置データ格納部91に格納する。前処理部92は、設定データ格納部93に格納されているデータを用いて処理を行い、処理結果を第1データ格納部94に格納する。
第1ラベリング部95は、クラスタリング部951と、抽出部952と、評価部953とを有し、各ユーザについて第1本拠地(例えば居住地)及び第2本拠地(例えば通学先又は通勤先)を推定する処理を実施する。そして、第1ラベリング部95は、当該推定結果を用いて、各ユーザについて登録された位置のうち該当する位置に対して第1本拠地又は第2本拠地のラベルを設定し、処理結果を第2データ格納部96に格納する。
第2ラベリング部97は、距離算出部971と、クラスタリング部972と、設定部973とを有し、各ユーザについて登録された位置のうち第1本拠地及び第2本拠地以外の位置について滞留点(例えば長時間滞在している位置)と移動点(例えば移動途中の位置)とのいずれかのラベルを設定し、処理結果を第3データ格納部98に格納する。
次に、図3乃至図18を用いて、情報処理装置9の処理内容を説明する。
まず、位置データ取得部90は、ネットワーク7を介してゲームサーバ5から、位置データを取得し、位置データ格納部91に格納する(図3:ステップS1)。例えば、図4に示すようなデータが取得される。図4の例では、時刻と、ユーザ識別子(ユーザID)と、緯度(lat)及び経度(lon)とが格納されるようになっている。本実施の形態では、図4における各レコードは、ユーザが意識的に位置登録を行った場合に登録されるデータである。
また、前処理部92は、位置データに対して付加データを付与する処理を実行し、処理結果を第1データ格納部94に格納する(ステップS3)。各ユーザについて、レコードを時刻でソートした上で、直前のレコードに含まれる緯度経度と自レコードに含まれる緯度経度から距離及び方角を算出し、同じく直前のレコードに含まれる時刻と自レコードに含まれる時刻から時間を算出し、さらに速度(=距離/時間)を算出する。また、設定データ格納部93に、例えば県市区町村の各範囲について緯度経度のデータを地域マスタとして格納しておき、各レコードの緯度経度に対応する県市区町村名を特定する。例えば、第1データ格納部94には、図5に示すようなデータが格納される。
図5の例では、時刻と、ユーザIDと、緯度(lat)及び経度(lon)と、県と、市区と、町村と、距離と、方角と、速度とが、各レコードに含まれている。県市区町村については、緯度経度では分かりにくい位置を把握しやすくするために用いられる。なお、距離、方角及び速度については、補助情報であり、算出しなくても良い。
その後、第1ラベリング部95は、第1データ格納部94に格納されているデータに対して、本拠地推定処理を実行し、処理結果を第2データ格納部96に格納する(ステップS5)。この本拠地推定処理については後に詳しく述べる。
そして、第2ラベリング部97は、第2データ格納部96に格納されているデータを用いて、滞留点及び移動点特定処理を実行し、処理結果を第3データ格納部98に格納する(ステップS7)。この滞留点及び移動点特定処理については後に詳しく述べる。
以上の処理を実行すれば、所定の条件を満たすユーザについては、登録された各位置について第1本拠地、第2本拠地、滞留点又は移動点といったラベルが付与されるようになる。
次に、図6乃至図9を用いて、本拠地推定処理について説明する。第1ラベリング部95は、第1データ格納部94に格納されているレコードをユーザIDでソートする(図6:ステップS11)。そして、第1ラベリング部95は、第1データ格納部94にデータが格納されているユーザのうち未処理のユーザを一人特定する(ステップS12)。
そして、第1ラベリング部95は、特定されたユーザのデータは以下の処理を実行可能か判断する(ステップS13)。本実施の形態では、ユーザによって指示されたタイミングでしか位置データが登録されないので、ある程度の量位置データが登録されないと有効なラベリングが行われない。従って、本実施の形態では、(a)最低2ヶ月以内の位置登録があること、(b)同期間内で、1日の最後に登録された位置が同じ地域内に5回以上あること、を処理実行の要件としている。この他の要件を付加しても良い。
特定されたユーザのデータが処理できない場合には、端子Aを介して図9の処理に移行する。一方、特定されたユーザのデータが処理可能であれば、第1ラベリング部95のクラスタリング部951は、特定されたユーザの位置のデータについて、クラスタリング処理を実行する(ステップS15)。
例えば、本実施の形態では、クラスタリングの手法としてk−means法を採用する。k−means法では、初期的にN個のクラスタに要素を分類する。そして、各クラスタについて、当該クラスタに包含される要素の重心を当該クラスタの重心として算出し、各要素を、各クラスタの重心のうち最も近い重心のクラスタに再分類する。すなわち、重心は移動するので、クラスタの構成要素も変化する。一般的なk−means法では、このような処理を重心が安定するまで繰り返すものである。本実施の形態では、5個のクラスタに分類する処理を30回繰り返すことにする。但し、クラスタ数及び繰り返し回数は変更可能である。
模式的に示すと、図7に示すようなクラスタリング結果が得られる。図7の例では、上で述べたように5つのクラスタに分類した例を示している。
1回クラスタリング処理を実施すると、抽出部952は、クラスタ毎に当該クラスタに属するレコード数(位置の数)を計数する(ステップS17)。例えば図8に示すようなデータが得られる。図8の例では、クラスタリング処理の実行毎に、クラスタ1乃至5のそれぞれに属するレコードの数が登録されるようになっている。
そして、抽出部952は、最も多くのレコードが属している第1位クラスタに含まれるレコードの数が全体の50%以上となっているか判断する(ステップS19)。例えば、100レコード中50以上のレコードが1つのクラスタに属しているか判断する。図8の例では、2回目及び5回目のクラスタリング結果においては、クラスタ1がこの条件を満たしている。
第1位クラスタに含まれるレコードの数が全体の50%以上となっている場合には、抽出部952は、第1位クラスタに含まれるレコードを処理対象に設定する(ステップS21)。そして処理はステップS27に移行する。
一方、第1位クラスタに含まれるレコードの数が全体の50%未満である場合には、抽出部952は、上位2つのクラスタに含まれるレコードの数が全体の40%以上であるか判断する(ステップS23)。所属するレコードの数が上位2つのクラスタに属するレコードの数の和が、例えば100レコード中40以上のレコードであるかを判断する。図8の例では、1回目、3回目及び4回目におけるクラスタ1及び2がこの条件を満たしている。
上位2つのクラスタに含まれるレコードの数が全体の40%以上である場合には、抽出部952は、上位2つのクラスタに含まれるレコードを処理対象に設定する(ステップS25)。そして処理はステップS27に移行する。一方、このような条件を満たさない場合には、処理対象に設定されるレコードはなく、そのまま処理はステップS27に移行する。
ステップS19乃至S25の処理は、クラスタリングの結果が、特徴を抽出するのに十分な程度偏っているか否かを判断し、十分偏っていれば、偏りが検出されたクラスタに含まれるレコードを以下の処理の処理対象として設定している。
k−means法によってクラスタリング処理の繰り返し毎に重心が移動するので、図8に示すように、クラスタに属するレコードは変動し、また処理対象として設定されるクラスタも変動する。これによって、GPSによる位置データの誤差等のゆらぎを吸収させる。
また、このような処理を繰り返すと、同じレコードが何度も処理対象に設定される。以下の処理では、元々同じレコードであっても、異なるレコードとして処理を行うので、特徴となる位置が強調されることになる。すなわち、特徴を浮き彫りにする効果を有する。
そして、クラスタリング部951は、クラスタリング処理の実行回数は閾値に達したか判断する(ステップS27)。クラスタリング処理の実行回数は閾値に達していない場合には、処理はステップS15に戻る。
一方、クラスタリング処理の実行回数が閾値に達した場合には、処理は端子Bを介して図9の処理に移行する。
図9の処理の説明に移行して、評価部953は、処理対象レコードの評価処理を実行する(ステップS29)。評価処理については、図10乃至図14を用いて説明する。
そして、第1ラベリング部95は、第1データ格納部94に位置が登録されているユーザのうち未処理のユーザが存在しているか判断する(ステップS31)。未処理のユーザが存在している場合には、処理は端子Cを介して図6のステップS12に戻る。一方、未処理のユーザが存在しない場合には、呼び出し元の処理に戻る。
次に、図10乃至図14を用いて第1の評価処理について説明する。評価部953は、処理対象として設定されたレコードについて、ヒストグラムを生成する(ステップS41)。本実施の形態では、緯度及び経度の各々について、例えば所定の範囲を所定数(例えば5000)のバンド(レンジとも呼ぶ)に分割して、各バンドの度数を計数することで、ヒストグラムを生成する。例えば、図11及び図12に示すようなヒストグラムが得られる。
そして、評価部953は、ヒストグラムにおいて、最も出現頻度が高い位置を第1本拠地(例えば自宅位置)、2番目に出現頻度が高い位置を第2本拠地(例えば通勤先又は通学先)として特定する(ステップS43)。図11及び図12の例では、緯度についてはaのバンドが最も出現頻度が高いことを表しており、経度についてはcのバンドが最も出現頻度が高いことを表しているので、バンドaの中央値とバンドbの中央値とを第1本拠地の緯度経度として採用する。同様に、緯度についてはbのバンドが2番目に出現頻度が高いことを表しており、経度についてはdのバンドが2番目に出現頻度が高いことを表しているので、バンドbの中央値とバンドdの中央値とを第2本拠地の緯度経度として採用する。
そうすると、例えば図13に示すようなデータが得られる。すなわち、各ユーザについて、第1本拠地の緯度経度、第2本拠地の緯度経度が得られる。
その後、評価部953は、位置ラベルとして第1本拠地及び第2本拠地を、該当するレコードに設定し、処理結果を第2データ格納部96に格納する(ステップS45)。
例えば、ヒストグラムにおいて第1本拠地として特定されたバンドに含まれるレコードに対して第1本拠地を表すラベルを付与し、ヒストグラムにおいて第2本拠地として特定されたバンドに含まれるレコードに対して第2本拠地を表すラベルを付与する。
他の手法として緯度経度の誤差を勘案して、第1本拠地の緯度経度を中心として所定範囲に緯度経度が含まれるレコードに対して第1本拠地を表すラベルを付与し、第2本拠地の緯度経度を中心として所定範囲に緯度経度が含まれるレコードに対して第2本拠地を表すラベルを付与する。
例えば、図14に示すように、処理に係るユーザのレコードのうち該当するレコードについて、第1本拠地というラベルと第2本拠地というラベルとが付与される。
以上のような処理を実行することで、自宅と推定される第1本拠地と勤務先又は通学先などであると推定される第2本拠地とを推定でき、該当するレコードに対して位置ラベルとして設定できるようになる。
次に、図15乃至図18を用いて滞留点及び移動点特定処理について説明する。
まず、第2ラベリング部97は、第2データ格納部96に格納されているデータにおいて、第1及び第2本拠地が特定された未処理のユーザを一人特定する(ステップS51)。そして、第2ラベリング部97は、第2データ格納部96から、特定されたユーザのレコードを抽出する(ステップS53)。
距離算出部971は、第1及び第2本拠地以外のレコードについて、正規化ユークリッド距離を算出する(ステップS57)。
正規化ユークリッド距離は、以下のように定義される。
Figure 0005886718
ここで(latk−latj)は、直前のレコードjにおける緯度と自レコードkにおける緯度との差を表し、(lonk−lonj)は、直前のレコードjにおける経度と自レコードkにおける経度との差を表す。
さらに、(t’k−t’j)は、直前レコードjにおける補正後時刻と自レコードkにおける補正後時刻との差を表す。時間は、例えば秒単位(又はユニックス時間)の差を用いると全体として時間依存の距離となってしまうので、例えばt’=kt(調整係数k=10-4)というように補正することで、正規化したユークリッド距離dが得られるようになる。
例えば、ステップS57を実行すると、図16に示すようなデータが得られる。図16の例では、各レコードについて、正規化ユークリッド距離が算出されている。
そして、クラスタリング部972は、特定されたユーザについて算出された正規化ユークリッド距離についてクラスタリングを実行する(ステップS59)。クラスタリングについては、ここでもk−means法を用いても良い。また、滞留点と移動点とに分けるため、クラスタは2つとなる。
例えば、図17は、緯度と経度とで張られた平面において、特定されたユーザについてのレコードに含まれる緯度経度に対応する点に、ステップS57で算出された正規化ユークリッド距離に相当する長さの線分を垂直方向に伸ばした形で表している。この例では、クラスタリングを実施すると、おおよそ距離3以上となっているレコードについては、滞留点のクラスタに属し、おおよそ距離3未満となっているレコードについては、移動点のクラスタに属する。
この結果をより具体的に検討すると、差分時間が短いレコードについては、移動点のクラスタに属し、差分時間が長いレコードについては、滞留点のクラスタに属していることが分かった。このように、ある程度長い正規化ユークリッド距離が算出された位置については滞留点とラベル付けし、あまり長い正規化ユークリッド距離が算出されなかった位置については移動点とラベル付けするのは、妥当性がある。
そして、設定部973は、ステップS53で読み出されたレコードのうち、正規化ユークリッド距離が長い方のクラスタに含まれるレコードに滞留点というラベルを設定し、正規化ユークリッド距離が短い方のクラスタに含まれるレコードに移動点というラベルを設定する(ステップS61)。そして、処理結果を、第3データ格納部98に格納する。
例えば、図18に示すようなデータが、第3データ格納部98に格納される。図18の例では、位置ラベルとして移動点、滞留点についても設定されている。
そして、第2ラベリング部97は、第1及び第2本拠地が特定された未処理のユーザが第2データ格納部96に存在しているか判断する(ステップS63)。第1及び第2本拠地が特定された未処理のユーザが存在している場合には、処理はステップS51に戻る。一方、未処理のユーザが存在していない場合には、処理は呼出元の処理に戻る。
以上のような処理を実施することにより、不定期で位置情報を取得する場合においても、時刻情報に依存せず第1本拠地及び第2本拠地を抽出することができるようになる。また、第1本拠地及び第2本拠地が抽出できれば、時間のデータを用いて滞留点及び移動点をも区別できるようになる。
[実施の形態2]
上で述べた実施の形態では、評価処理として図10の処理を実行してヒストグラムにより第1本拠地及び第2本拠地を特定する例を示したが、例えば、図19に示すような第2の評価処理を実行するようにしても良い。
まず、評価部953は、カーネル密度関数の演算に用いられるパラメータを算出する(図19:ステップS71)。
カーネル密度関数p(x)は、以下のように表される。
Figure 0005886718
Nは、処理対象レコードの数であり、xiは、各処理対象レコードにおける緯度又は経度である。バンド幅d(正規化ユークリッド距離とは異なる)は、以下のように表される。なお、この式は、メジアンを考慮したバンド幅の式である。これ以外にもバンド幅を決定する方法は存在しているが、例えばこのような式を用いればよい。
Figure 0005886718
σは、処理対象レコードの緯度又は経度についての標準偏差である。
このようにカーネル密度関数p(x)でカーネル密度を算出するには、N、d及びσを算出しておく。
そして、評価部953は、計算されたパラメータを用いてカーネル密度関数の値を計算し、第1のピークにおける緯度経度を第1本拠地として特定し、第2のピークにおける緯度経度を第2本拠地として特定する(ステップS73)。
図20に緯度についてのカーネル密度関数のカーブを表し、図21に経度についてのカーネル密度関数のカーブを表す。図20及び図21では、同じ処理対象レコードについて生成したヒストグラムを重ねて表している。このようにカーネル密度関数p(x)は、バンド幅d毎に値を計算することで、図20及び図21に示すように滑らかなカーブとして表される。バンド幅は、ヒストグラムでは固定的な設定となるが、カーネル密度関数では、処理対象レコードについての緯度及び経度の分布に基づき決定されるので、より適切なカーブが得られる。
ステップS73では、緯度については、第1のピークpに係るバンド幅の中央値を第1本拠地の緯度として採用し、第2のピークqに係るバンド幅の中央値を第2本拠地の緯度として採用する。経度については、第1のピークrに係るバンド幅の中央値を第1本拠地の経度として採用し、第2のピークsに係るバンド幅の中央値を第2本拠地の経度として採用する。
さらに、評価部953は、位置ラベルとして第1本拠地及び第2本拠地を、該当するレコードに設定し、処理結果を第2データ格納部96に格納する(ステップS75)。
例えば、第1本拠地として特定されたバンドに含まれるレコードに対して第1本拠地を表すラベルを付与し、第2本拠地として特定されたバンドに含まれるレコードに対して第2本拠地を表すラベルを付与する。
他の手法として緯度経度の誤差を勘案して、第1本拠地の緯度経度を中心として所定範囲に緯度経度が含まれるレコードに対して第1本拠地を表すラベルを付与し、第2本拠地の緯度経度を中心として所定範囲に緯度経度が含まれるレコードに対して第2本拠地を表すラベルを付与する。
以上のような処理を実施することで、ヒストグラムより精度良く第1本拠地及び第2本拠地を特定することができるようになる。
以上本発明の実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、図2に示した情報処理装置9の構成は一例であって、プログラムモジュールの実装構成とは異なる場合がある。処理フローについても、処理結果が変わらない限り、処理順番を入れ替えたり、処理ステップを並列に実行するようにしても良い。
なお、上で述べた情報処理装置9は、コンピュータ装置であって、図22に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
9 情報処理装置
90 位置データ取得部
91 位置データ格納部
92 前処理部
93 設定データ格納部
94 第1データ格納部
95 第1ラベリング部
96 第2データ格納部
97 第2ラベリング部
98 第3データ格納部
951 クラスタリング部
952 抽出部
953 評価部
971 距離算出部
972 クラスタリング部
973 設定部

Claims (3)

  1. ユーザが指示したタイミングにおける位置のデータと前記ユーザの識別子とを含むデー タブロックを複数格納するデータ格納部から、所定の条件を満たすユーザの位置のデータを読み出すステップと、
    前記所定の条件を満たす各ユーザについて、当該ユーザの位置を所定個数のクラスタに分類するクラスタリング処理を繰り返し、当該繰り返し毎に位置の所定の集中状態を表す 条件を満たす位置を抽出するステップと、
    前記所定の条件を満たす各ユーザについて、抽出された前記位置から最頻出現位置を特定する特定ステップと、
    を含み、
    前記クラスタリング処理が、各クラスタについて当該クラスタに属する位置を用いて当該クラスタの重心を算出し、各位置について最も近い重心を有するクラスタに分類し直す処理であり、
    前記特定ステップが、
    前記所定の条件を満たす各ユーザについて、抽出された前記位置から2番目に頻出する 位置を特定するステップ
    を含み、
    前記データブロックが、前記タイミングについての時刻をさらに含み、
    前記所定の条件を満たす各ユーザについて、前記最頻出現位置及び前記2番目に頻出する位置に該当する第1のデータブロック以外の第2のデータブロック毎に、直前の時刻の データブロックに含まれる位置及び時刻に対する距離を算出するステップと、
    算出された距離によって前記第2のデータブロックを2つにクラスタリングするステッ プと、
    をさらに含み、
    前記距離が、時刻又は位置に対して調整係数を乗じた値を用いて算出される
    コンピュータにより実行される情報処理方法。
  2. 前記特定ステップが、
    抽出された前記位置についてヒストグラムを生成するステップ
    を含む請求項記載の情報処理方法。
  3. 前記特定ステップが、
    抽出された前記位置についてのカーネル密度関数のカーブにおいてピークを検出するス テップ
    を含む請求項1又は2記載の情報処理方法。

JP2012196878A 2011-11-29 2012-09-07 情報処理方法及び装置 Active JP5886718B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012196878A JP5886718B2 (ja) 2011-11-29 2012-09-07 情報処理方法及び装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011260430 2011-11-29
JP2011260430 2011-11-29
JP2012196878A JP5886718B2 (ja) 2011-11-29 2012-09-07 情報処理方法及び装置

Publications (2)

Publication Number Publication Date
JP2013137738A JP2013137738A (ja) 2013-07-11
JP5886718B2 true JP5886718B2 (ja) 2016-03-16

Family

ID=48913385

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012196878A Active JP5886718B2 (ja) 2011-11-29 2012-09-07 情報処理方法及び装置

Country Status (1)

Country Link
JP (1) JP5886718B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6215864B2 (ja) 2014-04-25 2017-10-18 日東電工株式会社 偏光子、偏光板および画像表示装置
JP6215865B2 (ja) * 2014-04-25 2017-10-18 日東電工株式会社 偏光子の製造方法
JP6214594B2 (ja) * 2014-04-25 2017-10-18 日東電工株式会社 偏光子、偏光板および画像表示装置
JP6215261B2 (ja) 2014-06-27 2017-10-18 日東電工株式会社 長尺状の偏光子、長尺状の偏光板および画像表示装置
JP6713189B2 (ja) 2014-06-27 2020-06-24 日東電工株式会社 長尺状の偏光フィルム積層体
JP7163000B2 (ja) 2015-06-25 2022-10-31 日東電工株式会社 非偏光部を有する偏光子
JP6422415B2 (ja) 2015-09-28 2018-11-14 日東電工株式会社 偏光子、偏光板および画像表示装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI393378B (zh) * 2009-04-07 2013-04-11 Inst Information Industry 熱點分析系統及方法,及其電腦程式產品
JP5244686B2 (ja) * 2009-04-24 2013-07-24 株式会社東芝 監視装置およびサーバー
JP2011096004A (ja) * 2009-10-29 2011-05-12 Ntt Docomo Inc 交通量推定装置及び交通量推定方法
JP5536485B2 (ja) * 2010-02-17 2014-07-02 Kddi株式会社 ユーザの移動に伴って住所/居所を推定する携帯端末、サーバ、プログラム及び方法
JPWO2011102541A1 (ja) * 2010-02-19 2013-06-17 日本電気株式会社 行動特徴抽出装置、行動特徴抽出システム、行動特徴抽出方法、及び行動特徴抽出プログラム
JP5317213B2 (ja) * 2010-04-26 2013-10-16 株式会社ゼンリンデータコム 日常圏設定システム、日常圏設定方法及び日常圏設定プログラム
WO2011142225A1 (ja) * 2010-05-12 2011-11-17 日本電気株式会社 特徴点検出システム、特徴点検出方法、及びプログラム

Also Published As

Publication number Publication date
JP2013137738A (ja) 2013-07-11

Similar Documents

Publication Publication Date Title
JP5886718B2 (ja) 情報処理方法及び装置
CN106570722B (zh) 一种智能推荐系统及智能推荐方法
JP6225257B2 (ja) 関心ポイントのクラスタリング方法及び関連する装置
CN104731917B (zh) 一种推荐方法及装置
US8532648B2 (en) Generating an OD matrix
US11755675B2 (en) Method and apparatus for managing region tag
US20130304685A1 (en) Behaviour pattern analysis system, mobile terminal, behaviour pattern analysis method, and program
US9159030B1 (en) Refining location detection from a query stream
JP6049186B2 (ja) 携帯端末を所持したユーザの滞在地を推定する装置、プログラム及び方法
JP6634511B2 (ja) 人口推定装置、プログラム及び人口推定方法
CN107014392B (zh) 一种路线规划方法及设备
JP6396686B2 (ja) 行動判定装置、行動判定方法及びプログラム
JP6169022B2 (ja) 携帯端末を所持したユーザの滞在地を推定する装置、プログラム及び方法
CN110765383A (zh) 资源缓存方法以及装置
CN107133689B (zh) 一种位置标记方法
JP5986028B2 (ja) 携帯端末を所持したユーザの短時間滞留地を推定する装置、プログラム及び方法
CN109409959A (zh) 一种用户信息分析方法、装置、设备及介质
KR101867421B1 (ko) 소셜 데이터를 이용한 서비스 제공업체 추천 방법 및 장치
JP5401421B2 (ja) 行動域推定装置、方法及びプログラム
CN111711668A (zh) 基于poi的实时推送服务的方法、装置、计算机设备
CN108170795B (zh) 信息推送方法、装置及设备
CN110672086B (zh) 场景识别方法、装置、设备及计算机可读介质
JP5235710B2 (ja) 文書検索装置、文書検索方法、文書検索プログラムおよびそのプログラムを記録した記録媒体。
RU2658876C1 (ru) Способ и сервер для обработки данных датчика беспроводного устройства для создания вектора объекта, связанного с физическим положением
CN113132891B (zh) 一种基于移动信令的客流统计方法和系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160212

R150 Certificate of patent or registration of utility model

Ref document number: 5886718

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250