JP6053027B2 - 類似移動経路をとるユーザを検索する装置、プログラム及び方法 - Google Patents

類似移動経路をとるユーザを検索する装置、プログラム及び方法 Download PDF

Info

Publication number
JP6053027B2
JP6053027B2 JP2013180611A JP2013180611A JP6053027B2 JP 6053027 B2 JP6053027 B2 JP 6053027B2 JP 2013180611 A JP2013180611 A JP 2013180611A JP 2013180611 A JP2013180611 A JP 2013180611A JP 6053027 B2 JP6053027 B2 JP 6053027B2
Authority
JP
Japan
Prior art keywords
stay
short
time
place
staying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013180611A
Other languages
English (en)
Other versions
JP2015049681A (ja
Inventor
茂莉 黒川
茂莉 黒川
孝文 渡邉
孝文 渡邉
村松 茂樹
茂樹 村松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013180611A priority Critical patent/JP6053027B2/ja
Publication of JP2015049681A publication Critical patent/JP2015049681A/ja
Application granted granted Critical
Publication of JP6053027B2 publication Critical patent/JP6053027B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、携帯端末を所持したユーザの滞在及び移動に関わる情報を推定する技術に関する。
近年、携帯電話機に代表される携帯端末の多くは、GPS(Global Positioning System)といった測位機能を備えている。これにより、ユーザは、測位を通して現在位置情報を取得できるとともに、測位結果をネットワーク経由でサーバに送信することによって、位置に応じた様々なサービス情報を受信可能となる。
しかしながら、ユーザの位置情報の取得のために、携帯端末においてGPS機能及びそのアプリケーションを常時又は定期的に起動させると、携帯端末の電池の消耗が早まるのみならず、携帯端末からのパケットの送出量が増大してしまう。また、それ故に、ユーザの位置情報に基づくサービスを普及させることも困難となる。
そのため、通信事業者側としては、携帯端末で取得された位置情報ではなく、その携帯端末を配下とする基地局の位置情報によって、携帯端末を所持したユーザの滞在に関する位置及び時間区間を推定できることが好ましい。この場合、携帯端末は常時又は定期的にGPS機能を起動させる必要もない。
例えば、特許文献1には、携帯端末等の移動体を配下とする基地局の位置情報の履歴を用いて、移動体の動線を分析する技術が開示されている。この技術によれば、2つの移動体における滞在地の一致と滞在時間帯の重複とに基づいて、移動体同士の接触の有無が評価される。
特開2006−85257号公報
しかしながら、特許文献1に記載されたような従来技術では、1つの携帯端末と他の携帯端末とが同行しているか、又は互いに近くを通行しているかを検知することは困難である。例えば、携帯端末を所持したユーザが電車や自動車等の移動手段によって移動している場合、他の携帯端末を所持したユーザがこのユーザと所定の時間区間において同じ移動手段に乗車しているか否か、または、他のユーザの乗車した移動手段がこのユーザの乗車した移動手段の近くを移動しているか否かを推定することは困難である。
このような同行又は近接位置の通行を検知し推定するためには、各ユーザの移動経路を導出して適切に比較することが重要になる。
そこで、本発明は、携帯端末の測位機能に頼ることなく、通信事業者設備によって取得可能な基地局位置情報を用いて、携帯端末を所持したユーザの移動経路に類似した移動経路をとるユーザを検索することができる装置、プログラム及び方法を提供することを目的とする。
本発明によれば、携帯端末を所持したユーザの移動経路に類似した移動経路をとるユーザを検索する装置であって、
携帯端末毎に、通信に係る日時刻及び基地局位置情報を対応付けた複数の通信記録を含む通信履歴を蓄積した位置情報履歴蓄積手段と、
携帯端末毎に、通信履歴における第1の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「短時間滞留地」を決定し、この第1の時間窓よりも長い時間幅を有する第2の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「滞在地」を決定し、決定された「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを生成する時系列データ生成手段と、
滞在滞留時系列データから所定頻度以上で発生する「短時間滞留地」間遷移パターンを抽出し、「短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「短時間滞留地」間遷移モデルを構築する短時間滞留地間遷移モデル構築手段と、
滞在滞留時系列データから所定頻度以上で発生する「滞在地・短時間滞留地」間遷移パターンを抽出し、「滞在地・短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「滞在地・短時間滞留地」間遷移モデルを構築する滞在地・短時間滞留地間遷移モデル構築手段と、
滞在滞留時系列データについて、構築された「短時間滞留地」間遷移モデル及び「滞在地・短時間滞留地」間遷移モデルに基づいて、時系列において欠損している「短時間滞留地」を補間する短時間滞留地補間手段と、
所定の携帯端末に係る補間処理後の滞在滞留時系列データと、他の携帯端末に係る補間処理後の滞在滞留時系列データとの間の最長一致部分系列長に基づいて、所定の携帯端末の移動経路に類似した移動経路をとる携帯端末を検索するユーザ検索手段と
を有する装置が提供される。
この本発明の装置における時系列データ生成手段は、
通信履歴を、第1の時間窓と第2の時間窓とのそれぞれで分割する時間窓分割手段と、
第1の時間窓毎に、複数の基地局位置情報に基づく位置の確率分布に基づいて「滞留」か否かを判定して、「滞留」と判定された第1の時間窓における位置の確率分布に基づいて「滞留地」を決定し、「滞留」と判定された所定数以下の連続する第1の時間窓に対し、滞留の所定時間以上前又は後に異なる「滞留地」を有する第1の時間窓が存在しており、且つ連続する第1の時間窓の「滞留地」と異なる「滞留地」とが所定距離以上離隔している場合、この連続する第1の時間窓を「短時間滞留」と判定する第1の短時間滞留判定手段と、
複数の携帯端末に係る「短時間滞留」と判定された第1の時間窓の「滞留地」の確率分布に基づいて「短時間滞留地」を決定し、「短時間滞留地」毎に基地局位置情報を対応付けた基地局リストを生成する基地局情報収集手段と、
通信履歴について、基地局リストに含まれる基地局が存在する場合、この基地局の基地局位置情報に、基地局リストで対応している「短時間滞留地」を対応付けた短時間滞留地履歴を生成する第2の短時間滞留判定手段と、
第2の時間窓毎に、複数の基地局位置情報に基づく位置の確率分布に基づいて「滞在」か否かを判定し、「滞在」と判定された第2の時間窓における位置の確率分布に基づいて「滞在地」を決定する滞在判定手段と、
携帯端末毎に、生成された短時間滞留地履歴に基づいて、決定された「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを生成する滞在滞留時系列データ生成手段と
を有することも好ましい。
また、上述した実施形態では、基地局情報収集手段は、「短時間滞留地」毎に、基地局の基地局位置情報と、この基地局に対する接続確率とを対応付けた基地局リストを生成し、第2の短時間滞留判定手段は、接続確率が所定値以上である基地局のみを選択して短時間滞留地履歴を生成することも好ましい。さらに、時間窓分割手段は、所定地域範囲における短時間滞留の時間長の平均値、最頻値又はN分位点(0≦N≦1)値を、第1の時間窓の時間幅に設定することも好ましい。
また、本発明の装置における短時間滞留地補間手段は、時系列において欠損している「短時間滞留地」の候補が複数存在する場合、1つの候補を間に含んだ遷移パターンの出現確率に基づく尤度が最も高くなるところの当該候補で補間することも好ましい。
さらに、この短時間滞留地補間手段は、滞在滞留時系列データにおいて隣接する「短時間滞留地」同士又は隣接する「滞在地」及び「短時間滞留地」が所定時間以上離隔している場合、「短時間滞留地」同士の間又は「滞在地」及び「短時間滞留地」の間に、欠損している「短時間滞留地」が存在すると推定することも好ましい。
また、本発明の装置におけるユーザ検索手段は、2つの携帯端末間の類似度を(最長一致部分系列長)/(これらの2つの携帯端末に係る補間処理後の滞在滞留時系列データのうちの長いほうの系列長)として、類似度が所定閾値以上の携帯端末を検索することも好ましい。さらに、ユーザ検索手段は、指定された検索対象の時間区間のうち、互いに所定時間以上離隔した「滞在地」に対応する時間区間の間となる時間区間について最長一致部分系列長を調査することも好ましい。
また、本発明によれば、広域無線通信網に接続された以上に述べた装置である通信設備装置であって、
基地局識別子及び基地局位置情報を対応付けて記憶する基地局位置情報管理手段と、
携帯端末を配下に接続させる基地局から、携帯端末毎に通信に係る日時刻とこの基地局の基地局識別子とを対応付けた通信記録を収集する通信履歴収集手段とを更に有し、
位置情報履歴蓄積手段は、通信記録について、携帯端末毎に基地局識別子に対応する基地局位置情報を更に対応付けて通信履歴を生成する
ことを特徴とする通信設備装置が提供される。
本発明によれば、さらに、装置に搭載されたコンピュータを、携帯端末を所持したユーザの移動経路に類似した移動経路をとるユーザを検索するように機能させるプログラムであって、
携帯端末毎に、通信に係る日時刻及び基地局位置情報を対応付けた複数の通信記録を含む通信履歴を蓄積した位置情報履歴蓄積手段と、
携帯端末毎に、通信履歴における第1の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「短時間滞留地」を決定し、この第1の時間窓よりも長い時間幅を有する第2の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「滞在地」を決定し、決定された「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを生成する時系列データ生成手段と、
滞在滞留時系列データから所定頻度以上で発生する「短時間滞留地」間遷移パターンを抽出し、「短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「短時間滞留地」間遷移モデルを構築する短時間滞留地間遷移モデル構築手段と、
滞在滞留時系列データから所定頻度以上で発生する「滞在地・短時間滞留地」間遷移パターンを抽出し、「滞在地・短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「滞在地・短時間滞留地」間遷移モデルを構築する滞在地・短時間滞留地間遷移モデル構築手段と、
滞在滞留時系列データについて、構築された「短時間滞留地」間遷移モデル及び「滞在地・短時間滞留地」間遷移モデルに基づいて、時系列において欠損している「短時間滞留地」を補間する短時間滞留地補間手段と、
所定の携帯端末に係る補間処理後の滞在滞留時系列データと、他の携帯端末に係る補間処理後の滞在滞留時系列データとの間の最長一致部分系列長に基づいて、所定の携帯端末の移動経路に類似した移動経路をとる携帯端末を検索するユーザ検索手段と
してコンピュータを機能させるプログラムが提供される。
本発明によれば、さらにまた、装置の有するコンピュータにおけるソフトウェアの情報処理によって、携帯端末を所持したユーザの移動経路に類似した移動経路をとるユーザを検索する方法であって、
上記装置は、携帯端末毎に、通信に係る日時刻及び基地局位置情報を対応付けた複数の通信記録を含む通信履歴を蓄積した位置情報履歴蓄積手段を有し、上記方法は、
携帯端末毎に、通信履歴における第1の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「短時間滞留地」を決定し、この第1の時間窓よりも長い時間幅を有する第2の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「滞在地」を決定し、決定された「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを生成する第1のステップと、
滞在滞留時系列データから所定頻度以上で発生する「短時間滞留地」間遷移パターンを抽出し、「短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「短時間滞留地」間遷移モデルを構築する第2のステップと、
滞在滞留時系列データから所定頻度以上で発生する「滞在地・短時間滞留地」間遷移パターンを抽出し、「滞在地・短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「滞在地・短時間滞留地」間遷移モデルを構築する第3のステップと、
滞在滞留時系列データについて、構築された「短時間滞留地」間遷移モデル及び「滞在地・短時間滞留地」間遷移モデルに基づいて、時系列において欠損している「短時間滞留地」を補間する第4のステップと、
所定の携帯端末に係る補間処理後の滞在滞留時系列データと、他の携帯端末に係る補間処理後の滞在滞留時系列データとの間の最長一致部分系列長に基づいて、所定の携帯端末の移動経路に類似した移動経路をとる携帯端末を検索する第5のステップと
を有する方法が提供される。
本発明の装置、プログラム及び方法によれば、携帯端末の測位機能に頼ることなく、通信事業者設備によって取得可能な基地局位置情報を用いて、携帯端末を所持したユーザの移動経路に類似した移動経路をとるユーザを検索することができる。
実空間での携帯端末の滞在及び移動を示す概略図である。 本発明による類似移動経路ユーザ検索装置の機能構成図である。 基地局位置情報の表である。 通信履歴の表である。 通信記録に基地局位置情報を対応付けた通信履歴の表である。 第1の時間窓の開始時刻及び終了時刻を示す表である。 携帯端末毎に、図5の各行(通信記録)を図6の第1の時間窓毎に分類した表である。 第2の時間窓の開始時刻及び終了時刻を示す表である。 携帯端末毎に、図5の各行(通信記録)を図8の第2の時間窓毎に分類した表である。 単峰性を有するか否かを判定するためのフローチャートである。 「滞在」と判定された第2の時間窓及び対応する代表点位置情報を示す表である。 図11に示した第2の時間窓毎の代表点位置情報に基づいて算出された「滞在地クラスタ」の代表点位置情報を示す表である。 「滞留」と判定された第1の時間窓及び対応する代表点位置情報を示す表である。 図14は、「短時間滞留」と判定された第1の時間窓及び対応する「滞留地」代表点を示す表である。 複数の携帯端末2から「滞留」に係る情報を収集する様子を示す概略図、及び「短時間滞留地」における滞留地代表点の算出結果を示す表である。 短時間滞留地の基地局リストを示す表である。 第2の短時間滞留判定の結果を示す表である。 携帯端末00001及び00002が「滞在」及び「短時間滞留」を行いながら進行する様子を示す概略図、及び生成された滞在滞留時系列データを示す表である。 「短時間滞留地」間遷移モデルを示す表である。 「滞在地・短時間滞留地」間遷移モデルを示す表である。 短時間滞留地A〜Gについての短時間滞留地間遷移モデルを示す表である。 滞在地α及びβ並びに短時間滞留地A〜Gについての滞在地・短時間滞留地間遷移モデルを示す表である。 「短時間滞留地」補間の実施例を説明するための表である。
以下、本発明の実施形態について、図面を用いて詳細に説明する。
図1は、実空間での携帯端末の滞在及び移動を示す概略図である。
図1によれば、ユーザに所持された携帯端末(例えば携帯電話機やスマートフォン)2は、どの位置にあってもいずれかの基地局の配下にあり、通常、当該基地局と無線通信し続けることができる。このユーザにとっては、自宅及び職場が「滞在地」となる。また、自宅、職場以外の場所であるA駅、B駅、C駅及びD駅が、電車乗降のための又は電車の停車による「短時間滞留地」となる。
多数の基地局3を統合する通信事業者設備(図2)は、携帯端末2毎に、空間的粒度が粗く且つ時間間隔が一定でない基地局位置情報を常時収集することができる。ここで、「空間的粒度が粗く」とは、位置情報同士の地理的な距離が比較的長いことを意味する。また、「時間間隔が一定でない」とは、位置情報の取得時間間隔が通信タイミングに依存して比較的ばらついていることを意味する。
広域無線通信網(携帯電話網)に接続された基地局3は、その配下に位置する携帯端末2と通信した際の日時刻(例えば通信を開始した日時刻)を通信履歴として取得する。通信履歴は、通話、メールの送受信や、Webページの閲覧の際に取得される。さらには、携帯端末2にインストールされたアプリケーションとサーバとの間の通信や、アプリケーション又はコンテンツのダウンロードやアップロード等の際にも取得される。
図2は、本発明による類似移動経路ユーザ検索装置の機能構成図である。
本発明による装置1は、予め蓄積された通信履歴を用いて、携帯端末2を所持したユーザの移動経路に類似した移動経路をとるユーザを検索することができる。例えば、携帯端末を所持したユーザが電車や自動車等の移動手段によって移動している際、他の携帯端末を所持したユーザがこのユーザと所定の時間区間において同じ移動手段に乗車しているか否かを推定し、類似した移動経路をとるユーザを検索することができる。または、他のユーザの乗車した移動手段がこのユーザの乗車した移動手段の近くを移動しているか否かを推定してユーザを検索することもできる。
このように類似移動経路をとるユーザを推定することによって、例えば、携帯端末を所持しており移動経路が類似するユーザ群に、その移動経路に応じた広告や、クーポン等のオンライン情報を配信することが可能となる。尚、装置1は、広域無線通信網(携帯電話網)に設置され、基地局3から通信履歴を適宜収集する通信設備装置であってもよい。
図2によれば、類似移動経路ユーザ検索用の装置1は、時間窓分割部121と、滞在判定部122と、第1の短時間滞留判定部123と、基地局情報収集部124と、第2の短時間滞留判定部125と、滞在滞留時系列データ生成部126と、短時間滞留地間遷移モデル構築部127と、滞在地・短時間滞留地間遷移モデル構築部128とを有する。これらの機能構成部は、時系列データ生成部12として機能する。装置1は、また、短時間滞留地補間部131と、ユーザ検索部132とを有する。
上述した機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、図2によれは、各機能構成部を用いた処理の流れは、類似移動経路をとるユーザを検索する方法としても理解される。
さらに、装置1は、広域無線通信網(携帯電話網)に設置された通信設備装置である場合、通信履歴を取得するために、広域通信網に接続する通信インタフェース部10と、通信履歴収集部111と、基地局位置情報管理部112と、位置情報履歴蓄積部113とを更に有する。ここで、通信インタフェース部10は、類似移動経路ユーザ検索のためのクエリを受信し、検索結果を送信するインタフェースとしても機能する。以下、装置1は通信設備装置として説明する。
[基地局位置情報管理部112]
基地局位置情報管理部112(図2)は、基地局識別子と基地局位置情報とを対応付けて記憶する。
図3は、基地局位置情報の表である。基地局識別子毎に、緯度・経度の基地局位置情報が対応付けられている。図3によれば、基地局0001は、緯度が35.845度であって経度が139.502度の位置に設置されていることが理解される。また、基地局0003は、緯度35.845及び経度139.504の位置に設置されていることが理解される。尚、このような基地局位置情報は、基地局位置情報管理部112内に予め蓄積したものであってもよいし、通信インタフェース部10を介して各基地局3から適宜取得するものであってもよい。
[通信履歴収集部111]
通信履歴収集部111(図2)は、基地局3から、当該基地局3の配下にある携帯端末2毎に日時刻及び基地局識別子といった通信記録(通信履歴)を収集する。
図4は、通信履歴の表である。通信履歴は、基地局3が携帯端末2からの通信を受け付けた際の一連の通信記録(ログ)である。各通信記録では、携帯端末2の「端末識別子」(アドレス、電話番号、識別番号等)毎に、「日時刻」及び「基地局識別子」が対応付けられている。
通信記録(端末識別子、日時刻、基地局識別子)
図4の通信履歴によれば、携帯端末00001は、2010年6月15日17:54:50に基地局0003と通信している。また、携帯端末00001は、2010年6月15日17:57:00には基地局0001と通信している。
[位置情報履歴生成部113]
位置情報履歴生成部113(図2)は、基地局位置情報管理部111を用いて、通信記録(ログ)毎に、基地局識別子に対応する基地局位置情報を更に対応付けた通信履歴を生成し蓄積する。
図5は、通信記録に基地局位置情報を対応付けた通信履歴の表である。図5の表は、図4の表の基地局識別子の部分を、図3の基地局の緯度・経度情報で置き換えたものである。図5の通信履歴によれば、携帯端末00001は、2010年6月15日17:54:50に、緯度35.845及び経度139.504の基地局と通信したことが理解される。また、携帯端末00001は、2010年6月15日17:57:00に、緯度35.845及び経度139.502の基地局と通信したことが理解される。
[時間窓分割部121]
時間窓分割部121(図2)は、位置情報履歴生成部113から出力された通信履歴を所定の時間窓(時間区間)で分割する。具体的には、通信履歴を構成する複数の通信記録を、日時刻が所定の時間窓に属するもの同士を集めて区分する。時間窓は、時間幅T及びシフト幅Sによって決定される。シフト幅Sの時間窓とは、開始時刻をSだけ遅らせたものである。従ってT>Sの場合、時間窓はT−Sだけ重畳することになる。
時間幅Tは「どの時間幅で滞在又は滞留を判定するか」を決めるパラメータである。ここで、時間窓内に所定数以上の位置情報が存在しないと滞在/移動の判定が難しい。従って、時間幅Tは、通信履歴の通信記録(ログ)数から判断して、時間窓内にできるだけ所定数以上の位置情報が入るように決定することが好ましい。
また、シフト幅Sは、その幅を短くすると滞在時間区間の時間解像度が増す。一方で、その幅を長くすると、時間窓の数が多くなるので計算量が増大する。従って、シフト幅Sは、アプリケーションの求める時間解像度及び処理時間に応じて決定されることが好ましい。
時間窓分割部121は、「短時間滞留」及び「滞在」の判定を仕分けるため、2種類の時間窓を設定する。このうち「短時間滞留」の判定では、実際の短時間滞留の時間、例えば電車等の移動手段の一時停止及び停車の時間を勘案し、より短い時間幅(第1の時間幅)を有する第1の時間窓を設定する。ここで、第1の時間幅Tは、時間窓内に含まれる位置情報の数を勘案して設定してもよい。さらには、第1の時間幅Tとして、エリア毎の短時間滞留の時間長に関する分布を取得し、同時間長の平均、最頻値又はN分位点(0≦N≦1)を用いてもよい。以下の実施例では、T=5分及びS=2分30秒である第1の時間窓を採用する。
一方、「滞在」の判定では、時間窓内に一定数の位置情報が含まれるように第1の時間幅よりも長い時間幅(第2の時間幅)を有する第2の時間窓を設定する。以下の実施例では、T=20分及びS=10分である第2の時間窓を採用する。
図6は、第1の時間窓(T=5分及びS=2分30秒)の開始時刻及び終了時刻を示す表である。図6によれば、時間窓1は17:50:00〜17:54:59であり、T=00:05:00となっている。また、時間窓2は17:52:30〜17:57:29であり、時間窓1に対してS=00:02:30となっていることが分かる。
図7は、携帯端末毎に、図5の各行(通信記録)を図6の第1の時間窓毎に分類した表である。尚、同表では、時間窓内の点(位置情報)の数が4以上のもののみが記録されている。図7によれば、携帯端末00001について、第1の時間窓12には5個の通信記録が属し、第1の時間窓13には4個の通信記録が属している。
図8は、第2の時間窓(T=20分及びS=10分)の開始時刻及び終了時刻を示す表である。図8によれば、時間窓1は17:50:00〜18:09:59であり、T=00:20:00となっている。また、時間窓2は18:00:00〜18:19:59であり、時間窓1に対してS=00:10:00となっていることが分かる。
図9は、携帯端末毎に、図5の各行(通信記録)を図8の第2の時間窓毎に分類した表である。図9によれば、携帯端末00001について、第2の時間窓1には5個の通信記録が属し、第2の時間窓2には6個の通信記録が属している。
[滞在判定部122]
滞在判定部122(図2)は、各携帯端末2につき、第2の時間窓毎に、複数の基地局位置情報に基づく位置の確率分布に基づいて「滞在」か否かを判定し、「滞在」と判定された第2の時間窓における位置の確率分布に基づいて「滞在地」を決定する。具体的には、第2の時間窓毎に、複数の基地局位置情報に基づく位置の確率分布が単峰性を有するならば「滞在」と判定し、単峰性を有さないならば「移動」と判定する。
ここで、単峰性とは、位置の確率分布が1つの山の形状をしている(1つのピークをなす)ことを意味する。即ち、1つの第2の時間窓(例えば20分)に属する基地局位置の確率分布が単峰性を有する場合、この時間区間については「滞在」と判定することができる。一方、基地局位置の確率分布が、複数の山の形状をしている(複数のピークをなす)ならば多峰性を有するものとする。1つの第2の時間窓について多峰性を有する場合、この時間区間については「移動」中と判定することができる。
尚、滞在判定部122は、滞在判定に必要な最小点数(基地局位置情報数)に関する条件を設定し、最小点数に満たない第2の時間窓では、「滞在」ではないと判定してもよい。以下、最小点数を4とする。
図10は、単峰性を有するか否かを判定するためのフローチャートである。
図10によれば、滞在判定部122は、基地局の位置情報の確率分布が単峰性を有するか否かを判定するため、代表点計算処理を実行する。その結果、代表点の種類数が1個であれば単峰性を有しているので「滞在」と判定し、代表点の種類数が複数個であれば多峰性を有しているので「移動」中と判定する。
代表点計算処理は、各第2の時間窓に含まれる複数の位置情報について、以下のステップS1〜S5によって実行される。
(S1)任意の点(位置情報)を、最初の中心点とする。
(S2)中心点を中心とした第1の閾値(例えば2km)の半径の円に含まれる点(位置情報)を用いて、重心を算出する。
(S3)次に、算出された重心と現在の中心点との差(変化量)が、第2の閾値(例えば100m)以下であるか否かを判定する。
(S4)S3において偽と判定された場合、その重心を新たな中心点とする。次いで、再びS2へ戻り、変化量が第2の閾値以下に収まるまで繰り返す。
(S5)S3において真と判定された場合、その重心(収束した点)を代表点とする。
最後に、各第2の時間窓について、収束した代表点の種類数が1個の場合には「滞在」と判定し、複数個の場合には「移動」と判定する。ここで、当該第2の時間窓について、全ての代表点が第1の閾値又は第2の閾値の半径の円周領域内に収まる場合、収束した代表点の種類数が1個であるとすることも好ましい。
以下、図9の第2の時間窓1について、具体的に、滞在/移動を代表点抽出処理を用いて判定する。
(第2の時間窓1における滞在移動判定)
(a)第2の時間窓1の点(35.845,139.504)に関する1回目の重心を計算する。第2の時間窓1の点(35.845,139.504)と第2の時間窓1に含まれるその他の点との距離はすべて2km以内であるので、その他の点すべての平均をとると(35.845,139.503)となる。
(b)第2の時間窓1の点(35.845,139.504)に関する2回目の重心を計算する。2回目の重心計算では、中心点を(35.845,139.503)とする。この中心点と第2の時間窓1に含まれるその他の点との距離はすべて2km以内であるので、その他の点すべての平均をとると(35.845,139.503)となる。
(c)1回目と2回目の重心計算の結果は同じであり変化量は100m以下であるので、第2の時間窓1の点(35.845,139.504)の代表点は(35.845,139.503)となる。
(d)同様に、第2の時間窓1における他の点の各々について代表点を算出すると、いずれの代表点も(35.845,139.503)となる。
(e)以上により、計算された代表点はいずれの点についても(35.845,139.503)であり、代表点の種類数は1であるので、第2の時間窓1は「滞在」と判定される。
尚、滞在判定部122は、第2の時間窓毎に、複数の基地局位置情報に対してカーネル密度推定(Kernel density estimation)を用いて単峰性を有するか否かを判定することも好ましい。カーネル密度推定とは、確率変数の確率密度関数を推定するべく、ある母集団の標本のデータを外挿する方法である(例えば、野村友和、「カーネル密度推定」、[online]、[平成25年8月8日検索]、インターネット<URL:http://www.econ.kobe-u.ac.jp/~nomura/lecture/11f/kd.pdf>参照)。この方法によれば、カーネル関数を用いて峰となるコブを導出することができる。
次いで、滞在判定部122は、「滞在」と判定された第2の時間窓の位置情報を収集する。「滞在」と判定された第2の時間窓の代表点の数は1である。図11は、「滞在」と判定された第2の時間窓及び対応する代表点位置情報を示す表である。図11によれば、第2の時間窓1、2及び6が「滞在」と判定されている。
滞在判定部122は、さらに、「滞在」と判定された各第2の時間窓の複数の位置情報の重心を「滞在地クラスタ」(「滞在地」)とする。具体的には、この重心を代表点とし、互いに近接した代表点の集合を1つの「滞在地クラスタ」とする。
図10に示すように、この「滞在地クラスタ」を形成する位置クラスタリング処理も、上述した滞在移動判定での処理と同様に代表点計算処理を実行する。具体的には、各第2の時間窓で抽出された代表点の位置情報について、所与の中心点から第1の閾値の範囲で重心を算出し、この重心と中心点との差(変化量)が第2の閾値に収まるまで繰り返し、最終的に得られた各位置の収束値(図11の代表点における代表点)を、第2の時間窓毎の「滞在地クラスタ」の代表点とする。
図12は、図11に示した第2の時間窓毎の代表点位置情報に基づいて算出された「滞在地クラスタ」の代表点位置情報を示す表である。同表での代表点計算処理では、第1の閾値を2km、第2の閾値を100mとした。図12によれば、第2の時間窓1及び2について1つの「滞在地クラスタ」が形成され、この「滞在地クラスタ」の代表点は、緯度35.845及び経度139.503であることが理解される。また、第2の時間窓6では、緯度35.862及び経度139.515の位置が別の「滞在地クラスタ」の代表点となることが理解される。
このように、適切に設定された第2の時間窓を利用することによって、携帯端末の測位機能に頼ることなく、基地局位置情報を用いてユーザの「滞在」状態及び「滞在地」を推定することが可能となる。
[第1の短時間滞留判定部123]
第1の短時間滞留判定部123(図2)は、各携帯端末2につき、
(a)第1の時間窓毎に、複数の基地局位置情報に基づく位置の確率分布に基づいて「滞留」か否かを判定し、「滞留」と判定された第1の時間窓における位置の確率分布に基づいて「滞留地」を決定し、
(b)「滞留」と判定された所定数以下の連続する第1の時間窓に対し、当該滞留の所定時間以上前又は後に異なる「滞留地」を有する第1の時間窓が存在しており、且つ該連続する第1の時間窓の「滞留地」と該異なる「滞留地」とが所定距離以上離隔している場合、該連続する第1の時間窓を「短時間滞留」と判定する。
具体的に、第1の短時間滞留判定部123は、まず、第1の時間窓毎に、複数の基地局位置情報に基づく位置の確率分布が単峰性を有するならば「滞留」と判定し、単峰性を有さないならば「滞留」ではないと判定する。この「滞留」判定の処理フローは、図10を用いて説明した「滞在」判定の処理フローと同様である。即ち、図10に示した「滞在」判定の処理フローにつき、第2の時間窓に代えて第1の時間窓を採用し、「滞在」との判定に代えて「滞留」との判定を採用したものが「滞留」判定の処理フローとなる。
図13は、「滞留」と判定された第1の時間窓及び対応する代表点位置情報を示す表である。図13によれば、携帯端末00001については、第1の時間窓13、17及び18が「滞留」と判定されている。また、携帯端末00002については、第1の時間窓13、15、16及び17が「滞留」と判定されている。
第1の短時間滞留判定部123は、さらに、「滞留」と判定された各第1の時間窓の複数の位置情報の重心を「滞留地」とする。具体的には、この重心を代表点とし、互いに近接した代表点の集合を1つの「滞留地」とする。この「滞在地」を形成する位置クラスタリング処理でも、上述した滞在移動判定での処理(図10)と同様に代表点計算処理を実行する。
第1の短時間滞留判定部123は、次いで、「滞留」と判定された所定数以下の連続する第1の時間窓に対し、当該滞留の所定時間以上前又は後に異なる「滞留地」を有する第1の時間窓が存在しており、且つこの連続する第1の時間窓の「滞留地」と、この異なる「滞留地」とが所定距離以上離隔している場合、この連続する第1の時間窓を「短時間滞留」と判定する。
以下の実施例では、2つ以下(即ち2つ)の連続する第1の時間窓において滞留と「判定」され、滞留の2分30秒以上前又は滞留の2分30秒以上後に異なる「滞留地」において滞留し、且つ「滞留地」間の距離が2km以上離れている場合に、「短時間滞留」と判定する。
図14は、「短時間滞留」と判定された第1の時間窓及び対応する「滞留地」代表点を示す表である。図14によれば、携帯端末00001について、第1の時間窓13並びに第1の時間窓17及び18が「短時間滞留」と判定されている。また、携帯端末00002について、第1の時間窓13並びに第1の時間窓15及び16が「短時間滞留」と判定されている。
このように、適切に設定された第1の時間窓を利用することによって、携帯端末の測位機能に頼ることなく、基地局位置情報を用いてユーザの「短時間滞留」を推定することが可能となる。
[基地局情報収集部124]
基地局情報収集部124(図2)は、複数の携帯端末2(複数ユーザ)についての、「短時間滞留」と判定された第1の時間窓の「滞留地」の確率分布に基づいて、その重心を「短時間滞留地」(滞留地代表点)として算出し、「短時間滞留地」毎に、
(a)当該基地局位置情報と、(b)当該基地局に対する接続確率と
を対応付けた基地局リストを生成する。ここで、「滞留」に係る情報の収集先を1つの携帯端末2(1ユーザ)に限定した場合、「短時間滞留地」において一定回数以上の接続回数を有する事例が少なくデータ収集に限度が生じるが、複数の携帯端末2(複数ユーザ)から収集すると、一定数の事例を概ね確実に収集することが可能になる。
図15は、複数の携帯端末2から「滞留」に係る情報を収集する様子を示す概略図、及び「短時間滞留地」における滞留地代表点の算出結果を示す表である。また、図16は、短時間滞留地の基地局リストを示す表である。
図15によれば、短時間滞留地として、短時間滞留地1〜3が挙げられている。図16では、例えば短時間滞留地1について、対応する3つの基地局位置情報が挙げられ、各位置情報(基地局)に接続確率が対応付けられている。例えば、短時間滞留地1の位置情報(35.848,139.506)の基地局では接続回数が2であるが、短時間滞留地1での総接続回数が2+2+4=8であるから、接続確率は2/8=0.250となる。
[第2の短時間滞留判定部125]
第2の短時間滞留判定部125(図2)は、取得された通信履歴について、短時間滞留地の基地局リスト(図16)に含まれる基地局が存在する場合、この基地局の基地局位置情報に、この基地局リストで対応している「短時間滞留地」を対応付けた短時間滞留地履歴を生成する。即ち、この基地局識別子を短時間滞留地番号で置き換える。尚、判定に用いる短時間滞留地の基地局リストは、「短時間滞留地」に関して接続確率が所定閾値以上の基地局に限定してもよい。本実施形態では限定しない。
図17は、第2の短時間滞留判定の結果を示す表である。
図17によれば、携帯端末00001は、短時間滞留地1を開示時刻18:21:10から終了時刻18:21:40まで「短時間滞留」し、次に、短時間滞留地2を開示時刻18:28:20から終了時刻18:30:00まで「短時間滞留」し、その後、短時間滞留地3を開示時刻18:33:10から終了時刻18:35:20まで「短時間滞留」したことが理解される。このように、第2の短時間滞留判定結果によれば、携帯端末2が「短時間滞留」した短時間滞留履歴を取得することができる。
[滞在滞留時系列データ生成部126]
滞在滞留時系列データ生成部126(図2)は、携帯端末2毎に、生成された短時間滞留地履歴に基づいて、決定された「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを生成する。尚、開始時刻及び終了時刻を対応付けた「滞在地」データは、滞在判定部122で決定された「滞在地」を入力した基地局情報収集部124が、「滞在地」毎に基地局位置情報を対応付けた基地局リストを生成することによって取得される。
図18は、携帯端末00001及び00002が「滞在」及び「短時間滞留」を行いながら進行する様子を示す概略図、及び生成された滞在滞留時系列データを示す表である。
図18によれば、携帯端末00001について、滞在地1から短時間滞留地1を経て短時間滞留地3に至る経緯が理解される。一方、携帯端末00002についても、短時間滞留地1から短時間滞留地2を経て滞在地2に至る経緯が理解される。また、両携帯端末ともに、短時間滞留地1には開始時刻18:20:00〜終了時刻18:24:59の間滞留しており、例えば、この時刻範囲において同一の駅に滞留していたことが分かる。
[短時間滞留地間遷移モデル構築部127]
短時間滞留地間遷移モデル構築部127(図2)は、図18に示したような滞在滞留時系列データから、所定頻度以上で発生する「短時間滞留地」間遷移パターンを抽出し、抽出した「短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「短時間滞留地」間遷移モデルを構築する。具体的には、「短時間滞留地」の前後に、所定閾値以上の遷移確率で出現する「短時間滞留地」を検出する。
図19は、「短時間滞留地」間遷移モデルを示す表である。
図19では、0.5以上の確率で出現する遷移パターンが抽出されている。ここで、図18に示すように、滞在滞留時系列データは2種類であるので、出現確率0.5以上は、遷移パターンが1種類以上の時系列データに出現することに対応する。さらに、図19では、平均所要時間が遷移パターン毎に対応付けて記録されている。この平均所要時間は、遷移パターン毎に、遷移元「短時間滞留地」における開始時刻及び終了時刻の中間時刻と、遷移先「短時間滞留地」における開始時刻及び終了時刻の中間時刻との差を計算し、その平均をとることによって算出される。
[滞在地・短時間滞留地間遷移モデル構築部128]
滞在地・短時間滞留地間遷移モデル構築部128(図2)は、図18に示したような滞在滞留時系列データから、所定頻度以上で発生する「滞在地・短時間滞留地」間遷移パターンを抽出し、抽出した「滞在地・短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「滞在地・短時間滞留地」間遷移モデルを構築する。具体的には、「滞在地」の前後に、所定閾値以上の遷移確率で出現する「短時間滞留地」を検出する。
図20は、「滞在地・短時間滞留地」間遷移モデルを示す表である。
図20では、0.5以上の確率で出現する遷移パターンが抽出されている。ここでも、図18に示すように、滞在滞留時系列データは2種類であるので、出現確率0.5以上は、遷移パターンが1種類以上の時系列データに出現することに対応する。さらに、図19では、平均所要時間が遷移パターン毎に対応付けて記録されている。この平均所要時間は、遷移パターン毎に、遷移先/元「短時間滞留地」における開始時刻及び終了時刻の中間時刻と、遷移元/先「滞在地」における開始時刻及び終了時刻のうち、この中間時刻により近い方との差を計算し、その平均をとることによって算出される。
[短時間滞留地間遷移モデル構築の実施例]
ここで、短時間滞留地間遷移モデル構築の簡単な実施例を説明する。複数の携帯端末の滞在滞留時系列データについて、所定の時間(例えば5分)以内に短時間滞留地1に続いて別の短時間滞留地2が検出された場合、その遷移を記録し、短時間滞留地1について記録された全遷移におけるその遷移の数に基づいて、短時間滞留地1から短時間滞留地2への遷移確率を算出する。短時間滞留地1に関する遷移確率は合計すると1になる。以下、短時間滞留地としてA〜Gが存在する場合について、短時間滞留地間遷移モデルを構築する。
図21は、短時間滞留地A〜Gについての短時間滞留地間遷移モデルを示す表である。
図21によれば、複数の携帯端末について、短時間滞留地1がAである場合、この短時間滞留地1に続いて検出される短時間滞留地2がBである確率は0.9であり、Eである確率は0.1である。従って、携帯端末は、短時間滞留地Aに続いて90%の確率で短時間滞留地Bに遷移し、残りの10%の場合、短時間滞留地Eに遷移することが理解される。
[滞在地・短時間滞留地間遷移モデル構築の実施例]
次いで、滞在地・短時間滞留地間遷移モデル構築の簡単な実施例を説明する。携帯端末毎の滞在滞留時系列データについて、所定の時間(例えば5分)以内に滞在地1に続いて短時間滞留地2が検出された場合、その遷移を記録し、滞在地1について記録された全遷移におけるその遷移の数に基づいて、滞在地1から短時間滞留地2への遷移確率を算出する。滞在地1からの遷移確率は合計すると1になる。一方、短時間滞留地1から滞在地2への遷移モデルも同様に構築される。この場合、滞在地2への遷移確率は合計すると1になる。以下、滞在地としてα及びβが存在し、短時間滞留地としてA〜Gが存在する場合について、短時間滞留地間遷移モデルを構築する。
図22は、滞在地α及びβ並びに短時間滞留地A〜Gについての滞在地・短時間滞留地間遷移モデルを示す表である。
図22によれば、ある携帯端末について、滞在地1がαである場合、この滞在地1に続いて検出される短時間滞留地2がAである確率は0.9であり、Eである確率は0.1である。従って、携帯端末は、滞在地αに続いて90%の確率で短時間滞留地Aに遷移し、残りの10%の場合、短時間滞留地Eに遷移することが理解される。
一方、ある携帯端末について、遷移先の滞在地2がβである場合、この滞在地2の前に検出される短時間滞留地1がDである確率は0.9であり、Gである確率は0.1である。従って、滞在地βへの遷移元の90%は短時間滞留地Dであり、残りの10%は短時間滞留地Gであることが理解される。
[短時間滞留地補間部131]
短時間滞留地補間部131(図2)は、滞在滞留時系列データ生成部126によって生成された滞在滞留時系列データについて、構築された「短時間滞留地」間遷移モデル(図21)及び「滞在地・短時間滞留地」間遷移モデル(図22)に基づき、時系列データにおいて欠損している「短時間滞留地」を補間する。具体的には、滞在滞留時系列データには存在しないが、時系列に出現している「滞在地」と「短時間滞留地」との間、又は「短時間滞留地」間に高い出現確率で出現し得る「短時間滞留地」があれば、この「短時間滞留地」を補間する。
因みに、このような補間の必要が生じるのは、移動中の携帯端末2がいずれかの基地局3の配下に位置するとしても、電波障害物の存在や通信の混雑・輻輳等によって、必ずしも当該基地局3との接続を確立できるとは限らないためである。携帯端末2と基地局3との間で通信ができなければ、通信記録に基地局位置情報を対応付けた通信履歴(図5)を取得することができず、「滞在地」及び「短時間滞留地」の推定もできなくなる。
ここで、短時間滞留地補間部131は、滞在滞留時系列データにおいて隣接する「短時間滞留地」同士又は隣接する「滞在地」及び「短時間滞留地」が所定時間以上離隔している場合、この「短時間滞留地」同士の間又はこの「滞在地」及び「短時間滞留地」の間に、欠損した「短時間滞留地」が存在すると推定することも好ましい。
また、短時間滞留地補間部131は、時系列において欠損している「短時間滞留地」の候補が複数存在する場合、当該候補を間に含んだ遷移パターンの出現確率に基づく尤度が最も高くなるところの当該候補で補間することも好ましい。
図23は、「短時間滞留地」補間の実施例を説明するための表である。
図23には、「滞在地」及び「短時間滞留地」の遷移パターン1〜5が列挙されている。いずれの遷移パターンも、滞在地αから移動を開始し、複数の短時間滞留地を経て、滞在地βで移動を終了する形となっている。各パターンにつき、隣接する「滞在地」及び「短時間滞留地」並びに隣接する「短時間滞留地」同士において、(所定の時間として)5分以上時間的に離隔している場合、その間に「短時間滞留地」を補完する。
図23に示すように、パターン1では、短時間滞留地Aと短時間滞留地Cとが5分以上離隔しているので、両者の間に1つの短時間滞留地<1>を補間する。ここで、図21の「短時間滞留地」間遷移モデルによれば、AからCへ至る遷移は、
A→B→C
のみである。即ち、Aからの遷移先はB及びEであるが、Cへ遷移する遷移元はBのみである。従って、AとCとの間にはBのみが補間可能である。従って、短時間滞留地<1>として短時間滞留地Bが決定される。
次に、パターン2では、短時間滞留地Bと短時間滞留地Dとが5分以上離隔しているので、両者の間に1つの短時間滞留地<2>を補間する。図21の「短時間滞留地」間遷移モデルによれば、BからDへ至る遷移は、
B→C→D、及びB→F→D
の2つである。ここで、上記の各遷移を採用した遷移パターンの尤度を算出して比較し、より尤度の高い遷移を採用する。本実施例では尤度は、遷移パターンを構成する遷移要素(矢印1つ分)の遷移確率の積として算出される。各遷移要素の遷移確率は、「短時間滞留地」間遷移モデル(図21)及び「滞在地・短時間滞留地」間遷移モデル(図22)で決定された値とする。
B→C→Dを採用した場合の尤度P(B,C,D)は、
(1) P(B,C,D)=P(α,A)・ P(A→B)・P(B→C)・P(C→D)・P(D→β)
となり、B→F→Dを採用した場合の尤度P(B,F,D)は、
(2) P(B,F,D)=P(α,A)・ P(A→B)・P(B→F)・P(F→D)・P(D→β)
となる。ここで、P(X,Y)は、滞在地(短時間滞留地)Xから短時間滞留地(滞在地)Yへの遷移確率である。
式(1)及び(2)の間での違いは、P(B→C)・P(C→D)の部分及びP(B→F)・P(F→D)の部分であるので、これらの部分の値を比較する。
(1a) P(B→C)・P(C→D)=0.5×0.9=0.45
(2a) P(B→F)・P(F→D)=0.5×0.2=0.10
であるので、B→C→Dを採用した遷移パターンの方がより高い尤度を有する。従って、短時間滞留地<2>として短時間滞留地Cが決定される。
次に、パターン3では、AとDとの間に短時間滞留地を補完する。図21の「短時間滞留地」間遷移モデルによれば、Aから短時間滞留地を経てDへ至る遷移は、
A→B→C→D、A→B→F→D、及びA→E→F→D
の3つである。ここでも、上記の各遷移を採用した遷移パターンの尤度を算出して比較し、より尤度の高い遷移を採用する。
A→B→C→D、A→B→F→D及びA→E→F→Dを採用した場合の尤度P(A,B,C,D)、P(A,B,F,D)及びP(A,E,F,D)はそれぞれ、
(3) P(A,B,C,D)=P(α,A)・ P(A→B)・P(B→C)・P(C→D)・P(D→β)
(4) P(A,B,F,D)=P(α,A)・ P(A→B)・P(B→F)・P(F→D)・P(D→β)
(5) P(A,E,F,D)=P(α,A)・ P(A→E)・P(E→F)・P(F→D)・P(D→β)
となる。
式(3)〜(5)の間で異なる部分の値を算出し比較すると、それぞれ、
(3a) P(A→B)・P(B→C)・P(C→D)=0.405
(4a) P(A→B)・P(B→F)・P(F→D)=0.090
(5a) P(A→E)・P(E→F)・P(F→D)=0.020
となるので、A→B→C→Dを採用した遷移パターンが最も高い尤度を有することが分かる。従って、短時間滞留地<3>及び<4>としてそれぞれ短時間滞留地B及びCが決定される。
次に、パターン4では、滞在地αと短時間滞留地Bとが5分以上離隔しているので、両者の間に1つの短時間滞留地<5>を補間する。図22の「滞在地・短時間滞留地」間遷移モデル及び図21の「短時間滞留地」間遷移モデルによれば、αからBへ至る遷移は、
α→A→B
の1つだけである。従って、短時間滞留地<5>として短時間滞留地Aが決定される。
最後に、パターン5では、短時間滞留地Cと滞在地βとが5分以上離隔しているので、Cとβとの間に短時間滞留地<6>を補完する。図22の「滞在地・短時間滞留地」間遷移モデルによれば、Cからβへ至る遷移は、
C→D→β、及びC→G→β
の2つである。ここでも、上記の各遷移を採用した遷移パターンの尤度を算出して比較し、より尤度の高い遷移を採用する。
C→D→β及びC→G→βを採用した場合の尤度P(C,D,β)及びP(C,G,β)はそれぞれ、
(6) P(C,D,β)=P(α,A)・ P(A→B)・P(B→C)・P(C→D)・P(D→β)
(7) P(C,G,β)=P(α,A)・ P(A→B)・P(B→C)・P(C→G)・P(G→β)
となる。
式(6)及び(7)の間で異なる部分の値を算出し比較すると、
(6a) P(C→D)・P(D→β)=0.81
(7a) P(C→G)・P(G→β)=0.01
となるので、C→D→βを採用した遷移パターンがより高い尤度を有することが分かる。従って、短時間滞留地<6>として短時間滞留地Dが決定される。
尚、短時間滞留地補間部131が、滞在滞留時系列データにおいて「短時間滞留地」を補間する必要がないと判断した場合、滞在滞留時系列データ、従って第2の短時間滞留判定の結果(図17)は、そのまま出力される。
[ユーザ検索部]
ユーザ検索部132(図2)は、所定の携帯端末に係る上記の短時間滞留地補間処理後の滞在滞留時系列データと、他の携帯端末に係る短時間滞留地補間処理後の滞在滞留時系列データとの間の最長一致部分系列長に基づいて、この所定の携帯端末の移動経路に類似した移動経路をとる携帯端末を検索する。ここで、最長一致部分系列長は、比較する2つの時系列データにおいて、例えばA→B→C→D→EとA→C→D→E→Fとにおける共通部分C→D→Eのように「短時間滞留地」の時系列が一致する部分の長さと定義される。
具体的に、ユーザ検索部132は、2つの携帯端末2間の類似度を、
(8)(類似度)=
(最長一致部分系列長)/(時系列データのうちの長いほうの系列長)
として算出し、この類似度が所定閾値以上の携帯端末を検索することができる。ここで、分母の(時系列データのうちの長いほうの系列長)とは、2つの携帯端末2に係る補間処理後の滞在滞留時系列データのうちの長いほうの系列長のことである。この(時系列データのうちの長いほうの系列長)で除することによって類似度が正規化される。また、ユーザ検索部132は、ユーザによって指定された検索対象の時間区間のうち、互いに所定時間以上離隔した「滞在地」に対応する時間区間の間となる時間区間について、上記の最長一致部分系列長を調査することも好ましい。
一実施例として、指定された時間区間が18:20〜18:35であって、指定された携帯端末が携帯端末00001であり、この指定された時間区間における携帯端末00001の移動経路に類似した移動経路をとる1または複数のユーザを検索する。この検索においては、携帯端末00001と他のユーザとの類似度を算出し、類似度が所定閾値=0.8以上のユーザを検索する。
以下、図17の第2の短時間滞留判定の結果が上述した補正処理後の結果であるとする。この短時間滞留判定結果によれば、携帯端末00001と携帯端末00002とは、指定時間区間18:20〜18:35における「短時間滞留地」の共通する時系列として、
短時間滞留地1,短時間滞留地2,短時間滞留地3
を有している。従って、(最長一致部分系列長)=3となる。また、携帯端末00001及び携帯端末00002の時系列データ長もともに3なので、(時系列データのうちの長いほうの系列長)=3である。従って、式(8)より、(類似度)=3/3=1を得る。類似度反知恵の所定閾値は0.8であるから、携帯端末00001と携帯端末00002との類似度は、この所定閾値以上である。従って、携帯端末00001のユーザにおける18:20〜18:35の移動経路に類似した移動経路をとるユーザの携帯端末として、携帯端末00002が検索される。
以上、詳細に説明したように、本発明の装置、プログラム及び方法によれば、携帯端末の測位機能に頼ることなく、通信事業者設備によって取得可能な基地局位置情報を用いて、携帯端末を所持したユーザの移動経路に類似した移動経路をとるユーザを検索することができる。ここで、基地局位置情報では一般に、空間的粒度が粗く且つ時間間隔が一定ではないが、このような基地局位置情報を使用しても、ユーザの「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを算出することができる。特に、本発明によれば、携帯端末での測位のための処理負荷を回避しつつ、ユーザの滞在滞留時系列データの情報、更には類似移動経路をとるユーザを推定するための情報を通信事業者側のみで取得することができる。
さらに、本発明によれば、通常発生し得る滞在滞留時系列データにおける欠損の存在にもかかわらず、より高い精度でユーザの移動経路を推定する。その結果、類似移動経路をとるユーザをより確実に検索することが可能となる。
ここで、ユーザの移動経路に類似した移動経路をとるユーザを検索することにより提供されるサービスとして、例えば、携帯端末を所持しており移動経路が互いに類似するユーザ群に対し、その移動経路の周辺情報に即した広告やクーポン等のオンライン情報を配信することができる。これにより、配信情報の広告効果の向上が見込まれる。さらに、移動経路が集中する領域には基地局を増設する等、好適な無線通信ネットワーク設計・構築の際の判断データを提供することができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲内での種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例示であって、何ら制約を意図するものではない。本発明は、特許請求の範囲及びその均等物によってのみ制約される。
1 通信設備装置(類似移動経路ユーザ検索用の装置)
10 通信インタフェース部
111 通信履歴収集部
112 基地局位置情報管理部
113 位置情報履歴蓄積部
12 時系列データ生成部12
121 時間窓分割部
122 滞在判定部
123 第1の短時間滞留判定部
124 基地局情報収集部
125 第2の短時間滞留判定部
126 滞在滞留時系列データ生成部
127 短時間滞留地間遷移モデル構築部
128滞在地・短時間滞留地間遷移モデル構築部
131 短時間滞留地補間部
132 ユーザ検索部
2 携帯端末
3 基地局

Claims (11)

  1. 携帯端末を所持したユーザの移動経路に類似した移動経路をとるユーザを検索する装置であって、
    携帯端末毎に、通信に係る日時刻及び基地局位置情報を対応付けた複数の通信記録を含む通信履歴を蓄積した位置情報履歴蓄積手段と、
    携帯端末毎に、当該通信履歴における第1の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「短時間滞留地」を決定し、該第1の時間窓よりも長い時間幅を有する第2の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「滞在地」を決定し、決定された「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを生成する時系列データ生成手段と、
    当該滞在滞留時系列データから所定頻度以上で発生する「短時間滞留地」間遷移パターンを抽出し、当該「短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「短時間滞留地」間遷移モデルを構築する短時間滞留地間遷移モデル構築手段と、
    当該滞在滞留時系列データから所定頻度以上で発生する「滞在地・短時間滞留地」間遷移パターンを抽出し、当該「滞在地・短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「滞在地・短時間滞留地」間遷移モデルを構築する滞在地・短時間滞留地間遷移モデル構築手段と、
    当該滞在滞留時系列データについて、構築された当該「短時間滞留地」間遷移モデル及び当該「滞在地・短時間滞留地」間遷移モデルに基づいて、時系列において欠損している「短時間滞留地」を補間する短時間滞留地補間手段と、
    所定の携帯端末に係る当該補間処理後の滞在滞留時系列データと、他の携帯端末に係る当該補間処理後の滞在滞留時系列データとの間の最長一致部分系列長に基づいて、前記所定の携帯端末の移動経路に類似した移動経路をとる携帯端末を検索するユーザ検索手段と
    を有することを特徴とする装置。
  2. 前記時系列データ生成手段は、
    当該通信履歴を、当該第1の時間窓と当該第2の時間窓とのそれぞれで分割する時間窓分割手段と、
    当該第1の時間窓毎に、複数の基地局位置情報に基づく位置の確率分布に基づいて「滞留」か否かを判定して、「滞留」と判定された第1の時間窓における位置の確率分布に基づいて「滞留地」を決定し、「滞留」と判定された所定数以下の連続する第1の時間窓に対し、当該滞留の所定時間以上前又は後に異なる「滞留地」を有する第1の時間窓が存在しており、且つ該連続する第1の時間窓の「滞留地」と該異なる「滞留地」とが所定距離以上離隔している場合、該連続する第1の時間窓を「短時間滞留」と判定する第1の短時間滞留判定手段と、
    複数の携帯端末に係る「短時間滞留」と判定された第1の時間窓の「滞留地」の確率分布に基づいて「短時間滞留地」を決定し、「短時間滞留地」毎に当該基地局位置情報を対応付けた基地局リストを生成する基地局情報収集手段と、
    当該通信履歴について、当該基地局リストに含まれる基地局が存在する場合、該基地局の基地局位置情報に、当該基地局リストで対応している「短時間滞留地」を対応付けた短時間滞留地履歴を生成する第2の短時間滞留判定手段と、
    当該第2の時間窓毎に、複数の基地局位置情報に基づく位置の確率分布に基づいて「滞在」か否かを判定し、「滞在」と判定された第2の時間窓における位置の確率分布に基づいて「滞在地」を決定する滞在判定手段と、
    携帯端末毎に、生成された当該短時間滞留地履歴に基づいて、決定された「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを生成する滞在滞留時系列データ生成手段と
    を有することを特徴とする請求項1に記載の装置。
  3. 前記短時間滞留地補間手段は、時系列において欠損している「短時間滞留地」の候補が複数存在する場合、当該候補を間に含んだ遷移パターンの出現確率に基づく尤度が最も高くなるところの当該候補で補間することを特徴とする請求項1又は2に記載の装置。
  4. 前記短時間滞留地補間手段は、当該滞在滞留時系列データにおいて隣接する「短時間滞留地」同士又は隣接する「滞在地」及び「短時間滞留地」が所定時間以上離隔している場合、当該「短時間滞留地」同士の間又は当該「滞在地」及び「短時間滞留地」の間に、欠損している「短時間滞留地」が存在すると推定することを特徴とする請求項1から3のいずれか1項に記載の装置。
  5. 前記ユーザ検索手段は、2つの携帯端末間の類似度を(最長一致部分系列長)/(当該2つの携帯端末に係る補間処理後の滞在滞留時系列データのうちの長いほうの系列長)として、当該類似度が所定閾値以上の携帯端末を検索することを特徴とする請求項1から4のいずれか1項に記載の装置。
  6. 前記ユーザ検索手段は、指定された検索対象の時間区間のうち、互いに所定時間以上離隔した「滞在地」に対応する時間区間の間となる時間区間について最長一致部分系列長を調査することを特徴とする請求項1から5のいずれか1項に記載の装置。
  7. 前記基地局情報収集手段は、「短時間滞留地」毎に、当該基地局の基地局位置情報と、該基地局に対する接続確率とを対応付けた基地局リストを生成し、
    前記第2の短時間滞留判定手段は、当該接続確率が所定値以上である基地局のみを選択して当該短時間滞留地履歴を生成する
    ことを特徴とする請求項2に記載の装置。
  8. 前記時間窓分割手段は、所定地域範囲における短時間滞留の時間長の平均値、最頻値又はN分位点(0≦N≦1)値を、第1の時間窓の時間幅に設定することを特徴とする請求項2又は7に記載の装置。
  9. 広域無線通信網に接続された請求項1から8のいずれか1項に記載の装置である通信設備装置であって、
    基地局識別子及び基地局位置情報を対応付けて記憶する基地局位置情報管理手段と、
    携帯端末を配下に接続させる基地局から、携帯端末毎に通信に係る日時刻と当該基地局の基地局識別子とを対応付けた通信記録を収集する通信履歴収集手段とを更に有し、
    前記位置情報履歴蓄積手段は、当該通信記録について、携帯端末毎に基地局識別子に対応する基地局位置情報を更に対応付けて当該通信履歴を生成する
    ことを特徴とする通信設備装置。
  10. 装置に搭載されたコンピュータを、携帯端末を所持したユーザの移動経路に類似した移動経路をとるユーザを検索するように機能させるプログラムであって、
    携帯端末毎に、通信に係る日時刻及び基地局位置情報を対応付けた複数の通信記録を含む通信履歴を蓄積した位置情報履歴蓄積手段と、
    携帯端末毎に、当該通信履歴における第1の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「短時間滞留地」を決定し、該第1の時間窓よりも長い時間幅を有する第2の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「滞在地」を決定し、決定された「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを生成する時系列データ生成手段と、
    当該滞在滞留時系列データから所定頻度以上で発生する「短時間滞留地」間遷移パターンを抽出し、当該「短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「短時間滞留地」間遷移モデルを構築する短時間滞留地間遷移モデル構築手段と、
    当該滞在滞留時系列データから所定頻度以上で発生する「滞在地・短時間滞留地」間遷移パターンを抽出し、当該「滞在地・短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「滞在地・短時間滞留地」間遷移モデルを構築する滞在地・短時間滞留地間遷移モデル構築手段と、
    当該滞在滞留時系列データについて、構築された当該「短時間滞留地」間遷移モデル及び当該「滞在地・短時間滞留地」間遷移モデルに基づいて、時系列において欠損している「短時間滞留地」を補間する短時間滞留地補間手段と、
    所定の携帯端末に係る当該補間処理後の滞在滞留時系列データと、他の携帯端末に係る当該補間処理後の滞在滞留時系列データとの間の最長一致部分系列長に基づいて、前記所定の携帯端末の移動経路に類似した移動経路をとる携帯端末を検索するユーザ検索手段と
    してコンピュータを機能させることを特徴とするプログラム。
  11. 装置の有するコンピュータにおけるソフトウェアの情報処理によって、携帯端末を所持したユーザの移動経路に類似した移動経路をとるユーザを検索する方法であって、
    前記装置は、携帯端末毎に、通信に係る日時刻及び基地局位置情報を対応付けた複数の通信記録を含む通信履歴を蓄積した位置情報履歴蓄積手段を有し、前記方法は、
    携帯端末毎に、当該通信履歴における第1の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「短時間滞留地」を決定し、該第1の時間窓よりも長い時間幅を有する第2の時間窓での複数の基地局位置情報に基づく位置の確率分布に基づいて「滞在地」を決定し、決定された「滞在地」及び/又は「短時間滞留地」を時系列に並べた滞在滞留時系列データを生成する第1のステップと、
    当該滞在滞留時系列データから所定頻度以上で発生する「短時間滞留地」間遷移パターンを抽出し、当該「短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「短時間滞留地」間遷移モデルを構築する第2のステップと、
    当該滞在滞留時系列データから所定頻度以上で発生する「滞在地・短時間滞留地」間遷移パターンを抽出し、当該「滞在地・短時間滞留地」間遷移パターン毎に、当該遷移パターンの出現確率を対応付けた「滞在地・短時間滞留地」間遷移モデルを構築する第3のステップと、
    当該滞在滞留時系列データについて、構築された当該「短時間滞留地」間遷移モデル及び当該「滞在地・短時間滞留地」間遷移モデルに基づいて、時系列において欠損している「短時間滞留地」を補間する第4のステップと、
    所定の携帯端末に係る当該補間処理後の滞在滞留時系列データと、他の携帯端末に係る当該補間処理後の滞在滞留時系列データとの間の最長一致部分系列長に基づいて、前記所定の携帯端末の移動経路に類似した移動経路をとる携帯端末を検索する第5のステップと
    を有することを特徴とする方法。
JP2013180611A 2013-08-30 2013-08-30 類似移動経路をとるユーザを検索する装置、プログラム及び方法 Active JP6053027B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013180611A JP6053027B2 (ja) 2013-08-30 2013-08-30 類似移動経路をとるユーザを検索する装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013180611A JP6053027B2 (ja) 2013-08-30 2013-08-30 類似移動経路をとるユーザを検索する装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2015049681A JP2015049681A (ja) 2015-03-16
JP6053027B2 true JP6053027B2 (ja) 2016-12-27

Family

ID=52699659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013180611A Active JP6053027B2 (ja) 2013-08-30 2013-08-30 類似移動経路をとるユーザを検索する装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6053027B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106796550B (zh) 2015-07-24 2020-01-17 株式会社日立制作所 信息配送装置以及方法
JP6788961B2 (ja) * 2015-11-11 2020-11-25 チトセ バイオ エボリューション ピーティーイー リミテッド 細胞を分類可能な遺伝子の選出方法
JP6545115B2 (ja) * 2016-03-22 2019-07-17 Kddi株式会社 ユーザの将来期間の生活パターンを予測する生活パターン予測装置、携帯端末、プログラム及び方法
EP3451275B1 (en) 2016-04-27 2020-10-28 Hitachi, Ltd. Information processing device and method
JP6674557B2 (ja) * 2016-11-08 2020-04-01 ヤマハ株式会社 音声再生装置及び音声再生方法
JP6621208B2 (ja) * 2016-12-28 2019-12-18 Kddi株式会社 滞在地間を行き来する双方向交通機関の必要性を推定するプログラム、装置及び方法
WO2020055321A1 (en) * 2018-09-10 2020-03-19 Eureka Analytics Pte. Ltd. Telecommunications data used for lookalike analysis
US10560839B1 (en) * 2019-02-26 2020-02-11 Polaris Wireless, Inc. System and method for mobile alias identification
US10945126B2 (en) 2019-02-26 2021-03-09 Polaris Wireless, Inc. Identifying mobile aliases
JP7501276B2 (ja) 2020-09-24 2024-06-18 株式会社Jvcケンウッド 情報処理装置、情報処理方法、およびプログラム
JP7501275B2 (ja) 2020-09-24 2024-06-18 株式会社Jvcケンウッド 情報処理装置、情報処理方法、およびプログラム
KR102634331B1 (ko) * 2021-12-15 2024-02-07 재단법인 서울연구원 통신데이터 위치정보에 미분기법을 적용한 효과적인 체류정보 추출 방법 및 장치
WO2024047949A1 (ja) * 2022-08-30 2024-03-07 株式会社Nttドコモ 滞在poi推定装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5523274B2 (ja) * 2010-10-12 2014-06-18 Kddi株式会社 携帯端末を所持したユーザの有意圏を推定する装置、プログラム及び方法
JP5421307B2 (ja) * 2011-02-21 2014-02-19 日本電信電話株式会社 行動予測装置、行動予測方法及び行動予測プログラム

Also Published As

Publication number Publication date
JP2015049681A (ja) 2015-03-16

Similar Documents

Publication Publication Date Title
JP6053027B2 (ja) 類似移動経路をとるユーザを検索する装置、プログラム及び方法
Lv et al. Big data driven hidden Markov model based individual mobility prediction at points of interest
US20160227367A1 (en) Method of providing positioning data to mobile device
CN106778876B (zh) 基于移动用户轨迹相似性的用户分类方法和系统
US9743237B2 (en) Method and apparatus for predicting mobility based on relative mobile characteristics
JP6052806B2 (ja) 携帯端末を所持したユーザの滞在目的を推定する装置、プログラム及び方法
JP5410462B2 (ja) 行動及び属性推定装置及び方法及びプログラム
JP6049186B2 (ja) 携帯端末を所持したユーザの滞在地を推定する装置、プログラム及び方法
CN106294534B (zh) 一种用户兴趣匹配推送系统及用户兴趣匹配推送方法
CN102047697A (zh) 用于基于周期性位置锁定生成用户简档的方法和装置
CN105307112A (zh) 分析获取用户移动轨迹的方法和系统
JP6634511B2 (ja) 人口推定装置、プログラム及び人口推定方法
JP6169022B2 (ja) 携帯端末を所持したユーザの滞在地を推定する装置、プログラム及び方法
JP6075725B2 (ja) 携帯端末を所持したユーザが搭乗する移動対象物を推定する装置、プログラム及び方法
JP5986028B2 (ja) 携帯端末を所持したユーザの短時間滞留地を推定する装置、プログラム及び方法
JP6223302B2 (ja) 携帯端末を所持したユーザの滞在判定が可能な装置、プログラム及び方法
JP5364557B2 (ja) 滞在地推定装置、方法及びプログラム
JP2017091435A (ja) 滞在場所予測装置
Yadav et al. Placemap: Discovering human places of interest using low-energy location interfaces on mobile phones
JP6676408B2 (ja) 人物移動予測システム
JP6433059B2 (ja) 通信レコードに基づき移動端末を測位する装置、プログラム及び方法
JP6396811B2 (ja) 通信履歴から使用路線を推定する装置、プログラム及び方法
AU2016433153B2 (en) Estimated user location from cellular telephony data
KR101138606B1 (ko) 과금 데이터를 이용한 위치 기반 서비스 제공 방법, 위치기반 서비스 시스템 및 서비스 데이터 제공 서버
JP6369943B2 (ja) 複数の推定用距離を用いて移動速度を推定する装置、プログラム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161125

R150 Certificate of patent or registration of utility model

Ref document number: 6053027

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150