JP2013138417A - 情報分析装置および情報分析方法 - Google Patents

情報分析装置および情報分析方法 Download PDF

Info

Publication number
JP2013138417A
JP2013138417A JP2012262923A JP2012262923A JP2013138417A JP 2013138417 A JP2013138417 A JP 2013138417A JP 2012262923 A JP2012262923 A JP 2012262923A JP 2012262923 A JP2012262923 A JP 2012262923A JP 2013138417 A JP2013138417 A JP 2013138417A
Authority
JP
Japan
Prior art keywords
mobile device
coefficient
information
feature amount
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012262923A
Other languages
English (en)
Inventor
Tomohiro Nagata
智大 永田
Masayuki Terada
雅之 寺田
Toru Odawara
亨 小田原
Ichiro Okajima
一郎 岡島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2012262923A priority Critical patent/JP2013138417A/ja
Publication of JP2013138417A publication Critical patent/JP2013138417A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】位置情報を用いて端末数を推計する際に、受信間隔の変動が与える影響を校正しつつ端末数を精度良く推計しつつ、正確な帰宅困難者数を算出すること。
【解決手段】距離算出部106は、ユーザ識別子突合データにおける、住所地と現在地とに基づいた位置間の距離を、各移動機の位置ごとに算出し、帰宅困難者係数導出部107は、算出された距離に応じた係数を導出する。そして、データ補正部108は、ユーザ識別子突合データにおける各移動機の位置ごとに、導出された係数を、ユーザ識別子突合データに記述されている特徴量に乗算して得られた係数反映済み特徴量を含んだ補正済みのデータベースである帰宅困難者データテーブルを生成し、端末数推計部109は、この帰宅困難者データテーブルに基づいて、所定単位ごとに、係数反映済み特徴量を合算することで、移動機の端末数を推計する。
【選択図】図1

Description

本発明は、移動機加入者の位置情報に基づいて災害時の非難状況を分析する情報分析装置および情報分析方法に関する。
特許文献1には、災害などで自宅までの帰宅が困難者の数である帰宅困難者数をより正確に算出する技術が記載されている。具体的には、特許文献1に記載の情報分析装置は、観測対象となる集計エリアに在圏する各ユーザの住所とその集計エリアとの帰宅距離を求め、集計エリアごとに、帰宅距離ごとに分計した人口を求める。そして、その人口に帰宅距離に応じて定められた係数を掛けることにより、帰宅困難者数を算出する。
国際公開2011/055601号
ところが、上記特許文献1では、移動機の位置登録信号等に基づいた位置情報を取得する必要があるが、この位置情報から端末数を正しく推計することは容易ではない。これは、位置登録信号やGPS情報等の端末の位置情報は常時携帯電話ネットワークに送信されるわけではなく、ある程度の時間間隔をおいて送信されること、および送信の時間間隔が一定でないことに起因する。
例えば、位置情報として位置登録信号を用いて端末数を推計することを考える。もし位置登録信号が完全に周期的に送信されると仮定できるのであれば、あるセクタである定められた観測時間内に受信される位置登録信号の数は、セクタ内の端末数に比例する。しかし実際には、位置登録信号は、例えば携帯電話内のタイマによって周期的に送信されることを基本とするものの、ある特定の基地局セクタ間を跨がる契機によってタイマの状態にかかわらず位置登録信号の送信が行われたり、通話や圏外等の影響により送信が遅延されることもある。また、GPS情報についても同様に、圏外や端末の操作等様々な影響により送受信の周期は一定しない。
また、位置情報として位置登録信号とGPS情報とを併用することを考える。この場合、端末数推計に利用できる情報量が増加するため、より精度が高い端末数推計が可能になると期待できる。しかしこの場合、両情報を併せた位置情報の送受信頻度はそれぞれ単独に用いる場合に比べてランダムさがさらに増すこととなり、送受信の周期を一定と仮定して端末数を推計してしまうと、逆に推計精度が悪化することが懸念される。
そのため、端末数を精度良く推計するためには、受信信号の数を単に数えるだけでなく、受信信号の受信間隔の変動を考慮する必要がある。
本発明は、上記に鑑みてなされたもので、位置情報を用いて端末数を推計する際に、受信間隔の変動が与える影響を校正しつつ端末数を精度良く推計しつつ、正確な帰宅困難者数を算出することができる情報分析装置および情報分析方法を提供することを目的とする。
上述の課題を解決するために、本発明の情報分析装置は、各移動機の位置に基づいて各移動機の時間的な存在割合を示した特徴量を、当該位置に基づく所定エリアごとに算出する特徴量算出手段と、前記各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断する判断手段と、前記判断手段により判断された行政区界情報に基づいて、前記移動機のユーザの住所地との距離を算出する距離算出手段と、前記距離算出手段により算出された距離に応じた係数を導出する係数導出手段と、前記特徴量算出手段により算出された特徴量と、前記係数導出手段により導出された係数とに基づいて、移動機の端末数を推計する推計手段と、を備えている。
また、本発明の情報分析方法は、各移動機の位置に基づいて各移動機の時間的な存在割合を示した特徴量を、当該位置に基づく所定エリアごとに算出する特徴量算出ステップと、各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断する判断ステップと、前記判断ステップにより判断された行政区界情報に基づいて、前記移動機のユーザの住所地との距離を算出する距離算出ステップと、前記距離算出ステップにより算出された距離に応じた係数を導出する係数導出ステップと、前記特徴量算出ステップにより算出された特徴量と、前記係数導出ステップにより導出された係数とに基づいて、移動機の端末数を推計する推計ステップと、を備えている。
この発明によれば、各移動機の位置に基づいて各移動機の時間的な存在割合を示した特徴量を算出する。そして、各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断し、判断された行政区界情報に基づいて、前記ユーザ識別子のユーザの住所地との距離を算出する。算出された距離に応じた係数を導出し、算出された特徴量と、導出された係数とに基づいて、所定単位で、係数反映済み特徴量を合算することで、移動機の端末数を推計する。これにより、位置情報を用いて端末数を推計する際に、受信間隔の変動が与える影響を校正しつつ端末数を精度良く推計しつつ、正確な帰宅困難者数を算出することができる。
具体的には、本発明の情報分析装置は、前記特徴量算出手段により算出された特徴量に対して、前記係数導出手段により導出された、当該特徴量の距離に応じた係数を乗算することにより、係数反映済み特徴量を算出する補正手段をさらに備え、前記推計手段は、前記補正手段により算出された係数反映済み特徴量に基づいて、所定単位で、移動機の端末数を推計する。
さらに具体的には、本発明の情報分析装置において、前記補正手段は、位置ごとに対応付けられた特徴量に、係数を乗算することで、各移動機における位置ごとの係数反映済み特徴量を算出するようにしてもよく、また、本発明の情報分析装置において、前記補正手段は、係数を同じにする、前記距離算出手段により算出された距離ごとに合算した特徴量に対して、当該係数を乗算することで、距離毎における係数反映済み特徴量を算出するようにしてもよい。
また、前記所定エリアは、前記各移動機の位置に対応するセクタであり、前記推計手段は、前記特徴量算出手段により算出された前記セクタごとの特徴量と、前記係数導出手段により導出された係数とに基づいて、移動機の端末数を推計するようにしてもよい。また、前記所定エリアは、前記各移動機の位置であり、前記推計手段は、前記特徴量算出手段により算出された前記各移動機の位置ごとの前記特徴量と、前記係数導出手段により導出された前記係数とに基づいて、移動機の端末数を推計するようにしてもよい。更に、前記推計手段は、前記特徴量算出手段により算出された前記特徴量と、前記移動機のユーザの住所地と、前記係数導出手段により導出された前記係数とに基づいて、移動機の端末数を推計するようにしてもよい。
また、本発明の情報分析装置は、各移動機の位置に基づいて、各移動機の時間的な存在割合を示した特徴量を算出する特徴量算出手段と、前記特徴量算出手段により算出された各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断する判断手段と、前記判断手段により判断された行政区界情報に基づいて、前記移動機のユーザの住所地との距離を算出する距離算出手段と、前記距離算出手段により算出された距離に応じた係数を導出する係数導出手段と、前記特徴量算出手段により算出された特徴量を含んだ、前記各移動機の位置ごとに区別されている各ユーザレコードを、前記係数導出手段により導出された係数に基づいて定められた割合で、間引く処理を行う間引き処理手段と、前記間引き処理手段により間引かれて残ったユーザレコードにおける特徴量を、所定単位で合算することにより、移動機の端末数を推計する推計手段と、を備えている。
また、本発明の情報分析方法は、各移動機の位置に基づいて、各移動機の時間的な存在割合を示した特徴量を算出する特徴量算出ステップと、前記特徴量算出ステップにより算出された各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断する判断ステップと、前記判断ステップにより判断された行政区界情報に基づいて、前記識別子のユーザの住所地との距離を算出する距離算出ステップと、前記距離算出ステップにより算出された距離に応じた係数を導出する係数導出ステップと、前記特徴量算出ステップにより算出された特徴量を含んだ、前記各移動機の位置ごとに区別されている各ユーザレコードを、前記係数導出ステップにより導出された係数に基づいて定められた割合で、間引く処理を行う間引き処理ステップと、前記間引き処理ステップにより間引かれて残ったユーザレコードにおける特徴量を、所定単位で合算することにより、移動機の端末数を推計する推計ステップと、を備えている。
この発明によれば、各移動機の位置に基づいて、各移動機の時間的な存在割合を示した特徴量を算出する。そして、算出された各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断し、判断された行政区界情報に基づいて、前記ユーザ識別子のユーザの住所地との距離を算出する。算出された距離に応じた係数を導出し、記憶されている各移動機を区別するための識別子および当該各移動機の位置ごとに区別されている各ユーザレコードを、導出された係数に基づいて定められた割合で、間引く処理を行う。間引かれて残ったユーザレコードにおける特徴量を、所定単位で合算することにより、移動機の端末数を推計する。これにより、位置情報を用いて端末数を推計する際に、受信間隔の変動が与える影響を校正しつつ端末数を精度良く推計しつつ、正確な帰宅困難者数を算出することができる。
また、本発明の情報分析装置において、前記特徴量算出手段は、移動機を識別する識別情報と、前記移動機の位置に関する位置情報と、前記位置情報が取得された位置取得時刻情報と、を含む位置データを取得する位置データ取得手段と、ある第1の位置データについて、当該第1の位置データと同一の識別情報を含む位置データのうち、当該第1の位置データの直前の位置データである第2の位置データの位置取得時刻情報、および当該第1の位置データの直後の位置データである第3の位置データの位置取得時刻情報を取得する前後位置データ取得手段と、前記第1の位置データの位置取得時刻情報、前記第2の位置データの位置取得時刻情報および前記第3の位置データの位置取得時刻情報のうち2つ以上に基づいて、前記第1の位置データについての特徴量を計算する計算手段と、から構成される。
この発明によれば、位置情報を用いて端末数を推計する際に、受信間隔の変動が与える影響を校正しつつ端末数を精度良く推計することができる。
本発明によれば、位置情報を用いて端末数を推計する際に、受信間隔の変動が与える影響を校正しつつ端末数を精度良く推計しつつ、正確な帰宅困難者数を算出することができる。
第一の実施形態の情報分析装置100の機能構成を示すブロック図である。 情報分析装置100のハードウェア構成図である。 位置情報記憶部101が記憶する位置データテーブルの具体例を示す説明図である。 加入者情報管理テーブルを示す図である。 行政区界コードのエリアテーブルを示す図である。 ユーザ識別子突合データを記述したユーザ識別子突合データテーブルの具体例を示す図である。 帰宅困難者データテーブルの具体例を示す図である。 情報分析装置100の処理を示すフローチャートである。 端末数推計の考え方を説明するための図である。 端末数推計に係る計算方法を説明するための図である。 特徴量の計算処理を示すフローチャートである。 変形例における情報分析装置100aの機能構成を示すブロック図である。 基地局情報記憶部102aが記憶するデータを示す図である。 セクタ・行政区界突合部102bが記憶するデータを示す図である。 第二の実施形態における情報分析装置100bの機能構成を示すブロック図である。 第二の実施形態におけるユーザ識別子突合データを説明する説明図である。 情報分析装置100bの処理を示すフローチャートである。 第三の実施形態の情報分析装置100cの機能構成を示すブロック図である。 位置情報合算部103aに入力されるデータのフォーマットを示す図である。 位置情報合算テーブルの第一例を示す図である。 位置情報合算テーブルの第二例を示す図である。 位置情報合算テーブルの第三例を示す図である。 位置情報合算テーブルの第四例を示す図である。 情報分析装置100cの処理を示すフローチャートである。 第四の実施形態の情報分析装置100dの機能構成を示すブロック図である。 面積比突合データの第一例を示す図である。 面積比突合データの第二例を示す図である。 面積比突合データの第三例を示す図である。 行政区界面積比突合データテーブルの具体例を示す図である。 行政区界別合算特徴量データの具体例を示す図である。 情報分析装置100dの処理を示すフローチャートである。
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
[第一の実施形態]
図1は、第一の実施形態の情報分析装置100の機能構成を示すブロック図である。図1に示されているとおり、情報分析装置100は、位置情報記憶部101、行政区界情報記憶部102、特徴量算出部103(特徴量算出手段)、加入者情報記憶部104、行政区界突合部105(判断手段)、距離算出部106(距離算出手段)、帰宅困難者係数導出部107(係数導出手段)、データ補正部108(補正手段)、および端末数推計部109(推計手段)を含んで構成されている。
この情報分析装置100は、CPU等を含んだハードウェアにより実現されるものであり、例えば、図2に示されるハードウェア構成により実現される。図2は、情報分析装置100のハードウェア構成図である。図1に示される情報分析装置100は、物理的には、図2に示すように、CPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスクまたは半導体メモリ等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図1において説明した各機能は、図2に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図1に示す機能ブロックに基づいて、各機能ブロックを説明する。
位置情報記憶部101は、複数のユーザ(移動機)についての複数の時刻にわたる位置データを保存している。例えば、図3は、位置情報記憶部101が記憶する位置データテーブルの具体例を示す説明図である。図3に示されるように、この位置データテーブルには、ユーザ識別子ごとに位置データ(x,y)およびその取得時刻(t)が対応付けて、その移動遷移が分かるように複数の位置データが記述されている。なお、この位置データテーブルには、更に遅延量が対応付けて記述されていてもよい。遅延量は、各移動機と基地局との間の通信において発生する通信遅延の大きさを示す指標である。遅延量は、セクタ識別子(各移動機の現在位置のセクタのセクタ識別子)と併せて用いることにより、当該セクタを更に分割した分割エリアを特定可能である。
この位置情報記憶部101に記憶される位置データは、移動機の位置登録信号による位置登録処理に基づいた位置データである場合には、HLR(Home Location Register)などの交換機から取得されるものである。また、各移動機においてGPSによる位置測位を行うものにおいても、交換機等を介して取得され記憶されてもよい。
行政区界情報記憶部102は、基礎自治体などの行政単位である市区町村などの行政区界のエリア範囲を特定するためのポリゴン情報と、市区町村等の識別コードである行政区界コードとの対応付けを記述するエリアテーブルを記憶する部分である。図5は、そのエリアテーブルの具体例である。図5に示すように、エリアテーブルは、行政区界コードと、そのエリア範囲を特定するためのポリゴン情報(そのエリアの位置を特定する情報を含む)とを対応付けて記述している。なお、ポリゴン情報は、複数組の緯度・経度で表現される情報であって、例えば四角形のポリゴンを表現するには、4組の緯度・経度で表現される。
特徴量算出部103は、位置情報記憶部101に記憶されている位置データテーブルに基づいて、指定された観測期間およびエリアごとにおける各移動機の時間的な存在割合を示した特徴量を算出する部分であり、位置単位(例えば位置登録信号単位や、GPS信号単位)に特徴量を算出することができる。また、特徴量算出部103は、各移動機の位置に基づく所定エリア単位(例えば各移動機の位置に対応するセクタ単位等)に特徴量を算出することもできる。この特徴量算出部103は、日本全国の位置情報に基づいて一括で、各位置における特徴量を算出する。具体的な、特徴量の算出方法については、後述する。
加入者情報記憶部104は、加入者情報管理テーブルを記憶する部分であり、HLR・交換機等から取得される情報に基づいた情報を記憶する部分である。この具体例について図4に示す。図4は、加入者情報管理テーブルを示す図である。この加入者情報管理テーブルは、ユーザ識別子と、現在位置のセクタのセクタ識別子、その概略位置情報(緯度・経度)、およびユーザの住所を示す住所コードを対応付けて記述している。この加入者情報管理テーブルは、ユーザの性別およびユーザの年齢を対応付けて記述してもよい。この住所コードは、移動機の購入時において契約した住所(実際に住んでいる住所や請求書の送付先など)に基づいた情報である。なお、ユーザ識別子を、ハッシュ関数など不可逆な一方向関数を利用して、他の全く異なる識別子に変換することにより、非識別化しておいてもよい。すなわち、ユーザを特定することなく、他のユーザ(移動機)と区別できるような識別子に変換しておいてもよい。この場合、ユーザのプライバシーを保護することができる。
行政区界突合部105は、特徴量算出部103により算出された特徴量と、加入者情報記憶部104に記憶されている加入者情報管理テーブルと、行政区界情報記憶部102に記憶されているエリアテーブルとに従って、ユーザ識別子突合データを生成して記憶する部分である。図6は、ユーザ識別子突合データを記述したユーザ識別子突合データテーブルの具体例を示す。図6に示されるとおり、このユーザ識別子突合データテーブルは、ユーザ識別子、セクタ識別子、特徴量、位置情報(緯度・経度)、ユーザの住所地(住所コードで表現)、および現在地(行政区界コードで表現)を対応付けて記述している。なお、住所コードは、市区町村に加えてさらに番地まで特定可能なコード情報であり、行政区界コードは、市区町村まで特定可能なコード情報である。行政区界コードは、住所コードの上位のコードのみ(市区町村を特定するコード)からなるものである。このユーザ識別子突合データを作成する際、各ユーザ識別子で特定されるユーザの各位置において算出されている特徴量に対して、加入者情報管理テーブルにおける位置情報経度および緯度が追加され、現在地は、位置情報をキーにして抽出され特徴量テーブルに追加されることにより、ユーザ識別子突合データが生成される。すなわち、各移動機における各位置に対応付けて、特徴量、セクタ識別子、住所地、および現在地が対応付けられている。なお、上述の突合の方法は、一例であって、各ユーザにおける各位置の特徴量、住所地、および現在地が対応付けたテーブルを作成できれば、上述の方法に限るものではない。
距離算出部106は、ユーザの現在地を示す行政区界コードとユーザの住所地に基づいた住所コードとのそれぞれに基づくエリア(または位置)との距離を、ユーザ識別子ごとに算出する部分である。ここでは、距離算出部106は、ユーザ識別子突合データに基づいて、ユーザの現在地に基づいた行政区界コードと、ユーザの住所地に基づいた住所コードとに基づいて、現在地と住所地とのエリア間の距離を求める。これは、予めエリア間の対応テーブルを備え、その対応テーブルに基づいて距離を算出する。なお、各エリアの基準位置(例えば、中心地)を予め記憶しておき、その基準位置に基づいてエリアの距離を求めても良いし、エリアの外縁同士の距離を求めるようにしても良い。また、より正確な距離を算出する場合、ユーザの現在地(座標情報、例えば位置登録信号に含まれている緯度・経度)と、住所地の座標とに基づいた距離を算出しても良い。
帰宅困難者係数導出部107は、距離算出部106に基づいて算出された、各移動機の位置ごとに算出された距離に基づいて帰宅困難者係数を導出する部分である。例えば、距離が大きいほど、帰宅困難者係数が大きくなるように設定されており、その距離が10km未満であれば、0.0であるが、10kmであれば0.1、11kmであれば、0.2というように、1km増えるごとに0.1加算され、20km以上では、1.0となるよう設定されている。なお、これら数値は一例であって、これに限るものではない。
ここでは、エリア間の距離と帰宅困難者係数との対応テーブルを備えることにより、距離算出部106により算出された距離に対応する一の帰宅困難者係数を導出し、これを位置情報に結びつけることができる。
データ補正部108は、帰宅困難者係数導出部107により算出された帰宅困難者係数をユーザ識別子突合データの特徴量に乗算することで、補正済みデータベースである帰宅困難者データテーブルを生成する部分である。すなわち、データ補正部108は、図6のユーザ識別子突合データにおける各ユーザ識別子の各位置情報に対応する特徴量のそれぞれに、その位置情報に対応する帰宅困難者係数を乗算する。そして、係数反映済み特徴量を算出し、その算出した係数反映済み特徴量を、ユーザ識別子突合データにおける特徴量に置き換えることで、帰宅困難者データテーブルを生成する。
図7は、帰宅困難者データテーブルの具体例である。この帰宅困難者データテーブルは、上述データ補正部108による処理に基づいて生成されたものであって、ユーザ識別子、セクタ識別子、係数反映済み特徴量、位置情報(緯度・経度)、住所地、および現在地を対応付けたものとなっている。この図7においては、帰宅困難者係数が0.5であるとして図6における特徴量に乗算されて得られた係数反映済み特徴量(帰宅困難者係数0.5×特徴量1.0)が記述されている。
端末数推計部109は、帰宅困難者データテーブルにおいて、所定の条件でソートして、当該条件ごとに係数反映済み特徴量を合算することにより、その所定の条件に基づいたエリアにおける帰宅困難者数を推計する部分である。ここで所定の条件とは、現在地や、住所地、またはセクタ識別子であって、それら条件ごとに帰宅困難者数を推計することができる。
ここで、より正確な人口分布を算出するために、所定の拡大係数を特徴量に乗算することもできる。すなわち、ある行政区界コードに基づいた地域またはその地域を含んだより広域の地域の統計情報(国勢調査などによる人口)を予め保持しておき、その広域の地域における、帰宅困難者係数を乗算する前の特徴量の合計値から求めた端末数と実際の人口との比率として拡大係数を求めておき、この比率を行政区界コードの地域の端末数に乗算することにより、より実数に近い帰宅困難者数を算出することができる。
より具体的には、拡大係数は以下のとおり算出することができる。拡大係数は、一例として、「在圏率と端末の普及率との積(即ち、人口に対する在圏数の比率)」の逆数を用いることができる。ここで「在圏率」とは、契約台数に対する在圏数の比率を意味し、「普及率」とは人口に対する契約台数の比率を意味する。このような拡大係数は、上記の人口推計単位ごとに導出することが望ましいが、必須ではない。
また、拡大係数は、例えば、以下のように特徴量および観測期間長に基づいて推計された端末数(在圏数)を用いて導出してもよい。即ち、位置データから特徴量を求め、特徴量および観測期間長に基づいて、拡大係数算出単位ごとの端末数を集計することでユーザ数ピラミッドデータを得るとともに、統計データ(例えば住民基本台帳など)として予め求められた同じ拡大係数算出単位における人口ピラミッドデータを取得する。そして、ユーザ数ピラミッドデータ及び人口ピラミッドデータにおいて拡大係数算出単位ごとの位置データの取得率(即ち、在圏数/人口)を算出する。ここで得られた「位置データの取得率(即ち、在圏数/人口)」が、前述した「在圏率と端末の普及率との積」に相当する。このようにして得られた「位置データの取得率」の逆数を拡大係数として導出することができる。なお、拡大係数を算出する拡大係数算出単位としては、一例として、住所の都道府県ごと、5才又は10才刻み年齢層ごと、男女ごと、時間帯として1時間ごとなどを採用してもよいし、これらの2つ以上を組み合わせたものを採用してもよい。例えば、拡大係数算出単位を「東京都在住の20才台の男性」とした場合、日本全国における、東京都在住の(即ち、ユーザ属性における住所情報が東京都である)20才台の男性に該当する位置データを抽出して端末数を集計することでユーザ数ピラミッドデータを得るとともに、統計データから東京都在住の20才台の男性に関する人口ピラミッドデータを取得する。なお、上記ユーザ数ピラミッドデータを得る際に、「東京都在住」という条件については、東京都に在圏するユーザの位置データだけを抽出するのではなく、ユーザ属性における住所情報が東京都である位置データを抽出する。そして、ユーザ数ピラミッドデータ及び人口ピラミッドデータから拡大係数算出単位(ここでは東京都在住の20才台の男性)の位置データの取得率(即ち、在圏数/人口)を算出し、得られた「位置データの取得率」の逆数を拡大係数として導出することができる。なお、本願では、拡大係数算出単位と人口推計単位とが等しいものとして説明しているが、これはあくまでも一例であり、これに限られるものではない。
なお、上述の方法では、各移動機の位置ごとの特徴量に対して係数反映済み特徴量を含んだデータベースを生成している。しかしながら、これに限るものではなく、距離毎に特徴量を集計した集計値に対して、距離に応じた帰宅困難者係数を乗算することで、距離ごとの帰宅困難者を推計するようにしても良い。例えば、図6における、各移動機の位置ごとに特徴量が算出されたユーザ識別子突合データテーブルに対して、距離算出部106は、レコードごとに距離を算出して、対応付けする。そして、データ補正部108は、距離が同じまたは距離が所定幅にあるレコードごとに、すなわち帰宅困難者係数を同じにする距離のレコードごとに、その特徴量を集計し、データ補正部108は、その集計した集計値(特徴量の合算値)に対して、距離に応じて導出された帰宅困難者係数を乗算する。端末数推計部109は、集計値に対して帰宅困難者係数が乗算された数値を、そのエリアにおける帰宅困難者の端末数と推計する。これにより、上述と同様に、帰宅困難者数となる端末数を正確に推計することができる。
つぎに、このように構成された情報分析装置100の処理について説明する。図8は、情報分析装置100の処理を示すフローチャートである。
情報分析装置100のオペレータにより、分析処理の開始操作がなされると、特徴量算出部103により、各移動機の位置ごとに特徴量の算出処理が行われる(S101)。なお、特徴量算出部103による特徴量算出処理は、予め行われて特徴量記憶部(図示せず)に記憶しておいても良い。
そして、行政区界突合部105により、ユーザ識別子突合データが生成され(S102)、距離算出部106により、ユーザ識別子突合データの住所地と現在地とのそれぞれの行政区界コードとに基づいて、各移動機の位置ごとに、そのコードに基づいたエリア間の距離が算出される(S103)。
つぎに、帰宅困難者係数導出部107により、ユーザ識別子ごとに帰宅困難者係数が導出され(S105)、データ補正部108により、ユーザ識別子突合データのユーザ識別子ごとの特徴量に、その係数に基づいて定められた帰宅困難者係数が乗算されることで、帰宅困難者データテーブルが生成される(S105)。そして、端末数推計部109により、例えば、現在地における行政区画コードなど、所定の条件で定められた地域別に特徴量が合算され、地域ごとの端末数が帰宅困難者として、推計される(S106)。なお、この端末数に拡大係数を乗算することでより実数に近い数値とすることができる。
ここで、特徴量算出部103による特徴量の算出方法について説明する。特徴量算出部103は、移動機の位置情報を取得する位置データ取得手段、その前後の位置データを取得する前後位置データ取得手段、およびこれら位置データに基づいて特徴量を算出する計算手段から構成されている。以下、この特徴量算出部103の処理について説明する。
位置情報記憶部101に記憶されている各移動機の各位置情報である第1の位置データ(観測対象位置データ)それぞれについての特徴量を計算する。例えば、特徴量算出部103は、第2の位置データの位置取得時刻と第3の位置データの位置取得時刻との差を、当該第1の位置データについての特徴量として計算する。また、特徴量算出部103は、第2の位置データの位置取得時刻が異常値である場合、ここでは一例として第1の位置データの位置取得時刻と第2の位置データの位置取得時刻との差が所定の基準値(例えば1時間)より大きい場合に、第1の位置データの位置取得時刻から予め定められた時間(例えば1時間)だけ過去に遡った時刻を第2の位置データの位置取得時刻として用いて、第1の位置データについての特徴量を計算する。同様に、特徴量算出部103は、第3の位置データの位置取得時刻が異常値である場合、ここでは一例として第1の位置データの位置取得時刻と第3の位置データの位置取得時刻との差が所定の基準値(例えば1時間)より大きい場合に、第1の位置データの位置取得時刻から予め定められた時間(例えば1時間)だけ未来に進めた時刻を第3の位置データの位置取得時刻として用いて、第1の位置データについての特徴量を計算する。このような第2、第3の位置データの位置取得時刻が異常値である場合の処理は、必須の処理ではないが、上記処理を行うことで、移動機が圏外に位置していることや移動機の電源がオフされていること等に起因して位置データの取得時間間隔が異常に長くなった際に、当該異常に長くなった取得時間間隔による影響が過大に出ることを防ぐことができる。
特徴量算出部103は、観測対象位置データについての特徴量および観測開始時刻と観測終了時刻との差である観測期間長に基づいて、観測期間中に観測エリアに在圏した端末数を推計する。詳細は後述するが、特徴量算出部103は、観測対象位置データについての特徴量の総和を観測期間長の2倍によって除して得られた数値を端末数として推計する。
[端末数推計の考え方および計算方法]
次に、端末数推計の考え方および計算方法を説明する。図9に示すモデルのように、ある観測期間(長さT)の間に、n個の端末a,a,…,aがセクタSを通過し、各端末aの観測期間内のセクタSの滞在時間がt(0<t≦T)であったとする。このとき、セクタSに存在する端末数m(実際にはセクタSに存在する端末数mの観測期間内における平均値)は、以下の式(1)で表わされる。
Figure 2013138417

即ち、各端末aの観測期間内のセクタSの滞在時間tの総和を観測期間の長さTで除した結果を、端末数mとして推計する。ただし、端末aの観測期間内のセクタSの滞在時間tの真の値は観測不能であるが、各端末aは信号(例えば位置登録信号)を発信し、それらの信号は観測可能である。
端末aが観測期間内にセクタSで発信した信号を、時刻順に
Figure 2013138417

(xは、端末aが観測期間内にセクタSで発信した信号の総数)とすると、端末数の推計とは、観測された信号qij(jは1以上x以下の整数)からmの値を推計することに他ならない。
さて、図10に基づき端末数推計の計算方法を説明する。端末aから信号qijが送信される密度(即ち、単位時間あたりの信号数)をpとする。このとき、信号が送信される確率がセクタに対して独立であれば、端末aが観測期間内にセクタSで発信した信号の総数xの期待値E(x)は、E(x)=t×pであるため、端末aの観測期間内のセクタSの滞在時間tの期待値E(t)について以下の式(2)が成立する。
E(t)=x/p (2)
ここで、信号qijの送信時刻をuijとしたとき、信号qijの密度pijは、以下の式(3)で与えられる。
ij=2/(ui(j+1)−ui(j−1)) (3)
ここで、信号qijを第1の位置データに係る信号とすると、信号qi(j-1)は第2の位置データに係る信号、信号qi(j+1)は第3の位置データに係る信号に相当する。本実施形態では、第2の位置データに係る信号qi(j-1)の送信時刻ui(j−1)と第3の位置データに係る信号qi(j+1)の送信時刻ui(j+1)の差、即ち、上記式(3)の(ui(j+1)−ui(j−1))を、第1の位置データについての特徴量wijとする。そのため、上記式(3)は、以下となる。即ち、特徴量wijは、密度pijの逆数に対応づけて算出することができる。
ij=2/(ui(j+1)−ui(j−1))=2/wij (4)
このとき密度pは、
Figure 2013138417

で与えられるため、端末数mの推計値E(m)は以下の式(6)で計算することができる。
Figure 2013138417
図10の例に示すように、観測期間内であり且つ端末aがセクタSに滞在していた期間内に、端末aは信号qi1、qi2、qi3を送信し、信号qi1の直前に信号qi0を、信号qi3の直後に信号qi4を送信したものとし、信号qi0、qi1、qi2、qi3、qi4の送信時刻をそれぞれui0、ui1、ui2、ui3、ui4とすると、上記の考え方は、端末aの観測期間内のセクタSの滞在時間tを、(ui0とui1の中点)から(ui3とui4の中点)までの期間と推計することに相当する。なお、端末aは、観測期間内ではないものの、セクタSへの滞在中に信号qi4を送信している。但し、滞在時間tの推計量の不偏性を維持するために、ここでは一例として、滞在時間tの終了時刻を観測期間Tの終了時刻と同じとして推計することは行わない処理を説明する。
ここで、特徴量算出部103が、第1の位置データについての特徴量を計算する際における、その処理内容について、図11を用いて説明する。ここでは、第1、第2、第3の位置データの位置取得時刻を、それぞれt1、t2、t3とする。また、第2の位置データの位置取得時刻t2が異常値であると判断するための基準となる所定の基準値(第1、第2の位置データの位置取得時刻の差に関する基準値)を基準値A(例えば1時間)とし、第3の位置データの位置取得時刻t3が異常値であると判断するための基準となる所定の基準値(第1、第3の位置データの位置取得時刻の差に関する基準値)を基準値B(例えば1時間)とする。
特徴量算出部103は、第1、第2の位置データの位置取得時刻の差(即ち、時刻t1とt2の差)Da、および第1、第3の位置データの位置取得時刻の差(即ち、時刻t1とt3の差)Dbを算出する(図11のステップS11)。そして、特徴量算出部103は、第1、第2の位置データの位置取得時刻の差Daが所定の基準値A(例えば1時間)より大きいか否かを判断し(ステップS12)、もし、差Daが基準値Aより大きければ、第1の位置データの位置取得時刻t1から予め定められた時間(例えば1時間)だけ過去に遡った時刻を、第2の位置データの位置取得時刻t2とする(ステップS13)。次に、特徴量算出部103は、第1、第3の位置データの位置取得時刻の差Dbが所定の基準値B(例えば1時間)より大きいか否かを判断し(ステップS14)、もし、差Dbが基準値Bより大きければ、第1の位置データの位置取得時刻t1から予め定められた時間(例えば1時間)だけ未来に進めた時刻を、第3の位置データの位置取得時刻t3とする(ステップS15)。そして、特徴量算出部103は、第2の位置データの位置取得時刻t2と第3の位置データの位置取得時刻t3との差を、第1の位置データについての特徴量として計算する(ステップS16)。以上により、ある1つの観測対象位置データ(第1の位置データ)についてのステップS4、S5の処理が完了する。
つぎに、特徴量に関する変形例を述べる。前述した実施形態においては、特徴量を求める対象の位置データ(第1の位置データ)の前後の位置データの時間差(第2の位置データと第3の位置データとの時間差)を、第1の位置データの特徴量として算出する例を示した。これを式で表すと、特徴量は、以下の式(7)で表すことができる。なお、以下の式(7)は、前述した式(4)を変形しただけであり、式(4)と等価である(即ち、式(4)の考え方を変更したものではない)。
ij=ui(j+1)−ui(j−1) (7)
本変形例は、特徴量算出部103において算出される特徴量の算出方法の別のバリエーションを示すものである。
本変形例では、特徴量算出部103は、上記の第1の位置データの特徴量を求める場合、第2の位置データ及び第3の位置データについての種別情報(例えば後述する位置データの生成要因(生成タイミング))を考慮する。具体的には、特徴量算出部103は、第3の位置データと第1の位置データとの時間差に対し、第3の位置データの種別情報(ここでは生成要因)に対応する補正係数αを乗算した値を算出するとともに、第1の位置データと第2の位置データとの時間差に対し、第2の位置データの種別情報(ここでは生成要因)に対応する補正係数βを乗算した値を算出する。ただし、上記以外に、特徴量算出部103は、第1の位置データの種別情報に応じて補正係数α又はβを定めても良いし、また、第1および第2の位置データの種別情報に応じて補正係数βを定めても、第1および第3の位置データの種別情報に応じて補正係数αを定めてもよい。そして、特徴量算出部103は、これらの乗算で得られた値を合算した値を第1の位置データの特徴量とする。特徴量算出部103における特徴量の算出処理を式で表すと、以下の式(8)で表される。
ij=α(ui(j+1)−uij)+β(uij−ui(j−1)) (8)
第2の位置データ及び第3の位置データについての種別情報としては、例えば、位置データが位置登録情報である場合、当該位置登録情報の生成要因に関する情報が挙げられ、この生成要因に関する情報は、生成された位置登録情報に含まれている。位置登録情報の生成要因としては、端末が位置登録エリア(Location Area)境界を跨いだこと、周期的に行われる位置登録に基づき生成されたこと、端末の電源オン等によるアタッチ処理の実行、端末の電源オフ等によるデタッチ処理の実行などが挙げられ、これらの生成要因に対応して、補正係数αおよびβの設定値を予め定めておく。そして、特徴量算出部103は、第3の位置データの生成要因に関する情報に応じて第3の位置データについての補正係数αを設定し、第2の位置データの生成要因に関する情報に応じて第2の位置データについての補正係数βを設定すればよい。なお、補正係数α、βはともに、0以上2以下の値に予め定めておいてもよい。但し、この数値範囲は必須ではない。
例えば、周期的に行われる位置登録に基づく位置登録情報のように端末の位置と位置登録情報の生成契機とが無関係である位置登録情報の場合は、現在のセクタに滞在していた時間の期待値は、当該位置登録情報の生成の前後で同じと考えられる。一方、位置登録エリア境界を端末が跨いだことで生成された位置登録情報の場合、少なくとも当該位置登録情報が生成される前は、端末は現在のセクタに滞在していなかったと判断できる。そのため、当該位置登録情報が生成される前に端末が現在のセクタに滞在していた時間を0と考え、第1の位置データの種別情報(生成要因)が「位置登録エリア境界跨り」であれば、上記式(8)における補正係数β(即ち、直前の位置データとの時間差に関する補正係数β)を0に設定することができる。これにより、より実態に即した特徴量を算出できる。
このように、特徴量算出部103は、対象の位置データ(第1の位置データ)についての特徴量を算出する場合、第1の位置データの前後の位置データである第2及び第3の位置データについての種別情報(一例として位置データの生成要因)に応じて、第2の位置データと第3の位置データとの時間差を補正し、補正した時間差を用いて特徴量を算出する。これにより、位置データの種別情報に基づいて特徴量をより精度よく算出することができる。
つぎに、本実施形態の変形例である情報分析装置100aについて説明する。図12は、変形例における情報分析装置100aの機能構成を示すブロック図である。図12に示されるとおり、この情報分析装置100aは、位置情報記憶部101、行政区界情報記憶部102、基地局情報記憶部102a、セクタ・行政区界突合部102b、特徴量算出部103、加入者情報記憶部104、行政区界突合部105、距離算出部106、帰宅困難者係数導出部107、データ補正部108、および端末数推計部109を含んで構成されている。
この変形例の情報分析装置100aにおいては、基地局情報記憶部102aおよびセクタ・行政区界突合部102bを備えている点で、本実施形態の情報分析装置100と異なっている。以下、この相違点について説明する。
基地局情報記憶部102aは、セクタ識別子と、その中心位置となる座標情報(緯度・経度)とを対応付けて記憶する部分である。図13は、その具体的な内容であり、セクタ識別子と、セクタ中心緯度および経度とが対応付けて記憶されている。図13において、N/Aは、情報がないことを示している。なお、基地局情報記憶部102aは、必ずしも必須ではなく、後述するセクタ・行政区界突合部102bにおいて生成する情報である、セクタ識別子と行政区界情報とを対応付け情報を、予め記憶しておいてもよい。
セクタ・行政区界突合部102bは、基地局情報記憶部102aに記憶されている情報と、行政区界情報記憶部102に記憶されているエリアテーブルとから、セクタ識別子突合データを生成する部分である。例えば、セクタの座標情報に基づくセクタ中心座標がポリゴンに含まれるか否かで、行政区界にいることを判断して生成する。図14は、その具体的な内容であり、セクタ識別子と、行政区界コードとを対応付けたセクタ識別子突合データの具体例を示している。
行政区界突合部105は、ここで生成されたセクタ識別子突合データを用いて、ユーザ識別子突合データ(図6参照)を生成し、以下、本実施形態と同様に、端末数の推計処理を行う。
この変形例においては、行政区界が、座標情報で決定することができず、セクタ識別子に基づいて行政区界を決定する場合における処理を示したものである。
つぎに、第一の実施形態における情報分析装置100および100aの作用効果について説明する。
この発明によれば、位置情報記憶部101は、各移動機の位置ごとに特徴量を算出するために、その位置情報およびその取得時刻を対応付けて記憶しておき、行政区界情報記憶部102は、行政区界コードとその位置情報とを対応付けて記憶しておき、加入者情報記憶部104は、加入者情報として、ユーザ識別子ごとに、住所地を示す住所コードを少なくとも記憶している。
特徴量算出部103は、各移動機の位置に基づいて、指定された観測期間およびエリアごとにおける各移動機の位置ごとの特徴量を算出する。また、行政区界突合部105は、各移動機を区別するための識別子ごとに、算出された特徴量と、ユーザの住所地と、当該移動機が在圏する現在地を示す行政区界コードとを対応付けたデータベースであるユーザ識別子突合データ(図6参照)を生成して記憶する。
そして、距離算出部106は、ユーザ識別子突合データにおける住所地と現在地との行政区画コードを用いた距離を、各移動機の位置ごとに算出し、帰宅困難者係数導出部107は、算出された距離に応じた係数を導出する。そして、データ補正部108は、ユーザ識別子突合データにおける各移動機の位置ごとに、導出された係数を、ユーザ識別子突合データに記述されている特徴量に乗算して係数反映済み特徴量を算出し、これを含んだ補正済みのデータベースである帰宅困難者データテーブルを生成し、端末数推計部109は、この帰宅困難者データテーブルに基づいて、例えば現在地に基づいた係数反映済み特徴量を合算することで、移動機の端末数を推計する。
これにより、位置情報を用いて端末数を推計する際に、受信間隔の変動が与える影響を校正しつつ端末数を精度良く推計しつつ、正確な帰宅困難者数を算出することができる。
[第二の実施形態]
つぎに、第二の実施形態について説明する。図15は、第二の実施形態の情報分析装置100bの機能構成を示すブロック図である。図15に示されているように、この情報分析装置100bは、位置情報記憶部101、行政区界情報記憶部102、特徴量算出部103、加入者情報記憶部104、行政区界突合部105、距離算出部106、帰宅困難者係数導出部107、間引き処理部108a(間引き処理手段)、および端末数推計部109を含んで構成されている。
第一の実施形態における情報分析装置100とは、データ補正部108に代えて、間引き処理部108aを備えている点で相違する。以下、この相違点を中心にして、情報分析装置100bの構成について説明する。
上述したとおり、情報分析装置100bは、行政区界突合部105が、行政区界情報記憶部102に記憶されているエリアテーブル、特徴量算出部103により算出された特徴量、および加入者情報記憶部104に記憶されている加入者情報テーブルに基づいて、ユーザ識別子突合データを生成する(図6参照)。そして、距離算出部106は、各ユーザ識別子で示されるユーザの住所地と現在地との距離を、住所コードや行政区界コードを利用して算出し、そして帰宅困難者係数導出部107が、距離に応じた帰宅困難者係数を導出して、各移動機の位置ごとに帰宅困難者係数を導出する。
つぎに、本実施形態の特徴部分である間引き処理部108aは、帰宅困難者係数に従って間引き処理を行う。すなわち、ユーザ識別子突合データは、各移動機の位置ごとのデータをユーザレコードとした場合、そのユーザレコードにおいて特徴量を含んだデータであり、間引き処理部108aは、各ユーザコードのうち帰宅困難者係数で示された確率に従ってランダムにユーザレコードを削除する。これにより、帰宅困難の度合いに応じた帰宅困難者数を間引く処理を行うことができ、適正な数値を導出することができる。例えば、帰宅困難者係数が0.6である場合には、40%の確率で、間引き処理部108aは、ユーザレコードを間引く処理を行う。すなわち、帰宅困難者係数が0.6である場合には、そこに在圏する人たちのうち、60%が帰宅困難者であり、40%が帰宅可能な人であるため、100−60=40%という計算に基づいて間引き率を変える処理を行う。
図16にその具体例を示す。図16は、ユーザ識別子突合データを説明する説明図であり、図16(a)は、間引き処理前のユーザ識別子突合データであり、図16(b)は、間引き処理後のユーザ識別子突合データである。
図16(b)に示されるとおり、帰宅困難者係数に従って、例えば、特徴量“0.7”、ユーザ識別子“123456789”、位置“36.1314、136.131”のユーザレコード、および特徴量“0.9”、ユーザ識別子“123456792”、位置“36.1314,136.131”のユーザレコードは、間引き処理部108aにより、間引き処理される。
そして、端末数推計部109は、ユーザレコードが間引かれたユーザ識別子突合データに基づいて、特徴量の合算処理を行うことで、端末数を推計することができる。
つぎに、この情報分析装置100bの処理について説明する。図17は、情報分析装置100bの処理を示すフローチャートである。なお、情報分析装置100の処理と、S101からS104までは同じであり、特徴量に基づいてユーザ識別子突合データが生成され、そして、各地域におけるユーザの住所地での距離が算出され、それに応じた帰宅困難者係数が、各移動機の位置ごとに算出される(S101〜S104)。
そして、間引き処理部108aにより、ユーザ識別子突合データの各ユーザレコードが、帰宅困難者係数に基づいて間引き処理され(S105a)、そして、間引き処理されたユーザ識別子突合データにおいて、現在地の行政区画コードなどに基づいて、各地域ごとの各特徴量を合算することで、各地域における帰宅困難者を示す端末数が推計される(S106)。
このような処理により、帰宅困難者を示す端末数を適切に推計することができる。なお、上述と同様に、第二の実施形態においても、ユーザ識別子を非識別化処理することもできるし、また拡大係数を用いて、より実数に近い帰宅困難者数を算出することができる。
また、上述した第一の実施形態の変形例である情報分析装置100aと同様に、基地局情報記憶部102a、セクタ・行政区界突合部102bを備え、セクタ識別子に基づいて行政区界コードを導出するようにしても良い。
つぎに、第二の実施形態の情報分析装置100bの作用効果について説明する。
この発明によれば、位置情報記憶部101は、各移動機の位置ごとに特徴量を算出するために、その位置情報およびその取得時刻を対応付けて記憶しておき、行政区界情報記憶部102は、行政区界コードとその位置情報とを対応付けて記憶しておき、加入者情報記憶部104は、加入者情報として、ユーザ識別子ごとに、ユーザの住所地の住所コードを少なくとも記憶している。
特徴量算出部103は、各移動機の位置に基づいて、指定された観測期間およびエリアごとにおける各移動機の位置ごとの特徴量を算出する。また、行政区界突合部105は、各移動機の位置ごとに算出された特徴量と、ユーザの住所地と、現在地とを対応付けたデータベースであるユーザ識別子突合データ(図6参照)を生成する。
そして、距離算出部106は、ユーザ識別子突合データにおける、住所地に基づいた位置と現在地に基づいた位置との距離を、各移動機の位置ごとに算出し、帰宅困難者係数導出部107は、算出された距離に応じた帰宅困難者係数を導出する。
そして、間引き処理部108aは、生成されたユーザ識別子突合データにおける各移動機の位置ごとに構成されている各ユーザレコードを、導出された帰宅困難者係数に基づいて定められた割合で、間引く処理を行う。端末数推計部109は、帰宅困難者データテーブルにおいて間引かれて残ったユーザレコードにおける特徴量を、現在地を表す行政区界コードごとに合算することにより、移動機の端末数を推計する。
これにより、位置情報を用いて端末数を推計する際に、受信間隔の変動が与える影響を校正しつつ端末数を精度良く推計しつつ、正確な帰宅困難者数を算出することができる。
[第三の実施形態]
つぎに、第三の実施形態について説明する。図18は、第三の実施形態の情報分析装置100cの機能構成を示すブロック図である。図18に示されるとおり、この情報分析装置100cは、位置情報記憶部101、行政区界情報記憶部102、基地局情報記憶部102a、セクタ・行政区界突合部102b、特徴量算出部103、位置情報合算部103a(特徴量算出手段、判断手段、および推計手段)、加入者情報記憶部104、行政区界突合部105、距離算出部106、帰宅困難者係数導出部107、データ補正部108、および端末数推計部109を含んで構成されている。
この第三の実施形態の情報分析装置100cにおいては、位置情報合算部103aを備えている点で、第一の実施形態の変形例である情報分析装置100aと異なっている。以下、この相違点について説明する。なお、位置情報合算部103aは、位置情報記憶部101及び加入者情報記憶部104のそれぞれからの各種データの受信が可能であり、且つ、行政区界突合部105への各種データの送信が可能である。
位置情報合算部103aは、特徴量算出部103により算出された特徴量と、加入者情報記憶部104に記憶されている加入者情報管理テーブルとに従って、ユーザ識別子突合データを生成した後、このユーザ識別子突合データに基づいて、同一のセクタ(又は、当該セクタよりも狭いエリア、地点等)ごとに特徴量を合算・集計して位置情報合算テーブルに記憶させる部分である。この具体例について図19に示す。図19は、位置情報合算部103aに入力されるデータのフォーマットを示す図である。このフォーマットは、ユーザ識別子、セクタ識別子(各移動機の現在位置のセクタのセクタ識別子)、特徴量、位置情報(緯度・経度)、および遅延量が対応付けられている。遅延量は、各移動機と基地局との間の通信において発生する通信遅延の大きさを示す指標である。遅延量は、セクタ識別子と併せて用いることにより、当該セクタを更に分割した分割エリアを特定可能である。遅延量のフィールドは、位置情報記憶部101に位置データが保存されている時点で存在する。
上記フォーマットのデータが位置情報合算部103aに入力されると、位置情報合算部103aは、ユーザ識別子突合データを生成し、その後、同一のセクタ識別子(例えば「abcdef01」)と対応する複数の特徴量(例えば「1.0」、「0.5」、および「1.5」)を合算することにより、セクタ単位の「合算特徴量」(ここでは「3.0」)を算出して位置情報合算テーブルに記憶させる。なお、位置情報合算部103aは、同一のセクタ識別子且つ同一の遅延量(例えば「234」)と対応する複数の特徴量(例えば「0.5」および「1.5」)を合算することにより、遅延量単位の「合算特徴量」(ここでは「2.0」)を算出して位置情報合算テーブルに記憶させることも可能である。更に、位置情報合算部103aは、同一のセクタ識別子且つ同一の緯度(例えば「36.2」)及び経度(例えば「136.2」)と対応する複数の特徴量(例えば「0.5」および「1.5」)を合算することにより、移動機の位置の緯度及び経度により特定される地点単位の「合算特徴量」(ここでは「2.0」)を算出して位置情報合算テーブルに記憶させることも可能である。
この具体例について図20〜23に示す。図20は、位置情報合算テーブルの第一例を示す図である。この位置情報合算テーブルは、同一のセクタ識別子単位の合算特徴量の算出の結果に基づいて、セクタ識別子および合算特徴量を対応付けて記述している。また、図21は、位置情報合算テーブルの第二例を示す図である。この位置情報合算テーブルは、同一のセクタ識別子且つ同一の遅延量単位の合算特徴量の算出の結果に基づいて、セクタ識別子、遅延量、および合算特徴量を対応付けて記述している。
また、図22は、位置情報合算テーブルの第三例を示す図である。この位置情報合算テーブルは、同一のセクタ識別子且つ同一の緯度・経度単位の合算特徴量の算出の結果に基づいて、セクタ識別子、移動機の位置情報(緯度・経度)、および合算特徴量を対応付けて記述している。また、図23は、位置情報合算テーブルの第四例を示す図である。この位置情報合算テーブルは、同一のセクタ識別子、同一の遅延量、同一の性別、同一の年齢、及び同一の住所地(住所コードで表現)単位の合算特徴量の算出の結果に基づいて、セクタ識別子、ユーザの性別、ユーザの年齢、ユーザの住所地(住所コードで表現)、遅延量、および合算特徴量を対応付けて記述している。なお、位置情報合算部103aは、加入者情報管理テーブル(加入者情報記憶部104)との突合を行うことにより、性別単位、年齢(又は年齢層)単位、住所地(住所コードで表現)単位等での合算が可能になる。
行政区界突合部105は、ここで算出された合算特徴量を用いて、(図6における「特徴量」が「合算特徴量」に置換された)ユーザ識別子突合データを生成して記憶する。そして、第一実施形態の変形例と同様に、距離算出部106及び帰宅困難者係数導出部107による処理が行われる。
次に、データ補正部108が、帰宅困難者係数導出部107により算出された帰宅困難者係数を、ユーザ識別子突合データの「合算特徴量」に乗算することで、補正済みデータベースである帰宅困難者データテーブルを生成する。そして、端末数推計部109が、帰宅困難者データテーブルにおいて、所定の条件でソートして、その所定の条件に基づいたエリアにおける帰宅困難者数を推計する。
この第三の実施形態の情報分析装置100cにおいては、セクタ(又は、当該セクタよりも狭いエリア、地点等)ごとの各特徴量を合算してから帰宅困難者係数を乗算する点で、各特徴量に各帰宅困難者係数を乗算してから合算する情報分析装置100aと異なっている。
つぎに、この情報分析装置100cの処理について説明する。図24は、情報分析装置100cの処理を示すフローチャートである。情報分析装置100cのオペレータにより、分析処理の開始操作がなされると、特徴量算出部103により、各移動機の位置ごとに特徴量の算出処理が行われる(S101)。そして、位置情報合算部103aにより、特徴量算出部103により算出された特徴量と、加入者情報記憶部104に記憶されている加入者情報管理テーブルとに従って、ユーザ識別子突合データが生成される(S102)。そして、位置情報合算部103aにより、同一のセクタ(又は、当該セクタよりも狭いエリア、地点等)ごとの特徴量の合算である合算特徴量が算出されて位置情報合算テーブルに記憶される(S102a)。
そして、行政区界突合部105により、ここで算出された合算特徴量を用いて、(図6における「特徴量」が「合算特徴量」に置換された)ユーザ識別子突合データが生成される。そして、各地域におけるユーザの住所地での距離が算出され、それに応じた帰宅困難者係数が、各移動機の位置ごとに算出される(S103〜S104)。そして、データ補正部108により、帰宅困難者係数が、ユーザ識別子突合データの合算特徴量に乗算される(S105b)。そして、端末数推計部109により、この乗算結果が用いられ、所定の条件でソートされて、その所定の条件に基づいたエリアにおける帰宅困難者を示す端末数が推計される(S106a)。
このような処理により、セクタ(又は、当該セクタよりも狭いエリア、地点等)ごとの帰宅困難者を示す端末数を適切に推計することができる。なお、上述と同様に、第三の実施形態においても、ユーザ識別子を非識別化処理することもできるし、また拡大係数を用いて、より実数に近い帰宅困難者数を算出することができる。
[第四の実施形態]
つぎに、第四の実施形態について説明する。図25は、第四の実施形態の情報分析装置100dの機能構成を示すブロック図である。図25に示されるとおり、この情報分析装置100dは、位置情報記憶部101、行政区界情報記憶部102、基地局情報記憶部102a、セクタ・行政区界面積比算出部102c(特徴量算出手段、判断手段、および推計手段)、行政区界合算部102d(特徴量算出手段、判断手段、および推計手段)、特徴量算出部103、位置情報合算部103a、加入者情報記憶部104、行政区界突合部105、距離算出部106、帰宅困難者係数導出部107、データ補正部108、および端末数推計部109を含んで構成されている。
この第四の実施形態の情報分析装置100dにおいては、行政区界合算部102dを備え、且つ、セクタ・行政区界突合部102bの代わりにセクタ・行政区界面積比算出部102cを備えている点で、第三の実施形態である情報分析装置100cと異なっている。以下、この相違点について説明する。なお、セクタ・行政区界面積比算出部102cは、行政区界情報記憶部102及び基地局情報記憶部102aのそれぞれからの各種データの受信が可能であり、且つ、行政区界合算部102dへの各種データの送信が可能である。また、行政区界合算部102dは、セクタ・行政区界面積比算出部102c及び位置情報合算部103aのそれぞれからの各種データの受信が可能であり、且つ、行政区界突合部105への各種データの送信が可能である。
セクタ・行政区界面積比算出部102cは、基地局情報記憶部102aに記憶されている情報と、行政区界情報記憶部102に記憶されているエリアテーブルとから、面積比突合データを生成して記憶する部分である。例えば、セクタのエリア範囲の面積を100とした場合における、当該セクタのエリア範囲と行政区界のエリア範囲とが重なるエリア範囲の面積比が、面積比突合データとして生成される。図26は、その具体的な内容の第一例であり、セクタ識別子と、行政区界コードと、面積比とを対応付けた面積比突合データの例を示している。図27は、その具体的な内容の第二例であり、セクタ識別子と、行政区界コードと、面積比と、遅延量とを対応付けた面積比突合データの例を示している。図28は、その具体的な内容の第三例であり、セクタ識別子と、セクタの概略位置情報(緯度・経度)と、現在地(行政区界コードで表現)と、面積比とを対応付けた面積比突合データの例を示している。
行政区界合算部102dは、セクタ・行政区界面積比算出部102cに記憶されている情報と、位置情報合算部103aに記憶されている位置情報合算テーブルとに従って、行政区界面積比突合データを生成して記憶する部分である。図29は、行政区界面積比突合データを記述した行政区界面積比突合データテーブルの具体例を示す。行政区界面積比突合データは、例えばセクタ識別子(又は、「セクタ識別子及び遅延量」、「セクタ識別子及び位置情報(緯度・経度)」)をキーとして突合が行われたデータである。図29に示されるとおり、この行政区界面積比突合データテーブルは、セクタ識別子、ユーザの性別、ユーザの年齢、ユーザの住所地、突合の結果合算された特徴量である合算特徴量、遅延量、現在地(行政区界コードで表現)、および面積比を対応付けて記述している。
更に、行政区界合算部102dは、この行政区界面積比突合データに基づいて、合算特徴量(例えば「1.5」)に面積比(例えば「80」%)を乗算することにより、セクタのエリア範囲と行政区界のエリア範囲とが重なるエリア範囲における合算特徴量である行政区界別合算特徴量(ここでは「1.2」)を算出して、行政区界別合算特徴量データを生成する部分である。図30は、その具体的な内容の第一例であり、ユーザの性別、ユーザの年齢、ユーザの住所地、行政区界別合算特徴量、および現在地(行政区界コードで表現)を対応付けて記述している。なお、データ補正部108は、帰宅困難者係数導出部107により算出された帰宅困難者係数を、行政区界別合算特徴量データの行政区界別合算特徴量に乗算することで、補正済みデータベースである帰宅困難者データテーブルを生成する。これにより、特徴量と、ユーザの住所地と、帰宅困難者係数とに基づく移動機の端末数が推計される。
つぎに、この情報分析装置100dの処理について説明する。図31は、情報分析装置100dの処理を示すフローチャートである。なお、情報分析装置100の処理と、S101からS102までは同じであり、特徴量に基づいてユーザ識別子突合データが生成される(S101〜S102)。そして、位置情報合算部103aにより、同一のセクタ(又は、当該セクタよりも狭いエリア、地点等)ごとの特徴量の合算である合算特徴量が算出されて位置情報合算テーブルに記憶される(S102a)。そして、セクタ・行政区界面積比算出部102cにより、基地局情報記憶部102aに記憶されている情報と、行政区界情報記憶部102に記憶されているエリアテーブルとから、面積比突合データが生成されて記憶される。
そして、行政区界合算部102dにより、セクタ・行政区界面積比算出部102cに記憶されている情報と、位置情報合算部103aに記憶されている位置情報合算テーブルとに従って、行政区界面積比突合データが生成されて記憶される。更に、行政区界合算部102dにより、この行政区界面積比突合データに基づいて、合算特徴量に面積比を乗算する演算処理が行われて行政区界合算特徴量が算出され、行政区界別合算特徴量データが生成される(S102b)。そして、各地域におけるユーザの住所地での距離が算出され、それに応じた帰宅困難者係数が、各移動機の位置ごとに算出される(S103〜S104)。
そして、データ補正部108により、帰宅困難者係数が、ユーザ識別子突合データの行政区界別特徴量に乗算される(S105c)。そして、端末数推計部109により、この乗算結果が用いられ、所定の条件でソートされて、その所定の条件に基づいたエリアにおける帰宅困難者を示す端末数が推計される(S106a)。
このような処理により、セクタと、例えばメッシュ等の算出対象エリアと、の重なり度合いである面積比が考慮されたメッシュごとの帰宅困難者を示す端末数を適切に推計することができる。なお、上述と同様に、第四の実施形態においても、ユーザ識別子を非識別化処理することもできるし、また拡大係数を用いて、より実数に近い帰宅困難者数を算出することができる。
100、100a、100b、100c、100d…情報分析装置、101…位置情報記憶部、102…行政区界情報記憶部、102a…基地局情報記憶部、102b…セクタ・行政区界突合部、102c…セクタ・行政区界面積比算出部、102d…行政区界合算部、103…特徴量算出部、103a…位置情報合算部、104…加入者情報記憶部、105…行政区界突合部、106…距離算出部、107…帰宅困難者係数導出部、108…データ補正部、108a…間引き処理部、109…端末数推計部。

Claims (11)

  1. 各移動機の位置に基づいて各移動機の時間的な存在割合を示した特徴量を、当該位置に基づく所定エリアごとに算出する特徴量算出手段と、
    前記各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断する判断手段と、
    前記判断手段により判断された行政区界情報に基づいて、前記移動機のユーザの住所地との距離を算出する距離算出手段と、
    前記距離算出手段により算出された距離に応じた係数を導出する係数導出手段と、
    前記特徴量算出手段により算出された特徴量と、前記係数導出手段により導出された係数とに基づいて、移動機の端末数を推計する推計手段と、
    を備える情報分析装置。
  2. 前記所定エリアは、前記各移動機の位置に対応するセクタであり、
    前記推計手段は、前記特徴量算出手段により算出された前記セクタごとの特徴量と、前記係数導出手段により導出された係数とに基づいて、移動機の端末数を推計することを特徴とする請求項1に記載の情報分析装置。
  3. 前記所定エリアは、前記各移動機の位置であり、
    前記推計手段は、前記特徴量算出手段により算出された前記各移動機の位置ごとの前記特徴量と、前記係数導出手段により導出された前記係数とに基づいて、移動機の端末数を推計することを特徴とする請求項1に記載の情報分析装置。
  4. 前記推計手段は、前記特徴量算出手段により算出された前記特徴量と、前記移動機のユーザの住所地と、前記係数導出手段により導出された前記係数とに基づいて、移動機の端末数を推計することを特徴とする請求項1〜3のいずれか一項に記載の情報分析装置。
  5. 前記特徴量算出手段により算出された特徴量に対して、前記係数導出手段により導出された、当該特徴量の距離に応じた係数を乗算することにより、係数反映済み特徴量を算出する補正手段をさらに備え、
    前記推計手段は、前記補正手段により算出された係数反映済み特徴量に基づいて、所定単位で、移動機の端末数を推計することを特徴とする請求項1〜4のいずれか一項に記載の情報分析装置。
  6. 前記補正手段は、位置ごとに対応付けられた特徴量に、係数を乗算することで、各移動機における位置ごとの係数反映済み特徴量を算出することを特徴とする請求項5に記載の情報分析装置。
  7. 前記補正手段は、係数を同じにする、前記距離算出手段により算出された距離ごとに合算した特徴量に対して、当該係数を乗算することで、距離毎における係数反映済み特徴量を算出し、これを端末数とすることを特徴とする請求項5に記載の情報分析装置。
  8. 各移動機の位置に基づいて、各移動機の時間的な存在割合を示した特徴量を算出する特徴量算出手段と、
    前記特徴量算出手段により算出された各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断する判断手段と、
    前記判断手段により判断された行政区界情報に基づいて、前記移動機のユーザの住所地との距離を算出する距離算出手段と、
    前記距離算出手段により算出された距離に応じた係数を導出する係数導出手段と、
    前記特徴量算出手段により算出された特徴量を含んだ、前記各移動機の位置ごとに区別されている各ユーザレコードを、前記係数導出手段により導出された係数に基づいて定められた割合で、間引く処理を行う間引き処理手段と、
    前記間引き処理手段により間引かれて残ったユーザレコードにおける特徴量を、所定単位で合算することにより、移動機の端末数を推計する推計手段と、
    を備える情報分析装置。
  9. 前記特徴量算出手段は、
    移動機を識別する識別情報と、前記移動機の位置に関する位置情報と、前記位置情報が取得された位置取得時刻情報と、を含む位置データを取得する位置データ取得手段と、
    ある第1の位置データについて、当該第1の位置データと同一の識別情報を含む位置データのうち、当該第1の位置データの直前の位置データである第2の位置データの位置取得時刻情報、および当該第1の位置データの直後の位置データである第3の位置データの位置取得時刻情報を取得する前後位置データ取得手段と、
    前記第1の位置データの位置取得時刻情報、前記第2の位置データの位置取得時刻情報および前記第3の位置データの位置取得時刻情報のうち2つ以上に基づいて、前記第1の位置データについての特徴量を計算する計算手段と、
    から構成されることを特徴とする請求項1または2に記載の情報分析装置。
  10. 各移動機の位置に基づいて各移動機の時間的な存在割合を示した特徴量を、当該位置に基づく所定エリアごとに算出する特徴量算出ステップと、
    各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断する判断ステップと、
    前記判断ステップにより判断された行政区界情報に基づいて、前記移動機のユーザの住所地との距離を算出する距離算出ステップと、
    前記距離算出ステップにより算出された距離に応じた係数を導出する係数導出ステップと、
    前記特徴量算出ステップにより算出された特徴量と、前記係数導出ステップにより導出された係数とに基づいて、移動機の端末数を推計する推計ステップと、
    を備える情報分析方法。
  11. 各移動機の位置に基づいて、各移動機の時間的な存在割合を示した特徴量を算出する特徴量算出ステップと、
    前記特徴量算出ステップにより算出された各移動機の位置に基づいて、当該各移動機の現在位置の行政区界情報を判断する判断ステップと、
    前記判断ステップにより判断された行政区界情報に基づいて、前記識別子のユーザの住所地との距離を算出する距離算出ステップと、
    前記距離算出ステップにより算出された距離に応じた係数を導出する係数導出ステップと、
    前記特徴量算出ステップにより算出された特徴量を含んだ、前記各移動機の位置ごとに区別されている各ユーザレコードを、前記係数導出ステップにより導出された係数に基づいて定められた割合で、間引く処理を行う間引き処理ステップと、
    前記間引き処理ステップにより間引かれて残ったユーザレコードにおける特徴量を、所定単位で合算することにより、移動機の端末数を推計する推計ステップと、
    を備える情報分析方法。
JP2012262923A 2011-11-30 2012-11-30 情報分析装置および情報分析方法 Pending JP2013138417A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012262923A JP2013138417A (ja) 2011-11-30 2012-11-30 情報分析装置および情報分析方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011262573 2011-11-30
JP2011262573 2011-11-30
JP2012262923A JP2013138417A (ja) 2011-11-30 2012-11-30 情報分析装置および情報分析方法

Publications (1)

Publication Number Publication Date
JP2013138417A true JP2013138417A (ja) 2013-07-11

Family

ID=48913770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012262923A Pending JP2013138417A (ja) 2011-11-30 2012-11-30 情報分析装置および情報分析方法

Country Status (1)

Country Link
JP (1) JP2013138417A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110203257A (zh) * 2019-05-09 2019-09-06 北京交通大学 一种轨道交通事件下列车运行调度方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110203257A (zh) * 2019-05-09 2019-09-06 北京交通大学 一种轨道交通事件下列车运行调度方法和系统
CN110203257B (zh) * 2019-05-09 2020-04-28 北京交通大学 一种轨道交通事件下列车运行调度方法和系统

Similar Documents

Publication Publication Date Title
JP5627702B2 (ja) 位置情報集計装置及び位置情報集計方法
JP5470469B2 (ja) 端末数推計装置および端末数推計方法
KR102097426B1 (ko) 피셀 알고리즘을 이용하여 실시간 유동 인구 데이터의 제공이 가능한 유동인구 정보 분석 방법
RU2541892C1 (ru) Устройство оценки количества терминалов и способ оценки количества терминалов
RU2527754C2 (ru) Система генерирования статистической информации и способ генерирования статистической информации
JP5230815B2 (ja) 世帯人員数分布推定装置及び世帯人員数分布推定方法
WO2012105516A1 (ja) 端末数推計装置及び端末数推計方法
US20130176433A1 (en) Unique-terminal-count estimation device and unique-terminal-count estimation method
US20140372172A1 (en) Method and computer system to forecast economic time series of a region and computer program thereof
JP5497899B2 (ja) 情報分析装置および情報分析方法
CN105160173B (zh) 安全评估方法和装置
CN111148018A (zh) 基于通信数据识别定位区域价值的方法和装置
KR20120063547A (ko) 관리 서버, 인구 정보 산출 관리 서버, 부재 영역 관리 방법 및 인구 정보 산출 방법
JP2013153286A (ja) 情報処理装置およびクラスタ生成方法
JP2012054921A (ja) 移動機分布算出システム及び移動機分布算出方法
JP5797120B2 (ja) 情報分析装置および人口分布算出方法
JP2013138417A (ja) 情報分析装置および情報分析方法
CN110992081A (zh) 用于线下服务商的数据处理方法及装置
JP5543619B2 (ja) 端末数推計装置および端末数推計方法
US9104994B2 (en) Organization attribute estimation device, non-transitory computer readable medium, and organization attribute estimation method
JPWO2012133680A1 (ja) 情報処理装置および端末数推計方法
JP2013106078A (ja) 情報処理装置および情報処理方法
US20140032448A1 (en) Method, computer programs and a use for the prediction of the socioeconomic level of a region
CN116702817A (zh) 识别码生成方法、装置、设备及存储介质
JP2012032924A (ja) 情報分析装置および情報分析方法