以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。図面の説明において、同一又は同等の要素には同一符号を用い、重複する説明を省略する。
まず、本発明に係るログ収集装置の概要について説明する。図1は、本発明に係るログ収集装置の概要を説明するための図である。ログ収集装置は、通信端末において取得されたログ情報(詳細は後述)を収集し、収集したログ情報を用いて統計処理を行うことにより、ログ情報が取得された所定のエリアの情報(例えば通信品質)を導出する装置である。このようなログ収集装置において、例えば、各通信端末から一定間隔でログ情報を収集すると、都心や駅等の通信端末数が多いエリアではログ情報の数が多くなり、住宅地等の通信端末数が少ないエリアではログ情報の数が少なくなる。
例えば、図1(a)に示されるように、a1エリア〜a4エリアの4つのエリアがある場合に、A端末及びB端末がa1エリア及びa2エリアに等確率で存在し、C端末がa2エリア及びa3エリアに等確率で存在し、D端末がa2エリア及びa4エリアに等確率で存在するとする。そして、ログ収集装置において、各通信端末から一定間隔でログ情報を収集したとすると、例えばa1エリアに関して取得されるログ情報の総数が2件であるとすると、a2エリアに関して取得されるログ情報の総数が4件、a3エリアに関して取得されるログ情報の総数が1件、a4エリアに関して取得されるログ情報の総数が1件となる。
ここで、上述したように、ログ情報は、エリアの情報を導出するための所定の統計処理に用いられる情報である。そのため、各エリアに関して、当該統計処理を適切に行えるだけの十分な量だけログ情報が収集される必要がある。例えば、図1(a)に示した例において、各エリアでログ情報を2件ずつ収集する必要があるとすると、a3エリア及びa4エリアではログ情報が不足することとなる。一方で、ログ情報を必要以上に収集しているエリアでは、当該エリアに存在する通信端末において本来不要である通信(必要以上のログ情報を取得するための通信)が発生することとなり、通信端末における無駄なバケット通信及びバッテリー消費が問題となる。例えば、図1(a)に示した例において、各エリアでログ情報を2件ずつ収集すればよい場合、a2エリアではログ情報が必要以上に収集されることとなる。
本発明に係るログ収集装置では、ログ情報を取得する頻度をエリア毎に設定することにより、通信端末数が少ないエリアにおいて十分にログ情報を収集すると共に、通信端末が多いエリアにおけるログ情報の収集量を抑制する。すなわち図1(b)に示すように、図1(a)においてログ情報が不足していたa3エリア及びa4エリアにおける通信端末のログ情報収集頻度を上げると共に、図1(a)においてログ情報が過多となっていたa2エリアにおける通信端末のログ情報収集頻度を下げることにより、各エリアにおけるログ情報収集量を必要十分な量とするものである。
[第1実施形態]
図2は、第1実施形態に係るログ収集システムの機能構成を示す図である。図2に示されるように、ログ収集システム1は、ログ収集装置10と、通信端末50とを備えている。ログ収集システム1は、ログ収集装置10及び通信端末50間において通信を行うことにより、通信端末50において取得したログ情報をログ収集装置10において収集するシステムである。ここで、ログ情報とは、通信端末50における通信状況の記録であり、例えば、通信端末50が通信を行うネットワークの品質情報を含む情報である。当該品質情報とは、例えば、RTT(Round Trip Time)、RSRP(Reference SignalReceived Power)、RSRQ(Reference Signal Received Quality)、RSSI(Receive Strength Signal Indicator)等であるが、ネットワークの品質を示す情報であればこれらに限定されない。このような品質情報は、通信端末50において自動的に取得され、ログ収集装置10において統計処理がなされることにより、例えば、ネットワーク網の品質改善に供される。以下では、ログ情報には上記品質情報が含まれているとする。
通信端末50は、在圏するエリアに応じてログ収集装置10によって設定された確率値(頻度)で、ログ情報を取得する端末である。通信端末50は、例えば出荷時の機能として、所定の一定間隔でログ情報を自動取得することとされている。ログ収集システム1では、通信端末50に上記確率値(頻度)が設定されることにより、当該一定間隔の全てのタイミングのうち一部のタイミングでのみ、通信端末50にログ情報を取得させるものである。例えば、上記確率値が「50%」とされた場合には、通信端末50では、一定間隔の全てのタイミングのうち半分のタイミングでのみ、ログ情報が取得される。エリアとは、例えば、地図上の領域を任意の大きさに分割して得られる区画であるメッシュ、又は、対応する基地局の電波により通信が可能な領域であるセル等である。
通信端末50は、例えばユーザに所持(携帯)されて用いられる、スマートフォン等の携帯電話機、又は、タブレット端末等である。通信端末50は、自身の移動を契機として、ログ情報取得に係る処理を開始する。通信端末50が移動したとは、例えば、通信端末50の位置の変化量が所定値を上回ったことをいう。通信端末50は、例えば、基地局との通信にかかる時間に基づいて基地局からの距離を特定し、自身の位置の変化を取得する。或いは、通信端末50は、例えばGPS(Global Positioning System)により一定間隔で位置を取得することにより、自身の位置の変化を取得してもよい。通信端末50は、当該移動したか否かの判断を、搭載されたOS(Operating System)が実装する機能を利用して行ってもよいし、搭載されたアプリにより行ってもよい。以下では、通信端末は、OSの機能により移動したか否かの判断を行うとして説明する。
通信端末50は、移動したことを検知すると、当該移動が別エリアへの移動か否かを判断する。当該別エリアであるか否かについては、予め記憶されたエリアの位置に関する情報と、上述した通信端末50の位置とに基づき判断される。通信端末50は、別エリアであると判断した場合には、ログ収集装置10に対して新たなエリア(現在値エリア)を示す情報を送信する。通信端末50は、当該新たなエリアを示す情報に応じた確率値を、ログ収集装置10から取得する。
通信端末50は、取得した確率値に応じてログ情報の計測を行うか否かを判断する。通信端末50は、例えば、一定期間内のログの取得数(送付数)が規定値を超えていないか否か、及び、取得した確率値(当該エリアの取得した確率値)を考慮して、今回のタイミングでログ情報を計測するか否かを判断する。通信端末50は、ログ情報を計測すると判断すると、ログ情報の計測を行う。ログ情報は、例えば通信端末50が接続している基地局からの電波の強さを測定することにより計測される。通信端末50は、計測することにより取得したログ情報を、ログ収集装置10に送信する。
ログ収集装置10は、通信端末50において取得されるログ情報を、複数ユーザの通信端末50から収集するサーバである。ログ収集装置10は、例えば、通信端末50が利用する通信サービスを提供する通信事業者により管理されるサーバである。ログ収集装置10は、収集したログ情報を用いて所定の統計処理を行うことにより、当該ログ情報が取得されたエリアの通信品質を導出(推定)する。ログ収集装置10は、通信部11(ログ収集部)と、ログ記憶部12と、比較部13と、頻度設定部14と、頻度記憶部15と、を備えている。
図3は、図2に示したログ収集装置10のハードウェア構成を示す図である。ログ収集装置10は、物理的には、図2に示すように、1又は複数のCPU101、主記憶装置であるRAM102及びROM103、入力デバイスであるキーボード及びマウス等の入力装置104、ディスプレイ等の出力装置105、ネットワークカード等のデータ送受信デバイスである通信モジュール106、半導体メモリ等の補助記憶装置107等を含むコンピュータとして構成されている。
ログ収集装置10の各機能は、図3に示すCPU101、RAM102等のハードウェア上に1又は複数の所定のコンピュータソフトウェアを読み込ませることにより、CPU101の制御のもとで入力装置104、出力装置105、通信モジュール106を動作させるとともに、RAM102や補助記憶装置107におけるデータの読み出し及び書き込みを行うことで実現される。
図2に戻り、通信部11は、通信端末50と通信を行う機能である。通信部11は、通信端末50から現在値エリアを示す情報を受信し、該現在値エリアを示す情報に応じた確率値を通信端末50に送信(返却)する。具体的には、通信部11は、頻度記憶部15に記憶された、エリアと確率値との対応表である確率値テーブルを参照することにより、現在値エリアに応じた確率値を取得し、該確率値を通信端末50に送信する。当該頻度記憶部15に記憶された確率値テーブルは、頻度設定部14により設定されたものである(詳細は後述)。
そして、通信部11は、通信端末50に送信した確率値、すなわち頻度設定部14により設定された確率値で、エリア毎に、通信端末50からログ情報を収集する。通信部11は、収集したログ情報をログ記憶部12に格納する。
ログ記憶部12は、通信部11により取得された通信端末50のログ情報を記憶する機能である。ログ情報には、取得に係るエリアを一意に特定するエリアIDと、取得日時と、ネットワークの品質情報とが含まれている。すなわち、ログ記憶部12は、エリアID、取得日時、及び品質情報を関連付けて記憶している。
比較部13は、所定の期間において通信部11により収集されたエリア毎のログ情報の数と、予め定められたエリア毎の収集目標値とを比較する機能である。比較部13は、ログ記憶部12を参照することによって、エリアIDが比較に係るエリアであって、日時情報が上記所定の期間に含まれるログ情報の数を取得する。エリア毎の収集目標値は、上述したログ情報を用いた統計処理を行うのに必要十分な値とされている。上記所定の期間は、例えば1週間とされる。
比較部13は、頻度設定部14に比較結果を出力する。当該比較結果には、例えば、比較を行ったエリアを示すエリアID、ログ情報の数が上回っていたか否かを示す情報、及び乖離度合いを示す情報が含まれている。ログ情報の数が上回っていたか否かを示す情報とは、ログ情報の数が収集目標値を上回っている、収集目標値を下回っている、或いは収集目標値と一致している、のいずれかを示す情報である。乖離度合いを示す情報とは、ログ情報の数が収集目標値からどの程度離れているかを示す情報であり、例えば、ログ情報の数から収集目標値を差し引いた数値で示される。
頻度設定部14は、ログ情報を収集する頻度をエリア毎に設定する機能である。頻度設定部14は、頻度記憶部15に記憶された確率値テーブルにおける確率値を更新することにより、ログ情報を収集する頻度をエリア毎に設定する。
頻度設定部14は、通信端末50のログ情報が収集される前の初期段階においては、頻度記憶部15の確率値テーブルにおける確率値として、予め定められた初期値を設定する。頻度設定部14は、当該初期値を、例えば全エリア共通の値(例えば50%)とする。また、頻度設定部14は、エリア毎の人口密度を考慮して、確率値の初期値を設定してもよい。この場合には、エリア毎に確率値の初期値が異なることとなる。
頻度設定部14は、通信端末50のログ情報が所定期間収集されると、当該ログ情報に基づいて、確率値テーブルにおける確率値を更新する。頻度設定部14は、比較部13により入力される比較結果に応じて、ログ情報の数が収集目標値に近づくように、エリア毎の確率値を設定する。具体的には、頻度設定部14は、比較結果においてログ情報の数が収集目標値を上回っていると判断されたエリアに関しては確率値を下げる。また、頻度設定部14は、比較結果においてログ情報の数が収集目標値を下回っていると判断されたエリアに関しては確率値を上げる。このように、ログ情報収集及び確率値の更新が繰り返し行われることにより、各エリアの確率値が所望の値に収束する。
頻度設定部14は、比較部13により入力される比較結果における、収集目標値からのログ情報の数の乖離度合いに応じて、確率値を設定してもよい。すなわち、頻度設定部14は、乖離度合いが大きいエリアほど、確率値の変動率を大きくしてもよい。
上述したように、ログ収集装置10では、各エリアの確率値が所望の値に収束するまで、ログ情報を所定期間収集した後にエリア毎の確率値の更新を行う、との一連の処理を繰り返し行う。例えば、当該一連の処理に1週間要するとすると、繰り返しが8回行われた場合には、確率値の収束までに8週間を要することとなる。これに対して、頻度設定部14は、実際に収集されたログ情報だけでなく、エリア毎の過去のユーザ存在実績に基づくシミュレーション結果を考慮して、エリア毎の確率値を設定してもよい。具体的には、頻度設定部14は、まず各エリアにおけるユーザの存在確率を割り出す。すなわち、頻度設定部14は、所定期間(例えば一週間)、ログ情報を収集し、各エリアにおけるユーザの存在確率を割り出す。そして、頻度設定部14は、当該各エリアにおけるユーザの存在確率を用いて、各エリアに対するユーザの遷移に関するシミュレーションを実施する。当該シミュレーションが行われる場合には、ログ情報の収集は最初にユーザの存在確率を割り出すためだけに行えばよくなるので、確率値の収束までに要する時間を大幅に削減することができる。例えば、最初のログ情報の収集に1週間要したとしても、シミュレーション処理自体は1時間等で完了でき、その後のログ情報の収集も不要になるので、上述した繰り返し処理と比較すると、要する時間を7週間程度短縮することができる。なお、ユーザ存在実績とは、通信端末50に係るユーザのみの存在実績であってもよいし、通信端末50との関連がない一般ユーザの存在実績を含むものであってもよい。
頻度記憶部15は、エリアと確率値との対応表である確率値テーブル(図示せず)を記憶する機能である。当該確率値テーブルの値は、上述したように頻度設定部14により更新可能とされている。また、当該確率値テーブルの値は、通信部11により読み出し可能とされている。
次に、図4及び図5を参照して、ログ収集システム1のログ収集処理について説明する。図4は、本発明の第1実施形態に係るログ収集システム1のログ収集処理を示すシーケンス図である。図5は、図4に示した各処理を説明するための図である。
図4に示されるように、最初に、ログ収集装置10の頻度設定部14により初期化処理が行われる(ステップS1)。当該初期化処理では、頻度設定部14により、頻度記憶部15の確率値テーブルにおける確率値が、予め定められた初期値とされる。当該初期化処理は、原則、ログ情報が収集される前の初期段階において一度のみ行われる。図5(a)は、初期化処理がなされたエリアの確率値設定状況の一例を示している。図5(a)に示される例では、初期化処理により、a1〜a4エリア共通で、確率値の初期値として50%が設定されている。
つづいて、通信端末50においてログ取得処理が行われる(ステップS2〜ステップS8)。すなわち、通信端末50においては、移動検知処理(ステップS2)、別エリアへの移動判定処理(ステップS3)、現在値エリアの送信処理(ステップS4)、確率値の取得処理(ステップS5)、計測有無の判断処理(ステップS6)、計測処理(ステップS7)、及びログ送信処理(ステップS8)が行われる。上記ログ取得処理について、図6を参照して説明する。図6は、本発明の第1実施形態に係る通信端末50のログ取得処理を示すフローチャートである。
図6及び図4に示されるように、通信端末50では、最初に、移動したか否かが判断され(ステップS21,S2)、移動していた場合に限りログ取得処理が開始される。S21において移動していないと判断された場合には、所定時間後に再度S21の処理が行われる。一方で、S21において移動したと判断された場合には、通信端末50では、当該移動が別エリアへの移動か否かが判定される(ステップS22,S3)。S22において別エリアへの移動でないと判定された場合には処理が終了する。一方で、S22において別エリアへの移動であると判定された場合には、通信端末50では、現在値エリアが更新され該現在値エリアを示す情報がログ収集装置10に送信される(ステップS23,S4)。そして、通信端末50では、ログ収集装置10から、現在値エリアの確率値が取得される(ステップS24,S5)。
つづいて、通信端末50では、取得した確率値に応じてログ情報の計測を行うか否かが判断される(ステップS25,S6)。S25において計測を行わないと判断された場合には処理が終了する。一方で、S25において計測を行うと判定された場合には、通信端末50ではログ情報の計測が行われる(ステップS26,S7)。そして、通信端末50では、計測したログ情報がログ収集装置10に送信される(ステップS27,S8)。
図5(b)は、初期化処理後の、各エリアにおける通信端末50のログ情報取得状況の一例を示している。いま、a1〜a4エリアに関する確率値の初期値として、全て50%が設定されているとする。そして、A端末及びB端末がa1エリア及びa2エリアに等確率で存在し、C端末がa2エリア及びa3エリアに等確率で存在し、D端末がa2エリア及びa4エリアに等確率で存在するとする。この場合、上記確率値の初期値に基づいて、a1エリアでは例えばA端末及びB端末が1件ずつログ情報を取得して合計2件のログ情報が取得され、a2エリアでは例えばA端末、B端末、C端末、及びD端末が1件ずつログ情報を取得して合計4件のログ情報が取得され、a3エリアでは例えばC端末により1件のログ情報が取得され、a4エリアでは例えばD端末により1件のログ情報が取得される。このように、全エリアの確率値を50%とすると、取得されるログ情報の数が各エリア間でばらつくこととなる。
図4に戻り、通信端末50によるログ取得処理が一定期間(例えば一週間)行われた後、ログ収集装置10により確率値の再計算が行われる(ステップS9)。当該確率値の再計算処理の詳細については、図7を参照して説明する。図7は、本発明の第1実施形態に係るログ収集装置10のログ収集処理を示すフローチャートである。
図7に示されるように、ログ収集装置10では、エリア毎に確率値の再計算が行われる。最初に、比較部13により未完了のエリアが一つ選択される(ステップS31)。そして、比較部13により、ログ記憶部12が参照されて、選択されたエリアにおける、過去一定期間で取得されたログ情報の数が取得される(ステップS32)。
つづいて、比較部13により、選択されたエリアのログ情報の数と、予め定められた該エリアの収集目標値とが比較される。そして、ログ情報の数が収集目標値を上回っている場合には、頻度設定部14により確率値テーブルにおける確率値が下げられる(ステップS33,S34)。一方で、ログ情報の数が収集目標値を下回っている場合には、頻度設定部14により確率値テーブルにおける確率値が上げられる(ステップS35,S36)。そして、全てのエリアに対する確率値再計算が完了したか否かが判断され(ステップS37)、完了していなければ再度S31の処理が行われ、完了していれば処理が終了する。
図5(c)は、上述した確率値再計算がなされたエリアの確率値設定状況の一例を示している。図5(c)に示されるように、過去一定期間において、a1エリアで2件のログ情報が取得され、a2エリアで4件のログ情報が取得され、a3エリアで1件のログ情報が取得され、a4エリアで1件のログ情報が取得されたとする。そして、収集目標値が2件であったとすると、ログ収集装置10において確率値が再計算され、ログ情報の数が収集目標値と一致するa1エリアの確率値が現状維持の50%とされ、収集目標値を上回るa2エリアの確率値が45%に下げられ、収集目標値を下回るa3エリア及びa4エリアの確率値が55%に上げられる。このように、ログ収集装置10において、ログ収集と確率の再計算とが繰り返されることにより、エリア間のログ情報数の格差を是正することができる。
次に、第1実施形態に係るログ収集装置10の作用効果について説明する。
ログ収集装置10は、通信端末50において取得されるログ情報を複数ユーザの通信端末50から収集する情報処理装置であって、ログ情報を収集する確率値を所定のエリア毎に設定する頻度設定部14と、頻度設定部14により設定された確率値で、エリア毎に、通信端末50からログ情報を収集する通信部11と、を備える。
このログ収集装置10では、所定のエリア毎に設定された確率値で、通信端末50において取得されたログ情報が収集される。確率値が所定のエリア毎に設定されているので、例えば通信端末50が少ないエリアにおける確率値を上げ、通信端末50が多いエリアにおける確率値を下げることが可能となる。或いは、ネットワーク品質が悪く詳細な解析を行いたいエリアのログ情報の確率値を上げ、ネットワーク品質が良く簡単な確認程度でよいエリアのログ情報の確率値を下げることが可能となる。このことにより、通信端末50が少ないエリアや詳細な解析を行いたいエリアにおいては十分にログ情報が確保され、また、通信端末50が多いエリアや詳細な解析が不要なエリアにおいては必要以上のログ情報取得が抑制される。すなわち、当該ログ収集装置10によれば、ログ情報を用いた統計処理を確実に行うと共に、通信端末50における不要な通信を抑制することができる。
ログ収集装置10は、所定の期間において通信部11により収集されたエリア毎のログ情報の数と、予め定められたエリア毎の収集目標値とを比較する比較部13を更に備え、頻度設定部14は、比較部13の比較結果に応じて、ログ情報の数が収集目標値に近づくように、確率値を設定する。エリア毎にログ情報の数と収集目標値とが比較され、ログ情報の数が収集目標値に近づくように確率値が設定されることにより、実測値に応じて、収集されるログ情報の数を所望の値に近づけることができる。
頻度設定部14は、比較部13により、ログ情報の数が収集目標値を上回っていると判断されたエリアに関しては、確率値を下げ、比較部13により、ログ情報の数が収集目標値を下回っていると判断されたエリアに関しては、確率値を上げる。これにより、実測値に応じて、収集されるログ情報の数を所望の値に確実に近づけることができる。
頻度設定部14は、比較部13による比較結果における、収集目標値からのログ情報の数の乖離度合いに応じて、確率値を設定する。これにより、収集されるログ情報の数を迅速に収集目標値に近づけることができる。
頻度設定部14は、エリア毎の人口密度を考慮して、確率値の初期値を設定する。これにより、実測前の初期段階において、収集されるログ情報の数を収集目標値に近づけ易くなる。
頻度設定部14は、エリア毎のユーザ存在実績に基づくシミュレーション結果を考慮して、エリア毎の確率値を設定する。これにより、実測値だけでなく、過去の実績に応じて収集頻度を設定することができ、収集されるログ情報の数を迅速に収集目標値に近づけることができる。
[第2実施形態]
次に、図8〜図16を参照して、第2実施形態に係るログ収集装置10について説明する。なお、本実施形態の説明では、上記第1実施形態と異なる点について主に説明する。
第2実施形態に係るログ収集装置10では、比較部13が、各ユーザの通信端末50それぞれに関して、一又は複数の生活エリアを特定する。比較部13は、通信端末50において取得され、通信端末50から送信された、生活エリアを示す情報に基づいて、各ユーザの通信端末50の生活エリアを特定する。生活エリアとは、通信端末50が主に在圏するエリアであり、例えば、所定期間(例えば1か月)において通信端末50が一定頻度以上在圏していたエリアをいう。生活エリアの一例としては、例えば、通信端末50のユーザの自宅、及び、該ユーザの職場(或いは学校)等が考えられる。
比較部13は更に、特定した各生活エリアそれぞれに関して、該生活エリアにおける全ユーザの通信端末50のログ情報の数と、予め定められた該生活エリアの収集目標値とを比較する。
頻度設定部14は、ログ情報の数が収集目標値を上回っているエリアに関しては、該エリアを生活エリアとするユーザの通信端末50の確率値を所定値だけ下げた頻度候補を導出する。また、頻度設定部14は、ログ情報の数が収集目標値を下回っている前記エリアに関しては、該エリアを生活エリアとするユーザの通信端末50の確率値を所定値だけ上げた頻度候補を導出する。
更に、頻度設定部14は、各ユーザの通信端末50毎に、全ての頻度候補を合計した値が予め定めた合計値となるように、各頻度候補の比率を考慮して各頻度候補を補正し、該補正した値を、当該ユーザの通信端末50における、各生活エリアの確率値とする。
上述した、ユーザの通信端末50毎の確率値設定について、図8〜図13を参照して説明する。図8〜図13は、本発明の第2実施形態に係るログ収集装置10の処理の一例を説明するための図である。なお、図8〜図13では、設定された確率値どおりにログ情報が収集されるものとする。
いま、図8(a)に示されるように、頻度設定部14による確率値テーブルの初期化処理により、a1エリアのA端末及びB端末、a2エリアのA端末〜D端末、a3エリアのC端末、並びに、a4エリアのD端末に関して、確率値の初期値として50%が設定されているとする。そして、A端末及びB端末がa1エリア及びa2エリアに等確率で存在しこれらのエリアを生活エリアとしており、C端末がa2エリア及びa3エリアに等確率で存在しこれらのエリアを生活エリアとしており、D端末がa2エリア及びa4エリアに等確率で存在しこれらのエリアを生活エリアとしている、とする。
この場合には、図8(b)に示されるように、上記確率値の初期値に基づいて、a1エリアでは例えばA端末及びB端末が1件ずつログ情報を取得して合計2件のログ情報が取得され、a2エリアでは例えばA端末、B端末、C端末、及びD端末が1件ずつログ情報を取得して合計4件のログ情報が取得され、a3エリアでは例えばC端末により1件のログ情報が取得され、a4エリアでは例えばD端末により1件のログ情報が取得される。このように、全エリアの全ユーザの通信端末50の確率値を50%とすると、取得されるログ情報の数が各エリア間でばらつくこととなる。例えば、各エリアの収集目標値が2であるとすると、比較部13は、a1エリアのみ取得されるログ情報の数(期待値)が収集目標値と一致し、a2エリアでは取得されるログ情報の数が収集目標値を上回り、a3エリア及びa4では取得されるログ情報の数が収集目標値を下回る、と判断する。
この場合、図8(c)に示されるように、頻度設定部14は、例えば、a2エリアの確率値を10%下げた40%をa2エリアに関するA端末〜D端末の頻度候補とし、a3エリアの確率値を10%上げた60%をa3エリアに関するC端末の確率候補とし、a4エリアの確率値を10%上げた60%をa4エリアに関するD端末の頻度候補とする。
更に、頻度設定部14は、図8(d)に示されるように、各ユーザの通信端末50に関して、全ての頻度候補を合計した値が100%となるように、各頻度候補の比率を考慮して各頻度候補を補正する。そして、補正した値を、各通信端末50における各生活エリアの確率値とする。図8(d)では、A端末及びB端末について、頻度候補を補正した値が確率値とされている。すなわち、a1エリアに関して、50%であった頻度候補に基づき、A端末及びB端末の確率値が56%とされ、a2エリアに関して、40%であった頻度候補に基づき、A端末及びB端末の確率値が44%とされる。なお、C端末及びD端末については、全ての頻度候補を合計した値が100%となっているため、頻度候補がそのまま確率値とされている。
図9(a)は、このようにして、初期化状態から1回目の確率値変更が行われた確率値テーブルを示している。当該確率値テーブルに基づいてログ情報が収集されると、a1エリア及びa2エリアではログ情報の数が収集目標値を上回り、a3エリア及びa4エリアではログ情報の数が収集目標値を下回る(図9(b)参照)。
この場合、図9(c)に示されるように、頻度設定部14は、例えば、a1エリアの確率値を10%下げた46%をa1エリアに関するA端末及びB端末の頻度候補とし、a2エリアの確率値を10%下げた34%をa2エリアに関するA端末及びB端末の頻度候補とし、a2エリアの確率値を10%下げた30%をa2エリアに関するC末及びD端末の頻度候補とし、a3エリアの確率値を10%上げた70%をa3エリアに関するC端末の頻度候補とし、a4エリアの確率値を10%上げた70%をa4エリアに関するD端末の頻度候補とする。
更に、図9(d)に示されるように、頻度設定部14は、各ユーザの通信端末50の頻度候補の合計が100%になるように補正を行い、確率値を導出する。すなわち、a1エリアに関して46%であった頻度候補の値に基づき、A端末及びB端末の確率値が58%とされ、a2エリアに関して34%であった頻度候補の値に基づき、A端末及びB端末の確率値が42%とされる。
上述した確率値変更は、各エリア間におけるログ収集量の差が無視できる程度となるまで続けられる。上述した2回目の確率値変更後の確率値テーブル(図10(a))に基づきログ情報が収集されると、a1エリア及びa2エリアではログ情報の数が収集目標値を上回り、a3エリア及びa4エリアではログ情報の数が収集目標値を下回る(図10(b)参照)
この場合、図10(c)に示されるように、頻度設定部14は、例えば、a1エリアの確率値を10%下げた48%をa1エリアに関するA端末及びB端末の頻度候補とし、a2エリアの確率値を10%下げた32%をa2エリアに関するA端末及びB端末の頻度候補とし、a2エリアの確率値を10%下げた20%をa2エリアに関するC末及びD端末の頻度候補とし、a3エリアの確率値を10%上げた80%をa3エリアに関するC端末の頻度候補とし、a4エリアの確率値を10%上げた80%をa4エリアに関するD端末の頻度候補とする。
更に、図10(d)に示されるように、頻度設定部14は、各ユーザの通信端末50の頻度候補の合計が100%になるように補正を行い、確率値を導出する。すなわち、a1エリアに関して48%であった頻度候補の値に基づき、A端末及びB端末の確率値が60%とされ、a2エリアに関して32%であった頻度候補の値に基づき、A端末及びB端末の確率値が40%とされる。
上述した3回目の確率値変更後の確率値テーブル(図11(a))に基づきログ情報が収集されると、a1エリア及びa2エリアではログ情報の数が収集目標値を上回り、a3エリア及びa4エリアではログ情報の数が収集目標値を下回る(図11(b)参照)
この場合、図11(c)に示されるように、頻度設定部14は、例えば、a1エリアの確率値を10%下げた50%をa1エリアに関するA端末及びB端末の頻度候補とし、a2エリアの確率値を10%下げた30%をa2エリアに関するA端末及びB端末の頻度候補とし、a2エリアの確率値を10%下げた10%をa2エリアに関するC末及びD端末の頻度候補とし、a3エリアの確率値を10%上げた90%をa3エリアに関するC端末の頻度候補とし、a4エリアの確率値を10%上げた90%をa4エリアに関するD端末の頻度候補とする。
更に、図11(d)に示されるように、頻度設定部14は、各ユーザの通信端末50の頻度候補の合計が100%になるように補正を行い、確率値を導出する。すなわち、a1エリアに関して50%であった頻度候補の値に基づき、A端末及びB端末の確率値が67%とされ、a2エリアに関して30%であった頻度候補の値に基づき、A端末及びB端末の確率値が33%とされる。
上述した4回目の確率値変更後の確率値テーブル(図12(a))に基づきログ情報が収集されると、a1エリアではログ情報の数が収集目標値を上回り、a2エリア、a3エリア及びa4エリアではログ情報の数が収集目標値を下回る(図12(b)参照)
この場合、図12(c)に示されるように、頻度設定部14は、例えば、a1エリアの確率値を10%下げた57%をa1エリアに関するA端末及びB端末の頻度候補とし、a2エリアの確率値を10%上げた43%をa2エリアに関するA端末及びB端末の頻度候補とし、a2エリアの確率値を10%上げた20%をa2エリアに関するC末及びD端末の頻度候補とし、a3エリアの確率値を10%上げた100%をa3エリアに関するC端末の頻度候補とし、a4エリアの確率値を10%上げた100%をa4エリアに関するD端末の頻度候補とする。
更に、図12(d)に示されるように、頻度設定部14は、各ユーザの通信端末50の頻度候補の合計が100%になるように補正を行い、確率値を導出する。すなわち、a2エリアに関して20%であった頻度候補の値に基づき、C端末及びD端末の確率値が17%とされ、a3エリアに関して100%であった頻度候補の値に基づき、C端末の確率値が83%とされ、a4エリアに関して100%であった頻度候補の値に基づき、D端末の確率値が83%とされる。
上述した処理を更に複数回繰り返すと、図13の確率値テーブルに示されるように、A端末〜D端末の負担を同程度としながら、各エリアのログ情報収集量を同程度とすることができる。
次に、図14〜図16を参照して、第2実施形態に係るログ収集システム1のログ収集処理について説明する。図14は、本発明の第2実施形態に係るログ収集システム1のログ収集処理を示すシーケンス図である。図15は、本発明の第2実施形態に係る通信端末50のログ収集処理を示すフローチャートである。図16は、本発明の第2実施形態に係るログ収集装置10のログ収集処理を示すフローチャートである。
図14に示されるように、最初に、ログ収集装置10の頻度設定部14により初期化処理が行われる(ステップS101)。当該初期化処理では、頻度設定部14により、頻度記憶部15の確率値テーブルにおける確率値が、予め定められた初期値とされる。当該初期化処理は、原則、ログ情報が収集される前の初期段階において一度のみ行われる。
つづいて、通信端末50においてログ取得処理が行われる(ステップS102〜ステップS105、ステップS107〜ステップS111)。すなわち、通信端末50においては、移動検知処理(ステップS102)、別エリアへの移動判定処理(ステップS103)、生活エリアの計算処理(ステップS104)、生活エリア送信処理(ステップS105)、現在値エリアの送信処理(ステップS107)、確率値の取得処理(ステップS108)、計測有無の判断処理(ステップS109)、計測処理(ステップS110)、及びログ送信処理(ステップS111)が行われる。上記ログ取得処理について、図15を参照して説明する。
図15及び図14に示されるように、通信端末50では、最初に、移動したか否かが判断され(ステップS121,S102)、移動していた場合に限りログ取得処理が開始される。S121において移動していないと判断された場合には、所定時間後に再度S121の処理が行われる。一方で、S121において移動したと判断された場合には、通信端末50では、当該移動が別エリアへの移動か否かが判定される(ステップS122,S103)。S122において別エリアへの移動でないと判定された場合には処理が終了する。一方で、S122において別エリアへの移動であると判定された場合には、通信端末50では、現在値エリアが更新される(ステップS123)。
つづいて、通信端末50では、生活エリアの計算(導出)が行われる(ステップS124,S104)。通信端末50は、例えば、1か月などの所定期間における各エリアへの在圏数を計算し、一定頻度以上在圏していたエリアを生活エリアとして導出する。そして、通信端末50により、生活エリアを特定する情報、及び該通信端末50のユーザを一意に特定するユーザ識別子(端末ID)が、ログ収集装置10に送信される(ステップS125,S105)。ログ収集装置10は、通信端末50から送信されたユーザ識別子と生活エリアを示す情報とを関連付けて記憶する(ステップS106)。当該記憶された情報は、後述するログ収集装置10による確率値の再計算に用いられる。
つづいて、通信端末50では、現在値エリアを示す情報がログ収集装置10に送信され(ステップS107)、ログ収集装置10から、該現在値エリアの確率値が取得される(ステップS126,S108)。
つづいて、通信端末50では、取得した確率値に応じてログ情報の計測を行うか否かが判断される(ステップS127,S109)。S127において計測を行わないと判断された場合には処理が終了する。一方で、S127において計測を行うと判定された場合には、通信端末50ではログ情報の計測が行われる(ステップS128,S110)。そして、通信端末50では、計測したログ情報がログ収集装置10に送信される(ステップS129,S111)。
図14に戻り、通信端末50によるログ取得処理が一定期間(例えば一週間)行われた後、ログ収集装置10により確率値の再計算が行われる(ステップS112)。当該確率値の再計算処理の詳細については、図16を参照して説明する。
図16に示されるように、ログ収集装置10では、ユーザの通信端末50毎に、各生活エリアの確率値の再計算が行われる。最初に、比較部13により確率値の再計算が未完了の通信端末50(未完了のユーザの通信端末50)が一つ選択される(ステップS131)。つづいて、比較部13により、当該通信端末50の生活エリアのうち頻度候補の導出が未完了の生活エリアが一つ選択される(ステップS132)。そして、比較部13により、ログ記憶部12が参照されて、選択された生活エリアにおける、過去一定期間で取得された全ユーザのログ情報の数が取得される(ステップS133)。
つづいて、比較部13により、選択された生活エリアのログ情報の数と、予め定められた該生活エリアの収集目標値とが比較される。そして、ログ情報の数が収集目標値を上回っている場合には、頻度設定部14により、確率値テーブルにおける当該通信端末50の当該生活エリアの確率値を下げた値が、当該通信端末50の当該生活エリアの頻度候補として導出される(ステップS134,S135)。一方で、ログ情報の数が収集目標値を下回っている場合には、頻度設定部14により、確率値テーブルにおける当該通信端末50の当該生活エリアの確率値を上げた値が、当該通信端末50の当該生活エリアの頻度候補として導出される(ステップS136,S137)。なお、ログ情報の数が収集目標値と等しい場合には、頻度設定部14により、確率値テーブルにおける当該通信端末50の当該生活エリアの確率値が、当該通信端末50の当該生活エリアの頻度候補として導出される。
そして、当該通信端末50の全ての生活エリアにおける頻度候補の導出が完了したか否かが判断され(ステップS138)、完了していなければ、再度S132の処理が行われ、完了していれば、当該通信端末50の各生活エリアの頻度候補の比率を考慮して、全ての頻度候補を導出した合計値が所定値となるように、当該通信端末50の各生活エリアの確率値が導出される(ステップS139)。最後に、全てのユーザの通信端末50の確率値の再計算が完了しているか否かが判断され(ステップS140)、完了していなければ再度S131の処理が行われ、完了していれば処理が終了する。
上述したように、第2実施形態に係るログ収集装置10では、比較部13が、各ユーザの通信端末50それぞれに関して、一又は複数の生活エリアを特定する。また、比較部13は、特定した各生活エリアそれぞれに関して、該生活エリアにおける全ユーザの通信端末50のログ情報の数と、予め定められた該生活エリアの収集目標値とを比較する。
そして、頻度設定部14は、ログ情報の数が収集目標値を上回っているエリアに関しては、該エリアを生活エリアとするユーザの通信端末50の確率値を所定値だけ下げた頻度候補を導出する。また、頻度設定部14は、ログ情報の数が収集目標値を下回っているエリアに関しては、該エリアを生活エリアとするユーザの通信端末50の確率値を所定値だけ上げた頻度候補を導出する。そして、頻度設定部14は、各ユーザの通信端末50に関して、全ての頻度候補を合計した値が予め定めた合計値となるように、各頻度候補の比率を考慮して各頻度候補を補正し、該補正した値を、各生活エリアの確率値とする。
これにより、ユーザ毎に、各エリア(生活エリア)の確率値が設定される。第1実施形態において説明したエリア毎の確率値設定により、エリア毎のログ情報収集量の偏りを是正することができる。ここで、通信端末50によっては、例えば、他の通信端末50が極めて少ないエリアを生活エリアとしているものもあるところ、各通信端末50単位でどのようなエリアを生活エリアとしているかを考慮していなければ、エリア単位でのログ情報収集量の偏りを是正することができたとしても、一部の通信端末50におけるログ情報収集の負担が大きくなってしまうおそれがある。この点、各ユーザの通信端末50に関して、頻度候補を、各生活エリアの頻度候補の比率を考慮して補正することにより、一部の通信端末50の負担が大きくなることを抑制しながら、エリア毎のログ情報収集量の偏りを是正することができる。
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されない。例えば、ログ収集装置10は、比較部13による比較結果に応じて確率値を再設定するとして説明したがこれに限定されない。すなわち、ログ収集装置10は、エリア毎の確率値を、予め定められたエリア毎の固定値としてもよい。