以下、図面を参照して、本発明の各実施形態について説明する。
(第1実施形態)
以下では、第1実施形態について、図1〜図9を参照して説明する。
図1は、本実施形態による所属地分析用データ構築システム10の構成を説明する図である。図示のように、所属地分析用データ構築システム10は、分析装置20と、基準SSIDデータベース30と、学習用SSIDデータベース40と、学習後SSIDデータベース50と、を備えている。
所属地分析用データ構築システム10は、演算/制御装置、各種記憶装置、及び各種入出力装置を備えたコンピュータで構成される。なお、演算/制御装置は、例えば、CPU(Central Processing Unit)等により実現される。各種記憶装置は、RAM(Random Access Memory)、ROM(Read Only Memory)、SSD(Solid State Drive)、及びハードディスク(磁気記憶装置)等により実現される。さらに、入出力装置は、キーボード、マウス、タッチパネル、ディスプレイ、プリンタ、及びI/Oポート等により実現される。そして、所属地分析用データ構築システム10は、これら各ハードウェア及び後述の図7〜図9で説明する各処理を実行するためのプログラム(ソフトウェア)により構成される。
また、所属地分析用データ構築システム10は、LAN(Local Area Network)等の狭域ネットワーク及びインターネット等の広域ネットワークによって構成されるネットワーク100を介して、複数の端末T1〜Tn(nは任意の自然数)と接続されている。すなわち、所属地分析用データ構築システム10は、各端末T1〜Tnとの間でネットワーク100を介して必要なデータを送受信可能に構成されている。
特に、本実施形態の所属地分析用データ構築システム10は、ネットワーク100を介して、各端末T1〜TnからそれぞれのMAC(Media Access Control address)アドレス等の識別情報、及び各端末T1〜Tnが過去に接続したことのあるアクセスポイントのSSIDを含む接続履歴を受信する。
なお、各端末T1〜Tnは、それぞれ、スマートフォン、タブレット端末、フィーチャーフォン(ガラパゴス携帯)及びPDA等の携帯端末、又はノートパソコン(ラップトップ)及びデスクトップ等のパーソナルコンピュータから構成される。
ここで、本明細書における「アクセスポイント」とは、各端末T1〜Tnにインターネット等の所定のネットワークを介した無線通信(特に無線LAN通信)を可能とさせるハードウェア構成及びソフトウェア構成を備えた無線機を意味する。無線通信の規格としては、例えば、Wi-Fiなどが想定される。
さらに、「SSID」とは、一台又は所定の台数単位でアクセスポイントを識別するための識別子である。すなわち、本明細書における「SSID」という語には、一台のアクセスポイントにユニークに付される識別子のみならず、例えば特定の通信事業者が提供する無線通信にかかる複数台のアクセスポイントに対して一つという単位で付される識別子も含む概念である。
所属地分析用データ構築システム10が各端末T1〜Tnから受信する接続履歴についてより詳細に説明する。
図3は、各端末T1〜Tnにおける過去のアクセスポイントへの各接続履歴の一態様を示している。なお、図3以降の図面において、簡略化のため、SSIDの文字列を簡略化して示している。また、以降の説明及び図面の記載において、7台の各端末T1〜T7が過去に接続したアクセスポイントにかかる接続履歴H1〜H7に対象を絞る。しかしながら、これは本明細書における「接続履歴」に含まれる情報がSSIDのみであることを限定する趣旨ではない。
図3に示すように、各端末T1〜T7に対応する各接続履歴H1〜H7には、それぞれ、各端末T1〜T7が過去に接続したことのあるアクセスポイントのSSIDが情報として含まれている。
すなわち、本実施形態の所属地分析用データ構築システム10は、各端末T1〜T7がそれぞれ過去に接続したことのあるアクセスポイントのSSIDを少なくとも含む接続履歴H1〜H7を取得するように構成されている。
次に、図1に戻り、所属地分析用データ構築システム10の各構成の詳細について説明する。
先ず、分析装置20は、本実施形態の所属地分析にかかる処理を実行する演算/制御装置として機能する。
図2は、分析装置20の機能を説明するブロック図である。図示のように、分析装置20は、基準SSID設定部22と、抽出部24と、設定部26と、を有している。
基準SSID設定部22は、ユーザが無線通信を利用するために所定の端末を介して接続したアクセスポイントのSSIDであって、ユーザの所属地に紐付いた基準SSIDを設定する処理を行う。
より詳細には、本実施形態の基準SSID設定部22は、予め各端末T1〜Tn以外の任意の複数台の端末(以下、「基準設定用端末」とも記載する)から、基準設定用端末が過去に接続したことのあるアクセスポイントのSSIDを含む各接続履歴(以下、「基準設定用接続履歴」とも記載する)を取得する。さらに、基準SSID設定部22は、基準設定用接続履歴に基づいて、実質的に基準設定用端末の各ユーザの所属地を特定し得る属性(特に文字列)を含むSSIDを抽出し、これを基準SSIDとして設定する。
例えば、基準設定用接続履歴に含まれるSSIDの内、「docomo○○」又は「au○○」など、無線LANサービスを利用するユーザの居住国を制限している通信事業者が提供するアクセスポイントであることを特定できる文字列を含むSSIDは、ユーザの所属地を特定し得る属性を含む特定SSIDである。したがって、基準SSID設定部22は、このような特定SSIDを基準SSIDに設定する。
なお、基準設定用接続履歴に含まれるSSIDの中から、上記特定SSIDを選択するための具体的な処理について種々の方法を採用することができる。例えば、上述の特定SSIDと判断できる特定の文字列を記憶した文字列データベースを構成し、基準SSID設定部22が当該文字列データベースを参照して、上記基準設定用接続履歴に含まれるSSIDが当該文字列データベースに記憶された文字列を含むかどうかに基づいて特定SSIDを決定しても良い。
そして、基準SSID設定部22は、設定した基準SSIDを当該所属地と関連させて基準SSIDデータベース30に記憶する。
図4は、基準SSIDデータベース30に記憶されたデータの一態様を示す表である。図4に示すように、基準SSIDデータベース30には、上記特定SSIDと判断されたSSIDと、これに紐付いた所属地と、が関連して記憶される。
より具体的に図4で示す例では、基準SSIDデータベース30は、基準SSIDとしての「A」及び「B」に対して所属地「日本」が対応し、基準SSIDとしての「C」及び「D」に対して所属地「韓国」が対応し、さらに、基準SSIDとしての「E」及び「F」に対して所属地「中国」が対応するデータ構造を取っている。
次に、抽出部24は、各端末T1〜Tnの各接続履歴H1〜Hnに基準SSIDとともに含まれる他のSSIDを学習用SSIDとして抽出する。
より詳細には、抽出部24は、各接続履歴H1〜H7から、基準SSIDが含まれている接続履歴H1〜H6を特定し、特定した接続履歴H1〜H6に含まれる基準SSID以外のSSIDを学習用SSIDとして抽出する。
特に図3及び図4の例に基づいてより具体的に説明すると、抽出部24は、まず、各接続履歴H1〜H7から、基準SSIDである「A」、「B」、「C」、「D」、「E」、及び「F」(図4参照)の少なくとも一つが含まれている接続履歴H1〜H6(図3参照)を特定する。そして、抽出部24は、各接続履歴H1〜H6にそれぞれ含まれるSSIDの中から、「A」、「B」、「C」、「D」、「E」、及び「F」以外のSSIDを学習用SSIDとして抽出する。すなわち、図3の例では、抽出部24は、端末T1の接続履歴H1に含まれる「A」以外のSSID「x1」〜「x10」を学習用SSIDとして抽出する。そして、抽出部24は、同様の処理を、端末T2〜端末T6の接続履歴H1〜接続履歴H2に対しても実行する。
そして、抽出部24は、抽出した学習用SSIDを、同じ接続履歴H1〜H6に含まれていた基準SSIDに紐付いた所属地と関連付けて学習用SSIDデータベース40に記憶させる。
例えば、図3及び図4を参照すれば理解されるように、端末T1の接続履歴H1は、所属地としての「日本」と紐付いた基準SSIDである「A」が含まれている。そして、接続履歴H1には、基準SSIDである「A」以外のSSIDとして「x1」が含まれている。すなわち、抽出部24は、基準SSID「A」に紐付いた所属地「日本」と関連させて、この「x1」を学習用SSIDとして、学習用SSIDデータベース40に記憶させる。抽出部24は、同様の処理を、他の学習用SSIDにも実行する。これにより、各学習用SSIDに暫定的に、少なくとも一つの所属地が紐つけられることとなる。
図5は、学習用SSIDデータベース40に記憶されたデータの一態様を示す表である。図5に示すように、学習用SSIDデータベース40には、上記各基準SSID由来の各所属地と、これに暫定的に紐付けられた学習用SSIDと、が関連して記憶される。
より詳細に説明すると、図5で示す例では、学習用SSIDデータベース40は、所属地「日本」とこれに暫定的に紐付いた「x1」及び「x2」等の学習用SSID、所属地「韓国」とこれに暫定的に紐付いた「x30」及び「x31」等の学習用SSID、並びに所属地「中国」とこれに暫定的に紐付いた「x80」及び「x9」等の学習用SSIDをそれぞれ対応させて記憶している。
なお、上記説明から理解されるように、学習用SSIDデータベース40に記憶される学習用SSIDは、ある所属地と紐付いた基準SSIDを含む接続履歴に当該基準SSIDと一緒に含まれるSSIDを機械的に抽出したものである。したがって、例えば図5に示す学習用SSID「x9」のように、異なる所属地に対して重複して含まれる学習用SSIDも存在する。
次に、設定部26は、同一の所属地に紐付いた基準SSIDを含む接続履歴H1〜H6の内の少なくとも2つに共通して含まれる学習用SSID(図5の表における各ハッチング部分を参照)を、当該所属地に対応した学習後SSIDとして設定する。
設定部26による処理を図3〜図5を用いてより具体的に説明する。本実施形態の設定部26は、先ず、各接続履歴H1〜H7(図3参照)の中から、基準SSIDデータベース30(図4参照)を参照しつつ、同一の所属地に紐付いた一つ又は複数の基準SSIDを含むものを特定する。
より詳細には、設定部26は、各接続履歴H1〜H7の中から、所属地「日本」に紐付いた基準SSID「A」又は「B」を含む接続履歴H1及びH2を特定する。同様に、設定部26は、所属地「韓国」に紐付いた基準SSID「C」又は「D」を含む接続履歴H3及びH4、並びに所属地「中国」に紐付いた基準SSID「E」又は「F」を含む接続履歴H5及びH6を特定する。
さらに、設定部26は、所属地「日本」に紐付いた基準SSID「A」又は「B」を含む接続履歴H1及びH2に含まれる各SSIDと、学習用SSIDデータベース40(図5参照)において所属地「日本」と紐付けて記憶された各学習用SSID「x1」、「x2」・・・、「x18」と、を対比する。そして、設定部26は、これらに共通して含まれる学習用SSID「x2」、「x5」、及び「x7」を、所属地「日本」に対応した学習後SSIDとして設定する。さらに、設定部26は、所属地「韓国」及び所属地「中国」に関しても、所属地「日本」の場合と同様に学習後SSIDを設定する処理を行う。
そして、設定部26は、設定した学習後SSIDを、各所属地と対応させて学習後SSIDデータベース50に記憶させる。
図1に戻り、基準SSIDデータベース30は、所属地分析用データ構築システム10の記憶装置により構成される。図4に例示したように、基準SSIDデータベース30は、上述した基準SSIDと、これに紐付いた各所属地と、を対応させて記憶する。
学習用SSIDデータベース40は、所属地分析用データ構築システム10の記憶装置により構成される。図5に例示したように、学習用SSIDデータベース40は、上述した学習用SSIDと、これに暫定的に紐付けられた各所属地と、を対応させて記憶する。
学習後SSIDデータベース50は、所属地分析用データ構築システム10の記憶装置により構成される。図6に例示したように、学習後SSIDデータベース50は、上述した学習後SSIDと、これに紐付けられた各所属地と、を対応させて記憶する。
以下では、上記構成を有する本実施形態の所属地分析用データ構築システム10による所属地分析用データ構築方法の流れについて説明する。
図7は、本実施形態の所属地分析用データ構築方法の流れを説明するフローチャートである。
ステップS100において、所属地分析用データ構築システム10は、各端末T1〜T7から各接続履歴H1〜H7を取得する。
ステップS200において、所属地分析用データ構築システム10の分析装置20の基準SSID設定部22は、基準SSIDを設定する。
図8は、基準SSIDを設定するためのロジックの一例を説明するフローチャートである。
ステップS201において、基準SSID設定部22は、上述の基準設定用端末から、当該基準設定用端末が過去に接続したことのあるアクセスポイントのSSIDを含む基準設定用接続履歴を取得する。
ステップS202において、基準SSID設定部22は、取得した基準設定用接続履歴から、基準設定用端末の各ユーザの所属地を特定し得る文字列を含む特定SSIDを抽出する。
ステップS203において、基準SSID設定部22は、抽出した特定SSIDを、基準SSIDとして設定する。
ステップS204において、基準SSID設定部22は、設定した基準SSIDをこれに紐付いた所属地と対応させて基準SSIDデータベース30に記憶する。
なお、ステップS200における基準SSIDの設定処理は、上記ステップS100よりも前に予め実行しても良い。
図7に戻り、ステップS300以降の処理について説明する。
ステップS300において、分析装置20の抽出部24は、既に説明したように、基準SSIDデータベース30を参照して、取得した各接続履歴H1〜H7から学習用SSIDを抽出する。そして、抽出部24は、学習用SSIDを、これに暫定的に紐付けられた所属地と対応させて学習用SSIDデータベース40に記憶する。
ステップS400において、分析装置20の設定部26は、基準SSIDデータベース30及び学習用SSIDデータベース40を参照して、取得した各接続履歴H1〜Hnから学習後SSIDを設定する。
具体的に、設定部26は、基準SSIDデータベース30に記憶された所属地と基準SSIDの関係を参照して、取得した各接続履歴H1〜H7の中で同一の所属地に紐付いた基準SSIDを含む接続履歴H1〜H6を特定する。そして、学習用SSIDデータベース40を参照しつつ、これら接続履歴H1〜H6の内の少なくとも2つに共通して含まれる学習用SSIDを抽出する。そして、本実施形態の設定部26は、この学習後SSIDを、当該学習後SSIDと基準SSIDに紐付いた所属地とを対応させて学習後SSIDデータベース50に記憶させる。
以上説明した第1実施形態にかかる所属地分析用データ構築システム10によれば、以下の作用効果を奏する。
本実施形態の所属地分析用データ構築システム10は、ユーザが端末としての基準設定用端末を介して接続するアクセスポイントのSSIDであって、ユーザの所属地に紐付いた基準SSID(図4参照)を設定する基準設定部としての基準SSID設定部22と、
基準SSID(図4参照)を含むアクセスポイントへの接続履歴H1〜H6に該基準SSIDと一緒に含まれる他のSSIDを学習用SSID(図5参照)として抽出する抽出部24と、少なくとも2つの接続履歴(例えば接続履歴H3、H4)に基準SSID(「C」と「D」)と一緒に含まれる学習用SSID(「x36」及び「x37」など)を、所属地(韓国)に紐付いた学習後SSIDとして設定する設定部26と、を備える。
これによれば、実質的にユーザの所属地に一致する基準SSIDと同じ接続履歴に含まれる学習用SSIDの内、少なくとも複数回同じ接続履歴に含まれた学習用SSIDを、当該基準SSIDに紐付いた所属地と同じ所属地に紐付く学習後SSIDとして決定することができる。
したがって、この学習後SSIDを、端末のユーザの所属地の分析に用いることができる。このため、上述の特定SSIDのみを用いて所属地の分析を行う場合に比べて分析に用いることのできるSSIDの範囲が増加するため、SSIDに基づくユーザの所属地の分析の汎用性をより向上させることができる。
特に、本発明者らは、特定の所属地に属する(特に特定の国籍を有する)多くのユーザが使用する端末の接続履歴に含まれるSSIDには、一定の傾向が存在することを発見した。したがって、本発明者らは、予めユーザの所属地を高い信頼性を持って特定可能な限られた基準SSIDが含まれている接続履歴を取得し、この接続履歴において基準SSIDと同じ接続履歴に複数回に亘って含まれるSSIDであれば、一定の信頼性をもった端末ユーザの所属地の分析に寄与することができる点を見出した。
特に、Wi-Fiに基づく通信を想定した場合、上記特定SSID(基準SSID)が含まれる接続履歴を有する端末は一定数以下に限られるため、所属地の分析が可能となるシーンは制限されることが想定される。これに対して、本実施形態の構成であれば、いわゆるFREE Wi-Fiにかかる無線LANサービスを利用するためのアクセスポイントのSSIDの中から、所属地の分析に用いるに足るものを上記学習後SSIDとして設定する。結果として、Wi-Fiに基づく通信の場合には、本実施形態の構成によって、端末のユーザの所属地の分析に用いることのできるSSIDの対象が劇的に拡大することとなる。
また、本実施形態では、基準SSID設定部22は、アクセスポイントへの接続権限を特定所属地(特定の居住地)のユーザに対して許可する事業者(特に電気通信事業者)を特定する文字列を含む特定SSIDを取得し(図8のステップS202)、当該居住地を上記所属地に設定とみなして、特定SSIDを基準SSIDに設定する(図8のステップS203)。
すなわち、本実施形態では、電気通信事業者が提供するアクセスポイントに付される特定SSIDが基準SSIDとして用いられることとなる。ここで、一般的に電気通信事業者は、契約等によりアクセスポイントへの接続権限を与えるユーザの居住地を特定の国に制限している。また、上記特定SSIDには、一般的に電気通信事業者を特定可能な文字列(「docomo」又は「au」など)が含まれる。したがって、本実施形態では、基準SSID設定部22は、この電気通信事業者を特定可能な特定SSIDを基準SSIDとしつつ、上記居住地の制限にかかる特定の国を所属地として設定する。
これにより、上記学習後SSIDを設定するための処理の起点となる基準SSIDに紐付いた所属地が、ユーザの実際の所属地に合致する蓋然性を向上させることができる。したがって、このような基準SSIDに基づき上記各処理にしたがって得られる学習後SSIDについても、当該学習後SSIDと紐付けられた所属地が実際の端末ユーザの所属地と好適に合致することとなる。結果として、本実施形態の所属地分析用データ構築システム10により設定された学習後SSIDを用いたユーザの所属地の分析に関し、その精度をより向上させることができる。
さらに、本実施形態では、コンピュータとしての分析装置20に、上述した各処理(ステップS200、ステップS300、及びステップS400)を実行させるための所属地分析用データ構築プログラム及び当該所属地分析用データ構築プログラムをコンピュータが読み取り可能に構成された記憶媒体が提供される。
特に、この所属地分析用データ構築プログラムは、ユーザが端末としての基準設定用端末を介して接続するアクセスポイントのSSIDであって、ユーザの所属地に紐付いた基準SSID(図4参照)を設定する基準SSID設定処理(図7のステップS200)と、基準SSID(図4参照)を含むアクセスポイントへの接続履歴H1〜H6に該基準SSIDと一緒に含まれる他のSSIDを学習用SSID(図5参照)として抽出する抽出処理(図7のステップS300)と、少なくとも2つの接続履歴(例えば接続履歴H3、H4)に基準SSID(「C」と「D」)と一緒に含まれる学習用SSID(「x36」及び「x37」など)を、所属地(韓国)に紐付いた学習後SSIDとして設定する設定処理(図7のステップS400)と、を分析装置20に実行させる。
さらに、本実施形態によれば、上述した図7におけるステップS200の工程、ステップS300の工程、及びステップS400の工程を含む所属地分析用データ構築方法が提供される。
なお、上記実施形態において、基準SSID設定部22が、各端末T1〜Tnの各接続履歴H1〜Hnとは関係なく定めた基準SSIDを基準SSIDデータベース30に記憶させる例を説明した。
しかしながら、これに代えて、上述した各端末T1〜Tnの各接続履歴H1〜Hnから、実質的にそれぞれの端末T1〜Tnのユーザの所属地を特定し得る文字列を含むSSIDを抽出し、抽出したSSIDを当該所属地に紐付けて基準SSIDに設定しても良い。
(第2実施形態)
以下、第2実施形態について、主に図9を参照して説明する。なお、第1実施形態と同様の要素には同一の符号を付し、その説明を省略する。本実施形態では、特に、設定部26による学習後SSIDの設定処理(図7のステップS400)の詳細が第1実施形態と異なる。
図9は、本実施形態における学習後SSIDの設定処理を説明するフローチャートである。図示のように、本実施形態では、上記ステップS400における学習後SSIDの設定処理として、以下に具体的に説明するステップS410〜ステップS450の各処理が実行される。
先ず、ステップS410において、分析装置20の設定部26は、学習用SSIDデータベース40から所属地に暫定的に紐付けられた学習用SSID(図5参照)を読み出す。
ステップS420において、設定部26は、読み出した学習用SSIDの中で、同一の所属地に紐付いた基準SSIDとともに一緒に接続履歴に含まれた回数(以下、単に「履歴共有回数」とも記載する)を演算する。なお、設定部26は、履歴共有回数が1と演算される学習用SSIDは、当該処理の対象から除外する。
図3〜図5に示した例に基づいてより具体的に説明すると、例えば、学習用SSID「x36」は、同一の所属地である「韓国」に紐付いた基準SSID「C」又は「D」とともに共通の接続履歴H3及びH4に含まれている。したがって、図3〜図5に示した範囲においては、設定部26は、学習用SSID「x36」の履歴共有回数を「2」と演算する。
ステップS430において、設定部26は、学習用SSIDの履歴共有回数が第1閾値Th1以上であるか否かを判定する。設定部26は、学習用SSIDの履歴共有回数が第1閾値Th1以上であると判定すると、ステップS440に移行する。
ステップS440において、設定部26は、履歴共有回数が第1閾値Th1以上であると判定した学習用SSIDを学習後SSIDに設定する。
ここで、本実施形態では、履歴共有回数が第1閾値Th1以上となる学習用SSIDは、ユーザの所属地の分析に用いるにあたり、一定の信頼性を備えていると判断し、これを学習後SSIDに設定することとなる。このため、第1閾値Th1は、かかる信頼性を損なわないようにする観点から定まる十分に大きい数に設定されることが好適である。
一方、設定部26は、上記ステップS430において、学習用SSIDの履歴共有回数が第1閾値Th1以上ではないと判定した場合(第1閾値Th1未満であると判定した場合)、ステップS450以降の処理に移行する。
すなわち、ステップS450以降の処理は、履歴共有回数のみに基づいて学習用SSIDを学習後SSIDに設定できる程度に、当該履歴共有回数の大きさが達していない場合を想定している。この場合には、設定部26は、ステップS450以降の判定処理の結果に基づいて、学習用SSIDを学習後SSIDに設定する処理、又は学習用SSIDを破棄する処理を実行することとなる。
より具体的に、ステップS450において、設定部26は、学習用SSIDの履歴共有回数が第2閾値Th2以上であるか否かを判定する。ここで、第2閾値Th2は、第1閾値Th1よりも小さい値に設定される。
特に、第2閾値Th2は、履歴共有回数がこれを越えたことをもって即座に学習用SSIDを学習後SSIDに設定可能と判断できるほどの信頼性は無いものの、履歴共有回数が第2閾値Th2を越えていれば、他の重み付け要素によっては、ユーザの所属地の分析に用いるにあたり一定の信頼性がある可能性があるか否かという観点から定められる。
したがって、設定部26は、学習用SSIDの履歴共有回数が第2閾値Th2以上であると判定すると、他の重み付け要素を考慮するためのステップS460の判定に移行する。一方、設定部26は、学習用SSIDの履歴共有回数が第2閾値Th2以上ではないと判定すると(第2閾値Th2未満であると判定すると)、ステップS470に移行して学習用SSIDを破棄する。
そして、ステップS460において、設定部26は、学習用SSIDに所定の重み付け係数を設定し、当該重み付け係数が所定値以上であるか否かを判定する。すなわち、当該判定は、実質的に、履歴共有回数が第2閾値Th2以上である学習用SSIDが、他の重み付け要素を考慮した上で学習後SSIDに設定する信頼性を有するか否かを判断するものである。
ここで、重み付け係数を設定するためのアルゴリズムは種々の観点から定めることができる。例えば、学習用SSIDに、当該学習用SSIDと同じ接続履歴に含まれる基準SSIDに紐付けられた所属地を直接的に示唆する文字列(例えば、「Japan」、「Korea」、及び「China」など)が含まれている場合、又は当該所属地と間接的に示唆する文字列が含まれている場合に、これらを重み付け要素として重み付け係数を設定するようにしても良い。特に、この場合、当該学習用SSIDに含まれる文字列と当該所属地の間の関連性を適切なスケールで数値化したものを重み付け係数に設定することができる。
そして、上記ステップS460において、設定部26は、重み付け係数が所定値以上であると判定するとステップS440に移行し、学習用SSIDを学習後SSIDに設定する。一方、設定部26は、重み付け係数が所定値未満であると判定すると、ステップS470に移行して学習後SSIDを破棄する。
なお、本実施形態の設定部26は、上記ステップS430以降の処理を、上記ステップS420において履歴共有回数が2以上と演算された全ての学習用SSIDに対して実行する。
以上説明した第2実施形態にかかる所属地分析用データ構築システム10によれば、以下の作用効果を奏する。
本実施形態の所属地分析用データ構築システム10では、設定部26は、学習用SSIDが基準SSIDと一緒に接続履歴に含まれる回数としての履歴共有回数及び該履歴共有回数以外の重み付け要素に基づいて、学習用SSIDを学習後SSIDに設定する。
これにより、ユーザの所属地の分析に用いる観点からの学習後SSIDの信頼性をより向上させることができる。
なお、本実施形態の所属地分析用データ構築システム10の変形例として、履歴共有回数が第1閾値Th1以上となるかどうかのみに基づいて、学習用SSIDを学習後SSIDに設定するかどうかを決定するシステムを構成しても良い。すなわち、図9において、ステップS450及びステップS460を省き、ステップS430において学習用SSIDの履歴共有回数が第1閾値Th1未満と判定された場合、ステップS470において当該学習用SSIDを破棄するように設定部26を構成しても良い。
また、本実施形態の設定部26が、基準SSIDに対して所定の統計処理に基づいて相関が高い学習用SSIDを学習後SSIDに設定する設定処理を行うように構成されても良い。統計処理としては、適宜、ロングテール分布を用いた解析及び回帰分析等の統計的な解析手法を適用することができる。
例えば、ある所属地に暫定的に紐付けられた各学習用SSIDを横軸に設定し、縦軸に当該学習用SSIDが基準SSIDと同一の接続履歴に含まれた回数を設定し、縦軸の大きさが第1閾値Th1以上となる学習用SSIDを学習後SSIDとして設定するように設定部26を構成しても良い。
(第3実施形態)
以下、第3実施形態について、主に図10及び図11を参照して説明する。なお、第1実施形態又は第2実施形態と同様の要素には同一の符号を付し、その説明を省略する。本実施形態では、特に、基準SSID設定部22による基準SSID設定処理(図7のステップS200)が第1実施形態及び第2実施形態と異なる。
図10は、本実施形態による所属地分析用データ構築システム10の構成を説明する図である。なお、図10では各データベース30、40、50は省略する。図示のように、本実施形態では、所属地分析用データ構築システム10が、ネットワーク200を介して複数(図10では3つ)の端末群TP1、TP2、TP3と個別に通信可能に構成されている。
本実施形態において、これら複数の端末群TP1、TP2、TP3は、各アクセスポイントP1、アクセスポイントP2、及びアクセスポイントP3に接続される。すなわち、複数の端末群TP1に記憶された接続履歴には、アクセスポイントP1のSSIDが含まれる。同様に、複数の端末群TP2に記憶された接続履歴には、アクセスポイントP2のSSIDが含まれる。さらに、複数の端末群TP3に記憶された接続履歴には、アクセスポイントP3のSSIDが含まれる。
ここで、アクセスポイントP1、アクセスポイントP2、及びアクセスポイントP3は相互に異なる設置場所L1、L2、L3に設置されている。例えば、アクセスポイントP1の設置場所L1は「東京」、アクセスポイントP2の設置場所L2は「ソウル」、アクセスポイントP3の設置場所L3は「上海」などのように設定される。
ここで、所属地分析用データ構築システム10の分析装置20は、例えば、端末群TP1を構成するそれぞれの端末がアクセスポイントP1に接続するタイミングで、当該それぞれの端末に含まれる各接続履歴からなる接続履歴群HP1を取得する。同様に、端末群TP2及び端末群TP3にかかるそれぞれの接続履歴群HP2及び接続履歴群HP3も同様に取得する。
なお、各端末群TP1〜TP3からそれぞれの接続履歴群HP1〜HP3の取得するための構成は、例えば、アクセスポイントP1、P2、及びP3の周辺に、各端末と各アクセスポイントP1、P2、及びP3との間の通信(特に各端末が送信する接続履歴)を受信する無線センサを設け、この無線センサと所属地分析用データ構築システム10を適切な通信方式で通信させることで実現される。以下では、基準SSID設定部22による処理を説明する。
図11は、本実施形態による基準SSIDを設定するためのロジックの一例を説明するフローチャートである。なお、以下では説明の簡略化のため、設置場所L1に設置されたアクセスポイントP1と通信する端末群TP1の各接続履歴群HP1に基づいた基準SSIDの設定についてのみ説明する。しかしながら、以下の処理は、各接続履歴群HP2、及び各接続履歴群HP3についても同様に適用できる。
図示のように、本実施形態では、ステップS210において、基準SSID設定部22は、接続履歴群HP1の端末群TP1からの取得場所(設置場所L1)を、端末群TP1の「所属地」としてメモリ等に記憶する。
ステップS211において、基準SSID設定部22は、端末群TP1の接続履歴群HP1を構成する接続履歴の中に、所定数以上共通して含まれるSSIDが存在するか否かを判定する。そして、基準SSID設定部22は、このようなSSIDが存在すると判定するとステップS212の処理に移行する。
ステップS212において、基準SSID設定部22は、上記SSIDを適格SSIDに設定する。
そして、ステップS213において、基準SSID設定部22は、適格SSIDを基準SSIDに設定する。より詳細には、基準SSID設定部22は、上記ステップS210において記憶された「所属地」を適格SSIDに関連付け、これを所属地に紐付けられた基準SSIDとして基準SSIDデータベース30に記憶させる。
なお、基準SSID設定部22は、上記ステップS211において、共通のSSIDが存在しないと判定すると、ステップS214に移行し、他のロジック(例えば図8に基づいて説明したロジック)により、基準SSIDを設定する。
以上説明した第3実施形態にかかる所属地分析用データ構築システム10によれば、以下の作用効果を奏する。
本実施形態の基準SSID設定部22は、特定の場所(設置場所L1)において複数の端末である端末群TP1から取得された過去のアクセスポイントへの接続履歴としての接続履歴群HP1に所定回数以上共通して含まれるSSIDを適格SSIDとして設定し(ステップS212参照)、この適格SSIDを、設置場所L1を所属地とみなして基準SSIDに設定する(ステップS213)。
これにより、基準SSIDの設定方法のバリエーションを増やすことができるので、より汎用性の高いユーザの所属地分析の実現に資することとなる。
特に、本実施形態では、アクセスポイントP1の設置場所L1は「東京」、アクセスポイントP2の設置場所L2は「ソウル」、アクセスポイントP3の設置場所L3は「上海」である。そして、端末群TP1を構成する複数の端末、端末群TP2を構成する複数の端末、端末群TP3を構成する複数の端末は、各設置場所L1、L2、L3のアクセスポイントP1、P2、P3に接続されることとなる。
ここで、例えば、設置場所L1としての「東京」に設置されたアクセスポイントP1に接続される端末群TP1を構成する端末のユーザの所属地は「日本」である可能性が比較的高いと推測できる。
逆に、端末群TP1を構成する複数の端末の各接続履歴の多くに共通して含まれている学習用SSIDは、所属地を「日本」とするユーザが使用する端末である可能性が高いと判断できる。同様の理由で、端末群TP2を構成する複数の端末の各接続履歴の多くに共通して含まれている学習用SSIDは、所属地を「韓国」とするユーザが使用する端末である可能性が高いと判断できる。さらに、端末群TP3を構成する複数の端末の各接続履歴の多くに共通して含まれている学習用SSIDは、所属地を「中国」とするユーザが使用する端末である可能性が高いと判断できる。
そして、本実施形態では、このような学習用SSIDを基準SSIDとすることで、ユーザの所属地の分析にあたり、当該分析の信頼性を確保しつつ利用可能な基準SSIDのバリエーションを広げることができる。
なお、本実施形態において、分析の対象であるユーザの所属地は上述した「日本」、「韓国」、及び「中国」等の「国」に限定されるものではない。すなわち、上述のように、アクセスポイントP1〜P3の設置場所L1〜L3として「東京」、「ソウル」、及び「韓国」を想定している例を説明していることから理解されるように、例えば「都市」及び「町」等の「国」よりも細かい単位の所属地に対して本実施形態の所属地分析用データ構築システム10の構成を適用しても良い。
これにより、国籍又は居住国よりも詳細な範囲におけるユーザの所属地の分析が可能となる。
(第4実施形態)
以下、第4実施形態について説明する。なお、上記第1実施形態〜第3実施形態の少なくとも何れかと同様の要素には同一の符号を付し、その説明を省略する。
本実施形態の基準SSID設定部22は、上記各実施形態において説明した設定部26によって設定された学習後SSIDを基準SSIDに設定する。そして、再度、この基準SSIDに基づいて、図7のステップS300及びステップS400の処理を実行して、学習後SSIDを設定する。
これにより、初めに設定された基準SSIDに基づいて設定された学習後SSIDも、さらなる学習後SSIDを設定するための基準SSIDとして用いることができる。この結果、本実施形態の所属地分析用データ構築システム10に用いることのできる基準SSIDの数がより一層増加することとなり、より一層広範な所属地分析が実現されることとなる。
(第5実施形態)
以下、第5実施形態について、主に図12及び図13を参照して説明する。なお、上記第1実施形態〜第4実施形態の少なくとも何れかと同様の要素には同一の符号を付し、その説明を省略する。本実施形態では、上記第1実施形態〜第4実施形態で説明した所属地分析用データ構築システム10の何れかを含む所属地分析システム80が提供される。
図12は、本実施形態による所属地分析システム80の構成を説明する図である。なお、図12では分析装置20及び各データベース30、40、50は省略する。
図示のように、本実施形態の所属地分析システム80は、ネットワーク300を介して複数(図12では3つのみ示す)の判定対象端末O1、O2、O3と個別に通信可能に構成されている。
また、所属地分析システム80は、上記第1実施形態〜第4実施形態で説明した構成の何れかの構成を備えた所属地分析用データ構築システム10と、接続履歴取得部60と、判断部70と、を備えている。また、所属地分析用データ構築システム10の学習後SSIDデータベース50が、本実施形態の判定用データベースとして機能する。
そして、接続履歴取得部60は、複数の判定対象端末O1、O2、O3が有するアクセスポイントへの接続履歴を取得する。
判断部70は、学習後SSIDデータベース50を参照し、判定対象端末O1、O2、O3の各接続履歴に基づいて判定対象端末O1、O2、O3の各ユーザの所属地を判定する。
より詳細には、判断部70は、判定対象端末O1から取得された接続履歴に、学習後SSIDデータベース50に記憶されている学習後SSIDと一致するSSIDがあるか否かを判定する。そして、判断部70は、判定対象端末O1の接続履歴に学習後SSIDと一致するSSIDと判定した場合、学習後SSIDに紐付けられた所属地を、判定対象端末O1のユーザの所属地と判断する。
そして、判断部70は、同様の処理を、判定対象端末O2の接続履歴及び判定対象端末O3の接続履歴に対しても実行する。
以上、説明した本実施形態の所属地分析システム80は、第1実施形態〜第4実施形態の何れかで説明した所属地分析用データ構築システム10と、所定の判定対象端末O1、O2、O3が有する接続履歴である判定対象接続履歴を取得する接続履歴取得部60と、
学習後SSID及び判定対象接続履歴に基づいて、判定対象端末O1、O2、O3のユーザの所属地を判断する判断部70と、を備える。
これにより、学習後SSIDを用いたユーザの所属地の分析の一態様として、判定対象端末O1、O2、O3の各ユーザの所属地を実際に判定することが可能となる。
なお、本実施形態では、判断部70によるユーザの所属地の判断にあたり、判定対象端末O1〜O3の各接続履歴に学習後SSIDと一致するSSIDがあるか否かを判定する例を説明した。一方で、これに加え、判定対象端末O1〜O3の各接続履歴に、高い信頼性でユーザの所属地と紐付けられている基準SSIDと一致するSSIDがあるか否かを判定する処理を加えても良い。
例えば、図13に示すステップS600〜ステップS650の処理にしたがうことで、判定対象端末O1〜O3の各接続履歴に学習後SSID又は基準SSIDと一致するSSIDが存在する場合に、ユーザの所属地を判断することが可能となる。これにより、判断部70によるユーザの所属地の判断の汎用性がより向上する。また、図13のステップS630における判断は、各ユーザの所属地の確定的判断に代えて、判定対象端末O1〜O3の各接続履歴に含まれる学習後SSID又は基準SSIDの数、或いは当該学習後SSID又は基準SSIDの重要度に応じて、あるユーザの所属地が特定の国である確率を判断する態様であっても良い。
以上、本発明の各実施形態について説明したが、上記各実施形態は本発明の適用例の一部を示したに過ぎず、本発明の技術的範囲を上記各実施形態の具体的構成に限定する趣旨ではない。
例えば、上記各実施形態における所属地分析用データ構築システム10の各ハードウェア構成及びソフトウェア構成は一態様であり、本発明の技術的範囲に含まれる範囲で任意に変更が可能である。一例として、所属地分析用データ構築システム10における各ハードウェア構成及び各ソフトウェア構成は、一台のコンピュータで実現されても良いし、適宜複数台のコンピュータの機能を統合させて実現するようにしても良い。
また、各端末の数、閲覧履歴Hの数、基準SSIDの数、学習用SSIDの数、及び学習後SSIDの数などは、上記各実施形態における説明及び図面に開示された範囲に限定されるものではなく、適宜変更が可能である。
また、上記各実施形態では、「所属地」が「国」である場合を中心的に説明し、特に「国」として「日本」、「韓国」、及び「中国」を例示している。しかしながら、「国」はこれらに限定されるものではない。例えば、「アメリカ」などの他の国を含む場合について、上記各実施形態の所属地分析用データ構築システム10の構成を適用することができる。
さらに、上記各実施形態における「所属地」とは、「都市」及び「市町村」等の「国」以外の場所に置き換えることも可能である。すなわち、「所属地」としては、過去に任意のアクセスポイントに接続したことのある端末のユーザが、一定以上の期間に亘って居住又は滞在している特定の場所、又は当該ユーザを実質的に管理する国家若しくは自治体などの意義であり、当該意義の範囲内に含まれる具体例であれば任意に採用することができる。
また、上記各実施形態において「アクセスポイントへの接続」とは、端末がアクセスポイントと通信を行い、且つ端末がアクセスポイントを介して無線通信を利用可能となった状態を意味する。例えば、電気通信事業者が提供するアクセスポイントによっては、契約等に基づいて権限を有していないユーザの端末であってもアクセスポイントとの通信は可能であるものの、アクセスポイントを介した無線通信の利用はできないという場合が想定される。したがって、このような場合における端末とアクセスポイントとの間の通信は、上記各実施形態における「アクセスポイントへの接続」には含まれない。
上記各実施形態の構成は、論理的に矛盾しない範囲で相互に組み合わせることが可能である。