JP6274973B2 - ユーザ特定装置、ユーザ特定方法、およびプログラム - Google Patents

ユーザ特定装置、ユーザ特定方法、およびプログラム Download PDF

Info

Publication number
JP6274973B2
JP6274973B2 JP2014111759A JP2014111759A JP6274973B2 JP 6274973 B2 JP6274973 B2 JP 6274973B2 JP 2014111759 A JP2014111759 A JP 2014111759A JP 2014111759 A JP2014111759 A JP 2014111759A JP 6274973 B2 JP6274973 B2 JP 6274973B2
Authority
JP
Japan
Prior art keywords
sns
user
friendship
range
browsing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014111759A
Other languages
English (en)
Other versions
JP2015225613A (ja
Inventor
亮博 小林
亮博 小林
啓一郎 帆足
啓一郎 帆足
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2014111759A priority Critical patent/JP6274973B2/ja
Publication of JP2015225613A publication Critical patent/JP2015225613A/ja
Application granted granted Critical
Publication of JP6274973B2 publication Critical patent/JP6274973B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、SNSにおけるユーザ識別子を特定するユーザ特定装置、ユーザ特定方法、およびプログラムに関する。
匿名のソーシャル・ネットワーキング・サービス(SNS)上で、企業にとって問題ある発言があった場合、その発言が内部の人間が行ったものであるか確認したいというニーズが、企業にはあると考えられる。
ところで、これまで企業が行ってきたセキュリティ対策には、社内のWebアクセス履歴の収集がある。Webアクセス履歴を確認することで、例えば、企業にとって問題ある発言がされたWebページXにアクセスした社員を割り出すことができる。一方で、WebページXの記述内容から、その投稿者である匿名ユーザAを特定することができる。しかしながら、WebページXにアクセスした社員は匿名ユーザAが記述したWebページXを閲覧しただけの可能性もあり、社員を匿名ユーザAであると特定することはできなかった。
そこで、SNSへの書き込みや削除といった、アクセス可能なユーザが限られたURLをWebアクセス履歴から抽出し、抽出したURLのページへのWebアクセス履歴を持つ者をそのページの投稿者と特定する技術が提案されている(例えば、特許文献1参照)。
特開2013−45322号
しかしながら、SNSによっては、ユーザが発言の削除を滅多に行わない場合や、そもそも発言の書き込みが少ない場合もある。また、SNSによっては、セキュリティの向上のために、実行可能なユーザが限られる行為(例えば、書き込みや削除)は暗号化して通信していることも多く、Webアクセス履歴に残らない場合もある。このような場合には、特許文献1の技術では、Webアクセスの履歴から、問題ある発言がされたWebページの投稿者を特定することは困難であるという問題点があった。
そこで、本発明は、上記課題に鑑み、Webアクセス履歴から得られるユーザのSNS上の閲覧範囲と、SNSに構築されている交友範囲とからSNSにおけるユーザ識別子を特定するユーザ特定装置、ユーザ特定方法、およびプログラムを提供することを目的とする。
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
(1) 本発明は、Webアクセス履歴を取得、蓄積する履歴サーバ(例えば、図1のプロキシサーバ10に相当)、およびSNSサーバ(例えば、図1のSNSサーバ20に相当)と接続され、ユーザのSNSにおけるユーザ識別子を特定するユーザ特定装置であって、前記履歴サーバに蓄積されている前記ユーザのSNSへのWebアクセス履歴に基づいて、前記ユーザが前記SNSにおいてWebページの閲覧を介して交友を行ったSNSユーザの範囲を示す閲覧交友範囲を取得する閲覧交友範囲取得手段(例えば、図1のアクセス履歴取得部110および閲覧交友範囲取得部120に相当)と、前記SNSサーバから、前記SNSにおける各SNSユーザの交友関係の範囲を示すSNS交友範囲を取得するSNS交友範囲取得手段(例えば、図1のSNS交友範囲取得部130に相当)と、前記SNS交友範囲取得手段で取得した前記各SNSユーザの前記SNS交友範囲と、前記閲覧交友範囲取得手段で取得した前記閲覧交友範囲との類似度を算出する範囲類似度算出手段(例えば、図1の交友範囲類似度算出部140に相当)と、前記範囲類似度算出手段で算出した類似度が高いSNS交友範囲を有するSNSユーザのユーザ識別子を、前記ユーザのSNSにおけるユーザ識別子として特定するユーザ特定手段(例えば、図1のユーザ特定部150に相当)と、を備えることを特徴とするユーザ特定装置を提案している。
(2) 本発明は、(1)のユーザ特定装置において、前記閲覧交友範囲取得手段が、前記閲覧交友範囲として、前記ユーザのSNSへのWebアクセス履歴に基づいて、前記SNSの各ユーザとの閲覧による交友状態を数値化し、当該数値化された交友状態を要素とするアクセスベクトルを取得し、前記SNS交友範囲取得手段が、前記SNS交友範囲として、前記各SNSユーザについて、前記SNSにおける交友関係を数値化し、当該数値化された交友関係を要素とする交友ベクトルを取得し、前記範囲類似度算出手段が、前記SNS交友範囲取得手段で取得した前記交友ベクトルと、前記閲覧交友範囲取得手段で取得した前記アクセスベクトルとの内積を、前記類似度として算出することを特徴とするユーザ特定装置を提案している。
(3) 本発明は、(2)ユーザ特定装置において、前記交友状態が、前記ユーザのSNSへのWebアクセス履歴に基づいて、前記SNSの各ユーザへの接触頻度により重み付けして数値化されることを特徴とするユーザ特定装置を提案している。
(4) 本発明は、(2)または(3)のユーザ特定装置において、前記交友関係が、前記SNSサーバから取得したSNSユーザ間の発言頻度により重み付けして数値化されることを特徴とするユーザ特定装置を提案している。
(5) 本発明は、(2)から(4)のユーザ特定装置において、前記SNSサーバから取得した前記SNSにおける各SNSユーザの交友関係に基づいて、前記SNSにおけるユーザグループを解析するユーザグループ解析手段(図2のSNS交友範囲取得部131に相当)を備え、前記交友関係が、前記ユーザグループ解析手段で解析されたユーザグループに属するか否かによって重み付けして数値化されることを特徴とするユーザ特定装置を提案している。
(6) 本発明は、(1)から(5)のユーザ特定装置において、前記ユーザのSNSへのWebアクセス履歴に基づいて取得した、前記ユーザが前記SNSにおいてWebページの閲覧を介して交友を行ったSNSユーザを記憶する対象SNSユーザ記憶手段(例えば、図4の対象SNSユーザ記憶部170に相当)を備え、前記対象SNSユーザ記憶手段に記憶されているSNSユーザに関するWebページへの前記ユーザのWebアクセス履歴を、当該ユーザのSNSへのWebアクセス履歴として前記履歴サーバから取得することを特徴とするユーザ特定装置を提案している。
(7) 本発明は、(1)から(6)のユーザ特定装置において、前記履歴サーバが、前記SNSサーバから取得した前記SNSにおける各SNSユーザの交友関係に基づいて、取得、蓄積するWebアクセス履歴を決定することを特徴とするユーザ特定装置を提案している。
(8) 本発明は、Webアクセス履歴を取得、蓄積する履歴サーバ、およびSNSサーバと接続され、ユーザのSNSにおけるユーザ識別子を特定するユーザ特定装置におけるユーザ特定方法であって、前記ユーザ特定装置が、閲覧交友範囲取得手段、SNS交友範囲取得手段、範囲類似度算出手段、およびユーザ特定手段を備え、前記閲覧交友範囲取得手段が、前記履歴サーバに蓄積されている前記ユーザのSNSへのWebアクセス履歴に基づいて、前記ユーザが前記SNSにおいてWebページの閲覧を介して交友を行ったSNSユーザの範囲を示す閲覧交友範囲を取得する第1のステップ(例えば、図2のステップS1およびS2に相当)と、前記SNS交友範囲取得手段が、前記SNSサーバから、前記SNSにおける各SNSユーザの交友関係の範囲を示すSNS交友範囲を取得する第2のステップ(例えば、図2のステップS3に相当)と、前記範囲類似度算出手段が、前記SNS交友範囲取得手段で取得した前記各SNSユーザの前記SNS交友範囲と、前記閲覧交友範囲取得手段で取得した前記閲覧交友範囲との類似度を算出する第3のステップ(例えば、図2のステップS4に相当)と、前記ユーザ特定手段が、前記範囲類似度算出手段で算出した類似度が高いSNS交友範囲を有するSNSユーザのユーザ識別子を、前記ユーザのSNSにおけるユーザ識別子として特定する第4のステップ(例えば、図2のステップS5に相当)と、を備えることを特徴とするユーザ特定方法を提案している。
(9) 本発明は、Webアクセス履歴を取得、蓄積する履歴サーバ、およびSNSサーバと接続され、ユーザのSNSにおけるユーザ識別子を特定するユーザ特定装置におけるユーザ特定方法をコンピュータに実行させるためのプログラムであって、前記ユーザ特定装置が、閲覧交友範囲取得手段、SNS交友範囲取得手段、範囲類似度算出手段、およびユーザ特定手段を備え、前記閲覧交友範囲取得手段が、前記履歴サーバに蓄積されている前記ユーザのSNSへのWebアクセス履歴に基づいて、前記ユーザが前記SNSにおいてWebページの閲覧を介して交友を行ったSNSユーザの範囲を示す閲覧交友範囲を取得する第1のステップ(例えば、図2のステップS1およびS2に相当)と、前記SNS交友範囲取得手段が、前記SNSサーバから、前記SNSにおける各SNSユーザの交友関係の範囲を示すSNS交友範囲を取得する第2のステップ(例えば、図2のステップS3に相当)と、前記範囲類似度算出手段が、前記SNS交友範囲取得手段で取得した前記各SNSユーザの前記SNS交友範囲と、前記閲覧交友範囲取得手段で取得した前記閲覧交友範囲との類似度を算出する第3のステップ(例えば、図2のステップS4に相当)と、前記ユーザ特定手段が、前記範囲類似度算出手段で算出した類似度が高いSNS交友範囲を有するSNSユーザのユーザ識別子を、前記ユーザのSNSにおけるユーザ識別子として特定する第4のステップ(例えば、図2のステップS5に相当)と、を含むことを特徴とするプログラムを提案している。
本発明によれば、Webアクセス履歴から得られるユーザのSNS上の閲覧範囲と、SNSに構築されている交友範囲とからSNSにおけるユーザ識別子を特定することができる。
本発明の第1の実施形態に係るユーザ特定装置の機能構成を示す図である。 本発明の第1の実施形態に係るユーザ特定装置におけるユーザ特定処理フローを示す図である。 本発明の第2の実施形態に係るユーザ特定装置の機能構成を示す図である。 本発明の第3の実施形態に係るユーザ特定装置の機能構成を示す図である。
以下、図面を用いて、本発明の実施形態について詳細に説明する。なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
実施可能なユーザが限られる行為(例えば、書き込みや削除)は暗号化して通信されるためにWebアクセス履歴は残らないが、モバイル機器への負荷を考慮し、閲覧といった実施可能なユーザが限られない行為については暗号化がされていないのでWebアクセス履歴は残っている。また、SNSにおいてユーザが閲覧する閲覧範囲は、ユーザのSNSにおける交友関係に影響を受けるといえる。これらのことを利用して、本実施形態でユーザが閲覧した閲覧交友範囲とユーザのSNSにおけるSNS交友範囲とに基づいて、ユーザのSNSにおけるユーザ識別子(以下、SNSIDという)を特定する。
<第1の実施形態>
図1は、本発明の第1の実施形態に係るユーザ特定装置100の機能構成を示す図である。ユーザ特定装置100は、Webアクセス履歴から得られるユーザのSNS上の閲覧交友範囲と、SNSに構築されている交友関係に基づく各SNSユーザのSNS交友範囲とから、ユーザがSNS上に持つSNSユーザのユーザ識別子を特定する装置である。ユーザ特定装置100は、プロキシサーバ10およびSNSを提供するSNSサーバ20と接続される。
プロキシサーバ10は、社内や大学といった組織のLANに接続された端末から外部インターネットへの接続を中継するサーバであって、端末からWebページへのWebアクセス履歴を取得・蓄積する。Webアクセス履歴には、Webページにアクセスしたアクセス日時、アクセス先WebページのURL、およびWebページにアクセスしたユーザのユーザIDが含まれる。
プロキシサーバ10が、全てのWebアクセス履歴を取得・蓄積すると、大量のデータを扱う必要があり、システム負荷が高くなってしまう。そこで、予め、プロキシサーバ10が取得・蓄積するWebアクセス履歴を、SNSにおける交友関係に基づいて限定してもよい。例えば、SNSにおいて交友関係が広い人、いわゆる有名人のWebページへのWebアクセス履歴は取得しないとする。対象ユーザが有名人のページにアクセスしたという情報は、対象ユーザのSNSIDを特定する上で、価値が低い情報だからである。
本実施形態においては、プロキシサーバ10とユーザ特定装置100とは独立しているが、プロキシサーバ10をユーザ特定装置100としてもよい。
ユーザ特定装置100は、図1に示すように、アクセス履歴取得部110、閲覧交友範囲取得部120、SNS交友範囲取得部130、交友範囲類似度算出部140、およびユーザ特定部150を備える。
アクセス履歴取得部110は、SNS上にもつSNSユーザのユーザ識別子(以下、SNSIDという)を特定したいユーザ(以下、対象ユーザという)のユーザIDに基づいて、プロキシサーバ10からWebアクセス履歴を取得する。なお、Webアクセス履歴を取得する際に、期間や対象とするSNSといった条件を設定してもよい。
閲覧交友範囲取得部120は、アクセス履歴取得部110で取得したWebアクセス履歴に基づいて、対象ユーザがSNSにおいてWebページの閲覧を介して交友を行ったSNSユーザの範囲を示す閲覧交友範囲を取得する。Webアクセス履歴に、複数のSNSのWebページに関するものが含まれている場合には、閲覧交友範囲取得部120はSNS毎に閲覧交友範囲は取得し、取得した閲覧交友範囲それぞれについて後述する処理が行われる。なお、以下、アクセス履歴取得部110で取得したWebアクセス履歴には、複数のSNSではなく一のSNSのWebページに関するものが含まれているとする。
閲覧交友範囲取得部120は、具体的には、まず、アクセス履歴取得部110で取得したアクセス履歴それぞれから、対象ユーザがアクセスしたWebページのURLを特定する。次に、閲覧交友範囲取得部120は、特定したURLのページ内容を解析して、そのページに投稿したSNSユーザのSNSIDを取得する。なお、一のWebページに複数SNSユーザが投稿している場合には、投稿した全SNSユーザのSNSIDを取得してもよいし、最初に投稿したSNSユーザのSNSIDのみを取得してもよい。そして、閲覧交友範囲取得部120は、各Webページから取得したSNSIDをリスト化した閲覧交友リストを閲覧交友範囲として取得する。
SNS交友範囲取得部130は、SNSにおける各SNSユーザの交友関係を示すSNS交友範囲を取得する。具体的には、SNS交友範囲取得部130は、SNSユーザ毎に、SNSユーザと交友関係にあるSNSユーザのSNSIDをリスト化したSNS交友リストをSNS交友範囲として、SNSサーバ20から取得する。
交友範囲類似度算出部140は、SNS交友範囲取得部130で取得したSNS交友範囲それぞれについて、閲覧交友範囲取得部120で取得した閲覧交友範囲との類似度を算出する。具体的には、SNS交友範囲であるSNS交友リストに含まれるSNSIDと、閲覧交友範囲である閲覧交友リストに含まれるSNSIDとがどの程度一致しているかを、交友範囲類似度算出部140は類似度として算出する。
ユーザ特定部150は、交友範囲類似度算出部140で算出した類似度が最も高いSNS交友範囲を持つSNSユーザのSNSIDを、対象ユーザのSNSでのSNSIDと特定する。そして、ユーザ特定部150は、特定したSNSIDや、特定したSNSIDと対象ユーザのユーザIDとの組合せを出力する。SNSにおいて閲覧する閲覧範囲は、ユーザのSNSにおける交友関係に影響を受けるといえるので、対象ユーザの閲覧交友範囲と類似度が高いSNS交友範囲のSNSユーザは、対象ユーザと同一人物であると特定することができる。
なお、ユーザ特定部150は、交友範囲類似度算出部140で算出された類似度が所定値以上のSNS交友範囲がない場合には、対象ユーザのSNSでのSNSIDはないと特定してもよい。類似度が低いSNS交友範囲をもつSNSユーザは、対象ユーザと同一人物であるとは特定できる可能性が低いからである。
また、ユーザ特定部150は、交友範囲類似度算出部140で算出した類似度が所定値以上のSNS交友範囲を持つSNSユーザのSNSIDを、対象ユーザのSNSID候補として記憶しておき、定期的に同様の処理を繰り返し行って、候補として特定されることが最も多いSNSIDを対象ユーザのSNSIDとしてもよい。プロキシサーバ10のWebアクセス履歴の保存期間が短い場合や、プロキシサーバ10が記憶できるWebアクセス履歴が限られている場合に、有益である。
図2は、本実施形態に係るユーザ特定装置100におけるユーザ特定処理フローを示す図である。
まず、ステップS1において、アクセス履歴取得部110は、対象ユーザのユーザIDに基づいて、プロキシサーバ10からWebアクセス履歴を取得する。
次に、ステップS2において、閲覧交友範囲取得部120は、ステップS1で取得したWebアクセス履歴に基づいて、対象ユーザがSNSにおいてWebページの閲覧を介して交友を行った範囲である閲覧交友範囲を取得する。
次に、ステップS3において、SNS交友範囲取得部130は、SNSにおける各SNSユーザの交友関係を示すSNS交友範囲を取得する。
次に、ステップS4において、交友範囲類似度算出部140は、ステップS3で取得したSNS交友範囲それぞれについて、ステップS2で取得した閲覧交友範囲との類似度を算出する。
次に、ステップS5において、ユーザ特定部150は、交友範囲類似度算出部140で算出した類似度が高いSNS交友範囲を持つSNSユーザのSNSIDを、対象ユーザのSNSでのSNSIDと特定する。
以上、説明したように、本実施形態によれば、Webアクセス履歴から得られるユーザの閲覧交友範囲とSNSでの交友関係から得られるSNS交友範囲とから、ユーザのSNSにおけるユーザ識別子(SNSID)を特定することができる。
その結果、企業にとって問題ある発言があった場合、その発言が内部の人間が行ったものであるか確認することが可能となる。
<第2の実施形態>
図3を用いて、本発明の第2の実施形態について説明する。第1の実施形態においては、閲覧交友範囲およびSNS交友範囲として、SNSIDのリストを用いたが、本実施形態においては、SNSIDを要素とするベクトル空間を用いる。なお、第1の実施形態と同一の符号を付す構成要素については、同一の機能を有することから、その詳細な説明は省略する。
図3は、本発明の第2の実施形態に係るユーザ特定装置101の機能構成を示す図である。ユーザ特定装置101は、Webアクセス履歴から得られるユーザのSNS上の閲覧交友範囲と、SNSに構築されている交友関係に基づく各SNSユーザのSNS交友範囲とから、ユーザがSNS上に持つSNSユーザのユーザ識別子を特定する装置であって、プロキシサーバ10およびSNSを提供するSNSサーバ20と接続される。
ユーザ特定装置101は、図3に示すように、アクセス履歴取得部110、閲覧交友範囲取得部121、SNS交友範囲取得部131、交友範囲類似度算出部141、およびユーザ特定部150を備える。
閲覧交友範囲取得部121は、アクセス履歴取得部110で取得したWebアクセス履歴に基づいて、対象ユーザがSNSにおいてWebページの閲覧を介して交友を行った範囲である閲覧交友範囲を取得する。Webアクセス履歴に、複数のSNSのWebページに関するものが含まれている場合には、閲覧交友範囲取得部121はSNS毎に閲覧交友範囲は取得し、取得した閲覧交友範囲それぞれについて後述する処理が行われる。なお、以下、アクセス履歴取得部110で取得したWebアクセス履歴には、複数のSNSではなく一のSNSのWebページに関するものが含まれているとする。
具体的には、閲覧交友範囲取得部121は、まず、アクセス履歴取得部110で取得したアクセス履歴それぞれから、対象ユーザがアクセスしたWebページのURLを特定する。次に、閲覧交友範囲取得部121は、特定したURLのWebページ内容を解析して、そのWebページに投稿したSNSユーザのSNSIDを取得する。なお、一のWebページに複数SNSユーザが投稿している場合には、投稿した全SNSユーザのSNSIDを取得してもよいし、最初に投稿したSNSユーザのSNSIDのみを取得してもよい。次に、閲覧交友範囲取得部121は、Webアクセス履歴から取得したSNSIDとSNSサーバ20から取得した全SNSIDとに基づいて、(1)式に示す、各SNSIDへのアクセス有無を数値化して要素とするアクセスベクトルAを閲覧交友範囲として取得する。
Figure 0006274973
アクセスベクトルAのxに、各SNSユーザへの対象ユーザの接触回数を重み付けした値を用いてもよい。ここで、接触回数とは、対象ユーザのSNSユーザへの発言回数、書き込み回数、同意回数等の総回数である。この場合には、xは(2)式で定義される。
Figure 0006274973
SNS交友範囲取得部131は、SNSにおける各SNSユーザの交友関係を示すSNS交友範囲を取得する。具体的には、SNS交友範囲取得部131は、SNSユーザ毎に、SNSユーザと交友関係にあるSNSユーザのSNSIDと、全SNSIDとをSNSサーバ20から取得し、これらに基づいて、(3)式に示す、各SNSユーザと他のSNSユーザとの交友の有無を数値化して要素とする交友ベクトルFをSNS交友範囲として取得する。
Figure 0006274973
一般的に有向グラフ解析における隣接行列生成時は、非特許文献1(D.Austin.“How Google finds your need in the Web‘s haystack.”American Mathematical Society(AMS) Feature Column,(2006).[http://www.ams.org/samplings/feature−column/fcarc−pagerank(2014年5月26日検索)]にあるように、自分自身への接続は無いと解釈してk=iの場合ζ=0と定義する。しかし、本実施形態においては、ユーザは自分自身のWebページを閲覧することも考えられるため、k=iの場合ζ=1とする。
接続ベクトルFのyに、交友の深さを重み付けした値を用いてもよい。交友の深さは、SNSにおけるSNSユーザ間の互いに向けての発言頻度で表し、この場合には、yは、(4)式で定義される。
Figure 0006274973
このように交友の深さで重み付けするのは、SNSユーザiが多くの他SNSユーザと交友関係がある場合でも、SNS上でSNSユーザiとSNSユーザjとの交友が深ければ、SNSユーザiへのアクセス履歴を持つ対象ユーザはSNSユーザjである可能性が高いからである。
また、SNS上でのソーシャルグラフで密接に関係があるユーザ間では、互いの発言頻度が少なくとも、互いの閲覧頻度が高い可能性がある。そこで、SNS交友範囲取得部131は、例えば、非特許文献2(Y.−Y.Ahn,J.P.Bagrow,and S.Lehmann,“Link communities reveal multiscale complexity in networks”, Nature 466, 761 (2010).)に述べられているようなグラフクラスタリング手法を用いて、SNS上のソーシャルグラフから、互いに密接にリンクしあうSNSユーザグループを取り出す。そして、取り出したSNSユーザグループのうちSNSユーザkが属するSNSユーザグループにSNSユーザiが属するか否かに基づいて、SNSユーザiとの交友の有無を示すyに重みをつけてもよい。
交友範囲類似度算出部141は、SNS交友範囲取得部131で取得したSNS交友範囲それぞれについて、閲覧交友範囲取得部121で取得した閲覧交友範囲との類似度を算出する。具体的には、閲覧交友範囲を示すアクセスベクトルAとSNS交友範囲を示す交友ベクトルFとの内積を、交友範囲類似度算出部141は類似度として算出する。
以上、説明したように、本実施形態によれば、閲覧交友範囲およびSNS交友範囲をベクトル空間で表すことで、閲覧交友範囲およびSNS交友範囲の類似度を算出することができる。また、ベクトル空間にSNSユーザ間のアクセス回数や交友の深さにより重み付けすることにより、より精度よくユーザのSNSユーザを特定することができる。
<第3の実施形態>
図4を用いて、本発明の第3の実施形態について説明する。第1の実施形態においては、SNSにおける全SNSユーザそれぞれの交友関係を取得したが、本実施形態では、対象ユーザである可能性が高いSNSユーザそれぞれの交友関係を取得する。なお、第1の実施形態と同一の符号を付す構成要素については、同一の機能を有することから、その詳細な説明は省略する。
図4は、本発明の第3の実施形態に係るユーザ特定装置102の機能構成を示す図である。ユーザ特定装置102は、Webアクセス履歴から得られるユーザのSNS上の閲覧交友範囲と、SNSに構築されている交友関係に基づく各SNSユーザのSNS交友範囲とから、ユーザがSNS上に持つSNSユーザのユーザ識別子を特定する装置であって、プロキシサーバ10およびSNSを提供するSNSサーバ20と接続される。
ユーザ特定装置102は、図4に示すように、アクセス履歴取得部110、閲覧交友範囲取得部120、SNSユーザ絞込み部160、SNSユーザ記憶部170、SNS交友範囲取得部132、交友範囲類似度算出部140、およびユーザ特定部150を備える。
SNSユーザ絞込み部160は、アクセス履歴取得部110で取得されたアクセス履歴に基づいて、SNS交友範囲取得部132でSNSサーバ20から交友関係を取得するSNSユーザのSNSIDを絞り込む。
SNSユーザ絞込み部160は、具体的には、アクセス履歴取得部110で取得したアクセス履歴それぞれから、対象ユーザがアクセスしたWebページのURLを特定する。次に、閲覧交友範囲取得部120は、特定したURLのWebページ内容を解析して、そのWebページに投稿したSNSユーザのSNSIDを取得する。なお、一のWebページに複数SNSユーザが投稿している場合には、投稿した全SNSユーザのSNSIDを取得してもよいし、最初に投稿したSNSユーザのSNSIDのみを取得してもよい。そして、SNSユーザ絞込み部160は、SNS交友範囲取得部132に取得したSNSIDを送信する。対象ユーザがアクセスしていないWebページを投稿したSNSユーザは、対象ユーザである可能性が高いからである。
SNSユーザ記憶部170は、SNSユーザ絞込み部160で取得したSNSIDを記憶する。
SNS交友範囲取得部132は、SNSユーザ記憶部170に記憶されているSNSIDについて、SNSユーザと交友関係にあるSNSユーザのSNSIDをリスト化したSNS交友リストをSNS交友範囲として、SNSサーバ20から取得する。
以上、説明したように、本実施形態によれば、SNSサーバから交友関係を取得するSNSユーザを対象ユーザである可能性があるものに限定することにより、SNSサーバから取得する交友関係を減らし、効率的にSNSサーバから交友関係を取得することができる。それにより、SNSサーバが、利用可能なアクセス数を制限していたり、送受信するデータが従量制課金で料金が必要であったり、SNSの交友関係を自由に取得できない場合に有効である。
なお、ユーザ特定装置の処理をコンピュータシステムが読み取り可能な記録媒体に記録し、この記録媒体に記録されたユーザ特定装置に読み込ませ、実行することによって本発明のユーザ特定装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。更に、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
10 プロキシサーバ
20 SNSサーバ
100,101,102 ユーザ特定装置
110 アクセス履歴取得部
120,121 閲覧交友範囲取得部
130,131,132 SNS交友範囲取得部
140 交友範囲類似度算出部
150 ユーザ特定部
160 SNSユーザ絞込み部
170 SNSユーザ記憶部

Claims (9)

  1. Webアクセス履歴を取得、蓄積する履歴サーバ、およびSNSサーバと接続され、ユーザのSNSにおけるユーザ識別子を特定するユーザ特定装置であって、
    前記履歴サーバに蓄積されている前記ユーザのSNSへのWebアクセス履歴に基づいて、前記ユーザが前記SNSにおいてWebページの閲覧を介して交友を行ったSNSユーザの範囲を示す閲覧交友範囲を取得する閲覧交友範囲取得手段と、
    前記SNSサーバから、前記SNSにおける各SNSユーザの交友関係の範囲を示すSNS交友範囲を取得するSNS交友範囲取得手段と、
    前記SNS交友範囲取得手段で取得した前記各SNSユーザの前記SNS交友範囲と、前記閲覧交友範囲取得手段で取得した前記閲覧交友範囲との類似度を算出する範囲類似度算出手段と、
    前記範囲類似度算出手段で算出した類似度が高いSNS交友範囲を有するSNSユーザのユーザ識別子を、前記ユーザのSNSにおけるユーザ識別子として特定するユーザ特定手段と、
    を備えることを特徴とするユーザ特定装置。
  2. 前記閲覧交友範囲取得手段が、前記閲覧交友範囲として、前記ユーザのSNSへのWebアクセス履歴に基づいて、前記SNSの各ユーザとの閲覧による交友状態を数値化し、当該数値化された交友状態を要素とするアクセスベクトルを取得し、
    前記SNS交友範囲取得手段が、前記SNS交友範囲として、前記各SNSユーザについて、前記SNSにおける交友関係を数値化し、当該数値化された交友関係を要素とする交友ベクトルを取得し、
    前記範囲類似度算出手段が、前記SNS交友範囲取得手段で取得した前記交友ベクトルと、前記閲覧交友範囲取得手段で取得した前記アクセスベクトルとの内積を、前記類似度として算出することを特徴とする請求項1に記載のユーザ特定装置。
  3. 前記交友状態が、前記ユーザのSNSへのWebアクセス履歴に基づいて、前記SNSの各ユーザへの接触頻度により重み付けして数値化されることを特徴とする請求項2に記載のユーザ特定装置。
  4. 前記交友関係が、前記SNSサーバから取得したSNSユーザ間の発言頻度により重み付けして数値化されることを特徴とする請求項2または請求項3に記載のユーザ特定装置。
  5. 前記SNSサーバから取得した前記SNSにおける各SNSユーザの交友関係に基づいて、前記SNSにおけるユーザグループを解析するユーザグループ解析手段を備え、
    前記交友関係が、前記ユーザグループ解析手段で解析されたユーザグループに属するか否かによって重み付けして数値化されることを特徴とする請求項2から請求項4のいずれかに記載のユーザ特定装置。
  6. 前記ユーザのSNSへのWebアクセス履歴に基づいて取得した、前記ユーザが前記SNSにおいてWebページの閲覧を介して交友を行ったSNSユーザを記憶する対象SNSユーザ記憶手段を備え、
    前記対象SNSユーザ記憶手段に記憶されているSNSユーザに関するWebページへの前記ユーザのWebアクセス履歴を、当該ユーザのSNSへのWebアクセス履歴として前記履歴サーバから取得することを特徴とする請求項1から請求項5のいずれかに記載のユーザ特定装置。
  7. 前記履歴サーバが、前記SNSサーバから取得した前記SNSにおける各SNSユーザの交友関係に基づいて、取得、蓄積するWebアクセス履歴を決定することを特徴とする請求項1から請求項6のいずれかに記載のユーザ特定装置。
  8. Webアクセス履歴を取得、蓄積する履歴サーバ、およびSNSサーバと接続され、ユーザのSNSにおけるユーザ識別子を特定するユーザ特定装置におけるユーザ特定方法であって、
    前記ユーザ特定装置が、閲覧交友範囲取得手段、SNS交友範囲取得手段、範囲類似度算出手段、およびユーザ特定手段を備え、
    前記閲覧交友範囲取得手段が、前記履歴サーバに蓄積されている前記ユーザのSNSへのWebアクセス履歴に基づいて、前記ユーザが前記SNSにおいてWebページの閲覧を介して交友を行ったSNSユーザの範囲を示す閲覧交友範囲を取得する第1のステップと、
    前記SNS交友範囲取得手段が、前記SNSサーバから、前記SNSにおける各SNSユーザの交友関係の範囲を示すSNS交友範囲を取得する第2のステップと、
    前記範囲類似度算出手段が、前記SNS交友範囲取得手段で取得した前記各SNSユーザの前記SNS交友範囲と、前記閲覧交友範囲取得手段で取得した前記閲覧交友範囲との類似度を算出する第3のステップと、
    前記ユーザ特定手段が、前記範囲類似度算出手段で算出した類似度が高いSNS交友範囲を有するSNSユーザのユーザ識別子を、前記ユーザのSNSにおけるユーザ識別子として特定する第4のステップと、
    を備えることを特徴とするユーザ特定方法。
  9. Webアクセス履歴を取得、蓄積する履歴サーバ、およびSNSサーバと接続され、ユーザのSNSにおけるユーザ識別子を特定するユーザ特定装置におけるユーザ特定方法をコンピュータに実行させるためのプログラムであって、
    前記ユーザ特定装置が、閲覧交友範囲取得手段、SNS交友範囲取得手段、範囲類似度算出手段、およびユーザ特定手段を備え、
    前記閲覧交友範囲取得手段が、前記履歴サーバに蓄積されている前記ユーザのSNSへのWebアクセス履歴に基づいて、前記ユーザが前記SNSにおいてWebページの閲覧を介して交友を行ったSNSユーザの範囲を示す閲覧交友範囲を取得する第1のステップと、
    前記SNS交友範囲取得手段が、前記SNSサーバから、前記SNSにおける各SNSユーザの交友関係の範囲を示すSNS交友範囲を取得する第2のステップと、
    前記範囲類似度算出手段が、前記SNS交友範囲取得手段で取得した前記各SNSユーザの前記SNS交友範囲と、前記閲覧交友範囲取得手段で取得した前記閲覧交友範囲との類似度を算出する第3のステップと、
    前記ユーザ特定手段が、前記範囲類似度算出手段で算出した類似度が高いSNS交友範囲を有するSNSユーザのユーザ識別子を、前記ユーザのSNSにおけるユーザ識別子として特定する第4のステップと、
    を含むことを特徴とするプログラム。
JP2014111759A 2014-05-29 2014-05-29 ユーザ特定装置、ユーザ特定方法、およびプログラム Active JP6274973B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014111759A JP6274973B2 (ja) 2014-05-29 2014-05-29 ユーザ特定装置、ユーザ特定方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014111759A JP6274973B2 (ja) 2014-05-29 2014-05-29 ユーザ特定装置、ユーザ特定方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2015225613A JP2015225613A (ja) 2015-12-14
JP6274973B2 true JP6274973B2 (ja) 2018-02-07

Family

ID=54842280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014111759A Active JP6274973B2 (ja) 2014-05-29 2014-05-29 ユーザ特定装置、ユーザ特定方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6274973B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6777823B2 (ja) * 2017-08-03 2020-10-28 日本電信電話株式会社 アカウント特定装置、アカウント特定方法およびアカウント特定プログラム
WO2024203235A1 (ja) * 2023-03-27 2024-10-03 日本電気株式会社 Sns情報処理装置、sns情報処理方法及び記録媒体

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5106499B2 (ja) * 2009-09-08 2012-12-26 ヤフー株式会社 ユーザ抽出装置および方法
JP5509131B2 (ja) * 2011-03-29 2014-06-04 Kddi株式会社 ユーザの投稿文と、そのユーザの加入者識別子とを関連付ける投稿者識別方法、サーバ及びプログラム
JP5739277B2 (ja) * 2011-08-25 2015-06-24 Kddi株式会社 ユーザのアカウントと、そのユーザの端末の加入者識別子とを関連付ける識別方法、識別サーバ及びプログラム
JP6113560B2 (ja) * 2013-04-10 2017-04-12 テンソル・コンサルティング株式会社 ソーシャルネットワーク情報処理装置、処理方法、および処理プログラム

Also Published As

Publication number Publication date
JP2015225613A (ja) 2015-12-14

Similar Documents

Publication Publication Date Title
Morera et al. Security recommendations for mHealth apps: Elaboration of a developer’s guide
JP6549128B2 (ja) ガイドされたユーザアクションのためのシステムおよび方法
US10817791B1 (en) Systems and methods for guided user actions on a computing device
CN110046293B (zh) 一种用户身份关联方法及装置
JP6043277B2 (ja) 表示システム、表示方法、プログラム、及び、記録媒体
US20160321367A1 (en) Federated search page construction based on machine learning
US20180101864A1 (en) Endorsement abuse detection via social interactions
CA2921622A1 (en) Sourcing abound candidates apparatuses, methods and systems
Wong et al. Design of a crawler for online social networks analysis
KR101450453B1 (ko) 컨텐츠 추천 방법 및 장치
JP6066878B2 (ja) アドレス帳自動タグ付与装置、アドレス帳自動タグ付与方法、およびプログラム
Sams et al. E-research applications for tracking online socio-political capital in the Asia-Pacific region
JP6274973B2 (ja) ユーザ特定装置、ユーザ特定方法、およびプログラム
Benavides-Astudillo et al. Comparative study of deep learning algorithms in the detection of phishing attacks based on HTML and text obtained from web pages
Tan et al. Uncovering the Grylloidea and Tettigonioidea (Orthoptera: Ensifera) in the Forest Research Center (Sepilok) Entomological Collection.
CN105706409B (zh) 用于增强用户对于服务的参与度的方法、设备及系统
JP2017016544A (ja) 情報処理装置、情報処理方法
Dhekane et al. Talash: Friend Finding In Federated Social Networks.
US9591056B2 (en) Techniques for contact exporting
Eichinger et al. Affinity: A system for latent user similarity comparison on texting data
KR101638262B1 (ko) 소셜 네트워크 리포트들
JP6249794B2 (ja) ボット判定装置、ボット判定方法、およびプログラム
Ali Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, Github, and More, by Matthew A. Russell: (2013). Sebastopol, CA: O’Reilly Media, Inc., 448 pp
JP5665685B2 (ja) 重要度判定装置、重要度判定方法およびプログラム
JP2017151574A (ja) ユーザ情報処理サーバ及びユーザ情報の処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180109

R150 Certificate of patent or registration of utility model

Ref document number: 6274973

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150