JP2022114389A - 推定装置、推定方法及び推定プログラム - Google Patents

推定装置、推定方法及び推定プログラム Download PDF

Info

Publication number
JP2022114389A
JP2022114389A JP2021010696A JP2021010696A JP2022114389A JP 2022114389 A JP2022114389 A JP 2022114389A JP 2021010696 A JP2021010696 A JP 2021010696A JP 2021010696 A JP2021010696 A JP 2021010696A JP 2022114389 A JP2022114389 A JP 2022114389A
Authority
JP
Japan
Prior art keywords
distribution
friend
information
target user
account
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021010696A
Other languages
English (en)
Inventor
圭佑 池田
Keisuke Ikeda
一郁 児島
Kazufumi Kojima
真宏 谷
Masahiro Tani
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2021010696A priority Critical patent/JP2022114389A/ja
Priority to US17/578,619 priority patent/US11575641B2/en
Publication of JP2022114389A publication Critical patent/JP2022114389A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】より少ない情報で対象ユーザの活動位置を推定することが可能な推定装置、推定方法及び推定プログラムを提供する。【解決手段】推定装置10は、ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、対象ユーザの第1の位置分布を生成する第1の位置分布生成部11と、ソーシャルメディアにおける対象ユーザと関係のある友人のアカウント情報に基づいて、友人の第2の位置分布を生成する第2の位置分布生成部12と、生成された第1の位置分布と生成された第2の位置分布とに基づいて、対象ユーザの活動位置を推定する推定部13と、を備える。【選択図】図1

Description

本発明は、推定装置、推定方法及び推定プログラムに関する。
近年、SNS(Social Networking Service)などのソーシャルメディアが世界中に普及し広く利用されている。ソーシャルメディアには、アカウントを有するユーザやユーザの友人に関する情報が日々大量に蓄積されることから、これらの情報を分析し活用する方法が研究されている。
関連する技術として、非特許文献1や2のように、ソーシャルメディアの情報からユーザの位置を推定する技術が知られている。非特許文献1には、対象ユーザとソーシャルメディア上で友人関係にある友人のうち、実世界においても交流のある友人(オフライン友人)の情報を用いて、対象ユーザの活動エリアを推定する方法が開示されている。非特許文献2には、ユーザの友人関係とテキストを含むユーザが生成したコンテンツとを用いて、ユーザの位置を推定する方法が開示されている。
池田 圭佑、児島 一郁、谷 真宏著「友人群の地理的近接性に着目した居住エリア推定手法の検討」、電子情報通信学会、信学技報、Vol. 119、No. 317、pp. 37-42、AI2019-36、2019年11月 Dan Xu, Peng Cui, Wenwu Zhu, Shiqiang Yang著, "Graph-based residence location inference for social media users", IEEE Computer Society, IEEE MultiMedia, Volume 21, Issue 4, pp 76-83, 2014年10月
しかしながら、非特許文献1では、オフライン友人を判別するために予め大量のデータを用いて学習する必要がある。また、非特許文献2では、半教師あり学習法の一つであるラベル伝搬法を用いて位置を推定するため、予め大量のデータを用いて学習し学習モデルを生成する必要がある。このため、非特許文献1や2のような関連する技術では、対象ユーザの活動位置を推定するために、予め大量の情報を用意する必要があった。
本開示は、このような課題に鑑み、より少ない情報で対象ユーザの活動位置を推定することが可能な推定装置、推定方法及び推定プログラムを提供することを目的とする。
本開示に係る推定装置は、ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、前記対象ユーザの第1の位置分布を生成する第1の位置分布生成部と、前記ソーシャルメディアにおける前記対象ユーザと関係のある友人のアカウント情報に基づいて、前記友人の第2の位置分布を生成する第2の位置分布生成部と、前記生成された第1の位置分布と前記生成された第2の位置分布とに基づいて、前記対象ユーザの活動位置を推定する推定部と、を備えるものである。
本開示に係る推定方法は、ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、前記対象ユーザの第1の位置分布を生成し、前記ソーシャルメディアにおける前記対象ユーザと関係のある友人のアカウント情報に基づいて、前記友人の第2の位置分布を生成し、前記生成された第1の位置分布と前記生成された第2の位置分布とに基づいて、前記対象ユーザの活動位置を推定するものである。
本開示に係る推定プログラムは、ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、前記対象ユーザの第1の位置分布を生成し、前記ソーシャルメディアにおける前記対象ユーザと関係のある友人のアカウント情報に基づいて、前記友人の第2の位置分布を生成し、前記生成された第1の位置分布と前記生成された第2の位置分布とに基づいて、前記対象ユーザの活動位置を推定する、処理をコンピュータに実行させるための推定プログラムである。
本開示によれば、より少ない情報で対象ユーザの活動位置を推定することが可能な推定装置、推定方法及び推定プログラムを提供することができる。
実施の形態に係る推定装置の概要を示す構成図である。 実施の形態1に係る活動エリア推定システムの構成例を示す構成図である。 実施の形態1に係る活動エリア推定装置の動作例を示すフローチャートである。 実施の形態1に係る投稿分布の生成例を示す図である。 実施の形態1に係る投稿分布の生成例を説明するための図である。 実施の形態1に係る友人分布の生成例を示す図である。 実施の形態1に係る活動エリア分布の生成例を示す図である。 実施の形態1に係る活動エリア分布の出力例を示す図である。 実施の形態2に係る活動エリア推定装置の構成例を示す構成図である。 実施の形態2に係る活動エリア推定装置の動作例を示すフローチャートである。 実施の形態3に係る活動エリア推定装置の構成例を示す構成図である。 実施の形態3に係る活動エリア推定装置の動作例を示すフローチャートである。 実施の形態4に係る活動エリア推定装置の構成例を示す構成図である。 実施の形態4に係る活動エリア推定装置の動作例を示すフローチャートである。 実施の形態に係るコンピュータのハードウェアの概要を示す構成図である。
以下、図面を参照して実施の形態について説明する。各図面においては、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略される。
(実施の形態の概要)
ソーシャルメディアから対象ユーザの居住地を含む活動範囲を取得することが可能である。多くのソーシャルメディアでは、ユーザ名や性別、年齢等のユーザ自身のプロフィールを記載することが可能であり、そのようなプロフィールの一部として自身の居住地等を設定することが可能である。また、ソーシャルメディアに動画像やテキスト等のコンテンツを投稿する際、それらコンテンツの撮影場所や今いる場所等の情報を紐付けることも可能である。しかし、プロフィールや投稿コンテンツに位置情報を登録することが可能であるにも関わらず、実際に位置情報を登録しているユーザは極めて少ない。そのため、実施の形態では、ソーシャルメディアから得られる情報を基に対象ユーザに関連する位置情報を推定する方法を提案する。
図1は、実施の形態に係る推定装置の概要を示している。実施の形態に係る推定装置10は、ソーシャルメディアの情報を用いて、フィジカル空間における対象ユーザの活動位置を推定する装置である。例えば、推定装置10は、対象ユーザの居住エリアや行動エリア等の場所に紐付いたレコメンデーションを実施するジオマーケティングやロケーションベースマーケティングなどのマーケティングを実施する際に、場所情報を取得するための手段として利用できる。これにより単なる趣味嗜好とのマッチングにとどまらないレコメンデーションを実施することが可能となる。なお、マーケティングに限らず、その他の分野で活用することも可能である。
図1に示すように、推定装置10は、第1の位置分布生成部11、第2の位置分布生成部12、推定部13を備えている。第1の位置分布生成部11は、ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、対象ユーザの第1の位置分布を生成する。例えば、第1の位置分布生成部11は、対象ユーザの投稿情報(投稿場所)に基づいて、投稿分布を生成してもよい。
第2の位置分布生成部12は、ソーシャルメディアにおける対象ユーザと関係のある友人のアカウント情報に基づいて、友人の第2の位置分布を生成する。例えば、第2の位置分布生成部12は、友人の活動拠点情報(居住地情報)に基づいて、友人分布を生成してもよい。
推定部13は、生成された第1の位置分布と生成された第2の位置分布とに基づいて、対象ユーザの活動位置を推定する。例えば、推定部13は、第1の位置分布と第2の位置分布の重なりに応じて、対象ユーザの活動位置を推定してもよい。また、カーネル密度推定関数のようなノンパラメトリック手法により第1の位置分布及び第2の位置分布を生成し、活動位置を推定してもよい。第1の位置分布及び第2の位置分布のいずれか一方を、ノンパラメトリック手法により生成してもよい。推定する活動位置は、活動エリアでもよく、対象ユーザが普段の生活で訪れる日常的な活動場所(居住地や職場、買い物や飲食等の目的のために赴く店、その間の移動経路等)でもよいし、対象ユーザが普段の生活では訪れない非日常的な活動場所(旅行や出張時の観光地やホテル、移動経路等)でもよい。
このように実施の形態では、対象ユーザのアカウント情報による位置分布と友人のアカウント情報による位置分布を用いることで、より少ない情報で対象ユーザの活動位置(活動エリア)を推定することができる。例えば、対象ユーザの投稿情報あるいは友人の友人情報のどちらか一方しか利用できない場合に活動エリアを推定可能としてもよい。2種類の情報が利用できる場合、それらを組み合わせることでより精度よく活動エリアを推定することができる。また、大規模なデータ収集が必要ないノンパラメトリック手法を用いることにより、データ収集に制限のあるソーシャルデータの収集コストを削減することができる。
(実施の形態1)
以下、図面を参照して実施の形態1について説明する。図2は、本実施の形態に係る活動エリア推定システムの構成例を示している。図2に示すように、本実施の形態に係る活動エリア推定システム1は、活動エリア推定装置100とソーシャルメディアシステム200を備えている。
ソーシャルメディアシステム200は、SNSなどのソーシャルメディアサービスを提供するシステムである。ソーシャルメディアシステム200は、複数のソーシャルメディアサービスを含んでもよい。ソーシャルメディアサービスは、インターネット(オンライン)上で、複数のアカウント(ユーザ)間で情報を発信(公開)し、コミュニケーションをとることが可能なオンラインサービスである。ソーシャルメディアサービスは、SNSに限らず、チャットなどのメッセージングサービス、ブログや電子掲示板(フォーラムサイト)、動画共有サイトや情報共有サイト、ソーシャルゲームやソーシャルブックマーク等を含む。
例えば、ソーシャルメディアシステム200は、クラウド上のサーバとユーザ端末を含む。サーバは、ソーシャルメディアサーバでもよいし、webサーバでもよい。ユーザ端末は、サーバが提供するAPI(Application Programming Interface)を介して、ユーザのアカウントでログインし、投稿の入力や閲覧等を行い、また、友人関係やフォロー関係等のアカウントのつながりを登録する。ソーシャルメディアシステム200と活動エリア推定装置100は、インターネット等を介して通信可能に接続されている。
活動エリア推定装置100は、投稿情報取得部101、投稿分布生成部102、友人情報取得部103、友人分布生成部104、活動エリア推定部105、活動エリア出力部106を備える。なお、各部(ブロック)の構成は一例であり、後述の動作(方法)が可能であれば、その他の各部で構成されてもよい。また、各部を一つの装置に備えてもよいし、複数の装置に備えてもよい。例えば、投稿情報取得部101及び投稿分布生成部102を第1の位置分布生成部とし、友人情報取得部103及び友人分布生成部104を第2の位置分布生成部としてもよい。
投稿情報取得部(対象アカウント情報取得部)101は、ソーシャルメディアシステム200から対象アカウントの投稿情報を取得する。投稿情報取得部101は、活動エリアを推定する対象ユーザの対象アカウントを特定する対象アカウント特定部でもある。例えば、対象ユーザは、マーケティングのターゲットとなる人物であるが、その他の任意の人物でもよい。投稿情報取得部101は、ソーシャルメディアシステム200から、特定した対象アカウントのアカウント情報(ソーシャルメディア情報)を取得する。アカウント情報は、ソーシャルメディア上のアカウントに関する公開情報であり、アカウントのプロフィール情報や投稿情報等を含む。投稿情報取得部101は、複数のソーシャルメディアのアカウント情報を取得してもよい。投稿情報取得部101は、ソーシャルメディアサービスを提供するサーバからAPIやクローラー(取得ツール)を介して取得してもよいし、予めソーシャルメディアのアカウント情報が格納されたデータベースから取得してもよい。
投稿情報取得部101は、対象アカウントのアカウント情報から全ての投稿情報を取得する。投稿情報には、アカウント(ユーザ)がタイムラインなどに投稿した画像やテキスト等が含まれる。投稿情報取得部101は、取得した投稿情報の画像やテキストから投稿場所及び投稿日時を抽出する。投稿場所は、対象ユーザが投稿情報を投稿した場所であり、投稿日時はその投稿情報を投稿した日時である。投稿日時は、投稿時に、投稿した画像やテキストに紐づけて登録されている。投稿場所は、投稿情報から抽出可能な位置情報であり、投稿画像に付与されたGPS(Global Positioning System)情報などのGEOタグでもよいし、投稿画像中のランドマーク等の写り込みから特定される位置でもよい。また、画像に限らず、投稿文(テキスト)で言及されている場所でも良い。投稿文で言及されている場所は、例えば、投稿文の自然言語処理によって抽出される。なお、投稿場所は、対象ユーザのアカウント情報から対象ユーザの活動場所(所縁のある場所)を推定するための位置情報の一例であり、投稿場所に限らず、プロフィール情報に含まれる居住地などの活動拠点でもよい。
投稿分布生成部102は、対象アカウントの投稿情報に基づいて対象アカウントの投稿分布(第1の位置分布)を生成する。投稿分布生成部102は、抽出した対象アカウントの投稿場所の投稿分布を生成する。投稿分布は、フィジカル空間における投稿場所(投稿位置)の分布(投稿位置特有の空間分布)であり、例えば、緯度及び経度の座標からなる2次元の地理的空間分布である。例えば、投稿分布は、所定の大きさの分布エリア単位における投稿場所の分布である。分布エリアの粒度レベルは、国単位、都道府県単位、市区町村単位などの行政区画単位でもよいし、1Km×1Kmや100m×100m、10m×10mなど所定の大きさのメッシュ単位でもよい。
投稿分布生成部102は、所定の分布関数により投稿分布を求める。ノンパラメトリック手法により分布を推定する密度推定関数を用いることが好ましい。本実施の形態では、ノンパラメトリック手法の密度推定関数の例として、カーネル密度推定関数を用いる。投稿分布の生成(算出)において、投稿情報に基づいて、それぞれの投稿情報に重みづけを行ってもよい。例えば、投稿日時により投稿情報に重みづけを行ってもよい。なお、分布関数に限らず、その他の統計処理により投稿分布を求めてもよい。例えば、各分布エリアに含まれる投稿場所の数をカウントすることで、投稿分布(ヒストグラム)を生成してもよい。
友人情報取得部103は、ソーシャルメディアシステム200から友人アカウントの友人情報を取得する。友人情報取得部103は、対象ユーザの友人アカウントを特定する友人アカウント特定部でもある。友人アカウントは、ソーシャルメディアにおいて、対象アカウントと友人関係等のつながりのあるアカウントである。対象ユーザと同じソーシャルメディアのアカウントでもよいし、異なるソーシャルメディアのアカウントでもよい。例えば、友人アカウントは、対象アカウントに友人関係が登録されているアカウントであるが、対象アカウントとその他のつながり(関係)があるアカウント(関連アカウント)でもよい。例えば、フォロー関係(フォローまたはフォロワー)のつながり、投稿によるつながり(投稿へのコメント、リツイートなどの引用、「いいね」などの反応、メンションによる言及など)、メッセージの交換歴等のあるアカウントでもよい。なお、リツイートとは、他アカウントの投稿または自アカウントの投稿を引用した形でコメント等を投稿することである。メンションとは、特定のアカウント名を含むコメント等を投稿することである。
友人情報取得部103は、ソーシャルメディアシステム200から、特定した友人アカウントのアカウント情報を取得する。ソーシャルメディアシステム200からの情報取得方法は、投稿情報取得部101と同様であり、サーバのAPI等によりアカウント情報を取得する。友人情報取得部103は、取得した全ての友人カウアンのアカウント情報から友人情報を抽出する。友人情報は、友人アカウントに関する位置情報であり、例えば、アカウント情報から抽出される居住地(居住エリア)である。友人情報取得部103は、アカウント情報に含まれるプロフィール情報から居住地情報を抽出する。居住地に限らず、出身地や職場、学校などその他の活動拠点を抽出してもよい。なお、友人情報は、友人のアカウント情報から友人の活動場所(所縁のある場所)を推定するための位置情報の一例であり、居住地などの活動拠点に限らず、投稿情報の投稿場所などでもよい。
友人分布生成部104は、友人アカウントの友人情報(活動拠点)に基づいて友人アカウントの友人分布(第2の位置分布)を生成する。友人分布生成部104は、抽出した友人アカウントの居住地の友人分布を生成する。友人分布は、投稿分布と同様、フィジカル空間における友人の居住地(友人位置)の分布(友人の居住地特有の空間分布)である。友人分布の分布エリアの粒度レベルは、投稿分布と同じであるが、異なる粒度としてもよい。友人分布生成部104は、投稿分布生成部102と同様、カーネル密度推定関数などのノンパラメトリック手法の分布関数により友人分布を求めるが、その他の統計処理により友人分布を求めてもよい。友人分布の生成(算出)において、居住地情報に基づいて、それぞれの居住地情報に重みづけを行ってもよい。
活動エリア推定部105は、生成された投稿分布と生成された友人分布とに基づいて、対象ユーザの活動エリアを推定する。活動エリア推定部105は、投稿分布と友人分布を重ね合わせることにより、対象ユーザの活動エリア分布を生成する。生成される活動エリア分布の粒度レベルは、投稿分布及び友人分布(またはいずれか)の粒度と同じであるが、異なる粒度としてもよい。活動エリア推定部105は、投稿分布と友人分布との重なり(重なる量)に応じて活動エリアを推定する。分布の重なりは、カーネル密度推定関数によりそれぞれ求めた投稿分布と友人分布のスコアで表される。すなわち、カーネル密度推定関数により得られた投稿分布のスコアとカーネル密度推定関数により得られた友人分布のスコアに基づいて活動エリアを推定する。活動エリア推定部105は、カーネル密度推定関数によりそれぞれ求めた投稿分布のスコアと友人分布のスコアとの所定の演算結果に基づいて、活動エリアを推定する。例えば、投稿分布のスコアと友人分布のスコアの積をとり、スコアが最も高いエリアを活動エリアとする。なお、積に限らず、加算や減算等してもよい。投稿分布のスコアと友人分布のスコアの積や加算により、対象ユーザの日常的な活動エリアを推定することができる。投稿分布のスコアから友人分布のスコアを減算することにより非日常的な活動エリアを推定できる。活動エリア推定部105は、求めたスコアが所定値以上のエリアを活動エリアとしてもよいし、スコアが上位N件(上位5件など)のエリアを活動エリアとしてもよい。
活動エリア出力部106は、推定された活動エリアを出力する。活動エリア出力部106を表示装置として、GUI(Graphical User Interface)により、所定の形式で活動エリアを表示してもよい。投稿分布と友人分布を表示し、分布が重なったエリアを強調表示してもよい。例えば、各活動エリアのスコアをヒートマップ形式で表示してもよい。また、所定の形式のファイルとして外部へ出力してもよい。例えば、各活動エリアのスコアをリスト形式で出力し、所定の件数のみを出力してもよい。
図3は、本実施の形態に係る活動エリア推定装置の動作(活動エリア推定方法)の一例を示している。図3に示すように、まず、活動エリア推定装置100は、対象ユーザの対象アカウントを特定する(S101)。投稿情報取得部101は、対象アカウントに関する情報の入力を受け付け、入力された情報に基づいて対象アカウントを特定する。対象アカウントのアカウントID(識別情報)を入力することでアカウントを特定してもよいし、入力された名前やキーワード等からソーシャルメディアやインターネット上で検索しアカウントを特定してもよい。
続いて、活動エリア推定装置100は、対象アカウントの投稿情報を取得する(S102)。投稿情報取得部101は、ソーシャルメディアシステム200のサーバやデータベースにアクセスし、公開されており取得可能な対象アカウントのアカウント情報を取得する。例えば、ソーシャルメディアサービスのAPI等により可能な範囲で対象アカウントのアカウント情報を取得する。投稿情報取得部101は、対象アカウントのアカウント情報に含まれる全ての投稿情報を取得する。
続いて、活動エリア推定装置100は、投稿情報の投稿場所及び投稿日時を抽出する(S103)。投稿情報取得部101は、対象アカウントの全ての投稿情報から投稿場所及び投稿日時を抽出する。なお、全ての投稿情報に限らず、一部の投稿情報から投稿場所及び投稿日時を抽出してもよい。例えば、所定の日時よりも古い投稿情報を抽出の対象外としてもよいし、同じ投稿内容の投稿情報が2つある場合に一方の投稿情報を抽出の対象外としてもよい。投稿情報取得部101は、投稿画像にGEOタグが付与されている場合、GEOタグから投稿場所(位置情報)を取得する。投稿画像にGEOタグが付与されていない場合、投稿画像の写り込みを画像解析し、位置を特定できる建物や風景等から投稿場所を取得してもよい。投稿画像から位置情報を取得できない場合、投稿文のテキストを自然言語処理し、位置を特定できる単語から投稿場所を取得してもよい。投稿情報取得部101は、投稿情報から投稿場所が取得できない場合、その投稿情報を投稿分布生成のための情報から除いてもよい。また、投稿情報取得部101は、投稿情報に付与されている日時を投稿日時として取得する。
続いて、活動エリア推定装置100は、対象アカウントの投稿分布を生成する(S104)。投稿分布生成部102は、抽出した複数の投稿情報の投稿場所及び投稿日時に基づいて投稿分布を生成する。この例では、投稿分布生成部102は、カーネル密度推定関数を用いて、次の式(1)により投稿分布p(L)を求める。投稿分布p(L)は、各分布エリアの投稿情報のカーネル密度推定値(スコア)の集合である。
Figure 2022114389000002
式(1)において、lは投稿場所の集合、hは投稿用バンド幅、wは投稿用重み、Kは投稿用カーネル関数である。バンド幅は、カーネル密度推定において、各標本の影響範囲を示すパラメータである。投稿用バンド幅は、投稿分布用の所定の値であり、予め設定されていてもよいし、予め複数の投稿場所から学習して得られた値でもよい。出力された活動エリア(推定結果)に応じて、投稿用バンド幅を変更してもよい。
図4は、カーネル密度推定により求めた投稿分布のイメージを示している。図4に示すように、緯度及び経度の2次元座標上に各投稿情報の投稿場所がプロットされ、投稿場所を中心として投稿用バンド幅の影響範囲(例えば正規分布の円形)を示す分布となる。各投稿場所(標本)の影響範囲では、中心(投稿場所)のスコアが最も大きく、中心から離れるにしたがってスコアが小さくなる。図の例では、スコアが大きいほど濃い色で示している。
式(1)における投稿用重みは、各投稿情報に基づいた、投稿分布における投稿情報の重みである。投稿用重みは、各投稿情報の重要性の度合いを示し、スコアの大きさを設定する。一例として、投稿用重みは、投稿情報の投稿日時に基づく重みである。例えば、図5に示すように、投稿情報の重要度と経過時間は反比例の関係にあり、時間の経過にしたがって重要性が低くなる。このため、新しい投稿情報になるほど重みを大きくし(重要性を高く)、古い投稿情報になるほど重みを小さく(重要性を低く)する。式(1)の重みを投稿日時に応じて変えることで、影響範囲は不変だが、新しい情報ほどスコアが大きくなり、古い情報ほどスコアが小さくできる。
一方、活動エリア推定装置100は、対象アカウントの特定(S101)に続いて、友人アカウントを特定する(S105)。友人情報取得部103は、対象アカウントのアカウント情報から、対象アカウントと友人関係等にある友人アカウントを特定する。例えば、対象アカウントのアカウント情報で友人関係に登録されているアカウントを友人アカウントとする。また、対象アカウントの投稿のフォローやフォロワー等の関係を有するアカウントや、対象アカウントの投稿情報を引用した投稿情報を有しているアカウント、対象アカウントの投稿情報に「いいね」等を付与したアカウント、メッセージの交換歴があるアカウントを友人アカウントとしてもよい。
続いて、活動エリア推定装置100は、友人アカウントの友人情報を取得する(S106)。友人情報取得部103は、対象アカウントのアカウント情報の取得と同様に、ソーシャルメディアシステム200のサーバ等から、ソーシャルメディアサービスのAPI等により可能な範囲で全ての友人アカウントのアカウント情報を取得する。
続いて、活動エリア推定装置100は、友人アカウントの居住地情報を抽出する(S107)。友人情報取得部103は、取得した全ての友人アカウントのアカウント情報から居住地情報を抽出する。友人情報取得部103は、友人のアカウント情報のプロフィール情報を取得し、プロフィール情報に登録された居住地情報を取得する。プロフィール情報から居住地が取得できない場合、プロフィール情報に登録された出身地や職場、学校などの活動拠点を居住地情報としてもよい。投稿情報から投稿場所を抽出し、投稿場所の頻度が高い場所を居住地情報としてもよい。また、友人アカウントのアカウント情報から居住地情報が取得できない場合、友人とさらに友人関係にある、友人の友人(他の友人)のアカウント情報から、友人の居住地を推定してもよい。例えば、友人のさらに友人のアカウント情報から得られる居住地の分布に基づいて、友人の居住地を推定してもよい。すなわち、友人のさらに友人の居住地から特定される友人の居住地に基づいて、友人分布を生成してもよい。友人情報取得部103は、友人アカウントの居住地情報が取得できない場合、その友人アカウントの情報を友人分布生成のための情報から除いてもよい。
続いて、活動エリア推定装置100は、友人アカウントの友人分布を生成する(S108)。友人分布生成部104は、抽出した複数の友人アカウントの居住地情報に基づいて友人分布を生成する。この例では、友人分布生成部104は、投稿分布と同様、カーネル密度推定関数を用いて、次の式(2)により友人分布p(L)を求める。友人分布p(L)は、各分布エリアの友人情報のカーネル密度推定値(スコア)の集合である。
Figure 2022114389000003
式(2)において、lは友人の居住地の集合、hは友人用バンド幅、wは友人用重み、Kは友人用カーネル関数である。友人用バンド幅は、友人分布用の所定の値であり、投稿用バンド幅と同様、予め設定されていてもよいし、複数の友人の居住地から学習して得られた値でもよい。友人用バンド幅は、投稿用バンド幅と異なってもよいし、同じでもよい。出力された活動エリア(推定結果)に応じて、友人用バンド幅を変更してもよい。
式(2)における友人用重みは、各友人情報(アカウント情報)に基づいた、友人分布における友人情報(居住地)の重みである。友人用重みは、各友人情報の重要性の度合いを示し、スコアの大きさを設定する。一例として、友人用重みは、対象ユーザと友人になった(友人関係となった、つながりを持った)時期に基づく重みでもよい。例えば、対象ユーザと友人になった日時が取得できる場合、古くからの友人情報は重みを小さく(あまり重視しない)、新しい友人は重みを大きく(重視する)する。これは,対象ユーザが引っ越した場合、古くからの友人は元の住所付近に居住している可能性があるためである。なお、これとは逆に新しい友人を重視しないように重みづけてもよい。例えば、憧れの街、住みたい街があった場合、その街の情報収集のため移住前からその街に住む人と友人となっていることが推定され、このような場合、古い友人の方を重視してもよい。具体的な計算方法として、重みの値は例えば初期値(100)を設定し、対象ユーザと友人になってからの時間経過に基づきこの重みの値を減少させてもよい。単純な例では、重み=ax+b(aは負の値、xは経過日数、bは初期値の100)のような一次関数により求めてもよい。また、一定の基準日を設けておき、x日以内に友人になっていれば一定の重みを付与し、x日以上前に友人になっていた場合は重みを付与しないとしても良い。
また、友人用重みは、対象ユーザのアカウントに対するメンション回数やリツイート回数などの会話頻度による重みでもよい。例えば、対象ユーザとの会話頻度が他の友人と比較して多い友人は重みを大きくする(重視する)。具体的な計算方法として、対象ユーザの総会話数を分母とし、各友人との会話数を分子として当該友人に重みを付与してもよいし、一定回数以上の会話がある友人には重みを付与し、一定回数に満たない友人には重みを付与しないとしてもよい。
さらに、友人用重みは、友人アカウントの信頼度に基づく重みでもよい。ソーシャルメディアユーザの中には、情報を詐称するフェイク・アカウントが存在するため、そのようなフェイク・アカウントが友人に含まれる場合、その友人の情報を重視せず推定を行ってもよい。信頼度は、アカウントの信頼性の度合を示し、信頼度が大きいほど信頼性が高い。信頼度は,距離で求められた数値指標であってもよい。活動エリア推定装置100は、信頼度算出部(不図示)をさらに備え、信頼度算出部がアカウントの人物属性情報に基づいて信頼度を求めてもよい。例えば、信頼度算出部は、信頼度を求める判定対象アカウントの人物属性情報(プロフィール等の情報)と判定対象アカウントの友人アカウントの人物属性情報を取得し、友人アカウントの人物属性情報から判定対象アカウントの人物属性を推定する。友人アカウントの人物属性情報に居住地が含まれる場合、居住地からの物理的距離に基づき、判定対象アカウントのユーザの居住地を推定する。さらに、取得された判定対象アカウントの人物属性情報(居住地)と、推定された判定対象アカウントの人物属性情報(居住地)との距離に基づき信頼度を算出する。例えば、信頼度算出部が求めた信頼度(または信頼度に基づいた値)を友人用重みとする。
また、友人用重みは、友人のオフライン友人度に基づく重みでもよい。オフライン友人は、ソーシャルメディア上で対象ユーザと友人関係にある友人アカウントのうち、フィジカル空間(実世界)においても対象ユーザと友人関係にある(つながりのある)友人である。このオフライン友人の情報をオンライン友人の情報よりも重視して推定を行ってもよい。オフライン友人度は、フィジカル空間においてもオフライン友人の関係が形成されているか否かを表す。活動エリア推定装置100は、オフライン友人判別部をさらに備え、オフライン友人判別部が対象ユーザの友人アカウントごとに、オフライン友人の度合いを示すスコアを計算してもよい。オフライン友人判別部及びオフライン友人度の計算方法の具体例については、後述の実施の形態で説明する。例えば、オフライン友人判別部が求めたオフライン友人度(またはオフライン友人度に基づいた値)を友人用重みとする。
図6は、カーネル密度推定により求めた友人分布のイメージを示している。図6に示すように、投稿分布と同様に、緯度及び経度の2次元座標上に各友人の居住地がプロットされ、友人の居住地を中心として友人用バンド幅の影響範囲(例えば正規分布の円形)を示す分布となる。
投稿分布の生成と友人分布の生成に続いて、活動エリア推定装置100は、対象ユーザの活動エリア分布を生成する(S109)。活動エリア推定部105は、同じエリア(空間)の投稿分布と友人分布を重ね合わせることにより、対象ユーザの活動エリア分布を生成する。例えば、活動エリア推定部105は、次の式(3)及び式(4)のように、上記の式(1)及び式(2)より求めた投稿分布と友人分布との積をとることで、対象ユーザの活動エリアl(推定活動エリア)を推定する。
Figure 2022114389000004
式(3)においてLはlとlの集合である。式(4)のように、各分布エリアのスコアp(L)は、投稿分布のスコアと友人分布のスコアに比例し、式(3)のように、スコアp(L)が最も高いエリアを活動エリアと推定する。
図7は、投稿分布と友人分布を同じ空間(座標)上に重ね合わせたイメージを示している。図7に示すように、投稿分布の各場所の影響範囲と友人分布の各場所の影響範囲を重ね合わせる。友人の居住地と投稿場所の分布の重なる場所が活動エリアであり、より重なる量が大きい場所(より濃い場所)を活動エリアと見做す。
続いて、活動エリア推定装置100は、生成した活動エリア分布を出力する(S110)。活動エリア出力部106は、生成した活動エリア分布を所定の形式で表示等する。図8は、活動エリア分布の表示例を示している。図8に示すように、例えば、活動エリア分布をヒートマップにより表示する。ヒートマップでは、地図(世界地図、日本地図、地域の地図等)上に、各エリアのスコアに応じた色や濃さの分布を表示する。
以上のように、本実施の形態では、所縁のある場所など活動の痕跡がより濃い場所を活動エリアと見做す。具体的には、友人情報(居住地)に基づく分布と投稿情報(投稿場所)に基づく分布をそれぞれ同時並行で生成し、それらを重ね合わせることにより対象ユーザの活動エリア分布を生成する。
非特許文献1及び2と本実施の形態とを対比すると、非特許文献1及び2では、位置推定のために大規模なデータが必要になる。すなわち、非特許文献1及び2では、所縁のある場所と推定対象ユーザ間の位置関係の学習用データセットや、推定に直接用いる友人の投稿や、友人の友人情報等の収集コストのかかるデータを大量に準備する必要がある。しかし、ソーシャルメディア運営企業はデータ収集に制約(一定期間に取得可能なデータ数等)をかけているため、大量データを用いる手法はデータ収集コストが掛かる。これに対し、本実施の形態では、事前のモデル準備が不要な推定手法を用いることで、大規模なデータを用意する必要がない。具体的には、大量データを用いたパラメータ学習が不要なカーネル密度推定を利用する。また、推定に利用する情報を、対象ユーザの友人居住地及び対象ユーザ本人の投稿場所に限定することでデータ収集コストを低減できる。さらに、学習時・推定時の両方で収集コストを低減することができる。
また、非特許文献1では、対象ユーザの友人が少ない、もしくは友人から得られる情報が少ない場合、高精度に位置を推定できない。すなわち、非特許文献1では、対象ユーザの友人からオフライン友人を判別し、判別したオフライン友人の情報を重視して対象ユーザの活動エリアを推定するため、友人の数や友人の情報が少ないと推定することが困難となる。これに対し、本実施の形態では、2種類の情報により対象ユーザの活動エリアを推定可能とする。具体的には、推定に利用する情報を、対象ユーザの友人居住地及び対象ユーザ本人の投稿場所とする。これにより、どちらか一方の情報しか取得できない対象ユーザに対しても活動エリアを推定することが可能である。また、上記2種類の情報に絞ることで、非特許文献1よりも収集コストを抑えることが可能である。
(実施の形態2)
以下、図面を参照して実施の形態2について説明する。本実施の形態では、実施の形態1の活動エリア推定装置において、投稿情報及び友人情報をフィルタリングする例について説明する。
図9は、本実施の形態に係る活動エリア推定装置の構成例を示している。図9に示すように、本実施の形態に係る活動エリア推定装置100は、実施の形態1の構成に加えて、投稿情報フィルタ部107と友人情報フィルタ部108を備えている。
投稿情報フィルタ部107は、投稿情報取得部101が取得した対象アカウントの投稿情報を所定の条件でフィルタリングする。投稿情報フィルタ部107は、対象ユーザのアカウント情報に含まれる複数の投稿情報から、投稿分布の生成に使用する投稿情報を選択する選択部(第1の選択部)である。投稿情報フィルタ部107は、投稿場所の粒度に基づいて投稿情報を選択し、例えば、投稿場所の粒度が所定の粒度レベルよりも大きい投稿情報を除外する。具体例として、市区町村単位よりも大きい、国単位や都道府県単位の粒度の投稿情報を除外してもよいし、10m×10m単位よりも大きい、1Km×1Km単位や100m×100m単位の粒度の投稿情報を除外してもよい。
友人情報フィルタ部108は、友人情報取得部103が取得した友人アカウントの友人情報を所定の条件でフィルタリングする。友人情報フィルタ部108は、友人のアカウント情報に含まれる複数の居住地情報(活動拠点情報)から、友人分布の生成に使用する居住地情報を選択する選択部(第2の選択部)である。友人情報フィルタ部108は、投稿情報と同様に、居住地情報の粒度に基づいて居住地情報を選択し、例えば、居住地情報の粒度が所定の粒度レベルよりも大きい友人情報を除外する。
図10は、本実施の形態に係る活動エリア推定装置の動作例を示している。図10に示すように、投稿場所及び投稿日時の抽出(S103)の後、投稿情報フィルタ部107は、投稿情報をフィルタリングする(S111)。投稿情報フィルタ部107は、抽出された各投稿情報の投稿場所の粒度を判定し、投稿場所の粒度が所定の粒度レベルよりも大きい場合、その投稿情報を投稿分布生成のための情報から除外する。例えば、所定の粒度レベルは、生成する投稿分布(または出力する活動エリア分布)の粒度レベルである。続いて、投稿分布生成部102は、実施の形態1と同様に、フィルタリングされた投稿情報により投稿分布を生成する(S104)。
なお、この例では、投稿場所の粒度に応じて投稿情報をフィルタリングするが、その他の基準によりフィルタリングを行ってもよい。実施の形態1の投稿用重みで用いた投稿日時等に基づいて投稿情報をフィルタリングしてもよい。例えば、投稿日時が所定の日時よりも古い投稿情報を除外してもよい。
また、この例では、投稿場所の粒度をフィルタリングの基準とするが、投稿場所の粒度を実施の形態1の投稿用重みとしてもよい。すなわち、上記式(1)において、投稿用重み(w)を投稿場所の粒度レベルに基づく重みとし、投稿分布を生成してもよい。例えば、投稿場所の粒度が小さいほど詳細な分布を生成できる。このため、投稿場所の粒度が小さいほど重みを大きくし、投稿場所の粒度が大きいほど重みを小さくしてもよい。
一方、友人の居住地情報の抽出(S107)の後、友人情報フィルタ部108は、友人情報をフィルタリングする(S112)。友人情報フィルタ部108は、投稿情報と同様に、抽出された各友人の居住地情報の粒度を判定し、友人の居住地情報の粒度が所定の粒度レベルよりも大きい場合、その友人情報を友人分布生成のための情報から除外する。例えば、所定の粒度レベルは、生成する友人分布(または出力する活動エリア分布)の粒度レベルである。続いて、友人分布生成部104は、実施の形態1と同様に、フィルタリングされた友人情報により友人分布を生成する(S108)。
なお、投稿情報と同様に、居住地情報の粒度に限らず、その他の基準によりフィルタリングを行ってもよい。実施の形態1の友人用重みで用いた、友人になった時期、会話頻度、友人アカウントの信頼度、友人のオフライン友人度等に基づいて友人情報をフィルタリングしてもよい。例えば、対象ユーザと友人になった時期が所定の日時よりも古い(または新しい)友人情報、対象ユーザとの会話数が所定の回数以下の友人情報、友人アカウントの信頼度が所定値以下の友人情報、オフライン友人度が所定値以下の友人情報等を除外してもよい。
また、投稿情報と同様に、居住地情報の粒度をフィルタリングの基準に限らず、実施の形態1の友人用重みとしてもよい。すなわち、実施の形態1の上記式(2)において、友人用重み(w)を友人の居住地情報(活動拠点)の粒度レベルに基づく重みとし、友人分布を生成してもよい。例えば、投稿情報と同様、居住地情報の粒度が小さいほど重みを大きくし、居住地情報の粒度が大きいほど重みを小さくしてもよい。
以上のように、本実施の形態では、投稿分布を生成する投稿情報と友人分布を生成する友人情報をそれぞれの情報に基づいてフィルタリングする。これにより、所定の粒度レベルの情報により分布を生成できるため、所望の精度の分布を得ることができる。
(実施の形態3)
以下、図面を参照して実施の形態3について説明する。本実施の形態では、実施の形態1または2の活動エリア推定装置において、重ね合わせる投稿分布と友人分布に重みづけを行う例について説明する。
図11は、本実施の形態に係る活動エリア推定装置の構成例を示している。図11に示すように、本実施の形態に係る活動エリア推定装置100は、実施の形態1の構成に加えて、重みづけ部109を備えている。重みづけ部109は、重ね合わせる投稿分布と友人分布に重みづけ(重ね合わせの重みづけ)を行う。例えば、友人分布の友人情報の数(標本数)と投稿分布の投稿情報の数(標本数)に応じて友人分布と投稿分布に重みづけを行い、友人情報の数と投稿情報の数の差に応じて重みづけを行ってもよい。また、友人分布と投稿分布のいずれかに重みづけてもよい。活動エリア推定部105は、投稿分布と友人分布(またはいずれか)の重みづけに基づいて、対象ユーザの活動エリアを推定する。
図12は、本実施の形態に係る活動エリア推定装置の動作例を示している。図12に示すように、投稿分布の生成(S104)と友人分布の生成(S108)の後、重みづけ部109は、友人分布と投稿分布に重ね合わせの重みづけを行う(S113)。重みづけ部109は、生成された投稿分布の投稿情報(投稿場所)の数と生成された友人分布の友人情報(居住地)の数をカウントして、投稿情報数と友人情報数の差分を求め、求めた差分に応じて投稿分布と友人分布に重みづけを行う。例えば、投稿情報数と友人情報数に大きな差があると、どちらかの情報が重視され過ぎる恐れがあるため、投稿情報数と友人情報数のバランスをとるようにしてもよい。例えば、友人数が100、投稿数が200の場合,友人分布と投稿分布を2対1の割合で重ね合わせてもよい。
続いて、活動エリア推定部105は、重みづけられた友人分布と投稿分布を重ね合わせて活動エリア分布を生成する(S109)。例えば、次の式(5)のように、友人分布の重みWF、投稿分布の重みWPをそれぞれの分布に掛けることより、スコアp(L)を求める。
Figure 2022114389000005
以上のように、本実施の形態では、友人分布と投稿分布の重ね合わせ時に、各分布に重みづけを行う。これにより、友人分布と投稿分布のいずれかを重視して対象ユーザの活動エリアを推定することができる。例えば、友人数と投稿数に基づき重みづけを行うことで、バランスよく活動エリアを推定できる。
(実施の形態4)
以下、図面を参照して実施の形態4について説明する。本実施の形態では、実施の形態3の重ね合わせの重みづけの他の例として、オンライン友人の分布とオフライン友人の分布に重みづけを行う例について説明する。
図13は、本実施の形態に係る活動エリア推定装置の構成例を示している。図13に示すように、本実施の形態に係る活動エリア推定装置100は、実施の形態3の構成に加えて、オフライン友人判別部110を備えている。オフライン友人判別部110は、ソーシャルメディア上で対象ユーザと友人関係にある友人アカウントの中から、フィジカル空間(実世界)において対象ユーザと友人関係にある(つながりのある)オフライン友人を判別する。すなわち、対象ユーザの友人から、オフライン友人と、オフライン友人以外のオンライン友人とを判別する。活動エリア推定部105は、投稿分布と、オフライン友人の友人分布と、オンライン友人の友人分布とに基づいて、対象ユーザの活動エリアを推定する。また、オフライン友人の友人分布とオンライン友人の友人分布の重みづけに基づいて、活動エリアを推定する。
図14は、本実施の形態に係る活動エリア推定装置の動作例を示している。図14に示すように、友人の居住地の抽出(S107)の後、オフライン友人判別部110は、オフライン友人を判別する(S114)。オフライン友人判別部110は、取得した友人アカウントのアカウント情報に基づいて、友人アカウントを保有する各友人が、対象ユーザとフィジカル空間においても友人であるか、又はフィジカル空間では友人ではないかを判定する。オフライン友人判別部110は、友人アカウントのオフライン友人度を求め、オフライン友人度によりオフライン友人またはオンライン友人を判別する。オフライン友人判別部110は、対象ユーザの友人アカウントごとに、オフライン友人の度合いを示すスコアを計算し、例えば、スコアが一定のしきい値を超える場合、オフライン友人度を、オフライン友人である旨を示す値(例えば「1」)とし、スコアがしきい値以下の場合、オフライン友人度を、オフライン友人ではない旨を示す値(例えば「0」)とする。しきい値は、例えば活動エリア推定装置100の利用者が任意に設定する。
オフライン友人判別部110は、友人アカウントが特定の地域に関連したローカルアカウントであるか否かを判定してもよい。例えば、ローカルアカウントは、ソーシャルメディアアカウントのうち、ある特定の場所や地域などを対象として運営されているソーシャルメディアのアカウントである。ローカルアカウントの例として、地方紙や地方自治体、個人経営の飲食店などの地域密着型企業が運営するアカウントがある。オフライン友人判別部110は、友人アカウントがローカルアカウントであるか否かの判定結果に基づいて、友人のオフライン友人度を計算してもよい。例えば、オフライン友人判別部110は、友人アカウントの友人情報(プロフィール情報や投稿情報)を参照し、当該アカウントが特定の場所や地域を対象として運営されているかがわかる情報の有無、及びそれらの情報の過多に応じてスコアを計算し、友人アカウントがローカルアカウントであるか否か判定してもよい。
また、オフライン友人判別部110は、友人アカウントがローカルアカウントであるか否かが不明であると判定した場合、その友人アカウントのさらに友人情報を参照し、友人アカウントがローカルアカウントであるか否かを判定してもよい。例えば、友人アカウントのさらに友人のアカウントがローカルアカウントであるか否かに基づいて、対象ユーザの友人アカウントのオフライン友人度を計算してもよい。その他、非特許文献1に記載の手法を用いて、オフライン友人とオンライン友人を判別してもよい。
友人分布生成部104は、判別したオフライン友人の友人分布と、オンライン友人の友人分布を生成する(S108)。友人分布生成部104は、実施の形態1と同様に、オフライン友人の居住地情報に基づいてオフライン友人の友人分布を生成し、オンライン友人の居住地情報に基づいてオンライン友人の友人分布を生成する。
続いて、重みづけ部109は、生成したオフライン友人の友人分布と生成したオンライン友人の友人分布に重みづけを行う(S113)。例えば、オンライン友人よりもオフライン友人の方が、対象ユーザの活動エリアに関して重要性が高い。このため、オンライン友人の友人分布よりもオフライン友人の友人分布が重視されるように重みづけを行う。
続いて、活動エリア推定部105は、重みづけられたオフライン友人の友人分布及びオンライン友人の友人分布と、投稿分布を重ね合わせて活動エリア分布を生成する(S109)。なお、オフライン友人の友人分布と投稿分布のみを重ね合わせて活動エリア分布を生成してもよい。例えば、次の式(6)のように、オフライン友人の友人分布の重みWFoff、オンライン友人の友人分布の重みWFonをそれぞれの分布に掛け、投稿分布と積をとることにより、スコアp(L)を求める。なお、この場合の友人用重みは、オフライン友人度に基づく重みを含まないことが好ましい。
Figure 2022114389000006
なお、式(6)において、hf1、wf1はオンライン友人の友人分布における値であり、hf2、wf2はオフライン友人の友人分布における値である。すなわち、オフライン友人用の友人分布とオンライン友人用の友人分布を生成する際、それぞれのバンド幅や友人用重みを異なる値にしても良い。これにより、生成される友人分布と友人分布を異なるものにすることができる。
以上のように、本実施の形態では、友人分布をオフライン友人だけの分布とオンライン友人だけの分布に分け、投稿分布の重ね合わせ時にオフライン友人の分布に重みづけを行う。これにより、オフライン友人の友人分布を重視して対象ユーザの活動エリアを推定することができる。
なお、本開示は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、対象ユーザの友人アカウントの位置情報(居住地)を取得する際、友人アカウントから位置情報を取得できない、あるいは当該位置情報が古い等の場合には、上記実施の形態における対象アカウントの活動エリア分布生成手法を用いて、友人アカウントの位置を推定してもよい。これにより、対象ユーザの友人アカウントが位置情報を含まない場合であっても、友人アカウントの位置を推定できる。
上述の実施形態における各構成は、ハードウェア又はソフトウェア、もしくはその両方によって構成され、1つのハードウェア又はソフトウェアから構成してもよいし、複数のハードウェア又はソフトウェアから構成してもよい。各装置及び各機能(処理)を、図15に示すような、CPU(Central Processing Unit)等のプロセッサ21及び記憶装置であるメモリ22を有するコンピュータ20により実現してもよい。例えば、メモリ22に実施形態における方法(推定方法)を行うためのプログラムを格納し、各機能を、メモリ22に格納されたプログラムをプロセッサ21で実行することにより実現してもよい。
これらのプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、前記対象ユーザの第1の位置分布を生成する第1の位置分布生成部と、
前記ソーシャルメディアにおける前記対象ユーザと関係のある友人のアカウント情報に基づいて、前記友人の第2の位置分布を生成する第2の位置分布生成部と、
前記生成された第1の位置分布と前記生成された第2の位置分布とに基づいて、前記対象ユーザの活動位置を推定する推定部と、
を備える、推定装置。
(付記2)
前記推定部は、前記第1の位置分布と前記第2の位置分布の重なりに応じて、前記対象ユーザの活動位置を推定する、
付記1に記載の推定装置。
(付記3)
前記推定部は、前記対象ユーザの日常的または非日常的な活動位置を推定する、
付記1または2に記載の推定装置。
(付記4)
前記第1の位置分布生成部及び前記第2の位置分布生成部は、それぞれノンパラメトリック手法により前記第1の位置分布及び前記第2の位置分布を生成する、
付記1乃至3のいずれか一項に記載の推定装置。
(付記5)
前記第1の位置分布生成部及び前記第2の位置分布生成部は、それぞれカーネル密度推定関数を用いて前記第1の位置分布及び前記第2の位置分布を生成する、
付記4に記載の推定装置。
(付記6)
前記推定部は、前記カーネル密度推定関数により得られた前記第1の位置分布のスコアと、前記カーネル密度推定関数により得られた前記第2の位置分布のスコアとに基づいて、前記対象ユーザの活動位置を推定する、
付記5に記載の推定装置。
(付記7)
前記推定部は、前記第1の位置分布のスコアと前記第2の位置分布のスコアとの所定の演算結果に基づいて、前記対象ユーザの活動位置を推定する、
付記6に記載の推定装置。
(付記8)
前記第1の位置分布生成部は、前記対象ユーザのアカウント情報に含まれる投稿情報に基づいて、前記第1の位置分布を生成する、
付記1乃至7のいずれか一項に記載の推定装置。
(付記9)
前記第1の位置分布生成部は、前記投稿情報から抽出される投稿場所に基づいて、前記第1の位置分布を生成する、
付記8に記載の推定装置。
(付記10)
前記第1の位置分布生成部は、前記投稿情報に含まれる画像またはテキストから前記投稿場所を抽出する、
付記9に記載の推定装置。
(付記11)
前記第1の位置分布生成部は、前記投稿情報に基づいて、前記第1の位置分布における前記投稿情報に重みづけを行う、
付記8乃至10のいずれか一項に記載の推定装置。
(付記12)
前記第1の位置分布生成部は、前記投稿情報の投稿日時に基づいて、前記重みづけを行う、
付記11に記載の推定装置。
(付記13)
前記第1の位置分布生成部は、前記投稿情報の投稿場所の粒度に基づいて、前記重みづけを行う、
付記11または12に記載の推定装置。
(付記14)
前記対象ユーザのアカウント情報に含まれる複数の投稿情報から、前記第1の位置分布の生成に使用する投稿情報を選択する第1の選択部を備える、
付記8乃至13のいずれか一項に記載の推定装置。
(付記15)
前記第1の選択部は、前記投稿情報の投稿日時に基づいて、前記投稿情報を選択する、
付記14に記載の推定装置。
(付記16)
前記第1の選択部は、前記投稿情報の投稿場所の粒度に基づいて、前記投稿情報を選択する、
付記14または15に記載の推定装置。
(付記17)
前記第2の位置分布生成部は、前記友人のアカウント情報に含まれる活動拠点情報に基づいて、前記第2の位置分布を生成する、
付記1乃至16のいずれか一項に記載の推定装置。
(付記18)
前記第2の位置分布生成部は、前記友人のアカウント情報のプロフィール情報に含まれる居住地に基づいて、前記第2の位置分布を生成する、
付記17に記載の推定装置。
(付記19)
前記第2の位置分布生成部は、前記友人と関係のある他の友人のアカウント情報の活動拠点情報に基づいて、前記第2の位置分布を生成する、
付記17または18に記載の推定装置。
(付記20)
前記第2の位置分布生成部は、前記友人のアカウント情報に基づいて、前記第2の位置分布における前記活動拠点情報に重みづけを行う、
付記17乃至19のいずれか一項に記載の推定装置。
(付記21)
前記第2の位置分布生成部は、前記友人が前記対象ユーザと友人になった時期、前記友人と前記対象ユーザとの会話頻度、前記友人のアカウントの信頼度、前記友人のオフライン友人度、前記活動拠点情報の粒度のいずれかに基づいて、前記重みづけを行う、
付記20に記載の推定装置。
(付記22)
前記友人のアカウント情報に含まれる複数の活動拠点情報から、前記第2の位置分布の生成に使用する活動拠点情報を選択する第2の選択部を備える、
付記17乃至21のいずれか一項に記載の推定装置。
(付記23)
前記第2の選択部は、前記友人が前記対象ユーザと友人になった時期、前記友人と前記対象ユーザとの会話頻度、前記友人のアカウントの信頼度、前記友人のオフライン友人度、前記活動拠点情報の粒度のいずれかに基づいて、前記活動拠点情報を選択する、
付記22に記載の推定装置。
(付記24)
前記推定部は、前記第1の位置分布または前記第2の位置分布の重みづけに基づいて、前記活動位置を推定する、
付記1乃至23のいずれか一項に記載の推定装置。
(付記25)
前記推定部は、前記第1の位置分布の標本数と前記第2の位置分布の標本数に応じた重みづけに基づいて、前記活動位置を推定する、
付記24に記載の推定装置。
(付記26)
前記対象ユーザと関係のある複数の友人の中から、フィジカル空間において友人関係にあるオフライン友人を判別する判別部を備え、
前記第2の位置分布生成部は、前記オフライン友人の位置分布と前記オフライン友人以外のオンライン友人の位置分布を生成し、
前記推定部は、前記第1の位置分布と前記オフライン友人の位置分布と前記オンライン友人の位置分布とに基づいて、前記対象ユーザの活動位置を推定する、
付記1乃至25のいずれか一項に記載の推定装置。
(付記27)
前記推定部は、前記オフライン友人の位置分布と前記オンライン友人の位置分布の重みづけに基づいて、前記活動位置を推定する、
付記26に記載の推定装置。
(付記28)
前記推定された活動位置を、前記第1の位置分布と前記第2の位置分布に応じた色のヒートマップ形式、または、リスト形式で出力する出力部を備える、
付記1乃至27のいずれか一項に記載の推定装置。
(付記29)
ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、前記対象ユーザの第1の位置分布を生成し、
前記ソーシャルメディアにおける前記対象ユーザと関係のある友人のアカウント情報に基づいて、前記友人の第2の位置分布を生成し、
前記生成された第1の位置分布と前記生成された第2の位置分布とに基づいて、前記対象ユーザの活動位置を推定する、
推定方法。
(付記30)
ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、前記対象ユーザの第1の位置分布を生成し、
前記ソーシャルメディアにおける前記対象ユーザと関係のある友人のアカウント情報に基づいて、前記友人の第2の位置分布を生成し、
前記生成された第1の位置分布と前記生成された第2の位置分布とに基づいて、前記対象ユーザの活動位置を推定する、
処理をコンピュータに実行させるための推定プログラム。
1 活動エリア推定システム
10 推定装置
11 第1の位置分布生成部
12 第2の位置分布生成部
13 推定部
20 コンピュータ
21 プロセッサ
22 メモリ
100 活動エリア推定装置
101 投稿情報取得部
102 投稿分布生成部
103 友人情報取得部
104 友人分布生成部
105 活動エリア推定部
106 活動エリア出力部
107 投稿情報フィルタ部
108 友人情報フィルタ部
109 重みづけ部
110 オフライン友人判別部
200 ソーシャルメディアシステム

Claims (10)

  1. ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、前記対象ユーザの第1の位置分布を生成する第1の位置分布生成部と、
    前記ソーシャルメディアにおける前記対象ユーザと関係のある友人のアカウント情報に基づいて、前記友人の第2の位置分布を生成する第2の位置分布生成部と、
    前記生成された第1の位置分布と前記生成された第2の位置分布とに基づいて、前記対象ユーザの活動位置を推定する推定部と、
    を備える、推定装置。
  2. 前記推定部は、前記第1の位置分布と前記第2の位置分布の重なりに応じて、前記対象ユーザの活動位置を推定する、
    請求項1に記載の推定装置。
  3. 前記推定部は、前記対象ユーザの日常的または非日常的な活動位置を推定する、
    請求項1または2に記載の推定装置。
  4. 前記第1の位置分布生成部及び前記第2の位置分布生成部は、それぞれノンパラメトリック手法により前記第1の位置分布及び前記第2の位置分布を生成する、
    請求項1乃至3のいずれか一項に記載の推定装置。
  5. 前記第1の位置分布生成部及び前記第2の位置分布生成部は、それぞれカーネル密度推定関数を用いて前記第1の位置分布及び前記第2の位置分布を生成する、
    請求項4に記載の推定装置。
  6. 前記推定部は、前記カーネル密度推定関数により得られた前記第1の位置分布のスコアと、前記カーネル密度推定関数により得られた前記第2の位置分布のスコアとに基づいて、前記対象ユーザの活動位置を推定する、
    請求項5に記載の推定装置。
  7. 前記第1の位置分布生成部は、前記対象ユーザのアカウント情報に含まれる投稿情報に基づいて、前記第1の位置分布を生成する、
    請求項1乃至6のいずれか一項に記載の推定装置。
  8. 前記第2の位置分布生成部は、前記友人のアカウント情報に含まれる活動拠点情報に基づいて、前記第2の位置分布を生成する、
    請求項1乃至7のいずれか一項に記載の推定装置。
  9. ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、前記対象ユーザの第1の位置分布を生成し、
    前記ソーシャルメディアにおける前記対象ユーザと関係のある友人のアカウント情報に基づいて、前記友人の第2の位置分布を生成し、
    前記生成された第1の位置分布と前記生成された第2の位置分布とに基づいて、前記対象ユーザの活動位置を推定する、
    推定方法。
  10. ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて、前記対象ユーザの第1の位置分布を生成し、
    前記ソーシャルメディアにおける前記対象ユーザと関係のある友人のアカウント情報に基づいて、前記友人の第2の位置分布を生成し、
    前記生成された第1の位置分布と前記生成された第2の位置分布とに基づいて、前記対象ユーザの活動位置を推定する、
    処理をコンピュータに実行させるための推定プログラム。
JP2021010696A 2021-01-26 2021-01-26 推定装置、推定方法及び推定プログラム Pending JP2022114389A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021010696A JP2022114389A (ja) 2021-01-26 2021-01-26 推定装置、推定方法及び推定プログラム
US17/578,619 US11575641B2 (en) 2021-01-26 2022-01-19 Estimating device, estimating method, and estimating program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021010696A JP2022114389A (ja) 2021-01-26 2021-01-26 推定装置、推定方法及び推定プログラム

Publications (1)

Publication Number Publication Date
JP2022114389A true JP2022114389A (ja) 2022-08-05

Family

ID=82494919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021010696A Pending JP2022114389A (ja) 2021-01-26 2021-01-26 推定装置、推定方法及び推定プログラム

Country Status (2)

Country Link
US (1) US11575641B2 (ja)
JP (1) JP2022114389A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7228573B2 (ja) * 2018-04-18 2023-02-24 株式会社Nttドコモ 訪問先推定装置および訪問先推定方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110219422A1 (en) * 2009-02-23 2011-09-08 Method Solutions Llc System and method for displaying a density of objects in a social network application
US8725660B2 (en) * 2009-07-30 2014-05-13 Hewlett-Packard Development Company, L.P. Applying non-linear transformation of feature values for training a classifier
US20160110381A1 (en) * 2014-10-17 2016-04-21 Fuji Xerox Co., Ltd. Methods and systems for social media-based profiling of entity location by associating entities and venues with geo-tagged short electronic messages
US10931764B2 (en) * 2015-09-02 2021-02-23 Facebook, Inc. Geographic-area cluster
EP3423962A4 (en) * 2016-03-04 2019-10-02 Axon Vibe AG SYSTEMS AND METHOD FOR PREDICTING THE USER BEHAVIOR BASED ON LOCATION DATA
US10535081B2 (en) * 2016-12-20 2020-01-14 Facebook, Inc. Optimizing audience engagement with digital content shared on a social networking system
US10871877B1 (en) * 2018-11-30 2020-12-22 Facebook, Inc. Content-based contextual reactions for posts on a social networking system
US11423620B2 (en) * 2020-03-05 2022-08-23 Wormhole Labs, Inc. Use of secondary sources for location and behavior tracking

Also Published As

Publication number Publication date
US11575641B2 (en) 2023-02-07
US20220239620A1 (en) 2022-07-28

Similar Documents

Publication Publication Date Title
Gong et al. DeepScan: Exploiting deep learning for malicious account detection in location-based social networks
JP6540314B2 (ja) 施設推定方法、デバイス及びプログラム
Chen et al. Social media visual analytics
Chung et al. International tourism dynamics in a globalized world: A social network analysis approach
Smith-Clarke et al. Poverty on the cheap: Estimating poverty maps using aggregated mobile communication networks
CN103795613B (zh) 一种在线社交网络中朋友关系预测的方法
Roick et al. L ocation B ased S ocial N etworks–Definition, Current State of the Art and Research Agenda
CN105532030B (zh) 用于分析目标实体的移动的装置、系统和方法
Lin et al. Modeling people's place naming preferences in location sharing
Mashhadi et al. Putting ubiquitous crowd-sourcing into context
US9877162B2 (en) Systems and methods for generating a user location history
Chen et al. From interest to function: Location estimation in social media
TW201727558A (zh) 地理區域的熱力展現方法和裝置
US20110083101A1 (en) Sharing of Location-Based Content Item in Social Networking Service
KR20180101472A (ko) 사용자가 위치되는 지리적 위치의 유형을 식별하기 위한 방법 및 디바이스
Wang et al. Rapid estimation of an earthquake impact area using a spatial logistic growth model based on social media data
McKitrick et al. Collecting, analyzing, and visualizing location-based social media data: review of methods in GIS-social media analysis
KR101687494B1 (ko) 소셜 네트워크 위치기반 통합 마케팅 분석 서비스 제공 시스템
Gao et al. Mining human mobility in location-based social networks
CN107666649A (zh) 个人财产状态评估方法及装置
Shi et al. Challenges and prospects of uncertainties in spatial big data analytics
US11575641B2 (en) Estimating device, estimating method, and estimating program
Xu et al. Social sensors based online attention computing of public safety events
WO2023095277A1 (ja) 情報処理装置、情報処理方法及びプログラム
Qarabash et al. Twitter location-based data: evaluating the methods of data collection provided by twitter API

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240820