JP2024073786A - 処理装置、処理方法、及びプログラム - Google Patents

処理装置、処理方法、及びプログラム Download PDF

Info

Publication number
JP2024073786A
JP2024073786A JP2022184680A JP2022184680A JP2024073786A JP 2024073786 A JP2024073786 A JP 2024073786A JP 2022184680 A JP2022184680 A JP 2022184680A JP 2022184680 A JP2022184680 A JP 2022184680A JP 2024073786 A JP2024073786 A JP 2024073786A
Authority
JP
Japan
Prior art keywords
posted information
poster
reliability
information
activity area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022184680A
Other languages
English (en)
Inventor
真宏 谷
Masahiro Tani
圭佑 池田
Keisuke Ikeda
一郁 児島
Kazufumi Kojima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2022184680A priority Critical patent/JP2024073786A/ja
Priority to US18/388,718 priority patent/US20240168960A1/en
Publication of JP2024073786A publication Critical patent/JP2024073786A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ソーシャルメディアの投稿情報の中から有益な情報を高精度に抽出する。【解決手段】本発明は、対象エリアに関連する投稿情報を取得する取得部11と、投稿情報の投稿者の活動エリア、活動エリアの推定結果の信頼度、投稿者のプロフィールの開示具合、投稿者の属性、投稿者にとっての活動エリアの属性、及び投稿情報の内容のカテゴリの中の少なくとも2つに基づき、投稿情報の信頼度を算出する算出部12と、投稿情報の信頼度が閾値より高い投稿情報を出力する出力部13と、を有する処理装置10を提供する。【選択図】図1

Description

本発明は、処理装置、処理方法、及びプログラムに関する。
本発明に関連する技術が、特許文献1乃至8、非特許文献1乃至7に開示されている。
特許文献1には、「その地域をよく知る人」から提供された情報を、信憑性のある情報として識別する技術が開示されている。具体的には、当該技術では、地域情報を提供したユーザの活動地域を示す日常圏に基づき、情報の信憑性を評価する。
特許文献2には、ソーシャルメディアの情報に基づき、ユーザの活動エリアを推定する技術が開示されている。
特許文献3には、ソーシャルメディアの情報を収集し、データベースを構築する技術が開示されている。
特許文献4、非特許文献1乃至5には、ソーシャルメディアにアカウントを有するユーザの活動範囲を、友人関係に基づき推定する技術が開示されている。
特許文献5乃至7、非特許文献6及び7には、同一人物によって所有されているソーシャルメディアのアカウントを特定する技術が開示されている。
特許文献8に開示の技術は、ソーシャルメディアにおける対象ユーザのアカウント情報に基づいて対象ユーザの第1の位置分布を生成する。また、当該技術は、ソーシャルメディアにおける対象ユーザと関係のある友人のアカウント情報に基づいて友人の第2の位置分布を生成する。そして、当該技術は、生成された第1の位置分布と第2の位置分布とに基づいて、対象ユーザの活動位置を推定する。
特開2014-016870号公報 国際公開第2022/074807号公報 国際公開第2016/051810号公報 国際公開第2021/028988号公報 国際公開第2019/187107号公報 国際公開第2019/234827号公報 特開2013-122630号公報 特開2022-114389号公報
池田 圭佑、児島 一郁、谷 真宏著「友人群の地理的近接性に着目した居住エリア推定手法の検討」、電子情報通信学会、信学技報、Vol. 119、No. 317、pp. 37-42、AI2019-36、2019年11月 Dan Xu, Peng Cui, Wenwu Zhu, Shiqiang Yang著, "Graph-based residence location inference for social media users", IEEE Computer Society, IEEE MultiMedia, Volume 21, Issue 4, pp 76-83, 2014年10月 Backstrom Lars, Eric Sun, Cameron Marlow著, "Find me if you can: Improving geographical prediction with social and spatial proximity" Proceedings of the 19th international conference on World Wide Web, 2010, pp.61-70 Liu Zhi, Yan Huang 著, "Closeness and structure of friends help to estimate user locations", International Conference on Database Systems for Advanced Applications, Springer, pp. 33-48 池田 圭佑、児島 一郁、谷 真宏著「カーネル密度推定を用いたソーシャルメディアユーザーの活動エリア推定手法」、電子情報通信学会、信学技報、Vol. 120、No. 379、pp. 18-23、AI2020-42、2021年2月 Y. Li, Y. Peng、W. Ji, Z. Zhang、及び Q. Xu、「User Identification Based on Display Names Across Online Social Networks」、IEEE Access、vol. 5、pp. 17342-17353、2017年8月25日 X. Han, X Liang and et al. "Linking social network accounts by modeling user spatiotemporal habits", Intelligence and Security Informatics (ISI), IEEE International Conference on, 2017
ソーシャルメディアの投稿情報を用いた地域情報の提供等の試みがなされている。しかし、ソーシャルメディアの投稿情報は玉石混合である。このため、ソーシャルメディアの投稿情報の中から有益な情報を抽出する技術が必要となっている。
例えば、特許文献1の技術を利用することで、信憑性の高い投稿情報を抽出することができる。しかし、ユーザの活動地域を示す日常圏のみを用いた信憑性の評価の場合、評価の精度が十分でない場合がある。特許文献2乃至8、非特許文献1乃至7は、ソーシャルメディアの投稿情報の中から有益な情報を抽出する技術でない。
本発明の目的の一例は、上述した問題を鑑み、ソーシャルメディアの投稿情報の中から有益な情報を高精度に抽出するという課題を解決する処理装置、処理方法、及びプログラムを提供することにある。
本発明の一態様によれば、
対象エリアに関連する投稿情報を取得する取得手段と、
前記投稿情報の投稿者の活動エリア、前記活動エリアの推定結果の信頼度、前記投稿者のプロフィールの開示具合、前記投稿者の属性、前記投稿者にとっての前記活動エリアの属性、及び前記投稿情報の内容のカテゴリの中の少なくとも2つに基づき、前記投稿情報の信頼度を算出する算出手段と、
前記投稿情報の信頼度が閾値より高い前記投稿情報を出力する出力手段と、
を有する処理装置が提供される。
本発明の一態様によれば、
1つ以上のコンピュータが、
対象エリアに関連する投稿情報を取得し、
前記投稿情報の投稿者の活動エリア、前記活動エリアの推定結果の信頼度、前記投稿者のプロフィールの開示具合、前記投稿者の属性、前記投稿者にとっての前記活動エリアの属性、及び前記投稿情報の内容のカテゴリの中の少なくとも2つに基づき、前記投稿情報の信頼度を算出し、
前記投稿情報の信頼度が閾値より高い前記投稿情報を出力する、
処理方法が提供される。
本発明の一態様によれば、
コンピュータを、
対象エリアに関連する投稿情報を取得する取得手段、
前記投稿情報の投稿者の活動エリア、前記活動エリアの推定結果の信頼度、前記投稿者のプロフィールの開示具合、前記投稿者の属性、前記投稿者にとっての前記活動エリアの属性、及び前記投稿情報の内容のカテゴリの中の少なくとも2つに基づき、前記投稿情報の信頼度を算出する算出手段、
前記投稿情報の信頼度が閾値より高い前記投稿情報を出力する出力手段、
として機能させるプログラムが提供される。
本発明の一態様によれば、ソーシャルメディアの投稿情報の中から有益な情報を高精度に抽出するという課題を解決する処理装置、処理方法、及びプログラムが実現される。
上述した目的、及びその他の目的、特徴及び利点は、以下に述べる公的な実施の形態、及びそれに付随する以下の図面によってさらに明らかになる。
処理装置の機能ブロック図の一例を示す図である。 処理装置が行う処理の一例の概要を説明するための図である。 処理装置のハードウエア構成の一例を示す図である。 処理装置が行う処理の一例を説明するための図である。 処理装置が処理する情報の一例を模式的に示す図である。 処理装置が出力する情報の一例を模式的に示す図である。 処理装置の処理の流れの一例を示すフローチャートである。
以下、本発明の実施の形態について、図面を用いて説明する。なお、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
<第1の実施形態>
図1は、第1の実施形態に係る処理装置10の概要を示す機能ブロック図である。処理装置10は、取得部11と、算出部12と、出力部13とを有する。
取得部11は、対象エリアに関連する投稿情報を取得する。算出部12は、投稿情報の投稿者の活動エリア、活動エリアの推定結果の信頼度、投稿者のプロフィールの開示具合、投稿者の属性、投稿者にとっての活動エリアの属性、及び投稿情報の内容のカテゴリの中の少なくとも2つに基づき、投稿情報の信頼度を算出する。出力部13は、投稿情報の信頼度が閾値より高い投稿情報を出力する。
このように、特徴的な情報を少なくとも2つ用いて投稿情報の信頼度を算出する本実施形態の処理装置10によれば、ソーシャルメディアの投稿情報の中から有益な情報を高精度に抽出するという課題が解決される。
<第2の実施形態>
「概要」
本実施形態の処理装置10は、第1の実施形態の処理装置10を具体化したものである。図2を用いて、処理装置10が実行する処理の概要を説明する。なお、各処理の詳細は後述する。
図2に示すように、処理装置10は、ソーシャルメディアの投稿情報の中から、対象エリアに関連する投稿情報を抽出する。対象エリアは、投稿情報を用いた所定の処理(例:地域情報の提供等)を行うエリアである。次いで、処理装置10は、抽出した投稿情報の中から、信頼度が閾値より高い投稿情報を抽出し、出力する。処理装置10は、後述する特徴的な手法で、各投稿情報の信頼度を算出し、信頼度が閾値より高い投稿情報を抽出する。
このような本実施形態の処理装置10により、ソーシャルメディアの投稿情報の中から有益な情報を高精度に抽出するという課題が解決される。以下、本実施形態の処理装置10の構成を詳細に説明する。
「ハードウエア構成」
次に、処理装置10のハードウエア構成の一例を説明する。処理装置10の各機能部は、ハードウエアとソフトウエアの任意の組合せによって実現される。その実現方法にはいろいろな変形例があることは、当業者には理解されるところである。ソフトウエアは、予め装置を出荷する段階から格納されているプログラムや、CD(Compact Disc)等の記録媒体やインターネット上のサーバ等からダウンロードされたプログラム等を含む。
図3は、処理装置10のハードウエア構成を例示するブロック図である。図3に示すように、処理装置10は、プロセッサ1A、メモリ2A、入出力インターフェイス3A、周辺回路4A、バス5Aを有する。周辺回路4Aには、様々なモジュールが含まれる。処理装置10は周辺回路4Aを有さなくてもよい。なお、処理装置10は物理的及び/又は論理的に分かれた複数の装置で構成されてもよい。この場合、複数の装置各々が上記ハードウエア構成を備えることができる。
バス5Aは、プロセッサ1A、メモリ2A、周辺回路4A及び入出力インターフェイス3Aが相互にデータを送受信するためのデータ伝送路である。プロセッサ1Aは、例えばCPU、GPU(Graphics Processing Unit)などの演算処理装置である。メモリ2Aは、例えばRAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。入出力インターフェイス3Aは、入力装置、外部装置、外部サーバ、外部センサ、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。また、入出力インターファイス3Aはインターネット等の通信ネットワークに接続するためのインターフェイスを含むことができる。入力装置は、例えばキーボード、マウス、マイク、物理ボタン、タッチパネル等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ1Aは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。
「機能構成」
次に、本実施形態の処理装置10の機能構成を詳細に説明する。図1に、処理装置10の機能ブロック図の一例を示す。図示するように、処理装置10は、取得部11と、算出部12と、出力部13とを有する。
取得部11は、対象エリアに関連する投稿情報を取得する。
「対象エリア」は、投稿情報を用いた所定の処理を行うエリアである。所定の処理は、投稿情報そのものや、投稿情報を用いて生成した情報等を、その地域に関する地域情報として顧客に提供する処理等である。処理装置10のオペレータが対象エリアを指定する入力を行う。取得部11は、当該入力に基づき対象エリアを特定する。対象エリアは、地名で指定されてもよい。対象エリアは、例えば国名、都道府県名、市区町村名、州名、商店街の名称等で指定される(例:「日本」、「神奈川県」、「川崎市」等)。なお、対象エリアは、地図上で一部エリアを囲む等、その他の手法で指定されてもよい。
「投稿情報」は、ソーシャルメディアに投稿され、公開されている情報である。投稿情報は、メッセージ、静止画像、動画像、音声等で構成される。
「対象エリアに関連する投稿情報」は、
・投稿位置が対象エリア内である投稿情報、及び、
・投稿情報の内容が、対象エリア又は対象エリア内に存在する対象(例:施設、店舗、自然物等)に関連する投稿情報
の少なくとも一方を含む。
「ソーシャルメディア」は、インターネット(オンライン)上で、複数のアカウント(ユーザ)間で情報を発信(公開)し、コミュニケーションをとることが可能なオンラインサービスである。ソーシャルメディアは、SNS(social networking service)、チャットなどのメッセージングサービス、ブログや電子掲示板(フォーラムサイト)、動画共有サイトや情報共有サイト、ソーシャルゲームやソーシャルブックマーク等を含むことができる。
ソーシャルメディアのシステムは、クラウド上のサーバとユーザ端末を含む。サーバは、ソーシャルメディアサーバでもよいし、webサーバでもよい。ユーザ端末は、サーバが提供するAPI(Application Programming Interface)を介して、ユーザのアカウントでログインする。そして、ユーザ端末は、投稿の入力や閲覧、また、友人関係やフォロー関係等のアカウントのつながりの登録等を行う。取得部11は、このようなソーシャルメディアのシステムのサーバから投稿情報を取得することができる。
ここで、取得部11が実行する処理について説明する。取得部11は、インターネット上で公開されている投稿情報を収集し、記憶装置に記憶させる。当該記憶装置は、処理装置10が備えてもよいし、処理装置10と通信可能に構成された外部装置が備えてもよい。
そして、取得部11は、当該記憶装置に記憶されている投稿情報の中から、対象エリアに関連する投稿情報を抽出する。
投稿情報に投稿位置を示す投稿位置情報(例:緯度経度情報等)が付与されている場合、取得部11は、その投稿位置情報が示す位置が対象エリア内である投稿情報を、対象エリアに関連する投稿情報として抽出する。
また、取得部11は、投稿情報を解析して、対象エリアに関連する投稿情報を抽出することができる。例えば、取得部11は、投稿情報のメッセージやハッシュタグの中に、対象エリアに関連する所定のキーワードが含まれている投稿情報を、対象エリアに関連する投稿情報として抽出してもよい。対象エリアに関連する所定のキーワードは、対象エリアの地名、ニックネーム、呼称、略称、対象エリア内の施設の名称、ニックネーム、呼称等である。対象エリアに関連する所定のキーワードは、予め処理装置10に登録されている。
その他、取得部11は、投稿情報の画像(静止画像、動画像)を解析し、撮影場所を特定してもよい。そして、取得部11は、画像の撮影場所が対象エリア内である投稿情報を、対象エリアに関連する投稿情報として抽出してもよい。撮影場所は、画像に付与されたメタデータに基づき特定されてもよいし、画像に写っている各位置に特有のランドマークを画像解析で検出することで特定されてもよい。
その他、取得部11は、投稿情報の音声の中に、対象エリアに関連する所定のキーワードが含まれている投稿情報を、対象エリアに関連する投稿情報として抽出してもよい。対象エリアに関連する所定のキーワードは、上述の通りである。音声の中に所定のキーワードが含まれているか判断する処理の詳細は特段制限されない。例えば、音声認識技術を用いて音声データをテキストデータに変換した後、テキストデータ内で所定のキーワードを検索してもよい。
算出部12は、取得部11が取得した投稿情報各々の信頼度を算出する。算出部12は、投稿情報の投稿者の活動エリア、活動エリアの推定結果の信頼度、投稿者のプロフィールの開示具合、投稿者の属性、投稿者にとっての活動エリアの属性、及び投稿情報の内容のカテゴリの中の少なくとも2つに基づき、投稿情報の信頼度を算出する。
算出部12は、例えば、以下の算出例4又は5で、取得部11が取得した投稿情報各々の信頼度を算出することができる。その他、算出部12は、以下の算出例1乃至5の中の2つ以上を組み合わせて、取得部11が取得した投稿情報各々の信頼度を算出することができる。
なお、算出部12は、算出例1と、算出例2乃至5の中の少なくとも1つとに基づき、投稿情報の信頼度を算出してもよい。以下で説明するが、算出例1では、投稿者の活動エリアと対象エリアとの関係性に基づき、信頼度が算出される。このような算出例1を少なくとも利用することで、算出部12は、取得部11が取得した投稿情報各々の「対象エリアに関連する投稿情報」としての信頼度を算出することができる。
-算出例1:投稿者の活動エリアに基づく投稿情報の信頼度の算出-
算出部12は、取得部11が取得した投稿情報の投稿者ごとに、対象エリアの中の活動エリアを特定する。図4の例の場合、対象エリアはA市である。そして、対象エリアの中のB町が、投稿者Aの活動エリアとして特定されている。なお、図示しないが、A市全体が活動エリアとなっている投稿者が存在する可能性もある。また、図示しないが、A市の中に活動エリアがない投稿者が存在する可能性もある。
そして、算出部12は、対象エリアと活動エリアの一致度がより大きい投稿者の投稿情報ほど、より高い信頼度を算出する。一致度は、例えば「対象エリアの中の活動エリアの大きさ」、すなわち互いに重なる領域の大きさである。その他、一致度は、「対象エリアの中の活動エリアが占める大きさの割合」であってもよい。その他、一致度は、「活動エリアの中の対象エリアが占める大きさの割合」であってもよい。信頼度の具体的な算出方法は、当該条件が満たされる範囲内で任意に設計可能である。
なお、「活動エリア」は、実世界において投稿者が活動するエリアであり、市区町村やそれよりも広いエリア、又はそれよりも狭いエリアで示される。
算出部12は、例えばソーシャルメディアで公開されている公開情報に基づき、活動エリアを算出することができる。
「公開情報」は、ソーシャルメディア上で各アカウントのユーザに紐付けて公開されているあらゆる情報を含むことができる。例えば、公開情報は、各アカウントのユーザのプロフィール、各アカウントのユーザが投稿した投稿情報、ソーシャルメディア上での他のアカウントのユーザとの関係を示す関係情報、ソーシャルメディア上で各アカウントのユーザと所定の関係を有する他のアカウントのユーザのプロフィール、当該他のアカウントのユーザが投稿した投稿情報の中の少なくとも一つを含む。
「関係情報」は、ソーシャルメディア上での他のアカウントのユーザとの繋がりを示す情報である。例えば、関係情報は、各アカウントのユーザと相互フォローの関係にある他のアカウントのユーザ、各アカウントのユーザがフォローしている他のアカウントのユーザ、各アカウントのユーザをフォローしている他のアカウントのユーザ、各アカウントのユーザとメッセージの交換歴のある他のアカウントのユーザ、各アカウントのユーザと同じタイミングで同じ場所にいたことがある他のアカウントのユーザの中の少なくとも1つを示してもよい。
「メッセージの交換歴がある」とは、少なくとも一方のユーザが他方のユーザにテキストデータ、絵文字、写真、動画、音声、アイコン等を送ったり、いいねボタンの押下でアクションを行ったりしたことがある状態であってもよい。その他、「メッセージの交換歴がある」とは、両方のユーザが互いにテキストデータ、絵文字、写真、動画、音声、アイコン等を送ったり、いいねボタンの押下でアクションを行ったりしたことがある状態であってもよい。
算出部12は、例えば、ソーシャルメディア上で公開されている各投稿者のプロフィールに基づき、各投稿者の活動エリアを推定してもよい。この例の場合、算出部12は、例えばプロフィールで公開されている居住地を、各投稿者の活動エリアと推定してもよい。
その他、算出部12は、ある地域に関連するアカウントに所定数以上フォローされている投稿者の活動エリアとして、その地域を特定してもよい。「ある地域に関連するアカウント」は、例えばプロフィールにおいてその地域が居住地となっているアカウントである。
その他、算出部12は、ある地域に関連するアカウントから所定数以上の「いいね」をもらった投稿者の活動エリアとして、その地域を特定してもよい。
その他、算出部12は、ある地域に関連するアカウントから所定回数以上リツイートされた投稿者の活動エリアとして、その地域を特定してもよい。
その他、算出部12は、ある地域に存在するお店、会社、組織、団体等を所定数以上フォローしている投稿者の活動エリアとして、その地域を特定してもよい。
その他、算出部12は、ある地域に存在するお店、会社、組織、団体等から所定数以上フォローされている投稿者の活動エリアとして、その地域を特定してもよい。
その他、算出部12は、ある地域に存在するお店、会社、組織、団体等から所定数以上の「いいね」をもらった投稿者の活動エリアとして、その地域を特定してもよい。
その他、算出部12は、ある地域に存在するお店、会社、組織、団体等から所定回数以上リツイートされた投稿者の活動エリアとして、その地域を特定してもよい。
その他、算出部12は、本人の投稿の位置情報と投稿回数に基づき活動エリアを推定してもよい。例えば、算出部12は、投稿回数が所定回数以上であるエリアをその本人の活動エリアと推定する。
その他、算出部12は、例えば特許文献4及び8、非特許文献1乃至5に開示されている技術等のその他の技術を用いて、投稿者の活動エリアを推定してもよい。
なお、算出部12は、同一ユーザ(ソーシャルメディアのユーザ)によって所有されている複数のアカウントを特定してもよい。そして、あるアカウントのユーザの活動エリアの推定において、そのアカウントに紐付けて公開されている公開情報のみならず、そのユーザの他のアカウントに紐付けて公開されている公開情報もさらに利用してもよい。より多くの公開情報を利用することで、活動エリアの推定精度が向上する。同一ユーザによって所有されている複数のアカウントの特定の仕方は特段制限されず、例えば特許文献5乃至7、非特許文献6及び7に開示されている技術等のあらゆる技術を採用することができる。
また、ある投稿者の活動エリアが複数存在する場合、算出部12は、その中の一部又は全部に基づき、活動エリアが対象エリアの中に存在するか判断することができる。
-算出例2:活動エリアの推定結果の信頼度に基づく投稿情報の信頼度の算出-
算出部12は、対象エリアの中に活動エリアがある投稿者においては、そのエリアを活動エリアとする推定結果の信頼度が高い投稿者の投稿情報ほど、より高い信頼度を算出する。図4の例の場合、投稿者Aは、対象エリアであるA市の中に活動エリア(B町)がある。投稿者Aの投稿情報の信頼度は、B町を投稿者Aの活動エリアとする推定結果の信頼度が高いほど、高くなる。投稿情報の信頼度の具体的な算出方法は、当該条件が満たされる範囲内で任意に設計可能である。
各投稿者の活動エリアの推定結果の信頼度を算出する手法は特段制限されない。例えば、特許文献8に開示されている技術を採用することができる。特許文献8に開示されている「活動エリアのスコア」が、活動エリアの推定結果の信頼度となる。
-算出例3:投稿者のプロフィールの開示具合に基づく投稿情報の信頼度の算出-
当該例の場合、取得部11は、ソーシャルメディア上で公開されている各投稿者のプロフィールをさらに取得する。プロフィールに含まれる項目はソーシャルメディア毎に異なり得るが、例えば、ユーザ名、ニックネーム、性別、生年月日、国籍、年齢(又は年代)、出身地、現在の居住地、所属(会社名、学校名)、出身校等を含む。
なお、ソーシャルメディアでは、各ユーザは、これらのプロフィール情報の公開/非公開を選択できる。例えば、項目毎に公開/非公開が選択できてもよい。
そして、算出部12は、プロフィールをより多く開示している投稿者の投稿情報ほど、より高い信頼度を算出する。例えば、算出部12は、公開している項目の数が多い投稿者の投稿情報ほど、より高い信頼度を算出してもよい。
その他、予め、項目毎に重みスコアが設定されていてもよい。より重要度の高い項目ほど高い重みスコアが付与される。そして、算出部12は、投稿者ごとに、公開されている項目の重みスコアを足し合わせて開示具合スコアを算出してもよい。この場合、算出部12は、開示具合スコアが高い投稿者の投稿情報ほど、より高い信頼度を算出する。
信頼度の具体的な算出方法は、上述した条件が満たされる範囲内で任意に設計可能である。
-算出例4:投稿者の属性、及び投稿情報の内容のカテゴリに基づく投稿情報の信頼度の算出-
算出部12は、投稿者の属性と、投稿情報の内容のカテゴリとが所定の関係を満たす投稿情報の信頼度を、所定の関係を満たさない投稿情報の信頼度よりも高く算出する。信頼度の具体的な算出方法は、当該条件が満たされる範囲内で任意に設計可能である。
予め、より高い信頼度を算出する「投稿者の属性」と「投稿情報の内容のカテゴリ」との組み合わせが処理装置10に登録されている。この登録されている組み合わせとなっている投稿情報が、上述した所定の関係を満たす投稿情報となる。
例えば、投稿者の属性「母親」又は「父親」と、投稿情報の内容のカテゴリ「幼稚園」、「保育園」、「学校」、「塾」、「子育て」、「公園」、「習い事」又は「病院」等との組み合わせが、処理装置10に登録される。
その他、例えば、投稿者の属性「学生」と、投稿情報の内容のカテゴリ「学校」又は「塾」等との組み合わせが、処理装置10に登録される。
投稿者の属性は、ソーシャルメディア上で公開されている各投稿者のプロフィールや、各投稿者の投稿情報に基づき推定することができる。例えば、プロフィールに「学生」と登録されている場合、算出部12は、その投稿者の属性を「学生」と推定してもよい。
その他の例として、プロフィールで公開されている年齢が20~60才であり、性別が女性であり、投稿情報の画像に同じ子供が高頻度(例:所定回数以上、所定期間内に所定回数以上)で写っている場合、算出部12はその投稿者の属性を「母親」と推定してもよい。同様に、プロフィールで公開されている年齢が20~60才であり、性別が男性であり、投稿情報の画像に同じ子供が高頻度(例:所定回数以上、所定期間内に所定回数以上)で写っている場合、算出部12はその投稿者の属性を「父親」と推定してもよい
その他の例として、プロフィールで公開されている年齢が20~60才であり、性別が女性であり、投稿情報のメッセージの中に子育てに関連する所定のキーワードが高頻度(例:所定回数以上、所定期間内に所定回数以上)で含まれている場合、算出部12はその投稿者の属性を「母親」と推定してもよい。同様に、プロフィールで公開されている年齢が20~60才であり、性別が男性であり、投稿情報のメッセージの中に子育てに関連する所定のキーワードが高頻度(例:所定回数以上、所定期間内に所定回数以上)で含まれている場合、算出部12はその投稿者の属性を「父親」と推定してもよい。子育てに関連する所定のキーワードは、「幼稚園」、「保育園」、「学校」、「塾」、「子育て」、「公園」、「習い事」、「病院」等であり、予め処理装置10に登録されている。
投稿情報の内容のカテゴリは、各投稿情報に基づき推定することができる。例えば、予めカテゴリ毎に、各カテゴリに関連するキーワードが処理装置10に登録されている。そして、算出部12は、関連するキーワードが含まれているカテゴリを、各投稿情報の内容のカテゴリとして推定することができる。
-算出例5:投稿者にとっての活動エリアの属性、及び投稿情報の内容のカテゴリに基づく投稿情報の信頼度の算出-
算出部12は、対象エリア内の活動エリアの投稿者にとっての属性と、投稿情報の内容のカテゴリとが所定の関係を満たす投稿情報の信頼度を、所定の関係を満たさない投稿情報の信頼度よりも高く算出する。信頼度の具体的な算出方法は、当該条件が満たされる範囲内で任意に設計可能である。
ここで、「対象エリア内の活動エリアの投稿者にとっての属性」について説明する。図4の例の場合、投稿者Aにとって、B町が、対象エリア内の活動エリアである。そして、投稿者AにとってのB町の属性が、上記「対象エリア内の活動エリアの投稿者にとっての属性」となる。投稿者AにとってのB町の属性は、例えば、居住地、勤務地、学校所在地、休日頻出スポット等である。
予め、より高い信頼度を算出する「対象エリア内の活動エリアの投稿者にとっての属性」と「投稿情報の内容のカテゴリ」との組み合わせが処理装置10に登録されている。この登録されている組み合わせとなっている投稿情報が、上述した所定の関係を満たす投稿情報となる。
例えば、対象エリア内の活動エリアの投稿者にとっての属性「居住地」と、投稿情報の内容のカテゴリ「幼稚園」、「保育園」、「学校」、「塾」、「子育て」、「公園」、「習い事」又は「病院」等との組み合わせが、処理装置10に登録される。
その他、例えば、対象エリア内の活動エリアの投稿者にとっての属性「勤務地」と、投稿情報の内容のカテゴリ「レストラン」、「定食屋」、「カフェ」、「バー」又は「居酒屋」等との組み合わせが、処理装置10に登録される。
その他、例えば、対象エリア内の活動エリアの投稿者にとっての属性「学校所在地」と、投稿情報の内容のカテゴリ「レストラン」又は「カフェ」等との組み合わせが、処理装置10に登録される。
対象エリア内の活動エリアの投稿者にとっての属性は、ソーシャルメディア上で公開されている各投稿者のプロフィールや、各投稿者の投稿情報に基づき推定することができる。
例えば、算出部12は、平日(月曜日から金曜日)の9時から17時の時間帯に投稿位置となる頻度が休日(土曜日、日曜日)や平日の夜間に投稿位置となる頻度よりも高い活動エリアは、学校所在地又は勤務地と予測することができる。そして、例えばプロフィールで公開されている年齢が10代である場合、算出部12は、その活動エリアは「学校所在地」と推定することができる。一方、例えばプロフィールで公開されている年齢が所定年齢以上(例:20才以上)である場合、算出部12は、その活動エリアは「勤務地」と推定することができる。
投稿情報の内容のカテゴリは、各投稿情報に基づき推定することができる。例えば、予めカテゴリ毎に、各カテゴリに関連するキーワードが処理装置10に登録されている。そして、算出部12は、関連するキーワードが含まれているカテゴリを、各投稿情報の内容のカテゴリとして推定することができる。
図1に戻り、出力部13は、投稿情報の信頼度が閾値より高い投稿情報を出力する。
取得部11及び算出部12による処理により、図5に示すようなデータが得られる。図5に示すデータは、「神奈川県川崎市」が対象エリアとして指定され、生成されたデータである。図5に示すデータは、取得部11が取得した対象エリアに関連する投稿情報を互いに識別する投稿情報ID(identifier)と、投稿情報と、投稿位置を示す位置情報と、算出部12が算出した投稿情報の信頼度とが互いに紐付けて登録されている。出力部13は、例えば当該データに基づき、投稿情報の信頼度が閾値より高い投稿情報を抽出し、抽出した投稿情報を特徴的な手法で出力することができる。
例えば、出力部13は、抽出した投稿情報の一部又は全部を、投稿情報の信頼度の順に並べて出力することができる(図5参照)。
また、出力部13は、抽出した投稿情報の一部又は全部を一覧表示するとともに、投稿情報の信頼度が基準値より高い投稿情報を強調表示して出力することができる。なお、基準値は閾値よりも高い。
また、出力部13は、例えば図6に示すような手法で、抽出した投稿情報を出力することができる。
図6に示す例では、出力部13は、抽出した投稿情報を地図上にマッピングして出力している。具体的には、抽出した投稿情報の投稿位置に、所定のマークPが付与されている。そして、1つのマークSPに対して所定の操作(例:タッチ操作、クリック操作)を行うと、その位置で投稿された投稿情報が表示される。
また、図6に示す例では、出力部13は、抽出した投稿情報の中の投稿位置(マークPの位置)が画面表示されているエリア内である投稿情報を、領域Dに一覧表示している。画面表示されるエリアは、ユーザによる画面拡大/縮小操作や、画面表示する位置をずらす操作等に応じて変化する。
領域Dにおいては、複数の投稿情報は投稿順(新しい順、又は古い順)に並べて一覧表示されてもよい。その他、領域Dにおいては、複数の投稿情報は投稿情報の信頼度の順(高い順、又は低い順)に並べて一覧表示されてもよい。
また、領域Dにおいて、投稿情報の信頼度が基準値より高い投稿情報を強調表示してもよい。その他、地図上において、投稿情報の信頼度が基準値より高い投稿情報の投稿位置にあるマークPを強調表示してもよい。なお、基準値は閾値よりも高い。強調表示の手法は特段制限されず、点滅させる、枠で囲む、所定の色で表示する等が例示されるが、これらに限定されない。
出力部13は、例えば処理装置10が備えるディスプレイに上述のような情報を表示(出力)することができる。その他、処理装置10は、サーバであってもよい。そして、出力部13は、クライアント端末に上述のような情報を送信(出力)してもよい。
次に、図7のフローチャートを用いて、処理装置10の処理の流れの一例を説明する。
処理装置10は、対象エリアに関連する投稿情報を取得すると(S10)、投稿情報の投稿者の活動エリア、活動エリアの推定結果の信頼度、投稿者のプロフィールの開示具合、投稿者の属性、投稿者にとっての活動エリアの属性、及び投稿情報の内容のカテゴリの中の少なくとも2つに基づき、投稿情報の信頼度を算出する(S11)。次いで、処理装置10は、投稿情報の信頼度が閾値より高い投稿情報を出力する(S12)。
「作用効果」
本実施形態の処理装置10によれば、第1の実施形態と同様の作用効果が実現される。
また、本実施形態の処理装置10によれば、投稿情報の投稿者の活動エリア、活動エリアの推定結果の信頼度、投稿者のプロフィールの開示具合、投稿者の属性、投稿者にとっての活動エリアの属性、及び投稿情報の内容のカテゴリの中の少なくとも2つに基づき、投稿情報の信頼度を算出することができる。このような特徴的な情報を2つ以上組み合わせて投稿情報の信頼度を算出するので、処理装置10は、投稿情報の信頼度を高精度に算出することができる。
また、処理装置10は、投稿情報を信頼度の順に並べて出力したり、信頼度が基準値より高い投稿情報を強調表示したりできる。このような処理装置10によれば、より信頼度の高い情報がユーザに届きやすくなる。
<変形例>
上述の通り、取得部11は、対象エリアに関連する投稿情報を取得する。変形例として、取得部11は、対象エリアに関連する投稿情報の中の一部を取得してもよい。取得部11は、所定の情報に基づき、取得する情報を絞り込むことができる。所定の情報は、投稿日時、及び投稿者の属性の少なくとも一方を含む。
例えば、取得部11は、対象エリアに関連する投稿情報であって、投稿日時が所定の期間内(例:直近1年間)内である投稿情報を取得してもよい。その他、取得部11は、対象エリアに関連する投稿情報であって、投稿者の属性が所定の条件(例:女性、男性、10代、20代以上等)を満たす投稿情報を取得してもよい。所定の期間及び所定の条件は、処理装置10のオペレータが設定することができる。
当該変形例によれば、膨大な投稿情報の中から所望の投稿情報を取得し、その中から信頼度の高い投稿情報を抽出することができる。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。上述した実施形態の構成は、互いに組み合わせたり、一部の構成を他の構成に入れ替えたりしてもよい。また、上述した実施形態の構成は、趣旨を逸脱しない範囲内において種々の変更を加えてもよい。また、上述した各実施形態や変形例に開示される構成や処理を互いに組み合わせてもよい。
また、上述の説明で用いたフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施の形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施の形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施の形態は、内容が相反しない範囲で組み合わせることができる。
上記の実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下に限られない。
1. 対象エリアに関連する投稿情報を取得する取得手段と、
前記投稿情報の投稿者の活動エリア、前記活動エリアの推定結果の信頼度、前記投稿者のプロフィールの開示具合、前記投稿者の属性、前記投稿者にとっての前記活動エリアの属性、及び前記投稿情報の内容のカテゴリの中の少なくとも2つに基づき、前記投稿情報の信頼度を算出する算出手段と、
前記投稿情報の信頼度が閾値より高い前記投稿情報を出力する出力手段と、
を有する処理装置。
2. 前記算出手段は、前記対象エリアと前記活動エリアの一致度がより大きい前記投稿者の前記投稿情報ほど、より高い信頼度を算出する1に記載の処理装置。
3. 前記算出手段は、前記対象エリア内の前記活動エリアの推定結果の信頼度がより高い前記投稿者の前記投稿情報ほど、より高い信頼度を算出する1又は2に記載の処理装置。
4. 前記算出手段は、前記プロフィールがより多く開示されている前記投稿者の前記投稿情報ほど、より高い信頼度を算出する1から3のいずれかに記載の処理装置。
5. 前記算出手段は、前記投稿者の属性と、前記投稿情報の内容のカテゴリとが所定の関係を満たす前記投稿情報の信頼度を、前記所定の関係を満たさない前記投稿情報の信頼度よりも高く算出する1から4のいずれかに記載の処理装置。
6. 前記算出手段は、前記対象エリア内の前記活動エリアの前記投稿者にとっての属性と、前記投稿情報の内容のカテゴリとが所定の関係を満たす前記投稿情報の信頼度を、前記所定の関係を満たさない前記投稿情報の信頼度よりも高く算出する1から5のいずれかに記載の処理装置。
7. 前記出力手段は、前記投稿情報の信頼度が前記閾値より高い前記投稿情報の一部又は全部を、前記投稿情報の信頼度の順に並べて出力する1から6のいずれかに記載の処理装置。
8. 前記出力手段は、
前記投稿情報の信頼度が前記閾値より高い前記投稿情報の一部又は全部を一覧表示し、
前記投稿情報の信頼度が基準値より高い前記投稿情報を強調表示し、
前記基準値は前記閾値よりも高い、1から6のいずれかに記載の処理装置。
9. 1つ以上のコンピュータが、
対象エリアに関連する投稿情報を取得し、
前記投稿情報の投稿者の活動エリア、前記活動エリアの推定結果の信頼度、前記投稿者のプロフィールの開示具合、前記投稿者の属性、前記投稿者にとっての前記活動エリアの属性、及び前記投稿情報の内容のカテゴリの中の少なくとも2つに基づき、前記投稿情報の信頼度を算出し、
前記投稿情報の信頼度が閾値より高い前記投稿情報を出力する、
処理方法。
10. コンピュータを、
対象エリアに関連する投稿情報を取得する取得手段、
前記投稿情報の投稿者の活動エリア、前記活動エリアの推定結果の信頼度、前記投稿者のプロフィールの開示具合、前記投稿者の属性、前記投稿者にとっての前記活動エリアの属性、及び前記投稿情報の内容のカテゴリの中の少なくとも2つに基づき、前記投稿情報の信頼度を算出する算出手段、
前記投稿情報の信頼度が閾値より高い前記投稿情報を出力する出力手段、
として機能させるプログラム。
10 処理装置
11 取得部
12 算出部
13 出力部
1A プロセッサ
2A メモリ
3A 入出力I/F
4A 周辺回路
5A バス

Claims (10)

  1. 対象エリアに関連する投稿情報を取得する取得手段と、
    前記投稿情報の投稿者の活動エリア、前記活動エリアの推定結果の信頼度、前記投稿者のプロフィールの開示具合、前記投稿者の属性、前記投稿者にとっての前記活動エリアの属性、及び前記投稿情報の内容のカテゴリの中の少なくとも2つに基づき、前記投稿情報の信頼度を算出する算出手段と、
    前記投稿情報の信頼度が閾値より高い前記投稿情報を出力する出力手段と、
    を有する処理装置。
  2. 前記算出手段は、前記対象エリアと前記活動エリアの一致度がより大きい前記投稿者の前記投稿情報ほど、より高い信頼度を算出する請求項1に記載の処理装置。
  3. 前記算出手段は、前記対象エリア内の前記活動エリアの推定結果の信頼度がより高い前記投稿者の前記投稿情報ほど、より高い信頼度を算出する請求項1に記載の処理装置。
  4. 前記算出手段は、前記プロフィールがより多く開示されている前記投稿者の前記投稿情報ほど、より高い信頼度を算出する請求項1に記載の処理装置。
  5. 前記算出手段は、前記投稿者の属性と、前記投稿情報の内容のカテゴリとが所定の関係を満たす前記投稿情報の信頼度を、前記所定の関係を満たさない前記投稿情報の信頼度よりも高く算出する請求項1に記載の処理装置。
  6. 前記算出手段は、前記対象エリア内の前記活動エリアの前記投稿者にとっての属性と、前記投稿情報の内容のカテゴリとが所定の関係を満たす前記投稿情報の信頼度を、前記所定の関係を満たさない前記投稿情報の信頼度よりも高く算出する請求項1に記載の処理装置。
  7. 前記出力手段は、前記投稿情報の信頼度が前記閾値より高い前記投稿情報の一部又は全部を、前記投稿情報の信頼度の順に並べて出力する請求項1から6のいずれか1項に記載の処理装置。
  8. 前記出力手段は、
    前記投稿情報の信頼度が前記閾値より高い前記投稿情報の一部又は全部を一覧表示し、
    前記投稿情報の信頼度が基準値より高い前記投稿情報を強調表示し、
    前記基準値は前記閾値よりも高い、請求項1から6のいずれか1項に記載の処理装置。
  9. 1つ以上のコンピュータが、
    対象エリアに関連する投稿情報を取得し、
    前記投稿情報の投稿者の活動エリア、前記活動エリアの推定結果の信頼度、前記投稿者のプロフィールの開示具合、前記投稿者の属性、前記投稿者にとっての前記活動エリアの属性、及び前記投稿情報の内容のカテゴリの中の少なくとも2つに基づき、前記投稿情報の信頼度を算出し、
    前記投稿情報の信頼度が閾値より高い前記投稿情報を出力する、
    処理方法。
  10. コンピュータを、
    対象エリアに関連する投稿情報を取得する取得手段、
    前記投稿情報の投稿者の活動エリア、前記活動エリアの推定結果の信頼度、前記投稿者のプロフィールの開示具合、前記投稿者の属性、前記投稿者にとっての前記活動エリアの属性、及び前記投稿情報の内容のカテゴリの中の少なくとも2つに基づき、前記投稿情報の信頼度を算出する算出手段、
    前記投稿情報の信頼度が閾値より高い前記投稿情報を出力する出力手段、
    として機能させるプログラム。
JP2022184680A 2022-11-18 2022-11-18 処理装置、処理方法、及びプログラム Pending JP2024073786A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022184680A JP2024073786A (ja) 2022-11-18 2022-11-18 処理装置、処理方法、及びプログラム
US18/388,718 US20240168960A1 (en) 2022-11-18 2023-11-10 Processing apparatus, processing method, and non-transitory storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022184680A JP2024073786A (ja) 2022-11-18 2022-11-18 処理装置、処理方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2024073786A true JP2024073786A (ja) 2024-05-30

Family

ID=91080060

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022184680A Pending JP2024073786A (ja) 2022-11-18 2022-11-18 処理装置、処理方法、及びプログラム

Country Status (2)

Country Link
US (1) US20240168960A1 (ja)
JP (1) JP2024073786A (ja)

Also Published As

Publication number Publication date
US20240168960A1 (en) 2024-05-23

Similar Documents

Publication Publication Date Title
US9436690B2 (en) System and method for predicting a geographic origin of content and accuracy of geotags related to content obtained from social media and other content providers
JP6540314B2 (ja) 施設推定方法、デバイス及びプログラム
US10373202B2 (en) Selection of region-specific brand pages based on location information of social networking system users
US11153253B2 (en) System and method for determining and delivering breaking news utilizing social media
Zhai et al. Mapping the popularity of urban restaurants using social media data
Hao et al. An efficient approach to generating location-sensitive recommendations in ad-hoc social network environments
TWI454099B (zh) 擴充訊息傳送系統與方法
Giatsoglou et al. CityPulse: A platform prototype for smart city social data mining
EP2518679A1 (en) Method and system fo recommending geo-tagged items
US20160110381A1 (en) Methods and systems for social media-based profiling of entity location by associating entities and venues with geo-tagged short electronic messages
US10013462B2 (en) Virtual tiles for service content recommendation
US20110225048A1 (en) Generating a user profile based on self disclosed public status information
Gao et al. Mining human mobility in location-based social networks
Ho et al. Modeling and visualizing information propagation in a micro-blogging platform
Williams et al. Improving geolocation of social media posts
Jin et al. Similarity measurement on human mobility data with spatially weighted structural similarity index (SpSSIM)
Cheong et al. A literature review of recent microblogging developments
Zhong et al. Measuring user similarity using check-ins from LBSN: a mobile recommendation approach for e-commerce and security services
US20140179354A1 (en) Determining contact opportunities
US20150178773A1 (en) Information processing apparatus and method, and non-transitory computer readable medium
US11575641B2 (en) Estimating device, estimating method, and estimating program
JP2024073786A (ja) 処理装置、処理方法、及びプログラム
Zhu et al. Understanding users’ information dissemination behaviors on Douyin, a short video mobile application in China
Tiwari et al. Location based recommender systems: Architecture, trends and research areas
Bendler et al. Does social media reflect metropolitan attractiveness? Behavioral information from twitter activity in urban areas