JP7476956B2 - システム、クエリ生成装置、クエリ生成方法及びプログラム - Google Patents

システム、クエリ生成装置、クエリ生成方法及びプログラム Download PDF

Info

Publication number
JP7476956B2
JP7476956B2 JP2022527449A JP2022527449A JP7476956B2 JP 7476956 B2 JP7476956 B2 JP 7476956B2 JP 2022527449 A JP2022527449 A JP 2022527449A JP 2022527449 A JP2022527449 A JP 2022527449A JP 7476956 B2 JP7476956 B2 JP 7476956B2
Authority
JP
Japan
Prior art keywords
account
information
user
name
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022527449A
Other languages
English (en)
Other versions
JPWO2021240791A1 (ja
JPWO2021240791A5 (ja
Inventor
一郁 児島
真宏 谷
圭佑 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2021240791A1 publication Critical patent/JPWO2021240791A1/ja
Publication of JPWO2021240791A5 publication Critical patent/JPWO2021240791A5/ja
Application granted granted Critical
Publication of JP7476956B2 publication Critical patent/JP7476956B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、システム、クエリ生成装置、クエリ生成方法及び非一時的なコンピュータ可読媒体に関する。
近年、SNS(Social Networking Service)などのソーシャルメディアが世界中に広く普及している。ソーシャルメディアの種類も増えており、約80%のユーザーが異なるソーシャルメディアに複数のアカウントを所有している。このため、ソーシャルメディアのユーザーと、ユーザーが利用するアカウントとの関係が多様化しており、関連する研究が進められている。
関連する技術として、非特許文献1が知られている。非特許文献1には、異なるソーシャルメディアのアカウントのリンク情報を使用して、同一ユーザーのアカウントを探すことが開示されている。その他、アカウント名の生成に関連する技術として、非特許文献2が知られている。非特許文献2に開示されるツールでは、入力されたユーザー情報(名前、性別、出身地など)を基に任意のアカウント名を生成することができる。
Waseem Ahmad, Rashid Ali, "A Framework for Seed User Identification across Multiple Online Social Networks", 2017 International Conference on Advances in Computing, Communications and Informatics (ICACCI), 13-16 Sept. 2017 Masterpiece Generator, "Name Generator", [online], インターネット <URL:https://www.name-generator.org.uk/username/>
特許文献1のような関連する技術によれば、異なるソーシャルメディアのアカウントのリンク情報を使用することで、同一ユーザーのアカウントを探すことができる。しかしながら、関連する技術では、その他の情報が考慮されていないため、同一ユーザーが利用するアカウントを効果的に探すことは困難である。
本開示は、このような課題に鑑み、同一ユーザーが利用するアカウントを効果的に探すことが可能なシステム、クエリ生成装置、クエリ生成方法及び非一時的なコンピュータ可読媒体を提供することを目的とする。
本開示に係るシステムは、入力されたアカウントのアカウント情報に基づいて、検索クエリのアカウント名を生成するクエリ生成手段と、前記生成された検索クエリを用いて、ソーシャルメディア情報から該当するアカウント名のアカウント情報を検索するアカウント検索手段と、を備えるものである。
本開示に係るクエリ生成装置は、入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリの候補となる複数のアカウント名の候補を生成するアカウント名候補生成手段と、前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングする候補フィルタリング手段と、を備えるものである。
本開示に係るクエリ生成装置は、入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリとなる複数のアカウント名を生成するアカウント名生成手段と、前記生成された複数のアカウント名に対し、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいて、前記検索の結果をアカウント照合するための優先度を設定する優先度設定手段と、を備えるものである。
本開示に係るクエリ生成装置は、入力されたアカウントのアカウント情報に基づいて、前記アカウントのユーザーの特性を抽出する特性抽出手段と、前記入力されたアカウント情報と前記抽出されたユーザーの特性に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリのアカウント名を生成するアカウント名生成手段と、を備えるものである。
本開示に係るクエリ生成方法は、入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリの候補となる複数のアカウント名の候補を生成し、前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングするものである。
本開示に係るクエリ生成方法は、入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリとなる複数のアカウント名を生成し、前記生成された複数のアカウント名に対し、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいて、前記検索の結果をアカウント照合するための優先度を設定するものである。
本開示に係るクエリ生成方法は、入力されたアカウントのアカウント情報に基づいて、前記アカウントのユーザーの特性を抽出し、前記入力されたアカウント情報と前記抽出されたユーザーの特性に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリのアカウント名を生成するものである。
本開示に係る非一時的なコンピュータ可読媒体は、入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリの候補となる複数のアカウント名の候補を生成し、
前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングする、処理をコンピュータに実行させるためのプログラムが格納された非一時的なコンピュータ可読媒体である。
本開示に係る非一時的なコンピュータ可読媒体は、入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリとなる複数のアカウント名を生成し、前記生成された複数のアカウント名に対し、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいて、前記検索の結果をアカウント照合するための優先度を設定する、処理をコンピュータに実行させるためのプログラムが格納された非一時的なコンピュータ可読媒体である。
本開示に係る非一時的なコンピュータ可読媒体は、入力されたアカウントのアカウント情報に基づいて、前記アカウントのユーザーの特性を抽出し、前記入力されたアカウント情報と前記抽出されたユーザーの特性に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリのアカウント名を生成する、処理をコンピュータに実行させるためのプログラムが格納された非一時的なコンピュータ可読媒体である。
本開示によれば、同一ユーザーが利用するアカウントを効果的に探すことが可能なシステム、クエリ生成装置、クエリ生成方法及び非一時的なコンピュータ可読媒体を提供することができる。
実施の形態1に係るアカウント照合システムの構成例を示す構成図である。 実施の形態1に係るアカウント検索システムの構成例を示す構成図である。 実施の形態1に係るアカウント照合システムの構成例を示す構成図である。 実施の形態1に係るアカウント照合システムの動作例を示すフローチャートである。 実施の形態2に係るクエリ生成装置の構成例を示す構成図である。 実施の形態2に係るクエリ生成装置の構成例を示す構成図である。 実施の形態2に係るクエリ生成装置の動作例を示すフローチャートである。 実施の形態3に係るクエリ生成装置の構成例を示す構成図である。 実施の形態4に係るクエリ生成装置の構成例を示す構成図である。 実施の形態5に係るクエリ生成装置の構成例を示す構成図である。 実施の形態6に係るクエリ生成装置の構成例を示す構成図である。 実施の形態7に係るクエリ生成装置の構成例を示す構成図である。 実施の形態7に係るクエリ生成装置の動作例を示すフローチャートである。 実施の形態8に係るクエリ生成装置の構成例を示す構成図である。 実施の形態8に係るクエリ生成装置の動作例を示すフローチャートである。 実施の形態に係るコンピュータのハードウェアの概要を示す構成図である。
以下、図面を参照して実施の形態について説明する。各図面においては、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略される。
(実施の形態に至る検討)
異なるソーシャルメディアから同一ユーザーが所有するアカウントを特定(アカウント照合)する技術は、ユーザーの属性推定に有用であるため、マーケティングやターゲット広告、犯罪捜査などで活用可能である。
例えば、サイバー空間を活用した犯罪が近年増加しており、サイバー空間における脅威が問題視されている。サイバー空間は主に犯行の計画や資金調達などの目的で活用されており、犯罪を未然防止するためには犯罪に関係している人物をサイバー空間内で特定することが重要である。サイバー空間を活用した犯罪捜査では、サイバー空間で犯罪に関係する可能性のある情報を収集し、収集した情報をもとに不審人物を検知し、サイバー空間の情報からその不審人物を特定し、最終的に実世界においてその人物を監視する流れが考えられる。例えば、サイバー空間の情報から不審人物を特定する際に、同一ユーザーのアカウントを特定することが有効である。
発明者らは、異なるソーシャルメディアのアカウントの中から、同一ユーザーのアカウントを検索し照合する方法を検討し、関連する技術では、同一ユーザーのアカウントを効果的に検索し照合することは困難であることを見出した。非特許文献1の技術を用いて、ソーシャルメディアのアカウントのリンク情報を使用して検索したとしても、アカウントにリンクが張られていない場合は、アカウントを検索し照合することはできない。また、非特許文献2の技術を用いて、ユーザー情報からアカウント名を生成し、そのアカウント名を使用して検索したとしても、生成されるアカウント名の候補数が多く、検索対象が膨大になる。
そこで、以下の実施の形態では、膨大なソーシャルメディアのアカウントの中から同一ユーザーが保有するアカウントを効率よく効果的に検索し照合することを可能とする。
(実施の形態1)
以下、図面を参照して実施の形態1について説明する。図1は、本実施の形態に係るアカウント照合システムの構成例を示している。本実施の形態に係るアカウント照合システムは、入力されるアカウントと同じユーザーが所有するアカウントを検索し照合するためのシステムである。例えば、アカウント照合システムは、照合結果を出力することで、各国法執行機関向け犯罪の捜査支援や、リテール向けマーケティング及びターゲティング広告の支援等を行うことができる。
図1に示すように、本実施の形態に係るアカウント照合システム1は、クエリ生成装置100、アカウント収集装置200、アカウント照合装置300を備えている。なお、アカウント照合システム1は、3つの装置に限らず、これらの装置の機能を含む任意の数の装置で構成してもよい。例えば、図2のように、クエリ生成装置100及びアカウント収集装置200を備えるアカウント検索システム2としてもよい。
クエリ生成装置(クエリ生成部)100は、入力されるアカウントのアカウント情報に基づいて、検索クエリのアカウント名を生成する。例えば、アカウント情報は、アカウントIDを含み、また、アカウント名、プロフィール情報及び投稿情報のいずれかの情報、または複数の情報を含む。アカウントIDは、アカウント登録時にソーシャルメディアシステムが割り当てた情報であり、アカウントを識別するための識別子である。アカウント名は、ユーザーが任意に設定した情報であり、アカウントを識別するための名称である。プロフィール情報は、ユーザーが入力した情報であり、ユーザーのプロフィールを示す属性情報や画像である。例えば、プロフィール情報は、性別、年齢、誕生日、活動場所、住所、出身地、趣味、職業、学校等を含む。なお、プロフィール情報にアカウント名が含まれてもよい。投稿情報は、ユーザーがタイムライン等に投稿した画像やコメント、会話等である。アカウント情報は、アカウントに関連するその他の情報を含んでもよい。例えば、ソーシャルメディアにおける友人やフォロワーなど他のアカウントとのつながりを示す情報を含んでもよい。
アカウント収集装置(アカウント検索部)200は、クエリ生成装置100により生成された検索クエリを用いて、ソーシャルメディア情報から該当するアカウント名のアカウント情報を検索する。アカウント照合装置(アカウント照合部)300は、アカウント収集装置200の検索により得られた複数のアカウント情報と、クエリ生成装置100に入力されたアカウント情報とを照合する。
図3は、本実施の形態に係るアカウント照合システムの各装置の具体的な構成例を示している。例えば、アカウント照合システム1の各装置は、ソーシャルメディアシステム400と通信可能に接続されている。
ソーシャルメディアシステム400は、SNSなどのソーシャルメディアサービスを提供するシステムである。ソーシャルメディアシステム400は、複数のソーシャルメディアサービスを含む。ソーシャルメディアサービスは、インターネット(オンライン)上で、複数のアカウント(ユーザー)間で情報を発信(公開)し、コミュニケーションをとることが可能なオンラインサービスである。ソーシャルメディアサービスは、SNSに限らず、チャットなどのメッセージングサービス、ブログや電子掲示板、動画共有サイトや情報共有サイト、ソーシャルゲームやソーシャルブックマーク等を含む。例えば、ソーシャルメディアシステム400は、クラウド上のサーバやユーザー端末を含む。ユーザー端末は、サーバが提供するAPI(Application Programming Interface)を介して、投稿の入力や閲覧等を行う。アカウント照合システム1の各装置は、提供されるAPI(取得ツール)を介して必要なソーシャルメディア情報(アカウント情報)を取得してもよいし、予めソーシャルメディア情報が格納されたデータベースから取得してもよい。
クエリ生成装置100は、取得部101、生成部102を備えている。取得部101は、照合(検索)対象のアカウントのアカウント情報を取得(入力)するアカウント情報取得部(入力部)である。取得部101は、アカウントIDやアカウント名、プロフィール情報、投稿情報を入力してもよいし、入力されたアカウントIDを用いてソーシャルメディアシステム400からアカウント名、プロフィール情報、投稿情報等を取得してもよい。
生成部102は、取得(入力)されたアカウント情報に含まれるアカウント名、プロフィール情報及び投稿情報に基づいて、ソーシャルメディア情報を検索するための検索クエリを生成する。生成部102は、アカウントのアカウント名、プロフィール情報及び投稿情報に基づいて、検索クエリとなる複数のアカウント名を生成する。
アカウント収集装置200は、取得部201、検索部202を備えている。取得部201は、ソーシャルメディアシステム400からソーシャルメディア情報を取得(収集)するソーシャルメディア情報取得部である。ソーシャルメディア情報は、ソーシャルメディアの各アカウントに関する公開情報であり、アカウントごとにアカウントID、アカウント名、プロフィール情報、投稿情報等のアカウント情報を含む。取得部201は、ソーシャルメディアシステム400から取得可能な複数のソーシャルメディアのソーシャルメディア情報を取得する。
検索部202は、取得したソーシャルメディア情報から、生成された全てのアカウント名を検索クエリとして、アカウント情報を検索するアカウント情報検索部である。検索クエリのアカウント名と同じアカウント名のアカウント情報のみを検索してもよいし、検索クエリのアカウント名と所定の範囲で類似するアカウント名のアカウント情報を検索してもよい。
アカウント照合装置300は、算出部301、判別部302を備えている。算出部301は、検索により得られた複数のアカウント情報と、入力されたアカウント情報との類似度(類似スコア)を算出する。例えば、アカウント情報に含まれるアカウント名、プロフィール情報及び投稿情報を含めて類似度を算出する。判別部302は、算出された類似度に基づいて、検索により得られた複数のアカウント情報から、入力されたアカウント情報と同一ユーザーのアカウント情報を判別(探索)する。
図4は、本実施の形態に係るアカウント照合システムの動作例を示している。図4に示すように、まず、クエリ生成装置100は、アカウント情報を入力する(S101)。取得部101は、照合対象のソーシャルメディアのアカウントのアカウントID、アカウント名、プロフィール情報、投稿情報を含むアカウント情報を入力(取得)する。
次に、クエリ生成装置100は、アカウント情報に基づいて検索クエリを生成する(S102)。生成部102は、入力されたアカウント名、プロフィール情報、投稿情報等に基づいて、検索クエリのアカウント名を生成する。図4の例では、入力されたアカウント名(Kojima)から、プロフィール情報及び投稿情報に基づいて、検索クエリとしてアカウント名(k-kojima、kojikoji)を生成する。
次に、アカウント収集装置200は、ソーシャルメディア情報からアカウント情報を検索する(S103)。取得部201は、ソーシャルメディアシステム400から複数のソーシャルメディアのソーシャルメディア情報を取得し、検索部202は、取得したソーシャルメディア情報から、全ての検索クエリのアカウント名のアカウント情報を検索する。図4の例では、アカウント名(k-kojima)を検索クエリとして、アカウントID(A1, A2, A3, A4)のアカウント情報が検索され、アカウント名(kojikoji)を検索クエリとして、アカウントID(A2, A4, B1, B2)のアカウント情報が検索されている。
次に、アカウント照合装置300は、検索されたアカウント情報を照合する(S104)。算出部301は、検索により得られた複数のアカウント情報と、入力されたアカウント情報との類似度(類似スコア)を算出し、判別部302は、算出された類似度に基づいて、入力されたアカウント情報と同一ユーザーのアカウント情報を判別する。例えば、類似度が所定の閾値よりも高い場合、同一ユーザーのアカウント情報であると判断する。図4の例では、アカウントID=A1の類似度が0.8であり、アカウントID=A2の類似度が0.2である。例えば、閾値を0.5とすると、アカウントID=A1を同一ユーザーのアカウントであると判断する。
以上のように、本実施の形態では、入力されたアカウントのアカウント情報に応じて検索クエリを生成することで、同一ユーザーが所有する他のソーシャルメディアのアカウントを検索するための支援を行う。入力されたアカウントと同じユーザーが所有する他のソーシャルメディアのアカウントを見つける場合、他のソーシャルメディアに存在する無数のアカウントを対象にアカウントを検索し照合する必要がある。しかしながら、検索対象が膨大なため、収集コストも計算コストも大きなものとなる。そこで、アカウント情報(例えば、アカウント名、プロフィール情報及び投稿情報を含む)に基づいて、検索クエリのアカウント名を生成することで、アカウントに応じた適切な検索クエリを生成できる。これにより、検索対象とする他のソーシャルメディアのアカウント数を減らすことができ、収集コストも計算コストも削減できる。
(実施の形態2)
以下、図面を参照して実施の形態2について説明する。本実施の形態では、実施の形態1のクエリ生成装置の一例として、アカウント名の候補群をフィルタリングする例について説明する。
図5は、本実施の形態に係るクエリ生成装置の構成例を示している。図5の構成は、例えば、実施の形態1の図3の生成部102に対応している。図5に示すように、本実施の形態に係るクエリ生成装置100は、アカウント名候補生成部110、候補フィルタリング部120を備えている。
アカウント名候補生成部110は、入力されたアカウント情報に基づいて、検索クエリの候補となるアカウント名の候補群を生成する。アカウント名候補生成部110は、入力されたアカウント情報に含まれるアカウント名、プロフィール情報及び投稿情報から、複数のアカウント名の候補を生成する。
候補フィルタリング部120は、生成されたアカウント名の候補群をフィルタリングする。候補フィルタリング部120は、入力されたアカウント情報から取得されるアカウントのユーザーの特性に基づいて、アカウント名の候補群をフィルタリングし、検索クエリの数を絞り込む。
図6は、本実施の形態に係るクエリ生成装置の各部の具体的な構成例を示している。図6に示すように、アカウント名候補生成部110は、アカウント名生成部111、類似度算出部112を備えている。
アカウント名生成部111は、入力されたアカウント情報に含まれるアカウント名、プロフィール情報及び投稿情報に基づいて、複数のアカウント名を生成する。類似度算出部112は、生成された複数のアカウント名と、入力されたアカウント情報のアカウント名との類似度(類似スコア)を算出する。類似度は、アカウント名の文字が一致する割合を示すスコアである。
候補フィルタリング部120は、特性パラメータ取得部121、検索クエリ制御部122を備えている。特性パラメータ取得部121は、入力されたアカウントのユーザーの特性パラメータを取得する。特性パラメータ取得部121は、入力されたアカウント情報に含まれるプロフィール情報及び投稿情報(アカウント名を含んでもよい)に基づいて特性パラメータを取得する。特性パラメータは、アカウント名に関連するユーザーの特性を示すパラメータである。
検索クエリ制御部(フィルタリング制御部)122は、取得された特性パラメータに基づいて、アカウント名の候補群をフィルタリングする。検索クエリ制御部122は、特性パラメータ(ユーザーの特性)に基づいてフィルタリングの閾値(類似スコアの閾値)を決定し、決定した閾値に応じて出力する検索クエリの数を制御する。例えば、予め定められたユーザーの特性と閾値との関連付けに基づいて、ユーザーの特性に応じた閾値を決定してもよいし、予めユーザーの特性と閾値との関連を学習した学習モデルに基づいて、ユーザーの特性に応じた閾値を決定してもよい。
図7は、本実施の形態に係るクエリ生成装置の動作例を示している。図7に示すように、まず、クエリ生成装置100は、アカウント情報を入力する(S201)。図4と同様に、照合対象のソーシャルメディアのアカウントのアカウントID、アカウント名、プロフィール情報、投稿情報を含むアカウント情報を入力する。
次に、クエリ生成装置100は、アカウント名の候補を生成する(S202)。アカウント名生成部111は、入力されたアカウント情報に含まれるアカウント名、プロフィール情報及び投稿情報等に基づいて、検索クエリとなる複数のアカウント名の候補を生成する。例えば、アカウント名生成部111は、プロフィール情報(属性情報)や投稿情報から抽出される文字(単語)とアカウント名を組み合わせることで、複数のアカウント名を生成する。図7の例では、入力されたアカウント名(Kojima)から、プロフィール情報及び投稿情報に基づいて、アカウント名(k-kojima、kojikoji、kojima0901、Koji09)を生成する。
次に、クエリ生成装置100は、アカウント名の類似度を算出する(S203)。類似度算出部112は、生成された複数のアカウント名と、入力されたアカウント情報のアカウント名との類似度(類似スコア)を算出する。図7の例では、入力されたアカウント名(Kojima)と候補のアカウント名(k-kojima、kojikoji、kojima0901、Koji09)との類似度を算出する。
次に、クエリ生成装置100は、特性パラメータを取得する(S204)。特性パラメータ取得部121は、入力されたアカウント情報に含まれるプロフィール情報及び投稿情報に基づいて特性パラメータを取得する。例えば、プロフィール情報及び投稿情報の文字や画像を解析し、それらの特徴から、アカウント名に関連するユーザーの任意の特性パラメータを取得する。
次に、クエリ生成装置100は、フィルタリングの閾値を決定する(S205)。検索クエリ制御部122は、取得した特性パラメータに基づいてフィルタリングの閾値(類似スコアの閾値)を決定する。例えば、特性パラメータにより、ユーザーが同じアカウント名を使用する可能性が高い場合、閾値を高く設定し、ユーザーが同じアカウント名を使用する可能性が低い場合、閾値を低く設定する。
次に、クエリ生成装置100は、フィルタリングを実施する(S206)。検索クエリ制御部122は、決定した閾値によりアカウント名の候補群をフィルタリングする。図7の例では、閾値を0.8とし、0.8よりも小さい類似度のアカウント名を除いて、0.8以上の類似度(類似スコア)のアカウント名(k-kojima、kojikoji)を検索クエリとして出力する。
以上のように、本実施の形態では、プロフィール情報や投稿情報を含むアカウント情報からアカウント名の候補群を生成し、アカウント情報に基づいたユーザーの特性に応じて候補群をフィルタリングする。これにより、ユーザーの特性に応じて、検索クエリの総数を適切に減らすことができ、同一ユーザーのアカウントを効率よく検索することを可能にする。
(実施の形態3)
以下、図面を参照して実施の形態3について説明する。本実施の形態では、実施の形態2のクエリ生成装置の候補フィルタリング部の一例として、情報リテラシー度を算出する例について説明する。
図8は、本実施の形態に係るクエリ生成装置100の構成例を示している。図8に示すように、本実施の形態では、候補フィルタリング部120の特性パラメータ取得部121として、情報リテラシー度算出部123を備えている。
情報リテラシー度算出部123は、ユーザーの特性パラメータとして、ユーザーの情報リテラシー度を算出する。情報リテラシー度(情報開示度)は、ソーシャルメディアにおけるユーザー自身の情報開示のレベルを示すスコアである。
プロフィールの充実度、セルフィー画像や、ユーザーの身辺情報(GPS(Global Positioning System)情報の有無、友人関係、行動履歴など)を投稿するユーザーは情報リテラシーが低いと考えられる。このため、情報リテラシー度は、例えば、下記のリテラシー要素に基づいてスコアを算出する。例えば、各リテラシー要素の数値の合計値に基づいてもよいし、平均値に基づいてもよい。また、いずれか一つの要素を用いてもよいし、任意の複数の要素を用いてもよい。なお、これらのリテラシー要素は一例であり、その他の要素(投稿頻度、投稿の公開範囲等)を含めて情報リテラシー度を求めてもよい。
・プロフィール情報内の各項目の記入率
・複数の投稿画像に含まれるセルフィー画像(ユーザーの画像、プロフィール画像と一致する人物の画像)の割合
・GPS情報(位置情報)を付与した投稿情報の件数
・複数の投稿画像に頻出する人物の人数(複数回現れる人物の数)
本実施の形態では、検索クエリ制御部122は、算出された情報リテラシー度に応じてフィルタリングの閾値を決定する。情報リテラシー度が低いユーザーは共通のアカウント名を用いる可能性が高く、情報リテラシー度が高いユーザーは異なるアカウント名を用いる可能性が高い。このため、情報リテラシー度が低い場合、閾値を高く設定し、情報リテラシー度が高い場合、閾値を低く設定する。
検索クエリ制御部122は、例えば、予め情報リテラシー度と閾値との関係をテーブル等に対応付けておき、その対応付けに基づいて閾値を決定してもよい。また、情報リテラシー度のリテラシー要素と閾値との関係を対応付けておいてもよい。例えば、情報リテラシー度算出部123が、各リテラシー要素の条件を満たす(または満たさない)ことを示す情報を出力し、検索クエリ制御部122が、各条件を満たすリテラシー要素の数に応じて閾値を設定するようにしてもよい。
また、検索クエリ制御部122は、例えば、予め情報リテラシー度と閾値との関係を学習した学習モデルを生成しておき、その学習モデルに基づいて閾値を決定してもよい。さらに、情報リテラシー度のリテラシー要素と閾値との関係を学習してもよい。例えば、情報リテラシー度算出部123がリテラシー要素の値を出力し、そのリテラシー要素に閾値のラベルを付与して機械学習することで学習モデルを生成する。学習後の学習モデルに、リテラシー要素の値を入力することで、情報リテラシー度に応じた閾値を得ることができる。
以上のように、本実施の形態では、ユーザーの特性パラメータとして、アカウントに記載されているプロフィール情報や投稿情報に基づいてユーザーの情報リテラシー度を表すスコアを算出し、算出した情報リテラシー度に応じて検索クエリ数を制御する。これにより、ユーザー自身の情報開示度に応じて、アカウント名の候補を適切に絞り込むことができる。
(実施の形態4)
以下、図面を参照して実施の形態4について説明する。本実施の形態では、実施の形態2のクエリ生成装置の候補フィルタリング部の一例として、著名度を取得する例について説明する。
図9は、本実施の形態に係るクエリ生成装置100の構成例を示している。図9に示すように、本実施の形態では、候補フィルタリング部120の特性パラメータ取得部121として、著名度取得部124を備えている。
著名度取得部124は、ユーザーの特性パラメータとして、アカウント(ユーザー)の著名度を取得する。著名度は、アカウントが他のユーザー(アカウント)からの認知度に応じたスコアである。
例えば、著名度は、ソーシャルメディアにおけるアカウントの友人の数、フォロワーの数、投稿に対する他のアカウントの反応(リツイート、「いいね」)の数等に基づいている。また、ソーシャルメディアが公式に認定しているオフィシャルアカウントの場合、著名度を高く設定してもよい。著名度をこれらの情報から算出してもよいし、外部から取得してもよい。
本実施の形態では、検索クエリ制御部122は、取得された著名度に応じてフィルタリングの閾値を決定する。著名な人ほど、自分のアカウントの認知度を高めることを目的に、自分のアカウント名を変え難い。このため、著名度が高い場合、閾値を高く設定し、著名度が低い場合、閾値を低く設定する。
検索クエリ制御部122は、実施の形態3と同様に、予め著名度と閾値との関係をテーブル等に対応付けておき、その対応付けに基づいて閾値を決定してもよいし、予め著名度と閾値との関係を学習した学習モデルを生成しておき、その学習モデルに基づいて閾値を決定してもよい。
以上のように、本実施の形態では、ユーザーの特性パラメータとして、アカウント(ユーザー)の著名度を表すスコアを取得し、取得した著名度に応じて検索クエリ数を制御する。これにより、アカウント(ユーザー)の著名度に応じて、アカウント名の候補を適切に絞り込むことができる。
(実施の形態5)
以下、図面を参照して実施の形態5について説明する。本実施の形態では、実施の形態2のクエリ生成装置の候補フィルタリング部の一例として、名前使用率を取得する例について説明する。
図10は、本実施の形態に係るクエリ生成装置100の構成例を示している。図10に示すように、本実施の形態では、候補フィルタリング部120の特性パラメータ取得部121として、名前使用率取得部125を備えている。
名前使用率取得部125は、ユーザーの特性パラメータとして、ユーザーの名前の使用率を取得する。名前使用率は、ユーザーの名前が一般的に使用される割合(確率)である。
例えば、名前使用率は、ソーシャルメディアのアカウント情報に含まれる名前として使用される割合、インターネット上で公表されている名前として使用される割合、名前の統計情報から取得される割合等に基づいている。名前使用率をこれらの情報から算出してもよいし、外部から取得してもよい。
本実施の形態では、検索クエリ制御部122は、取得された名前使用率に応じてフィルタリングの閾値を決定する。使用者が多すぎる名前(鈴木,田中など)の場合、名前ではない他の何かを用いてアカウント名を代用する傾向がある。このため、名前使用率が高い場合、閾値を低く設定し、名前使用率が低い場合、閾値を高く設定する。
検索クエリ制御部122は、実施の形態3と同様に、予め名前使用率と閾値との関係をテーブル等に対応付けておき、その対応付けに基づいて閾値を決定してもよいし、予め名前使用率と閾値との関係を学習した学習モデルを生成しておき、その学習モデルに基づいて閾値を決定してもよい。
以上のように、本実施の形態では、ユーザーの特性パラメータとして、ユーザーの名前の使用率を表すスコアを取得し、取得した使用率に応じて検索クエリ数を制御する。これにより、ユーザーの名前の使用率に応じて、アカウント名の候補を適切に絞り込むことができる。
(実施の形態6)
以下、図面を参照して実施の形態6について説明する。本実施の形態では、実施の形態2のクエリ生成装置の候補フィルタリング部の一例として、特性ベクトルを抽出する例について説明する。
図11は、本実施の形態に係るクエリ生成装置100の構成例を示している。図11に示すように、本実施の形態では、候補フィルタリング部120の特性パラメータ取得部121として、特性ベクトル抽出部126を備えている。特性ベクトル抽出部126は、プロフィール情報及び投稿情報に基づいたユーザーの特性を示すベクトル情報を抽出する
ユーザーの特性ベクトルは、ユーザーの特性に関する複数の特性要素を含む。例えば、特性要素は、上記情報リテラシー度の要素を含み、さらに他の要素を含む。特性要素は、ユーザーの性別や年齢、居住地などの属性情報(プロフィール情報の属性を示す情報)や、プロフィール情報内の各項目の記入率、複数の投稿画像に含まれるセルフィー画像の割合、GPS情報を付与した投稿の件数、複数の投稿画像に頻出する人物の人数などの任意の複数の要素を含む。特性要素は、プロフィール情報及び投稿情報から得られるその他の要素でもよい。
本実施の形態では、検索クエリ制御部122は、抽出された特性ベクトルに応じてフィルタリングの閾値を決定する。検索クエリ制御部122は、ユーザーの特性ベクトルとアカウント名の候補群との類似スコアに基づいて、検索クエリ候補群を制御してもよい。また、特性ベクトルの特性要素と閾値との関係を学習してもよい。例えば、特性ベクトル抽出部126が抽出したその特性要素に閾値のラベルを付与して機械学習することで学習モデルを生成する。学習後の学習モデルに、特性要素を入力することで、特性ベクトルに応じた閾値を得ることができる。
以上のように、本実施の形態では、ユーザーの特性パラメータとして、プロフィール情報や投稿情報から得られる特性ベクトルを抽出し、抽出した特性ベクトルに応じて検索クエリ数を制御する。これにより、ユーザーの特性に応じて、アカウント名の候補を適切に絞り込むことができる。
(実施の形態7)
以下、図面を参照して実施の形態7について説明する。本実施の形態では、実施の形態1のクエリ生成装置の一例として、複数のアカウント名の優先度を決定する例について説明する。
図12は、本実施の形態に係るクエリ生成装置の構成例を示している。図12の構成は、例えば、実施の形態1の図3の生成部102に対応している。図12に示すように、本実施の形態に係るクエリ生成装置100は、アカウント名候補生成部110、優先度制御部130を備えている。なお、アカウント名候補生成部110は、実施の形態2と同様の構成である。
優先度制御部(優先度設定部)130は、生成されたアカウント名の候補群の優先度を制御(設定)する。優先度は、アカウント照合装置300がアカウントの照合処理を行うための優先度(優先順位)である。
優先度制御部130は、特性パラメータ取得部121、優先度決定部131を備えている。特性パラメータ取得部121は、実施の形態2~6と同様の構成である。優先度決定部131は、取得された特性パラメータ(ユーザーの特性)に基づいて、検索クエリとなる複数のアカウント名の優先度を決定する。優先度は、実施の形態2~6のフィルタリングの閾値と同様に、予め定められたユーザーの特性と優先度との関連付けに基づいて決定してもよいし、予めユーザーの特性と閾値との関連を学習した学習モデルに基づいて決定してもよい。
図13は、本実施の形態に係るクエリ生成装置の動作例を示している。S201~S204は、実施の形態2の図7と同様である。本実施の形態では、特性パラメータを取得すると(S204)、優先度決定部131は、取得された特性パラメータに基づいて、検索クエリとなるアカウント名の優先度を決定する(S211)。次に、優先度決定部131は、決定した優先度とともに複数のアカウント名を出力する(S212)。図13の例では、0.8以上の類似度のアカウント名の優先度を最も高く設定し、0.8よりも小さいアカウント名の優先度を低く設定している。
その後、アカウント収集装置200がアカウント名を用いて検索し、アカウント照合装置300が優先度に基づいて照合を行う。アカウント照合装置300は、検索クエリの優先度の高い順に、検索結果のアカウント情報と入力されたアカウント情報とを照合する。例えば、類似度の基準を満たすアカウント情報が検出された場合、照合処理を終了することで、照合処理の速度を向上できる。
以上のように、本実施の形態では、ユーザーの特性に応じてアカウント名の候補群の優先度を決定し、その優先度に基づいてアカウント照合を行う。これにより、効率よく確実にアカウント照合を行うことができる。
(実施の形態8)
以下、図面を参照して実施の形態8について説明する。本実施の形態では、実施の形態1のクエリ生成装置の一例として、ユーザーの特性に応じてアカウント名を生成する例について説明する。
図14は、本実施の形態に係るクエリ生成装置の構成例を示している。図14の構成は、例えば、実施の形態1の図3の生成部102に対応している。図14に示すように、本実施の形態に係るクエリ生成装置100は、特性抽出部140、アカウント名生成部150を備えている。なお、実施の形態2~6と同様に、複数のアカウント名をフィルタリングするフィルタリング部をさらに備えてもよい。
特性抽出部140は、入力されたアカウント情報に含まれるプロフィール情報及び投稿情報(アカウント名を含んでもよい)に基づいてユーザーの特性情報を抽出する。アカウント名生成部150は、抽出されたユーザーの特性情報に基づいて検索クエリのアカウント名を生成する。アカウント名生成部150は、プロフィール情報や投稿情報(投稿内容、投稿傾向)を考慮してアカウント名を生成する。例えば、アカウント名生成部150は、検索に使用するソーシャルメディアの特性を考慮してもよい。
図15は、本実施の形態に係るクエリ生成装置の動作例を示している。図15に示すように、まず、クエリ生成装置100は、アカウント情報を入力する(S301)。図4と同様に、照合対象のソーシャルメディアのアカウントのアカウントID、アカウント名、プロフィール情報、投稿情報を含むアカウント情報を入力する。
次に、クエリ生成装置100は、ユーザーの特性を抽出する(S302)。特性抽出部140は、入力されたアカウント情報に含まれるプロフィール情報及び投稿情報に基づいてユーザーの特性情報を抽出する。特性情報は、実施の形態2~6と同様の特性パラメータを含んでもよいし、その他の特性を示す情報を含んでもよい。
次に、クエリ生成装置100は、アカウント名の生成ルールを決定する(S303)。アカウント名生成部150は、抽出されたユーザーの特性情報に基づいて、アカウント名の生成ルールを決定する。生成ルールは、アカウント名を生成するための文字や単語の組み合わせ方法である。例えば、組み合わせる単語は、ユーザーの属性情報(プロフィール情報)に含まれる単語、投稿情報で使用頻度が高い単語、アカウント情報から推定される共起語(共起度の高い単語)等である。組み合わせ方法は、「-」や「_」を付ける等である。
例えば、ユーザーのプロフィール情報(趣味など)や投稿情報から共起語などを類推できる。予めプロフィール情報や投稿情報(特性情報)に共起語のラベルを付与して機械学習することで学習モデルを生成し、学習後の学習モデルに、プロフィール情報や投稿情報(特性情報)を入力することで、共起語を推定してもよい。同様に、予めプロフィール情報や投稿情報(特性情報)に「-」や「_」を付けたアカウント名のラベルを付与して機械学習することで学習モデルを生成し、学習後の学習モデルに、プロフィール情報や投稿情報(特性情報)を入力することで、「-」や「_」を付けることを推定してもよい。なお、学習モデルに限らず、予め特性情報に使用する文字や単語を関連付けておいてもよい。
次に、クエリ生成装置100は、決定した生成ルールにしたがってアカウント名を生成する(S304)。例えば、ユーザーの特性情報(アカウント情報)からアカウント名に「-」や「_」を付けることが推定された場合、アカウント名生成部150は、入力されたアカウント名に「-」や「_」を用いて、検索クエリのアカウント名を生成する。また、アカウント名生成部150は、ユーザーの属性情報、使用頻度が高い単語、共起語を組み合わせてアカウント名を生成する。例えば、趣味が野球で居住地が東京の場合に「ジャイアンツ(登録商標)」が共起語として推定され、入力されたアカウント名に「ジャイアンツ」を組み合わせて、検索クエリのアカウント名を生成する。
以上のように、本実施の形態では、プロフィール情報や投稿内容、投稿傾向などユーザーの特性を基に検索クエリのアカウント名を生成する。これにより、ユーザーの特性に応じてより適切なアカウント名を生成することができ、同一ユーザーのアカウントを効率よく検索することを可能とする。
なお、本開示は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、アカウント名に限らず、その他のアカウント情報を検索クエリとしてもよい。
上述の実施形態における各構成は、ハードウェア又はソフトウェア、もしくはその両方によって構成され、1つのハードウェア又はソフトウェアから構成してもよいし、複数のハードウェア又はソフトウェアから構成してもよい。各装置及び各機能(処理)を、図16に示すような、CPU(Central Processing Unit)等のプロセッサ11及び記憶装置であるメモリ12を有するコンピュータ10により実現してもよい。例えば、メモリ12に実施形態における方法(各装置における方法)を行うためのプログラムを格納し、各機能を、メモリ12に格納されたプログラムをプロセッサ11で実行することにより実現してもよい。
これらのプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
以上、実施の形態を参照して本開示を説明したが、本開示は上記実施の形態に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
入力されたアカウントのアカウント情報に基づいて、検索クエリのアカウント名を生成するクエリ生成手段と、
前記生成された検索クエリを用いて、ソーシャルメディア情報から該当するアカウント名のアカウント情報を検索するアカウント検索手段と、
を備える、システム。
(付記2)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記1に記載のシステム。
(付記3)
前記クエリ生成手段は、
前記入力されたアカウント情報に基づいて、前記検索クエリの候補となる複数のアカウント名の候補を生成するアカウント名候補生成手段と、
前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングする候補フィルタリング手段と、
を備える、付記1または2に記載のシステム。
(付記4)
前記アカウント名候補生成手段は、前記複数のアカウント名の候補を生成するとともに、前記複数のアカウント名の候補と前記入力されたアカウント情報のアカウント名との類似度を算出し、
前記候補フィルタリング手段は、前記ユーザーの特性に基づいてフィルタリングの閾値を決定する、
付記3に記載のシステム。
(付記5)
前記候補フィルタリング手段は、予め定められた前記ユーザーの特性と前記閾値との関連付けに基づいて、前記ユーザーの特性に応じた前記閾値を決定する、
付記4に記載のシステム。
(付記6)
前記候補フィルタリング手段は、予め前記ユーザーの特性と前記閾値との関連を学習した学習モデルに基づいて、前記ユーザーの特性に応じた前記閾値を決定する、
付記4に記載のシステム。
(付記7)
前記候補フィルタリング手段は、
前記入力されたアカウント情報に基づいて、前記ユーザーの特性を示す特性パラメータを取得する特性パラメータ取得手段と、
前記取得された特性パラメータに基づいて、前記複数のアカウント名の候補をフィルタリングするフィルタリング制御手段と、
を備える、付記3乃至6のいずれか一項に記載のシステム。
(付記8)
前記特性パラメータ取得手段は、前記特性パラメータとして、前記ユーザーの情報開示のレベルを示す情報リテラシー度を算出する、
付記7に記載のシステム。
(付記9)
前記情報リテラシー度は、プロフィール情報内の各項目の記入率、複数の投稿画像に含まれる前記ユーザーの画像の割合、位置情報を付与した投稿情報の件数、または、複数の投稿画像に複数回現れる人物の数に基づいている、
付記8に記載のシステム。
(付記10)
前記特性パラメータ取得手段は、前記特性パラメータとして、前記ユーザーの著名度を取得する、
付記7に記載のシステム。
(付記11)
前記著名度は、ソーシャルメディアにおける友人の数、フォロワーの数、または、投稿に対する他のアカウントの反応の数に基づいている、
付記10に記載のシステム。
(付記12)
前記特性パラメータ取得手段は、前記特性パラメータとして、前記ユーザーの名前の使用率を取得する、
付記7に記載のシステム。
(付記13)
前記名前の使用率は、ソーシャルメディアのアカウント情報に含まれる名前として使用される割合、インターネット上で公表されている名前として使用される割合、または、名前の統計情報から取得される割合に基づいている、
付記12に記載のシステム。
(付記14)
前記特性パラメータ取得手段は、前記特性パラメータとして、前記ユーザーの特性を複数の要素により示す特性ベクトルを抽出する、
付記7に記載のシステム。
(付記15)
前記特性ベクトルの複数の要素は、プロフィール情報の属性を示す情報、プロフィール情報内の各項目の記入率、複数の投稿画像に含まれる前記ユーザーの画像の割合、位置情報を付与した投稿情報の件数、または、複数の投稿画像に複数回現れる人物の数を含む、
付記14に記載のシステム。
(付記16)
前記フィルタリング制御手段は、前記抽出された特性ベクトルの複数の要素に基づいて、前記複数のアカウント名の候補をフィルタリングする、
付記14または15に記載のシステム。
(付記17)
前記クエリ生成手段は、
前記入力されたアカウント情報に基づいて、前記検索クエリとなる複数のアカウント名を生成するアカウント名生成手段と、
前記生成された複数のアカウント名に対し、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいて、前記検索の結果をアカウント照合するための優先度を設定する優先度設定手段と、
を備える、
付記1または2に記載のシステム。
(付記18)
前記クエリ生成手段は、
前記入力されたアカウント情報に基づいて、前記アカウントのユーザーの特性を抽出する特性抽出手段と、
前記入力されたアカウント情報と前記抽出されたユーザーの特性に基づいて、前記検索クエリのアカウント名を生成するアカウント名生成手段と、
を備える、付記1または2に記載のシステム。
(付記19)
前記アカウント名生成手段は、前記抽出されたユーザーの特性に基づいて前記アカウント名を生成するための生成ルールを決定し、前記決定した生成ルールに基づいて前記アカウント名を生成する、
付記18に記載のシステム。
(付記20)
前記生成ルールは、前記ユーザーの特性から推定される共起語を用いるルールを含む、
付記19に記載のシステム。
(付記21)
前記共起語は、予め前記ユーザーの特性と前記共起語との関連を学習した学習モデルに基づいて、前記ユーザーの特性に応じた前記共起語を推定する、
付記20に記載のシステム。
(付記22)
入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリの候補となる複数のアカウント名の候補を生成するアカウント名候補生成手段と、
前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングする候補フィルタリング手段と、
を備える、クエリ生成装置。
(付記23)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記22に記載のクエリ生成装置。
(付記24)
入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリとなる複数のアカウント名を生成するアカウント名生成手段と、
前記生成された複数のアカウント名に対し、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいて、前記検索の結果をアカウント照合するための優先度を設定する優先度設定手段と、
を備える、クエリ生成装置。
(付記25)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記24に記載のクエリ生成装置。
(付記26)
入力されたアカウントのアカウント情報に基づいて、前記アカウントのユーザーの特性を抽出する特性抽出手段と、
前記入力されたアカウント情報と前記抽出されたユーザーの特性に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリのアカウント名を生成するアカウント名生成手段と、
を備える、クエリ生成装置。
(付記27)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記26に記載のクエリ生成装置。
(付記28)
入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリの候補となる複数のアカウント名の候補を生成し、
前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングする、
クエリ生成方法。
(付記29)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記28に記載のクエリ生成方法。
(付記30)
入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリとなる複数のアカウント名を生成し、
前記生成された複数のアカウント名に対し、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいて、前記検索の結果をアカウント照合するための優先度を設定する、
クエリ生成方法。
(付記31)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記30に記載のクエリ生成方法。
(付記32)
入力されたアカウントのアカウント情報に基づいて、前記アカウントのユーザーの特性を抽出し、
前記入力されたアカウント情報と前記抽出されたユーザーの特性に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリのアカウント名を生成する、
クエリ生成方法。
(付記33)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記32に記載のクエリ生成方法。
(付記34)
入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリの候補となる複数のアカウント名の候補を生成し、
前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングする、
処理をコンピュータに実行させるためのプログラムが格納された非一時的なコンピュータ可読媒体。
(付記35)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記34に記載の非一時的なコンピュータ可読媒体。
(付記36)
入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリとなる複数のアカウント名を生成し、
前記生成された複数のアカウント名に対し、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいて、前記検索の結果をアカウント照合するための優先度を設定する、
処理をコンピュータに実行させるためのプログラムが格納された非一時的なコンピュータ可読媒体。
(付記37)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記36に記載の非一時的なコンピュータ可読媒体。
(付記38)
入力されたアカウントのアカウント情報に基づいて、前記アカウントのユーザーの特性を抽出し、
前記入力されたアカウント情報と前記抽出されたユーザーの特性に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリのアカウント名を生成する、
処理をコンピュータに実行させるためのプログラムが格納された非一時的なコンピュータ可読媒体。
(付記39)
前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
付記38に記載の非一時的なコンピュータ可読媒体。
1 アカウント照合システム
2 アカウント検索システム
10 コンピュータ
11 プロセッサ
12 メモリ
100 クエリ生成装置
101 取得部
102 生成部
110 アカウント名候補生成部
111 アカウント名生成部
112 類似度算出部
120 候補フィルタリング部
121 特性パラメータ取得部
122 検索クエリ制御部
123 情報リテラシー度算出部
124 著名度取得部
125 名前使用率取得部
126 特性ベクトル抽出部
130 優先度制御部
131 優先度決定部
140 特性抽出部
150 アカウント名生成部
200 アカウント収集装置
201 取得部
202 検索部
300 アカウント照合装置
301 算出部
302 判別部
400 ソーシャルメディアシステム

Claims (11)

  1. 入力されたアカウントのアカウント情報に基づいて、検索クエリのアカウント名を生成するクエリ生成手段と、
    前記生成された検索クエリを用いて、ソーシャルメディア情報から該当するアカウント名のアカウント情報を検索するアカウント検索手段と、
    を備え、
    前記クエリ生成手段は、
    前記入力されたアカウント情報に基づいて、前記検索クエリの候補となる複数のアカウント名の候補を生成するアカウント名候補生成手段と、
    前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングする候補フィルタリング手段と、
    を備え、
    前記候補フィルタリング手段は、
    前記入力されたアカウント情報に基づいて、前記ユーザーの特性を示す特性パラメータを取得する特性パラメータ取得手段と、
    前記取得された特性パラメータに基づいて、前記複数のアカウント名の候補をフィルタリングするフィルタリング制御手段と、
    を備え、
    前記特性パラメータ取得手段は、前記特性パラメータとして、前記ユーザーの情報開示のレベルを示す情報リテラシー度を算出する、
    システム。
  2. 前記アカウント情報は、アカウント名、プロフィール情報及び投稿情報を含む、
    請求項1に記載のシステム。
  3. 前記アカウント名候補生成手段は、前記複数のアカウント名の候補を生成するとともに、前記複数のアカウント名の候補と前記入力されたアカウント情報のアカウント名との類似度を算出し、
    前記候補フィルタリング手段は、前記ユーザーの特性に基づいてフィルタリングの閾値を決定し、
    前記候補フィルタリング手段は、予め定められた前記ユーザーの特性と前記閾値との関連付けに基づいて、前記ユーザーの特性に応じた前記閾値を決定する、
    請求項1または2に記載のシステム。
  4. 前記アカウント名候補生成手段は、前記複数のアカウント名の候補を生成するとともに、前記複数のアカウント名の候補と前記入力されたアカウント情報のアカウント名との類似度を算出し、
    前記候補フィルタリング手段は、前記ユーザーの特性に基づいてフィルタリングの閾値を決定し、
    前記候補フィルタリング手段は、予め前記ユーザーの特性と前記閾値との関連を学習した学習モデルに基づいて、前記ユーザーの特性に応じた前記閾値を決定する、
    請求項1または2に記載のシステム。
  5. 前記情報リテラシー度は、プロフィール情報内の各項目の記入率、複数の投稿画像に含まれる前記ユーザーの画像の割合、位置情報を付与した投稿情報の件数、または、複数の投稿画像に複数回現れる人物の数に基づいている、
    請求項1乃至4のいずれか一項に記載のシステム。
  6. 前記特性パラメータ取得手段は、前記特性パラメータとして、前記ユーザーの著名度を取得し、
    前記著名度は、ソーシャルメディアにおける友人の数、フォロワーの数、または、投稿に対する他のアカウントの反応の数に基づいている、
    請求項1乃至4のいずれか一項に記載のシステム。
  7. 前記特性パラメータ取得手段は、前記特性パラメータとして、前記ユーザーの名前の使用率を取得し、
    前記名前の使用率は、ソーシャルメディアのアカウント情報に含まれる名前として使用される割合、インターネット上で公表されている名前として使用される割合、または、名前の統計情報から取得される割合に基づいている、
    請求項1乃至4のいずれか一項に記載のシステム。
  8. 前記特性パラメータ取得手段は、前記特性パラメータとして、前記ユーザーの特性を複数の要素により示す特性ベクトルを抽出し、
    前記特性ベクトルの複数の要素は、プロフィール情報の属性を示す情報、プロフィール情報内の各項目の記入率、複数の投稿画像に含まれる前記ユーザーの画像の割合、位置情報を付与した投稿情報の件数、または、複数の投稿画像に複数回現れる人物の数を含む、
    請求項1乃至4のいずれか一項に記載のシステム。
  9. 入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリの候補となる複数のアカウント名の候補を生成するアカウント名候補生成手段と、
    前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングする候補フィルタリング手段と、
    を備え、
    前記候補フィルタリング手段は、
    前記入力されたアカウント情報に基づいて、前記ユーザーの特性を示す特性パラメータを取得する特性パラメータ取得手段と、
    前記取得された特性パラメータに基づいて、前記複数のアカウント名の候補をフィルタリングするフィルタリング制御手段と、
    を備え、
    前記特性パラメータ取得手段は、前記特性パラメータとして、前記ユーザーの情報開示のレベルを示す情報リテラシー度を算出する、
    クエリ生成装置。
  10. 入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリの候補となる複数のアカウント名の候補を生成することと
    前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングすることと
    を含み、
    前記フィルタリングすることは、
    前記入力されたアカウント情報に基づいて、前記ユーザーの特性を示す特性パラメータを取得することと、
    前記取得された特性パラメータに基づいて、前記複数のアカウント名の候補をフィルタリングすることと、
    を含み、
    前記特性パラメータを取得することは、前記特性パラメータとして、前記ユーザーの情報開示のレベルを示す情報リテラシー度を算出することを含む、
    クエリ生成方法。
  11. 入力されたアカウントのアカウント情報に基づいて、ソーシャルメディア情報から前記アカウント情報を検索するための検索クエリの候補となる複数のアカウント名の候補を生成することと
    前記生成された複数のアカウント名の候補を、前記入力されたアカウント情報から取得される前記アカウントのユーザーの特性に基づいてフィルタリングすることと
    を含み、
    前記フィルタリングすることは、
    前記入力されたアカウント情報に基づいて、前記ユーザーの特性を示す特性パラメータを取得することと、
    前記取得された特性パラメータに基づいて、前記複数のアカウント名の候補をフィルタリングすることと、
    を含み、
    前記特性パラメータを取得することは、前記特性パラメータとして、前記ユーザーの情報開示のレベルを示す情報リテラシー度を算出することを含む、
    処理をコンピュータに実行させるためのプログラム。
JP2022527449A 2020-05-29 2020-05-29 システム、クエリ生成装置、クエリ生成方法及びプログラム Active JP7476956B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/021363 WO2021240791A1 (ja) 2020-05-29 2020-05-29 システム、クエリ生成装置、クエリ生成方法及び非一時的なコンピュータ可読媒体

Publications (3)

Publication Number Publication Date
JPWO2021240791A1 JPWO2021240791A1 (ja) 2021-12-02
JPWO2021240791A5 JPWO2021240791A5 (ja) 2023-01-31
JP7476956B2 true JP7476956B2 (ja) 2024-05-01

Family

ID=78723222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022527449A Active JP7476956B2 (ja) 2020-05-29 2020-05-29 システム、クエリ生成装置、クエリ生成方法及びプログラム

Country Status (3)

Country Link
US (1) US20230222167A1 (ja)
JP (1) JP7476956B2 (ja)
WO (1) WO2021240791A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022037955A (ja) * 2020-08-26 2022-03-10 株式会社日立製作所 学習モデルを選択するシステム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150215304A1 (en) 2014-01-28 2015-07-30 Alibaba Group Holding Limited Client authentication using social relationship data
JP2019109742A (ja) 2017-12-19 2019-07-04 Bhi株式会社 アカウント名寄せシステム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150215304A1 (en) 2014-01-28 2015-07-30 Alibaba Group Holding Limited Client authentication using social relationship data
JP2019109742A (ja) 2017-12-19 2019-07-04 Bhi株式会社 アカウント名寄せシステム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
山下 晃弘 外,SNSプライバシー保護とリスク管理の検討 -ソーシャルモニタリングツールの開発に向けて-,情報処理学会 デジタルプラクティス [online] ,日本,情報処理学会,2016年04月15日,Vol. 6 No. 2,pp. 150-158

Also Published As

Publication number Publication date
JPWO2021240791A1 (ja) 2021-12-02
US20230222167A1 (en) 2023-07-13
WO2021240791A1 (ja) 2021-12-02

Similar Documents

Publication Publication Date Title
US11704899B2 (en) Resolving entities from multiple data sources for assistant systems
CN109271512B (zh) 舆情评论信息的情感分析方法、装置及存储介质
Balaanand et al. An enhanced graph-based semi-supervised learning algorithm to detect fake users on Twitter
Abbass et al. A framework to predict social crime through twitter tweets by using machine learning
US10169708B2 (en) Determining trustworthiness and compatibility of a person
Xue et al. Personality recognition on social media with label distribution learning
Hu et al. Social spammer detection with sentiment information
US10599774B1 (en) Evaluating content items based upon semantic similarity of text
CN104281622B (zh) 一种社交媒体中的信息推荐方法和装置
JP6759844B2 (ja) 画像を施設に対して関連付けるシステム、方法、プログラム及び装置
TWI465950B (zh) 發掘可疑帳號之分身群組的方法與系統
EP2753024A2 (en) System and method for continuously monitoring and searching social networking media
CN110990683B (zh) 一种基于地域与情感特征的微博谣言集成识别方法及装置
JP2011248831A (ja) 情報処理装置および方法、並びに、プログラム
CN112559747B (zh) 事件分类处理方法、装置、电子设备和存储介质
US11010687B2 (en) Detecting abusive language using character N-gram features
CN112115367A (zh) 基于融合关系网络的信息推荐方法、装置、设备和介质
KR102020551B1 (ko) 모바일 컨텍스트 정보 기반의 음식점 추천방법 및 그를 위한 장치
CN107809370B (zh) 用户推荐方法及装置
CN110472057B (zh) 话题标签的生成方法及装置
CN110457558A (zh) 网络水军的识别方法及装置、存储介质和处理器
JP7476956B2 (ja) システム、クエリ生成装置、クエリ生成方法及びプログラム
JP7092194B2 (ja) 情報処理装置、判定方法、及びプログラム
CN112182390B (zh) 一种函件推送方法、装置、计算机设备及存储介质
Al Marouf et al. Looking behind the mask: A framework for detecting character assassination via troll comments on social media using psycholinguistic tools

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221114

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240401

R150 Certificate of patent or registration of utility model

Ref document number: 7476956

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150