JPWO2019234827A1 - 情報処理装置、判定方法、及びプログラム - Google Patents
情報処理装置、判定方法、及びプログラム Download PDFInfo
- Publication number
- JPWO2019234827A1 JPWO2019234827A1 JP2020523886A JP2020523886A JPWO2019234827A1 JP WO2019234827 A1 JPWO2019234827 A1 JP WO2019234827A1 JP 2020523886 A JP2020523886 A JP 2020523886A JP 2020523886 A JP2020523886 A JP 2020523886A JP WO2019234827 A1 JPWO2019234827 A1 JP WO2019234827A1
- Authority
- JP
- Japan
- Prior art keywords
- information
- identification information
- account
- similarity
- position information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 197
- 238000000034 method Methods 0.000 title claims description 26
- 238000004364 calculation method Methods 0.000 claims abstract description 116
- 238000004891 communication Methods 0.000 claims abstract description 23
- 239000002245 particle Substances 0.000 claims description 151
- 238000011156 evaluation Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 12
- 230000014509 gene expression Effects 0.000 description 10
- 239000000284 extract Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 3
- 239000011362 coarse particle Substances 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 239000010419 fine particle Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 230000010006 flight Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2272—Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/222—Monitoring or handling of messages using geographical location information, e.g. messages transmitted or received in proximity of a certain spot or area
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
- H04L67/306—User profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/52—Network services specially adapted for the location of the user terminal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
- H04W4/21—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel for social networking applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本開示の実施形態の説明に先立って、実施の形態の概要について説明する。
まず、図1を用いて、本開示の実施の形態にかかる情報処理装置1の概要について説明する。図1は、本開示の実施の形態にかかる情報処理装置の概要を示す図である。
特定部5は、算出部4が算出した識別情報間の類似度に基づいて、複数の識別情報のうち同一利用者が有する識別情報を特定する。
(実施の形態1)
以下、図面を参照して、実施の形態の詳細を説明する。
<情報処理システムの構成例>
まず、図2を用いて、情報処理システム100の構成例を説明する。図2は、実施の形態1にかかる情報処理システムの構成例を示す図である。情報処理システム100は、SNSサーバ20と、ネットワーク30と、情報処理装置40とを備える。なお、図2において、情報処理システム100は、SNSサーバを1つ備える構成となっているが、複数のSNSサーバを備える構成であってもよい。
続いて、情報処理装置40の構成例について説明する。情報処理装置40は、アカウント情報取得部41、記憶部42、位置情報取得部43、位置情報処理部44、算出部45および特定部46を備える。アカウント情報取得部41、記憶部42、位置情報取得部43、位置情報処理部44、算出部45および特定部46のそれぞれは、アカウント情報取得手段、記憶手段、位置情報取得手段、位置情報処理手段、算出手段および特定手段として機能する。また、上記の様に、アカウントは、実施の形態の概要における利用者の識別情報に対応することから、アカウント情報取得部41は、識別情報取得手段とも言える。
「都道府県」単位の階層化位置情報には、位置情報処理部44が特定した、粒度レベルが「都道府県」単位の階層化位置情報が設定される。
「市区町村」単位の階層化位置情報には、位置情報処理部44が特定した、粒度レベルが「市区町村」単位の階層化位置情報が設定される。
(アカウント間の類似度)=α×(粒度レベル「国」の類似度)+β×(粒度レベル「都道府県」の類似度)+γ×(粒度レベル「市区町村」の類似度) …(1)
続いて、図6を用いて、情報処理装置40の動作例を説明する。図6は、実施の形態1にかかる情報処理装置の動作例を示すフローチャートである。
続いて、実施の形態2について説明する。実施の形態2は、実施の形態1の改良例である。実施の形態1では、各アカウントに関連する全ての関連アカウント情報を用いて、アカウント間の類似度を算出した。実施の形態2では、各アカウントに関連する全ての関連アカウント情報のうち、関連アカウント間の関係性の深さ(関連度)に基づいて選択された関連アカウントに対応付けられた関連アカウント情報を用いてアカウント間の類似度を算出する。
図7を用いて、実施の形態2にかかる情報処理装置50の構成例を説明する。図7は、実施の形態2にかかる情報処理装置の構成例を示す図である。実施の形態2にかかる情報処理装置50は、実施の形態1の構成に、関連アカウント情報選択部51が追加された構成である。なお、その他の構成は、実施の形態1と同様であるので適宜説明を割愛して、実施の形態1と異なる内容について説明する。
続いて、図9Aおよび図9Bを用いて、実施の形態2にかかる情報処理装置50の動作例について説明する。図9Aおよび図9Bは、実施の形態2にかかる情報処理装置の動作例を示すフローチャートである。図9Aおよび図9Bに示した処理内容のうち、図6と共通する処理内容については、同一の番号を付しており、適宜説明を割愛して説明する。図9Aおよび図9Bと図6とを比較すると、図6の処理内容に、ステップS11〜S13の処理内容が追加されている。
次に、アカウント情報取得部41は、各アカウントに対して、関連アカウント情報を取得する(ステップS2)。
続いて、実施の形態3について説明する。実施の形態3は、実施の形態1および2の改良例である。そのため、実施の形態3を、実施の形態1を用いて説明する。実施の形態3は、実施の形態1および2におけるアカウント間の類似度の算出方法が異なる。
図10を用いて、実施の形態3にかかる情報処理装置60の構成例について説明する。図10は、実施の形態3にかかる情報処理装置の構成例を示す図である。実施の形態3にかかる情報処理装置60は、実施の形態1の構成にかかる情報処理装置40の記憶部42および算出部45がそれぞれ記憶部61および算出部62に置き換わった構成である。その他の構成は、実施の形態1と同様であるので適宜説明を割愛して、実施の形態1と異なる内容について説明する。
(統合スコア)=α×(国の類似度)+β×(都道府県の類似度)+γ×(市区町村の類似度) …(3)
続いて、図12Aおよび図12Bを用いて、実施の形態3にかかる情報処理装置60の動作例を説明する。図12Aおよび図12Bは、実施の形態3にかかる情報処理装置の動作例を示すフローチャートである。図12Aおよび図12Bに示した処理内容のうち、図6と共通する処理内容については、同一の番号を付しており、適宜説明を割愛して説明する。図9Aおよび図9Bと図6とを比較すると、図6の処理内容に、ステップS21の処理内容が追加されており、ステップS5がステップS22に置き換わっている。
<1>実施の形態1において、算出部45は、アカウント間の粒度レベル毎の類似度を、粒度レベル毎の階層化位置情報に含まれるデータの和集合を用いて算出することで説明をした。しかし、これには限定されず、例えば、算出部45は、アカウント間の粒度レベル毎の類似度を、粒度レベル毎の階層化位置情報に含まれるデータの積集合を用いて算出してもよい。
p=N1/N*N2/N
ip(l1,l2)=log(1/p) ・・・(7)
アカウント情報取得部72は、例えば、キーボード、マウス等の入力手段として構成され、ユーザから入力された判定対象のアカウントおよび当該アカウントに関連する関連アカウント情報が入力されるように構成される。また、アカウント情報取得部72は、記憶部71に記憶された各アカウントに対して、関連アカウントを特定し、特定した関連アカウントに対応付けられた関連アカウント情報を取得する。そして、アカウント情報取得部72は、記憶部71に、各アカウント情報と関連アカウント情報とを対応付ける。
算出部75は、アカウント情報取得部72に入力されたアカウントと、記憶部71に記憶された全てのアカウントとの間の類似度を算出する。
(付記1)
コミュニケーションサービスにおいて利用者を識別する識別情報であって、判定対象の複数の識別情報の各々に関連する少なくとも1つの関連識別情報に対応付けられた位置情報を取得する位置情報取得手段と、
前記位置情報に基づいて、位置の粒度レベルに応じて階層化された位置情報を示す階層化位置情報を特定する位置情報処理手段と、
前記階層化位置情報を用いて、識別情報間の類似度を算出する算出手段と、
算出された前記類似度に基づいて、前記複数の識別情報のうち同一利用者が有する識別情報を特定する特定手段と、を備える情報処理装置。
(付記2)
前記算出手段は、前記粒度レベル毎の階層化位置情報を用いて、前記識別情報間における前記粒度レベル毎の類似度を算出し、算出された前記粒度レベル毎の類似度に前記粒度レベルに応じた重み係数を乗じた類似度の総和を、前記識別情報間の類似度として算出する、付記1に記載の情報処理装置。
(付記3)
前記算出手段は、各識別情報において、前記粒度レベル毎に、前記粒度レベルに対応付けられた階層化位置情報に含まれるデータ毎の数を計数すると共に、計数した前記データ毎の数を前記関連識別数により正規化した値を算出し、算出された前記正規化した値を用いて、前記識別情報間における前記粒度レベル毎の類似度を算出する、付記2に記載の情報処理装置。
(付記4)
前記算出手段は、前記識別情報間における前記粒度レベル毎の類似度の算出元である第1の識別情報および第2の識別情報に共通するデータの各々に対して、前記第1の識別情報における前記正規化した値と、前記第2の識別情報における前記正規化した値とを乗算して、前記データに対する評価値を算出し、前記第1の識別情報および前記第2の識別情報に共通する全てのデータに対する前記評価値の総和を、前記第1の識別情報と前記第2の識別情報との間における前記粒度レベル毎の類似度として算出する、付記3に記載の情報処理装置。
(付記5)
前記算出手段は、各識別情報において、前記粒度レベル毎に、前記粒度レベルに対応する階層化位置情報に含まれる各データペアに対して、データペア間の重要度を決定し、前記データペアの重要度を用いて、前記識別情報間における前記粒度レベル毎の類似度を算出する、付記2に記載の情報処理装置。
(付記6)
前記データペアの重要度は、前記データペアの重要度は、前記データペアに対応する2つの地名間の距離、前記データペアに対応する2つの地名の人口比率、前記データペアに対応する2つの地名間の移動容易性に関する指標値、及び前記データペアの総データペア数に対する割合の少なくとも1つに応じて決定される、付記5に記載の情報処理装置。
(付記7)
前記データペアの重要度は、前記距離、前記移動容易性に関する指標値及び前記人口比率の少なくとも1つと、前記データペアの出現回数と、に基づいて決定される、付記6に記載の情報処理装置。
(付記8)
前記算出手段は、前記識別情報間における前記粒度レベル毎の類似度の算出元である第1の識別情報および第2の識別情報に共通するデータペアの各々に対して、前記第1の識別情報における前記データペアの重要度と、前記第2の識別情報における前記データペアの重要度とを乗算して、前記データペアに対する評価値を算出し、前記第1の識別情報および前記第2の識別情報に共通する全てのデータペアに対する前記評価値の総和を、前記第1の識別情報と前記第2の識別情報との間における前記粒度レベル毎の類似度として算出する、付記5〜7のいずれか1項に記載の情報処理装置。
(付記9)
前記算出手段は、前記粒度レベルが高いほど大きな重み付けを行う、付記2〜8のいずれか1項に記載の情報処理装置。
(付記10)
関連識別情報間の関連度を決定すると共に、前記関連度に基づいて前記少なくとも1つの関連識別情報のうちのいずれかを選択する関連識別情報選択手段をさらに備え、
前記位置情報取得手段は、前記関連識別情報選択手段が選択した関連識別情報に対応付けられた位置情報を取得する、付記1〜9のいずれか1項に記載の情報処理装置。
(付記11)
前記関連識別情報選択手段は、前記少なくとも1つの関連識別情報のうちの第1の関連識別情報に関連する第2の関連識別情報を特定し、前記第2の関連識別情報が前記少なくとも1つの関連識別情報に含まれる場合、前記第1の関連識別情報と前記第2の関連識別情報との間の関連度が高いと決定し、前記少なくとも1つの関連識別情報のうち、前記関連度が高い関連識別情報を選択する、付記10に記載の情報処理装置。
(付記12)
前記特定手段は、算出された前記類似度が所定の閾値以上である場合、前記類似度の算出元の2つの識別情報を有する利用者が同一であると判定する、付記1〜11のいずれか1項に記載の情報処理装置。
(付記13)
前記複数の識別情報と、前記関連識別情報と、前記関連識別情報に対応付けられた情報とを取得する識別情報取得手段と、
前記複数の識別情報と、前記関連識別情報と、前記関連識別情報に対応付けられた情報と関連付けて記憶する記憶手段と、をさらに備え、
位置情報取得手段は、記憶された前記関連識別情報に対応付けられた情報から前記位置情報を取得する、付記1〜12のいずれか1項に記載の情報処理装置。
(付記14)
前記関連識別情報に対応付けられた情報は、プロフィール情報および投稿情報の少なくとも1つを含む、付記13に記載の情報処理装置。
(付記15)
前記識別情報は、アカウントおよび電話番号の少なくとも1つを含む、付記1〜14のいずれか1項に記載の情報処理装置。
(付記16)
コミュニケーションサービスにおいて利用者を識別する識別情報であって、判定対象の複数の識別情報の各々に関連する少なくとも1つの関連識別情報に対応付けられた位置情報を取得することと、
前記位置情報に基づいて、位置の粒度レベルに応じて階層化された位置情報を示す階層化位置情報を特定することと、
前記階層化位置情報を用いて、識別情報間の類似度を算出することと、
算出された前記類似度に基づいて、前記複数の識別情報のうち同一利用者が有する識別情報を特定することと、を含む判定方法。
(付記17)
コミュニケーションサービスにおいて利用者を識別する識別情報であって、判定対象の複数の識別情報の各々に関連する少なくとも1つの関連識別情報に対応付けられた位置情報を取得することと、
前記位置情報に基づいて、位置の粒度レベルに応じて階層化された位置情報を示す階層化位置情報を特定することと、
前記階層化位置情報を用いて、識別情報間の類似度を算出することと、
算出された前記類似度に基づいて、前記複数の識別情報のうち同一利用者が有する識別情報を特定することと、をコンピュータに実行させるプログラムが格納された非一時的なコンピュータ可読媒体。
(付記18)
コミュニケーションサービスを提供するサーバと、
前記サーバと通信を行う情報処理装置と、を含み、
前記情報処理装置は、
前記コミュニケーションサービスにおいて利用者を識別する識別情報であって、判定対象の複数の識別情報の各々に関連する少なくとも1つの関連識別情報に対応付けられた位置情報を取得する位置情報取得手段と、
前記位置情報に基づいて、位置の粒度レベルに応じて階層化された位置情報を示す階層化位置情報を特定する位置情報処理手段と、
前記階層化位置情報を用いて、識別情報間の類似度を算出する算出手段と、
算出された前記類似度に基づいて、前記複数の識別情報のうち同一利用者が有する識別情報を特定する特定手段と、を備える情報処理システム。
(付記19)
前記算出手段は、前記粒度レベル毎の階層化位置情報を用いて、前記識別情報間における前記粒度レベル毎の類似度を算出し、算出された前記粒度レベル毎の類似度に前記粒度レベルに応じた重み係数を乗じた類似度の合計値を、前記識別情報間の類似度として算出する、付記18に記載の情報処理システム。
2、43、73 位置情報取得部
3、44、74 位置情報処理部
4、45、62、75 算出部
5、46、76 特定部
20 SNSサーバ
30 ネットワーク
41、72 アカウント情報取得部
42、61、71 記憶部
51 関連アカウント情報選択部
100 情報処理システム
Claims (18)
- コミュニケーションサービスにおいて利用者を識別する識別情報であって、判定対象の複数の識別情報の各々に関連する少なくとも1つの関連識別情報に対応付けられた位置情報を取得する位置情報取得手段と、
前記位置情報に基づいて、位置の粒度レベルに応じて階層化された位置情報を示す階層化位置情報を特定する位置情報処理手段と、
前記階層化位置情報を用いて、識別情報間の類似度を算出する算出手段と、
算出された前記類似度に基づいて、前記複数の識別情報のうち同一利用者が有する識別情報を特定する特定手段と、を備える情報処理装置。 - 前記算出手段は、前記粒度レベル毎の階層化位置情報を用いて、前記識別情報間における前記粒度レベル毎の類似度を算出し、算出された前記粒度レベル毎の類似度に前記粒度レベルに応じた重み係数を乗じた類似度の総和を、前記識別情報間の類似度として算出する、請求項1に記載の情報処理装置。
- 前記算出手段は、各識別情報において、前記粒度レベル毎に、前記粒度レベルに対応付けられた階層化位置情報に含まれるデータ毎の数を計数すると共に、計数した前記データ毎の数を前記関連識別数により正規化した値を算出し、算出された前記正規化した値を用いて、前記識別情報間における前記粒度レベル毎の類似度を算出する、請求項2に記載の情報処理装置。
- 前記算出手段は、前記識別情報間における前記粒度レベル毎の類似度の算出元である第1の識別情報および第2の識別情報に共通するデータの各々に対して、前記第1の識別情報における前記正規化した値と、前記第2の識別情報における前記正規化した値とを乗算して、前記データに対する評価値を算出し、前記第1の識別情報および前記第2の識別情報に共通する全てのデータに対する前記評価値の総和を、前記第1の識別情報と前記第2の識別情報との間における前記粒度レベル毎の類似度として算出する、請求項3に記載の情報処理装置。
- 前記算出手段は、各識別情報において、前記粒度レベル毎に、前記粒度レベルに対応する階層化位置情報に含まれる各データペアに対して、データペア間の重要度を決定し、前記データペアの重要度を用いて、前記識別情報間における前記粒度レベル毎の類似度を算出する、請求項2に記載の情報処理装置。
- 前記データペアの重要度は、前記データペアに対応する2つの地名間の距離、前記データペアに対応する2つの地名の人口比率、前記データペアに対応する2つの地名間の移動容易性に関する指標値、及び前記データペアの総データペア数に対する割合の少なくとも1つに応じて決定される、請求項5に記載の情報処理装置。
- 前記データペアの重要度は、前記距離、前記移動容易性に関する指標値及び前記人口比率の少なくとも1つと、前記データペアの出現回数と、に基づいて決定される、請求項6に記載の情報処理装置。
- 前記算出手段は、前記識別情報間における前記粒度レベル毎の類似度の算出元である第1の識別情報および第2の識別情報に共通するデータペアの各々に対して、前記第1の識別情報における前記データペアの重要度と、前記第2の識別情報における前記データペアの重要度とを乗算して、前記データペアに対する評価値を算出し、前記第1の識別情報および前記第2の識別情報に共通する全てのデータペアに対する前記評価値の総和を、前記第1の識別情報と前記第2の識別情報との間における前記粒度レベル毎の類似度として算出する、請求項5〜7のいずれか1項に記載の情報処理装置。
- 前記算出手段は、前記粒度レベルが高いほど大きな重み付けを行う、請求項2〜8のいずれか1項に記載の情報処理装置。
- 関連識別情報間の関連度を決定すると共に、前記関連度に基づいて前記少なくとも1つの関連識別情報のうちのいずれかを選択する関連識別情報選択手段をさらに備え、
前記位置情報取得手段は、前記関連識別情報選択手段が選択した関連識別情報に対応付けられた位置情報を取得する、請求項1〜9のいずれか1項に記載の情報処理装置。 - 前記関連識別情報選択手段は、前記少なくとも1つの関連識別情報のうちの第1の関連識別情報に関連する第2の関連識別情報を特定し、前記第2の関連識別情報が前記少なくとも1つの関連識別情報に含まれる場合、前記第1の関連識別情報と前記第2の関連識別情報との間の関連度が高いと決定し、前記少なくとも1つの関連識別情報のうち、前記関連度が高い関連識別情報を選択する、請求項10に記載の情報処理装置。
- 前記特定手段は、算出された前記類似度が所定の閾値以上である場合、前記類似度の算出元の2つの識別情報を有する利用者が同一であると判定する、請求項1〜11のいずれか1項に記載の情報処理装置。
- 前記複数の識別情報と、前記関連識別情報と、前記関連識別情報に対応付けられた情報とを取得する識別情報取得手段と、
前記複数の識別情報と、前記関連識別情報と、前記関連識別情報に対応付けられた情報と関連付けて記憶する記憶手段と、をさらに備え、
位置情報取得手段は、記憶された前記関連識別情報に対応付けられた情報から前記位置情報を取得する、請求項1〜12のいずれか1項に記載の情報処理装置。 - 前記関連識別情報に対応付けられた情報は、プロフィール情報および投稿情報の少なくとも1つを含む、請求項13に記載の情報処理装置。
- 前記識別情報は、アカウントおよび電話番号の少なくとも1つを含む、請求項1〜14のいずれか1項に記載の情報処理装置。
- コミュニケーションサービスにおいて利用者を識別する識別情報であって、判定対象の複数の識別情報の各々に関連する少なくとも1つの関連識別情報に対応付けられた位置情報を取得することと、
前記位置情報に基づいて、位置の粒度レベルに応じて階層化された位置情報を示す階層化位置情報を特定することと、
前記階層化位置情報を用いて、識別情報間の類似度を算出することと、
算出された前記類似度に基づいて、前記複数の識別情報のうち同一利用者が有する識別情報を特定することと、を含む判定方法。 - コミュニケーションサービスにおいて利用者を識別する識別情報であって、判定対象の複数の識別情報の各々に関連する少なくとも1つの関連識別情報に対応付けられた位置情報を取得することと、
前記位置情報に基づいて、位置の粒度レベルに応じて階層化された位置情報を示す階層化位置情報を特定することと、
前記階層化位置情報を用いて、識別情報間の類似度を算出することと、
算出された前記類似度に基づいて、前記複数の識別情報のうち同一利用者が有する識別情報を特定することと、をコンピュータに実行させるプログラムが格納された非一時的なコンピュータ可読媒体。 - コミュニケーションサービスを提供するサーバと、
前記サーバと通信を行う情報処理装置と、を含み、
前記情報処理装置は、
前記コミュニケーションサービスにおいて利用者を識別する識別情報であって、判定対象の複数の識別情報の各々に関連する少なくとも1つの関連識別情報に対応付けられた位置情報を取得する位置情報取得手段と、
前記位置情報に基づいて、位置の粒度レベルに応じて階層化された位置情報を示す階層化位置情報を特定する位置情報処理手段と、
前記階層化位置情報を用いて、識別情報間の類似度を算出する算出手段と、
算出された前記類似度に基づいて、前記複数の識別情報のうち同一利用者が有する識別情報を特定する特定手段と、を備える情報処理システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/021567 WO2019234827A1 (ja) | 2018-06-05 | 2018-06-05 | 情報処理装置、判定方法、プログラムが格納された非一時的なコンピュータ可読媒体および情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019234827A1 true JPWO2019234827A1 (ja) | 2021-07-01 |
JP7092194B2 JP7092194B2 (ja) | 2022-06-28 |
Family
ID=68770869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020523886A Active JP7092194B2 (ja) | 2018-06-05 | 2018-06-05 | 情報処理装置、判定方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11561970B2 (ja) |
JP (1) | JP7092194B2 (ja) |
WO (1) | WO2019234827A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021255909A1 (ja) | 2020-06-18 | 2021-12-23 | 日本電気株式会社 | 投稿位置の日常・非日常性判定システム |
JP7110293B2 (ja) | 2020-09-28 | 2022-08-01 | 楽天グループ株式会社 | 情報処理装置、情報処理方法およびプログラム |
WO2022074807A1 (ja) * | 2020-10-09 | 2022-04-14 | 日本電気株式会社 | 支援装置、システム、支援方法及び非一時的なコンピュータ可読媒体 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012500427A (ja) * | 2008-08-13 | 2012-01-05 | アリババ グループ ホールディング リミテッド | 地理的特性の一致による地域的コンテンツの提供 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003107321A1 (en) * | 2002-06-12 | 2003-12-24 | Jena Jordahl | Data storage, retrieval, manipulation and display tools enabling multiple hierarchical points of view |
US7403942B1 (en) * | 2003-02-04 | 2008-07-22 | Seisint, Inc. | Method and system for processing data records |
US20080208735A1 (en) * | 2007-02-22 | 2008-08-28 | American Expresstravel Related Services Company, Inc., A New York Corporation | Method, System, and Computer Program Product for Managing Business Customer Contacts |
US20100111372A1 (en) * | 2008-11-03 | 2010-05-06 | Microsoft Corporation | Determining user similarities based on location histories |
US20100153292A1 (en) * | 2008-12-11 | 2010-06-17 | Microsoft Corporation | Making Friend and Location Recommendations Based on Location Similarities |
JP5881396B2 (ja) | 2011-12-09 | 2016-03-09 | ビッグローブ株式会社 | 識別情報管理支援システム、識別情報管理支援方法およびプログラム |
CN103793420B (zh) * | 2012-10-31 | 2017-04-12 | 国际商业机器公司 | 用于跨站点数据分析的方法和系统 |
CN104573057B (zh) * | 2015-01-22 | 2017-10-27 | 电子科技大学 | 一种用于跨ugc网站平台的帐户关联方法 |
CN106034149B (zh) * | 2015-03-13 | 2019-06-18 | 阿里巴巴集团控股有限公司 | 一种账户识别方法及装置 |
CN107766322A (zh) * | 2017-08-31 | 2018-03-06 | 平安科技(深圳)有限公司 | 同名实体识别方法、电子设备及计算机可读存储介质 |
US11556845B2 (en) * | 2019-08-29 | 2023-01-17 | International Business Machines Corporation | System for identifying duplicate parties using entity resolution |
-
2018
- 2018-06-05 US US16/972,031 patent/US11561970B2/en active Active
- 2018-06-05 WO PCT/JP2018/021567 patent/WO2019234827A1/ja active Application Filing
- 2018-06-05 JP JP2020523886A patent/JP7092194B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012500427A (ja) * | 2008-08-13 | 2012-01-05 | アリババ グループ ホールディング リミテッド | 地理的特性の一致による地域的コンテンツの提供 |
Non-Patent Citations (2)
Title |
---|
HAN, XIAOHUI, WANG, LIANHAI, XU, LIJUAN AND ZHANG, SHUIHUI: "Social Media Account Linkage Using User-generated Geo-location Data", IEEE INTERNATIONAL CONFERENCE ON INTELLIGENCE AND SECURITY INFORMATICS, JPN6021051849, September 2016 (2016-09-01), pages 157 - 162, XP033005773, ISSN: 0004673467, DOI: 10.1109/ISI.2016.7745460 * |
HAN, XIAOHUI, WANG, LIANHAI, XU, SHUJIANG, LIU, GUANGQI AND ZHAO, DAWEI: "Linking Social Network Accounts by Modeling User Spatiotemporal Habits", IEEE INTERNATIONAL CONFERENCE ON INTELLIGENCE AND SECURITY INFORMATICS, JPN6021051850, 2017, pages 19 - 24, XP033138386, ISSN: 0004673466, DOI: 10.1109/ISI.2017.8004868 * |
Also Published As
Publication number | Publication date |
---|---|
JP7092194B2 (ja) | 2022-06-28 |
US11561970B2 (en) | 2023-01-24 |
WO2019234827A1 (ja) | 2019-12-12 |
US20210240701A1 (en) | 2021-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
McKenzie et al. | Weighted multi-attribute matching of user-generated points of interest | |
Peled et al. | Entity matching in online social networks | |
CN107862022B (zh) | 文化资源推荐系统 | |
JP6098600B2 (ja) | 評価対象者の評価装置、評価方法及び評価システム | |
JP2016177764A (ja) | 施設推定方法、デバイス及びプログラム | |
CN112148843B (zh) | 文本处理方法、装置、终端设备和存储介质 | |
JP2021111367A (ja) | Api評価のための自動パラメータ値解決 | |
JP7092194B2 (ja) | 情報処理装置、判定方法、及びプログラム | |
JP6488753B2 (ja) | 情報処理方法 | |
Ju et al. | Relationship strength estimation based on Wechat Friends Circle | |
KR20120087214A (ko) | 소셜 네트워킹 서비스 사용자를 위한 친구 추천 방법, 이를 위한 기록 매체 및 이를 이용하는 소셜 네트워킹 서비스 및 서버 | |
CN106708871A (zh) | 一种社交业务特征用户的识别方法和装置 | |
CN109885797B (zh) | 一种基于多身份空间映射的关系网络构建方法 | |
JP5734118B2 (ja) | ソーシャルネットワークから小集団を抽出し、名前付け、並びに可視化する方法およびプログラム | |
CN112163098A (zh) | 一种知识图谱的创建方法、装置、存储介质和服务器 | |
Tournier et al. | Expanding the attack surface: Robust profiling attacks threaten the privacy of sparse behavioral data | |
Heravi et al. | Tweet location detection | |
CN109902129A (zh) | 基于大数据分析的保险代理人归类方法及相关设备 | |
KR102296420B1 (ko) | 개인정보보호 정책서 분석 기반 개인정보 수집/활용자의 신뢰도 평가 방법 및 장치 | |
CN111177526B (zh) | 网络意见领袖识别方法及装置 | |
He et al. | POI Alias Discovery in Delivery Addresses using User Locations | |
CN114357184A (zh) | 事项推荐方法及相关装置、电子设备和存储介质 | |
Zeng et al. | Model-Stacking-based network user portrait from multi-source campus data | |
CN111859146A (zh) | 信息挖掘方法、装置及电子设备 | |
US20150324813A1 (en) | System and method for determining by an external entity the human hierarchial structure of an rganization, using public social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220517 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220530 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7092194 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |