JP6574904B2 - ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法、サーバ、および記憶媒体 - Google Patents

ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法、サーバ、および記憶媒体 Download PDF

Info

Publication number
JP6574904B2
JP6574904B2 JP2018524809A JP2018524809A JP6574904B2 JP 6574904 B2 JP6574904 B2 JP 6574904B2 JP 2018524809 A JP2018524809 A JP 2018524809A JP 2018524809 A JP2018524809 A JP 2018524809A JP 6574904 B2 JP6574904 B2 JP 6574904B2
Authority
JP
Japan
Prior art keywords
social
information
group
target
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018524809A
Other languages
English (en)
Other versions
JP2019500685A (ja
Inventor
霖 李
霖 李
培▲シュアン▼ ▲陳▼
培▲シュアン▼ ▲陳▼
▲謙▼ ▲陳▼
▲謙▼ ▲陳▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2019500685A publication Critical patent/JP2019500685A/ja
Application granted granted Critical
Publication of JP6574904B2 publication Critical patent/JP6574904B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/06Selective distribution of broadcast services, e.g. multimedia broadcast multicast service [MBMS]; Services to user groups; One-way selective calling services
    • H04W4/08User group management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本開示は、情報技術の分野に関し、詳細には、ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法、サーバ、および記憶媒体に関する。
モバイルインターネットの普及に伴い、ソーシャルネットワークを利用することによって、日々のコミュニケーション、情報の同期、意見表現、および他の行動を実行することは、人々の間で非常に一般的になった。ソーシャルアクティビティのためにソーシャルネットワークに適用され得る一般的なソーシャルアプリケーションには、WeChat、QQ、Douban等がある。
ソーシャルプロセスにおいて、オピニオンリーダーなど、社会的影響力の強い人物がいる場合がしばしばある。オピニオンリーダーは、他のユーザに影響を与えるために、ソーシャルアカウントを使用することによって意見を表明したり、記事を共有したりする。特定の実装形態において、アカウントの影響力によって限られたリソースで最大のアクティビティ影響力を実現するために、大きな影響力を持つソーシャルアカウントをマイニングする必要が生じる場合がある。たとえば、広告が特定のグループの人々に提示される場合、特定のグループの人々をマイニングする精度はクリック率にとって非常に重要である。別の例として、銀行信用報告プロジェクトにおいて、グループの人々の属性は非常に重要な参照因子である。安全性保証の側面において、ソーシャルネットワークは悪意のあるユーザや法律違反者を迅速に特定する(locate)のを助けるために使用される。広告のための特定のグループの人々のマイニング、グループの人々の属性への参照、および悪意のあるユーザの特定は、すべてターゲットオブジェクトのソーシャルアカウントのマイニングに関連している。先行技術において、たとえば、Facebookによって提供される類似性ベースのマイニング、ソーシャルアカウントのネットワーク挙動によるマイニング、および社会組織部門に基づくマイニングなど、ターゲットオブジェクトのソーシャルアカウントをマイニングする複数の方法が提供される。しかしながら、実際の応用においては、この方法は精度が低くなるか、または計算の複雑さが大きくなる。
これを考慮して、本発明の実施形態は、上記の問題の少なくとも一部を解決するために、ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法、サーバ、および記憶媒体を提供する。
上記の目的を達成するために、本開示の技術的解決策は以下のように実施される。
一態様によれば、本発明の一実施形態は、ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法であって、
ターゲットオブジェクトの属性情報を使用することによって、ターゲットオブジェクトが存在するターゲットソーシャルグループを特定するステップと、
ターゲットソーシャルグループ内のソーシャルアカウントのあらかじめ設定された情報を解析し、ソーシャルアカウントに対応するユーザの第1の識別情報を取得するステップと、
第1の識別情報をターゲットオブジェクトの第2の識別情報とマッチングするステップと、
第2の識別情報にマッチングする第1の識別情報のソーシャルアカウントをターゲットオブジェクトのソーシャルアカウントとして決定するステップと
を含む方法を提供する。
別の態様によれば、本発明の一実施形態は、
ターゲットオブジェクトの属性情報を使用することによって、ターゲットオブジェクトが存在するターゲットソーシャルグループを特定するように構成された特定ユニット(locating unit)と、
ターゲットソーシャルグループ内のソーシャルアカウントのあらかじめ設定された情報を解析し、ソーシャルアカウントに対応するユーザの第1の識別情報を取得するように構成された解析ユニットと、
第1の識別情報をターゲットオブジェクトの第2の識別情報とマッチングするように構成されたマッチングユニットと、
第2の識別情報にマッチングする第1の識別情報のソーシャルアカウントをターゲットオブジェクトのソーシャルアカウントとして決定するように構成された決定ユニットと
を含むサーバを提供する。
本発明の実施形態はさらに、コンピュータ記憶媒体と、コンピュータ記憶媒体に記憶されたコンピュータ実行可能命令と、ターゲットオブジェクトのソーシャルアカウントをマイニングするための上記の方法を実行するために使用されるコンピュータ実行可能命令とを提供する。
本発明の実施形態において提供されるターゲットオブジェクトのソーシャルアカウントをマイニングするための方法、サーバ、および記憶媒体によれば、ユーザの識別情報がソーシャルアカウントのあらかじめ設定された情報から抽出され、次いで、ターゲットユーザのソーシャルアカウントを正確に特定するために、抽出された識別情報がユーザのオフライン識別情報とマッチングされる。オンライン識別情報とオフライン識別情報と間のマッチングにより、精度が向上され得る。また、たとえばソーシャルアカウントにおける多数の行動によってターゲットユーザのソーシャルアカウントを決定するための別の方法と比較して、識別情報を使用して直接的にマッチングする方法は、処理が必要な情報量が少なく、計算の複雑さが低く、計算が簡単であるというさらなる利点がある。
本発明の一実施形態による、ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法の概略フローチャートである。 本発明の一実施形態による、コミュニティネットワーク構築方法の概略フローチャートである。 本発明の一実施形態による、サーバの概略構造図である。 本発明の一実施形態による、別のサーバの概略構造図である。 本発明の一実施形態による、ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法の概略フローチャートである。 本発明の一実施形態による、候補のソーシャルグループの効果の概略図である。 本発明の一実施形態による、ターゲットソーシャルグループの効果の概略図である。 本発明の一実施形態による、ソーシャルアカウントのユーザ情報をマイニングする効果の第1の概略図である。 本発明の一実施形態による、ソーシャルアカウントのユーザ情報をマイニングする効果の第2の概略図である。 本発明の一実施形態による、ターゲットオブジェクトが参加する別のソーシャルグループの効果の概略図である。 本発明の一実施形態による、識別情報マイニング方法の概略フローチャートである。 本発明の一実施形態による、関係リンク拡張に基づいて、ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法の概略フローチャートである。
以下に、添付の図面および特定の実施形態を参照して、本開示の技術的解決策をさらに説明する。以下に記載される好ましい実施形態は、本開示の例示および説明のためのものにすぎず、本開示を限定するものではないことを理解されたい。
図1に示されるように、一実施形態は、以下を含むターゲットオブジェクトのソーシャルアカウントをマイニングするための方法を提供する。
ステップS110:ターゲットオブジェクトの属性情報を使用することによって、前記ターゲットオブジェクトが存在するターゲットソーシャルグループを特定する。
ステップS120:ターゲットソーシャルグループ内のソーシャルアカウントのあらかじめ設定された情報を解析し、ソーシャルアカウントに対応するユーザの第1の識別情報を取得する。
ステップS130:第1の識別情報をターゲットオブジェクトの第2の識別情報とマッチングする。
ステップS140:第2の識別情報にマッチングする第1の識別情報のソーシャルアカウントをターゲットオブジェクトのソーシャルアカウントとして決定する。
この実施形態において提供されるターゲットオブジェクトのソーシャルアカウントをマイニングするための方法は、情報処理機能を有する様々な電子デバイスに適用され得る。具体的には、分散コンピュータネットワークに適用される場合、本方法は複数のデバイスによって実行され得る。
この実施形態におけるターゲットオブジェクトは、ターゲットユーザであり得る。ソーシャルグループは、ソーシャル機能を有する様々な仮想組織であり得、通常は少なくとも2人のメンバーを含む。ソーシャルグループは、WeChatグループおよびQQグループなどの様々なグループを含み得る。
ターゲットオブジェクトの属性情報は、識別情報、職業情報、および年齢情報などの様々な特徴情報を含み得る。ステップS110において、ターゲットオブジェクトの相対的に一意的な属性情報、たとえば、ターゲットオブジェクトを他のユーザと一意に区別するために使用され得る属性情報が通常選択される。たとえば、ターゲットオブジェクトが、ある企業Yの創業者Bさんである場合、「企業Y」または「企業Yの上級管理職」などのキーワード、あるいは「Bさん」、または「企業Yの創業者」などの用語さえも、ターゲットソーシャルグループを決定するためにBさんの属性情報として使用され得る。たとえば、「企業Yの上級管理職」がターゲットオブジェクトの情報である場合、情報のマッチングにより、名前または名前リマーク(name remark)が「企業Yの上級管理職」であるソーシャルグループが見つけられ、ターゲットソーシャルグループとして使用され得る。この場合、通常、ターゲットオブジェクトのソーシャルアカウントがターゲットソーシャルグループ内にある確率は比較的高い。
ステップS120において、ターゲットソーシャルグループにおけるソーシャルアカウントのあらかじめ設定された情報が解析される。ここで、あらかじめ設定された情報は、グループニックネームおよびソーシャルアカウントなどの情報を含み得る。ソーシャルプロセスの間の認識を容易にするために、通常、ネットワーク名を使用することによってのみソーシャルアクティビティを実行する代わりに、日常生活で使用される名前などの識別情報を様々なリマーク情報に追加するユーザもいる。たとえば、Li Naはあるグループのニックネームフィールドに存在する。Li Naは、ユーザの日常生活に使用される名称であり、またはユーザのIDカードまたはパスポートに使用される名称でもあり得る。第1の識別情報は、ユーザのオフライン名称を含み得る。オフライン名称は、たとえば「Li Na」のように姓および名前を含んでもよく、「北京大学の学長」のような職名を含んでもよい。すべての情報は第1の識別情報であってもよく、ユーザのオフライン識別を示すことができる。第2の識別情報は、この実施形態における方法を別の電子デバイスから、またはヒューマンコンピュータインタラクションインターフェースから実行するために、電子デバイスによって受信される情報であり得る。たとえば、現在のターゲットオブジェクトが企業Yの上級管理職である場合、「企業Yの上級管理職」が検索項目として使用され、企業Yの上級管理職の名簿および対応する職種などの情報を見つけることが可能である。
ステップS130において、ソーシャルアカウントから抽出された第1の識別情報が、第2の識別情報とマッチングされる。マッチングが成功した場合、それは対応するアカウントがターゲットオブジェクトのソーシャルアカウントである可能性が高いことを示し、したがって、ターゲットオブジェクトのソーシャルアカウントが見つかったと考えられ得る。明らかに、ターゲットオブジェクトのソーシャルアカウントはマイニングされている。ユーザのソーシャルアカウントをユーザのオフライン識別情報と組み合わせて特定するための方法は、複雑性が低く、精度が高い。
この実施形態では、ターゲットオブジェクトのソーシャルアカウントをより適切にマイニングするために、ターゲットソーシャルグループがまず正確に特定される必要がある。以下は、ターゲットソーシャルグループを便利に、迅速に、また正確に特定するための任意の方法を提供する。
具体的には、ステップS110は、
候補のソーシャルグループのグループ属性を属性情報とマッチングするステップと、
属性情報とマッチングするグループ属性を有するソーシャルグループをターゲットソーシャルグループとして選択するステップと、
を含み得る。
一般に、ソーシャルグループには、グループ名、グループラベルなどが設定される。グループ名またはグループラベルは、グループ属性である。グループ名などのグループ属性は、ソーシャルグループ内のソーシャルアカウントに対応するユーザの識別情報をある程度反映することができる。この実施形態では、グループ名に基づくマッチングによって直接的に、いくつかのターゲットソーシャルグループを簡便かつ迅速に見つけることができる。しかしながら、時には、ソーシャルグループのグループ名は、ソーシャルグループ内のメンバーの識別情報を望ましく反映することができない。この実施形態では、グループ名がグループ内のメンバーの識別情報を正確に反映できない場合、ターゲットオブジェクトのソーシャルアカウントをマイニングするために、以下の方法が使用される。本方法は、
グループコミュニティを確立するステップであって、グループコミュニティが、あらかじめ設定された関連度を満たす少なくとも2つのソーシャルグループを含む、ステップと、
ソーシャルグループの属性情報の情報クラスタリングを実行し、クラスタリング対象を決定し、属性情報とマッチングするターゲットクラスタリング対象を決定するステップであって、それらの間のマッチング度が、あらかじめ設定されたマッチング度を満たす、ステップと、
ターゲットクラスタリング対象とは無関係のグループコミュニティを除去し、ターゲットクラスタリング対象に関連するターゲットグループコミュニティを取得するステップであって、ターゲットグループコミュニティ内のソーシャルグループが候補のソーシャルグループである、ステップと
をさらに含む。
ターゲットオブジェクトが複数のソーシャルグループ内にある場合、ソーシャルグループ内に同じソーシャルアカウントが存在する。この場合、ソーシャルグループは、あらかじめ設定された関連度を満たすと考えられ得る。
この実施形態では、グループコミュニティが確立され、グループコミュニティは少なくとも2つのソーシャルグループを含む。ソーシャルグループ内のグループメンバーは、ソーシャルアカウントのユーザに対応する。
情報クラスタリングは、グループコミュニティ内のソーシャルグループに対して実行される。情報クラスタリングは、グループ名を文書として使用して各ソーシャルグループのグループ名を抽出するステップと、クラスタリング結果を得るために潜在的ディリクレ配分法(LDA)を使用することによって対象クラスタリングを実行するステップとを含み得る。LDAは、3層構造を含む3層ベイジアン確率モデルとも呼ばれる。3つの層は、それぞれフレーズ、対象、および文書に対応する。LDAによれば、文書中の各フレーズは、「ある確率で対象が選択され、ある確率で対象からフレーズが選択される」というプロセスによって取得される。文書と対象との間の関係は多項分布に従い、対象とフレーズとの間の関係は多項分布に従う。さらに、LDAは監督されていない機械学習技術であり、大規模な文書セットまたはコーパスに隠されている対象情報を認識するために使用され得る。
もちろん、グループコミュニティの属性情報はグループ名に限定されず、グループ内のチャット履歴、ソーシャルグループのグループ空間に記憶されたグループ文書、またはソーシャルグループ内のグループ空間に記憶されたグループ画像から抽出された情報をさらに含み得る。
結論として、対象クラスタリングによって、複数のグループコミュニティ間の関連度が決定され得る。次に、グループコミュニティを除去するために、ターゲットオブジェクトの属性情報に従うターゲットクラスタリング対象が選択される。たとえば、複数のグループコミュニティがある。情報クラスタリングによって、あるグループコミュニティは大学Aに関連し、他のグループコミュニティは大学Bに関連していることが分かる。ターゲットオブジェクトは、大学Aの教授である。次に、ターゲットクラスタリング対象として大学Aが選択され、ターゲットグループコミュニティを取得するために大学Aとは無関係のグループコミュニティが除去される。この実施形態では、ターゲットクラスタリング対象に応じてグループコミュニティに対して除去が実行される場合、対象グループを特定するために、ターゲットクラスタリング対象とグループコミュニティのコミュニティ属性との間でファジーマッチングが実行され得る。ファジーマッチングは、ターゲットクラスタリング対象を完全には含まず、可能な限り、ターゲットオブジェクトが存在するターゲットグループコミュニティが選択されないようにするために、ターゲットクラスタリング対象の同義語などを含み得る。ターゲットグループコミュニティ内のソーシャルグループは、候補のソーシャルグループである。
候補のソーシャルグループが選択された後、正確なマッチングによって、候補のソーシャルグループからターゲットオブジェクトの属性情報とマッチングするターゲットソーシャルグループが選択される。正確なマッチングは、通常マッチングした2つの項目間の完全マッチングを必要とし、処理の複雑さおよび計算量を低減するために、ターゲットソーシャルグループを正確に特定し、ターゲットオブジェクトが含まれていないソーシャルグループの数を減らし、後で処理する必要があるデータの量を減らすために、2つの同義語項目間のマッチングは正確なマッチングではない。ターゲットソーシャルグループを決定するステップは、ターゲットグループコミュニティとしてあらかじめ設定された回数以上正確なマッチングが成功したグループコミュニティを選択するために、ターゲットオブジェクトの属性情報と候補のグループコミュニティ内のソーシャルグループのグループ属性とを使用することによって正確なマッチングをまず実行するステップと、次いで、ターゲットグループコミュニティ内のソーシャルグループをターゲットソーシャルグループとして使用するステップとを含み得る。確かに、マッチングは、ターゲットユーザのグループ属性とターゲットグループコミュニティ内のソーシャルグループを使用することによって再度実行され得る。マッチングは、上記のファジーマッチングと組み合わせられ得る。ファジーマッチングが成功した場合、ファジーマッチングが成功したソーシャルグループがターゲットソーシャルグループである。
確かに、上記の方法以外に、候補のソーシャルグループを決定するための方法は、ソーシャルツール内のすべてのソーシャルグループを候補のソーシャルグループとして直接考慮するステップなどを含み得る。
ターゲットグループコミュニティが選択される前に、各独立したグループがグループコミュニティに分類される必要がある。分類は、グループ名または他のグループ情報クラスタリングによって実行され得る。以下は、高いクラスタリング精度を有する別の任意の方法を提供する。
グループコミュニティを確立するステップは、
最初に、少なくとも2つのソーシャルグループを含むコミュニティネットワークを確立するステップであって、ソーシャルグループは、コミュニティネットワークにおけるノードであり、第1のノードと第2のノードが同じソーシャルアカウントを含む場合、有向エッジが第1のノードと第2のノードとの間に配置され、有向エッジのエッジ重みは、第1の値と第2の値との比に等しく、第1の値は、第1のノードと第2のノードの両方に含まれる同じソーシャルアカウントの数であり、第2の値は、第2のノードに含まれるソーシャルアカウントのデータである、ステップを含む。この実施形態では、有向エッジは、ある方向を有するエッジである。有向エッジは、ある方向を有するエッジである。この実施形態では、有向エッジは、あるノードから別のノードへ向かう方向のエッジである。
図2は3つのソーシャルグループを示し、それぞれG1、G2、およびG3である。G1には5人のメンバーが含まれ、各メンバーはソーシャルアカウントに対応する。G2には4人のメンバーが含まれる。G3には6人のメンバー含まれる。図2において、同じパターンで満たされた小さい円は、同じソーシャルアカウントを表す。したがって、図2から分かるように、G1とG2は3つの同じソーシャルアカウントを有し、G2とG3は2つの同じソーシャルアカウントを有し、G1とG3は3つの同じソーシャルアカウントを有する。2つのソーシャルグループに含まれるソーシャルアカウントは、共有ソーシャルアカウントと呼ばれ得る。
コミュニティは、図2のG1、G2、およびG3を使用することによって確立される。コミュニティネットワークは、図2の右側に示されている。コミュニティネットワークの確立のために、具体的には、たとえば、コミュニティ図を確立することによって、コミュニティネットワークが確立され得る。
コミュニティ図には次の特徴がある。
図のタイプ:有向図、
図のノード:ソーシャルグループが図のノードに対応する、
図のエッジ:同じグループメンバーを有する2つのノード間の接続線。
コミュニティネットワークが確立された後、エッジ重みが計算される必要がある。
エッジ重みの計算中に、エッジ重みを取得するために、共有ソーシャルアカウントの第1の値がノードに含まれるソーシャルアカウントの第2の値と比較される。たとえば、G1からG2への有向エッジのエッジ重みは、以下の式を使用することによって計算され得る。
WGy→Gx=Countcom(Gy,Gx)/Count(Gx)
WGy→Gxは、ソーシャルグループGyからソーシャルグループGxへのエッジ重みを表す。Countcom(Gy,Gx)は、ソーシャルグループGyとソーシャルグループGxの共有ソーシャルアカウントを表す。Count(Gx)はソーシャルグループのソーシャルアカウントである。
したがって、図2に示されるコミュニティ図に示されるように、G1からG2へのエッジ重みは3/4=0.75であり、G1からG3へのエッジ重みは3/6=0.5であり、G2からG1へのエッジ重みは3/5=0.6であり、G2からG3へのエッジ重みは2/6=0.33であり、G3からG1へのエッジ重みは3/5=0.6であり、G3からG2へのエッジ重みは2/4=0.5である。
次いで、コミュニティネットワークがトラバースされ、各ノードがターゲットノードとして使用され、ターゲットノードの隣接ノードのノードラベルと、対応する入次数エッジ(indegree edge)の入次数エッジ重みが収集され、入次数エッジ重みは隣接ノードからターゲットノードへ向かう方向の有向エッジのエッジ重みであり、ターゲットノードはコミュニティネットワーク内のノードである。この実施形態では、コミュニティネットワークをトラバースすることは、毎回各ノードをターゲットノードとして使用することである。各ノードはノードラベルに対応し、ノードラベルの初期値はノードに対応するノード識別子であり得る。たとえば、G1がターゲットノードである場合、G1の入次数エッジは、それぞれがG2からG1への有向エッジおよびG3からG1への有向エッジである2つの有向エッジを含み、対応する入次数エッジ重みはそれぞれ0.5および0.6である。明らかに、G3からG1への有向エッジは、より大きなエッジ重みを有する。G1がトラバースされる第1のターゲットノードである場合、G1のノードラベルはG3のノードラベルに置き換えられる。G3のノード識別子の初期値はG3自体のノード識別子であるため、更新後はG1のノードラベルはG3のノード識別子である。
次いで、同じノードラベルに対応する入次数エッジ重みが追加される。トラバースする前は、各ノードのノードラベルはノード自体である。いくつかのノードがトラバースされた後、ノードのノードラベルは、他のノードのノード識別子に置き換えられる。この時、ターゲットノードの有向エッジの一部は、同じノード識別子に対応し得る。したがって、同じノードラベルに対応する入次数エッジの重みが追加される必要がある。
次に、ターゲットノードのノードラベルが、最大入次数エッジ重みに対応するノードラベルに置き換えられる。追加後、ターゲットノードのすべての有向エッジのエッジ重みと、有向エッジに対応するノードラベルが取得され、ターゲットノードのノードラベルを置き換えるために最大エッジ重みに対応するノードラベルが選択される。
最後に、コミュニティネットワークがトラバースされた後、同じノードラベルを有するソーシャルグループがグループコミュニティに分類される。コミュニティネットワーク内のすべてのノードがトラバースされた後、ノードラベルのうちの一部または全部が更新される。この実施形態では、同じノードラベルを有するソーシャルグループは、同じグループコミュニティに分類される。明らかに、このようにして取得されたグループコミュニティ内の任意の2つのソーシャルグループは、同じソーシャルアカウントを有する。したがって、あらかじめ設定された関連度を満たすソーシャルグループは、グループコミュニティ内のソーシャルグループのうちの任意の2つが少なくとも1つの同じソーシャルアカウントを含むことを満たすことができる。
ステップS120は、
ターゲットソーシャルグループ内の各ソーシャルアカウントのリマーク情報を抽出するステップであって、リマーク情報が、ユーザの識別をマーク付けするために使用される情報である、ステップと、
リマーク情報から第1の識別情報を抽出するステップと
を含み得る。
図6は、WeChatソーシャルアカウントインターフェースを示す。明らかに、ソーシャルアカウントのリマーク情報内に、ソーシャルアカウントのいくつかユーザ情報がある。ユーザ情報には、ユーザの名前などの情報が含まれる。したがって、リマーク情報から第1の識別情報が抽出され得る。第1の識別情報は、ユーザの名前、ニックネームなどを含み得る。リマーク情報は、ソーシャルアカウント内のユーザの識別を示すことができる複数のフィールド内の情報に対応し得る。
具体的には、たとえば、リマーク情報は、友人リマーク情報、グループリマーク情報、およびアカウントリマーク情報のうちの少なくとも1つを含み、友人リマーク情報は、第1のソーシャルアカウント上で第1のソーシャルアカウントの友人アカウントによって作成されたリマーク情報であり、グループリマーク情報は、ソーシャルグループ内の第1のソーシャルアカウントのリマーク情報であり、アカウントリマーク情報は、ユーザの識別に関する第1のソーシャルアカウントによって作成されたリマーク情報である。
ソーシャルアカウントを使用する場合、ユーザはソーシャルアカウントのアカウント名を自分自身の名前またはニックネームに直接変更し得る。ソーシャルグループに参加した後、ユーザはソーシャルグループ内のグループニックネームまたはグループ名称などのリマーク情報またはラベル情報を設定し得る。ソーシャルアカウントが別のソーシャルアカウントの友人として追加された後、ソーシャルアカウントのリマーク情報は、ユーザの友人によってソーシャルアカウントのユーザのユーザ名などに直接設定され得る。したがって、この実施形態では、ステップS130においてマッチングを実行するために、情報から第1の識別情報が抽出され得る。第1の識別情報が第2の識別情報とマッチングされる場合、マッチングは直接実行され得る。この実施形態では、たとえば、名前が第1の識別情報に誤って書き込まれるのを避けるために、名前は同音異義語に書き込まれる。この実施形態では、ステップS130は第1の識別情報のアーティキュレーション情報を抽出するステップを含み得、ステップS140は第1の識別情報のアーティキュレーション情報を第2の識別情報のアーティキュレーション情報とマッチングするステップを含み得る。
アーティキュレーション情報は、中国語のピンイン(pinyin)であり得る。この実施形態では、中国語のピンインに基づくマッチングにより、第1の識別情報と第2の識別情報とが同一の人物を表している場合でも、一部の中国語文字の誤記によりマッチングが失敗するという問題を避けることができ、マッチング成功率が向上する。
複数のターゲットオブジェクトが存在し、ターゲットオブジェクトが相互に関連付けられている場合、本方法は、
ソーシャルアカウントが決定されたターゲットオブジェクトの友人アカウントを抽出するステップと、
友人アカウントのあらかじめ設定された情報を解析し、第1の識別情報とマッチングされる第2の識別情報を取得するステップと
をさらに含む。
ターゲットオブジェクトは、複数のターゲットユーザに対応し得る。たとえば、ターゲットオブジェクトは企業Yの上級管理職であり、明らかに、複数のターゲットオブジェクトが存在し得る。また、複数のターゲットオブジェクトは、企業Yの上級管理職に関連付けられている。関連付け関係に基づいて、ターゲットオブジェクトは相互に友人であり得る。友人関係は、ソーシャルアカウントの友人アカウントに反映され得る。したがって、この実施形態では、ソーシャルアカウントが決定されたターゲットオブジェクトがシードされたユーザとして使用される。シードされたユーザのソーシャルアカウントの友人アカウントが抽出され、友人アカウントのあらかじめ設定された情報が再び解析される。このようにして、ターゲットオブジェクトのソーシャルアカウントの位置が拡張される。たとえば、ターゲットオブジェクトAはターゲットオブジェクトBという友人を有し、ターゲットオブジェクトBはターゲットソーシャルグループに存在しない場合がある。友人間の関係リンクを解析することにより、ターゲットオブジェクトAがシードされたユーザとして使用され、ターゲットオブジェクトBのソーシャルアカウントが特定され得、それによってターゲットオブジェクトのソーシャルアカウントを決定する成功率を高めることができる。
図3に示されるように、一実施形態は、特定ユニット110と、解析ユニット120と、マッチングユニット130と、決定ユニット140とを含むサーバをさらに提供する。特定ユニット110は、ターゲットオブジェクトの属性情報を使用することによって、ターゲットオブジェクトが存在するターゲットソーシャルグループを特定するように構成される。解析ユニット120は、ターゲットソーシャルグループ内のソーシャルアカウントのあらかじめ設定された情報を解析し、ソーシャルアカウントに対応するユーザの第1の識別情報を取得するように構成される。マッチングユニット130は、第1の識別情報をターゲットオブジェクトの第2の識別情報とマッチングするように構成される。決定ユニット140は、第2の識別情報にマッチングする第1の識別情報のソーシャルアカウントをターゲットオブジェクトのソーシャルアカウントとして決定するように構成される。
この実施形態では、特定ユニット110と、解析ユニット120と、マッチングユニット130と、決定ユニット140は、いずれもサーバ内の情報処理構造に対応し得る。情報処理構造は、中央処理装置(CPU)、マイクロプロセッサ(MCU)、デジタル信号プロセッサ(DSP)、プログラマブルアレイロジック(PLC)、またはアプリケーションプロセッサ(AP)などのプロセッサを含み得る。情報処理構造は、さらに、特定用途向け集積回路(ASIC)を含み得る。情報処理構造は、情報処理を行うことができる電子構造であり得る。
この実施形態では、情報処理構造は、あらかじめ設定されたコードを実行することによって、上記のユニットの機能を実装し得る。ターゲットオブジェクトのソーシャルアカウントは、ターゲットオブジェクトのソーシャルアカウントを使用することによって情報プロモーションおよび情報マイニングなどの後続の動作を実行するために、第1の識別情報をオフラインの第2の識別情報とマッチングすることによって正確に決定される。たとえば、識別特性のために、ターゲットユーザはいくつかの情報に関心を持つかもしれない。したがって、広告リリースなどの有向情報プロモーションは、ソーシャルアカウントをマイニングすることによって実施され得る。ターゲットオブジェクトがオピニオンリーダーである場合、オピニオンリーダーによってリリース、編集、または注目された情報は、そのターゲットオブジェクトをオピニオンリーダーと見なしている別のユーザによって注目される可能性が十分にある。したがって、ソーシャルアカウントによってリリースされた情報は、正確な情報伝達を実現するためにマイニングされ、次いで、別のプラットフォームでリリースされるか、別のソーシャルアカウントにプロモーションされる。
いくつかの実施形態では、特定ユニット110は、候補のソーシャルグループのグループ属性を属性情報とマッチングすることと、その属性情報とマッチングするグループ属性を有するソーシャルグループをターゲットソーシャルグループとして選択することとを行うように構成される。たとえば、特定ユニット110は、ターゲットユーザの属性情報を候補のソーシャルグループのグループ属性とマッチングすることによって、ターゲットソーシャルグループを選択し得る。グループ属性は、ソーシャルグループ内のグループメンバーの識別特性を反映することができるグループ名、グループリマーク、またはグループラベルなどの情報を含み得る。
いくつかの実施形態では、サーバは、確立ユニット、クラスタリングユニット、およびフィルタリングユニットをさらに含む。確立ユニットは、グループコミュニティを確立するように構成され、グループコミュニティは、あらかじめ設定された関連度を満たす少なくとも2つのソーシャルグループを含み、クラスタリングユニットは、ソーシャルグループの属性情報の情報クラスタリングを実行することと、クラスタリング対象を決定することと、属性情報とマッチングするターゲットクラスタリング対象を決定することとを行うように構成され、それらの間のマッチング度が、あらかじめ設定されたマッチング度を満たし、フィルタリングユニットは、ターゲットクラスタリング対象とは無関係のグループコミュニティを除去することと、ターゲットクラスタリング対象に関連するターゲットグループコミュニティを取得することとを行うように構成される。ターゲットグループコミュニティ内のソーシャルグループは、候補のソーシャルグループである。この実施形態では、確立ユニット、クラスタリングユニット、およびフィルタリングユニットは、いずれも上記の情報処理構造に対応し得る。ターゲットグループコミュニティは、情報処理構造の情報処理によって特定され、ターゲットグループコミュニティ内のソーシャルグループは候補のソーシャルグループとして決定される。このようにして、明らかに、候補のソーシャルグループを選択するための範囲が大幅に減少し、それによって、後続のターゲットソーシャルグループの特定が単純化され、ターゲットオブジェクトのソーシャルアカウントを決定する効率が向上する。
たとえば、確立ユニットは、少なくとも2つのソーシャルグループを含むコミュニティネットワークを確立することであって、ソーシャルグループは、コミュニティネットワークにおけるノードであり、第1のノードと第2のノードが同じソーシャルアカウントを含む場合、有向エッジが第1のノードと第2のノードとの間に配置され、有向エッジのエッジ重みは、第1の値と第2の値との比に等しく、第1の値は、第1のノードと第2のノードの両方に含まれる同じソーシャルアカウントの数であり、第2の値は、第2のノードに含まれるソーシャルアカウントのデータである、確立することと、コミュニティネットワークをトラバースし、各ノードをターゲットノードとして使用し、ターゲットノードの隣接ノードのノードラベルと、対応する入次数エッジの入次数エッジ重みを収集することであって、入次数エッジ重みは隣接ノードからターゲットノードへ向かう方向の有向エッジのエッジ重みであり、ターゲットノードはコミュニティネットワーク内のノードであり、ノードラベルの初期値は対応するノードのノード識別子である、収集することと、同じノードラベルに対応する入次数エッジ重みを追加することと、ターゲットノードのノードラベルを、最大入次数エッジ重みに対応するノードラベルに置き換えることと、コミュニティネットワークをトラバースした後、同じノードラベルを有するソーシャルグループをグループコミュニティに分類することとを行うように構成される。
グループコミュニティ分類により、情報処理量を削減し、処理効率を向上させるために、ターゲットユーザの属性情報に従って、ターゲットユーザが初めて参加し得るソーシャルグループを続いて選択すると便利である。
いくつかの実施形態では、解析ユニット120は、ターゲットソーシャルグループ内の各ソーシャルアカウントのリマーク情報を抽出することであって、リマーク情報が、ユーザの識別をマーク付けするために使用される情報である、抽出することと、リマーク情報から第1の識別情報を抽出することとを行うように構成される。この実施形態では、解析ユニット120は、識別情報を取得するために、ソーシャルアカウント内の各ソーシャルグループのリマーク情報を抽出し得る。ここで、リマーク情報は、指定されたフィールド内の情報であってもよく、指定されたタイプの情報であってもよい。指定されたフィールド内の情報内、または指定されたタイプの情報内に、ユーザによってマーク付けされたユーザ識別情報が存在し得る。したがって、第1の識別情報を取得するために情報が解析され得る。
リマーク情報のソースによれば、リマーク情報は、友人リマーク情報、グループリマーク情報、およびアカウントリマーク情報を含み得る。したがって、リマーク情報は、友人リマーク情報、グループリマーク情報、およびアカウントリマーク情報のうちの少なくとも1つを含み、友人リマーク情報は、第1のソーシャルアカウント上で第1のソーシャルアカウントの友人アカウントによって作成されたリマーク情報であり、グループリマーク情報は、ソーシャルグループ内の第1のソーシャルアカウントのリマーク情報であり、アカウントリマーク情報は、ユーザの識別に関する第1のソーシャルアカウントによって作成されたリマーク情報である。
ネットワーク情報は比較的非公式であり得、ユーザの名前はしばしば同音異義語に書き込まれる。この現象によって引き起こされるマッチングの失敗を回避するために、この実施形態では、解析ユニット120は、第1の識別情報のアーティキュレーション情報を抽出するように特に構成され、マッチングユニット130は、第1の識別情報の前記アーティキュレーション情報を前記第2の識別情報のアーティキュレーション情報とマッチングするように構成される。アーティキュレーション情報に基づくマッチングによって、マッチング成功率が高くなり得、それによってターゲットオブジェクトのソーシャルアカウントを決定する成功率をさらに高めることができる。
さらに、決定ユニット140は、複数のターゲットオブジェクトが存在し、ターゲットオブジェクトが相互に関連付けられている場合、ソーシャルアカウントが決定されたターゲットオブジェクトの友人アカウントを抽出することと、友人アカウントのあらかじめ設定された情報を解析することと、第1の識別情報とマッチングされる第2の識別情報を取得することとを行うように構成される。この実施形態では、ターゲットユーザのソーシャルアカウントを特定する成功率をさらに高めるために、特定の方法は、ターゲットソーシャルグループ内のソーシャルアカウントに基づくマッチングに限定されない。その代わりに、ターゲットオブジェクトのソーシャルアカウントを決定する成功率を高めるために、決定されたソーシャルアカウントの友人関係リンクも特定のために使用される。
図4に示されるように、本発明の実施形態は別のサーバをさらに提供する。サーバは、プロセッサ402と、記憶媒体404と、少なくとも1つの外部通信インターフェース401とを含む。プロセッサ402と、記憶媒体404と、外部通信インターフェース401とは、バス403を使用することによって接続されている。プロセッサ402は、たとえば、マイクロプロセッサ、中央処理装置、デジタル信号プロセッサ、またはプログラマブル論理アレイなどの処理機能を有する電子部品であり得る。
記憶媒体404はコンピュータ実行可能命令を記憶する。プロセッサ402は、上記の技術的解決策のいずれかにおいて提供されるターゲットオブジェクトのソーシャルアカウントのための方法を実施するために、記憶媒体404に記憶されたコンピュータ実行可能命令を実行する。具体的には、図1に示される方法が実行され得る。
本発明の実施形態はさらに、コンピュータ記憶媒体を提供し、コンピュータ記憶媒体内にコンピュータ実行可能命令が記憶されており、コンピュータ実行可能命令が、ターゲットオブジェクトのソーシャルアカウントをマイニングするための上記の方法のうちの少なくとも1つを実行する、たとえば、図1、図2、図5、図11、および図12に示される方法のうちの少なくとも1つを実行するために使用される。コンピュータ記憶媒体は、ランダム記憶媒体(RAM)、読出し専用記憶媒体(ROM)、フラッシュメモリ、または磁気テープであってもよく、任意で非一時的記憶媒体であってもよい。
以下は、上記の実施形態のいずれかを参照していくつかの例を提供する。
例1:
図5に示されるように、この例において、WeChatはソーシャルツールとして使用され、ターゲットオブジェクトのWeChatアカウントをマイニングするための方法が提供される。本方法は、それぞれ以下のような5つのステップを含み得る。
ステップS1:WeChatグループコミュニティを検索し、
ステップS2:WeChatグループコミュニティにおいてLDAサブジェクトクラスタリングを実行し、
ステップS3:WeChatグループテキストをマイニングし、
ステップS4:ユーザの実名のテキストをマイニングし、実名はユーザのオフラインの社会生活に使用されている名前を含み得、
ステップS5:ターゲットオブジェクトのソーシャルアカウントを取得するために、関係リンク分散を実行する。
ステップS1は以下を含み得る:
ステップS11:WeChatグループコミュニティを確立し、
ステップS12:グループコミュニティを取得するために、グループコミュニティを完全に検索する。ここで、グループコミュニティを完全に検索することは、すべてのソーシャルグループに基づいてコミュニティネットワークを形成することと、あらかじめ設定された相関度を満たす複数のソーシャルグループを含むグループコミュニティを形成するためにコミュニティネットワークを分類することとを含む。
ステップS2は以下を含み得る:
ステップS21:各グループコミュニティ内のすべてのグループ名を収集し、
ステップS22:グループコミュニティを記事として使用し、収集したグループ名を記事のコンテンツとして使用することによって、LDAサブジェクトクラスタリングを実行する。
ステップS3は以下を含み得る:
ステップS31:対象モデルによって、対象とは無関係のグループコミュニティを除去し、
ステップS32:マイニングする必要がある上級管理職に対応する会社名を取得し、
ステップS33:グループコミュニティごとに、会社名をグループ名とマッチングし、
ステップS34:グループコミュニティの場合、マッチングが4回以上成功した場合、グループコミュニティは残り、上級管理職対象を含むグループコミュニティとして使用され、
ステップS35:グループメンバーとグループメンバーの実名を取得し、マイニングされる必要のある上級管理職と実名をマッチングし、グループメンバーをシードされた人物として使用する。
ステップS4は以下を含み得る:
ステップS41:ユーザの古いリマーク情報を収集し、
ステップS42:ユーザ自身のグループリマーク情報を収集し、
ステップS43:ユーザの実名をマイニングし、ユーザの実名は上記の第1の識別情報に対応し、ユーザのオフラインの名前、名称、タイトルなどを含み得、
ステップS44:実名とWeChatアカウントに従ってデータをマイニングする。
ステップS5は以下を含み得る:
ステップS51:シードされた人物の友人とそれに対応する実名をプル(pull)し、シードされた人物は、上記の実施形態においてソーシャルアカウントがすでに決定されたターゲットオブジェクトと等しい。
ステップS52:マイニングされた上級管理職とWeChatアカウントとの間のマッチングが完了したかどうかを決定し、マッチングが完了していない場合はステップS55を実行し、マッチングが完了した場合はステップS53を実行する。
ステップS53:上級管理職のWeChatアカウント情報をプルする。確かに、特定の実装プロセスにおいて、ソーシャルアカウントは、QQアカウント、Facebookアカウント、またはTwitterアカウントなどのソーシャルアカウントであり得る。上級管理職のプルされたWeChatアカウント情報はWeChatアカウントを含み得、上級管理職のWeChatの友人などの他の情報をさらに含み得る。
ステップS54:オンラインデータに基づいて、マッチングしたWeChatアカウントが正しいかどうかを決定する。
例2:
以下では、例としてM社の最高経営責任者(CEO)の検索を使用することによって説明する。M社のCEOによって使用されるWeChatアカウントが特定されている。M社のCEOの属性情報を分析することにより、M社のCEOはターゲットユーザの役職識別情報であり、M社はインターネット企業であることが分かる。まず、インターネットの属性に基づいて、インターネットに関連付けられるWeChatグループが選択され得る。Letvを属性情報として使用することによって、Letvに関連するWeChatグループが選択される。次いで、Letv CEOのWeChatアカウントを決定するために、Letv CEOのオフライン識別情報がWeChatから抽出された識別情報とマッチングされる。たとえば、オフライン識別情報は、Letv CEOの名前Aを含み得る。この例における方法の具体的な手順は以下の通りであり得る。
まず、M社のWeChatグループコミュニティが検索される。
1)インターネット関連企業がWeChatグループコミュニティ対象によってフィルタリングされた後、キーワード「Letv」を含むグループ名が名前の文字によってマッチングされ、マッチングが成功した少なくとも3つのグループ名を含むグループコミュニティが選択される。ここでは、グループコミュニティのマッチングはファジーマッチングであり、マッチングの効果が図6に示される。
2)上級管理職対象を満たすグループコミュニティがフィルタリングされる。フィルタリングの後、残りのソーシャルグループが図7に示されている。図7は、図6に示される候補のソーシャルグループに対してフィルタリングが実行された後のターゲットソーシャルグループを示す。
次いで、リマーク情報を解析することによって、各WeChatアカウントに対応するユーザの第1の識別情報が取得される。たとえば、ユーザの基本情報が検索され、見つかった情報が確認される。図8および図9は、WeChatアカウントが決定された後、WeChatアカウントに従って決定された第1の識別情報を示す。
次いで、マッチングによって会社MのCEOによって使用されるWeChatアカウントを決定するために、第1の識別情報が別の方法で取得された第2の識別情報とマッチングされる。
図10に示されるように、Aが参加するソーシャルグループが、Aに対応するソーシャルアカウントによって決定される。
WeChatグループコミュニティネットワークの構造:
図のタイプ:有向図、
図のノード:WeChatグループは、図のノードに対応する、
図のエッジ:同じグループメンバーを有する2つのグループノード、そして、
図の有向エッジ重み:
EdgeWeightGroupY-GroupX=CommonUserCount(GroupY,GroupX)/UserCount(GroupX)
CommonUserCount(GroupY,GroupX)は、ソーシャルグループGroupYとソーシャルグループGroupXの共有ソーシャルアカウントの数を表す。
UserCount(GroupX)は、ソーシャルグループGroupYのソーシャルアカウントの数を表する。
EdgeWeightGroupY-GroupXは、ソーシャルグループGroupYおよびソーシャルグループGroupXからの、図の有向エッジ重みである。
上記のコミュニティネットワークの確立により、少数のメンバーを有する小さいソーシャルグループと多数のメンバーを有する大きいソーシャルグループとの間の関係が確立され得る。たとえば、100人のメンバーの部門グループと10人のメンバーのチームグループとの間に関係が確立されている場合、その10人のメンバーは100人のメンバーの部門グループにも属する。明らかに、上記のコミュニティネットワークの確立中に、10人のメンバーのチームグループのノードラベルは、100人のメンバーの部門グループの対応するノードラベルに置き換えられる。
コミュニティ検索に関連する多くのアルゴリズムがある。簡単な計算を用いるラベル伝搬アルゴリズム(LPA)が使用され、確立は収集適用分散(GAS:gather apply scatter)法を使用することによって実行される。たとえば、コミュニティネットワークは、分散並列コンピューティングを使用することによって分類される。
改良された分散有向図LPAコミュニティ検索アルゴリズムは、以下を含む。
第1に、初期化動作が実行される:各ノードのノードラベルをノード自体のノード識別子に設定する。
第2に、ノードラベルが更新され、ノードラベルの更新は以下を含む。
収集動作:ターゲットノードごとに、入次数隣接ノードのノード識別子と対応する入次数エッジ重みを収集する。
適用動作:収集された隣接ノードと入次数エッジ重みを、同じノードラベルに対応する入次数エッジ重みに別々に追加し、最後に最大和に対応するノードラベルをノードのノードラベルとして選択する。同じ入次数エッジ重みが複数同時に存在する場合、ランダムに選択された入次数重みに対応するノードラベルが置き換えられる。
分散動作:新たに計算されたノードラベルが、前回の計算によって取得されたノードラベルと異なるかどうかを決定する。変更があった場合、隣接するすべてのノードに、このノードのノードラベルが更新されたことを通知し、次回のための更新と計算を実行する。
この例では、収集動作と分散動作が非同期的に実行され得る。収集動作中に新しい情報が受信されるたびに、適用動作および分散動作が実行され、ノードラベルの更新が再び実行される。
識別情報のマイニング:
第1に、ユーザのリマーク情報がピンインに変換され、次いで、確率の高い姓と名とを別々にカウントすることによってユーザの名前が最終的に決定される。ここで、ピンインは、上記のアーティキュレーション情報のうちの1つである。
たとえば、図11に示されるように、本方法は以下を含む。
ステップS61:友人によって作成されたユーザのリマーク情報を収集し、
ステップS62:ユーザのグループリマーク情報を収集し、
ステップS63:ピンイン処理:同じピンインを有する名前を最も頻繁に使用される名前に置き換え、
ステップS64:ピンインを抽出し、
ステップS65:姓リストを取得し、
ステップS66:最も可能性が高い姓にマッチングし、
ステップS67:実名およびWeChatアカウントに従ってデータをマイニングする。この例では、ピンイン抽出と姓のマッチングによって、書込みミスが修正され得る。最後に、マッチング成功率を高めるために、マッチングを通じて取得された姓を使用することによって、第1の識別情報と第2の識別情報とがマッチングされる。
反復分散:
取得されたシードされたユーザのために、シードされたユーザのソーシャルアカウントの関係リンクがプルされ、次いで、同時に友人としてN人のシードされたユーザを追加できる候補のユーザが選択され、上記ステップにおいて取得されたマイニングされた実名情報がプルされ、次いで上級管理職の名前のマッチングが実行される。マッチングが成功した場合、対応する上級管理職は、次回の反復のためにシードされたユーザとして使用される。
たとえば、図12に示されるように、本方法は以下を含む。
ステップS71:正しい上級管理職とマッチングし、次の友人分散のためにシードされた人物として正しい上級管理職を使用する。
ステップS72:シードされた人物の友人と、対応する友人の実名をプルし、
ステップS73:マイニングされた上級管理職のマッチングが完了したかどうかを決定し、マッチングが完了していない場合、ステップS71に戻り、マッチングが完了した場合は終了する。
本出願において提供されるいくつかの実施形態において、開示されたデバイスおよび方法は、他の方法で実施され得ることを理解されたい。記載されたデバイスの実施形態は単なる例示である。たとえば、ユニット分割は単に論理的な機能分割であり、実際の実装時には他の分割であってもよい。たとえば、複数のユニットまたは構成要素が組み合わせられてもよく、別のシステムに統合されてもよく、一部の機能が無視されてもよく、実行されなくてもよい。さらに、表示または議論された相互結合、あるいは構成要素間の直接結合または通信接続は、いくつかのインターフェース、デバイスまたはユニット間の間接的な結合または通信接続、あるいは電気的接続、機械的接続、または他の形態の接続によって実装され得る。
分離部分として記載されたユニットは物理的に分離されていてもよく、分離されていなくてもよい。ディスプレイユニットとして使用される部分は、物理的ユニットであってもよく、物理的ユニットでなくてもよい。すなわち、ユニットは同じ場所に配置されてもよく、多くのネットワークユニットに分散されてもよい。本実施形態の解決策の目的を実現するために、ユニットのうちの一部またはすべてが実際の要件に従って選択される必要がある。
さらに、本発明の実施形態における機能ユニットは、すべて処理モジュールに統合されてもよく、各ユニットが別々にユニットとして使用されてもよく、または2つ以上のユニットが1つのユニットに統合されてもよい。統合されたユニットは、ハードウェアの形態で実装されてもよく、ハードウェアとソフトウェア機能ユニットの形態で実装されてもよい。
当業者であれば、本方法の実施形態を実施するための一部またはすべてのステップが、プログラム命令に関連するハードウェアを使用することによって実施され得ることを理解することができるだろう。プログラムは、コンピュータ可読記憶媒体に記憶され得る。プログラムが実行されると、本方法の実施形態を含むステップが実行される。しかしながら、記憶媒体は、プログラムコードを記憶し得る様々なタイプの媒体、たとえば、モバイル記憶デバイス、読出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク、または光ディスクを含む。
上記は、本開示の特定の実装形態にすぎず、本開示の保護範囲は、これに限定されない。本開示の原理に従ってなされる変更は、本開示の保護範囲内に収まるものとする。
110 特定ユニット
120 解析ユニット
130 マッチングユニット
140 決定ユニット
401 外部通信インターフェース
402 プロセッサ
403 バス
404 記憶媒体

Claims (17)

  1. ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法であって、電子デバイスが、
    前記ターゲットオブジェクトの属性情報を使用することによって、前記ターゲットオブジェクトが存在するターゲットソーシャルグループを特定するステップと、
    前記ターゲットソーシャルグループ内のソーシャルアカウントのあらかじめ設定された情報を解析し、前記ソーシャルアカウントに対応するユーザの第1の識別情報を取得するステップと、
    前記第1の識別情報を前記ターゲットオブジェクトの第2の識別情報とマッチングするステップと、
    前記第2の識別情報にマッチングする前記第1の識別情報のソーシャルアカウントを前記ターゲットオブジェクトのソーシャルアカウントとして決定するステップと
    実行する、方法。
  2. 前記ターゲットオブジェクトの属性情報を使用することによって、前記ターゲットオブジェクトが存在するターゲットソーシャルグループを特定する前記ステップ前記電子デバイスが、
    候補のソーシャルグループのグループ属性を前記属性情報とマッチングするステップと、
    前記属性情報とマッチングするグループ属性を有するソーシャルグループを前記ターゲットソーシャルグループとして選択するステップと、
    実行する、請求項1に記載の方法。
  3. 前記電子デバイスが、
    グループコミュニティを確立するステップであって、前記グループコミュニティが、あらかじめ設定された関連度を満たす少なくとも2つのソーシャルグループを備える、ステップと、
    前記ソーシャルグループの前記属性情報の情報クラスタリングを実行し、クラスタリング対象を決定し、前記属性情報とマッチングするターゲットクラスタリング対象を決定するステップであって、それらの間のマッチング度が、あらかじめ設定されたマッチング度を満たす、ステップと、
    前記ターゲットクラスタリング対象とは無関係の前記グループコミュニティを除去し、前記ターゲットクラスタリング対象に関連するターゲットグループコミュニティを取得するステップであって、前記ターゲットグループコミュニティ内の前記ソーシャルグループが前記候補のソーシャルグループである、ステップと
    をさらに実行する、請求項2に記載の方法。
  4. グループコミュニティを確立する前記ステップ前記電子デバイスが、
    少なくとも前記2つのソーシャルグループを備えるコミュニティネットワークを確立するステップであって、前記ソーシャルグループが、前記コミュニティネットワークにおけるノードであり、第1のノードと第2のノードが同じソーシャルアカウントを含む場合、有向エッジが前記第1のノードと前記第2のノードとの間に配置され、前記有向エッジのエッジ重みが、第1の値と第2の値との比に等しく、前記第1の値が、前記第1のノードと前記第2のノードの両方に含まれる同じソーシャルアカウントの数であり、前記第2の値が、前記第2のノードに含まれるソーシャルアカウントのデータである、ステップと、
    前記コミュニティネットワークをトラバースし、各ノードをターゲットノードとして使用し、前記ターゲットノードの隣接ノードのノードラベルと、対応する入次数エッジの入次数エッジ重みを収集するステップであって、前記入次数エッジ重みが前記隣接ノードから前記ターゲットノードへ向かう方向の有向エッジのエッジ重みであり、前記ターゲットノードが前記コミュニティネットワーク内のノードであり、前記ノードラベルの初期値が前記対応するノードのノード識別子である、ステップと、
    同じノードラベルに対応する前記入次数エッジ重みを追加するステップと、
    前記ターゲットノードのノードラベルを、最大入次数エッジ重みに対応するノードラベルに置き換えるステップと、
    前記コミュニティネットワークをトラバースした後、同じノードラベルを有するソーシャルグループをグループコミュニティに分類するステップと
    実行する、請求項3に記載の方法。
  5. 前記ターゲットソーシャルグループ内のソーシャルアカウントのあらかじめ設定された情報を解析し、前記ソーシャルアカウントに対応するユーザの第1の識別情報を取得する前記ステップ前記電子デバイスが、
    前記ターゲットソーシャルグループ内の各ソーシャルアカウントのリマーク情報を抽出するステップであって、前記リマーク情報が、前記ユーザの識別をマーク付けするために使用される情報である、ステップと、
    前記リマーク情報から前記第1の識別情報を抽出するステップと
    実行する、請求項1に記載の方法。
  6. 前記リマーク情報が、友人リマーク情報、グループリマーク情報、およびアカウントリマーク情報のうちの少なくとも1つを備え、
    前記友人リマーク情報が、第1のソーシャルアカウント上で前記第1のソーシャルアカウントの友人アカウントによって作成されたリマーク情報であり、
    前記グループリマーク情報が、前記ソーシャルグループ内の前記第1のソーシャルアカウントのリマーク情報であり、
    前記アカウントリマーク情報が、前記ユーザの前記識別に関する前記第1のソーシャルアカウントによって作成されたリマーク情報である、請求項5に記載の方法。
  7. 前記リマーク情報から前記第1の識別情報を抽出する前記ステップ前記電子デバイスが、
    前記第1の識別情報のアーティキュレーション情報を抽出するステップを実行し
    前記第1の識別情報を前記ターゲットオブジェクトの第2の識別情報とマッチングする前記ステップ前記電子デバイスが、
    前記第1の識別情報の前記アーティキュレーション情報を前記第2の識別情報のアーティキュレーション情報とマッチングするステップを実行する、請求項5に記載の方法。
  8. 複数の前記ターゲットオブジェクトが存在し、前記ターゲットオブジェクトが相互に関連付けられている場合、前記電子デバイスが、
    ソーシャルアカウントが決定された前記ターゲットオブジェクトの友人アカウントを抽出するステップと、
    前記友人アカウントの前記あらかじめ設定された情報を解析し、前記第1の識別情報とマッチングされる前記第2の識別情報を取得するステップと
    をさらに実行する、請求項1に記載の方法。
  9. ターゲットオブジェクトの属性情報を使用することによって、前記ターゲットオブジェクトが存在するターゲットソーシャルグループを特定するように構成された特定ユニットと、
    前記ターゲットソーシャルグループ内のソーシャルアカウントのあらかじめ設定された情報を解析し、前記ソーシャルアカウントに対応するユーザの第1の識別情報を取得するように構成された解析ユニットと、
    前記第1の識別情報を前記ターゲットオブジェクトの第2の識別情報とマッチングするように構成されたマッチングユニットと、
    前記第2の識別情報にマッチングする前記第1の識別情報のソーシャルアカウントを前記ターゲットオブジェクトのソーシャルアカウントとして決定するように構成された決定ユニットと
    を備える、サーバ。
  10. 前記特定ユニットが、候補のソーシャルグループのグループ属性を前記属性情報とマッチングすることと、前記属性情報とマッチングするグループ属性を有するソーシャルグループを前記ターゲットソーシャルグループとして選択することとを行うように構成される、請求項9に記載のサーバ。
  11. 前記サーバが、
    グループコミュニティを確立するように構成された確立ユニットであって、前記グループコミュニティが、あらかじめ設定された関連度を満たす少なくとも2つのソーシャルグループを備える、確立ユニットと、
    前記ソーシャルグループの前記属性情報の情報クラスタリングを実行することと、クラスタリング対象を決定することと、前記属性情報とマッチングするターゲットクラスタリング対象を決定することと行うように構成されたクラスタリングユニットであって、それらの間のマッチング度が、あらかじめ設定されたマッチング度を満たす、クラスタリングユニットと、
    前記ターゲットクラスタリング対象とは無関係の前記グループコミュニティを除去することと、前記ターゲットクラスタリング対象に関連するターゲットグループコミュニティを取得することとを行うように構成されたフィルタリングユニットであって、前記ターゲットグループコミュニティ内の前記ソーシャルグループが前記候補のソーシャルグループである、フィルタリングユニットと、
    をさらに備える、請求項10に記載のサーバ。
  12. 前記確立ユニットが、少なくとも前記2つのソーシャルグループを備えるコミュニティネットワークを確立することであって、前記ソーシャルグループが、前記コミュニティネットワークにおけるノードであり、第1のノードと第2のノードが同じソーシャルアカウントを含む場合、有向エッジが前記第1のノードと前記第2のノードとの間に配置され、前記有向エッジのエッジ重みが、第1の値と第2の値との比に等しく、前記第1の値が、前記第1のノードと前記第2のノードの両方に含まれる同じソーシャルアカウントの数であり、前記第2の値が、前記第2のノードに含まれるソーシャルアカウントのデータである、確立することと、前記コミュニティネットワークをトラバースし、各ノードをターゲットノードとして使用し、前記ターゲットノードの隣接ノードのノードラベルと、対応する入次数エッジの入次数エッジ重みを収集することであって、前記入次数エッジ重みが前記隣接ノードから前記ターゲットノードへ向かう方向の有向エッジのエッジ重みであり、前記ターゲットノードが前記コミュニティネットワーク内のノードであり、前記ノードラベルの初期値が前記対応するノードのノード識別子である、収集することと、同じノードラベルに対応する前記入次数エッジ重みを追加することと、前記ターゲットノードのノードラベルを、最大入次数エッジ重みに対応するノードラベルに置き換えることと、前記コミュニティネットワークをトラバースした後、同じノードラベルを有するソーシャルグループをグループコミュニティに分類することとを行うように構成される、請求項11に記載のサーバ。
  13. 前記解析ユニットが、前記ターゲットソーシャルグループ内の各ソーシャルアカウントのリマーク情報を抽出することであって、前記リマーク情報が、前記ユーザの識別をマーク付けするために使用される情報である、抽出することと、前記リマーク情報から前記第1の識別情報を抽出することとを行うように構成される、請求項9に記載のサーバ。
  14. 前記リマーク情報が、友人リマーク情報、グループリマーク情報、およびアカウントリマーク情報のうちの少なくとも1つを備え、
    前記友人リマーク情報が、第1のソーシャルアカウント上で前記第1のソーシャルアカウントの友人アカウントによって作成されたリマーク情報であり、
    前記グループリマーク情報が、前記ソーシャルグループ内の前記第1のソーシャルアカウントのリマーク情報であり、
    前記アカウントリマーク情報が、前記ユーザの前記識別に関する前記第1のソーシャルアカウントによって作成されたリマーク情報である、請求項13に記載のサーバ。
  15. 前記解析ユニットが、前記第1の識別情報のアーティキュレーション情報を抽出するように構成され、
    前記マッチングユニットが、前記第1の識別情報の前記アーティキュレーション情報を前記第2の識別情報のアーティキュレーション情報とマッチングするように構成される、請求項13に記載のサーバ。
  16. 前記決定ユニットが、複数の前記ターゲットオブジェクトが存在し、前記ターゲットオブジェクトが相互に関連付けられている場合、ソーシャルアカウントが決定された前記ターゲットオブジェクトの友人アカウントを抽出することと、前記友人アカウントの前記あらかじめ設定された情報を解析することと、前記第1の識別情報とマッチングされる前記第2の識別情報を取得することとを行うように構成される、請求項9に記載のサーバ。
  17. コンピュータ実行可能命令が記憶されたコンピュータ記憶媒体であって、前記コンピュータ実行可能命令が、請求項1から8のいずれか一項に記載の、ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法のうちの少なくとも1つを実行するために使用されるコンピュータ記憶媒体。
JP2018524809A 2016-06-06 2016-11-22 ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法、サーバ、および記憶媒体 Active JP6574904B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610395583.1 2016-06-06
CN201610395583.1A CN106126521B (zh) 2016-06-06 2016-06-06 目标对象的社交账号挖掘方法及服务器
PCT/CN2016/106806 WO2017211051A1 (zh) 2016-06-06 2016-11-22 目标对象的社交账号挖掘方法、服务器和存储介质

Publications (2)

Publication Number Publication Date
JP2019500685A JP2019500685A (ja) 2019-01-10
JP6574904B2 true JP6574904B2 (ja) 2019-09-11

Family

ID=57270119

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018524809A Active JP6574904B2 (ja) 2016-06-06 2016-11-22 ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法、サーバ、および記憶媒体

Country Status (6)

Country Link
US (1) US11606671B2 (ja)
EP (1) EP3467675B1 (ja)
JP (1) JP6574904B2 (ja)
KR (1) KR102114765B1 (ja)
CN (1) CN106126521B (ja)
WO (1) WO2017211051A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126521B (zh) * 2016-06-06 2018-06-19 腾讯科技(深圳)有限公司 目标对象的社交账号挖掘方法及服务器
CN106775224B (zh) * 2016-11-30 2019-11-29 北京小米移动软件有限公司 备注信息设置方法及装置
CN108846767B (zh) * 2017-04-27 2022-03-11 清华大学 社交群组的特征获取方法及装置
CN108390788B (zh) * 2018-03-05 2021-05-14 北京奇艺世纪科技有限公司 用户识别方法、装置及电子设备
CN110213070B (zh) * 2018-04-04 2021-08-17 腾讯科技(深圳)有限公司 团网络识别方法、装置、服务器及计算机可读存储介质
CN108763466B (zh) * 2018-05-29 2021-08-31 武汉大学 基于位置实体的跨媒体用户身份匹配方法
CN110750681B (zh) * 2018-07-05 2022-08-16 武汉斗鱼网络科技有限公司 一种账号相似度计算方法、存储介质、电子设备及系统
CN114143286B (zh) * 2018-11-13 2023-05-12 创新先进技术有限公司 定位目标对象的方法、装置和电子设备
CN109547436A (zh) * 2018-11-23 2019-03-29 北京三快在线科技有限公司 关系链中节点评价方法及装置、存储介质和电子设备
CN109934726B (zh) * 2019-01-24 2021-03-02 北京亿幕信息技术有限公司 一种机构账号管理系统
CN109978016B (zh) * 2019-03-06 2022-08-23 重庆邮电大学 一种网络用户身份识别方法
CN110135890A (zh) * 2019-04-15 2019-08-16 深圳壹账通智能科技有限公司 基于知识关系挖掘的产品数据推送方法及相关设备
US11483408B2 (en) 2019-07-10 2022-10-25 Adobe Inc. Feature-based network embedding
CN111367955B (zh) * 2019-10-09 2024-03-26 杭州海康威视系统技术有限公司 目标对象的识别方法、装置、电子设备和存储介质
CN111292223B (zh) 2020-01-22 2023-07-25 北京百度网讯科技有限公司 图计算的处理方法、装置、电子设备及存储介质
CN111429791B (zh) * 2020-04-09 2022-11-18 浙江大华技术股份有限公司 身份确定方法、装置、存储介质及电子装置
CN111581521A (zh) * 2020-04-29 2020-08-25 北京达佳互联信息技术有限公司 群组成员的推荐方法、装置、服务器、存储介质及系统
CN111444440B (zh) * 2020-06-15 2020-09-29 腾讯科技(深圳)有限公司 一种身份信息识别方法、装置、电子设备和存储介质
CN112288528A (zh) * 2020-10-30 2021-01-29 浙江集享电子商务有限公司 恶意社群发现方法、装置、计算机设备和可读存储介质
CN113098756B (zh) * 2021-03-25 2023-04-07 深圳市艾酷通信软件有限公司 信息处理方法、装置、电子设备及存储介质
CN112948698A (zh) * 2021-04-06 2021-06-11 丁科 一种基于精准搜索词的社交目的识别方法
CN113779520B (zh) * 2021-09-07 2023-06-13 中国船舶重工集团公司第七0九研究所 基于多层属性分析的跨空间目标虚拟身份关联方法
CN114885200B (zh) * 2022-04-26 2024-01-02 北京达佳互联信息技术有限公司 消息处理方法、装置、电子设备及计算机可读存储介质
CN115118693A (zh) * 2022-06-28 2022-09-27 平安银行股份有限公司 群组成员的数据处理方法、装置、电子设备和存储介质

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101265263B1 (ko) * 2006-01-02 2013-05-16 삼성전자주식회사 발음 기호를 이용한 문자열 매칭 방법 및 시스템과 그방법을 기록한 컴퓨터 판독 가능한 기록매체
CN100578506C (zh) * 2007-09-17 2010-01-06 腾讯科技(深圳)有限公司 网络信息搜索方法及搜索系统
US8626835B1 (en) * 2010-10-21 2014-01-07 Google Inc. Social identity clustering
CN102004788A (zh) * 2010-12-07 2011-04-06 北京开心人信息技术有限公司 一种智能定位社交网络联系人的方法与系统
CN102638484A (zh) * 2011-02-15 2012-08-15 鸿富锦精密工业(深圳)有限公司 云端存取系统及其根据社群网络显示数据对象的方法
CN103425649B (zh) * 2012-05-15 2016-05-18 腾讯科技(深圳)有限公司 添加好友信息的方法及装置
CN103514230B (zh) * 2012-06-29 2018-06-05 北京百度网讯科技有限公司 一种用于根据语料序列训练语言模型的方法与设备
US8990209B2 (en) * 2012-09-06 2015-03-24 International Business Machines Corporation Distributed scalable clustering and community detection
US9098819B1 (en) * 2012-10-18 2015-08-04 Google Inc. Identifying social network accounts belonging to the same user
US9367536B2 (en) 2013-05-03 2016-06-14 Facebook, Inc. Using inverse operators for queries on online social networks
US8849813B1 (en) * 2013-07-18 2014-09-30 Linkedin Corporation Method and system to determine a member profile associated with a reference in a publication
CN103455615A (zh) * 2013-09-10 2013-12-18 中国地质大学(武汉) 一种微信帐号的排序过滤检索方法
US9384571B1 (en) * 2013-09-11 2016-07-05 Google Inc. Incremental updates to propagated social network labels
CN104572732A (zh) * 2013-10-22 2015-04-29 腾讯科技(深圳)有限公司 查询用户标识的方法及装置、获取用户标识的方法及装置
CN103646060B (zh) * 2013-11-29 2017-05-17 宇龙计算机通信科技(深圳)有限公司 一种搜索群组的方法及装置
US9819768B2 (en) * 2013-12-13 2017-11-14 Fuze, Inc. Systems and methods of address book management
US9552613B2 (en) * 2014-01-27 2017-01-24 Facebook, Inc. Label inference in a social network
KR102207254B1 (ko) * 2014-01-27 2021-01-26 삼성전자주식회사 노드들의 커뮤니티를 생성하는 방법 및 장치
CN105022761B (zh) * 2014-04-30 2020-11-03 腾讯科技(深圳)有限公司 群组查找方法和装置
CN105302810B (zh) * 2014-06-12 2019-07-09 北京搜狗科技发展有限公司 一种信息搜索方法和装置
CN105608120A (zh) * 2015-12-16 2016-05-25 中青冠岳科技(北京)有限公司 一种基于即时通讯程序进行目标用户搜索的方法和装置
US20170235726A1 (en) 2016-02-12 2017-08-17 Fujitsu Limited Information identification and extraction
CN106126521B (zh) * 2016-06-06 2018-06-19 腾讯科技(深圳)有限公司 目标对象的社交账号挖掘方法及服务器

Also Published As

Publication number Publication date
EP3467675A4 (en) 2019-11-20
KR20180069867A (ko) 2018-06-25
JP2019500685A (ja) 2019-01-10
CN106126521B (zh) 2018-06-19
CN106126521A (zh) 2016-11-16
EP3467675A1 (en) 2019-04-10
US11606671B2 (en) 2023-03-14
KR102114765B1 (ko) 2020-05-25
EP3467675B1 (en) 2020-10-28
WO2017211051A1 (zh) 2017-12-14
US20180262883A1 (en) 2018-09-13

Similar Documents

Publication Publication Date Title
JP6574904B2 (ja) ターゲットオブジェクトのソーシャルアカウントをマイニングするための方法、サーバ、および記憶媒体
CN109840533B (zh) 一种应用拓扑图识别方法及装置
CN109344326B (zh) 一种社交圈的挖掘方法和装置
CN104573130B (zh) 基于群体计算的实体解析方法及装置
WO2015066805A1 (en) Systems and methods for behavioral segmentation of users in a social data network
Rathore et al. Identifying groups of fake reviewers using a semisupervised approach
JP6488753B2 (ja) 情報処理方法
CN112818230B (zh) 内容推荐方法、装置、电子设备和存储介质
Ragunathan et al. Link prediction by analyzing common neighbors based subgraphs using convolutional neural network
CN107169065B (zh) 一种特定内容的去除方法和装置
CN113343012B (zh) 一种新闻配图方法、装置、设备及存储介质
CN115983873A (zh) 一种基于大数据的用户数据分析管理系统及方法
CN111984698B (zh) 一种信息预测方法、装置及存储介质
CN114781517A (zh) 风险识别的方法、装置及终端设备
CN113282686A (zh) 一种不平衡样本的关联规则确定方法及装置
US20150324813A1 (en) System and method for determining by an external entity the human hierarchial structure of an rganization, using public social networks
CN113312895A (zh) 自治系统as的组织机构映射方法、装置及电子设备
CN111191882B (zh) 一种识别异质信息网络中有影响力的开发者的方法及装置
Kotseruba et al. Industry and Academic Research in Computer Vision
CN111611981A (zh) 信息识别方法和装置及信息识别神经网络训练方法和装置
KR20190125067A (ko) 유사 기업 추출 장치 및 이를 이용한 유사 기업 추출 방법
CN114418752B (zh) 无类型标签用户数据的处理方法、装置、电子设备和介质
CN112559897B (zh) 匹配关系的识别方法、装置及设备
CN107622045B (zh) 一种信息处理方法及设备
Huang et al. Friend Recommendation in Online Social Networks Combining Interest Similarity and Social Interaction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190819

R150 Certificate of patent or registration of utility model

Ref document number: 6574904

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250