JP2023544022A - グループタイプの識別方法、装置、コンピュータ機器及びコンピュータプログラム - Google Patents

グループタイプの識別方法、装置、コンピュータ機器及びコンピュータプログラム Download PDF

Info

Publication number
JP2023544022A
JP2023544022A JP2023519589A JP2023519589A JP2023544022A JP 2023544022 A JP2023544022 A JP 2023544022A JP 2023519589 A JP2023519589 A JP 2023519589A JP 2023519589 A JP2023519589 A JP 2023519589A JP 2023544022 A JP2023544022 A JP 2023544022A
Authority
JP
Japan
Prior art keywords
user
feature
user nodes
nodes
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023519589A
Other languages
English (en)
Inventor
チェン,ハオ
Original Assignee
テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド filed Critical テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Publication of JP2023544022A publication Critical patent/JP2023544022A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/185Arrangements for providing special services to substations for broadcast or conference, e.g. multicast with management of multicast group membership
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

コンピュータ技術分野に属するグループタイプの識別方法、装置、コンピュータ機器及び媒体を提供する。第1のターゲットグラフの第1のグラフ構造特徴及び第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得し(101)、第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、第1のターゲットグラフにおける各第1のユーザノードのアテンションパラメータを取得し(102)、複数の第1のユーザノードから、選択されていない第1のユーザノードのアテンションパラメータよりも大きいアテンションパラメータを有する複数の第2のユーザノードを選択し(103)、複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別する(104)。スクリーニングされた重要なユーザノードのユーザ特徴及びグラフ構造特徴に基づいてターゲットグループを識別し、識別正確率を向上させる。【選択図】図5

Description

本発明は、2021年1月4日に出願した出願番号が202110002127.7であり、発明の名称が「グループタイプの識別方法、装置、コンピュータ機器及び媒体」である中国特許出願に基づく優先権を主張し、その全ての内容を参照により本発明に援用する。
本発明の実施例は、コンピュータ技術の分野に関し、特にグループタイプの識別方法、装置、コンピュータ機器及び媒体に関する。
コンピュータ技術及びインスタント通信アプリケーションの発展に伴い、インスタント通信アプリケーションに基づいて様々なタイプのグループを確立することができる。どのようにグループのタイプを識別するかは、早急に解決すべき技術的問題となった。
本発明の実施例は、グループタイプの識別正確率を向上させる、グループタイプの識別方法、装置、コンピュータ機器及び媒体を提供する。その技術的手段は、以下の通りである。
1つの態様では、コンピュータ機器が実行する、グループタイプの識別方法であって、第1のターゲットグラフの第1のグラフ構造特徴及び前記第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得するステップであって、前記第1のユーザノードは、ターゲットグループにおけるユーザIDに対応するノードであり、前記第1のターゲットグラフは、前記複数の第1のユーザノード間の関連関係に基づいて構築される、ステップと、前記第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得するステップであって、前記アテンションパラメータは、前記第1のターゲットグラフにおける前記第1のユーザノードの重要度を表す、ステップと、前記複数の第1のユーザノードから複数の第2のユーザノードを選択するステップであって、前記複数の第2のユーザノードのアテンションパラメータは、選択されていない第1のユーザノードのアテンションパラメータよりも大きい、ステップと、前記複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップであって、前記第2のターゲットグラフは、前記複数の第2のユーザノード間の関連関係に基づいて構築される、ステップと、を含む、方法を提供する。
もう1つの態様では、グループタイプの識別装置であって、第1のターゲットグラフの第1のグラフ構造特徴及び前記第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得する特徴取得モジュールであって、前記第1のユーザノードは、ターゲットグループにおけるユーザIDに対応するノードであり、前記第1のターゲットグラフは、前記複数の第1のユーザノード間の関連関係に基づいて構築される、特徴取得モジュールと、前記第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得する第1のアテンション取得モジュールであって、前記アテンションパラメータは、前記第1のターゲットグラフにおける前記第1のユーザノードの重要度を表す、第1のアテンション取得モジュールと、前記複数の第1のユーザノードから複数の第2のユーザノードを選択する第1のスクリーニングモジュールであって、前記複数の第2のユーザノードのアテンションパラメータは、選択されていない第1のユーザノードのアテンションパラメータよりも大きい、第1のスクリーニングモジュールと、前記複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するタイプ識別モジュールであって、前記第2のターゲットグラフは、前記複数の第2のユーザノード間の関連関係に基づいて構築される、タイプ識別モジュールと、を含む、装置を提供する。
好ましくは、該装置は、前記第2のグラフ構造特徴に基づいて、前記複数の第2のユーザノードの第1のユーザ特徴を調整し、前記複数の第2のユーザノードの第2のユーザ特徴を取得する特徴調整モジュールと、前記第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得する第2のアテンション取得モジュールと、前記複数の第2のユーザノードから複数の第3のユーザノードを選択する第2のスクリーニングモジュールであって、前記複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい、第2のスクリーニングモジュールと、をさらに含む。
好ましくは、前記タイプ識別モジュールは、前記複数の第2のユーザノードの第1のユーザ特徴、前記第2のグラフ構造特徴、前記複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別し、前記第3のターゲットグラフは、前記複数の第3のユーザノード間の関連関係に基づいて構築される。
好ましくは、前記タイプ識別モジュールは、前記複数の第2のユーザノードの第1のユーザ特徴と前記第2のグラフ構造特徴とを融合し、第1の融合特徴を取得する第1の融合部と、前記複数の第3のユーザノードの第2のユーザ特徴と前記第3のグラフ構造特徴とを融合し、第2の融合特徴を取得する第2の融合部と、前記第1の融合特徴及び前記第2の融合特徴に基づいて、前記ターゲットグループのグループタイプを識別するタイプ識別部と、を含む。
好ましくは、前記第1の融合部は、前記複数の第2のユーザノードの第1のユーザ特徴及び前記第2のグラフ構造特徴に基づいて平均値を求め、平均ユーザ特徴を取得し、前記平均ユーザ特徴と前記複数の第2のユーザノードの第1のユーザ特徴のうちの最大のユーザ特徴とを連結し、前記第1の融合特徴を取得する。
好ましくは、前記タイプ識別部は、前記第1の融合特徴と前記第2の融合特徴とを連結し、前記ターゲットグループに対応する連結特徴を取得し、前記連結特徴に基づいて、前記ターゲットグループのグループタイプを識別する。
好ましくは、グループタイプ識別モデルは、第1のアテンションネットワーク、第1のスクリーニングネットワーク及び識別ネットワークを含み、前記第1のアテンション取得モジュールは、前記第1のアテンションネットワークを呼び出し、前記第1のグラフ構造特徴及び前記複数の第1のユーザ特徴に基づいて、前記各第1のユーザノードのアテンションパラメータを取得し、前記第1のスクリーニングモジュールは、前記第1のスクリーニングネットワークを呼び出し、前記複数の第1のユーザノードから前記複数の第2のユーザノードを選択し、前記タイプ識別モジュールは、前記識別ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴及び前記第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別する。
好ましくは、前記グループタイプ識別モデルは、第1の畳み込みネットワーク、第2のアテンションネットワーク及び第2のスクリーニングネットワークをさらに含み、前記装置は、前記第1の畳み込みネットワークを呼び出し、前記第2のグラフ構造特徴に基づいて、前記複数の第2のユーザノードの第1のユーザ特徴を調整し、前記複数の第2のユーザノードの第2のユーザ特徴を取得する特徴調整モジュールと、前記第2のアテンションネットワークを呼び出し、前記第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得する第2のアテンション取得モジュールと、前記第2のスクリーニングネットワークを呼び出し、前記複数の第2のユーザノードから複数の第3のユーザノードを選択する第2のスクリーニングモジュールであって、前記複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい、第2のスクリーニングモジュールと、をさらに含む。
好ましくは、前記タイプ識別モジュールは、前記識別ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴、前記第2のグラフ構造特徴、前記複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別し、前記第3のターゲットグラフは、前記複数の第3のユーザノード間の関連関係に基づいて構築される。
好ましくは、前記グループタイプ識別モデルは、第1の融合ネットワーク及び第2の融合ネットワークをさらに含み、前記タイプ識別モジュールは、前記第1の融合ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴と前記第2のグラフ構造特徴とを融合し、第1の融合特徴を取得する第1の融合部と、前記第2の融合ネットワークを呼び出し、前記複数の第3のユーザノードの第2のユーザ特徴と前記第3のグラフ構造特徴とを融合し、第2の融合特徴を取得する第2の融合部と、前記識別ネットワークを呼び出し、前記第1の融合特徴及び前記第2の融合特徴に基づいて、前記ターゲットグループのグループタイプを識別するタイプ識別部と、を含む。
好ましくは、前記グループタイプ識別モデルは、連結ネットワークをさらに含み、前記タイプ識別部は、前記連結ネットワークを呼び出し、前記第1の融合特徴と前記第2の融合特徴とを連結し、前記ターゲットグループに対応する連結特徴を取得し、前記識別ネットワークを呼び出し、前記連結特徴に基づいて、前記ターゲットグループのグループタイプを識別する。
好ましくは、前記グループタイプ識別モデルの訓練プロセスは、サンプルグループのサンプルタイプ、サンプルグラフのサンプルグラフ構造特徴及び前記サンプルターゲットグラフにおける複数のサンプルユーザノードのサンプルユーザ特徴を取得するステップであって、前記サンプルユーザノードは、前記サンプルユーザIDに対応するノードであり、前記サンプルグラフは、サンプルグループにおける複数のサンプルユーザID間の関連関係に基づいて構築される、ステップと、前記グループタイプ識別モデルを呼び出し、前記サンプルグラフ構造特徴及び前記複数のサンプルユーザノードのサンプルユーザ特徴に基づいて、前記サンプルグループの予測タイプを識別するステップと、前記サンプルタイプと前記予測タイプとの差に基づいて、前記グループタイプ識別モデルを訓練するステップと、を含む。
好ましくは、前記第1のスクリーニングネットワークは、前記複数の第1のユーザノードの数と参照比率とを乗算して参照数を取得し、前記複数の第1のユーザノードのアテンションパラメータを大きい順に並び替え、並び替えられた上位の参照数のアテンションパラメータを選択し、選択されたアテンションパラメータに対応する第1のユーザノードを前記第2のユーザノードとする。
好ましくは、グラフ構造特徴は、複数のユーザノードのうちの任意の2つのユーザノード間の関連度を含み、前記特徴取得モジュールは、前記ターゲットグループにおける任意の2つのユーザIDの共通出現回数を取得し、前記共通出現回数は、複数の参照期間内に、前記任意の2つのユーザIDに基づいて前記ターゲットグループにおいて共通してコンテンツを投稿した回数であり、前記共通出現回数に基づいて、前記任意の2つのユーザID間の関連度を決定し、前記関連度と前記共通出現回数とは正の相関関係にある。
好ましくは、ユーザ特徴は、ユーザ行動特徴及びユーザ属性特徴を含み、前記特徴取得モジュールは、登録された複数のユーザIDを含むユーザソーシャルネットワークを取得し、前記ユーザソーシャルネットワークに基づいて、前記複数のユーザIDのユーザ行動特徴を取得し、前記複数のユーザIDに対応するユーザ画像情報に基づいて、前記複数のユーザIDのユーザ属性特徴を取得する。
もう1つの態様では、プロセッサと、少なくとも1つのコンピュータプログラムが記憶されたメモリと、を含むコンピュータ機器であって、前記少なくとも1つのコンピュータプログラムは、上記のグループタイプの識別方法を実現するように、前記プロセッサによりロードされて実行される、コンピュータ機器を提供する。
もう1つの態様では、少なくとも1つのコンピュータプログラムが記憶された、コンピュータ読み取り可能な記憶媒体であって、前記少なくとも1つのコンピュータプログラムは、上記のグループタイプの識別方法を実現するように、前記プロセッサによりロードされて実行される、記憶媒体を提供する。
もう1つの態様では、コンピュータ読み取り可能な記憶媒体に記憶されたコンピュータプログラムコードを含むコンピュータプログラム製品又はコンピュータプログラムであって、コンピュータ機器のプロセッサは、該コンピュータ機器で上記のグループタイプの識別方法を実行するように、コンピュータ読み取り可能な記憶媒体から前記コンピュータプログラムコードを読み取って実行する、コンピュータプログラム製品又はコンピュータプログラムを提供する。
本発明の実施例の技術的手段は、少なくとも以下の有利な効果を奏する。
本発明の実施例に係る方法は、各第1のユーザノードのアテンションパラメータを取得する際に、グラフ構造特徴及びユーザノード特徴を考慮するため、ユーザ情報のみを取得する従来技術と比べて、情報量を増加させ、得られたアテンションパラメータがユーザノードのグラフ構造における重要度をより正確に反映することができるため、アテンションパラメータに基づいて複数の第1のユーザノードをスクリーニングする際に、比較的に重要なユーザノードを正確に選択することができる。これらの重要なユーザノードのユーザ特徴及びグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別することで、識別正確率を向上させることができる。また、重要でないユーザノードを廃棄することで、処理すべきデータ量を低減させ、処理速度を向上させることができる。
本発明の実施例に係る技術をより明確に説明するために、以下は、実施例の説明に必要な図面を簡単に紹介する。なお、以下の図面は、単に本発明の幾つかの実施形態であり、当業者は、創造的な作業を行うことなく、これらの図面に基づいて他の図面を得ることができる。
本発明の実施例に係るグループタイプの識別方法の実装環境の一例の概略図である。 本発明の実施例に係るグループタイプ識別モデルの構成の概略図である。 本発明の実施例に係る他のグループタイプ識別モデルの構成の概略図である。 本発明の実施例に係る他のグループタイプ識別モデルの構成の概略図である。 本発明の実施例に係る他のグループタイプの識別方法のフローチャートである。 本発明の実施例に係る他のグループタイプ識別モデルの構成の概略図である。 本発明の実施例に係るグループタイプの識別装置の構成の概略図である。 本発明の実施例に係る他のグループタイプの識別装置の構成の概略図である。 本発明の実施例に係る端末の構成の概略図である。 本発明の実施例に係るサーバの構成の概略図である。
本発明の目的、技術的手段、及び利点をより明確にするために、以下は、図面を参照しながら本発明の実施形態をさらに詳細に説明する。
なお、本明細書で使用される「第1の」、「第2の」などの用語は、本明細書で使用されて様々な概念を説明するために使用されてもよいが、特に明記されない限り、これらの概念はこれらの用語により限定されない。これらの用語は、単なるある概念と別の概念とを区別するために使用される。例えば、本発明の範囲から逸脱することなく、第1のユーザノードを第2のユーザノードと称し、第2のユーザノードを第1のユーザノードと称してもよい。
本明細書で使用される「少なくとも1つ」、「複数」、「各」、「何れか」などの用語は、「少なくとも1つ」が1つを含み、「複数」が2つ以上を含み、「各」が対応する複数のもののそれぞれを意味し、「何れか」が複数のもののうちの任意の1つを意味する。例えば、「複数のユーザノード」は3つのユーザノードを含み、「各ユーザノード」はこの3つのユーザノードのそれぞれを意味し、「何れか」はこの3つのユーザノードのうちの任意の1つを意味し、1番目のユーザノードであってもよいし、2番目のユーザノードであってもよいし、3番目のユーザノードであってもよい。
従来技術では、グループにおける複数のユーザIDに対応するユーザ情報に基づいて、該グループのタイプを決定する。ここで、ユーザ情報には、ユーザプロファイル画像、ユーザタグ、年齢、性別などの情報が含まれる。しかし、このようなユーザ情報に基づいてグループタイプを決定する方式は、根拠となるデータ量が少ないため、決定されたグループタイプの正確率が低い。
本発明の実施例に係るグループタイプの識別方法は、グループタイプ識別のシナリオに適用される。例えば、インスタント通信アプリケーションでは、ユーザのプライバシー及びユーザの財産の安全性を考慮して、本発明の実施例に係るグループタイプの識別方法を用いて、ターゲットグループが特定のグループであるか否かを識別し、ターゲットグループが特定のグループであると決定された場合、ユーザの損失を回避するために、ターゲットグループに対してグループ無効化処理又は他の処理を行う。
本発明の実施例に係る方法は、コンピュータ機器により実行され、該コンピュータ機器は端末又はサーバである。好ましくは、端末は、携帯電話、コンピュータ、タブレットなどの携帯型、ポケット型、ハンドヘルド型などの様々なタイプの端末である。サーバは、独立した物理サーバ、又は複数の物理サーバにより構成されるサーバクラスタ又は分散型システム、又はクラウドサービス、クラウドデータベース、クラウドコンピューティング、クラウド関数、クラウドストレージ、ネットワークサービス、クラウド通信、ミドルウェアサービス、ドメインネームサービス、セキュリティサービス、CDN(Content Delivery Network:コンテンツ配信ネットワーク)、並びにビッグデータ及び人工知能プラットフォームなどの基礎クラウドコンピューティングサービスを提供するクラウドサーバである。
図1は、本発明の実施例に係るグループタイプの識別方法の実装環境の一例の概略図である。本発明の実施例の実行主体は、コンピュータ機器である。図1に示すように、該方法は、以下のステップを含む。
ステップ101:第1のターゲットグラフの第1のグラフ構造特徴及び第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得する。
本発明の実施例では、複数のユーザIDを含むターゲットグループを一例として説明する。
ここで、第1のユーザノードは、ターゲットグループにおけるユーザIDに対応するノードであり、第1のターゲットグラフは、複数の第1のユーザノード間の関連関係に基づいて構築される。
1つの可能な態様では、複数の第1のユーザノードがターゲットグループにおける全てのユーザIDに対応するユーザノードである場合、即ち、複数の第1のユーザノードがスクリーニングされていないものである場合、第1のターゲットグラフは、初期ターゲットグラフである。複数の第1のユーザノードがターゲットグループにおける一部のユーザIDに対応するユーザノードである場合、即ち、複数の第1のユーザノードが既にスクリーニングされたものである場合、第1のターゲットグラフは、スクリーニングされたターゲットグラフである。
ここで、第1のグラフ構造特徴は、第1のターゲットグラフを記述するために使用され、該第1のターゲットグラフは、複数の第1のユーザノード、及び複数の第1のユーザノード間の連結線を含む。任意の2つの第1のユーザノード間の連結線は、該任意の2つの第1のユーザノード間に関連関係があることを意味する。第1のユーザ特徴は、ユーザIDに対応するユーザを記述するために使用され、該第1のユーザ特徴は、ユーザ行動特徴又はユーザ属性特徴のうちの少なくとも1つを含む。
ステップ102:第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、第1のターゲットグラフにおける各第1のユーザノードのアテンションパラメータを取得する。
ここで、アテンションパラメータは、第1のターゲットグラフにおける第1のユーザノードの重要度を表し、即ち、ターゲットグループにおける該第1のユーザノードに対応するユーザIDの重要度を表す。ターゲットグループにおけるユーザIDの重要度とアテンションパラメータとは、正の相関関係にある。例えば、ターゲットグループにおけるグループマスタや管理者などのユーザは、ターゲットグループにおいて比較的に重要であり、これらのユーザに対応するユーザノードのアテンションパラメータも大きくなる。
ステップ103:複数の第1のユーザノードから複数の第2のユーザノードを選択する。複数の第2のユーザノードのアテンションパラメータは、選択されていない第1のユーザノードのアテンションパラメータよりも大きい。
本発明の実施例では、複数の第1のユーザノードをスクリーニングし、複数の第1のユーザノードからアテンションパラメータが比較的に大きい複数の第2のユーザノードを選択する。後でこれらのアテンションパラメータが比較的に大きい第2のユーザノードに基づいて処理を行うことによって、処理過程において幾つかの重要でない情報を廃棄し、データ量を低減させると共に、重要な情報に対する損失を低減させることができる。
ステップ104:複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別する。
ここで、第2のターゲットグラフは、複数の第2のユーザノード間の関連関係に基づいて構築される。第2のグラフ構造特徴は、第2のターゲットグラフを記述するために使用される。第2のターゲットグラフは、第1のターゲットグラフのサブグラフであり、該第2のターゲットグラフは、複数の第2のユーザノード、及び複数の第2のユーザノード間の連結線を含む。第2のターゲットグラフにおける複数の第2のユーザノード間の連結線は、第1のターゲットグラフにおける複数の第2のユーザノード間の連結線と同様である。
ここで、グループタイプとは、ターゲットグループが属するタイプを意味する。分類基準に応じて、異なるグループタイプを分けることができる。例えば、ターゲットグループにおけるユーザIDに対応するユーザの職業に応じて、勤務グループと非勤務グループとに分け、ターゲットグループにおけるユーザIDに対応するユーザ同士が親戚関係にあるか否かに応じて、家族グループと非家族グループとに分け、ターゲットグループにおけるユーザIDに対応するユーザのターゲットグループ内の行動が特定の行動に属するか否かに応じて、特定グループと非特定グループとに分ける。例えば、特定の行動は、ポルノ、ギャンブル、詐欺などの行為を含む。
本発明の実施例に係る方法は、各第1のユーザノードのアテンションパラメータを取得する際に、グラフ構造特徴及びユーザノード特徴を考慮するため、ユーザ情報のみを取得する従来技術と比べて、情報量を増加させ、得られたアテンションパラメータがユーザノードのグラフ構造における重要度をより正確に反映することができるため、アテンションパラメータに基づいて複数の第1のユーザノードをスクリーニングする際に、比較的に重要なユーザノードを正確に選択することができる。これらの重要なユーザノードのユーザ特徴及びグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別することで、識別正確率を向上させることができる。また、重要でないユーザノードを廃棄することで、処理すべきデータ量を低減させ、処理速度を向上させることができる。
1つの可能な態様では、コンピュータ機器は、グループタイプ識別モデルを呼び出して、ターゲットグループのグループタイプを識別する。以下は、グループタイプ識別モデルのモデル構成を説明する。
図2は、本発明の実施例に係るグループタイプ識別モデルの構成の概略図である。図2に示すように、該グループタイプ識別モデルは、入力ネットワーク201、第1のアテンションネットワーク202、第1のスクリーニングネットワーク203及び識別ネットワーク204を含む。ここで、入力ネットワーク201は第1のアテンションネットワーク202に接続され、第1のアテンションネットワーク202は第1のスクリーニングネットワーク203に接続され、第1のスクリーニングネットワーク203は識別ネットワーク204に接続される。
ここで、入力ネットワーク201は、入力されたグラフ構造特徴及びユーザ特徴を取得し、第1のアテンションネットワーク202は、各ユーザノードのアテンションパラメータを取得し、第1のスクリーニングネットワーク203は、取得されたアテンションパラメータに基づいて、重要なユーザノードをスクリーニングし、識別ネットワーク204は、スクリーニングされたユーザノードのユーザ特徴及び対応するグラフ構造特徴に基づいて、グループタイプを識別する。
1つの可能な態様では、図3に示すように、グループタイプ識別モデルは、第1の畳み込みネットワーク205、第2のアテンションネットワーク206、第2のスクリーニングネットワーク207及び連結ネットワーク208をさらに含む。ここで、第1の畳み込みネットワーク205は第1のスクリーニングネットワーク203及び第2のアテンションネットワーク206に接続され、第2のアテンションネットワーク206は第2のスクリーニングネットワーク207に接続され、第2のスクリーニングネットワーク207は識別ネットワーク204に接続され、連結ネットワーク208は第1のスクリーニングネットワーク203、第2のスクリーニングネットワーク207及び識別ネットワーク204に接続される。
ここで、第1の畳み込みネットワーク205は、第1のスクリーニングネットワーク203によりスクリーニングされた比較的に重要なユーザノードのユーザ特徴に対してさらに処理を行い、第2のアテンションネットワーク206は、スクリーニングされた各ユーザノードのアテンションパラメータを取得し、第2のスクリーニングネットワーク207は、取得されたアテンションパラメータに基づいて、スクリーニングされたユーザノードに対してさらにスクリーニングを行い、連結ネットワーク208は、第1のスクリーニングネットワーク203によりスクリーニングされたユーザノードのユーザ特徴と第2のスクリーニングネットワーク207により再度スクリーニングされたユーザノードのユーザ特徴とを連結する。
上記の可能な態様では、ユーザノードに対して2回のスクリーニングを行うことを一例として説明したが、もう1つの可能な態様では、より多くの情報量を取得するように、ユーザノードに対して3回、4回又はそれ以上の回数のスクリーニングを行ってもよい。例えば、図4に示すように、3つのアテンションネットワーク、3つのスクリーニングネットワークを使用して、ユーザノードに対して3回のスクリーニングを行う。ここで、連結ネットワークは、3つのスクリーニングネットワークによりスクリーニングされたユーザノードのユーザ特徴を連結する。
また、1つの可能な態様では、第1のアテンションネットワークの前に畳み込みネットワークをさらに含み、即ち、入力されたユーザ特徴及びグラフ構造特徴に対して先に畳み込み処理を行う。第1のアテンションネットワークは、畳み込み処理されたユーザ特徴及びグラフ構造特徴に基づいて、アテンションパラメータを取得する。
以下は、図5を参照しながら、グループタイプ識別モデルを呼び出してターゲットグループのタイプを識別する例について説明する。
図5は、本発明の実施例に係る他のグループタイプの識別方法のフローチャートである。本発明の実施例の実行主体は、コンピュータ機器である。図5に示すように、該方法は、以下のステップを含む。
ステップ501:ターゲットグループにおける複数のユーザID間の関連関係に基づいて、第1のターゲットグラフを構築する。
本発明の実施例では、第1ターゲットグラフが最初に構築されたターゲットグラフであることを一例として説明する。
本発明の実施例では、ターゲットグループにおける複数のユーザIDに基づいて対応するユーザノードを構築し、さらに複数のユーザID間の関連関係に基づいて、複数のユーザノードを連結して第1ターゲットグラフを構成する。該第1ターゲットグラフは、同種グラフ(homogeneous graph)であり、即ち、第1ターゲットグラフには、ユーザノードという一種類のノードのみが含まれ、且つ、ユーザノード間は同一の種類の関連関係に基づいて連結し、即ち、第1ターゲットグラフにおける連結線は同一の種類の連結線である。
ここで、任意の2つのユーザノード間の関連関係は、該任意の2つのユーザノード間の関連度特徴に基づいて決定され、該関連度特徴は、任意の2つのユーザノードに対応するユーザ間の親密度を表す。
1つの可能な態様では、ターゲットグループにおける任意の2つのユーザIDの共通出現回数を取得し、共通出現回数に基づいて、任意の2つのユーザID間の関連度特徴を決定する。ここで、関連度特徴は、関連度と称されてもよい。共通出現回数は、複数の参照期間内に、任意の2つのユーザIDに基づいてターゲットグループにおいて共通してコンテンツを投稿した回数を意味する。関連度と共通出現回数とは正の相関関係にあり、即ち、共通出現回数が大きいほど、2つのユーザID間の関連度が大きくなり、共通出現回数が小さいほど、2つのユーザID間の関連度が小さくなる。好ましくは、共通出現回数をそのまま関連度としてもよい。
例えば、参照期間は5分間であり、任意の2人のユーザについて、この5分間で両方のユーザがターゲットグループにおいて発言したか否かを決定し、両方のユーザが発言した場合には、2人のユーザに対応する共通出現回数に1を加算し、一方のユーザのみが発言した場合や両方のユーザが発言していない場合、共通出現回数は増加しない。ここで、2人のユーザが共通してターゲットグループにおいて発言した場合、この2人のユーザ間のコミュニケーションが多いことを示しており、2人のユーザ間は比較的に親密であるため、共通出現回数に基づいて関連度を決定することができる。
1つの可能な態様では、2人のユーザが同時にターゲットグループにおいて発言するような偶発的な状況が存在する可能性があることを考慮して、偶発的な状況を回避するために、共通出現回数が参照回数よりも小さいか否かを決定し、共通出現回数が参照回数よりも小さい場合、共通出現回数を0に設定してもよい。例えば、ターゲットグループにおけるグループマスタがメッセージを投稿し、該ターゲットグループ内のグループマスタ以外のユーザが該メッセージに返信する場合、ターゲットグループ内の多くのユーザが同時に発言するが、これらの同時に発言したユーザ間の関係は親密ではない可能性がある。
なお、本発明の実施例では、単に第1のオブジェクトグラフが同種グラフであることを一例として説明しているが、もう1つの態様では、第1のオブジェクトグラフは、異種グラフ(heterogeneous graph)である。例えば、第1のオブジェクトグラフには、ユーザノード及びユーザタイプノードが含まれ、ユーザノード間は、同一の種類の関連関係に従って連結され、ユーザノードとユーザタイプノードとの間は、ユーザノードに対応するユーザが属するタイプに従って連結される。
ステップ502:第1のターゲットグラフの第1のグラフ構造特徴及び第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得する。
ここで、第1のグラフ構造特徴は、該第1ターゲットグラフにおける複数のユーザノード及び該複数のユーザノード間の関連関係を表す。第1のグラフ構造特徴は、複数のユーザノードのうちの任意の2つのユーザノード間の関連度を含む。第1のユーザ特徴は、ユーザ行動特徴とユーザ属性特徴を含む。ユーザ行動特徴は、ユーザの履歴行動を表し、ユーザ属性特徴は、ユーザ自身の属性を表す。
1つの可能な態様では、ユーザソーシャルネットワークを取得し、該ユーザソーシャルネットワークに基づいて、ターゲットグループにおける複数のユーザIDのユーザ行動特徴を取得する。ここで、ユーザソーシャルネットワークは、登録された複数のユーザIDを含む。
好ましくは、グラフ埋め込み(graph embedding)の方式により、ユーザソーシャルネットワークに基づいて、ユーザIDのユーザ行動特徴を取得する。ここで、グラフ埋め込みは、グラフにおける各ノードを低次元空間の稠密ベクトルとして表現し、得られた該稠密ベクトルをノードの特徴情報とする。グラフ埋め込みの中心的なアイデアは、グラフ構造の固有の構造的属性を保持すること、即ち、グラフにおける連結されたノードをベクトル空間内で互いに近接させたままにすることである。例えば、グラフ埋め込みの方法は、DeepWalk(ネットワークにおけるノード表現を生成する方法)やNode2Vec(ネットワークにおけるノードベクトルを生成するモデル)などのノード埋め込み方法を含む。
Deepwalkノード埋め込み方法を一例にすると、ユーザソーシャルネットワークに基づいて、グラフにおける各ユーザノードから、ユーザソーシャルネットワーク及びユーザ連結線の重みに基づいて、ランダムに複数の軌跡を生成し、生成された全ての軌跡をコーパスとしてword2vec語ベクトル埋め込みモデルに入力し、word2vec語ベクトル埋め込みモデルにより処理を行い、最終的に各ユーザノードのユーザ行動特徴を取得する。
1つの可能な態様では、ターゲットグループにおける複数のユーザIDに対応するユーザ画像情報に基づいて、ターゲットグループにおける複数のユーザIDのユーザ属性特徴を取得する。ここで、ユーザ画像情報には、ユーザプロファイル画像、ユーザが投稿した動的な情報、ユーザの年齢、性別、ユーザが所在する地理的位置などの情報が含まれる。
1つの可能な態様では、第1のユーザ特徴をベクトルで表し、複数の第1のユーザ特徴を行列で表し、即ち、複数の第1のユーザ特徴を連結して1つの行列を構成する。例えば、行列における行又は列は、1つの第1のユーザノードの第1のユーザ特徴を表す。
1つの可能な態様では、第1のグラフ構造特徴を行列で表し、行列における各位置の要素は、対応する2つのユーザノード間の関連関係を表す。例えば、行列における3行目4列目の要素は、3番目のユーザノードと4番目のユーザノードとの間の関連関係を表す。例えば、以下の式を使用して、2つの第1のユーザノード間の関連関係を取得する。
ここで、Aijはi番目の第1のユーザノードとj番目の第1のユーザノードとの間の関連関係を表し、Cijはi番目の第1のユーザノードに対応するユーザIDとj番目の第1のユーザノードに対応するユーザIDとの共通出現回数を表す。
ステップ503:第1のアテンションネットワークを呼び出し、第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得する。
第1のアテンションネットワークは、少なくとも1つのGNN(Graph Neural Network:グラフニューラルネットワーク)である。以下の何れかの式を使用して、アテンションパラメータを取得する。
ここで、Zはアテンションパラメータを表し、Xは複数の第1のユーザ特徴を表し、Aは第1のグラフ構造特徴を表し、σは参照数値であり、
(外1)

は第1のユーザ特徴と第1のグラフ構造特徴に対して畳み込み処理を行うことを表し、mはm番目のGNNを表し、MはGNNの数を表す。ここで、Z、X及びAは行列である。
上記1番目及び2番目の式には1つのGNNが使用され、上記3番目の式には2つのGNNが使用され、上記4番目の式にはM個のGNNが使用される。上記の3番目の式では、2つのGNNが順次接続されており、即ち、まず1番目のGNNを用いて一次処理を行い、次に2番目のGNNを用いて一次処理に加えて二次処理を行い、アテンションパラメータを取得する。上記4番目の式において、M個のGNNは、それぞれ第1のユーザ特徴と第1のグラフ構造特徴を処理し、処理されたM個のアテンションパラメータの平均値を求め、最終的なアテンションパラメータを取得する。
ステップ504:第1のスクリーニングネットワークを呼び出し、複数の第1のユーザノードから複数の第2のユーザノードを選択し、複数の第2のユーザノード間の関連関係に基づいて第2ターゲットグラフを構築する。
ここで、複数の第2のユーザノードのアテンションパラメータは、選択されていない第1のユーザノードのアテンションパラメータよりも大きい。
1つの可能な態様では、第1のスクリーニングネットワークを呼び出し、複数の第1のユーザノードの数と参照比率とを乗算して参照数を取得し、複数の第1のユーザノードのアテンションパラメータを大きい順に並び替え、並び替えられた上位の参照数のアテンションパラメータを選択し、選択されたアテンションパラメータに対応する第1のユーザノードを第2のユーザノードとする。複数の第2のユーザノードが選択された後、選択された複数の第2のユーザノード間の関連関係に基づいて、第2ターゲットグラフを構築する。
好ましくは、以下の式を使用して、複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴を取得する。
ここで、X’は複数の第2のユーザノードの第1のユーザ特徴を表し、Xidx,:は複数の第1のユーザノードの第1のユーザ特徴から第2のユーザノードの第1のユーザ特徴を選択することを表し、Aは第2のグラフ構造特徴を表し、Aidx,idxは第1のグラフ構造特徴から複数の第2のユーザノードに対応する関連関係を選択することを表す。
好ましくは、アテンションパラメータの大きさを考慮して、以下の式を使用して、複数の第2のユーザノードの第1のユーザ特徴を調整し、調整された第1のユーザ特徴を取得する。
ここで、Xは調整された第1のユーザ特徴を表し、Zは複数の第2のユーザノードのアテンションパラメータを表し、
(外2)

はビット積、即ち各第2のユーザノードの第1のユーザ特徴とアテンションパラメータとを乗算することを表す。
なお、本発明の実施例は、単にユーザノードに対して複数回のスクリーニングを行うことを一例として説明しており、もう1つの態様では、ユーザノードに対して1回のみのスクリーニングを行う場合、複数の第2のユーザノードを選択した後、直接、複数の第2のユーザノードのユーザ特徴、及び第2のターゲットグラフを構築するための第2のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別し、以降のステップを実行しない。
ステップ505:第1の畳み込みネットワークを呼び出し、第2のグラフ構造特徴に基づいて、複数の第2のユーザノードの第1のユーザ特徴を調整し、複数の第2のユーザノードの第2のユーザ特徴を取得する。
第1の畳み込みネットワークは、GCN(Graph Convolutional Networks:グラフ畳み込みネットワーク)であり、以下の式を使用して畳み込み処理後の第2のユーザ特徴を決定する。
ここで、Xl+1は複数の第2のユーザノードの第2のユーザ特徴を表し、Xは複数の第2のユーザノードの第1のユーザ特徴を表し、Aは第2のグラフ構造特徴を表し、Wl+1は第1の畳み込みネットワークにおけるモデルパラメータを表し、σは参照数値である。
ステップ506:第2のアテンションネットワークを呼び出し、第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得する。
ステップ507:第2のスクリーニングネットワークを呼び出し、複数の第2のユーザノードから複数の第3のユーザノードを選択し、複数の第3のユーザノード間の関連関係に基づいて第3のターゲットグラフを構築する。
ステップ506~ステップ507の態様は、上述のステップ503~ステップ504の態様と同様であり、ここでその説明を省略する。
ステップ508:識別ネットワークを呼び出し、複数の第2のユーザノードの第1のユーザ特徴、第2のグラフ構造特徴、複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別する。
1つの可能な態様では、識別ネットワークが処理するデータ量を低減させるために、複数の第2のユーザノードの第1のユーザ特徴と第2のグラフ構造特徴とを融合し、第1の融合特徴を取得し、複数の第3のユーザノードの第2のユーザ特徴と第3のグラフ構造特徴とを融合し、第2の融合特徴を取得し、識別ネットワークを呼び出し、第1の融合特徴及び第2の融合特徴に基づいて、ターゲットグループのグループタイプを識別する。
1つの可能な態様では、第2のユーザノードの数量に基づいて、複数の第2のユーザノードの第1のユーザ特徴及び第2のグラフ構造特徴に対して平均値計算処理を行い、即ち、複数の第2のユーザノードの第1のユーザ特徴及び第2のグラフ構造特徴に基づいて平均値を求め、複数の第2のユーザノードに対応する平均ユーザ特徴を取得し、平均ユーザ特徴と複数の第2のユーザノードの第1のユーザ特徴のうちの最大のユーザ特徴とを連結し、第1の融合特徴を取得する。ここで、第2のグラフ構造特徴に複数の第2のユーザノード間の関連関係が含まれるため、任意の1つの第2のユーザノードについて、該第2のグラフ構造特徴から該第2のユーザノードと他の第2のユーザノードとの間の関連関係を決定することができる。この場合、平均値を求める際に、実際に、第2のユーザノードの第1のユーザ特徴及び該第2のユーザノードと他の第2のユーザノードとの間の関連関係を一体として、複数の第2のユーザノードの第1のユーザ特徴及び複数の関連関係について平均値を求める。
例えば、以下の式を使用して第1の融合特徴を取得する。
ここで、sは第1の融合特徴を表し、Nは第2のユーザノードの数を表し、xはi番目の第2のユーザノードの第1のユーザ特徴及びi番目の第2のユーザノードと他の第2のユーザノードとの間の関連関係を表し、
(外3)


(外4)

の前の特徴と
(外5)

の後の特徴とを連結することを表す。
同様に、第3のユーザノードの第2のユーザ特徴と第3のグラフ構造特徴について、第3のユーザノードの数に基づいて、複数の第3のユーザノードの第2のユーザ特徴及び第3のグラフ構造特徴に対して平均値計算処理を行い、即ち、複数の第3のユーザノードの第2のユーザ特徴及び第3のグラフ構造特徴に基づいて平均値を求め、複数の第3のユーザノードに対応する平均ユーザ特徴を取得し、平均ユーザ特徴と複数の第3のユーザノードの第2のユーザ特徴のうちの最大のユーザ特徴とを連結し、第2の融合特徴を取得する。
1つの可能な態様では、第1の融合特徴と第2の融合特徴とを連結し、ターゲットグループに対応する連結特徴を取得し、連結特徴に基づいて、ターゲットグループのグループタイプを識別する。ここで、連結特徴は、ターゲットグループを表す特徴である。
1つの可能な態様では、図6に示すモデル構成の概略図を参照すると、グループタイプ識別モデルは、第1の融合ネットワーク、第2の融合ネットワーク及び連結ネットワークをさらに含む。即ち、第1の融合ネットワークを呼び出し、複数の第2のユーザノードの第1のユーザ特徴と第2のグラフ構造特徴とを融合し、第1の融合特徴を取得し、第2の融合ネットワークを呼び出し、複数の第3のユーザノードの第2のユーザ特徴と第3のグラフ構造特徴とを融合し、第2の融合特徴を取得し、連結ネットワークを呼び出し、第1の融合特徴と第2の融合特徴とを連結し、ターゲットグループに対応する連結特徴を取得し、識別ネットワークを呼び出し、連結特徴に基づいて、ターゲットグループのグループタイプを識別する。
ターゲットグループが特定のグループであるか否かを決定することを一例として説明し、1つの可能な態様では、識別ネットワークは、多層パーセプトロンを含む分類器であり、識別ネットワークの出力は0又は1である。識別ネットワークの出力が0である場合、ターゲットグループが特定のグループではないことを示し、識別ネットワークの出力が1である場合、ターゲットグループが特定のグループであることを示す。例えば、以下の式を使用して、識別ネットワークの出力値を決定する。
ここで、
(外6)

は識別ネットワークの出力値を表し、Eは連結特徴を表し、
(外7)

はMLP(Multi-Layer Perceptron:多層パーセプトロン)を用いて連結特徴を処理することを表す。
もう1つの可能な態様では、識別ネットワークの出力は確率であり、出力の確率が参照確率よりも大きい場合、ターゲットグループが特定のグループであることを示し、出力の確率が参照確率以下である場合、ターゲットグループが特定のグループでないことを示す。
なお、図5に示す実施例は、単にグループタイプ識別モデルを呼び出してターゲットグループのグループタイプを識別することを一例として説明しており、もう1つの実施例では、コンピュータ機器は、直接、第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得し、複数の第1のユーザノードから複数の第2のユーザノードを選択し、複数の第2のユーザノード間の関連関係に基づいて第2のターゲットグラフを構築し、第2のターゲットグラフの第2のグラフ構造特徴に基づいて、複数の第2のユーザノードの第1のユーザ特徴を調整し、複数の第2のユーザノードの第2のユーザ特徴を取得し、第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得し、複数の第2のユーザノードから複数の第3のユーザノードを選択し、複数の第3のユーザノード間の関連関係に基づいて第3のターゲットグラフを構築し、複数の第2のユーザノードの第1のユーザ特徴、第2のグラフ構造特徴、複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別する。
本発明の実施例に係る方法は、各第1のユーザノードのアテンションパラメータを取得する際に、グラフ構造特徴及びユーザノード特徴を考慮するため、ユーザ情報のみを取得する従来技術と比べて、情報量を増加させ、得られたアテンションパラメータがユーザノードのグラフ構造における重要度をより正確に反映することができるため、アテンションパラメータに基づいて複数の第1のユーザノードをスクリーニングする際に、比較的に重要なユーザノードを正確に選択することができる。これらの重要なユーザノードのユーザ特徴及びグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別することで、識別正確率を向上させることができる。また、重要でないユーザノードを廃棄することで、処理すべきデータ量を低減させ、処理速度を向上させることができる。
また、本発明の実施例では、ユーザノードに対して複数回のスクリーニングを行い、異なる階層のユーザ特徴及びグラフ構造特徴を取得し、ターゲットグループを識別する際に、異なる階層のユーザ特徴及びグラフ構造特徴を考慮して、識別正確率をさらに向上させることができる。
1つの可能な態様では、グループタイプ識別モデルを使用する前に、グループタイプ識別モデルを訓練する必要がある。グループタイプ識別モデルの訓練プロセスは、サンプルグループのサンプルタイプ、サンプルグラフのサンプルグラフ構造特徴及びサンプルターゲットグラフにおける複数のサンプルユーザノードのサンプルユーザ特徴を取得するステップと、グループタイプ識別モデルを呼び出し、サンプルグラフ構造特徴及び複数のサンプルユーザノードのサンプルユーザ特徴に基づいて、サンプルグループの予測タイプを識別するステップと、サンプルタイプと前記予測タイプとの差に基づいて、グループタイプ識別モデルを訓練するステップと、を含む。ここで、サンプルユーザノードは、サンプルユーザIDに対応するノードであり、サンプルグラフは、サンプルグループにおける複数のサンプルユーザID間の関連関係に基づいて構築される。
例えば、二乗誤差を使用して、グループタイプ識別モデルを訓練する。
ここで、
(外8)

は予測タイプを表し、Yはサンプルタイプを表し、Lは予測タイプとサンプルタイプの差を表す。
好ましくは、グループタイプ識別モデルを呼び出し、ターゲットグループのグループタイプを識別した後、ターゲットグループを用いて該グループタイプ識別モデルに対する訓練を継続してもよい。
なお、上述した訓練プロセスは、単なる1回の訓練を一例とし、もう1つの実施例では、グループタイプ識別モデルに対して反復的な訓練を複数回実行してもよい。
1つの可能な態様では、ターゲットグループが特定グループであるか否かを決定する応用シナリオについて、従来技術では、キーワードのフィルタリング技術を用いて、ユーザが投稿したコンテンツに特定の単語が含まれているか否かを決定し、特定の単語が含まれている場合、該ターゲットグループが特定グループに属すると判断する。しかし、ユーザが対応する特定の単語の代わりに他の不特定の単語を使用した場合、キーワードのフィルタリングにより当該不特定の単語を検出できず、特定の単語であるか否かを決定できず、ターゲットグループに対する識別正確率が低い。もう1つの従来技術では、ユーザ通報の方式を使用し、即ち、ユーザがターゲットグループに対して通報を行った後、管理者が再び手動でチェックし、ターゲットグループが特定のグループに属するか否かを決定する。しかし、この方式は、ユーザの通報に依存し、ユーザの通報行為の影響を受け、ターゲットグループに対する識別正確率も低い。本発明の実施例に係る方式は、上記の2種類の従来技術と比べて、ユーザが使用する単語及びユーザ通報行為の影響を受けることなく、直接にターゲットグループにおける複数のユーザノード間の関連関係及びユーザノードのユーザ特徴に基づいて、ターゲットグループのグループタイプを識別することができ、識別正確率を向上させることができる。
もう1つの従来技術では、プーリング関数を使用してターゲットグループにおける全てのユーザノードの情報を読み出す。しかし、ユーザノードが多い場合、プーリング関数を使用して全ての情報を読み出すことが困難となり、大量の情報が失われ、ユーザノードが多いほど、処理速度が遅くなる。一方、本発明では、アテンションパラメータに基づいてユーザノードをスクリーニングすることができ、スクリーニングされたユーザノードの情報のみを読み出してよく、且つ、アテンションパラメータの大きさに基づいて重要なノードの情報を保留することができるため、大量の情報を失うことがなく、且つ、情報量を確保すると共に、処理速度を向上させることができる。
図7は、本発明の実施例に係るグループタイプの識別装置の構成の概略図である。図7に示すように、該装置は、以下のモジュールを含む。
特徴取得モジュール701は、第1のターゲットグラフの第1のグラフ構造特徴及び第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得する。第1のユーザノードは、ターゲットグループにおけるユーザIDに対応するノードであり、第1のターゲットグラフは、複数の第1のユーザノード間の関連関係に基づいて構築される。
第1のアテンション取得モジュール702は、第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得する。アテンションパラメータは、第1のターゲットグラフにおける第1のユーザノードの重要度を表す。
第1のスクリーニングモジュール703は、複数の第1のユーザノードから複数の第2のユーザノードを選択する。複数の第2のユーザノードのアテンションパラメータは、選択されていない第1のユーザノードのアテンションパラメータよりも大きい。
タイプ識別モジュール704は、複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別する。第2のターゲットグラフは、複数の第2のユーザノード間の関連関係に基づいて構築される。
本発明の実施例に係る装置は、各第1のユーザノードのアテンションパラメータを取得する際に、グラフ構造特徴及びユーザノード特徴を考慮するため、ユーザ情報のみを取得する従来技術と比べて、情報量を増加させ、得られたアテンションパラメータがユーザノードのグラフ構造における重要度をより正確に反映することができるため、アテンションパラメータに基づいて複数の第1のユーザノードをスクリーニングする際に、比較的に重要なユーザノードを正確に選択することができる。これらの重要なユーザノードのユーザ特徴及びグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別することで、識別正確率を向上させることができる。また、重要でないユーザノードを廃棄することで、処理すべきデータ量を低減させ、処理速度を向上させることができる。
1つの可能な態様では、図8に示すように、該装置は、以下のモジュールをさらに含む。
特徴調整モジュール705は、第2のグラフ構造特徴に基づいて、複数の第2のユーザノードの第1のユーザ特徴を調整し、複数の第2のユーザノードの第2のユーザ特徴を取得する。
第2のアテンション取得モジュール706は、第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得する。
第2のスクリーニングモジュール707は、複数の第2のユーザノードから複数の第3のユーザノードを選択する。複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい。
もう1つの可能な態様では、タイプ識別モジュール704は、複数の第2のユーザノードの第1のユーザ特徴、第2のグラフ構造特徴、複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別する。第3のターゲットグラフは、複数の第3のユーザノード間の関連関係に基づいて構築される。
もう1つの可能な態様では、図8に示すように、タイプ識別モジュール704は、以下の各部を含む。
第1の融合部7041は、複数の第2のユーザノードの第1のユーザ特徴と第2のグラフ構造特徴とを融合し、第1の融合特徴を取得する。
第2の融合部7042は、複数の第3のユーザノードの第2のユーザ特徴と第3のグラフ構造特徴とを融合し、第2の融合特徴を取得する。
タイプ識別部7043は、第1の融合特徴及び第2の融合特徴に基づいて、ターゲットグループのグループタイプを識別する。
もう1つの可能な態様では、図8に示すように、第1の融合部7041は、複数の第2のユーザノードの第1のユーザ特徴及び第2のグラフ構造特徴に基づいて平均値を求め、平均ユーザ特徴を取得し、平均ユーザ特徴と複数の第2のユーザノードの第1のユーザ特徴のうちの最大のユーザ特徴とを連結し、第1の融合特徴を取得する。
もう1つの可能な態様では、図8に示すように、タイプ識別部7043は、第1の融合特徴と第2の融合特徴とを連結し、ターゲットグループに対応する連結特徴を取得し、連結特徴に基づいて、ターゲットグループのグループタイプを識別する。
もう1つの可能な態様では、図8に示すように、グループタイプ識別モデルは、第1のアテンションネットワーク、第1のスクリーニングネットワーク及び識別ネットワークを含む。
第1のアテンション取得モジュール702は、第1のアテンションネットワークを呼び出し、第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得する。
第1のスクリーニングモジュール703は、第1のスクリーニングネットワークを呼び出し、複数の第1のユーザノードから複数の第2のユーザノードを選択する。
タイプ識別モジュール704は、識別ネットワークを呼び出し、複数の第2のユーザノードの第1のユーザ特徴及び第2のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別する。
もう1つの可能な態様では、グループタイプ識別モデルは、第1の畳み込みネットワーク、第2のアテンションネットワーク及び第2のスクリーニングネットワークをさらに含む。図8に示すように、該装置は、以下のモジュールをさらに含む。
特徴調整モジュール705は、第1の畳み込みネットワークを呼び出し、第2のグラフ構造特徴に基づいて、複数の第2のユーザノードの第1のユーザ特徴を調整し、複数の第2のユーザノードの第2のユーザ特徴を取得する。
第2のアテンション取得モジュール706は、第2のアテンションネットワークを呼び出し、第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得する。
第2のスクリーニングモジュール707は、第2のスクリーニングネットワークを呼び出し、複数の第2のユーザノードから複数の第3のユーザノードを選択する。複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい。
もう1つの可能な態様では、タイプ識別モジュール704は、識別ネットワークを呼び出し、複数の第2のユーザノードの第1のユーザ特徴、第2のグラフ構造特徴、複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別する。第3のターゲットグラフは、複数の第3のユーザノード間の関連関係に基づいて構築される。
もう1つの可能な態様では、グループタイプ識別モデルは、第1の融合ネットワーク及び第2の融合ネットワークをさらに含む。図8に示すように、タイプ識別モジュール704は、以下の各部を含む。
第1の融合部7041は、第1の融合ネットワークを呼び出し、複数の第2のユーザノードの第1のユーザ特徴と第2のグラフ構造特徴とを融合し、第1の融合特徴を取得する。
第2の融合部7042は、第2の融合ネットワークを呼び出し、複数の第3のユーザノードの第2のユーザ特徴と前記第3のグラフ構造特徴とを融合し、第2の融合特徴を取得する。
タイプ識別部7043は、識別ネットワークを呼び出し、第1の融合特徴及び第2の融合特徴に基づいて、ターゲットグループのグループタイプを識別する。
もう1つの可能な態様では、グループタイプ識別モデルは、連結ネットワークをさらに含む。図8に示すように、タイプ識別部7043は、連結ネットワークを呼び出し、第1の融合特徴と第2の融合特徴とを連結し、ターゲットグループに対応する連結特徴を取得し、識別ネットワークを呼び出し、連結特徴に基づいて、ターゲットグループのグループタイプを識別する。
もう1つの可能な態様では、グループタイプ識別モデルの訓練プロセスは、サンプルグループのサンプルタイプ、サンプルグラフのサンプルグラフ構造特徴及びサンプルターゲットグラフにおける複数のサンプルユーザノードのサンプルユーザ特徴を取得するステップであって、サンプルユーザノードは、サンプルユーザIDに対応するノードであり、サンプルグラフは、サンプルグループにおける複数のサンプルユーザID間の関連関係に基づいて構築される、ステップと、グループタイプ識別モデルを呼び出し、サンプルグラフ構造特徴及び複数のサンプルユーザノードのサンプルユーザ特徴に基づいて、サンプルグループの予測タイプを識別するステップと、サンプルタイプと予測タイプとの差に基づいて、グループタイプ識別モデルを訓練するステップと、を含む。
もう1つの可能な態様では、図8に示すように、第1のスクリーニングモジュール703は、複数の第1のユーザノードの数と参照比率とを乗算して参照数を取得し、複数の第1のユーザノードのアテンションパラメータを大きい順に並び替え、並び替えられた上位の参照数のアテンションパラメータを選択し、選択されたアテンションパラメータに対応する第1のユーザノードを前記第2のユーザノードとする。
もう1つの可能な態様では、グラフ構造特徴は、複数のユーザノードのうちの任意の2つのユーザノード間の関連度を含む。図8に示すように、特徴取得モジュール701は、ターゲットグループにおける任意の2つのユーザIDの共通出現回数を取得し、共通出現回数は、複数の参照期間内に、任意の2つのユーザIDに基づいてターゲットグループにおいて共通してコンテンツを投稿した回数であり、共通出現回数に基づいて、任意の2つのユーザID間の関連度を決定し、関連度と共通出現回数とは正の相関関係にある。
もう1つの可能な態様では、ユーザ特徴は、ユーザ行動特徴及びユーザ属性特徴を含む。図8に示すように、特徴取得モジュール701は、登録された複数のユーザIDを含むユーザソーシャルネットワークを取得し、ユーザソーシャルネットワークに基づいて、複数のユーザIDのユーザ行動特徴を取得し、複数のユーザIDに対応するユーザ画像情報に基づいて、複数のユーザIDのユーザ属性特徴を取得する。
上記の全ての可能な態様を任意に組み合わせて本発明の可能な実施例を形成してもよく、ここでその説明を省略する
なお、上記の実施例に係るグループタイプの識別装置がグループタイプを識別する際に、単に上記の機能モジュールの分割を一例にして説明する。実際に応用する際に、必要に応じて上記の機能を異なる機能ブロックに割り当ててもよい。即ち、電子機器の内部構造を様々な機能モジュールに分割して、上記の機能の全て又は一部を実行してもよい。また、上記の実施例に係るグループタイプの識別装置は、グループタイプの識別方法と同一の概念に属し、その具体的な実施プロセスは、方法の実施例を参照してもよく、ここでその説明を省略する。
本発明の実施例は、コンピュータ機器をさらに提供し、該コンピュータ機器は、プロセッサと、少なくとも1つのコンピュータプログラムが記憶されたメモリと、を含み、該少なくとも1つのコンピュータプログラムは、第1のターゲットグラフの第1のグラフ構造特徴及び第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得するステップであって、第1のユーザノードは、ターゲットグループにおけるユーザIDに対応するノードであり、第1のターゲットグラフは、複数の第1のユーザノード間の関連関係に基づいて構築される、ステップと、第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得するステップであって、アテンションパラメータは、第1のターゲットグラフにおける第1のユーザノードの重要度を表す、ステップと、複数の第1のユーザノードから複数の第2のユーザノードを選択するステップであって、複数の第2のユーザノードのアテンションパラメータは、選択されていない第1のユーザノードのアテンションパラメータよりも大きい、ステップと、複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別するステップであって、第2のターゲットグラフは、複数の第2のユーザノード間の関連関係に基づいて構築される、ステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、第2のグラフ構造特徴に基づいて、複数の第2のユーザノードの第1のユーザ特徴を調整し、複数の第2のユーザノードの第2のユーザ特徴を取得するステップと、第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得するステップと、複数の第2のユーザノードから複数の第3のユーザノードを選択するステップであって、複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい、ステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、複数の第2のユーザノードの第1のユーザ特徴、第2のグラフ構造特徴、複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別するステップであって、第3のターゲットグラフは、複数の第3のユーザノード間の関連関係に基づいて構築される、ステップ、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、複数の第2のユーザノードの第1のユーザ特徴と第2のグラフ構造特徴とを融合し、第1の融合特徴を取得するステップと、複数の第3のユーザノードの第2のユーザ特徴と第3のグラフ構造特徴とを融合し、第2の融合特徴を取得するステップと、第1の融合特徴及び第2の融合特徴に基づいて、ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、複数の第2のユーザノードの第1のユーザ特徴及び第2のグラフ構造特徴に基づいて平均値を求め、平均ユーザ特徴を取得するステップと、平均ユーザ特徴と複数の第2のユーザノードの第1のユーザ特徴のうちの最大のユーザ特徴とを連結し、第1の融合特徴を取得するステップとを実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、第1の融合特徴と第2の融合特徴とを連結し、ターゲットグループに対応する連結特徴を取得するステップと、連結特徴に基づいて、ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グループタイプ識別モデルは、第1のアテンションネットワーク、第1のスクリーニングネットワーク及び識別ネットワークを含む。該少なくとも1つのコンピュータプログラムは、前記第1のアテンションネットワークを呼び出し、前記第1のグラフ構造特徴及び前記複数の第1のユーザ特徴に基づいて、前記各第1のユーザノードのアテンションパラメータを取得するステップと、前記第1のスクリーニングネットワークを呼び出し、前記複数の第1のユーザノードから前記複数の第2のユーザノードを選択するステップと、前記識別ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴及び前記第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グループタイプ識別モデルは、第1の畳み込みネットワーク、第2のアテンションネットワーク及び第2のスクリーニングネットワークをさらに含む。該少なくとも1つのコンピュータプログラムは、第1の畳み込みネットワークを呼び出し、第2のグラフ構造特徴に基づいて、複数の第2のユーザノードの第1のユーザ特徴を調整し、複数の第2のユーザノードの第2のユーザ特徴を取得するステップと、第2のアテンションネットワークを呼び出し、第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得するステップと、第2のスクリーニングネットワークを呼び出し、複数の第2のユーザノードから複数の第3のユーザノードを選択するステップであって、複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい、ステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、識別ネットワークを呼び出し、複数の第2のユーザノードの第1のユーザ特徴、第2のグラフ構造特徴、複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別するステップであって、第3のターゲットグラフは、複数の第3のユーザノード間の関連関係に基づいて構築される、ステップを実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グループタイプ識別モデルは、第1の融合ネットワーク及び第2の融合ネットワークをさらに含む。該少なくとも1つのコンピュータプログラムは、第1の融合ネットワークを呼び出し、複数の第2のユーザノードの第1のユーザ特徴と第2のグラフ構造特徴とを融合し、第1の融合特徴を取得するステップと、第2の融合ネットワークを呼び出し、複数の第3のユーザノードの第2のユーザ特徴と第3のグラフ構造特徴とを融合し、第2の融合特徴を取得するステップと、識別ネットワークを呼び出し、第1の融合特徴及び第2の融合特徴に基づいて、ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グループタイプ識別モデルは、連結ネットワークをさらに含む。該少なくとも1つのコンピュータプログラムは、連結ネットワークを呼び出し、第1の融合特徴と前記第2の融合特徴とを連結し、ターゲットグループに対応する連結特徴を取得するステップと、識別ネットワークを呼び出し、連結特徴に基づいて、ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、サンプルグループのサンプルタイプ、サンプルグラフのサンプルグラフ構造特徴及びサンプルターゲットグラフにおける複数のサンプルユーザノードのサンプルユーザ特徴を取得するステップであって、サンプルユーザノードは、サンプルユーザIDに対応するノードであり、サンプルグラフは、サンプルグループにおける複数のサンプルユーザID間の関連関係に基づいて構築される、ステップと、グループタイプ識別モデルを呼び出し、サンプルグラフ構造特徴及び複数のサンプルユーザノードのサンプルユーザ特徴に基づいて、サンプルグループの予測タイプを識別するステップと、サンプルタイプと前記予測タイプとの差に基づいて、グループタイプ識別モデルを訓練するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グラフ構造特徴は、複数のユーザノードのうちの任意の2つのユーザノード間の関連度を含む。該少なくとも1つのコンピュータプログラムは、ターゲットグループにおける任意の2つのユーザIDの共通出現回数を取得するステップであって、共通出現回数は、複数の参照期間内に、任意の2つのユーザIDに基づいてターゲットグループにおいて共通してコンテンツを投稿した回数である、ステップと、共通出現回数に基づいて、任意の2つのユーザID間の関連度を決定するステップであって、関連度と共通出現回数とは正の相関関係にある、ステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、複数の第1のユーザノードの数と参照比率とを乗算して参照数を取得するステップと、複数の第1のユーザノードのアテンションパラメータを大きい順に並び替え、並び替えられた上位の参照数のアテンションパラメータを選択し、選択されたアテンションパラメータに対応する第1のユーザノードを第2のユーザノードとするステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、ユーザ特徴は、ユーザ行動特徴及びユーザ属性特徴を含む。該少なくとも1つのコンピュータプログラムは、登録された複数のユーザIDを含むユーザソーシャルネットワークを取得するステップと、ユーザソーシャルネットワークに基づいて、複数のユーザIDのユーザ行動特徴を取得するステップと、複数のユーザIDに対応するユーザ画像情報に基づいて、複数のユーザIDのユーザ属性特徴を取得するステップと、を実現するように、プロセッサによりロードされて実行される。
好ましくは、コンピュータ機器は、端末として提供される。図9は、本発明の実施例に係る端末900の構成の概略図である。端末900は、プロセッサ901及びメモリ902を含む。
プロセッサ901は、4コアプロセッサ、8コアプロセッサなどのような1つ又は複数の処理コアを含んでもよい。プロセッサ901は、メインプロセッサ及びコプロセッサを含んでもよい。メインプロセッサは、アウェイク状態でデータを処理するために使用されるプロセッサであり、CPU(Central Processing Unit:中央処理装置)とも称される。コプロセッサは、スタンバイ状態でデータを処理するために使用される低電力プロセッサである。幾つかの実施例では、プロセッサ901は、GPU(Graphics Processing Unit:グラフィックスプロセッシングユニット)と統合されてもよく、GPUは、表示画面に表示される必要がある内容をレンダリング及び描画するために使用される。
メモリ902は、1つ又は複数のコンピュータ読み取り可能な記憶媒体を含んでもよく、該コンピュータ読み取り可能な記憶媒体は、有形で非一時的であってもよい。メモリ902は、高速ランダムアクセスメモリ及び不揮発性メモリ、例えば、1つ又は複数の磁気ディスク記憶装置やフラッシュメモリ記憶装置をさらに含んでもよい。幾つかの実施例では、メモリ902における非一時的なコンピュータ読み取り可能な記憶媒体は、少なくとも1つの命令が記憶され、該少なくとも1つの命令は、本発明の実施例に係るグループタイプの識別方法を実現するように、プロセッサ901により実行されるために使用される。
幾つかの実施例では、端末900は、好ましくは、周辺機器インターフェース903及び少なくとも1つの周辺機器をさらに含んでもよい。プロセッサ901とメモリ902と周辺機器インターフェース903とは、バス又は信号線を介して接続することができる。各周辺機器は、バス、信号線又は回路基板を介して周辺機器インターフェース903に接続することができる。具体的には、周辺機器は、無線周波数回路904、表示スクリーン905、カメラコンポーネント906、オーディオ回路907、及び電源909のうちの少なくとも1つを含む。
周辺機器インターフェース903は、I/O(入力/出力)に関連する少なくとも1つの周辺機器をプロセッサ901及びメモリ902に接続するために使用されてもよい。幾つかの実施例では、プロセッサ901、メモリ902及び周辺機器インターフェース903は、同一のチップ又は回路基板に統合される。他の幾つかの実施例では、プロセッサ901、メモリ902及び周辺機器インターフェース903の何れか1つ又は2つは、単独したチップ又は回路基板に実装されてもよいが、本実施例はこれらに限定されない。
無線周波数回路904は、電磁信号とも称されるRF(Radio Frequency:無線周波数)信号を送受信するために使用される。無線周波数回路904は、電磁信号を介して通信ネットワーク及び他の通信機器と通信する。無線周波数回路904は、電気信号を送信用の電磁信号に変換し、或いは、受信した電磁信号を電気信号に変換する。
表示スクリーン905は、UI(User Interface:ユーザインターフェース)を表示するために使用される。該UIは、グラフィック、テキスト、アイコン、ビデオ、及びそれらの任意の組み合わせを含んでもよい。表示スクリーン905は、タッチ表示スクリーンである場合、表示スクリーン905の表面又は表面の上方でのタッチ信号を取り込む能力を有する。タッチ信号は、処理のための制御信号としてプロセッサ901に入力されてもよい。
カメラコンポーネント906は、画像又はビデオを取り込むために使用される。好ましくは、カメラコンポーネント906は、フロントカメラ及びリアカメラを含む。
オーディオ回路907は、マイクロフォン及びスピーカを含んでもよい。マイクロフォンは、ユーザ及び環境の音波を取り込み、音波を電気信号に変換して処理のためにプロセッサ901に入力し、或いは無線周波数回路904に入力して音声通信を実現するために使用される。
電源909は、端末900内の各コンポーネントに電力を供給するために使用される。電源909は、交流、直流、一次的な電池、又は充電式電池であってもよい。
なお、当業者が理解できるように、端末900は、図9に示す構成に限定されず、図示されているものより多く、又は少ない構成要素を含んでもよいし、特定の構成要素を組み合わせてもよいし、異なる構成要素の配置を採用してもよい。
好ましくは、該コンピュータ機器は、サーバとして実現されてもよい。図10は、本発明の実施例に係るサーバの構成の概略図である。サーバ1000は、構成又は性能が異なるために大きく異なる可能性がある。サーバ1000は、1つ又は複数のプロセッサ(Central Processing Units:CPU)1001及び1つ又は複数のメモリ1002を含む。ここで、メモリ1002には、少なくとも1つのコンピュータプログラムが記憶され、該少なくとも1つのコンピュータプログラムは、上記の各実施例に係る方法を実現するように、1つ又は複数のプロセッサ1001によりロードされて実行される。好ましくは、サーバ1000は、入力及び出力を行うために、有線又は無線のネットワークインターフェース、キーボード、及び入力/出力インターフェースなどのコンポーネントをさらに含み、サーバ1000は、機器機能を実現するための他のコンポーネントをさらに含むが、ここでその説明を省略する。
本発明の実施例は、少なくとも1つのコンピュータプログラムが記憶された、コンピュータ読み取り可能な記憶媒体をさらに提供する。該少なくとも1つのコンピュータプログラムは、第1のターゲットグラフの第1のグラフ構造特徴及び第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得するステップであって、第1のユーザノードは、ターゲットグループにおけるユーザIDに対応するノードであり、第1のターゲットグラフは、複数の第1のユーザノード間の関連関係に基づいて構築される、ステップと、第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得するステップであって、アテンションパラメータは、第1のターゲットグラフにおける第1のユーザノードの重要度を表す、ステップと、複数の第1のユーザノードから複数の第2のユーザノードを選択するステップであって、複数の第2のユーザノードのアテンションパラメータは、選択されていない第1のユーザノードのアテンションパラメータよりも大きい、ステップと、複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別するステップであって、第2のターゲットグラフは、複数の第2のユーザノード間の関連関係に基づいて構築される、ステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、第2のグラフ構造特徴に基づいて、複数の第2のユーザノードの第1のユーザ特徴を調整し、複数の第2のユーザノードの第2のユーザ特徴を取得するステップと、第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得するステップと、複数の第2のユーザノードから複数の第3のユーザノードを選択するステップであって、複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい、ステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、複数の第2のユーザノードの第1のユーザ特徴、第2のグラフ構造特徴、複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別するステップであって、第3のターゲットグラフは、複数の第3のユーザノード間の関連関係に基づいて構築される、ステップ、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、複数の第2のユーザノードの第1のユーザ特徴と第2のグラフ構造特徴とを融合し、第1の融合特徴を取得するステップと、複数の第3のユーザノードの第2のユーザ特徴と第3のグラフ構造特徴とを融合し、第2の融合特徴を取得するステップと、第1の融合特徴及び第2の融合特徴に基づいて、ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、複数の第2のユーザノードの第1のユーザ特徴及び第2のグラフ構造特徴に基づいて平均値を求め、平均ユーザ特徴を取得するステップと、平均ユーザ特徴と複数の第2のユーザノードの第1のユーザ特徴のうちの最大のユーザ特徴とを連結し、第1の融合特徴を取得するステップとを実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、第1の融合特徴と第2の融合特徴とを連結し、ターゲットグループに対応する連結特徴を取得するステップと、連結特徴に基づいて、ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グループタイプ識別モデルは、第1のアテンションネットワーク、第1のスクリーニングネットワーク及び識別ネットワークを含む。該少なくとも1つのコンピュータプログラムは、前記第1のアテンションネットワークを呼び出し、前記第1のグラフ構造特徴及び前記複数の第1のユーザ特徴に基づいて、前記各第1のユーザノードのアテンションパラメータを取得するステップと、前記第1のスクリーニングネットワークを呼び出し、前記複数の第1のユーザノードから前記複数の第2のユーザノードを選択するステップと、前記識別ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴及び前記第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グループタイプ識別モデルは、第1の畳み込みネットワーク、第2のアテンションネットワーク及び第2のスクリーニングネットワークをさらに含む。該少なくとも1つのコンピュータプログラムは、第1の畳み込みネットワークを呼び出し、第2のグラフ構造特徴に基づいて、複数の第2のユーザノードの第1のユーザ特徴を調整し、複数の第2のユーザノードの第2のユーザ特徴を取得するステップと、第2のアテンションネットワークを呼び出し、第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得するステップと、第2のスクリーニングネットワークを呼び出し、複数の第2のユーザノードから複数の第3のユーザノードを選択するステップであって、複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい、ステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、識別ネットワークを呼び出し、複数の第2のユーザノードの第1のユーザ特徴、第2のグラフ構造特徴、複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、ターゲットグループのグループタイプを識別するステップであって、第3のターゲットグラフは、複数の第3のユーザノード間の関連関係に基づいて構築される、ステップを実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グループタイプ識別モデルは、第1の融合ネットワーク及び第2の融合ネットワークをさらに含む。該少なくとも1つのコンピュータプログラムは、第1の融合ネットワークを呼び出し、複数の第2のユーザノードの第1のユーザ特徴と第2のグラフ構造特徴とを融合し、第1の融合特徴を取得するステップと、第2の融合ネットワークを呼び出し、複数の第3のユーザノードの第2のユーザ特徴と第3のグラフ構造特徴とを融合し、第2の融合特徴を取得するステップと、識別ネットワークを呼び出し、第1の融合特徴及び第2の融合特徴に基づいて、ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グループタイプ識別モデルは、連結ネットワークをさらに含む。該少なくとも1つのコンピュータプログラムは、連結ネットワークを呼び出し、第1の融合特徴と前記第2の融合特徴とを連結し、ターゲットグループに対応する連結特徴を取得するステップと、識別ネットワークを呼び出し、連結特徴に基づいて、ターゲットグループのグループタイプを識別するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、サンプルグループのサンプルタイプ、サンプルグラフのサンプルグラフ構造特徴及びサンプルターゲットグラフにおける複数のサンプルユーザノードのサンプルユーザ特徴を取得するステップであって、サンプルユーザノードは、サンプルユーザIDに対応するノードであり、サンプルグラフは、サンプルグループにおける複数のサンプルユーザID間の関連関係に基づいて構築される、ステップと、グループタイプ識別モデルを呼び出し、サンプルグラフ構造特徴及び複数のサンプルユーザノードのサンプルユーザ特徴に基づいて、サンプルグループの予測タイプを識別するステップと、サンプルタイプと前記予測タイプとの差に基づいて、グループタイプ識別モデルを訓練するステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、グラフ構造特徴は、複数のユーザノードのうちの任意の2つのユーザノード間の関連度を含む。該少なくとも1つのコンピュータプログラムは、ターゲットグループにおける任意の2つのユーザIDの共通出現回数を取得するステップであって、共通出現回数は、複数の参照期間内に、任意の2つのユーザIDに基づいてターゲットグループにおいて共通してコンテンツを投稿した回数である、ステップと、共通出現回数に基づいて、任意の2つのユーザID間の関連度を決定するステップであって、関連度と共通出現回数とは正の相関関係にある、ステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、該少なくとも1つのコンピュータプログラムは、複数の第1のユーザノードの数と参照比率とを乗算して参照数を取得するステップと、複数の第1のユーザノードのアテンションパラメータを大きい順に並び替え、並び替えられた上位の参照数のアテンションパラメータを選択し、選択されたアテンションパラメータに対応する第1のユーザノードを第2のユーザノードとするステップと、を実現するように、プロセッサによりロードされて実行される。
1つの可能な態様では、ユーザ特徴は、ユーザ行動特徴及びユーザ属性特徴を含む。該少なくとも1つのコンピュータプログラムは、登録された複数のユーザIDを含むユーザソーシャルネットワークを取得するステップと、ユーザソーシャルネットワークに基づいて、複数のユーザIDのユーザ行動特徴を取得するステップと、複数のユーザIDに対応するユーザ画像情報に基づいて、複数のユーザIDのユーザ属性特徴を取得するステップと、を実現するように、プロセッサによりロードされて実行される。
本発明の実施例は、コンピュータ読み取り可能な記憶媒体に記憶されたコンピュータプログラムコードを含むコンピュータプログラム製品又はコンピュータプログラムをさらに提供する。コンピュータ機器のプロセッサは、該コンピュータ機器で上記のグループタイプの識別方法を実行するように、コンピュータ読み取り可能な記憶媒体からコンピュータプログラムコードを読み取って実行する。
当業者が理解できるように、上記の実施例のステップの全部又は一部は、ハードウェアにより実現されてもよいし、関連するハードウェアが実行するようにプログラムを介して指示することで実現されてもよい。該プログラムは、コンピュータ読み取り可能な記憶媒体に記憶されてもよい。上述した記憶媒体は、読み取り専用メモリ、磁気ディスク又は光ディスクなどであってもよい。
なお、本発明の具体的な実施形態では、ユーザID、ユーザ行動、ユーザ属性データなどに関連するデータが言及されているが、本発明の上記の実施形態が具体的な製品又は技術に適用される際に、ユーザの許可又は同意が必要であり、関連するデータの収集、使用及び処理は、関連する国及び地域の関連する法令及び基準に準拠する必要がある。
以上は、単に本発明の例示的な実施例を説明し、本発明を制限するものではない。本発明の主旨及び原則の範囲内で行われる変更、均等的な置換、改良などは、本発明の保護範囲内に含まれる。

Claims (18)

  1. コンピュータ機器が実行する、グループタイプの識別方法であって、
    第1のターゲットグラフの第1のグラフ構造特徴及び前記第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得するステップであって、前記第1のユーザノードは、ターゲットグループにおけるユーザIDに対応するノードであり、前記第1のターゲットグラフは、前記複数の第1のユーザノード間の関連関係に基づいて構築される、ステップと、
    前記第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得するステップであって、前記アテンションパラメータは、前記第1のターゲットグラフにおける前記第1のユーザノードの重要度を表す、ステップと、
    前記複数の第1のユーザノードから複数の第2のユーザノードを選択するステップであって、前記複数の第2のユーザノードのアテンションパラメータは、選択されていない第1のユーザノードのアテンションパラメータよりも大きい、ステップと、
    前記複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップであって、前記第2のターゲットグラフは、前記複数の第2のユーザノード間の関連関係に基づいて構築される、ステップと、を含む、方法。
  2. 前記複数の第1のユーザノードから複数の第2のユーザノードを選択した後に、
    前記第2のグラフ構造特徴に基づいて、前記複数の第2のユーザノードの第1のユーザ特徴を調整し、前記複数の第2のユーザノードの第2のユーザ特徴を取得するステップと、
    前記第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得するステップと、
    前記複数の第2のユーザノードから複数の第3のユーザノードを選択するステップであって、前記複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい、ステップと、をさらに含む、請求項1に記載の方法。
  3. 前記複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップは、
    前記複数の第2のユーザノードの第1のユーザ特徴、前記第2のグラフ構造特徴、前記複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップであって、前記第3のターゲットグラフは、前記複数の第3のユーザノード間の関連関係に基づいて構築される、ステップ、を含む、請求項2に記載の方法。
  4. 前記複数の第2のユーザノードの第1のユーザ特徴、前記第2のグラフ構造特徴、前記複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップは、
    前記複数の第2のユーザノードの第1のユーザ特徴と前記第2のグラフ構造特徴とを融合し、第1の融合特徴を取得するステップと、
    前記複数の第3のユーザノードの第2のユーザ特徴と前記第3のグラフ構造特徴とを融合し、第2の融合特徴を取得するステップと、
    前記第1の融合特徴及び前記第2の融合特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップと、を含む、請求項3に記載の方法。
  5. 前記複数の第2のユーザノードの第1のユーザ特徴と前記第2のグラフ構造特徴とを融合し、第1の融合特徴を取得するステップは、
    前記複数の第2のユーザノードの第1のユーザ特徴及び前記第2のグラフ構造特徴に基づいて平均値を求め、平均ユーザ特徴を取得するステップと、
    前記平均ユーザ特徴と前記複数の第2のユーザノードの第1のユーザ特徴のうちの最大のユーザ特徴とを連結し、前記第1の融合特徴を取得するステップと、を含む、請求項4に記載の方法。
  6. 前記第1の融合特徴及び前記第2の融合特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップは、
    前記第1の融合特徴と前記第2の融合特徴とを連結し、前記ターゲットグループに対応する連結特徴を取得するステップと、
    前記連結特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップと、を含む、請求項4又は5に記載の方法。
  7. グループタイプ識別モデルは、第1のアテンションネットワーク、第1のスクリーニングネットワーク及び識別ネットワークを含み、
    前記第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得するステップは、
    前記第1のアテンションネットワークを呼び出し、前記第1のグラフ構造特徴及び前記複数の第1のユーザ特徴に基づいて、前記各第1のユーザノードのアテンションパラメータを取得するステップ、を含み、
    前記複数の第1のユーザノードから複数の第2のユーザノードを選択するステップは、
    前記第1のスクリーニングネットワークを呼び出し、前記複数の第1のユーザノードから前記複数の第2のユーザノードを選択するステップ、を含み、
    前記複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップは、
    前記識別ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴及び前記第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップ、を含む、請求項1に記載の方法。
  8. 前記グループタイプ識別モデルは、第1の畳み込みネットワーク、第2のアテンションネットワーク及び第2のスクリーニングネットワークをさらに含み、
    前記方法は、前記第1のスクリーニングネットワークを呼び出し、前記複数の第1のユーザノードから前記複数の第2のユーザノードを選択した後に、
    前記第1の畳み込みネットワークを呼び出し、前記第2のグラフ構造特徴に基づいて、前記複数の第2のユーザノードの第1のユーザ特徴を調整し、前記複数の第2のユーザノードの第2のユーザ特徴を取得するステップと、
    前記第2のアテンションネットワークを呼び出し、前記第2のグラフ構造特徴及び複数の第2のユーザ特徴に基づいて、各第2のユーザノードのアテンションパラメータを取得するステップと、
    前記第2のスクリーニングネットワークを呼び出し、前記複数の第2のユーザノードから複数の第3のユーザノードを選択するステップであって、前記複数の第3のユーザノードのアテンションパラメータは、選択されていない第2のユーザノードのアテンションパラメータよりも大きい、ステップと、をさらに含む、請求項7に記載の方法。
  9. 前記識別ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴及び前記第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップは、
    前記識別ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴、前記第2のグラフ構造特徴、前記複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップであって、前記第3のターゲットグラフは、前記複数の第3のユーザノード間の関連関係に基づいて構築される、ステップ、を含む、請求項8に記載の方法。
  10. 前記グループタイプ識別モデルは、第1の融合ネットワーク及び第2の融合ネットワークをさらに含み、
    前記識別ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴、前記第2のグラフ構造特徴、前記複数の第3のユーザノードの第2のユーザ特徴及び第3のターゲットグラフの第3のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップは、
    前記第1の融合ネットワークを呼び出し、前記複数の第2のユーザノードの第1のユーザ特徴と前記第2のグラフ構造特徴とを融合し、第1の融合特徴を取得するステップと、
    前記第2の融合ネットワークを呼び出し、前記複数の第3のユーザノードの第2のユーザ特徴と前記第3のグラフ構造特徴とを融合し、第2の融合特徴を取得するステップと、
    前記識別ネットワークを呼び出し、前記第1の融合特徴及び前記第2の融合特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップと、を含む、請求項9に記載の方法。
  11. 前記グループタイプ識別モデルは、連結ネットワークをさらに含み、
    前記識別ネットワークを呼び出し、前記第1の融合特徴及び前記第2の融合特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップは、
    前記連結ネットワークを呼び出し、前記第1の融合特徴と前記第2の融合特徴とを連結し、前記ターゲットグループに対応する連結特徴を取得するステップと、
    前記識別ネットワークを呼び出し、前記連結特徴に基づいて、前記ターゲットグループのグループタイプを識別するステップと、を含む、請求項10に記載の方法。
  12. 前記グループタイプ識別モデルの訓練プロセスは、
    サンプルグループのサンプルタイプ、サンプルグラフのサンプルグラフ構造特徴及び前記サンプルターゲットグラフにおける複数のサンプルユーザノードのサンプルユーザ特徴を取得するステップであって、前記サンプルユーザノードは、前記サンプルユーザIDに対応するノードであり、前記サンプルグラフは、サンプルグループにおける複数のサンプルユーザID間の関連関係に基づいて構築される、ステップと、
    前記グループタイプ識別モデルを呼び出し、前記サンプルグラフ構造特徴及び前記複数のサンプルユーザノードのサンプルユーザ特徴に基づいて、前記サンプルグループの予測タイプを識別するステップと、
    前記サンプルタイプと前記予測タイプとの差に基づいて、前記グループタイプ識別モデルを訓練するステップと、を含む、請求項7乃至11の何れかに記載の方法。
  13. グラフ構造特徴は、複数のユーザノードのうちの任意の2つのユーザノード間の関連度を含み、
    前記第1のターゲットグラフの前記グラフ構造特徴を取得するステップは、
    前記ターゲットグループにおける任意の2つのユーザIDの共通出現回数を取得するステップであって、前記共通出現回数は、複数の参照期間内に、前記任意の2つのユーザIDに基づいて前記ターゲットグループにおいて共通してコンテンツを投稿した回数である、ステップと、
    前記共通出現回数に基づいて、前記任意の2つのユーザID間の関連度を決定するステップであって、前記関連度と前記共通出現回数とは正の相関関係にある、ステップと、を含む、請求項1乃至12の何れかに記載の方法。
  14. 前記複数の第1のユーザノードから複数の第2のユーザノードを選択するステップは、
    前記複数の第1のユーザノードの数と参照比率とを乗算して参照数を取得するステップと、
    前記複数の第1のユーザノードのアテンションパラメータを大きい順に並び替え、並び替えられた上位の参照数のアテンションパラメータを選択し、選択されたアテンションパラメータに対応する第1のユーザノードを前記第2のユーザノードとするステップと、を含む、請求項1乃至13の何れかに記載の方法。
  15. ユーザ特徴は、ユーザ行動特徴及びユーザ属性特徴を含み、
    前記第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得するステップは、
    登録された複数のユーザIDを含むユーザソーシャルネットワークを取得するステップと、
    前記ユーザソーシャルネットワークに基づいて、前記複数のユーザIDのユーザ行動特徴を取得するステップと、
    前記複数のユーザIDに対応するユーザ画像情報に基づいて、前記複数のユーザIDのユーザ属性特徴を取得するステップと、を含む、請求項1乃至14の何れかに記載の方法。
  16. グループタイプの識別装置であって、
    第1のターゲットグラフの第1のグラフ構造特徴及び前記第1のターゲットグラフにおける複数の第1のユーザノードの第1のユーザ特徴を取得する特徴取得モジュールであって、前記第1のユーザノードは、ターゲットグループにおけるユーザIDに対応するノードであり、前記第1のターゲットグラフは、前記複数の第1のユーザノード間の関連関係に基づいて構築される、特徴取得モジュールと、
    前記第1のグラフ構造特徴及び複数の第1のユーザ特徴に基づいて、各第1のユーザノードのアテンションパラメータを取得する第1のアテンション取得モジュールであって、前記アテンションパラメータは、前記第1のターゲットグラフにおける前記第1のユーザノードの重要度を表す、第1のアテンション取得モジュールと、
    前記複数の第1のユーザノードから複数の第2のユーザノードを選択する第1のスクリーニングモジュールであって、前記複数の第2のユーザノードのアテンションパラメータは、選択されていない第1のユーザノードのアテンションパラメータよりも大きい、第1のスクリーニングモジュールと、
    前記複数の第2のユーザノードの第1のユーザ特徴及び第2のターゲットグラフの第2のグラフ構造特徴に基づいて、前記ターゲットグループのグループタイプを識別するタイプ識別モジュールであって、前記第2のターゲットグラフは、前記複数の第2のユーザノード間の関連関係に基づいて構築される、タイプ識別モジュールと、を含む、装置。
  17. プロセッサと、少なくとも1つのコンピュータプログラムが記憶されたメモリと、を含むコンピュータ機器であって、
    前記少なくとも1つのコンピュータプログラムは、請求項1乃至15の何れかに記載のグループタイプの識別方法を実現するように、前記プロセッサによりロードされて実行される、コンピュータ機器。
  18. 請求項1乃至15の何れかに記載のグループタイプの識別方法を実現するように、プロセッサによりロードされて実行される、コンピュータプログラム。
JP2023519589A 2021-01-04 2021-12-27 グループタイプの識別方法、装置、コンピュータ機器及びコンピュータプログラム Pending JP2023544022A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202110002127.7 2021-01-04
CN202110002127.7A CN114764480A (zh) 2021-01-04 2021-01-04 群组类型识别方法、装置、计算机设备及介质
PCT/CN2021/141553 WO2022143505A1 (zh) 2021-01-04 2021-12-27 群组类型识别方法、装置、计算机设备及介质

Publications (1)

Publication Number Publication Date
JP2023544022A true JP2023544022A (ja) 2023-10-19

Family

ID=82260211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023519589A Pending JP2023544022A (ja) 2021-01-04 2021-12-27 グループタイプの識別方法、装置、コンピュータ機器及びコンピュータプログラム

Country Status (4)

Country Link
US (1) US11916853B2 (ja)
JP (1) JP2023544022A (ja)
CN (1) CN114764480A (ja)
WO (1) WO2022143505A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116680633B (zh) * 2023-05-06 2024-01-26 国网四川省电力公司广安供电公司 基于多任务学习的异常用户检测方法、系统及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130055099A1 (en) * 2011-08-22 2013-02-28 Rose Yao Unified Messaging System with Integration of Call Log Data
US10305758B1 (en) * 2014-10-09 2019-05-28 Splunk Inc. Service monitoring interface reflecting by-service mode
US10592534B2 (en) * 2016-02-16 2020-03-17 Microsoft Technology Licensing Llc Automated aggregation of social contact groups
CN107770049A (zh) * 2017-10-23 2018-03-06 林楚莲 一种被邀请用户获取群组信息的方法及系统
US10565229B2 (en) * 2018-05-24 2020-02-18 People.ai, Inc. Systems and methods for matching electronic activities directly to record objects of systems of record
CN110083791B (zh) * 2019-05-05 2020-04-24 北京三快在线科技有限公司 目标群组检测方法、装置、计算机设备及存储介质
CN111738628B (zh) * 2020-08-14 2020-12-08 支付宝(杭州)信息技术有限公司 一种风险群组识别方法及装置

Also Published As

Publication number Publication date
US20230031045A1 (en) 2023-02-02
CN114764480A (zh) 2022-07-19
WO2022143505A1 (zh) 2022-07-07
US11916853B2 (en) 2024-02-27

Similar Documents

Publication Publication Date Title
TWI698770B (zh) 資源轉移監測方法、裝置、監測設備及儲存媒體
CN109872242B (zh) 信息推送方法和装置
WO2020093289A1 (zh) 资源推荐方法、装置、电子设备及存储介质
CN111222647A (zh) 联邦学习系统优化方法、装置、设备及存储介质
CN112084959B (zh) 一种人群图像处理方法及装置
CN113570030A (zh) 数据处理方法、装置、设备以及存储介质
CN112861963A (zh) 训练实体特征提取模型的方法、装置和存储介质
CN113052246B (zh) 用于训练分类模型及图像分类的方法和相关装置
CN110097004B (zh) 面部表情识别方法和装置
CN110245684B (zh) 数据处理方法、电子设备和介质
JP2023544022A (ja) グループタイプの識別方法、装置、コンピュータ機器及びコンピュータプログラム
CN110490295B (zh) 一种数据处理方法及处理装置
CN110855487A (zh) 网络用户相似度管理方法、装置及存储介质
CN114091551A (zh) 色情图像识别方法、装置、电子设备及存储介质
CN111062490B (zh) 一种包含隐私数据的网络数据的处理、识别方法及装置
CN106470215A (zh) 用户终端、服务器、未关注场景的消息推送系统及方法
CN109146122A (zh) 一种概率预测方法、装置、电子设备及计算机存储介质
CN111814051B (zh) 一种资源类型确定方法及装置
CN112036418A (zh) 用于提取用户特征的方法和装置
CN113886547A (zh) 基于人工智能的客户实时对话转接方法、装置和电子设备
CN108510071B (zh) 数据的特征提取方法、装置及计算机可读存储介质
CN112765022A (zh) 一种基于数据流的Webshell静态检测方法及电子设备
WO2019114481A1 (zh) 集群类型识别方法、装置、电子设备及存储介质
CN112132305A (zh) 节点类别确定方法、相关装置、设备及存储介质
CN112200170B (zh) 图像识别方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230329

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240521