JP7413438B2 - アカウントの親密度の生成方法、装置、電子機器及び記憶媒体 - Google Patents

アカウントの親密度の生成方法、装置、電子機器及び記憶媒体 Download PDF

Info

Publication number
JP7413438B2
JP7413438B2 JP2022078878A JP2022078878A JP7413438B2 JP 7413438 B2 JP7413438 B2 JP 7413438B2 JP 2022078878 A JP2022078878 A JP 2022078878A JP 2022078878 A JP2022078878 A JP 2022078878A JP 7413438 B2 JP7413438 B2 JP 7413438B2
Authority
JP
Japan
Prior art keywords
accounts
intimacy
account
graph
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022078878A
Other languages
English (en)
Other versions
JP2022106992A (ja
Inventor
シージェ ツァオ
ヤーナン リー
ブォレイ ホー
クンビン チェン
ウェイ ホー
フォン ホー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022106992A publication Critical patent/JP2022106992A/ja
Application granted granted Critical
Publication of JP7413438B2 publication Critical patent/JP7413438B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/18Commands or executable codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/216Handling conversation history, e.g. grouping of messages in sessions or threads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本開示は人工知能技術分野に関し、具体的には深層学習、クラウドコンピューティング及びビッグデータ技術分野であり、特にアカウントの親密度の生成方法、装置、電子機器及び記憶媒体に関する。
現在では、インスタントメッセージング(IM)のシーンでは、アカウントには複数の関係が存在しており、且つアカウント同士の関係は時間の経過とともに大きく変化し、例えば、オフィスIMシーンでは、アカウントは作業内容の変更に応じて新しい関係を確立する。アカウントの親密度はアカウント同士の関係を効果的に反映することができ、フレンド推薦などのサービスの実現に利便性を提供する。
関連技術では、アカウントの親密度の生成は十分正確ではない。
アカウントの親密度の生成方法、装置、電子機器及び記憶媒体を提供する。
第1の態様によれば、インスタントメッセージンググループ内のアカウントの集合を取得するステップと、予め設定された時間帯内の前記アカウント同士の通信頻度を取得するステップと、前記アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築するステップと、前記通信ネットワークグラフに基づいてグラフモデルを訓練して、前記グラフモデルによって出力されたアカウントのベクトル表現を得るステップと、前記アカウントのベクトル表現に基づいてアカウント同士の親密度を生成するステップと、を含むアカウントの親密度の生成方法を提供する。
第2の態様によれば、インスタントメッセージンググループ内のアカウントの集合を取得するための第1の取得モジュールと、予め設定された時間帯内の前記アカウント同士の通信頻度を取得するための第2の取得モジュールと、前記アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築するための構築モジュールと、前記通信ネットワークグラフに基づいてグラフモデルを訓練して、前記グラフモデルによって出力されたアカウントのベクトル表現を得るための訓練モジュールと、前記アカウントのベクトル表現に基づいてアカウント同士の親密度を生成するための生成モジュールと、を含むアカウントの親密度の生成装置を提供する。
第3の態様によれば、電子機器を提供し、前記電子機器は、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されるメモリとを含み、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが本開示の第1の態様に記載のアカウントの親密度の生成方法を実行できる。
第4の態様によれば、コンピュータ命令が記憶されている非一時的コンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は前記コンピュータに本開示の第1の態様に記載のアカウントの親密度の生成方法を実行させる。
第5の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムはプロセッサによって実行される際に本開示の第1の態様に記載のアカウントの親密度の生成方法を実現する。
なお、この部分で説明された内容は本開示の実施例の肝心又は重要な特徴を特定しようとするものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は以下の明細書によって分かりやすくなる。
図面は本解決案をよりよく理解するためのものであり、本開示を限定するものではない。
本開示の第1の実施例に係るアカウントの親密度の生成方法のフローチャートである。 本開示の第2の実施例に係るアカウントの親密度の生成方法のフローチャートである。 本開示の第3の実施例に係るアカウントの親密度の生成方法のフローチャートである。 本開示の実施例における例示的な通信ネットワークグラフである。 本開示の実施例に係るアカウントの親密度の生成方法のシーンの概略図である。 本開示の第1の実施例に係るアカウントの親密度の生成装置のブロック図である。 本開示の第2の実施例に係るアカウントの親密度の生成装置のブロック図である。 本開示の実施例に係るアカウントの親密度の生成方法を実現する電子機器のブロック図である。
以下、図面に合わせて本開示の例示的な実施例を説明し、理解を助けるために、本開示の実施例の様々な詳細が含まれており、それらを単なる例示的なものとして見なすべきである。従って、当業者であれば、本開示の範囲及び精神から逸脱しない限り、ここで説明された実施例に対して様々な変更と修正を行うことができる。同様に、明瞭かつ簡潔にするために、以下の説明では公知機能及び構造への説明を省略する。
人工知能(Artificial Intelligence、AIと略される)は人間の知能をシミュレート及び拡張する理論、方法、技術及びアプリケーションシステムを研究・開発する技術科学である。現在では、AI技術は自動化程度が高く、精度が高く、コストが低いという利点があり、幅広く利用されている。
深層学習(Deep Learning、DLと略される)は、機械学習(Machine Learning、MLと略される)分野における新しい研究の方向であり、サンプルデータの内的法則及び表現階層を学習し、これらの学習のプロセスで得た情報は、例えば文字、画像及び音声などのデータへの解釈に大きく役立つ。その最終的な目標は、機械が人間のように分析学習の能力を持ち、文字、画像及び音声などのデータを認識できるようにすることである。具体的な研究内容は主に、畳み込み演算に基づくニューロネットワークシステム、即ち畳み込みニューラルネットワークと、多層ニューロンに基づくオートエンコーダニューラルネットワークと、多層オートエンコーダニューラルネットワークの方式で事前訓練を行って、識別情報に合わせてニューラルネットワーク重みをさらに最適化するディープビリーフネットワークと、を含む。深層学習は検索技術、データマイニング、機械学習、機械翻訳、自然言語処理、マルチメディア学習、音声、推薦とカスタマイズ技術、及び他の関連分野においても多くの成果を出している。深層学習は視聴や思考などの人間の活動を機械にシミュレートさせ、パターン認識における複雑な課題を多数解決し、人工知能に関連する技術を大きく進歩させた。
クラウドコンピューティング(Cloud Computing)は利用されたデータ量に応じて料金を払うモードであり、こういうモードは利用可能で使いやすくかつ必要に応じたネットワークアクセスを提供し、構成可能なコンピューティングリソース共有プール(リソースはネットワーク、サーバ、記憶、アプリケーション、サービス)にアクセスし、これらのリソースは素早く提供することができ、わずかな管理作業を投入すればよく、或いはサービスプロバイダとのやり取りを最小限に抑えることができる。分散コンピューティング、並列コンピューティング、ユーティリティコンピューティング、ネットワークストレージ、仮想化、負荷分散、ホットスタンバイ冗長など、従来コンピュータ及びネットワーク技術が発展して融合する産物である。クラウドコンピューティングはコンピューティングをクライアントから「クラウド」に集中し、アプリケーションとしてインターネット経由でユーザに提供し、コンピューティングは、分散コンピューティングなどの技術により、複数台のコンピュータが共同で完成する。ユーザはアプリケーションの機能だけに注目すればよく、アプリケーションの実現形態に気にする必要がなく、アプリケーションの実現とアプリケーションはそのプロバイダによって完成され、ユーザは自身のニーズに応じて対応するアプリケーションを選択する。
ビッグデータ(Big Data)は、従来のデータベース管理ツールや従来のデータ処理アプリケーションの方法で処理し難い大型かつ複雑なデータセットであり、ビッグデータ技術の範囲はビッグデータの収集、記憶、検索、共有、伝送、分析及び可視化などを含み、容量が大きく、タイプが多く、アクセス速度が早く、応用する価値が高いことを主な特徴とするデータ集合であり、数量が膨大で、ソースが分散し、フォーマットが様々であるデータを収集、記憶及び関連分析し、その中に新しい知識を発見したり、新しい価値を創造したり、新しい能力を向上させたりする次世代の情報技術及びサービス業態に発展しつつある。ビッグデータは、分散アーキテクチャを用いて、大量のデータに対して分散データマイニングを行う必要があり、そのため、クラウドコンピューティングの分散処理、分散データベースとクラウドストレージ、仮想化技術に依存する必要があり、大規模、高複雑度のデータから情報を分析しかつマイニングする必要があり、これによって価値を発見しかつ動向を予測する。
以下、図面に合わせて本開示の実施例に係るアカウントの親密度の生成方法、装置、電子機器及び記憶媒体を説明する。
図1は本開示の第1の実施例に係るアカウントの親密度の生成方法のフローチャートである。
図1に示すように、本開示の実施例に係るアカウントの親密度の生成方法は、具体的に以下のステップS101~S105を含む。
S101、インスタントメッセージンググループ内のアカウントの集合を取得する。
具体的に、本開示の実施例に係るアカウントの親密度の生成方法の実行主体は本開示の実施例によって提供されるアカウントの親密度の生成装置であってもよく、当該アカウントの親密度の生成装置は、例えばデータ情報処理能力を備えるハードウェアデバイス及び/又は当該ハードウェアデバイスの動作を駆動するのに必要なソフトウェアである。選択可能に、実行主体は、例えばワークステーション、サーバ、コンピュータ、アカウント端末及び他のデバイスを含む。アカウント端末は携帯電話、コンピュータ、知的音声対話型デバイス、スマート家電、車載端末等などを含むが、これらに限定されない。
インスタントメッセージング(Instant Messaging、IMと略される)は、1つのリアルタイム通信システムであり、2人又は複数の人がネットワークを用いてテキストメッセージ、ファイル、音声及びビデオを送信し合って交流することを許容し、インスタントメッセージングは利用用途に応じて企業インスタントメッセージング及びウェブサイトインスタントメッセージングに分けられ、また、ロードされたオブジェクトに応じて携帯電話インスタントメッセージング及びPCインスタントメッセージングに分けられ、携帯電話インスタントメッセージングはショートメッセージを代表とし、PCインスタントメッセージングはウェブサイト、ビデオインスタントメッセージングを代表とする。
本開示の実施例では、IMシーンにおけるアカウント同士のリアルタイム通信を例として、アカウントの親密度の生成方法を説明する。ここで、インスタントメッセージンググループ内は複数のアカウントを含むことができ、取得するインスタントメッセージンググループ内のアカウントの集合は、具体的にアカウントニックネーム又はアカウント識別子(Identity document、IDと略される)などであってもよく、これによって集合内のアカウント同士の通信データを取得する。
S102、予め設定された時間帯内のアカウント同士の通信頻度を取得する。
具体的に、ステップS101で取得された集合内のアカウント同士の履歴通信データ(通信関係データのみを用い、具体的な通信内容には触れない)に基づいて、Spark(分散クラスタコンピューティングフレームワーク)時限タスクを介して、予め設定された時間帯内のアカウント同士の通信頻度を統計し、例えば、通信日数、通信回数などを統計する。予め設定された時間は例えば90日間又は120日間であり、具体的な数値はビジネスニーズに応じて設定すればよく、本開示では限定されない。選択可能に、取得された予め設定された時間帯内のアカウント同士の通信頻度を記憶することができ、例えば、アカウントの親密度を生成する時又は呼び出し側がアカウントの親密度を取得しようとする際にデータを直ちに呼び出せるように、データベース(例えばredis)に記憶することができる。
S103、アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築する。
具体的に、ステップS102で取得されたアカウント同士の通信頻度に基づいて通信ネットワークグラフを構築し、例えば、アカウントをノードとし、アカウント同士の通信頻度を辺重みとし、networkx(グラフ理論)を利用して通信ネットワークグラフを構築し、ノード間の到達可能な最短パス、媒介中心性及び到達可能な最短距離などの通信ネットワークグラフの属性を計算する。networkxは、python言語で書かれたソフトウェアツールキットであり、アカウントが複雑なネットワークを作成、操作及び学習することを容易にする。networkxを利用すれば、標準化されたデータフォーマット及び標準化されていないデータフォーマットでネットワークを記憶したり、様々なランダムネットワーク及びクラシックネットワークを生成したり、ネットワーク構造を分析したり、ネットワークモデルを作成したり、新しいネットワークアルゴリズムを設計したり、ネットワーク描画を行ったりすることができる。
S104、通信ネットワークグラフに基づいてグラフモデルを訓練して、グラフモデルによって出力されたアカウントのベクトル表現を得る。
具体的に、ベクトル表現(Embedding)は、離散変数を連続ベクトル表現に変換する方式であり、離散オブジェク(例えば文字や単語)から実数ベクトルへのマッピングであり、1つの高次元ベクトルと見なすことができる。通常、ベクトル内の各次元は決まった意味を持っておらず、機械学習が利用したのはベクトルの位置及び互いの距離を利用する。ニューラルネットワークでは、Embeddingは離散変数の空間次元数を減らすことができるだけではなく、当該変数を有意義に表すことができる。
ステップS103で構築された通信ネットワークグラフに基づいて、グラフモデルを訓練して、グラフモデルによって出力されたアカウントのベクトル表現を得て、さらには通信ネットワークグラフ内の各アカウントのベクトル表現を得る。本開示の実施例では、グラフモデルは具体的にNode2Vecグラフモデル及びグラフ注意力(Graph Attention)モデルのうちの少なくとも1つなどを含むが、これらに限定されない。
選択可能に、Node2Vecグラフモデルによって出力されたアカウントのベクトル表現、及びグラフ注意モデルによって出力されたアカウントのベクトル表現に対して線型結合を行って、グラフモデルによって出力されたアカウントのベクトル表現を得ることができる。
Node2Vecグラフモデルに対して、通信ネットワークグラフをNode2Vecグラフモデルに入力し、ランダムウォークという方式により、通信ネットワークグラフ構造において一連のパス(path)を生成し、その後、教師なし方式によって確率的勾配降下法を行い、これによってNode2Vecグラフモデルは各ノード(即ちアカウント)のベクトル表現を出力する。
グラフ注意モデルに対して、通信ネットワークグラフ内のアカウント同士の通信関係を訓練集合としてグラフ注意モデルを訓練する。具体的な実施では、存在している一部の辺関係を通信ネットワークグラフから抽出し、例えばアカウントAとアカウントBとの間に通信関係が存在し、検証集合として、訓練済みのグラフ注意モデルはノード自体及び近傍情報を統合して2つのノードの間に接続辺が存在するか否かを判断する。訓練済みのグラフ注意モデルは通信ネットワークグラフ内のアカウント同士の通信関係に基づいてアカウントのベクトル表現を出力する。
S105、アカウントのベクトル表現に基づいてアカウント同士の親密度を生成する。
具体的に、ステップS104で得られたアカウントのベクトル表現に基づいてアカウント同士の親密度を生成する。
以上により、本開示の実施例に係るアカウントの親密度の生成方法は、インスタントメッセージンググループ内のアカウントの集合を取得し、予め設定された時間帯内のアカウント同士の通信頻度を取得し、アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築し、通信ネットワークグラフに基づいてグラフモデルを訓練して、グラフモデルによって出力されたアカウントのベクトル表現を得て、アカウントのベクトル表現に基づいてアカウント同士の親密度スコアを生成する。アカウント同士の通信頻度に基づいて構築された通信ネットワークグラフを用いてグラフモデルを訓練し、ダウンストリームサービスと連携する必要がなく、独立してアカウントの親密度モデルを構築することができ、同時に、本開示の実施例は、グラフニューラルネットワークに基づいてアカウントの親密度関係をモデリングし、グラフモデルを効果的に利用してアカウント同士の関連を掘り出し、通信ネットワークグラフにおけるローカル及びグローバル特徴を捉えることができ、アカウントの親密度を生成する精度を向上させる。
図2は本開示の第2の実施例に係るアカウントの親密度の生成方法のフローチャートである。
図2に示すように、図1に示す実施例のもとに、本開示の実施例に係るアカウントの親密度の生成方法は具体的に以下のステップS201~S207を含むことができる。
S201、インスタントメッセージンググループ内のアカウントの集合を取得する。
S202、予め設定された時間帯内のアカウント同士の通信頻度を取得する。
具体的に、本実施例におけるステップS201~S202は上記実施例におけるステップS101~S102と同じであり、ここで詳しい説明を省略する。
S203、アカウント同士の通信頻度に基づいてアカウントの総通信頻度を計算する。
具体的に、ステップS202で取得されたアカウント同士の通信頻度に基づいてアカウントの総通信頻度を計算する。例えば、通信日数で通信頻度を表す場合、アカウントAと、アカウントB、アカウントC、アカウントDとの通信日数はそれぞれ1、3、4日間であり、したがって、アカウントAの総通信日数、即ち総通信頻度は1+3+4=8日間である。
S204、総通信頻度が予め設定された通信頻度閾値以下であるアカウントをアカウントの集合から取り除く。
具体的に、ステップS203で得られた、総通信頻度が予め設定された通信頻度閾値以下であるアカウントをアカウントの集合から取り除き、条件を満たすアカウントを保留する。選択可能に、条件を満たすアカウント同士の通信頻度を訓練サンプルデータとして記憶し、予め設定された通信頻度閾値は、必要に応じて設定することができ、本開示では限定されない。例えば、90日間以内に総通信頻度が1日間以下であるアカウントを取り除き、総通信頻度が1日間より大きいアカウントを保留し、アカウントの偶発的な通信によって生成されたデータを訓練サンプルデータ内に組み入れることを回避し、データの騒音を低減し、アカウント同士の親密度の生成精度を向上させる。
S205、アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築する。
S206、通信ネットワークグラフに基づいてグラフモデルを訓練して、グラフモデルによって出力されたアカウントのベクトル表現を得る。
S207、アカウントのベクトル表現に基づいてアカウント同士の親密度を生成する。
具体的に、本実施例におけるステップS205~S207は上記実施例におけるステップS103~S105と同じであり、ここで詳しい説明を省略する。
さらに、本開示の実施例に係るアカウントの親密度の生成方法は、以下のステップS208~S209をさらに含むことができる。
S208、通信ネットワークグラフに基づいて、コミュニティ分割アルゴリズムを用いてアカウントが所属するコミュニティを決定する。
具体的に、ステップS205で構築された通信ネットワークグラフはコミュニティ分割アルゴリズム(例えば、Louvainアルゴリズム)を用いて教師なしのコミュニティ分割を行って、アカウントが所属するコミュニティを決定する。具体的な実施では、異なるコミュニティはコミュニティタグで識別することができ、コミュニティタグは、アカウントが所属するチームおよび趣味など既存のデータ情報であってもよいし、ステップS205で構築された通信ネットワークグラフに基づいてコミュニティ分割アルゴリズムを用いて決定されたものであってもよい。本開示の実施例では、通信ネットワークグラフに基づいて、Louvainアルゴリズムを用いてコミュニティ分割を行って、アカウントが所属するコミュニティであるコミュニティ分割結果を得ることで、各アカウントが所属するコミュニティを決定する。選択可能に、決定された各アカウントが所属するコミュニティを記憶することができ、例えば、呼び出し側がアカウントの親密度を取得しようとする際にデータを直ちに呼び出せるように、データベース(例えばredis)内に記憶することができる。
S209、アカウント同士の親密度に基づいてアカウント同士の親密度レベルを決定する。
具体的に、ステップS207で生成されたアカウント同士の親密度に基づいてアカウント同士の親密度レベルを決定する。選択可能に、具体的な実施では、アカウント同士の親密度レベルはアカウント同士の親密度に対応する親密度スコアの値に基づいて決定することができ、各親密度レベルは1つの親密度スコアのスコア区間に対応し、具体的なレベルおよびスコア区間は本開示では限定されない。例えば、正規化された親密度スコアに対して、親密度レベルは以下の表1の方式で区分することができる。
選択可能に、決定されたアカウント同士の親密度レベルを記憶することができ、例えば、呼び出し側がアカウントの親密度を取得しようとする際にデータを直ちに呼び出せるように、データベース(例えばredis)内に記憶することができる。
さらに、図3に示すように、図2に示す実施例のもとに、グラフモデルはNode2Vecグラフモデル及びグラフ注意モデルのうちの少なくとも1つを含み、「アカウントのベクトル表現に基づいてアカウント同士の親密度を生成する」という上記ステップS207は具体的に以下のステップS301~S303を含むことができる。
S301、Node2Vecグラフモデルによって出力されたアカウントのベクトル表現に基づいてアカウント同士の第1のコサイン類似度を計算する。
具体的に、2つ以上のアカウント組み合せに対して、Node2Vecグラフモデルによって出力されたアカウントのベクトル表現に基づいてアカウント同士の第1のコサイン類似度、即ち2つのアカウントのEmbeddingの余弦の値を計算する。ここで、アカウント同士の第1のコサイン類似度はアカウント同士の親密度を反映することができ、第1のコサイン類似度の値が大きいほど、一対のアカウントのEmbeddingが近いことを表し、即ちアカウント同士の親密度が高い。
S302、グラフ注意モデルによって出力されたアカウントのベクトル表現に基づいてアカウント同士の第2のコサイン類似度を計算する。
具体的に、2つ以上のアカウント組み合せに対して、グラフ注意モデルによって出力されたアカウントのベクトル表現に基づいてアカウント同士の第2のコサイン類似度を計算する。第2のコサイン類似度の計算方法及び作用は第1のコサイン類似度と同じであり、ここで詳しい説明を省略する。
S303、第1のコサイン類似度及び第2のコサイン類似度に基づいてアカウント同士の親密度を生成する。
具体的に、ステップS301で計算して得られた第1のコサイン類似度及びS302で計算して得られた第2のコサイン類似度に基づいてアカウント同士の親密度を生成する。本開示の実施例では、第1のコサイン類似度及び第2のコサイン類似度に対して線形演算を行うことでアカウント同士の親密度を得ることができる。例えば、第1のコサイン類似度がaで、第2のコサイン類似度がbである場合、非線形変換関数Sigmoidを重み調整モジュール、即ちsigmoid(c * a + d * b)とし、アカウント同士の親密度を生成し、パラメータc及びdは先験的経験に基づいて決定することができ、例えば、本開示の実施例では、c=d=0.5、具体的な取り得る値は本開示では限定されない。
さらに、上記実施例のもとに、「アカウントのベクトル表現に基づいてアカウント同士の親密度を生成する」という上記ステップS207は具体的に、アカウントのベクトル表現及びアカウントの統計的特徴に基づいてアカウント同士の親密度を生成するステップを含むことができる。
具体的に、アカウントのベクトル表現及びアカウントの統計的特徴を統合し、重み調整モジュールによって、アカウント同士の親密度を生成する。
統計的特徴は具体的に通信頻度、到達可能な最短距離、到達可能な最短パス、媒介中心性、及び最後の通信時間と現在時間との時間差などの特徴のうちのいずれか1つ又は複数を含む。
なお、到達可能な最短距離Nは、通信ネットワークグラフ内の2つのノードの間で、最少のN個の中間ノードを通過して到達できるという意味である。到達可能な最短パスは、通信ネットワークグラフ内のノードの最短パスであり、なお、上記到達可能な最短パスに1つのノード系列が対応していることは容易に理解できる。媒介中心性は、1つのノードに対して、当該ノードがグラフ全体において、いくつかのペアのノードの最短パスにあるということを表す。具体的な実施では、到達可能な最短パス、到達可能な最短距離及び媒介中心性などの統計的特徴は、networkxツールキットを介して通信ネットワークグラフから得ることができ、図4に示す通信ネットワークグラフのように、ノード「1」及びノード「4」の到達可能な最短距離は2であり、到達可能な最短パスは1-5-4である。最後の通信時間と現在時間との時間差は、アカウントの履歴通信データに基づいて決定することができる。選択可能に、決定された各アカウントの統計的特徴を記憶することができ、例えば、呼び出し側がアカウントの親密度を取得しようとする際にデータを直ちに呼び出せるように、データベース(例えばredis)に記憶することができる。
当業者であれば、呼び出し側がアカウントの親密度を取得しようとする時、データベースに記憶されたアカウントの親密度、親密度レベル、統計的特徴及び所属するコミュニティを取得して、呼び出し側に返すことができる。
以上により、本開示の実施例に係るアカウントの親密度の生成方法は、インスタントメッセージンググループ内のアカウントの集合を取得し、予め設定された時間帯内のアカウント同士の通信頻度を取得し、アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築し、通信ネットワークグラフに基づいてグラフモデルを訓練して、グラフモデルによって出力されたアカウントのベクトル表現を得て、アカウントのベクトル表現に基づいてアカウント同士の親密度を生成する。アカウント同士の通信頻度に基づいて構築された通信ネットワークグラフを用いてグラフモデルを訓練し、ダウンストリームサービスと連携する必要がなく、独立してアカウントの親密度モデルを構築することができ、同時に、本開示の実施例は、グラフニューラルネットワークに基づいてアカウントの親密度関係をモデリングし、グラフモデルを効果的に利用してアカウント同士の関連を掘り出し、通信ネットワークグラフにおけるローカルとグローバル特徴を捉えることができ、アカウントの親密度を生成する精度を向上させる。通信ネットワークグラフに基づいて、コミュニティ分割アルゴリズムを用いてアカウントが所属するコミュニティを決定し、アカウントのソーシャルネットワーク分析結果を決定することができ、さらにアカウントの親密度の生成精度を向上させる。
本開示の実施例に係るアカウントの親密度の生成方法を明確に説明するために、以下、図5に合わせて詳しく説明する。
図5は本開示の実施例に係るアカウントの親密度の生成方法のシーンの概略図である。図5に示すように、本開示の実施例に係るアカウントの親密度の生成方法は、オンラインサービス及びオフラインモデル更新という2つ段階に分けられる。オンラインサービス段階では、アカウントが親密度取得要求を開始すると、サーバは、オフラインモデル更新段階で生成された当該アカウントに関連するアカウント同士の親密度、アカウント同士の親密度レベル、アカウントが所属するコミュニティ、及びアカウントの統計的特徴などのアカウントの親密度関連データをデータベースから直接呼び出して呼び出し側へ返す。オフラインモデル更新段階では、アカウント同士の通信頻度を利用して通信ネットワークグラフを構築し、通信ネットワークグラフに対応する統計的特徴を計算し、通信ネットワークグラフに基づいてNode2Vecグラフモデル及びグラフ注意モデルを訓練して、それぞれ2つのモデルによって出力されたベクトル表現を得て、2つのモデルによって出力されたベクトル表現及び統計的特徴を重み調整モジュールに入力して、アカウント同士の親密度を生成し、アカウント同士の親密度に基づいてアカウント同士の親密度レベルを決定し、通信ネットワークグラフに基づいて、コミュニティ分割アルゴリズムを用いてアカウントが所属するコミュニティなどを決定し、アカウント同士の親密度、アカウント同士の親密度レベル、アカウントが所属するコミュニティ、及びアカウントの統計的特徴などのアカウントの親密度関連データをデータベース内に記憶する。
図6は本開示の第1の実施例に係るアカウントの親密度の生成装置のブロック図である。
図6に示すように、本開示の実施例に係るアカウントの親密度の生成装置600は、第1の取得モジュール601、第2の取得モジュール602、構築モジュール603、訓練モジュール604及び生成モジュール605を含む。
第1の取得モジュール601は、インスタントメッセージンググループ内のアカウントの集合を取得するように構成される。
第2の取得モジュール602は、予め設定された時間帯内のアカウント同士の通信頻度を取得するように構成される。
構築モジュール603は、アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築するように構成される。
訓練モジュール604は、通信ネットワークグラフに基づいてグラフモデルを訓練して、グラフモデルによって出力されたアカウントのベクトル表現を得るように構成される。
生成モジュール605は、アカウントのベクトル表現に基づいてアカウント同士の親密度を生成するように構成される。
なお、アカウントの親密度の生成方法の実施例に対する上記説明は、本開示の実施例に係るアカウントの親密度の生成装置にも適用され、具体的なプロセスは省略する。
以上により、本開示の実施例に係るアカウントの親密度の生成装置は、インスタントメッセージンググループ内のアカウントの集合を取得し、予め設定された時間帯内のアカウント同士の通信頻度を取得し、アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築し、通信ネットワークグラフに基づいてグラフモデルを訓練して、グラフモデルによって出力されたアカウントのベクトル表現を得て、アカウントのベクトル表現に基づいてアカウント同士の親密度を生成する。アカウント同士の通信頻度に基づいて構築された通信ネットワークグラフを用いてグラフモデルを訓練し、ダウンストリームサービスと連携する必要がなく、独立してアカウントの親密度モデルを構築することができ、同時に、本開示の実施例は、グラフニューラルネットワークに基づいてアカウントの親密度関係をモデリングし、グラフモデルを効果的に利用してアカウント同士の関連を掘り出し、通信ネットワークグラフにおけるローカルとグローバル特徴を捉えることができ、アカウントの親密度を生成する精度を向上させる。
図7は本開示の第2の実施例に係るアカウントの親密度の生成装置のブロック図である。
図7に示すように、本開示の実施例に係るアカウントの親密度の生成装置700は、第2の取得モジュール701、第2の取得モジュール702、構築モジュール703、訓練モジュール704及び生成モジュール705を含む。
第1の取得モジュール701は上記実施例における第1の取得モジュール601と同じ構造及び機能を有し、第2の取得モジュール702は前の実施例における第2の取得モジュール602と同じ構造及び機能を有し、構築モジュール703は前の実施例における構築モジュール603と同じ構造及び機能を有し、訓練モジュール704は前の実施例における訓練モジュール604と同じ構造及び機能を有し、生成モジュール705は前の実施例における生成モジュール605と同じ構造及び機能を有する。
さらに、本開示の実施例に係るアカウントの親密度の生成装置700は、アカウント同士の通信頻度に基づいてアカウントの総通信頻度を計算するための計算モジュールと、総通信頻度が予め設定された通信頻度閾値以下であるアカウントをアカウントの集合から取り除くための除去モジュールと、をさらに含む。
さらに、グラフモデルはNode2Vecグラフモデル及びグラフ注意モデルのうちの少なくとも1つを含み、生成モジュール705は具体的に、Node2Vecグラフモデルによって出力されたアカウントのベクトル表現に基づいてアカウント同士の第1のコサイン類似度を計算するための第1の計算ユニットと、グラフ注意モデルによって出力されたアカウントのベクトル表現に基づいてアカウント同士の第2のコサイン類似度を計算するための第2の計算ユニットと、第1のコサイン類似度及び第2のコサイン類似度に基づいてアカウント同士の親密度を生成するための第1の生成ユニットと、を含むことができる。
さらに、生成モジュール705は具体的に、アカウントのベクトル表現及びアカウントの統計的特徴に基づいてアカウント同士の親密度を生成するための第2の生成ユニットを含むことができる。
さらに、統計的特徴は、通信頻度、到達可能な最短距離、到達可能な最短パス、媒介中心性、及び最後の通信時間と現在時間との時間差のうちのいずれか1つ以上を含む。
さらに、本開示の実施例に係るアカウントの親密度の生成装置700は、通信ネットワークグラフに基づいて、コミュニティ分割アルゴリズムを用いてアカウントが所属するコミュニティを決定するための第1の決定モジュール706をさらに含むことができる。
さらに、本開示の実施例に係るアカウントの親密度の生成装置700はアカウント同士の親密度に基づいてアカウント同士の親密度レベルを決定するための第2の決定モジュールをさらに含むことができる。
以上により、本開示の実施例に係るアカウントの親密度の生成装置は、インスタントメッセージンググループ内のアカウントの集合を取得し、予め設定された時間帯内のアカウント同士の通信頻度を取得し、アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築し、通信ネットワークグラフに基づいてグラフモデルを訓練して、グラフモデルによって出力されたアカウントのベクトル表現を得て、アカウントのベクトル表現に基づいてアカウント同士の親密度を生成する。アカウント同士の通信頻度に基づいて構築された通信ネットワークグラフを用いてグラフモデルを訓練し、ダウンストリームサービスと連携する必要がなく、独立してアカウントの親密度モデルを構築することができ、同時に、本開示の実施例はグラフニューラルネットワークに基づいてアカウントの親密度関係をモデリングし、グラフモデルを効果的に利用してアカウント同士の関連を掘り出し、通信ネットワークグラフにおけるローカルとグローバル特徴を捉えることができ、アカウントの親密度を生成する精度を向上させる。通信ネットワークグラフに基づいて、コミュニティ分割アルゴリズムを用いてアカウントが所属するコミュニティを決定し、アカウントのソーシャルネットワーク分析結果を決定することができ、さらにアカウントの親密度の生成精度を向上させる。
本開示の技術案では、関わるアカウント個人情報の取得、記憶及び応用などは、いずれも関連する法規制の規定に合致しており、公序良俗に反しない。
本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体及びコンピュータプログラムをさらに提供する。
図8は本開示の例示的な実施例を実施できる電子機器800の例示的なブロック図を示す。電子機器はラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセッサ、携帯電話、スマートフォン、ウェアラブルデバイス、他の類似する計算デバイスなどの様々な形態のモバイル装置を表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本出願の実現を制限することを意図したものではない。
図8に示すように、機器800は、リードオンリーメモリ(ROM)802に記憶されるコンピュータプログラム又は記憶ユニット807からランダムアクセスメモリ(RAM)803内にロードされるコンピュータプログラムに基づいて様々な適切な動作と処理を実行できる計算ユニット801を含む。RAM803は、機器800の操作に必要な様々なプログラム及びデータを含むことができる。計算ユニット801、ROM802及びRAM803はバスを介して804互いに接続される。入力/出力(I/O)インターフェース805は同様にバス804に接続される。
キーボード、マウスなどの入力ユニット806と、各種類のタイプのモニタ、スピーカーなどの出力ユニット807と、磁気ディスク、光ディスクなどの記憶ユニット808と、ネットワークカード、モデム、無線通信送受信機などの通信ユニット809とを含む機器800内の複数の部品はI/Oインターフェース805に接続される。通信ユニット809は、機器800がインターネットなどのコンピュータネットワーク及び/又は様々なテレコムネットワークを介して他の機器と情報/データを交換することを許容する。
計算ユニット801は処理と計算能力を有する様々な汎用及び/又は専用処理コンポーネントであってもよい。計算ユニット801の一部の例は、中央処理装置(CPU)、グラフィックス処理装置(GPU)、様々な専用の人工知能(AI)計算チップ、機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタル信号プロセッサ(DSP)、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット801は上記説明された各方法及び処理、例えば図1~図5に示すアカウントの親密度の生成方法を実行する。例えば、いくつかの実施例では、アカウントの親密度の生成方法は、記憶ユニット808など、機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。いくつかの実施例では、コンピュータプログラムの一部又はすべてはROM802及び/又は通信ユニット809を介して機器800にロード及び/又はインストールされる。コンピュータプログラムがRAM803にロードされ且つ計算ユニット801によって実行される際に、上記説明されたアカウントの親密度の生成方法の1つ又は複数のステップを実行することができる。代替的に、他の実施例では、計算ユニット801は他の任意の適切な方法(例えば、ファームウェアを介して)を介して、アカウントの親密度の生成方法を実行するように構成されてもよい。
本明細書の上記システム及び技術の様々な実施形態はデジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、コンプレックス・プログラマブル・ロジック・デバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施されてもよく、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び/又は解釈することができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置に伝送することができる。
本出願の方法を実行するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせで書くことができる。これらのプログラムコードは、プロセッサ又がコントローラによって実行された際に、フローチャート及び/又はブロック図によって規定された機能/動作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供することができる。プログラムコードは、完全に機械上で実行され、部分的に機械上で実行され、スタンドアロンソフトウェアパッケージとして、部分的に機械上で実行され、かつ部分的にリモート機械上で実行され、又は完全にリモート機械又はサーバ上で実行されてもよい。
本出願の文脈では、機械読み取り可能な媒体は、命令実行システム、装置、またはデバイスによって使用されたり、又は命令実行システム、装置、またはデバイスと組み合わせて使用されたりするプログラムを含むか、又は記憶できる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体または機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体システム、装置又はデバイス、または上記内容の任意の適切な組み合わせを含むことができるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、1つ又は複数のラインに基づく電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶装置、磁気記憶装置、または上記内容のいずれかの適切な組み合わせを含む。
ユーザとのインタラクションを提供するために、ここで説明されたシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)、並びにキーボードとポインティングデバイス(例えば、マウス又はトラックボール)を有し、ユーザは、当該キーボード及び当該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力または、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含む計算システム(例えば、データサーバとして)、又はミドルウェアコンポーネントを含む計算システム(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含む計算システム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されたシステム及び技術の実施形態とインタラクションを行う)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含む計算システムで実施することができる。任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット及びブロックチェーンネットワークを含む。
コンピュータシステムは、クライアントとサーバを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、かつ互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよく、分散システムのサーバであってもよく、或いはブロックチェーンと組み合わせたサーバであってもよい。
本開示の実施例によれば、本開示はコンピュータプログラムをさらに提供し、コンピュータプログラムはプロセッサによって実行される際に、本開示の上記実施例に示すアカウントの親密度の生成方法を実現する。
なお、上記様々な形式のフローを用いて、ステップを並べ替え、追加又は削除することができる。例えば、本発明開示に記載される各ステップは、本開示で開示された技術案の所望の結果を実現できる限り、並列的に実行されても良いし、順次実行されてもよく、異なる順序で実行されてもよいが、本明細書では限定されない。
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件や他の要因に応じて、様々な修正、組み合せ、一部の組み合せ及び代替を行うことができることを理解されたい。本開示の精神及び原則内で行われる修正、同等の置き換え及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims (15)

  1. アカウントの親密度の生成方法であって、
    インスタントメッセージンググループ内のアカウントの集合を取得するステップと、
    予め設定された時間帯内の前記アカウント同士の通信頻度を取得するステップと、
    前記アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築するステップと、
    前記通信ネットワークグラフに基づいてグラフモデルを訓練して、前記グラフモデルによって出力されたアカウントのベクトル表現を得るステップと、
    前記アカウントのベクトル表現に基づいてアカウント同士の親密度を生成するステップと、を含み、
    前記グラフモデルはNode2Vecグラフモデル及びグラフ注意モデルを含み、
    前記アカウントのベクトル表現に基づいてアカウント同士の親密度を生成するステップは、
    前記Node2Vecグラフモデルによって出力された前記アカウントのベクトル表現に基づいてアカウント同士の第1のコサイン類似度を計算するステップと、
    前記グラフ注意モデルによって出力された前記アカウントのベクトル表現に基づいてアカウント同士の第2のコサイン類似度を計算するステップと、
    前記第1のコサイン類似度及び前記第2のコサイン類似度に基づいて前記アカウント同士の親密度を生成するステップと、を含む、
    アカウントの親密度の生成方法。
  2. 前記アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築するステップの前に、
    前記アカウント同士の通信頻度に基づいてアカウントの総通信頻度を計算するステップと、
    前記総通信頻度が予め設定された通信頻度閾値以下であるアカウントを前記アカウントの集合から取り除くステップと、をさらに含む、
    請求項1に記載の生成方法。
  3. 前記アカウントのベクトル表現に基づいてアカウント同士の親密度を生成するステップは、
    前記アカウントのベクトル表現及びアカウントの統計的特徴に基づいて前記アカウント同士の親密度を生成するステップを含む、
    請求項1に記載の生成方法。
  4. 前記統計的特徴は、
    前記通信頻度、到達可能な最短距離、到達可能な最短パス、媒介中心性、及び最後の通信時間と現在時間との時間差のうちのいずれか1つ以上を含む、
    請求項に記載の生成方法。
  5. 前記通信ネットワークグラフに基づいて、コミュニティ分割アルゴリズムを用いてアカウントが所属するコミュニティを決定するステップをさらに含む、
    請求項1に記載の生成方法。
  6. 前記アカウント同士の親密度に基づいてアカウント同士の親密度レベルを決定するステップをさらに含む、
    請求項1に記載の生成方法。
  7. アカウントの親密度の生成装置であって、
    インスタントメッセージンググループ内のアカウントの集合を取得するための第1の取得モジュールと、
    予め設定された時間帯内の前記アカウント同士の通信頻度を取得するための第2の取得モジュールと、
    前記アカウント同士の通信頻度に基づいて通信ネットワークグラフを構築するための構築モジュールと、
    前記通信ネットワークグラフに基づいてグラフモデルを訓練して、前記グラフモデルによって出力されたアカウントのベクトル表現を得るための訓練モジュールと、
    前記アカウントのベクトル表現に基づいてアカウント同士の親密度を生成するための生成モジュールと、を含み、
    前記グラフモデルはNode2Vecグラフモデル及びグラフ注意モデルを含み、
    前記生成モジュールは、
    前記Node2Vecグラフモデルによって出力された前記アカウントのベクトル表現に基づいてアカウント同士の第1のコサイン類似度を計算するための第1の計算ユニットと、
    前記グラフ注意モデルによって出力された前記アカウントのベクトル表現に基づいてアカウント同士の第2のコサイン類似度を計算するための第2の計算ユニットと、
    前記第1のコサイン類似度及び前記第2のコサイン類似度に基づいて前記アカウント同士の親密度を生成するための第1の生成ユニットと、を含む、
    アカウントの親密度の生成装置。
  8. 前記アカウント同士の通信頻度に基づいてアカウントの総通信頻度を計算するための計算モジュールと、
    前記総通信頻度が予め設定された通信頻度閾値以下であるアカウントを前記アカウントの集合から取り除くための除去モジュールと、を含む、
    請求項に記載の生成装置。
  9. 前記生成モジュールは、
    前記アカウントのベクトル表現及びアカウントの統計的特徴に基づいて前記アカウント同士の親密度を生成するための第2の生成ユニットを含む、
    請求項に記載の生成装置。
  10. 前記統計的特徴は、
    前記通信頻度、到達可能な最短距離、到達可能な最短パス、媒介中心性、及び最後の通信時間と現在時間との時間差のうちのいずれか1つ以上を含む、
    請求項に記載の生成装置。
  11. 前記通信ネットワークグラフに基づいて、コミュニティ分割アルゴリズムを用いてアカウントが所属するコミュニティを決定するための第1の決定モジュールをさらに含む、
    請求項に記載の生成装置。
  12. 前記アカウント同士の親密度に基づいてアカウント同士の親密度レベルを決定するための第2の決定モジュールをさらに含む、
    請求項に記載の生成装置。
  13. 電子機器であって、
    少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが請求項1~のいずれか一項に記載のアカウントの親密度の生成方法を実行できる、
    電子機器。
  14. コンピュータ命令が記憶されている非一時的コンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は前記コンピュータに請求項1~のいずれか一項に記載のアカウントの親密度の生成方法を実行させる、
    非一時的コンピュータ読み取り可能な記憶媒体。
  15. コンピュータプログラムであって、前記コンピュータプログラムはプロセッサによって実行される際に、請求項1~のいずれか一項に記載のアカウントの親密度の生成方法を実現する、
    コンピュータプログラム。
JP2022078878A 2021-06-30 2022-05-12 アカウントの親密度の生成方法、装置、電子機器及び記憶媒体 Active JP7413438B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110738468.0 2021-06-30
CN202110738468.0A CN113572679B (zh) 2021-06-30 2021-06-30 账户亲密度的生成方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
JP2022106992A JP2022106992A (ja) 2022-07-20
JP7413438B2 true JP7413438B2 (ja) 2024-01-15

Family

ID=78163208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022078878A Active JP7413438B2 (ja) 2021-06-30 2022-05-12 アカウントの親密度の生成方法、装置、電子機器及び記憶媒体

Country Status (5)

Country Link
US (1) US20220286416A1 (ja)
EP (1) EP4033734A3 (ja)
JP (1) JP7413438B2 (ja)
KR (1) KR20220070177A (ja)
CN (1) CN113572679B (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195652A1 (en) 2007-02-08 2008-08-14 Samsung Electronics Co. Ltd. User interface forming method and apparatus based on human relations for mobile terminal
JP2013003635A (ja) 2011-06-13 2013-01-07 Sony Corp 情報処理装置、情報処理方法及びプログラム
JP2014067358A (ja) 2012-09-27 2014-04-17 Konami Digital Entertainment Co Ltd メッセージ表示装置、管理サーバ、メッセージ表示制御方法およびプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559407B (zh) * 2013-11-14 2016-08-31 北京航空航天大学深圳研究院 一种用于度量有向加权图中节点亲密度的推荐系统及方法
US10127300B2 (en) * 2013-12-23 2018-11-13 International Business Machines Corporation Mapping relationships using electronic communications data
CN105335438A (zh) * 2014-08-11 2016-02-17 天津科技大学 一种基于局部最短回路的社会网络群体划分方法
US10002292B2 (en) * 2015-09-30 2018-06-19 Microsoft Technology Licensing, Llc Organizational logo enrichment
CN109660582B (zh) * 2017-10-09 2021-05-11 腾讯科技(深圳)有限公司 帐号信号的推送方法、装置、存储介质和电子设备
CN109218169B (zh) * 2018-10-12 2020-12-22 广州酷狗计算机科技有限公司 即时通讯方法、装置及存储介质
CN109933666B (zh) * 2019-03-18 2022-12-30 西安电子科技大学 一种好友自动分类方法、装置、计算机设备和存储介质
CN110097125B (zh) * 2019-05-07 2022-10-14 郑州轻工业学院 一种基于嵌入表示的跨网络账户关联方法
CN110515986B (zh) * 2019-08-27 2023-01-06 腾讯科技(深圳)有限公司 一种社交网络图的处理方法、装置及存储介质
CN111192153B (zh) * 2019-12-19 2023-08-29 浙江大搜车软件技术有限公司 人群关系网络构建方法、装置、计算机设备和存储介质
CN111222049B (zh) * 2020-01-08 2021-10-01 东北大学 语义增强的异构信息网络上Top-k相似度搜索方法
US11521516B2 (en) * 2020-05-15 2022-12-06 Capital One Services, Llc Nuance-based augmentation of sign language communication
CN111651671B (zh) * 2020-05-27 2023-11-21 腾讯科技(深圳)有限公司 用户对象推荐方法、装置、计算机设备和存储介质
CN111930957A (zh) * 2020-06-28 2020-11-13 国家计算机网络与信息安全管理中心 实体间亲密度的分析方法、装置、电子设备以及存储介质
CN111882446B (zh) * 2020-07-28 2023-05-16 哈尔滨工业大学(威海) 一种基于图卷积网络的异常账户检测方法
CN112132606B (zh) * 2020-09-10 2023-01-13 上海风秩科技有限公司 一种基于图注意力算法的动态调价方法及系统
CN112087371B (zh) * 2020-09-10 2022-11-18 北京百度网讯科技有限公司 一种即时通讯群组的搜索方法、装置、设备和存储介质
CN112468523B (zh) * 2021-02-02 2021-07-06 北京明略昭辉科技有限公司 异常流量检测方法、装置、设备及存储介质
US20220284340A1 (en) * 2021-03-02 2022-09-08 Adobe Inc. Determining digital personas utilizing data-driven analytics
US20220351142A1 (en) * 2021-04-30 2022-11-03 Slack Technologies, Inc. Group-based communication platform interaction graphing
US11647240B2 (en) * 2021-07-19 2023-05-09 Raters Group Ltd. Apparatus for outputting content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195652A1 (en) 2007-02-08 2008-08-14 Samsung Electronics Co. Ltd. User interface forming method and apparatus based on human relations for mobile terminal
JP2013003635A (ja) 2011-06-13 2013-01-07 Sony Corp 情報処理装置、情報処理方法及びプログラム
JP2014067358A (ja) 2012-09-27 2014-04-17 Konami Digital Entertainment Co Ltd メッセージ表示装置、管理サーバ、メッセージ表示制御方法およびプログラム

Also Published As

Publication number Publication date
EP4033734A2 (en) 2022-07-27
EP4033734A3 (en) 2022-12-14
KR20220070177A (ko) 2022-05-30
CN113572679B (zh) 2023-04-07
CN113572679A (zh) 2021-10-29
JP2022106992A (ja) 2022-07-20
US20220286416A1 (en) 2022-09-08

Similar Documents

Publication Publication Date Title
US11151324B2 (en) Generating completed responses via primal networks trained with dual networks
KR20220005416A (ko) 다항 관계 생성 모델의 트레이닝 방법, 장치, 전자 기기 및 매체
JP7498248B2 (ja) コンテンツ推薦とソートモデルトレーニング方法、装置、機器、記憶媒体及びコンピュータプログラム
CN112487173A (zh) 人机对话方法、设备和存储介质
CN113407850B (zh) 一种虚拟形象的确定和获取方法、装置以及电子设备
CN111339437B (zh) 一种团伙成员角色的确定方法、装置及电子设备
EP4123474A1 (en) Method for acquiring structured question-answering model, question-answering method and corresponding apparatus
CN113223121B (zh) 视频生成方法、装置、电子设备及存储介质
CN114020950A (zh) 图像检索模型的训练方法、装置、设备以及存储介质
CN115481227A (zh) 人机交互对话方法、装置以及设备
US11281867B2 (en) Performing multi-objective tasks via primal networks trained with dual networks
CN113902005A (zh) 语言模型的预训练方法、装置、设备和存储介质
CN113657468A (zh) 预训练模型的生成方法、装置、电子设备和存储介质
CN117351299A (zh) 图像生成及模型训练方法、装置、设备和存储介质
JP7413438B2 (ja) アカウントの親密度の生成方法、装置、電子機器及び記憶媒体
CN113366510A (zh) 经由训练的原始网络与双网络来执行多目标任务
CN113222414B (zh) 模型稳定性的评估方法、装置、电子设备和存储介质
CN115186738A (zh) 模型训练方法、装置和存储介质
CN114969444A (zh) 数据的处理方法、装置、电子设备和存储介质
CN113987154A (zh) 基于UniLM与对比学习的相似句生成模型训练方法及相关设备
CN113033205A (zh) 实体链接的方法、装置、设备以及存储介质
CN113961797A (zh) 资源推荐方法、装置、电子设备和可读存储介质
JP7379793B2 (ja) ノード表現生成方法、装置、電子デバイス及び可読記憶媒体
CN114255427B (zh) 视频理解方法、装置、设备以及存储介质
CN114066278B (zh) 物品召回的评估方法、装置、介质及程序产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220512

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231227

R150 Certificate of patent or registration of utility model

Ref document number: 7413438

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150