JP2022051665A - ユーザappインタレストの埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム - Google Patents

ユーザappインタレストの埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム Download PDF

Info

Publication number
JP2022051665A
JP2022051665A JP2021039379A JP2021039379A JP2022051665A JP 2022051665 A JP2022051665 A JP 2022051665A JP 2021039379 A JP2021039379 A JP 2021039379A JP 2021039379 A JP2021039379 A JP 2021039379A JP 2022051665 A JP2022051665 A JP 2022051665A
Authority
JP
Japan
Prior art keywords
app
user
interest
installation list
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021039379A
Other languages
English (en)
Other versions
JP7220733B2 (ja
Inventor
フイチェン チョン
Huiqiang Zhong
スチ シュ
Siqi Xu
チェンフイ リュウ
Chenhui Liu
リェンフイ チェン
Lianghui Chen
ジュン ファン
Jun Fang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022051665A publication Critical patent/JP2022051665A/ja
Application granted granted Critical
Publication of JP7220733B2 publication Critical patent/JP7220733B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/61Installation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)
  • Information Transfer Between Computers (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ユーザAPPインタレストの埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラムを提供する。【解決手段】方法は、APPにAPPID情報とAPPカテゴリ情報が含まれるステップと、既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得するステップと、を含む。【効果】ユーザの既存のAPPインストールリスト情報と最近のAPPインストールリスト情報を組み合わせることによって、ユーザAPPインタレスト埋め込みベクトルはユーザの長期的なインタレストと短期的なインタレストの両方を反映でき、APPIDとAPPカテゴリを組み合わせることによって、ロングテールAPPのスパース問題を軽減し、ユーザAPPインタレスト埋め込みベクトルの表現能力を向上させることができる。【選択図】図2

Description

本出願はコンピュータ技術分野に関し、具体的にビッグデータ技術分野に関し、特にユーザAPPインタレスト(アプリに関するユーザの興味)の埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラムに関する。
アプリ(APP)は、ユーザの個人情報に密接に関連している。ユーザは、自分のニーズ、好み、習慣に基づいてアプリストアからアプリをダウンロード、インストール、使用、アンインストールすることができる。ユーザのAPPインストール動作は、ユーザの個人情報、興味の好み、性格、ライフスタイルなどを反映する場合が多い。
現在、ユーザのAPPインストール特徴としては、one-hot特徴とAPPカテゴリ統計特徴を用いる。APPの数が多いため、one-hotを用いると、特徴スペースが非常に大きくなり、同時に、one-hotが異なるAPPの間の関連関係を表現できないので、ダウンストリームタスクの使用に影響を与えることがある。APPカテゴリの統計特徴を用いると、簡単で実行しやすいが、同じカテゴリに属するAPPの間の異なる情報を区別することができない。
上記の背景技術に言及された1つまたは複数の技術的問題を解決するために、本出願の実施形態は、ユーザAPPインタレストの埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラムを提供する。
第1態様において、本出願の実施形態は、ユーザAPPインタレストの埋め込み方法であって、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得し、前記APPにはAPPID情報とAPPカテゴリ情報が含まれるステップと、前記既存のAPPインストールリストと前記所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得するステップと、を含むユーザAPPインタレストの埋め込み方法を提供する。
第2態様において、本出願の実施形態は、ユーザAPPインタレストの埋め込み装置であって、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得するように構成される取得モジュールであって、前記APPにはAPPID情報とAPPカテゴリ情報が含まれる取得モジュールと、前記既存のAPPインストールリストと前記所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得するように構成される出力モジュールと、を備えるユーザAPPインタレストの埋め込み装置を提供する。
第3態様において、本出願の実施形態は、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信接続されるメモリと、を備え、メモリには少なくとも1つのプロセッサによって実行されることができる指令が格納され、指令は少なくとも1つのプロセッサによって実行されると、少なくとも1つのプロセッサに第1態様のいずれかの実施形態に記載の方法が実行される、電子機器を提供する。
第4態様において、本出願の実施形態は、コンピュータ指令が格納された非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ指令は前記コンピュータに第1態様のいずれかの実施形態に記載の方法を実行するために使用されるコンピュータ読み取り可能な記憶媒体を提供する。
第5態様において、本出願の実施形態はプロセッサにより実行されると、第1態様のいずれかの実施形態に記載の方法が実装される、コンピュータプログラムを提供する。
本出願の実施形態によるユーザAPPインタレストの埋め込み方法、装置、機器及び記憶媒体は、まずユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得し、次に、既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得し、ユーザの既存のAPPインストールリスト情報と最近のAPPインストールリスト情報を組み合わせることによって、ユーザAPPインタレスト埋め込みベクトルはユーザの長期的なインタレストと短期的なインタレストの両方を反映でき、APPIDとAPPカテゴリを組み合わせることによって、ロングテールAPPのスパース問題(sparse problem)を軽減し、ユーザAPPインタレスト埋め込みベクトルの表現能力を向上させることができる。
なお、この部分で記述する内容は、本出願の実施形態の肝心なまたは重要な特徴を特定することを意図するものではなく、本出願の範囲を限定することを意図するものでもない。本出願の他の特徴は以下の明細書を通じて容易に理解される。
以下の図面を参照して非限定的な実施形態に対して行われた詳細な説明を読むことによって、本出願の他の特徴、目的及び利点がより明らかになる。図面は、当該技術的手段をより良く理解するためのものであり、本出願を限定するものではない。
本出願を適用できる例示的なシステムアーキテクチャを示す図である。 本出願によるユーザAPPインタレストの埋め込み方法の一実施形態のフロー模式図である。 本出願の実施形態によるユーザAPPインタレスト埋め込みモデルの訓練プロセスのフロー模式図である。 本出願によるユーザAPPインタレストの埋め込み方法の他の実施形態のフロー模式図である。 本出願によるユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得する一実施形態のフロー模式図である。 本出願によるユーザAPPインタレストの埋め込み装置の一実施形態の構造模式図である。 本出願の実施形態によるユーザAPPインタレストの埋め込み方法を実装するための電子機器のブロック図である。
以下、図面と実施形態を組み合わせて本出願をさらに詳細に説明する。ここで述べている具体的な実施形態は関連発明を説明するためのものに過ぎず、当該発明を限定するものではないことを理解すべきである。また、なお、説明の便宜上、図面には関連発明に関連する部分のみが示される。
なお、矛盾しない場合、本出願における実施形態及び実施形態における特徴を組み合わせることができる。以下、図面を参照して実施形態を組み合わせて本出願を詳細に説明する。
図1は本出願を適用できるユーザAPPインタレストの埋め込み方法またはユーザAPPインタレストの埋め込み装置の実施形態の例示的なシステムアーキテクチャ100である。
図1に示すように、システムアーキテクチャ100は端末装置101、ネットワーク102、サーバ103を備えてもよい。ネットワーク102は端末装置101とサーバ103の間に通信リンクを提供する媒体である。ネットワーク102は、様々な接続タイプ、例えば有線、無線通信リンクまたはいは光ファイバケーブルなどを含んでもよい。
端末装置101はネットワーク102を介してサーバ103とやりとりをすることができる。端末装置101はユーザのAPPインストールログを提供することができ、データベース、ユーザ端末などを含むが、これらに限定されない。
サーバ103は、様々なサービスを提供することができ、例えばサーバ103が端末装置101から取得されたユーザのAPPインストールログなどのデータに対して解析などの処理を実行して、処理結果(例えば、ユーザAPPインタレスト埋め込みベクトル)を生成することができる。
なお、サーバ103は、ハードウェアであってもよいし、ソフトウェアであってもよい。サーバ103がハードウェアである場合、複数のサーバからなる分散サーバクラスターとして実装されてもよいし、単一のサーバとして実装されてもよい。サーバ103がソフトウェアである場合、複数のソフトウェアまたはソフトウェアモジュールとして実装されてもよいし(例えば分散サービスを提供するために使用される)、単一のソフトウェアまたはソフトウェアモジュールとして実装されてもよい。ここでは具体的な限定をしない。
なお、本出願の実施形態によるユーザAPPインタレストの埋め込み方法は一般にサーバ103により実行され、対応的に、ユーザAPPのインタレストのある埋め込み装置は一般にサーバ103に設けられる。
理解すべきなのは、図1中の端末装置、ネットワーク及びサーバの数はただ例示的なものである。実装の必要性に応じて、任意の数の端末装置、ネットワーク及びサーバを備えることができる。
次に、本出願によるユーザAPPインタレストの埋め込み方法の一実施形態のフロー200を示す図2を参照する。該ユーザAPPインタレストの埋め込み方法は、ステップ201~202を含む。
ステップ201:ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得する。
本実施形態において、ユーザAPPインタレストの埋め込み方法の実行主体(例えば、図1に示すサーバ103)は、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得することができる。ユーザの既存のAPPインストールリストとは、現時点でのユーザ既存のAPPインストールリストを指す。ユーザの所定の時間窓内でのAPPインストールリストとは、現時点より前の時間窓内でのAPPインストールリストを指す。例えば、所定の時間窓を2週間或いは1か月に設定すると、最近の2週間または1か月にわたるユーザのAPPインストールリストを取得することができる。本実施形態において、APPインストールリストにおけるAPP情報にはAPPID情報とAPPカテゴリ情報が含まれる。具体的に、同じAPPの異なるシステムにおける複数のAPP名称を1つのAPPID情報にマッピングすることができる。APPカテゴリには、ソーシャル、ニュース、ショッピング、エンターテインメント、金融、生活、ツールなどが含まれる。
ステップ202:既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得する。
本実施形態において、上記実行主体は既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得することができる。ここで、ユーザAPPインタレスト埋め込みモデルは、訓練されていないユーザAPPインタレスト埋め込みモデルを訓練することによって取得される。訓練されていないユーザAPPインタレスト埋め込みモデルの各層には初期パラメータを設定でき、パラメータは訓練中に継続的に調整され得る。訓練されていないユーザAPPインタレスト埋め込みモデルは、様々なタイプの、訓練されていないまたは部分的に訓練された人工ニューラルネットワーク或いは訓練されていないまたは部分的に訓練された複数の人工ニューラルネットワークを組み合わせることによって取得されるモデルであってもよく、例えば、訓練されていないユーザAPPインタレスト埋め込みモデルは、訓練されていない畳み込みニューラルネットワークであってもよいし、訓練されていない再帰型ニューラルネットワークであってもよいし、訓練されていない畳み込みニューラルネットワーク、訓練されていない再帰型ニューラルネットワーク及び訓練されていない全結合層を組み合わせることによって取得されるモデルであってもよい。
本実施形態のいくつかのオプション的な実施形態において、上記訓練されていないユーザAPPインタレスト埋め込みモデルは、訓練されていないオートエンコーダ(AutoEncoder)ネットワークモデルであってもよい。訓練されていないオートエンコーダ(AutoEncoder)ネットワークモデルの各層には初期パラメータを設定でき、訓練済みオートエンコーダ(AutoEncoder)ネットワークモデルを取得するまで、訓練中にパラメータを継続的に調整できる。オートエンコーダ(AutoEncoder)ネットワークモデルを使用すると、ユーザAPPインストール動作のラベルデータに依存することなく、教師なしのユーザAPPインストール特徴の埋め込みを達成する。
従来の技術と比べて、本出願の実施形態はユーザの既存のAPPインストールリスト情報と最近のAPPインストールリスト情報を組み合わせて、ユーザAPPインタレスト埋め込みベクトルはユーザの長期的なインタレストと短期的なインタレストの両方を反映でき、APPIDとAPPカテゴリを組み合わせることによって、ロングテールAPPのスパース問題を軽減し、ユーザAPPインタレスト埋め込みベクトルの表現能力を向上させることができる。
次に、本出願の実施形態によるユーザAPPインタレスト埋め込みモデルの訓練プロセスのフロー模式図である図3を参照する。ユーザAPPインタレスト埋め込みモデルを訓練するステップは、ステップ301~306を含む。
ステップ301:ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得する。
本実施形態において、上記実行主体は、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得することができる。ユーザの所定の時間窓内でのAPPインストールリストとは、現時点より前の時間窓内でのAPPインストールリストを指す。例えば、所定の時間窓を2週間或いは1か月に設定すると、最近の2週間または1か月にわたるユーザのAPPインストールリストを取得することができる。本実施形態において、APPインストールリストにおけるAPP情報にはAPPID情報とAPPカテゴリ情報が含まれる。具体的に、同じAPPの異なるシステムにおける複数のAPP名称を1つのAPPID情報にマッピングすることができる。APPカテゴリには、ソーシャル、ニュース、ショッピング、エンターテインメント、金融、生活、ツールなどが含まれる。
ステップ302:APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをランダムに設定し、APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをスティッチングして、APP埋め込みベクトルを取得する。
本実施形態において、上記実行主体は、APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをランダムに設定し、APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをスティッチングして、APP埋め込みベクトルを取得することができる。ユーザAPPインタレスト埋め込みモデルの入力データには既存のAPPインストールリストと最近のAPPインストールリストが含まれ、各APPにはAPPID情報及びカテゴリ情報が含まれる。まず、APPを埋め込む必要があり、APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをランダムに設定し、次元はそれぞれn1*v1、n2*v2であり、ここで、n1はAPPの数であり、v1はAPPIDベクトル次元であり、n2はAPPカテゴリの数であり、v2はAPPカテゴリベクトル次元である。APPの埋め込みベクトルはAPPIDベクトルとAPPカテゴリベクトルをスティッチングしてなり、次元はv1+v2である。次に、それぞれ既存のAPPインストールリストと最近のAPPインストールリストに対応するAPP埋め込みベクトルを生成する。
ステップ303:APPインストールリストをone-hot特徴で表し、及びone-hot特徴とAPP埋め込みベクトルに基づいて、それぞれ既存のAPPインストールリストの入力ベクトルと所定の時間窓内でのAPPインストールリストの入力ベクトルを確定する。
本実施形態において、上記実行主体は、APPインストールリストをone-hot特徴で表し、及びone-hot特徴とAPP埋め込みベクトルに基づいて、それぞれ既存のAPPインストールリストの入力ベクトルと所定の時間窓内でのAPPインストールリストの入力ベクトルを確定することができる。具体的に、まずAPPインストールリストをone-hot特徴で表し、m番目の次元は1であると、該APPをインストールしたことを示し、0であると、該APPをインストールしていないことを示し、mが正の整数であり、その後、APPインストールリストのone-hot特徴とAPPの埋め込みベクトルを乗算し、既存のAPPインストールリストの入力ベクトルと所定の時間窓内でのAPPインストールリストの入力ベクトルを取得する。
ステップ304:ユーザAPPインタレスト埋め込みモデルを構築し、及び入力ベクトルをユーザAPPインタレスト埋め込みモデルに入力する。
本実施形態において、AutoEncoderネットワークモデルを構築して、且つ既存のAPPインストールリストの入力ベクトルと所定の時間窓内でのAPPインストールリストの入力ベクトルをAutoEncoderネットワークモデルに入力することができ、AutoEncoderネットワークモデルによってユーザAPPインストール動作を特徴付ける。具体的に、まずそれぞれ既存のAPPインストールリストの入力ベクトルと最近のAPPインストールリストの入力ベクトルに対して、加算、平均化、及び最大値の求めの3種の形態を含むプーリング操作を実行し、プーリングされた結果をスティッチングし、それぞれ次元が2*3*(v1+v2)の出力ベクトルを取得し、2は既存のAPPインストールリストと最近のAPPインストールリストの2種の入力を示し、3は加算、平均化、及び最大値の求めの3種のプーリング動作を示し、v1+v2はAPPの埋め込みベクトルを示し、最後に、N個の隠れ層ニューラルネットワークモデルを使用してユーザAPPインストール動作を表し、各ニューラルネットワークモデルは活性化関数を有する全結合層から構成され得、最初のM層の活性化関数はReluを使用し、最後の層はsigmoIDを使用し、トリプル(f、W、b)で表すことができ、fは活性化関数であり、wは全結合重み(full connection weight)を示し、bは全結合オフセット(full connection offset)を示す。Xnはニューラルネットワークモデルの出力を示すと、Xn=fn(Xn-1*Wn+bn)であり、XnはAutoEncoderネットワークモデルの出力ベクトルである。
ステップ305:ユーザAPPインタレスト埋め込みモデルに対応する復号ワークモデルを構築し、且つユーザAPPインタレスト埋め込みモデルの出力を復号ネットワークモデルの入力とする。
本実施形態において、上記実行主体は、ユーザAPPインタレスト埋め込みモデルに対応する復号ネットワークモデルを構築し、且つユーザAPPインタレスト埋め込みモデルの出力を復号ネットワークモデルの入力とすることができる。具体的に、復号ネットワークモデルはDecoder1モジュールとDecoder2モジュールを含む。まず、AutoEncoderネットワークモデルと同じような、逆方向のN個の隠れ層ニューラルネットワークモデルを使用し、例えば、AutoEncoderネットワークモデルの隠れ層の大きさは[h1,h2,h3]であり、ここで、h1が入力であり、h2とh3が隠れ層の出力であり、Decoder1モジュールの隠れ層の大きさは[h3,h2,h1]であり、ここで、h3が入力であり、h2とh1が隠れ層の出力である。その後、Decoder2モジュールはDecoder1モジュールの出力を復号し、復号にはsigmoID活性化関数を有するN個の全結合層からなるモデルを使用し、それぞれ既存のAPPインストールリストと最近のAPPインストールリストのone-hot特徴を取得する。全結合の入力の大きさはDecoder1の出力h1であり、全結合の出力の大きさはAPPの数n1である。
ステップ306:復号ネットワークモデルの既存のAPPインストールリストの復号誤差と最近のAPPインストールリストの復号誤差に基づいて、誤差逆伝播を行い、ユーザAPPインタレスト埋め込みモデルを収束させるようにAPPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルを調整する。
本実施形態において、損失関数はMSE平均二乗誤差を採用し、モデル損失は2つの部分からなり、loss1は既存のAPPインストールリストの復号誤差であり、loss2は最近のAPPインストールリストの復号誤差であり、総合損失loss=loss1+a*loss2であり、式中、aは高調波の重みである。lossに基づいて誤差逆伝播を行い、ユーザAPPインタレスト埋め込みモデルが収束するか、最大反復回数に達するまで、パラメータ、APPIDクエリベクトルテーブル及びAPPカテゴリクエリベクトルテーブルを更新する。
次に、本出願によるユーザAPPインタレストの埋め込み方法の他の実施形態のフロー400を示す図4を参照する。該ユーザAPPインタレストの埋め込み方法は、ステップ401~403を含む。
ステップ401:周期時間窓に基づいて、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを定期的に取得する。
本実施形態において、周期時間窓は、ユーザのニーズに応じて、特定の時間長さに設定でき、例えば、周期時間窓は2週間または1か月に設定されると、2週間または1か月ごとにユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得することができる。
ステップ402:定期的に取得された既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、周期時間窓に対応するユーザAPPインタレスト埋め込みベクトルを取得する。
本実施形態において、上記実行主体は、定期的に取得された既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力することによって、対応するユーザAPPインタレスト埋め込みベクトルを取得する。例えば、周期時間窓は2週間または1か月に設定されると、2週間または1か月ごとにユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、2週間または1か月あたりのユーザAPPインタレスト埋め込みベクトルを取得する。
ステップ403:周期時間窓に対応するユーザAPPインタレスト埋め込みベクトルをキー値(Key-value)ストアに格納する。
本実施形態において、上記実行主体は定期的に取得されたユーザAPPインタレスト埋め込みベクトルをキー値ストアに格納することができる。
本実施形態において、周期時間窓を設定し、ユーザのAPPインタレスト埋め込みベクトルを定期的に取得して、キー値ストアに格納することによって、ユーザのAPPインタレスト表現ベクトルの頻繁な更新と大量のリクエストによって引き起こされたユーザAPPインタレスト埋め込みモデルの予測圧力が大きいという問題を解消できる。
次に、本出願によるユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得する一実施形態のフロー模式図である図5を参照する。
図5に示すように、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得するステップはステップ501~504を含む。
ステップ501:ユーザのAPPインストールログを収集して、且つAPPインストールログにおけるAPPインストール情報と時間を関連付ける。
本実施形態において、上記実行主体は、ユーザのAPPインストールログを収集し、且つ時間と関連付けることができ、一人のユーザの異なる時点でのAPPインストール情報を異なるサンプルとする。
ステップ502:APPのユーザ数を統計し、APPのユーザ数に基づいて特定の数のAPPセットをスクリーニングする。
本実施形態において、上記実行主体は、APPのユーザ数を統計し、ユーザカバー率或いはtopk方法によって候補となるN個のAPPセットをスクリーニングすることができ、ここで、k、nはすべて正の整数である。
ステップ503:APPセットに基づいて、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを統計する。
本実施形態において、上記実行主体は、特定の時点でのユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを統計することができ、例えば、所定の時間窓は2週間或いは1か月に設定され得る。
ステップ504:APPインストールリストにおけるAPPID情報とAPPカテゴリ情報を収集する。
本実施形態において、上記実行主体は、APPに対応する細分化カテゴリ情報を収集或いは生成することができ、各APPにはAPPID情報及びカテゴリ情報が含まれる。
更に図6を参照し、上記各図に示すような方法の実装として、本出願はユーザAPPインタレストの埋め込みの一実施形態を提供し、該装置の実施形態は図2に示すような方法の実施形態に対応し、該装置は具体的に様々な電子機器に適用できる。
図6に示すように、本実施形態のユーザAPPインタレストの埋め込み装置600は、取得モジュール601と出力モジュール602を備え得る。取得モジュール601は、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得するように構成され、前記APPにはAPPID情報とAPPカテゴリ情報が含まれ、出力モジュール602は、前記既存のAPPインストールリストと前記所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得するように構成される。
本実施形態において、ユーザAPPインタレストの埋め込み装置600において、取得モジュール601と出力モジュール602の具体的な処理及びそれらによってもたらされた技術効果は、それぞれ図2の対応する実施形態におけるステップ201~202の関連説明を参照でき、ここでは省略する。
本実施形態のいくつかのオプション的な実施形態において、前記装置は、訓練モジュールをさらに備え、前記訓練モジュールは、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得するように構成され、前記APPにはAPPID情報とAPPカテゴリ情報が含まれる取得モジュールと、APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをランダムに設定し、及び前記APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをスティッチングして、APP埋め込みベクトルを取得するように構成される初期化モジュールと、前記APPインストールリストをone-hot特徴で表し、及び前記one-hot特徴と前記APP埋め込みベクトルに基づいて、それぞれ既存のAPPインストールリストの入力ベクトルと所定の時間窓内でのAPPインストールリストの入力ベクトルを確定するように構成されるベクトル化モジュールと、ユーザAPPインタレスト埋め込みモデルを構築し、及び前記入力ベクトルを前記ユーザAPPインタレスト埋め込みモデルに入力するように構成される埋め込みモデル構築モジュールと、前記ユーザAPPインタレスト埋め込みモデルに対応する復号ネットワークモデルを構築し、且つ前記ユーザAPPインタレスト埋め込みモデルの出力を前記復号ネットワークモデルの入力とするように構成される復号モデル構築モジュールと、前記復号ネットワークモデルの既存のAPPインストールリストの復号誤差と所定の時間窓内でのAPPインストールリストの復号誤差に基づいて、誤差逆伝播を行い、且つ前記ユーザAPPインタレスト埋め込みモデルを収束させるようにAPPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルを調整するように構成されるパラメータ調整モジュールと、を備える。
本実施形態のいくつかのオプション的な実施形態において、周期時間窓に基づいて、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを定期的に取得するように構成され、前記APPにはAPPID情報とAPPカテゴリ情報が含まれる定期取得モジュールと、前記の前記周期時間窓に対応するユーザAPPインタレスト埋め込みベクトルをキー値ストアに格納するように構成される記憶モジュールと、をさらに備え、前記出力モジュールはさらに、前記定期的に取得された既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、前記周期時間窓に対応するユーザAPPインタレスト埋め込みベクトルを取得するように構成される。
本実施形態のいくつかのオプション的な実施形態において、前記取得モジュールは、ユーザのAPPインストールログを収集し、且つ前記APPインストールログにおけるAPPインストール情報と時間を関連付けるように構成される収集モジュールと、APPのユーザ数を統計し、APPのユーザ数に基づいて特定の数のAPPセットをスクリーニングするように構成されるスクリーニングモジュールと、前記APPセットに基づいて、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを統計するように構成される統計モジュールと、前記APPインストールリストにおけるAPPID情報とAPPカテゴリ情報を採集するように構成される採集モジュールと、を備える。
本実施形態のいくつかのオプション的な実施形態において、前記ユーザAPPインタレスト埋め込みモデルはオートエンコーダネットワークモデルである。
図7に示すように、本出願の実施形態によるユーザAPPインタレストの埋め込み方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、その他の適切なコンピュータなどのさまざまな態様のデジタルコンピュータを示す。電子機器は、パーソナルデジタル処理、セルラー方式の携帯電話、スマートフォン、ウェアラブル装置、及び他の類似するコンピューティングデバイスなどのさまざまな態様のモバイルデバイスを示すこともできる。本明細書に示されるコンポーネント、それらの接続及び関係、ならびにそれらの機能は、単なる例示であり、本明細書に記載されるおよび/または要求される本出願の実現を限定することを意図するものではない。
図7に示すように、該電子機器は、1つまたは複数のプロセッサ701、メモリ702、及び各コンポーネントを接続するための、高速インターフェース及び低速インターフェースを含むインターフェースを備える。各コンポーネントは、異なるバスで相互に接続されており、共通のマザーボードに実装されてもよいし、必要に応じて、他の方法で実装されてもよい。プロセッサは、GUIのグラフィック情報を外部入/出力装置(インターフェースに結合された表示装置など)に表示できるように、メモリ内またはメモリ上に格納された指令を含む、電子機器で実行される指令を処理できる。他の実施形態では、必要とすれば、複数のプロセッサおよび/または複数のバスを複数のメモリと共に用いることができる。同様に、複数の電子機器を接続でき、各機器は一部の必要な動作を提供する(例えば、サーバアレイ、ブレードサーバグループ、またはマルチプロセッサシステムとする)。図7では、1つのプロセッサ701を例にする。
メモリ702は、即ち、本出願による非一時的なコンピュータ読み取り可能な記憶媒体である。ただし、前記メモリは、少なくとも1つのプロセッサによって実行可能な指令を格納するので、前記少なくとも1つのプロセッサに本出願によるユーザAPPインタレストの埋め込み方法を実行させる。本出願の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータに本出願によるユーザAPPインタレストの埋め込み方法を実行させるためのコンピュータ指令を格納する。
メモリ702は非一時的なコンピュータ読み取り可能な記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム、及びモジュールを格納することに用いられ、例えば本出願の実施形態におけるユーザAPPインタレストの埋め込み方法に対応するプログラム指令/モジュール(例えば、図6に示すような取得モジュール601、出力モジュール602)が挙げられる。プロセッサ701は、メモリ702に格納された非一時的なソフトウェアプログラム、指令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記方法の実施形態に係るユーザAPPインタレストの埋め込み方法を実現する。
メモリ702は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを格納可能なプログラム記憶領域と、ユーザAPPインタレストの埋め込み方法に係る電子機器の使用に応じて作成されたデータ等を格納可能なデータ記憶領域とを含んでもよい。また、メモリ702は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的なメモリを含んでもよく、例えば、少なくとも1つの磁気ディスク記憶デバイス、フラッシュメモリデバイス、または他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリを含んでもよい。いくつかの実施形態では、メモリ702は、任意選択で、プロセッサ601に対して遠隔に設置されたリモートメモリを含み、これらのリモートメモリは、ネットワークを介してユーザAPPインタレストの埋め込み方法を実行する電子機器に接続されることができる。上記ネットワークとしては、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせなどを含むが、これらに限定されない。
ユーザAPPインタレストの埋め込み方法を実行する電子機器は、入力装置703と出力装置704を備えてもよい。プロセッサ701、メモリ702、入力装置703及び出力装置704は、バスまたは他の方法で接続されてもよいが、図7にバスによる接続を例にする。
入力装置703は、入力された数字または文字情報を受信し、ユーザAPPインタレストの埋め込み方法を実行する電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができる。例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングデバイス、1つ以上のマウスボタン、トラックボール、ジョイスティック、その他の入力装置が挙げられる。出力装置704は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モーター)などを備えてもよい。該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを備えてもよい。いくつかの実施形態では、表示装置はタッチスクリーンであってもよい。
ここでは説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせにおいて実現できる。これらの様々な実施形態は、1つまたは複数のコンピュータプログラムに実装され、該1つまたは複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行および/または解釈されてもよく、該プログラマブルプロセッサは、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータと指令を受信し、そのデータと指令をストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置に送信できる専用または汎用のプログラマブルプロセッサであってもよい。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、高度プロセスおよび/またはオブジェクト指向プログラミング言語、および/またはアセンブリ言語/機械語を利用してこれらのコンピュータプログラムを実装することができる。本明細書で使用されるように、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、プログラマブルプロセッサに機械命令および/またはデータを提供するために用いられる任意のコンピュータプログラム製品、デバイス、および/または装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD)を指す。機械読み取り可能な信号である機械指令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、プログラマブルプロセッサに機械命令および/またはデータを提供するために用いられる任意の信号を指す。
ユーザとのインタラクションを提供するために、コンピュータにここで説明するシステム及び技術を実施してもよく、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニター)、及びキーボードとポインティングデバイス(マウスやトラックボールなど)を備え、ユーザが該キーボードとポインティングデバイスを介してコンピュータに入力を提供することができる。他のタイプの装置もユーザとのインタラクションを提供するために用いられ、例えば、ユーザに提供されるフィードバックは、任意の形式の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、任意の形式(音入力、音声入力、または触覚入力を含む)でユーザからの入力を受信することもできる。
ここでは説明するシステムと技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとして)、ミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、またはフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースまたはWebブラウザを備え、ユーザが該ラフィカルユーザインターフェースまたはWebブラウザを介してここで説明したシステムと技術の実施形態とやりとりできるユーザコンピュータ)、またはそのようなバックエンドコンポーネント、ミドルウェアコンポーネント、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムに実施してもよい。システムのコンポーネントは、任意の形式または媒体のデジタルデータ通信(通信ネットワークなど)を介して相互に接続されてもよい。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)およびインターネットが挙げられる。
コンピューティングシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバは、一般的に互いに離れており、通常は通信ネットワークを介してやりとりをする。対応するコンピュータ上で、互いにクライアント-サーバ関係を持つコンピュータプログラムを実行することによりクライアントとサーバの関係を生成する。
本出願の技術案によれば、まずユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得し、次に、既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得し、ユーザの既存のAPPインストールリスト情報と最近のAPPインストールリスト情報を組み合わせることによって、ユーザAPPインタレスト埋め込みベクトルはユーザの長期的なインタレストと短期的なインタレストの両方を反映でき、APPIDとAPPカテゴリを組み合わせることによって、ロングテールAPPのスパース問題を軽減し、ユーザAPPインタレスト埋め込みベクトルの表現能力を向上させることができる。
なお、上述した様々な形態のフローを用いて、ステップを並び替え、追加または削除を行うことができることを理解されるべきである。例えば、本出願に記載された各ステップは、本出願に開示された技術方案の所望の結果が達成できる限り、並行して実行されてもよく、順番に実行されてもよく、異なる順序で実行されてもよい。本明細書はここで制限はしない。
上記の具体的な実施形態は、本出願の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組み合わせ、及び代替を行うことは理解される。本出願の精神及び原則を逸脱せずに行われるあらゆる補正、均等な置換、改良などは、すべて本出願の保護範囲内に含まれるべきである。

Claims (13)

  1. ユーザAPPインタレストの埋め込み方法であって、
    ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得するステップであって、前記APPにはAPPID情報とAPPカテゴリ情報が含まれる、ステップと、
    前記既存のAPPインストールリストと前記所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得するステップと、を含むユーザAPPインタレストの埋め込み方法。
  2. 前記ユーザAPPインタレスト埋め込みモデルは、
    ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得するステップであって、前記APPにはAPPID情報とAPPカテゴリ情報が含まれる、ステップと、
    APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをランダムに設定し、前記APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをスティッチングして、APP埋め込みベクトルを取得するステップと、
    前記APPインストールリストをone-hot特徴で表し、前記one-hot特徴と前記APP埋め込みベクトルに基づいて、既存のAPPインストールリストの入力ベクトルと所定の時間窓内でのAPPインストールリストの入力ベクトルをそれぞれ確定するステップと、
    ユーザAPPインタレスト埋め込みモデルを構築し、前記入力ベクトルを前記ユーザAPPインタレスト埋め込みモデルに入力するステップと、
    前記ユーザAPPインタレスト埋め込みモデルに対応する復号ネットワークモデルを構築し、前記ユーザAPPインタレスト埋め込みモデルの出力を前記復号ネットワークモデルの入力とするステップと、
    前記復号ネットワークモデルの既存のAPPインストールリストの復号誤差と所定の時間窓内でのAPPインストールリストの復号誤差に基づいて、誤差逆伝播を行い、前記ユーザAPPインタレスト埋め込みモデルを収束させるように、APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルを調整するステップと、
    によって訓練されて得る、請求項1に記載のユーザAPPインタレストの埋め込み方法。
  3. 周期時間窓によって、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを定期的に取得するステップであって、前記APPにはAPPID情報とAPPカテゴリ情報が含まれる、ステップと、
    定期的に取得された既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、前記周期時間窓に対応するユーザAPPインタレスト埋め込みベクトルを取得するステップと、
    前記の前記周期時間窓に対応するユーザAPPインタレスト埋め込みベクトルをキー値ストアに格納するステップと、をさらに含む請求項1に記載のユーザAPPインタレストの埋め込み方法。
  4. ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得する前記ステップは、
    ユーザのAPPインストールログを収集し、前記APPインストールログにおけるAPPインストール情報と時間を関連付けるステップと、
    APPのユーザ数を統計し、APPのユーザ数に基づいて特定の数のAPPセットをスクリーニングするステップと、
    前記APPセットに基づいて、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを統計するステップと、
    前記APPインストールリストにおけるAPPID情報とAPPカテゴリ情報を採集するステップと、を含む請求項2に記載のユーザAPPインタレストの埋め込み方法。
  5. 前記ユーザAPPインタレスト埋め込みモデルは、オートエンコーダネットワークモデルである請求項1~4のいずれかに記載のユーザAPPインタレストの埋め込み方法。
  6. ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得するように構成される取得モジュールであって、前記APPにはAPPID情報とAPPカテゴリ情報が含まれる、取得モジュールと、
    前記既存のAPPインストールリストと前記所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、ユーザAPPインタレスト埋め込みベクトルを取得するように構成される出力モジュールと、を備えるユーザAPPインタレストの埋め込み装置。
  7. 前記ユーザAPPインタレストの埋め込み装置は訓練モジュールをさらに備え、
    前記訓練モジュールは、
    ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを取得するように構成される取得モジュールであって、前記APPにはAPPID情報とAPPカテゴリ情報が含まれる、取得モジュールと、
    APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをランダムに設定し、前記APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルをスティッチングして、APP埋め込みベクトルを取得するように構成される初期化モジュールと、
    前記APPインストールリストをone-hot特徴で表し、前記one-hot特徴と前記APP埋め込みベクトルに基づいて、既存のAPPインストールリストの入力ベクトルと所定の時間窓内でのAPPインストールリストの入力ベクトルをそれぞれ確定するように構成されるベクトル化モジュールと、
    ユーザAPPインタレスト埋め込みモデルを構築し、前記入力ベクトルを前記ユーザAPPインタレスト埋め込みモデルに入力するように構成される埋め込みモデル構築モジュールと、
    前記ユーザAPPインタレスト埋め込みモデルに対応する復号ネットワークモデルを構築し、前記ユーザAPPインタレスト埋め込みモデルの出力を前記復号ネットワークモデルの入力とするように構成される復号モデル構築モジュールと、
    前記復号ネットワークモデルの既存のAPPインストールリストの復号誤差と所定の時間窓内でのAPPインストールリストの復号誤差に基づいて、誤差逆伝播を行い、前記ユーザAPPインタレスト埋め込みモデルを収束させるように、APPIDクエリベクトルテーブルとAPPカテゴリクエリベクトルテーブルを調整するように構成されるパラメータ調整モジュールと、を備える請求項6に記載のユーザAPPインタレストの埋め込み装置。
  8. 周期時間窓によって、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを定期的に取得するように構成される定期取得モジュールであって、前記APPにはAPPID情報とAPPカテゴリ情報が含まれる、定期取得モジュールと、
    前記の前記周期時間窓に対応するユーザAPPインタレスト埋め込みベクトルをキー値ストアに格納するように構成される記憶モジュールと、をさらに備え、
    前記出力モジュールはさらに、定期的に取得された既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを事前訓練済みユーザAPPインタレスト埋め込みモデルに入力し、前記周期時間窓に対応するユーザAPPインタレスト埋め込みベクトルを取得するように構成される、請求項6に記載のユーザAPPインタレストの埋め込み装置。
  9. 前記取得モジュールは、
    ユーザのAPPインストールログを収集し、前記APPインストールログにおけるAPPインストール情報と時間を関連付けるように構成される収集モジュールと、
    APPのユーザ数を統計し、APPのユーザ数に基づいて特定の数のAPPセットをスクリーニングするように構成されるスクリーニングモジュールと、
    前記APPセットに基づいて、ユーザの既存のAPPインストールリストと所定の時間窓内でのAPPインストールリストを統計するように構成される統計モジュールと、
    前記APPインストールリストにおけるAPPID情報とAPPカテゴリ情報を採集するように構成される採集モジュールと、を備える請求項7に記載のユーザAPPインタレストの埋め込み装置。
  10. 前記ユーザAPPインタレスト埋め込みモデルは、オートエンコーダネットワークモデルである請求項7~9のいずれかに記載のユーザAPPインタレストの埋め込み装置。
  11. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を備え、
    前記メモリには前記少なくとも1つのプロセッサによって実行されることができる指令が格納され、前記指令は前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~5のいずれかに記載のユーザAPPインタレストの埋め込み方法が実行される、電子機器。
  12. コンピュータ指令が格納された非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ指令は請求項1~5のいずれかに記載のユーザAPPインタレストの埋め込み方法を前記コンピュータに実行するために使用される非一時的なコンピュータ読み取り可能な記憶媒体。
  13. プロセッサにより実行されると、請求項1~12のいずれかに記載のユーザAPPインタレストの埋め込み方法が実装される、コンピュータプログラム。

JP2021039379A 2020-09-21 2021-03-11 ユーザappインタレストの埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム Active JP7220733B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010995356.9 2020-09-21
CN202010995356.9A CN112015439B (zh) 2020-09-21 2020-09-21 用户app兴趣的嵌入方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
JP2022051665A true JP2022051665A (ja) 2022-04-01
JP7220733B2 JP7220733B2 (ja) 2023-02-10

Family

ID=73521584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021039379A Active JP7220733B2 (ja) 2020-09-21 2021-03-11 ユーザappインタレストの埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム

Country Status (5)

Country Link
US (1) US20210201149A1 (ja)
EP (1) EP3825876A3 (ja)
JP (1) JP7220733B2 (ja)
KR (1) KR102607359B1 (ja)
CN (1) CN112015439B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113392149B (zh) * 2021-06-15 2022-09-13 浙江大学 一种基于多源异构数据融合的贷款逾期预测方法
CN114692972B (zh) * 2022-03-31 2024-09-24 支付宝(杭州)信息技术有限公司 行为预测系统的训练方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765352A (zh) * 2019-10-11 2020-02-07 上海上湖信息技术有限公司 一种用户兴趣识别方法及装置
US20200107072A1 (en) * 2018-10-02 2020-04-02 Adobe Inc. Generating user embedding representations that capture a history of changes to user trait data

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100332326A1 (en) * 2008-02-13 2010-12-30 Ron Ishai System And Methods For Positioning Information From A Plurality Of Users
US9104771B2 (en) * 2011-11-03 2015-08-11 International Business Machines Corporation Providing relevant product reviews to the user to aid in purchasing decision
CN108062342A (zh) * 2016-11-08 2018-05-22 北京国双科技有限公司 应用程序的推荐方法及装置
EP3454260A1 (en) * 2017-09-11 2019-03-13 Tata Consultancy Services Limited Bilstm-siamese network based classifier for identifying target class of queries and providing responses thereof
CN107861938B (zh) * 2017-09-21 2020-09-25 北京三快在线科技有限公司 一种poi文案生成方法及装置,电子设备
CN107729560A (zh) * 2017-11-08 2018-02-23 北京奇虎科技有限公司 基于大数据的用户画像构造方法、装置及计算设备
CN108921221B (zh) * 2018-07-04 2022-11-18 腾讯科技(深圳)有限公司 用户特征的生成方法、装置、设备及存储介质
KR20210015524A (ko) * 2019-08-02 2021-02-10 삼성전자주식회사 사용자 관심도의 산출 방법 및 이를 지원하는 전자 장치
CN111242748B (zh) * 2020-02-21 2023-04-07 腾讯科技(深圳)有限公司 用于向用户推荐项目的方法、装置和存储介质
CN111523007B (zh) * 2020-04-27 2023-12-26 北京百度网讯科技有限公司 用户感兴趣信息确定方法、装置、设备以及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200107072A1 (en) * 2018-10-02 2020-04-02 Adobe Inc. Generating user embedding representations that capture a history of changes to user trait data
CN110765352A (zh) * 2019-10-11 2020-02-07 上海上湖信息技术有限公司 一种用户兴趣识别方法及装置

Also Published As

Publication number Publication date
CN112015439A (zh) 2020-12-01
US20210201149A1 (en) 2021-07-01
KR102607359B1 (ko) 2023-11-29
EP3825876A2 (en) 2021-05-26
EP3825876A3 (en) 2021-10-06
JP7220733B2 (ja) 2023-02-10
KR20210037631A (ko) 2021-04-06
CN112015439B (zh) 2024-01-12

Similar Documents

Publication Publication Date Title
JP7166322B2 (ja) モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
KR102484617B1 (ko) 이종 그래프 노드를 표현하는 모델 생성 방법, 장치, 전자 기기, 저장 매체 및 프로그램
US11044949B2 (en) Systems and methods for dynamic delivery of web content
CN111539514B (zh) 用于生成神经网络的结构的方法和装置
CN110688270B (zh) 视频元素资源处理方法、装置、设备及存储介质
JP2022023776A (ja) オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
JP7044839B2 (ja) エンドツーエンドモデルのトレーニング方法および装置
JP7200277B2 (ja) ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP2021111334A (ja) 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器
JP2022051665A (ja) ユーザappインタレストの埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP7285899B2 (ja) ユーザ画像認識モデルの更新方法、装置、電子機器、コンピュータ可読記録媒体及びコンピュータプログラム
CN111949272B (zh) 寄宿应用的编译优化方法、装置、电子设备及可读存储介质
EP3799036A1 (en) Speech control method, speech control device, electronic device, and readable storage medium
KR20220003444A (ko) 옵티마이저 학습 방법, 장치, 전자 기기 및 판독 가능 기록 매체
CN112446574B (zh) 产品评估方法、装置、电子设备及存储介质
CN112580723B (zh) 多模型融合方法、装置、电子设备和存储介质
CN112085103B (zh) 基于历史行为的数据增强方法、装置、设备以及存储介质
CN111783872B (zh) 训练模型的方法、装置、电子设备及计算机可读存储介质
CN112735601B (zh) 利用蓝牙确定传染病密接人群的测试方法、装置及设备
CN112016059B (zh) 用于处理数据的方法、装置、设备以及存储介质
EP4315010A1 (en) Advanced application of model operations in energy
CN111177558B (zh) 频道业务构建方法及装置
CN111291201B (zh) 一种多媒体内容分值处理方法、装置和电子设备
CN114912522B (zh) 信息分类方法和装置
CN111611582B (zh) 用于识别页面劫持行为的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230131

R150 Certificate of patent or registration of utility model

Ref document number: 7220733

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150