JP7135255B2 - アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体 - Google Patents

アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体 Download PDF

Info

Publication number
JP7135255B2
JP7135255B2 JP2021007184A JP2021007184A JP7135255B2 JP 7135255 B2 JP7135255 B2 JP 7135255B2 JP 2021007184 A JP2021007184 A JP 2021007184A JP 2021007184 A JP2021007184 A JP 2021007184A JP 7135255 B2 JP7135255 B2 JP 7135255B2
Authority
JP
Japan
Prior art keywords
training
item
user
task
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021007184A
Other languages
English (en)
Other versions
JP2021118000A (ja
Inventor
チェン、リアンフイ
フ、ヤン
ワン、クアンビン
ヤン、シャオシュアン
ペン、リアングアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021118000A publication Critical patent/JP2021118000A/ja
Application granted granted Critical
Publication of JP7135255B2 publication Critical patent/JP7135255B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/60Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
    • A63F13/69Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor by enabling or updating specific game elements, e.g. unlocking hidden features, items, levels or versions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/60Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
    • A63F13/67Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor adaptively or by learning from player actions, e.g. skill level adjustment or by storing successful combat sequences for re-use
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/70Game security or game management aspects
    • A63F13/79Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories
    • A63F13/795Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories for finding other players; for building a team; for providing a buddy list
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/50Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
    • A63F2300/57Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers details of game services offered to the player
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本出願は、コンピュータ技術分野に関するものであり、特に人工知能、具体的にアイテム推奨方法及びモデルトレーニング方法、システム、プログラム、電子機器及び記憶媒体に関するものである。
インターネットがこれまで発展し、様々なインターネットの製品が生み出された。例えば、電子商取引などのショッピングのプラットフォームの登場により、人々のライフスタイルが変えられてショッピングの利便性を高めた。
様々なインターネットアプリケーション製品において、ユーザーは、インタレストのアイテムを個別に選択してもよく、システムからユーザーにアイテムを推奨してもよい。例えば、既存のアイテム推奨システムでは、協調フィルタリングの推奨様式を採用することができる。例えば、業界で一般的に、アイテムベースの協調フィルタリング推奨であるitemCF、または、ユーザーベースの協調フィルタリング推奨であるuserCFを使用する。itemCFは、二つのアイテムに全部インタレストを持つユーザーの重複量を使用して、二つのアイテムの間の類似度を測定して、ユーザーの過去のアイテムをベースに、類似の候補アイテムを推奨する。userCFは、二つのユーザーが同時にインタレストを持つアイテムの重複量を使用して、二つのユーザーの間の類似度を測定し、類似のユーザーグループが気に入るアイテムをベースに、候補アイテムをターゲットユーザーに推奨する。
しかし、ユーザー数やアイテム数が多い場合、上述の推奨案の計算量の代価が非常に大きくて、計算エラーが発生しやすく、推奨案のアイテム推奨精度が低くなる。
上記技術的課題を解決するために、本出願は、アイテムの推奨方法及びモデルトレーニング方法、システム、電子機器及び記憶媒体を提供して、アイテム推奨精度を高める。
一方、本出願は、
予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築するステップと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得するステップと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得するステップと、
前記N個のアイテムの識別子に基づいて、前記ユーザーに前記N個のアイテムの相関情報を推奨するステップと、を含むアイテム推奨方法を提供する。
さらに、選択的に、上述の方法において、前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得するステップは、
前記アイテムの特徴表現のデータベースから前記ユーザーの特徴表現と相関性が最も高いN個のアイテムの特徴表現を検索するステップと、
前記N個のアイテムの特徴表現に対応される前記N個のアイテムの識別子を取得するステップと、を含む。
さらに、選択的に、上述の方法において、予めトレーニングされた、前記ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールを具備し、前記リコールのタスクモジュールと前記クリック率推定のタスクモジュールの間は連合学習を受ける。
他方、本出願は、
複数のトレーニングデータを収集するステップと、
前記複数のトレーニングデータを使用して、前記ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行うステップと、を含み、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法を提供する。
さらに、選択的に、上述の方法において、前記複数のトレーニングデータを使用して、前記ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行うステップは、
各前記トレーニングデータについて、前記トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得るステップと、
前記トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現を、それぞれ完全接続処理や活性化処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの特徴表現と前記トレーニングアイテムの特徴表現を乗じて、前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスを得るステップと、
前記クリック率推定のタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びsigmoid活性化関数の処理層を含む少なくとも二つの層の処理を通じて、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率を得るステップと、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数を生成するステップと、
前記総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを調整するステップと、
収束される場合は、第1の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、前記ユーザーがアイテムをクリックするタスクモデルを決定するステップと、を含む。
さらに、選択的に、上述の方法において、前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数を生成するステップは、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスと既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第1の交差エントロピー損失関数を生成するステップと、
前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率と既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第2の交差エントロピー損失関数を生成するステップと、
前記第1の交差エントロピー損失関数と前記第2の交差エントロピー損失関数の和を求めて、前記総合的な交差エントロピー損失関数を得るステップと、を含む。
さらに、選択的に、上述の方法において、前記総合的な交差エントロピー損失関数が、前記第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、
継続して前記複数のトレーニングデータを使用して、前記第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、前記リコールのタスクモジュールをトレーニングし、前記リコールのタスクモジュールのパラメータを決定して、前記リコールのタスクモジュールを決定し、前記ユーザーがアイテムをクリックするタスクモデルを決定するステップをさらに含む。
もう一方、本出願は、
予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する構築モジュールと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する特徴取得モジュールと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得するアイテム取得モジュールと、
前記N個のアイテムの識別子に基づいて、前記ユーザーに前記N個のアイテムの相関情報を推奨する推奨モジュールと、を具備するアイテム推奨システムをさらに提供する。
また一方、本出願は、
複数のトレーニングデータを収集する収集モジュールと、
前記複数のトレーニングデータを使用して、前記ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行うトレーニングモジュールと、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む、ユーザーがアイテムをクリックするタスクモデルのトレーニング装置をさらに提供する。
もう他方、本出願は、
少なくとも一つのプロセッサーと、
前記少なくとも一つのプロセッサーに通信接続されるメモリと、を具備して、
前記メモリには、前記少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも一つのプロセッサーによって実行されることで、上述のいずれか一項に記載の方法を前記少なくとも一つのプロセッサーに実行させることができる電子機器をさらに提供する。
また他方、本出願は、コンピューターに上述のいずれか一項に記載の方法を実行させるためのコンピューターコマンドが記憶されている非一時的コンピューター可読記録媒体をさらに提供する。
上記の出願における一実施例は以下の利点又は有益な効果を有する。予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築し、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得し、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得し、N個のアイテムの識別子に基づいて、ユーザーにN個のアイテムの相関情報を推奨することで、既存の技術に比べて、本出願の技術案は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルを使用してアイテムを推奨し、計算量を効果的に削減することができ、計算エラーを回避し、推奨精度を高めることができる。また、アイテム推奨のインテリジェンスを効果的に高め、アイテム推奨効率を向上させることができる。
また、本出願において、ユーザーがアイテムをクリックするタスクモデルに含まれるリコールのタスクモジュールとクリック率推定のタスクモジュールは、二つの互いに独立したタスクであるので、クリック率推定のタスクモジュールにおいてユーザーの特徴表現とアイテムの特徴表現を相互作用させることができる。このように、トレーニング時、当該クリック率推定のタスクモジュールは、逆伝播を介して、埋め込み処理モジュールの中のembeddingパラメータに影響を与えることができ、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がembeddingパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させ、アイテム推奨の効果をより効果的に高めることができる。
本出願におけるユーザーがアイテムをクリックするタスクモデルのトレーニング方法は、リコールタスクとクリック率推定タスクを同時にトレーニングすることができ、トレーニング時、逆伝播を介して、埋め込み処理モジュールの中のembeddingパラメータに影響を与え、ユーザーの特徴表現とアイテムの特徴表現の間の相互作用がある情報がembeddingパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。したがって、本実施例の技術案によってトレーニングされたユーザーがアイテムをクリックするタスクモデルは、リコール効果を効果的に高めることができ、当該ユーザーがアイテムをクリックするタスクモデルに基づいてアイテムを推奨する際、推奨精度をに高めることができ、アイテム推奨効率を向上させることができる。
また、本出願において、総合的な交差エントロピー損失関数が第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、また、継続して複数のトレーニングデータを使用して、第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定し、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定することにより、リコール効果をより一層高めることができ、推奨精度を高めることができ、アイテム推奨効率を向上させることができる。
上記好適な方式が有する他の効果ついては、具体的な実施例に基づいて以下説明される
図面はこの方案をよりよく理解するためのものであり、本出願の制限を構成するものではない。
本出願に係る実施例1の概略図である。 本実施例で提供されるユーザーがアイテムをクリックするタスクモデルの構成図である。 本出願に係る実施例2の概略図である。 本出願に係る実施例3の概略図である。 本出願に係る実施例4の概略図である。 本出願の実施例の上記方法を実現するための電子機器のブロック図である。
以下、図面に基づいて、本発明の例示的な実施例を記述する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。明らか、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
図1は、本出願に係る実施例1の概略図である。図1に示すように、本実施例のアイテム推奨の方法は、具体的に、ステップS101、ステップS102、ステップS103及びステップS104を含む。
ステップS101で、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する。
本実施例におけるアイテム推奨の方法を実行する主体はアイテム推奨装置であり、当該アイテム推奨装置は、電子エンティティであってもよく、またはプログラムが統合されたアプリケーションであってもよく、使用時、コンピュータ装置により実行されると、すぐにアイテム推奨が実現されることができる。
本実施例のアイテム推奨の方法は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルに基づいて実現される。当該ユーザーがアイテムをクリックするタスクモデルは、ニューラルネットワークモデルであり、当該ニューラルネットワークモデルは、ユーザーがアイテムをクリックする少なくとも一つのタスク、例えば、リコールタスク及び/またはクリック率推定タスクについてのシミュレーションを実現することができる。ユーザーがアイテムをクリックするタスクのシミュレーションの過程では、必然的に、まずユーザーの特徴情報とアイテムの特徴情報に基づいて、ユーザーとアイテムのそれぞれについて、埋め込み(embedding)処理をして、該当する特徴表現を得た後、特徴表現に基づいて、タスクについてのシミュレーションを実現する。したがって、ユーザーがアイテムをクリックするタスクモデルの中のトレーニングされた特徴表現のパラメータに基づいて、アイテムの特徴情報に基づいてのアイテムの特徴表現の取得を実現することができる。本実施例の特徴表現は、具体的には、ベクトルの様式を採用することができ、ベクトル表現と呼ばれてもよい。したがって、アイテムの特徴表現のデータベースは、FAISSベクトルインデックスデータベースであることができる。
本実施例の推奨待ちアイテムライブラリは、予め収集された複数のアイテム情報を含み、例えば、各々のアイテム情報には、当該アイテムの識別子と当該アイテムの少なくとも二つの特徴情報を含む。ここで、アイテムの識別子は、当該アイテムを一対一に識別するために使用され、例えば、アイテムの識別子は、数字、アルファベット及び文字の中の少なくとも一つまたは少なくとも二つの組み合わせが使用できる。アイテムの少なくとも二つの特徴情報は、アイテムのタイプ、アイテムのキーワードなどの、その他の情報を含むことができる。
本実施例では、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリ中の各アイテムの少なくとも二つの特徴情報に基づいて、各アイテムの特徴表現を取得することができる。また、各アイテムの特徴表現に基づいて、アイテムライブラリの中の各アイテムの特徴表現を含むアイテムの特徴表現のデータベースを構築することができる。ここで、当該アイテムの特徴表現のデータベースには、各アイテムの識別子をさらに含むことができる。
本実施例の特徴表現は、全部ベクトル様式を使用し、ベクトル表現またはベクトルと呼ばれてもよい。
ステップS102で、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する。
ステップS101の実施形態を参照すると、また、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報に基づいて、ユーザーの特徴表現を取得することもできて、詳細については、上述のステップS101の記載を参照すればよく、ここで繰り返して説明しない。
本実施例のユーザーの少なくとも二つの特徴情報は、ユーザーの動作情報、ユーザーのインタレストタグ及び年齢、性別、ライフステージのようなユーザーのデモグラフィック属性などを含んでもよく、ここでいちいち繰り返して説明しない。
ステップS103で、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得する。
具体的には、まず、アイテムの特徴表現のデータベースからユーザーの特徴表現と相関性が最も高いN個のアイテムの特徴表現を検索する。次に、N個のアイテムの特徴表現に対応するN個のアイテムの識別子を取得する。
ステップS104で、N個のアイテムの識別子に基づいて、ユーザーにN個のアイテムの相関情報を推奨する。
例えば、N個のアイテムの識別子に基づいて、ユーザーに、N個のアイテムの識別子、特徴情報、詳細情報やリンクなどの相関情報を推奨することができる。本実施例では、ユーザーに推奨待ちN個のアイテムの相関情報は、上述のいくつかに制限されず、実際の適用際、N個のアイテムの他の情報をさらに含んでもよく、ここでいちいち繰り返して説明しない。具体的には、本実施例の技術案の適用シナリオによって、N個のアイテムの識別子に基づいて、N個のアイテムの相関情報を取得して、ユーザーに推奨することができる。例えば、インターネットショッピングのプラットフォームの場合は、N個のアイテムの識別子に基づいて、N個のアイテムの詳細情報や購入リンクを取得して、ユーザーに推奨することができる。
上記記載によると、本実施例のアイテム推奨方法の適用シナリオが、推奨待ちアイテムライブラリとユーザーの少なくとも二つの特徴情報を分かった場合である時、トレーニングされたユーザーがアイテムをクリックするタスクモデルに基づいて、ユーザーにアイテムライブラリの中のN個のアイテムの相関情報を推奨することを実現できることを知ることができる。
選択的に、本実施例の予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールを具備することができ、リコールのタスクモジュールとクリック率推定のタスクモジュールの間は、連合学習(Co-training)を受けて得られる。例えば、図2は、本実施例で提供されるユーザーがアイテムをクリックするタスクモデルの構成図である。図2に示すように、本実施例のユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールを具備するほかに、基本情報の処理モジュール、即ち、埋め込み(embedding)処理モジュールをさらに具備する。埋め込み処理モジュールは、ユーザーの少なくとも二つの特徴情報とアイテムの少なくとも二つの特徴情報についてそれぞれ埋め込み(embedding)処理を行い、スプライシングさせる。リコールのタスクモジュールとクリック率推定のタスクモジュールは、いずれもスプライシング後の表現を入力として使用して処理を行う。
ここで、リコールのタスクモジュールは、ユーザーについてのアイテム推奨度のインデックスの計算に使用され、当該推奨度のインデックスが高いほど、当該ユーザーにアイテムを推奨する際、当該アイテムがリコールされる可能性が大きい。逆に、当該推奨度のインデックスが小さいほど、当該アイテムがリコールされる可能性が小さい。
クリック率推定のタスクモジュールは、アイテムについてのユーザーのクリック率の予測に使用され、クリック率が大きいほど、当該ユーザーが当該アイテムについてのインタレストがより多く、当該アイテムをクリックする可能性が大きいことを表す。逆に、クリック率が小さいほど、ユーザーが当該アイテムについてのインタレストがより少なく、当該アイテムをクリックする可能性が小さいことを表す。
本実施例のユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールは、二つの互いに独立したタスクである。実際の適用において、埋め込み処理モジュールは、リコールのタスクモジュールと組み合わせて、一つの独立したタスクモデルを形成してリコールタスクを実現することができる。または、埋め込み処理モジュールは、クリック率推定のタスクモジュールと組み合わせて、一つの独立したタスクモデルを形成してクリック率推定を実現することができる。
例えば、本実施例では、ユーザーがアイテムをクリックするタスクモデルは、埋め込み処理モジュールとリコールのタスクモジュールのみ具備して、クリック率推定のタスクモジュールを具備しなくてもよい。当該タスクモデルをトレーニングした後、当該タスクモデルに基づいて、上述の図1に示される実施例のステップS101及びステップS102を実現することができる。
しかし、図2に示すように、ユーザーがアイテムをクリックするタスクモデルが、埋め込み処理モジュールとリコールのタスクモジュールのみ具備した場合、ユーザーの特徴表現とアイテムの特徴表現とは、最上位でユーザーについてのアイテム推奨度のインデックスを計算するときに乗ずるほかに、どのような相互作用もない。最上位の情報は既に圧縮されたものであり、モデルには最下位の特徴表現同士の特徴の相互作用が不足して、当該ユーザーがアイテムをクリックするタスクモデルのトレーニング時、ユーザーの特徴表現とアイテムの特徴表現とが完全に独立して、ユーザーとアイテムの間の交差情報を学習することができないので、トレーニングされたモデルのリコール効果が低下する。
図2に示される本実施例のユーザーがアイテムをクリックするタスクモデルは、クリック率推定のタスクモジュールをさらに導入しており、当該クリック率推定のタスクモジュールは、ユーザーの組み合わせ特徴表現とアイテムの組み合わせ特徴表現のスプライシング後の特徴に基づいて、クリック率を予測する。つまり、ユーザーの特徴表現とアイテムの特徴表現を相互作用させた。このように、トレーニング時、当該クリック率推定のタスクモジュールは、逆伝播を介して、埋め込み処理モジュールの中のembeddingパラメータに影響を与えることができ、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がembeddingパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。
このとき、これに応じて、ステップS101の実施際、トレーニングされた図2に示されるユーザーがアイテムをクリックするタスクモデルの中の、埋め込み処理モジュールとリコールのタスクモジュールの中のネットワーク構造のパラメータに基づいて、アイテムライブラリの各アイテムの少なくとも二つの特徴情報に基づいて、アイテムライブラリの各アイテムの特徴表現を取得することができる。アイテムライブラリの中のすべてのアイテムの特徴表現を組み合わせて、一つのアイテムの特徴表現のデータベースを構築する。
同様に、ステップS102の実施際、トレーニングされた図2に示されるユーザーがアイテムをクリックするタスクモデルの中の、埋め込み処理モジュールとリコールのタスクモジュールの中のネットワーク構造のパラメータに基づいて、ユーザーの少なくとも二つの特徴情報に基づいて、ユーザーの特徴表現を取得してもよい。
本実施例でのアイテムは、商品であるほかに、広告などのその他の情報であってもよく、また、他の分野で広告やその他の情報の推奨を実現することができることに留意すべきである。
本実施例のアイテム推奨の方法は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築し、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得し、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得し、N個のアイテムの識別子に基づいて、ユーザーにN個のアイテムの相関情報を推奨することで、既存の技術に比べて、本実施例の技術案は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルを使用してアイテムを推奨し、計算量を効果的に削減することができ、計算エラーを回避し、推奨精度を高めることができる。また、アイテム推奨のインテリジェンスを効果的に高め、アイテム推奨効率を向上させることができる。
また、本実施例のユーザーがアイテムをクリックするタスクモデルに含まれるリコールのタスクモジュールとクリック率推定のタスクモジュールは、二つの互いに独立したタスクであるので、クリック率推定のタスクモジュールにおいてユーザーの特徴表現とアイテムの特徴表現を相互作用させることができる。このように、トレーニング時、当該クリック率推定のタスクモジュールは、逆伝播を介して、埋め込み処理モジュールの中のembeddingパラメータに影響を与えることができ、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がembeddingパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させ、アイテム推奨の効果をより効果的に高めることができる。
図3は、本出願の実施例2の概略図であり、図3に示すように、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング方法は、具体的に、ステップS301、ステップS302を含むことができる。
ステップS301で、複数のトレーニングデータを収集し、各トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及びトレーニングユーザーがトレーニングアイテムに対するクリック相互作用情報を含む。
本実施例では、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法の実行主体は、ユーザーがアイテムをクリックするタスクモデルのトレーニング装置である。当該ユーザーがアイテムをクリックするタスクモデルのトレーニング装置は、電子エンティティであってもよく、またはソフトウェアが統合されたアプリケーションであってもよく、使用時、当該アプリケーションを大型コンピュータ装置により実行され、本実施例の技術案を使用して、当該ユーザーがアイテムをクリックするタスクモデルについてのトレーニングを実現する。
本実施例では、収集されたトレーニングデータの量は、百万以上超えることができ、収集されたトレーニングデータの件数が多いほど、トレーニングされたユーザーがアイテムをクリックするタスクモデルがより正確である。
本実施例では、収集された各トレーニングデータに含まれるトレーニングユーザーの少なくとも二つのトレーニング特徴情報とトレーニングアイテムの少なくとも二つのトレーニング特徴情報は、上述の図1に示される実施例のユーザーの少なくとも二つの特徴情報とアイテムの少なくとも二つの特徴情報を参照すればよく、ここで繰り返して説明しない。ここで、トレーニングユーザーがトレーニングアイテムに対するクリック相互作用情報は、ユーザーが当該トレーニングアイテムをクリックしたか、またはユーザーが当該トレーニングアイテムをクリックしなかったことを含むことができる。
本実施例でトレーニングデータを収集する際、サイトまたはアプリケーション(application;app)のイベントトラッキング(event tracking)を介してユーザーの過去に現れたクリック、動作データを取得して、トレーニングデータをマイニングする。
ステップS302で、複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行う。
トレーニング前、ユーザーがアイテムをクリックするタスクモデルの中のネットワーク構造の各層のパラメータについて、ランダムに初期化してから、ランダムに初期化されたパラメータに基づいて、ユーザーがアイテムをクリックするタスクモデルをトレーニングし始めなければならないことに留意すべきである。
本実施例のユーザーがアイテムをクリックするタスクモデルは、図2に示される構造を使用することができ、例えば、トレーニング時、具体的にステップ(a)からステップ(j)を含むことができる。
ステップ(a)において、各トレーニングデータについて、トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得る。
ステップ(b)において、トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得る。
埋め込み表現して得られたものがすべてベクトル様式的な表現なので、スプライシング後のトレーニングユーザーの組み合わせ特徴表現をまたトレーニングユーザーの組み合わせベクトルと呼ばれてもよく、スプライシング後のトレーニングアイテムの組み合わせ特徴表現をまたトレーニングアイテムの組み合わせベクトルとも呼ばれてもよい。
ステップ(c)において、リコールのタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現を、それぞれ完全接続(fully connected)処理や活性化(Activation)処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得る。
本実施例では、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を生成する過程で、完全接続処理や活性化処理の処理層を含む少なくとも二つの層を通じなければならず、具体的には、処理層の層数はトレーニングユーザーの特徴情報の量によって決定される。トレーニングユーザーの特徴情報の量が比較的多い場合に、情報の混合がより均一でかつより正確なトレーニングユーザーの特徴表現を得るように、処理層の層数も比較的多く要られる。トレーニングアイテムの特徴表現側の原理もこれに似ており、ここで繰り返して説明しない。例えば、図2のネットワーク構造により示すように、リコールのタスクモジュールの各層の処理層には、いずれも完全接続処理や活性化処理を含み、ここで、活性化処理はReLU活性化処理を使用してもよい。
ステップ(d)において、リコールのタスクモジュールにおいて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を乗じて、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスを得る。
本実施例では、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を乗じて得られたものはドット積(dot product)であり、当該ドット積は、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスを表すために使用される。
ステップ(e)において、クリック率推定のタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びsigmoid活性化関数の処理層を含む少なくとも二つの層の処理を通じて、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率を得る。
同様に、クリック率推定のタスクモジュールで、トレーニングユーザーの特徴情報とトレーニングアイテムの特徴情報の量が比較的多い場合、より多くの層数の処理層を設定して、特徴情報をより均一に混合して、より正確な特徴情報を得て、予測クリック確率の値を高める。同様に、図2に示されるネットワーク構造では、クリック率推定のタスクモジュールの各層の処理層にも、いずれも完全接続処理や活性化処理を含み、ここで、活性化処理はReLU活性化処理を使用してもよい。
ステップ(f)において、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックス、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率及び既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数(Cross Entropy Loss)を生成する。
例えば、当該ステップは、具体的に、下記のステップ(1)、ステップ(2)及びステップ(3)を含むことができる。
ステップ(1)において、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスと既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第1の交差エントロピー損失関数を生成する。
ステップ(2)において、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率と既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第2の交差エントロピー損失関数を生成する。
ステップ(3)において、第1の交差エントロピー損失関数と第2の交差エントロピー損失関数の和を求めて、総合的な交差エントロピー損失関数を得る。
例えば、本実施例の総合的な交差エントロピー損失関数は、下記式で表すことができる。
Figure 0007135255000001
ここで、
Figure 0007135255000002
は、第1の交差エントロピー損失関数を表し、
Figure 0007135255000003
は、リコールタスクの中の既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて得られたトレーニングユーザーに対するトレーニングアイテムの既知の推奨度のインデックスである。例えば、トレーニングユーザーがトレーニングアイテムに対して実際のクリック動作があった場合に、
Figure 0007135255000004
を1と表記して、そうでない場合、すなわち、実際の動作がなかった場合に、
Figure 0007135255000005
を0と表記する。
Figure 0007135255000006
は、トレーニングユーザーに対するトレーニングアイテムの予測推奨度のインデックスを表す。

Figure 0007135255000007
は、第2の交差エントロピー損失関数を表し、
Figure 0007135255000008
は、クリック率推定タスクの中の既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて得られたトレーニングユーザーがトレーニングアイテムに対する実際のクリック率である。クリックが1である場合、非クリックは0である。
Figure 0007135255000009
は、モデルによって予測されたクリック率である。
ステップ(g)において、総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、ステップ(h)を実行し、収束される場合は、ステップ(i)を実行する。
ステップ(h)において、ユーザーがアイテムをクリックするタスクモデルのパラメータを調整し、ステップ(a)に戻り、次のトレーニングデータを使用して継続してトレーニングを行う。
具体的に、組み込み処理モジュール、リコールのタスクモジュール及びクリック率推定のタスクモジュールの中のネットワーク構造のパラメータを調整することを含むことができる。
ステップ(i)において、第1の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、ステップ(j)を実行して、収束されていない場合は、ステップ(a)に戻り、次のトレーニングデータを使用して継続してトレーニングを行う。
ステップ(j)において、ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、ユーザーがアイテムをクリックするタスクモデルを決定する。
選択的に、ステップ(i)で総合的な交差エントロピー損失関数が、第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、継続して複数のトレーニングデータを使用して、第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、リコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定して、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定するステップをさらに含むことができる。
言い換えると、本実施例のユーザーがアイテムをクリックするタスクモデルの中のクリック率推定のタスクモジュールは、単にモデルをトレーニングする過程のみに使用され、ユーザーの特徴表現とアイテムの特徴表現の相互作用を導入するために使用され、再トレーニング時、逆伝播を介して埋め込み処理モジュールの中のembeddingパラメータに影響を与え、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がembeddingパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。また、リコールの効果をより一層高めるために、リコールのタスクモジュールのネットワーク構造のパラメータを最適化し、本実施例では、総合的な交差エントロピー損失関数が収束するようにトレーニングした後、さらにリコールのタスクモジュールのネットワーク構造のパラメータを調整して、第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するようにして、リコールのタスクモジュールのパラメータを決定し、リコールのタスクモジュールを決定して、ユーザーがアイテムをクリックするタスクモデルを決定する。
本実施例の第1の連続予定ループ数及び第2の連続予定ループ数は、実際の需要に応じて、100、200、またはその他の数値に設定することができ、ここでこれに対して限定しない。
図1に示される実施例で使用された、トレーニングされたユーザーがアイテムをクリックするタスクモデルは、上述のトレーニング方法を使用してトレーニングされたユーザーがアイテムをクリックするタスクモデルである。
本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング方法は、上述の技術案を使用することにより、リコールタスクとクリック率推定タスクを同時にトレーニングすることができ、トレーニング時、逆伝播を介して、埋め込み処理モジュールの中のembeddingパラメータに影響を与え、ユーザーの特徴表現とアイテムの特徴表現の間の相互作用がある情報がembeddingパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。したがって、本実施例の技術案によってトレーニングされたユーザーがアイテムをクリックするタスクモデルは、リコール効果を効果的に高めることができ、当該ユーザーがアイテムをクリックするタスクモデルに基づいてアイテムを推奨する際、推奨精度をに高めることができ、アイテム推奨効率を向上させることができる。
また、本実施例のトレーニングにおいて、総合的な交差エントロピー損失関数が第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、また、継続して複数のトレーニングデータを使用して、第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定し、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定することにより、リコール効果をより一層高めることができ、推奨精度を高めることができ、アイテム推奨効率を向上させることができる。
図4は、本出願に係る実施例3の概略図である。図4に示すように、本実施例のアイテム推奨システム400は、具体的に、構築モジュール401、特徴取得モジュール402、アイテム取得モジュール403及び推奨モジュール404を具備する。
構築モジュール401は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する。
特徴取得モジュール402は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する。
アイテム取得モジュール403は、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得する。
オススメモジュール404は、N個のアイテムの識別子に基づいて、ユーザーにN個のアイテムの相関情報を推奨する。
選択的に、本実施例のアイテム推奨システム400のアイテム取得モジュール403は、
アイテムの特徴表現のデータベースからユーザーの特徴表現と相関性が最も高いN個のアイテムの特徴表現を検索し、
N個のアイテムの特徴表現に対応するN個のアイテムの識別子を取得する。
選択的に、本実施例のアイテム推奨システム400において、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールを具備することができ、リコールのタスクモジュールとクリック率推定のタスクモジュールの間は、連合学習(Co-training)を受ける。
本実施例のアイテム推奨システム400にとって、上述のモジュールによるアイテム推奨を実現する実現原理と技術的効果は、上述の関連方法の実施例の実現と同じであり、詳細は、上述の関連方法の実施例の記載を参照すればよく、ここで繰り返して説明しない。
図5は、本出願に係る実施例4の概略図である。図5に示すように、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置500は、収集モジュール501、トレーニングモジュール502を具備する。
収集モジュール501は、複数のトレーニングデータを収集し、各トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及びトレーニングユーザーがトレーニングアイテムに対するクリック相互作用情報を含む。
トレーニングモジュール502は、複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行う。
選択的に、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置500において、トレーニングモジュール502は、具体的に
各トレーニングデータについて、トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得て、
トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得て、
リコールのタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現を、それぞれ完全接続(fully connected)処理や活性化(Activation)処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得て、
リコールのタスクモジュールにおいて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を乗じて、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスを得て、
クリック率推定のタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びsigmoid活性化関数の処理層を含む少なくとも二つの層の処理を通じて、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率を得て、
トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックス、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率及び既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数(Cross Entropy Loss)を生成し、
総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、ユーザーがアイテムをクリックするタスクモデルのパラメータを調整し、
収束される場合は、第1の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、ユーザーがアイテムをクリックするタスクモデルを決定する。
選択的に、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置500において、トレーニングモジュール502は、
トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスと既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第1の交差エントロピー損失関数を生成し、
トレーニングアイテムに対するトレーニングユーザーの予測クリック確率と既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第2の交差エントロピー損失関数を生成し、
第1の交差エントロピー損失関数と第2の交差エントロピー損失関数の和を求めて、総合的な交差エントロピー損失関数を得る。
選択的に、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置500において、トレーニングモジュール502は、
総合的な交差エントロピー損失関数が第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、継続して複数のトレーニングデータを使用して、第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、リコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定して、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定する。
本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置500において、上述のモジュールによるユーザーがアイテムをクリックするタスクモデルのトレーニングを実現する実現原理と技術的効果は、上述の関連方法の実施例の実現と同じであり、詳細は、上述の関連実施例の記載を参照すればよく、ここで繰り返して説明しない。
本発明に係る実施例によれば、本発明は、電子機器と可読記憶媒体を提供する。
図6に示すように、本出願の実施例によるユーザークリックモデルのトレーニング又はリソース推奨方法の電子機器のブロック図である。電子機器は、様々な形式のデジタルコンピューター、例えば、ラップトップ、デスクトップ、ワークステーション、携帯情報端末、サーバー、ブレードサーバ、メインフレームコンピューター、及び他の適切なコンピューターであることが意図される。電子機器は、様々な種類のモバイル装置、例えば、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティング装置を示してもよい。ここで示した構成要素、これらの接続及び関係、ならびにこれらの機能は例示にすぎなく、本明細書において説明及び/又は請求される本出願の実現を限定することが意図されない。
図6に示すように、上記電子機器は、一つ又は複数のプロセッサー601、メモリ602、及び各構成要素に接続するためのインターフェースを含み、高速インターフェース及び低速インターフェースを含む。各構成要素は、異なるバスで相互接続され、そして、共通マザーボードに、又は必要に応じて、他の方式で実装されてもよい。プロセッサーは、電子機器内で実行されるコマンドを処理してもよく、メモリに又はメモリ上で外部入力/出力装置(例えば、インターフェースに結合される表示装置)にグラフィカルユーザーインターフェースのグラフィカル情報を表示するコマンドを含む。他の実施形態において、複数のプロセッサー及び/又は複数のバスが、適宜、複数のメモリ及びメモリのタイプとともに用いられてもよい。同様に、複数の電子機器が接続されてもよく、それぞれの装置が(例えば、サーババンク、ブレードサーバの集まり、又はマルチプロセッサーシステムとして)必要な操作の一部を提供する。図6において、一つのプロセッサー601を例にとる。
メモリ602は、本出願で提供される非一時的コンピューター可読記録媒体である。なお、メモリは、少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、少なくとも一つのプロセッサーに本出願で提供されるアイテム推奨方法やユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させる。本出願の非一時的コンピューター可読記録媒体は、上記ココンピューターに本出願で提供されるアイテム推奨方法やユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させるためのコンピューターコマンドが記憶されている。
メモリ602は、非一時的コンピューター可読記録媒体として、非一時的ソフトウェアプログラム、非一時的コンピューター実行可能なプログラム、モジュール、例えば、本出願の実施例におけるアイテム推奨方法またはユーザーがアイテムをクリックするタスクモデルのトレーニング方法に対応するプログラムコマンド/モジュール(例えば、図4に示すモジュールのそれぞれ及び図5に示すモジュールのそれぞれ)を記憶するために用いられる。プロセッサー601は、メモリ602に記憶されている非一時的ソフトウェアプログラム、コマンド及びモジュールを実行することで、サーバーの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記の方法実施例におけるアイテム推奨の方法またはユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現する。
メモリ602は、記憶プログラム領域及び記憶データ領域を含んでもよく、記憶プログラム領域はオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶してもよく、記憶データ領域は、アイテム推奨方法またはユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現するための電子機器の使用により作成されたデータなどを記憶してもよい。また、メモリ602は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的メモリを含んでもよく、例えば、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体記憶装置を含んでもよい。幾つかの実施例において、メモリ602は、プロセッサー601に対してリモートに設置されたメモリを選択的に含んでもよく、これらのリモートメモリは、ネットワークを介してアイテム推奨の方法またはユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現するための電子機器に接続されてもよい。上記のネットワークの例には、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。
アイテム推奨方法やユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現するための電子機器は、入力装置603及び出力装置604をさらに含むことができる。プロセッサー601、メモリ602、入力装置603及び出力装置604はバス又は他の方式で接続されてもよく、図6に、バスで接続されることを例にとる。
入力装置603は、入力された数値又は文字情報を受信し、また、アイテム推奨方法やユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現するための電子機器のユーザー設定と機能制御に関連するキー信号入力を生成でき、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置604は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モーター)などを含むことができる。上記表示装置は、液晶ディスプレイ(LCD)、発光ダイオードディスプレイ(LED)、及びプラズマディスプレイを含み得るが、これらに限定されない。いくつかの実施形態では、表示装置はタッチスクリーンであってもよい。
本明細書に説明されるシステム及び技術的様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向け集積回路、コンピューターハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及びコマンドを受信し、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置にデータ及びコマンドを送信するようにつなげられた、特殊用途でもよく一般用途でもよい少なくとも一つのプログラマブルプロセッサーを含む、プログラム可能なシステム上で実行可能及び/又は解釈可能な一つ又は複数のコンピュータープログラムにおける実行を含んでもよい。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又は、コードとも称される)は、プログラマブルプロセッサーの機械コマンドを含み、高水準のプロセス及び/もしくはオブジェクト向けプログラミング言語、及び/又はアセンブリ/機械言語で実行されることができる。本明細書で用いられる「機械可読媒体」という用語は、機械可読信号としての機械コマンドを受け取る機械可読媒体を含むプログラマブルプロセッサーに機械コマンド及び/又はデータを提供するのに用いられる任意のコンピュータープログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、及びプログラマブル論理デバイス)を指す。「機械可読信号」という用語は、プログラマブルプロセッサーに機械コマンド及び/又はデータを提供するために用いられる任意の信号を指す。
ユーザーとのインタラクトを提供するために、本明細書に説明されるシステムと技術は、ユーザーに対して情報を表示するためのディスプレイデバイス(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)、ユーザーがコンピューターに入力を与えることができるキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)を有するコンピューター上に実施されることが可能である。その他の種類の装置は、さらに、ユーザーとのインタラクションを提供するために使用されることが可能であり、例えば、ユーザーに提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック)であり得、ユーザーからの入力は、任意の形態で(音響、発話、又は触覚による入力を含む)受信され得る。
本明細書に説明されるシステムと技術的実施形態は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド構成要素を含むコンピューティングシステム(例えば、グラフィカルユーザーインターフェースもしくはウェブブラウザを有するクライアントコンピューターであり、ユーザーは、上記グラフィカルユーザーインターフェースもしくは上記ウェブブラウザを通じて本明細書で説明されるシステムと技術的実施形態とインタラクションすることができる)、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。ステムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、ワイド・エリア・ネットワーク(WAN)、インターネットワークを含む。
コンピューターシステムは、クライアントとサーバーを含み得る。クライアントとサーバーは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバーとの関係は、相応するコンピューター上で実行さ、互いにクライアント-サーバーの関係にあるコンピュータープログラムによって生じる。
本出願の実施例に係る技術案は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築し、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得し、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得し、N個のアイテムの識別子に基づいて、ユーザーにN個のアイテムの相関情報を推奨することで、既存の技術に比べて、本出願の本実施例の技術案は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルを使用してアイテムを推奨し、計算量を効果的に削減することができ、計算エラーを回避し、推奨精度を高めることができる。また、アイテム推奨のインテリジェンスを効果的に高め、アイテム推奨効率を向上させることができる。
また、本出願の実施形態に係る技術案において、ユーザーがアイテムをクリックするタスクモデルに含まれるリコールのタスクモジュールとクリック率推定のタスクモジュールは、二つの互いに独立したタスクであるので、クリック率推定のタスクモジュールにおいてユーザーの特徴表現とアイテムの特徴表現を相互作用させることができる。このように、トレーニング時、当該クリック率推定のタスクモジュールは、逆伝播を介して、埋め込み処理モジュールの中のembeddingパラメータに影響を与えることができ、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がembeddingパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させ、アイテム推奨の効果をより効果的に高めることができる。
本出願の実施形態に係る技術案において、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法は、リコールタスクとクリック率推定タスクを同時にトレーニングすることができ、トレーニング時、逆伝播を介して、埋め込み処理モジュールの中のembeddingパラメータに影響を与え、ユーザーの特徴表現とアイテムの特徴表現の間の相互作用がある情報がembeddingパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。したがって、本出願における実施例の技術案によってトレーニングされたユーザーがアイテムをクリックするタスクモデルは、リコール効果を効果的に高めることができ、当該ユーザーがアイテムをクリックするタスクモデルに基づいてアイテムを推奨する際、推奨精度をに高めることができ、アイテム推奨効率を向上させることができる。
また、本出願の実施形態に係る技術案において、総合的な交差エントロピー損失関数が第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、また、継続して複数のトレーニングデータを使用して、第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定し、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定することにより、リコール効果をより一層高めることができ、推奨精度を高めることができ、アイテム推奨効率を向上させることができる。
以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本出願に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本出願で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。
上記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、本出願の保護範囲内に含まれるべきである。

Claims (17)

  1. 予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、コンピューターがアイテムの特徴表現のデータベースを構築するステップと、
    前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、前記コンピューターがユーザーの特徴表現を取得するステップと、
    前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースとに基づいて、前記コンピューターが推奨待ちN個のアイテムの識別子を取得するステップと、
    前記N個のアイテムの識別子に基づいて、前記コンピューターが前記ユーザーに前記N個のアイテムの相関情報を推奨するステップと、を含む
    コンピューターにより実行される、アイテム推奨方法。
  2. 前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースとに基づいて、前記コンピューターが推奨待ちN個のアイテムの識別子を取得するステップは、
    前記アイテムの特徴表現のデータベースから前記ユーザーの特徴表現と相関性が最も高いN個のアイテムの特徴表現を前記コンピューターが検索するステップと、
    前記N個のアイテムの特徴表現に対応される前記N個のアイテムの識別子を前記コンピューターが取得するステップと、を含む
    請求項1に記載のアイテム推奨方法。
  3. 予めトレーニングされた、前記ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールとを具備し、前記リコールのタスクモジュールと前記クリック率推定のタスクモジュールの間は連合学習を受ける
    請求項1又は請求項2に記載のアイテム推奨方法。
  4. 複数のトレーニングデータをコンピューターが収集するステップと、
    前記複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールとについて前記コンピューターが連合学習を行うステップと、を含み、
    各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む
    コンピューターにより実行される、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法。
  5. 前記複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールとについて前記コンピューターが連合学習を行うステップは、
    各前記トレーニングデータについて、前記トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、前記コンピューターがトレーニングユーザーの組み合わせ特徴表現を得るステップと、
    前記トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、前記コンピューターがトレーニングアイテムの組み合わせ特徴表現を得るステップと、
    前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現とを、それぞれ完全接続処理や活性化処理の処理層を含む少なくとも二つの層の処理を通じて、前記コンピューターがトレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現とを得るステップと、
    前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの特徴表現と前記トレーニングアイテムの特徴表現とを乗じて、前記コンピューターが前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスを得るステップと、
    前記クリック率推定のタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びsigmoid活性化関数の処理層を含む少なくとも二つの層の処理を通じて、前記コンピューターが前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率を得るステップと、
    前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが総合的な交差エントロピー損失関数を生成するステップと、
    前記総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを前記コンピューターが調整するステップと、
    収束される場合は、第1の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、前記ユーザーがアイテムをクリックするタスクモデルを前記コンピューターが決定するステップと、を含む
    請求項4に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法。
  6. 前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが総合的な交差エントロピー損失関数を生成するステップは、
    前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスと既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが第1の交差エントロピー損失関数を生成するステップと、
    前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率と既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが第2の交差エントロピー損失関数を生成するステップと、
    前記第1の交差エントロピー損失関数と前記第2の交差エントロピー損失関数の和を求めて、前記コンピューターが前記総合的な交差エントロピー損失関数を得るステップと、を含む
    請求項5に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法。
  7. 前記総合的な交差エントロピー損失関数が、前記第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、前記方法は、
    継続して前記複数のトレーニングデータを使用して、前記第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、前記リコールのタスクモジュールをトレーニングし、前記リコールのタスクモジュールのパラメータを決定して、前記リコールのタスクモジュールを決定し、前記ユーザーがアイテムをクリックするタスクモデルを前記コンピューターが決定するステップをさらに含む
    請求項6に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法。
  8. 予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する構築モジュールと、
    前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する特徴取得モジュールと、
    前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースとに基づいて、推奨待ちN個のアイテムの識別子を取得するアイテム取得モジュールと、
    前記N個のアイテムの識別子に基づいて、前記ユーザーに前記N個のアイテムの相関情報を推奨する推奨モジュールと、を具備する
    アイテム推奨システム。
  9. 前記アイテム取得モジュールは、
    前記アイテムの特徴表現のデータベースから前記ユーザーの特徴表現と相関性が最も高いN個のアイテムの特徴表現を検索し、
    前記N個のアイテムの特徴表現に対応される前記N個のアイテムの識別子を取得する
    請求項8に記載のアイテム推奨システム。
  10. 予めトレーニングされた、前記ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールとを具備し、前記リコールのタスクモジュールと前記クリック率推定のタスクモジュールの間は連合学習を受ける
    請求項8又は請求項9に記載のアイテム推奨システム。
  11. 複数のトレーニングデータを収集する収集モジュールと、
    前記複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールとについて連合学習を行うトレーニングモジュールと、
    各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む
    ユーザーがアイテムをクリックするタスクモデルのトレーニング装置。
  12. 前記トレーニングモジュールは、
    各前記トレーニングデータについて、前記トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得て、
    前記トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得て、
    前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現とを、それぞれ完全接続処理や活性化処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得て、
    前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの特徴表現と前記トレーニングアイテムの特徴表現とを乗じて、前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスを得て、
    前記クリック率推定のタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びsigmoid活性化関数の処理層を含む少なくとも二つの層の処理を通じて、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率を得て、
    前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数を生成して、
    前記総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを調整して、
    収束される場合は、第1の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、前記ユーザーがアイテムをクリックするタスクモデルを決定する
    請求項11に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング装置。
  13. 前記トレーニングモジュールは、
    前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスと既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第1の交差エントロピー損失関数を生成して、
    前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率と既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第2の交差エントロピー損失関数を生成して、
    前記第1の交差エントロピー損失関数と前記第2の交差エントロピー損失関数の和を求めて、前記総合的な交差エントロピー損失関数を得る
    請求項12に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング装置。
  14. 前記トレーニングモジュールは、
    前記総合的な交差エントロピー損失関数が、前記第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、継続して前記複数のトレーニングデータを使用して、前記第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、前記リコールのタスクモジュールをトレーニングし、前記リコールのタスクモジュールのパラメータを決定して、前記リコールのタスクモジュールを決定し、前記ユーザーがアイテムをクリックするタスクモデルを決定する
    請求項13に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング装置。
  15. 少なくとも一つのプロセッサーと、
    前記少なくとも一つのプロセッサーに通信接続されるメモリと、を具備し、
    前記メモリには、前記少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも一つのプロセッサーによって実行されることで、請求項1から3のいずれか一項に記載のアイテム推奨方法または請求項4から7のいずれか一項に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法を前記少なくとも一つのプロセッサーに実行させる、電子機器。
  16. コンピューターに請求項1から3のいずれか一項に記載のアイテム推奨方法または請求項4から7のいずれか一項に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させるためのコンピューターコマンドが記憶されている非一時的コンピューター可読記録媒体。
  17. コンピューターに請求項1から3のいずれか一項に記載のアイテム推奨方法または請求項4から7のいずれか一項に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させるためのコンピュータープログラム。
JP2021007184A 2020-01-22 2021-01-20 アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体 Active JP7135255B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010073347.4 2020-01-22
CN202010073347.4A CN111259222B (zh) 2020-01-22 2020-01-22 物品推荐方法、系统、电子设备及存储介质

Publications (2)

Publication Number Publication Date
JP2021118000A JP2021118000A (ja) 2021-08-10
JP7135255B2 true JP7135255B2 (ja) 2022-09-13

Family

ID=70950995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021007184A Active JP7135255B2 (ja) 2020-01-22 2021-01-20 アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体

Country Status (5)

Country Link
US (1) US20210224879A1 (ja)
EP (1) EP3855369A3 (ja)
JP (1) JP7135255B2 (ja)
KR (1) KR102476056B1 (ja)
CN (1) CN111259222B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113744011A (zh) * 2020-06-17 2021-12-03 北京沃东天骏信息技术有限公司 物品搭配方法和物品搭配装置
CN112766406A (zh) * 2021-01-29 2021-05-07 北京达佳互联信息技术有限公司 物品图像的处理方法、装置、计算机设备及存储介质
CN113360770B (zh) * 2021-06-30 2024-04-12 北京百度网讯科技有限公司 内容推荐的方法、装置、设备以及存储介质
CN113836144B (zh) * 2021-09-28 2023-01-24 厦门市美亚柏科信息股份有限公司 一种基于字段推荐数据库标准表的方法及装置
CN114139052B (zh) * 2021-11-19 2022-10-21 北京百度网讯科技有限公司 用于智能推荐的排序模型训练方法、智能推荐方法及装置
CN114564496B (zh) * 2022-03-01 2023-09-19 北京有竹居网络技术有限公司 一种内容推荐方法及装置
CN114707070A (zh) * 2022-04-12 2022-07-05 华为技术有限公司 一种用户行为预测方法及其相关设备
CN114783563A (zh) * 2022-05-10 2022-07-22 浙江工业大学 一种视觉训练的推荐方法
CN116578875B (zh) * 2023-07-12 2023-11-10 深圳须弥云图空间科技有限公司 基于多行为的点击预测模型训练方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016115316A (ja) 2014-12-18 2016-06-23 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 処理装置、処理方法、推測装置、推測方法、およびプログラム
JP2018005662A (ja) 2016-07-05 2018-01-11 ヤフー株式会社 情報解析装置、情報解析方法、および情報解析プログラム
JP2018063484A (ja) 2016-10-11 2018-04-19 凸版印刷株式会社 ユーザ評価予測システム、ユーザ評価予測方法及びプログラム
JP2018181326A (ja) 2017-04-06 2018-11-15 ネイバー コーポレーションNAVER Corporation ディープラーニングを活用した個人化商品推薦

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654329A (zh) * 2015-01-22 2016-06-08 香港中文大学深圳研究院 一种整合性推荐方法及装置
US10824941B2 (en) * 2015-12-23 2020-11-03 The Toronto-Dominion Bank End-to-end deep collaborative filtering
CN106169150A (zh) * 2016-06-29 2016-11-30 广州市香港科大霍英东研究院 基于用户兴趣预测的物品推荐方法和装置
KR20180121466A (ko) * 2017-04-06 2018-11-07 네이버 주식회사 딥러닝을 활용한 개인화 상품 추천
US11093992B2 (en) * 2017-05-05 2021-08-17 Reai Inc. Smart matching for real estate transactions
CN107273438B (zh) * 2017-05-24 2021-02-23 深圳大学 一种推荐方法、装置、设备及存储介质
CN107392644A (zh) * 2017-06-19 2017-11-24 华南理工大学 一种商品购买预测建模方法
CN109903103B (zh) * 2017-12-07 2021-08-20 华为技术有限公司 一种推荐物品的方法和装置
KR102061331B1 (ko) * 2018-03-22 2019-12-31 네이버 주식회사 아이템 추천 방법 및 시스템
US20190303835A1 (en) * 2018-03-30 2019-10-03 Microsoft Technology Licensing, Llc Entity representation learning for improving digital content recommendations
CN109191240B (zh) * 2018-08-14 2021-06-08 北京九狐时代智能科技有限公司 一种进行商品推荐的方法和装置
CN109191196A (zh) * 2018-08-23 2019-01-11 深圳码隆科技有限公司 一种基于用户特征的商品推荐方法、装置和用户终端
CN109543066B (zh) * 2018-10-31 2021-04-23 北京达佳互联信息技术有限公司 视频推荐方法、装置和计算机可读存储介质
CN109547814B (zh) * 2018-12-13 2021-07-16 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN110008399B (zh) * 2019-01-30 2023-04-07 创新先进技术有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN109993627B (zh) * 2019-02-28 2021-09-07 华为技术有限公司 推荐方法、推荐模型的训练方法、装置和存储介质
CN110084670B (zh) * 2019-04-15 2022-03-25 东北大学 一种基于lda-mlp的货架商品组合推荐方法
CN110298725A (zh) * 2019-05-24 2019-10-01 北京三快在线科技有限公司 商品组合的推荐方法、装置、电子设备及可读存储介质
CN110457589B (zh) * 2019-08-19 2020-05-12 上海新共赢信息科技有限公司 一种车辆推荐方法、装置、设备及存储介质
CN110599295B (zh) * 2019-08-22 2022-04-08 创新先进技术有限公司 物品的推送方法、装置及设备
CN110599307A (zh) * 2019-09-17 2019-12-20 北京三快在线科技有限公司 一种商品推荐的方法及装置
CN110674406A (zh) * 2019-09-29 2020-01-10 百度在线网络技术(北京)有限公司 推荐方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016115316A (ja) 2014-12-18 2016-06-23 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 処理装置、処理方法、推測装置、推測方法、およびプログラム
JP2018005662A (ja) 2016-07-05 2018-01-11 ヤフー株式会社 情報解析装置、情報解析方法、および情報解析プログラム
JP2018063484A (ja) 2016-10-11 2018-04-19 凸版印刷株式会社 ユーザ評価予測システム、ユーザ評価予測方法及びプログラム
JP2018181326A (ja) 2017-04-06 2018-11-15 ネイバー コーポレーションNAVER Corporation ディープラーニングを活用した個人化商品推薦

Also Published As

Publication number Publication date
CN111259222A (zh) 2020-06-09
CN111259222B (zh) 2023-08-22
KR102476056B1 (ko) 2022-12-08
KR20210095579A (ko) 2021-08-02
EP3855369A3 (en) 2022-01-26
US20210224879A1 (en) 2021-07-22
EP3855369A2 (en) 2021-07-28
JP2021118000A (ja) 2021-08-10

Similar Documents

Publication Publication Date Title
JP7135255B2 (ja) アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体
JP7250052B2 (ja) 自然言語及び知識グラフに基づく表現学習方法及び装置
JP7076030B2 (ja) ユーザーインタラクション情報処理モデルの生成方法と装置、ユーザーインタラクション情報処理方法と装置、設備、媒体、及びプログラム
US20180285759A1 (en) Online hyperparameter tuning in distributed machine learning
US11551239B2 (en) Characterizing and modifying user experience of computing environments based on behavior logs
JP7316453B2 (ja) オブジェクト推薦方法及び装置、コンピュータ機器並びに媒体
CN111582479B (zh) 神经网络模型的蒸馏方法和装置
US10102503B2 (en) Scalable response prediction using personalized recommendation models
CN111311321B (zh) 用户消费行为预测模型训练方法、装置、设备及存储介质
CN112070226A (zh) 在线预测模型的训练方法、装置、设备及存储介质
JP7262539B2 (ja) 会話推薦方法、装置及び機器
CN112632403B (zh) 推荐模型的训练方法、推荐方法、装置、设备和介质
EP3353670A1 (en) Regularized model adaptation for in-session recommendations
Jia et al. Dom-q-net: Grounded rl on structured language
CN112163676A (zh) 多任务服务预测模型训练方法、装置、设备以及存储介质
US11947578B2 (en) Method for retrieving multi-turn dialogue, storage medium, and electronic device
CN112288483A (zh) 用于训练模型的方法和装置、用于生成信息的方法和装置
CN111324715A (zh) 问答机器人的生成方法和装置
Jain et al. Know your action set: Learning action relations for reinforcement learning
CN111563198A (zh) 一种物料召回方法、装置、设备及存储介质
JP7128311B2 (ja) 文書種別の推奨方法、装置、電子機器、可読記憶媒体及びコンピュータプログラム製品
CN111311000B (zh) 用户消费行为预测模型训练方法、装置、设备及存储介质
CN112579889A (zh) 物品推荐方法、装置、电子设备及存储介质
US20230394095A1 (en) Systems and methods for a search tool of code snippets
CN117541323A (zh) 用于训练模型的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220802

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220809

R150 Certificate of patent or registration of utility model

Ref document number: 7135255

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150