JP2023545896A - シーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワーク - Google Patents
シーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワーク Download PDFInfo
- Publication number
- JP2023545896A JP2023545896A JP2023513552A JP2023513552A JP2023545896A JP 2023545896 A JP2023545896 A JP 2023545896A JP 2023513552 A JP2023513552 A JP 2023513552A JP 2023513552 A JP2023513552 A JP 2023513552A JP 2023545896 A JP2023545896 A JP 2023545896A
- Authority
- JP
- Japan
- Prior art keywords
- user
- information
- click
- item
- framework
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013507 mapping Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 6
- 230000009471 action Effects 0.000 claims description 4
- 230000002431 foraging effect Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 abstract description 5
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 239000000047 product Substances 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Neurology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本発明は、シーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワークを開示する。本発明の有益な効果は以下の通りであり、第一に、ユーザー過去のクリックシーケンスにクリック率推定モデルが統合され、ユーザーの興味好みをよりよく捉え、ユーザーの描写精度を効果的に向上させたることと、第二に、アルゴリズムのフレームワークで、特徴組み合わせのモデル能力を保持すると同時に、ユーザーの興味と結合して、多種類のモデルを通じて表徴マッピング層を共有し、より正確にアイテムの表徴を学習し、さらに推薦モデルの正確性を高めることと、第三に、モデルトレーニング時に2つのサブネットワークが融合した後に連合学習し、オフラインサービスはフレームワーク全体を使用して推定し、オンラインサービスはユーザー興味のサブネットワークのみを使用して推定し、推薦の正確性を保証しながら軽量化配置を実現すること。【選択図】図1
Description
本発明はインターネット推薦システムの分野に関し、特にシーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワークに関する。
インターネット推薦システムは、アルゴリズムによってユーザーが興味を持つと思われるアイテムを見つけてユーザーに提示するシステムを指す。それはすでに電子商取引、広告、音声ビデオなどのインターネット製品に不可欠な一部となっている。
推薦システムにおけるクリック率の推定は、ユーザの属性、過去の行動、材料の属性などの情報に基づいてユーザが商品をクリックする可能性を判断することを指す。インターネット製品は、クリック率の高いアイテムをユーザーに提示し、ユーザーの転化を促進し、満足度を高め、インターネット製品の新しい活性化を実現する。
本願はこのシーンに対して、シーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワークを提案し、エンドツーエンドのモデルフレームワークを通じて、ユーザーの好みとアイテム特徴をより正確に描写し、推薦システムのクリック率推定の正確性を向上させた。
本発明が解決しようとする技術的な課題は従来技術の欠陥を克服し、シーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワークを提案する。
上記技術的な課題を解決するために、本発明は以下の技術的手段を提供し、
本発明は、以下のステップを含むシーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワークを提案し、
ユーザUが露出したアイテムE、クリックしたアイテムC(ここで、C∈E)及び各行為のタイムスタンプを含むユーザとアイテムのインタラクティブログを収集すると同時に、ユーザー特徴情報(年齢、性別、地域など)、アイテム特徴情報(カテゴリ、ブランド、店舗など)を保存するS1と、
収集されたログ情報を以下2つのセクションを含む構造化データに整理するS2と、
1)図2に示すように、各ユーザーが露出しクリックなし/クリックありのアイテムをクリック時間順にソートし、k個のクリックアイテムを単位として切り取ってサンプルデータを生成するユーザークリックアイテムのシーケンスデータと、
2)<ユーザー番号、アイテム番号>をサンプル主キーとし、ここで、露出しクリックなしのサンプルは0としてマークされ、露出しクリックありのサンプルは1としてマークされると同時に、ユーザー特徴情報、アイテム特徴情報、ユーザーとアイテムのインタラクティブ情報をサンプル特徴として整理するクリック分類サンプルデータ、
上記2つのセクションのデータを本アルゴリズムフレームワークに導入して学習を行い、2つのセクションのデータはそれぞれフレームワークにおける以下2つのサブネットワークに対応するS3と、
1)上記ユーザークリックアイテムのシーケンスデータを使用して、ユーザークリックシーケンスのアイテムID及び特徴情報を入力し、embedding層を経て稠密ベクトルにマッピングされ、sum pooling層を経てユーザ歴史的な興味好みを示すとともに、ユーザー特徴情報と候補アイテムはe、mbedding層を経て稠密ベクトルにマッピングされ、前記ユーザ歴史的な興味好みと結合して圧縮され、ユーザ情報、ユーザ歴史的な興味、対象アイテム間のネットワーク関係を構築し、さらに全結合層とsigmoid関数を通じて、ネットワークパラメータをトレーニングし、図3に示すように、Loss functionは以下の式で表されるユーザ興味のサブネットワークと、
本発明は、以下のステップを含むシーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワークを提案し、
ユーザUが露出したアイテムE、クリックしたアイテムC(ここで、C∈E)及び各行為のタイムスタンプを含むユーザとアイテムのインタラクティブログを収集すると同時に、ユーザー特徴情報(年齢、性別、地域など)、アイテム特徴情報(カテゴリ、ブランド、店舗など)を保存するS1と、
収集されたログ情報を以下2つのセクションを含む構造化データに整理するS2と、
1)図2に示すように、各ユーザーが露出しクリックなし/クリックありのアイテムをクリック時間順にソートし、k個のクリックアイテムを単位として切り取ってサンプルデータを生成するユーザークリックアイテムのシーケンスデータと、
2)<ユーザー番号、アイテム番号>をサンプル主キーとし、ここで、露出しクリックなしのサンプルは0としてマークされ、露出しクリックありのサンプルは1としてマークされると同時に、ユーザー特徴情報、アイテム特徴情報、ユーザーとアイテムのインタラクティブ情報をサンプル特徴として整理するクリック分類サンプルデータ、
上記2つのセクションのデータを本アルゴリズムフレームワークに導入して学習を行い、2つのセクションのデータはそれぞれフレームワークにおける以下2つのサブネットワークに対応するS3と、
1)上記ユーザークリックアイテムのシーケンスデータを使用して、ユーザークリックシーケンスのアイテムID及び特徴情報を入力し、embedding層を経て稠密ベクトルにマッピングされ、sum pooling層を経てユーザ歴史的な興味好みを示すとともに、ユーザー特徴情報と候補アイテムはe、mbedding層を経て稠密ベクトルにマッピングされ、前記ユーザ歴史的な興味好みと結合して圧縮され、ユーザ情報、ユーザ歴史的な興味、対象アイテム間のネットワーク関係を構築し、さらに全結合層とsigmoid関数を通じて、ネットワークパラメータをトレーニングし、図3に示すように、Loss functionは以下の式で表されるユーザ興味のサブネットワークと、
ここで、nはサンプルの総量であり、yはクリックするかどうかのラベルであり、pは出力層の確率値であり、
2)上記クリック分類サンプルデータを使用して、露出した<ユーザ、アイテム>サンプルペアに対して、ユーザの属性情報、アイテムの属性情報、ユーザとアイテムのインタラクティブ情報を補助し、ユーザがクリックしたかどうかをラベルとして二項分類学習を行い、入力された特徴情報は共有embedding層を経て稠密ベクトルにマッピングされ、伝統的なDNNネットワークを経て特徴組み合わせの交差を実現し、最終的にsigmoid関数を経て分類学習を行い、図4に示すように、Loss functionは以下の式で表される特徴組み合わせのサブネットワーク、
2)上記クリック分類サンプルデータを使用して、露出した<ユーザ、アイテム>サンプルペアに対して、ユーザの属性情報、アイテムの属性情報、ユーザとアイテムのインタラクティブ情報を補助し、ユーザがクリックしたかどうかをラベルとして二項分類学習を行い、入力された特徴情報は共有embedding層を経て稠密ベクトルにマッピングされ、伝統的なDNNネットワークを経て特徴組み合わせの交差を実現し、最終的にsigmoid関数を経て分類学習を行い、図4に示すように、Loss functionは以下の式で表される特徴組み合わせのサブネットワーク、
ここで、nはサンプルの総量であり、yはクリックするかどうかのラベルであり、pは出力層の確率値であり、
図5に示すように、上記2つのサブネットワークを本フレームワークにおいて共有embedding層を通じてマッピングし、且つ連合学習を行い、
各サブネットワークは推薦シーンの一部の情報を学習し、その中で、ユーザ興味のサブネットワークは、ユーザーの歴史的な興味好みを学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、特徴組み合わせのサブネットワークは、ネットワークを通じてアイテム、ユーザー間の高次交差特徴とクリック率の関係を学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、
学習効果を高めるために、本フレームワークは2つのサブネットワークに対して連合学習を行い、まず、2つのサブネットワークはembeddingマッピング層を共有し、embedding層に興味シーケンス情報とシングルポイント推定情報を融合させ、embedding表徴の正確性を向上させると同時に、最終的なloss層で2つのサブネットワークのlossを以下の式で加重合計するS4と、
図5に示すように、上記2つのサブネットワークを本フレームワークにおいて共有embedding層を通じてマッピングし、且つ連合学習を行い、
各サブネットワークは推薦シーンの一部の情報を学習し、その中で、ユーザ興味のサブネットワークは、ユーザーの歴史的な興味好みを学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、特徴組み合わせのサブネットワークは、ネットワークを通じてアイテム、ユーザー間の高次交差特徴とクリック率の関係を学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、
学習効果を高めるために、本フレームワークは2つのサブネットワークに対して連合学習を行い、まず、2つのサブネットワークはembeddingマッピング層を共有し、embedding層に興味シーケンス情報とシングルポイント推定情報を融合させ、embedding表徴の正確性を向上させると同時に、最終的なloss層で2つのサブネットワークのlossを以下の式で加重合計するS4と、
ここで、αはシーンのデータ特性及び学習効果に応じて調整することが可能であり、
クリック率の推定とオンラインサービスを行い、
モデルトレーニング時にフレームワークにおける2つのサブネットワークを連合学習を通じて同時にトレーニングし、オフライン推定する時には、時効性に対する要求が低く、フレームワーク全体を通じて正確な推定を行うことが可能であり、オンライン推定する場合、システムの時効性に対する要求が高く、且つユーザークリックシーケンスに現れた興味好みは絶えず変わっていき、ユーザー興味のサブネットワークを単独で使用して推薦結果を推定更新することができ、ユーザーの短期的な興味の変化によりよく寄り添うとともに、オンライン軽量化配置を実現するS5と、
推定されたユーザが部品に対するクリック確率値を降順にソートし、確率値が最も高いK個アイテムをソート結果としてhbaseに格納するS6と、
ユーザーがログインすると、フロントエンドはインタフェースを介してhbaseに格納されているソート結果を取得し、順番に表示するS7
クリック率の推定とオンラインサービスを行い、
モデルトレーニング時にフレームワークにおける2つのサブネットワークを連合学習を通じて同時にトレーニングし、オフライン推定する時には、時効性に対する要求が低く、フレームワーク全体を通じて正確な推定を行うことが可能であり、オンライン推定する場合、システムの時効性に対する要求が高く、且つユーザークリックシーケンスに現れた興味好みは絶えず変わっていき、ユーザー興味のサブネットワークを単独で使用して推薦結果を推定更新することができ、ユーザーの短期的な興味の変化によりよく寄り添うとともに、オンライン軽量化配置を実現するS5と、
推定されたユーザが部品に対するクリック確率値を降順にソートし、確率値が最も高いK個アイテムをソート結果としてhbaseに格納するS6と、
ユーザーがログインすると、フロントエンドはインタフェースを介してhbaseに格納されているソート結果を取得し、順番に表示するS7
従来技術と比較して、本発明の有益な効果は以下の通りであり、
第一に、ユーザー過去のクリックシーケンスにクリック率推定モデルが統合され、ユーザーの興味好みをよりよく捉え、ユーザーの描写精度を効果的に向上させたることと、
第二に、アルゴリズムのフレームワークで、特徴組み合わせのモデル能力を保持すると同時に、ユーザーの興味と結合して、多種類のモデルを通じて表徴マッピング層を共有し、より正確にアイテムの表徴を学習し、さらに推薦モデルの正確性を高めることと、
第三に、モデルトレーニング時に2つのサブネットワークが融合した後に連合学習し、オフラインサービスはフレームワーク全体を使用して推定し、オンラインサービスはユーザー興味のサブネットワークのみを使用して推定し、推薦の正確性を保証しながら軽量化配置を実現する。
第一に、ユーザー過去のクリックシーケンスにクリック率推定モデルが統合され、ユーザーの興味好みをよりよく捉え、ユーザーの描写精度を効果的に向上させたることと、
第二に、アルゴリズムのフレームワークで、特徴組み合わせのモデル能力を保持すると同時に、ユーザーの興味と結合して、多種類のモデルを通じて表徴マッピング層を共有し、より正確にアイテムの表徴を学習し、さらに推薦モデルの正確性を高めることと、
第三に、モデルトレーニング時に2つのサブネットワークが融合した後に連合学習し、オフラインサービスはフレームワーク全体を使用して推定し、オンラインサービスはユーザー興味のサブネットワークのみを使用して推定し、推薦の正確性を保証しながら軽量化配置を実現する。
図面は、本発明のさらなる理解を提供するためのものであり、本発明の実施形態とともに本発明を説明するための明細書の一部を構成するためのものであり、本発明の制限を構成するものではない。図面について、
本発明の実行フローチャートである。
本発明のユーザ-アイテムのインタラクティブシーケンスデータ概略図である。
本発明のユーザー興味のサブネットワーク概略図である。
本発明の特徴組み合わせのサブネットワーク概略図である。
本発明の推薦フレームワーク概略図である。
以下、添付図面を使用して本発明の好適な実施形態を説明するが、ここで説明する好適な実施形態は本発明の説明及び説明にのみ用いられ、本発明を限定するために用いられるものではないことを理解すべきである。
(実施形態1)
図1-5に示すように、本発明は、以下のステップを含むシーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワークを提供し、
ユーザUが露出したアイテムE、クリックしたアイテムC(ここで、C∈E)及び各行為のタイムスタンプを含むユーザとアイテムのインタラクティブログを収集すると同時に、ユーザー特徴情報(年齢、性別、地域など)、アイテム特徴情報(カテゴリ、ブランド、店舗など)を保存するS1と、
収集されたログ情報を以下2つのセクションを含む構造化データに整理するS2と、
3)図2に示すように、各ユーザーが露出しクリックなし/クリックありのアイテムをクリック時間順にソートし、k個のクリックアイテムを単位として切り取ってサンプルデータを生成するユーザークリックアイテムのシーケンスデータと、
4)<ユーザー番号、アイテム番号>をサンプル主キーとし、ここで、露出しクリックなしのサンプルは0としてマークされ、露出しクリックありのサンプルは1としてマークされると同時に、ユーザー特徴情報、アイテム特徴情報、ユーザーとアイテムのインタラクティブ情報をサンプル特徴として整理するクリック分類サンプルデータ、
上記2つのセクションのデータを本アルゴリズムフレームワークに導入して学習を行い、2つのセクションのデータはそれぞれフレームワークにおける以下2つのサブネットワークに対応するS3と、
3)上記ユーザークリックアイテムのシーケンスデータを使用して、ユーザークリックシーケンスのアイテムID及び特徴情報を入力し、embedding層を経て稠密ベクトルにマッピングされ、sum pooling層を経てユーザ歴史的な興味好みを示すとともに、ユーザー特徴情報と候補アイテムはe、mbedding層を経て稠密ベクトルにマッピングされ、前記ユーザ歴史的な興味好みと結合して圧縮され、ユーザ情報、ユーザ歴史的な興味、対象アイテム間のネットワーク関係を構築し、さらに全結合層とsigmoid関数を通じて、ネットワークパラメータをトレーニングし、図3に示すように、Loss functionは以下の式で表されるユーザ興味のサブネットワークと、
図1-5に示すように、本発明は、以下のステップを含むシーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワークを提供し、
ユーザUが露出したアイテムE、クリックしたアイテムC(ここで、C∈E)及び各行為のタイムスタンプを含むユーザとアイテムのインタラクティブログを収集すると同時に、ユーザー特徴情報(年齢、性別、地域など)、アイテム特徴情報(カテゴリ、ブランド、店舗など)を保存するS1と、
収集されたログ情報を以下2つのセクションを含む構造化データに整理するS2と、
3)図2に示すように、各ユーザーが露出しクリックなし/クリックありのアイテムをクリック時間順にソートし、k個のクリックアイテムを単位として切り取ってサンプルデータを生成するユーザークリックアイテムのシーケンスデータと、
4)<ユーザー番号、アイテム番号>をサンプル主キーとし、ここで、露出しクリックなしのサンプルは0としてマークされ、露出しクリックありのサンプルは1としてマークされると同時に、ユーザー特徴情報、アイテム特徴情報、ユーザーとアイテムのインタラクティブ情報をサンプル特徴として整理するクリック分類サンプルデータ、
上記2つのセクションのデータを本アルゴリズムフレームワークに導入して学習を行い、2つのセクションのデータはそれぞれフレームワークにおける以下2つのサブネットワークに対応するS3と、
3)上記ユーザークリックアイテムのシーケンスデータを使用して、ユーザークリックシーケンスのアイテムID及び特徴情報を入力し、embedding層を経て稠密ベクトルにマッピングされ、sum pooling層を経てユーザ歴史的な興味好みを示すとともに、ユーザー特徴情報と候補アイテムはe、mbedding層を経て稠密ベクトルにマッピングされ、前記ユーザ歴史的な興味好みと結合して圧縮され、ユーザ情報、ユーザ歴史的な興味、対象アイテム間のネットワーク関係を構築し、さらに全結合層とsigmoid関数を通じて、ネットワークパラメータをトレーニングし、図3に示すように、Loss functionは以下の式で表されるユーザ興味のサブネットワークと、
ここで、nはサンプルの総量であり、yはクリックするかどうかのラベルであり、pは出力層の確率値であり、
4)上記クリック分類サンプルデータを使用して、露出した<ユーザ、アイテム>サンプルペアに対して、ユーザの属性情報、アイテムの属性情報、ユーザとアイテムのインタラクティブ情報を補助し、ユーザがクリックしたかどうかをラベルとして二項分類学習を行い、入力された特徴情報は共有embedding層を経て稠密ベクトルにマッピングされ、伝統的なDNNネットワークを経て特徴組み合わせの交差を実現し、最終的にsigmoid関数を経て分類学習を行い、図4に示すように、Loss functionは以下の式で表される特徴組み合わせのサブネットワーク、
4)上記クリック分類サンプルデータを使用して、露出した<ユーザ、アイテム>サンプルペアに対して、ユーザの属性情報、アイテムの属性情報、ユーザとアイテムのインタラクティブ情報を補助し、ユーザがクリックしたかどうかをラベルとして二項分類学習を行い、入力された特徴情報は共有embedding層を経て稠密ベクトルにマッピングされ、伝統的なDNNネットワークを経て特徴組み合わせの交差を実現し、最終的にsigmoid関数を経て分類学習を行い、図4に示すように、Loss functionは以下の式で表される特徴組み合わせのサブネットワーク、
ここで、nはサンプルの総量であり、yはクリックするかどうかのラベルであり、pは出力層の確率値であり、
図5に示すように、上記2つのサブネットワークを本フレームワークにおいて共有embedding層を通じてマッピングし、且つ連合学習を行い、
各サブネットワークは推薦シーンの一部の情報を学習し、その中で、ユーザ興味のサブネットワークは、ユーザーの歴史的な興味好みを学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、特徴組み合わせのサブネットワークは、ネットワークを通じてアイテム、ユーザー間の高次交差特徴とクリック率の関係を学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、
学習効果を高めるために、本フレームワークは2つのサブネットワークに対して連合学習を行い、まず、2つのサブネットワークはembeddingマッピング層を共有し、embedding層に興味シーケンス情報とシングルポイント推定情報を融合させ、embedding表徴の正確性を向上させると同時に、最終的なloss層で2つのサブネットワークのlossを以下の式で加重合計するS4と、
図5に示すように、上記2つのサブネットワークを本フレームワークにおいて共有embedding層を通じてマッピングし、且つ連合学習を行い、
各サブネットワークは推薦シーンの一部の情報を学習し、その中で、ユーザ興味のサブネットワークは、ユーザーの歴史的な興味好みを学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、特徴組み合わせのサブネットワークは、ネットワークを通じてアイテム、ユーザー間の高次交差特徴とクリック率の関係を学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、
学習効果を高めるために、本フレームワークは2つのサブネットワークに対して連合学習を行い、まず、2つのサブネットワークはembeddingマッピング層を共有し、embedding層に興味シーケンス情報とシングルポイント推定情報を融合させ、embedding表徴の正確性を向上させると同時に、最終的なloss層で2つのサブネットワークのlossを以下の式で加重合計するS4と、
ここで、αはシーンのデータ特性及び学習効果に応じて調整することが可能であり、
クリック率の推定とオンラインサービスを行い、
モデルトレーニング時にフレームワークにおける2つのサブネットワークを連合学習を通じて同時にトレーニングし、オフライン推定する時には、時効性に対する要求が低く、フレームワーク全体を通じて正確な推定を行うことが可能であり、オンライン推定する場合、システムの時効性に対する要求が高く、且つユーザークリックシーケンスに現れた興味好みは絶えず変わっていき、ユーザー興味のサブネットワークを単独で使用して推薦結果を推定更新することができ、ユーザーの短期的な興味の変化によりよく寄り添うとともに、オンライン軽量化配置を実現するS5と、
推定されたユーザが部品に対するクリック確率値を降順にソートし、確率値が最も高いK個アイテムをソート結果としてhbaseに格納するS6と、
ユーザーがログインすると、フロントエンドはインタフェースを介してhbaseに格納されているソート結果を取得し、順番に表示するS7。
クリック率の推定とオンラインサービスを行い、
モデルトレーニング時にフレームワークにおける2つのサブネットワークを連合学習を通じて同時にトレーニングし、オフライン推定する時には、時効性に対する要求が低く、フレームワーク全体を通じて正確な推定を行うことが可能であり、オンライン推定する場合、システムの時効性に対する要求が高く、且つユーザークリックシーケンスに現れた興味好みは絶えず変わっていき、ユーザー興味のサブネットワークを単独で使用して推薦結果を推定更新することができ、ユーザーの短期的な興味の変化によりよく寄り添うとともに、オンライン軽量化配置を実現するS5と、
推定されたユーザが部品に対するクリック確率値を降順にソートし、確率値が最も高いK個アイテムをソート結果としてhbaseに格納するS6と、
ユーザーがログインすると、フロントエンドはインタフェースを介してhbaseに格納されているソート結果を取得し、順番に表示するS7。
具体的には、例示的なプロセスは以下のようになり、
1、露出レコードとクリックレコード、及びユーザー特徴とアイテム特徴を含むユーザとアイテムのインタラクティブ情報を収集する。
1、露出レコードとクリックレコード、及びユーザー特徴とアイテム特徴を含むユーザとアイテムのインタラクティブ情報を収集する。
2、インタラクティブレコードから2つの構造化サブデータを生成し、ユーザークリックアイテムのシーケンスデータと、対応するユーザー特徴とアイテム特徴と、露出し未クリックなし/クリックありラベル、およびユーザー特徴、アイテム特徴、ユーザーとアイテムのインタラクティブ特徴と、を含む。
3、2つの構造化サブデータを本フレームワークの2つのサブネットワークに入力し、本フレームワークの連合学習方式に基づいてモデル学習を行い、αを0.2に設定する。
4、3でトレーニングして得られたembedding表徴と各サブネットワークにおけるパラメータを保存する。
5、オフラインサービスの場合、予測されたユーザー及びアイテム特徴を本フレームワークに入力し、ユーザーの物品に対するクリック率の推定値を出力し、オンラインサービスの場合、予測されたユーザ及びアイテム特徴をユーザ興味のネットワークに入力し、更新されたクリック率の推定値を出力する。
6、最もクリック率の高いTOP 100アイテムを降順にソートし、最終的なソート結果としてユーザーに提示する。
最後に、上述は本発明の好適な実施形態にすぎず、本発明を限定するためには使用されないが、上述の実施形態を参照して本発明を詳細に説明したが、当業者にとっては、上述の各実施形態に記載された技術的態様を修正したり、技術的特徴の一部を同等に置き換えたりすることができる。本発明の精神と原則の中で、行ったいかなる修正、等価置換、改良などは、本発明の保護範囲に含まれるべきである。
Claims (1)
- 以下のステップを含むことを特徴とするシーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワーク。
ユーザUが露出したアイテムE、クリックしたアイテムC(ここで、C∈E)及び各行為のタイムスタンプを含むユーザとアイテムのインタラクティブログを収集すると同時に、ユーザー特徴情報(年齢、性別、地域など)、アイテム特徴情報(カテゴリ、ブランド、店舗など)を保存するS1と、
収集されたログ情報を以下2つのセクションを含む構造化データに整理するS2と、
5)図2に示すように、各ユーザーが露出しクリックなし/クリックありのアイテムをクリック時間順にソートし、k個のクリックアイテムを単位として切り取ってサンプルデータを生成するユーザークリックアイテムのシーケンスデータと、
6)<ユーザー番号、アイテム番号>をサンプル主キーとし、ここで、露出しクリックなしのサンプルは0としてマークされ、露出しクリックありのサンプルは1としてマークされると同時に、ユーザー特徴情報、アイテム特徴情報、ユーザーとアイテムのインタラクティブ情報をサンプル特徴として整理するクリック分類サンプルデータ、
上記2つのセクションのデータを本アルゴリズムフレームワークに導入して学習を行い、2つのセクションのデータはそれぞれフレームワークにおける以下2つのサブネットワークに対応するS3と、
5)上記ユーザークリックアイテムのシーケンスデータを使用して、ユーザークリックシーケンスのアイテムID及び特徴情報を入力し、embedding層を経て稠密ベクトルにマッピングされ、sum pooling層を経てユーザ歴史的な興味好みを示すとともに、ユーザー特徴情報と候補アイテムはe、mbedding層を経て稠密ベクトルにマッピングされ、前記ユーザ歴史的な興味好みと結合して圧縮され、ユーザ情報、ユーザ歴史的な興味、対象アイテム間のネットワーク関係を構築し、さらに全結合層とsigmoid関数を通じて、ネットワークパラメータをトレーニングし、図3に示すように、Loss functionは以下の式で表されるユーザ興味のサブネットワークと、
6)上記クリック分類サンプルデータを使用して、露出した<ユーザ、アイテム>サンプルペアに対して、ユーザの属性情報、アイテムの属性情報、ユーザとアイテムのインタラクティブ情報を補助し、ユーザがクリックしたかどうかをラベルとして二項分類学習を行い、入力された特徴情報は共有embedding層を経て稠密ベクトルにマッピングされ、伝統的なDNNネットワークを経て特徴組み合わせの交差を実現し、最終的にsigmoid関数を経て分類学習を行い、図4に示すように、Loss functionは以下の式で表される特徴組み合わせのサブネットワーク、
図5に示すように、上記2つのサブネットワークを本フレームワークにおいて共有embedding層を通じてマッピングし、且つ連合学習を行い、
各サブネットワークは推薦シーンの一部の情報を学習し、その中で、ユーザ興味のサブネットワークは、ユーザーの歴史的な興味好みを学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、特徴組み合わせのサブネットワークは、ネットワークを通じてアイテム、ユーザー間の高次交差特徴とクリック率の関係を学習するとともに、ユーザー特徴とアイテム特徴の表徴を最適化し、
学習効果を高めるために、本フレームワークは2つのサブネットワークに対して連合学習を行い、まず、2つのサブネットワークはembeddingマッピング層を共有し、embedding層に興味シーケンス情報とシングルポイント推定情報を融合させ、embedding表徴の正確性を向上させると同時に、最終的なloss層で2つのサブネットワークのlossを以下の式で加重合計するS4と、
クリック率の推定とオンラインサービスを行い、
モデルトレーニング時にフレームワークにおける2つのサブネットワークを連合学習を通じて同時にトレーニングし、オフライン推定する時には、時効性に対する要求が低く、フレームワーク全体を通じて正確な推定を行うことが可能であり、オンライン推定する場合、システムの時効性に対する要求が高く、且つユーザークリックシーケンスに現れた興味好みは絶えず変わっていき、ユーザー興味のサブネットワークを単独で使用して推薦結果を推定更新することができ、ユーザーの短期的な興味の変化によりよく寄り添うとともに、オンライン軽量化配置を実現するS5と、
推定されたユーザが部品に対するクリック確率値を降順にソートし、確率値が最も高いK個アイテムをソート結果としてhbaseに格納するS6と、
ユーザーがログインすると、フロントエンドはインタフェースを介してhbaseに格納されているソート結果を取得し、順番に表示するS7。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111046834.2 | 2021-09-07 | ||
CN202111046834.2A CN115774810A (zh) | 2021-09-07 | 2021-09-07 | 一种融合了序列信息的特征组合推荐算法框架 |
PCT/CN2021/142966 WO2023035506A1 (zh) | 2021-09-07 | 2021-12-30 | 一种融合了序列信息的特征组合推荐算法框架 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023545896A true JP2023545896A (ja) | 2023-11-01 |
Family
ID=85388456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023513552A Pending JP2023545896A (ja) | 2021-09-07 | 2021-12-30 | シーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワーク |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2023545896A (ja) |
CN (1) | CN115774810A (ja) |
WO (1) | WO2023035506A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116029357B (zh) * | 2023-03-29 | 2023-08-15 | 荣耀终端有限公司 | 训练样本生成、模型训练、点击率评估方法及电子设备 |
CN116720003B (zh) * | 2023-08-08 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 排序处理方法、装置、计算机设备、及存储介质 |
CN116887001B (zh) * | 2023-09-06 | 2023-12-15 | 四川中电启明星信息技术有限公司 | 融合社会属性信息的短视频推送方法、装置及电子设备 |
CN117708437B (zh) * | 2024-02-05 | 2024-04-16 | 四川日报网络传媒发展有限公司 | 一种个性化内容的推荐方法、装置、电子设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11461383B2 (en) * | 2017-09-25 | 2022-10-04 | Equifax Inc. | Dual deep learning architecture for machine-learning systems |
CN110555743A (zh) * | 2018-05-31 | 2019-12-10 | 阿里巴巴集团控股有限公司 | 商品对象推荐方法、装置及电子设备 |
CN110162690B (zh) * | 2018-10-23 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 确定用户对物品的兴趣度的方法与装置、设备和存储介质 |
CN112905876B (zh) * | 2020-03-16 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 基于深度学习的信息推送方法、装置和计算机设备 |
CN112035746A (zh) * | 2020-09-01 | 2020-12-04 | 湖南大学 | 一种基于时空序列图卷积网络的会话推荐方法 |
CN112541806A (zh) * | 2020-12-18 | 2021-03-23 | 北京航天云路有限公司 | 一种基于异质信息网络的推荐方法及装置 |
-
2021
- 2021-09-07 CN CN202111046834.2A patent/CN115774810A/zh active Pending
- 2021-12-30 WO PCT/CN2021/142966 patent/WO2023035506A1/zh unknown
- 2021-12-30 JP JP2023513552A patent/JP2023545896A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN115774810A (zh) | 2023-03-10 |
WO2023035506A1 (zh) | 2023-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023545896A (ja) | シーケンス情報を融合した特徴組み合わせ推薦アルゴリズムフレームワーク | |
WO2020207196A1 (zh) | 用户标签生成方法、装置、存储介质和计算机设备 | |
CN109960759B (zh) | 基于深度神经网络的推荐系统点击率预测方法 | |
CN108665064B (zh) | 神经网络模型训练、对象推荐方法及装置 | |
CN107516235B (zh) | 商品偏好预估方法和装置 | |
CN111160954B (zh) | 基于图卷积网络模型的面向群组对象的推荐方法 | |
CN108205766A (zh) | 信息推送方法、装置及系统 | |
CN112801760A (zh) | 一种内容个性化推荐系统的排序优化方法及系统 | |
CN110110372B (zh) | 一种用户时序行为自动切分预测方法 | |
Zhu et al. | Portal nodes screening for large scale social networks | |
CN113850649A (zh) | 一种基于多平台用户数据的定制化推荐方法及推荐系统 | |
CN111651678A (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN112288554A (zh) | 商品推荐方法和装置、存储介质及电子装置 | |
CN115329215A (zh) | 异构网络中基于自适应动态知识图谱的推荐方法及系统 | |
CN116308556A (zh) | 基于物联网的广告推送方法及系统 | |
CN116501779A (zh) | 一种进行实时反馈的大数据挖掘分析系统 | |
CN109146606B (zh) | 一种品牌推荐方法、电子设备、存储介质及系统 | |
CN113344648B (zh) | 一种基于机器学习的广告推荐方法及系统 | |
CN116342228B (zh) | 一种基于有向图神经网络的相关推荐的方法 | |
CN110851694A (zh) | 基于用户记忆网络和树形结构的深度模型的个性化推荐系统 | |
CN112541010B (zh) | 一种基于逻辑回归的用户性别预测方法 | |
CN116634008A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
JP6457986B2 (ja) | メッセージ分類システム、メッセージ分類方法及びプログラム | |
CN113010727B (zh) | 直播平台画像的构建方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230224 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240229 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240527 |