JP7441270B2 - 機械学習方法、訓練方法、予測システム、及び非一時的コンピュータ可読媒体 - Google Patents

機械学習方法、訓練方法、予測システム、及び非一時的コンピュータ可読媒体 Download PDF

Info

Publication number
JP7441270B2
JP7441270B2 JP2022096135A JP2022096135A JP7441270B2 JP 7441270 B2 JP7441270 B2 JP 7441270B2 JP 2022096135 A JP2022096135 A JP 2022096135A JP 2022096135 A JP2022096135 A JP 2022096135A JP 7441270 B2 JP7441270 B2 JP 7441270B2
Authority
JP
Japan
Prior art keywords
shop
user
item
category
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022096135A
Other languages
English (en)
Other versions
JP2023017701A (ja
Inventor
ヤン シー
グアンナン リアン
ヨンジョー チュン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Group Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Group Inc filed Critical Rakuten Group Inc
Publication of JP2023017701A publication Critical patent/JP2023017701A/ja
Application granted granted Critical
Publication of JP7441270B2 publication Critical patent/JP7441270B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、一般に、機械学習ベースの推薦システムに関し、より具体的には、サンプル選択バイアスが少なく、電子商取引のプラットフォーム上の小型ショップに対してより良いパフォーマンスを発揮する改良型推薦システムに関する。
推薦システムは、ターゲット広告のために、アイテム(item)を購入する可能性が最も高いユーザを特定するために使用される場合がある。また、ユーザにアイテムを推薦するために使用されることもある。過去数十年の電子商取引の爆発的な成長により、消費者が処理できる以上の商品提供が行われており、推薦システムはこの過負荷の問題を克服するために不可欠なものとなってきている。推薦システムの目的は、既知のユーザからのフィードバックを受け、アイテムに対する未知のユーザのフィードバックを予測することである。これは、商品の広告をターゲットとする際、又は、ユーザに推薦アイテムのリストを提供する際に役立つ。フィードバックは、しばしば相互作用と呼ばれ、暗示的なもの(例えば、購入した/購入しそう)、または明示的なもの(例えば、1-5の間の評価)であり得る。
多くの推薦システムは、機械学習モデルを用いて予測を行う。例えば、ニューラル協調フィルタリング(NCF)システムは、ユーザデータとアイテムデータに、ニューラルネットワークエンコーダを適用して、ユーザデータとアイテムデータの表現を生成し、ユーザ表現とアイテム表現を使用してアイテムに対するユーザの評価を予測する。
電子商取引のプラットフォームの予測に使用される機械学習モデルは、通常、電子商取引プラットフォームにおけるユーザ-アイテム相互作用に基づいて訓練される。プラットフォーム上で販売量の多いショップの訓練データは、小型ショップの訓練データよりも圧倒的に多く存在する。その結果、これらのモデルは、小型ショップよりも大型ショップの予測を行うのに適している。これは、サンプル選択バイアスとして知られている。実際、小型ショップの新アイテムに関し、このモデルのパフォーマンスは低いことがある。したがって、電子商取引プラットフォームにおいて、小型ショップと大型ショップの双方に対して、良好な予測性能を持つ推薦システムの需要がある。
本開示は、大型ショップに対する精度を維持しながら、電子商取引プラットフォーム上の小型ショップに対する推薦を改善することに関する。この改善は、メタ学習プロセスを用いてサンプル選択バイアスを低減するために機械学習推薦モデルを再訓練することによって達成される。再訓練処理は、電子商取引プラットフォーム上のショップのサンプルサブセットを特定し、サブセット内の各ショップに対してショップ固有推薦モデルを生成することから構成される。ショップの第1訓練データセットを使用して、基準モデルを最適化し、ショップのユーザ-アイテム相互作用を予測することにより、各ショップ固有モデルは生成される。各ショップ固有モデルは、次にそのショップの第2訓練データセットを使用して、テストされる。各ショップ別モデルについて、適用可能な第2訓練データセットについてモデルが予測したユーザ-アイテム相互作用と、第2訓練データセットにおける実際のユーザ-アイテム相互作用に基づいて、損失を算出する。各ショップ固有損失に基づいて、グローバル損失が算出され、基準モデルのパラメータは、グローバル損失を最小化するように更新される。
グローバルモデルには、入力アイテムが小型ショップか大型ショップかによって、ユーザ-アイテム相互作用スコアに適用される小型ショップと大型ショップの重みパラメータが含まれている。重みパラメータは、再訓練処理で学習される。小型ショップと大型ショップで異なる重みパラメータを学習することで、小型ショップに対する推薦と大型ショップに対する推薦の違いを学習する。これにより、大型ショップに対するモデルバイアスが緩和され、大型ショップと小型ショップの双方に対する推薦性能が向上する。
一実施形態では、再訓練工程は、以下のステップからなる。
(a)前記電子商取引プラットフォーム上のショップのサンプルバッチであって、小型ショップカテゴリのショップと大型ショップカテゴリのショップを含むサンプルバッチを特定するステップであって、前記小型ショップカテゴリと前記大型ショップカテゴリは、前記電子商取引プラットフォーム上の販売量閾値に関連して定義され、前記小型ショップカテゴリのショップは、前記大型ショップカテゴリのショップよりも前記電子商取引プラットフォーム上での販売量は少なく、
(b)前記サンプルバッチ内の各ショップついて、第1訓練データセットと第2訓練データセットを取得するステップであって、各ショップについて、前記第1訓練データセットと前記第2訓練データセットはそれぞれ、前記ショップ内のアイテムに関するアイテムデータと、前記ショップ内のアイテムに関するユーザ-アイテム相互作用データを含むユーザデータと、を有し、
(c)サンプルバッチの各ショップに対して、
前記ショップが前記小型ショップカテゴリに含まれるのか、前記大型ショップカテゴリに含まれるのかを判断し、
前記機械学習モデルを前記ショップの前記第1訓練データセットのユーザデータとアイテムデータに適用して、前記第1訓練データセットの各ユーザとアイテムのペアの予備的ユーザ-アイテム相互作用スコアを取得し、
前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル小型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル大型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
前記最終的なユーザ-アイテム相互作用スコアを用いて、前記第1訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
前記ショップの前記第1訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第1ショップ固有損失を算出し、
前記第1ショップ固有損失を減少させるために、
前記機械学習モデルのパラメータの局所更新を算出し、
前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記ショップの前記小型ショップ重みパラメータの局所更新を算出し、
前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記ショップの前記大型ショップ重みパラメータの局所更新を算出し、
局所パラメータの更新を前記機械学習モデルに適用することにより、前記機械学習モデルのショップ固有バージョンを生成し、
前記機械学習モデルの前記ショップ固有のバージョンを、前記ショップの前記第2訓練データセットのユーザデータとアイテムデータに適用して、前記第2訓練データセットの各ユーザとアイテムのペアに対する予備的ユーザ-アイテム相互作用スコアを取得し、
前記ショップが前記小型ショップカテゴリに含まれることに応答して、局所小型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
前記ショップが前記大型ショップカテゴリに含まれることに応答して、局所大型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
前記最終的なユーザ-アイテム相互作用スコアを使用して、前記第2訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
前記ショップの前記第2訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第2ショップ固有損失を算出し、
(d)前記サンプルバッチ内の全ショップの前記第2ショップ固有損失に基づいて、グローバル損失を算出し、
(e)前記グローバル損失を低減するため前記機械学習モデルのグローバルパラメータ調整を算出し、
(f)前記グローバル損失を低減するため前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータを調整し、
(g)前記グローバルパラメータ調整を用いて、前記機械学習モデルのパラメータを調整することにより、更新されたモデルを生成し、
(h)ステップ(c)-(g)を複数繰り返し、前の繰り返しの前記更新されたモデルが、次の繰り返しの前記機械学習モデルとなり、調整された前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータが、次の繰り返しで使用される、ことを実行する。
一実施形態に係る推薦モデルの訓練段階の概要を示すフローチャートである。 一実施形態による推薦モデルの再訓練方法を示すフローチャートである。 (a)(b)は、予測段階を説明するフローチャートである。 (a)(b)は、推薦システムの機械学習モデルアーキテクチャの一例を示すブロック図である。 推薦システムのアーキテクチャの一例を示すブロック図である。
本開示は、販売量の異なるショップを含む電子商取引プラットフォーム上において、ユーザ-アイテム相互作用を予測する機械学習ベースの推薦システム及び方法に関するものである。具体的には、本開示は、大型ショップに対する予測精度を維持しつつ、小型ショップに対するより良い予測を有する改良された推薦システムに関する。この改良は、メタ学習プロセスを用いてサンプル選択バイアスを低減するように推薦システムを再訓練することによって達成される。本明細書に開示される方法は、コンピュータシステム(「システム」)によって実行される。
適用できる電子商取引プラットフォームにおける、閾値に関連する一定期間の販売数に基づいて、小型/大型ショップを定義する。具体的には、本明細書では、「小型ショップ(small shop)」「より小型ショップ(smaller shop)」という用語は、売上高がある閾値以下のショップを指す。逆に、「大型ショップ(large shop)」、「より大型ショップ(larger shop)」、「最大型ショップ(largest shop)」という用語は、ある閾値以上の売上高を有するショップを意味する。本発明は、特定の閾値または閾値の範囲に依存または限定されるものではない。小型ショップおよび大型ショップを定義する閾値は、問題となる特定の電子商取引プラットフォームに依拠してもよいし、電子商取引プラットフォームごとに異なってもよい。しかしながら、例として、閾値は、過去12ヶ月などの期間中の電子商取引プラットフォーム上の全ショップのショップ販売量の中央値であってもよい。
以下、推薦システムの訓練段階と予測段階の双方を説明する。
(1.訓練段階)
図1は、訓練段階の概要を示す図である。システムは、電子商取引プラットフォームにおけるユーザ-アイテム相互作用を予測するため、以前に訓練された機械学習モデルを取得する(ステップ110)。このモデルは、本明細書において基準モデルと呼ばれる。一実施形態では、基準モデルは、電子商取引プラットフォーム上のユーザ-アイテム相互作用を含む、アイテムデータとユーザデータを用いて訓練される。基準モデルは、多数の既知の訓練方法のうちの1つを使用して訓練されてもよく、本明細書で開示される再訓練方法は、基準モデルが最初に訓練される方法に依存しない。上述したように、小型ショップのアイテムよりも大型ショップからのアイテムの方がより多くの訓練データがある。したがって、基準モデルは、より大型ショップからのアイテムについてより良く、予測を行うことになる。これはサンプル選択バイアスと呼ばれる。
システムは、サンプル選択バイアスを低減するために、基準モデルを再訓練する(ステップ120)。モデルを再訓練することは、電子商取引プラットフォーム上のショップのサンプルバッチを特定することを含む(ステップ120a)。サンプルバッチは、プラットフォーム上のショップのサブセットであり、小型カテゴリのショップと大型カテゴリのショップとを含む。
システムは、サンプルバッチ内の各ショップについて、本明細書において第1訓練データセット及び第2訓練データセットと呼ばれる2つの訓練データセットを取得する(ステップ120b)。ショップの第1及び第2訓練データセットの各々は、(1)ショップ内のアイテムに関するアイテムデータ、及び(2)ユーザ-アイテム相互作用データを含むユーザデータ、を含む。ユーザ-アイテム相互作用データの例として、ユーザ評価又は購入履歴(すなわち、ユーザがアイテムを購入したか否か)が挙げられる。
システムは、ショップのサンプルバッチと第1及び第2のデータセットに関して、図2に記載された再訓練方法を実行する(ステップ120c)。システムは、図2に記載された再訓練方法を、多く繰り返す。繰り返しは、固定された繰返し回数であってもよく、あるいは、システムは、収束が達成されるまで再訓練の方法を繰り返してもよい(ステップ120d)。
(1.1.再訓練の方法)
図2は再訓練の方法を示す。このセクションで説明する再訓練のステップは、サンプルバッチ内の各ショップに対して実行される。次のセクションで説明するように、この方法の第1の部分は、サンプルバッチ内の各ショップに対して、モデルのショップ固有バージョンを生成すること含む。
(1.1.1.モデルのショップ固有バージョンの生成)
システムは、ショップの第1訓練データセット(210)中のユーザデータとアイテムデータに、グローバルモデル(200)を適用する。グローバルモデルは、ショップの第1訓練データセットにおける各ユーザとアイテムのペアのための予備的なユーザ-アイテム相互作用スコア(212)を生成する。グローバルモデルは、ショップ固有バージョンのモデルとは対照的に、電子商取引プラットフォーム上の全てのショップのための機械学習モデルである。再訓練の方法の最初の繰り返しの間、グローバルモデルが基準モデルとなる。その次の繰り返しでは、グローバルモデルは、基準モデルの更新されたバージョンとなる。
システムは、ショップが小型カテゴリに含まれる大型カテゴリに含まれるかを決定する。ショップが小型カテゴリに含まれることに応答して、システムは、グローバル小型ショップ重みパラメータ(214)を、予備的なユーザ-アイテム相互作用スコアに適用し、第1訓練データセットに対する最終的なユーザ-アイテム相互作用スコアを得る。ショップが大型カテゴリに含まれることに応答して、システムは、グローバル大型ショップ重みパラメータ(213)を予備的なユーザ-アイテム相互作用スコアに適用し、第1訓練データセットに対する最終的なユーザ-アイテム相互作用スコアを得る。システムは、最終的なユーザ-アイテム相互作用スコアを用いてユーザ-アイテム予測を生成する(212)。
システムは、ショップの第1訓練データセットにおける予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用に基づいて、ショップの第1ショップ固有損失を算出する(215)。一実施形態では、平均二乗誤差が損失関数として使用される。システムは、損失を最小化するために、ショップ固有のモデル更新を算出する(220)。これは、モデルに対するショップ固有パラメータ調整を算出することからなる。次に、システムは、モデルに第1ショップ固有の更新を適用することにより、モデルのショップ固有バージョンを生成する(225)。特定の実施形態では、システムは、ショップ固有損失を最小化するために、小さい重みパラメータまたは大きい重みパラメータ(ショップのサイズに基づいて適用可能な方)に対する調整も算出する。言い換えれば、特定の実施形態において、システムはまた、ショップの第2訓練データセットについてユーザ-アイテム予測を行う際に使用される、局所な、ショップ固有重みパラメータ(小さいか大きいか、どちらか適用可能な方)を生成する。
一実施形態では、最初の訓練データセットは、ショップのそれぞれについて同じサイズである。これにより、訓練のこの段階において、小型ショップを大型ショップと同等にすることができる。言い換えれば、この段階で各ショップに対して同じサイズのデータセットを使用することで、小型ショップよりも多くの販売データを有する大型ショップへの過剰適合を防ぎ、基準モデルに固有のサンプル選択バイアスを低減させることができる。
後述するように、再訓練方法の次の部分は、ショップ固有モデルを第2訓練データセットに適用し、対応する損失を使用してグローバルモデルに対してグローバルパラメータ調整を行うことからなる。
(1.1.2.ショップ固有のモデルを用いたグローバルパラメータ調整の特定)
サンプルバッチ内の各ショップについて、システムは、ショップの第2訓練データセット(230)中のユーザデータとアイテムデータに、モデルのショップ固有のバージョン(225)を適用して、第2訓練データセットのユーザ-アイテム相互作用の予備スコア(235)を取得する。一実施形態では、第2訓練データセットのサイズは、最大数(例えば、100kトランザクション)までの、電子商取引プラットフォーム上のショップの販売量に対応する。これは、より大型ショップに対するモデルの予測精度を維持するのに役立つ。
ショップが小型カテゴリに含まれる場合、システムは、小型ショップ重みパラメータ(250)を予備的なユーザ-アイテム相互作用スコアに適用し、第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを得る。ショップが大型カテゴリに含まれる場合、システムは、大型ショップ重みパラメータ(240)を予備的なユーザ-アイテム相互作用スコアに適用し、第2訓練データセットのための最終的なユーザ-アイテム相互作用スコアを得る。ショップ固有の重みパラメータ調整が、第1ショップ固有損失の後に算出された実施形態では、適用される重みパラメータは、ショップ固有(局所)重みパラメータである。
システムは、ショップの第2訓練データセットにおける予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用に基づいて、ショップの第2ショップ固有損失を算出する(215)。図2において、サンプルバッチにはn個のショップがあり、これはステップ255の後に、n個の第2ショップ固有損失が算出されることを意味する。
システムは、全ての第2ショップ固有損失に基づいて、グローバル損失を算出する(260)。一実施形態では、グローバル損失は、第2ショップ固有損失の平均として算出される。次に、システムは、モデルのグローバルパラメータ調整(270)を算出して、グローバル損失を低減させる。システムは、グローバルパラメータ調整を用いて、モデルのパラメータを調整することにより、更新されたグローバルモデルを生成する。一実施形態では、ショップ固有パラメータ調整とグローバルパラメータ調整は、勾配降下法を使用して算出され、ショップ固有パラメータ調整とグローバルパラメータ調整は、勾配ステップである。
また、システムはグローバル損失を最小化するために、グローバルな小さい重みパラメータと、大きい重みパラメータを調整する。小型ショップと大型ショップに対して異なる重みパラメータを学習することで、小型ショップに対する推薦と大型ショップに対する推薦の違いを学習する。これにより、大型ショップへのモデルの偏りが緩和され、大型ショップ、小型ショップともに推薦性能が向上する。
システムは、再訓練方法を多く繰り返し、前回の繰り返しにおける更新後のグローバルモデルが、次の繰り返しにおけるグローバルモデルとなり、更新されたグローバルな小さな重みパラメータと大きな重みパラメータが、次の繰り返しにおけるグローバルな小さな重みパラメータと大きな重みパラメータとなる。
(1.1.3.再訓練処理の数式表現)
以下は、一実施形態による再訓練方法の数式である。
Figure 0007441270000001
上のアルゴリズムでは
θとθは、それぞれ推薦モデルの小型ショップと大型ショップのパラメータ。
θは、ショップ固有推薦モデルのパラメータ。
は、ショップpの最初のデータセット。
は、ショップpの2つ目のデータセット。
αとβとは、学習率である。
∇は、勾配ステップ、および
Lは、損失関数
後述する図4(a)及び図4(b)は、パラメータθを用いたモデルの例を示している。
一実施形態では、損失関数は次のように定義される。
Figure 0007441270000002
ここで、yは、実際の購入ラベル(購入しない場合は0、購入した場合は1)であり、
Figure 0007441270000003
は、予測されたラベルである。ここでfu,fiは、ユーザ特徴とアイテム特徴であり、これらは訓練可能なワンホット埋め込みまたは事前訓練された表現であってもよい。
(2.予測段階)
予測段階では、再訓練されたモデルは、ターゲット広告のためにショップにユーザを推薦する、又は、電子商取引プラットフォーム上でユーザにアイテムを推薦するために使用することができる。
図3(a)は、予測段階において、ユーザをショップに推薦する方法を示す図である。システムは、再訓練されたモデルを用いて、相互作用値が知られていないテストユーザとアイテムのペアに関して、ユーザ-アイテム相互作用値の予測を得る(ステップ310)。システムは、電子商取引プラットフォーム上でショップが販売するアイテム及び複数のテストユーザのそれぞれに関する予測された相互作用値に基づいて、1人以上のテストユーザをショップに推薦する(ステップ320)。より小型ショップに関する再訓練されたモデルの性能がより良いということは、小型ショップのコールドスタート広告が良いということである。
図3(b)は、テストユーザに1つ以上のアイテムを推薦するための方法を示す図である。システムは、再訓練されたモデルを使用して、相互作用値が知られていないテストユーザとアイテムのペアに関して、ユーザ-アイテム相互作用値の予測を得る(ステップ330)。次に、システムは、テストユーザと、電子商取引プラットフォーム上の複数のアイテムの各々に関する予測された相互作用値に基づいて、テストユーザに1つ以上のアイテムを推薦する(ステップ340)。
(3.モデルアーキテクチャの例)
図4(a)及び図4(b)は、機械学習推薦モデルのアーキテクチャの例を示す。図4(a)において、モデル400aは、連結モジュール420と、ニューラルネットワークエンコーダ430とを含む。連結モジュール420は、ユーザ入力データとアイテム入力データを受け取り、データを連結する。ニューラルネットワークエンコーダ430は、結合されたユーザとアイテムのデータを入力として受取り、入力されたユーザ及びアイテムに対する予備的なユーザ-アイテム相互作用埋込み432(これはベクトルの形である)を出力する。重み層434における重みパラメータが予備的なユーザ-アイテム相互作用埋め込みに適用され、最終的なユーザ-アイテム相互作用スコア436を得ることができる。重み層434では、入力されたアイテムが小型ショップからのものであれば、小型ショップの重みパラメータ434aが使用される。入力されたアイテムが大型ショップからのものである場合、大型ショップの重みパラメータ434bが使用される。小型ショップおよび大型ショップの重みパラメータ434a、434bは、上述した再訓練プロセスにおいて学習されてもよい。最終的なユーザ-アイテム相互作用スコアは、分類モジュール438によって使用され、ユーザ-アイテム相互作用を予測する。一実施形態では、分類モジュール438は、ソフトマックス(Softmax)分類器である。
図4(b)において、モデルは、ユーザニューラルネットワークエンコーダ460とアイテムニューラルネットワークエンコーダ465を含む。ユーザニューラルネットワークエンコーダ460は、入力されたユーザデータ445に適用され、ユーザベクトル表現を生成する。同様に、アイテムニューラルネットワークエンコーダ465は、入力されたアイテムデータ450に適用され、アイテムベクトル表現を得る。ドット積モジュール470は、ユーザ及びアイテムのベクトルのドット積を取り、入力されたユーザとアイテムに対する、予備的なユーザ-アイテム相互作用スコア475を生成する。重み層480における重みパラメータは、最終的なユーザ-アイテム相互作用スコア485を得るために、予備的なユーザ-アイテム相互作用スコアに適用される。重み層480では、入力されたアイテムが小型ショップからのものである場合、小型ショップの重みパラメータ480aが使用される。入力されたアイテムが大型ショップからのものである場合、大型ショップの重みパラメータ480bが使用される。小型ショップ及び大型ショップの重みパラメータ480a、480bは、上述した再訓練処理において学習されてもよい。最終的なユーザ-アイテム相互作用スコアは、分類モジュール490によって使用され、ユーザ-アイテム相互作用を予測する。一実施形態では、分類モジュール490は、ソフトマックス分類器である。
一実施形態では、入力されたユーザデータは、ユーザ-アイテム相互作用データを含む。また、ユーザに関する「サイド情報」(例えば、ユーザの年齢、場所などのユーザ情報)を含んでもよい。一実施形態では、アイテムデータは、アイテムに関する情報であるアイテム「サイド情報」(例えば、製品カテゴリ及びサブカテゴリ)を含む。
(4.システムアーキテクチャの例)
図5は、推薦システムソフトウェアアーキテクチャの一例を示す図である。本明細書に開示されるシステム及び方法は、必ずしもこのアーキテクチャに限定されるものではない。システム500は、機械学習モデル530と、訓練モジュール550と、推薦モジュール540とを含む。機械学習モデル530は、入力されたユーザとアイテムデータ510、520に適用され、ユーザ-アイテム相互作用を予測する。機械学習モデル530は、本明細書に記載の訓練方法に従って、訓練モジュール550によって訓練される。推薦モジュール540は、予測されたユーザ-アイテム相互作用に基づいて、ユーザをショップに推薦するか、又はユーザにアイテムを推薦する。当業者は、推薦システムが、本明細書の開示に関連しない他のモジュールを有し得ることを理解するであろう。
(5.一般)
図1-5について説明した方法は、ソフトウェアで具現化され、ソフトウェアを実行するコンピュータシステム(1つまたは複数のコンピューティングデバイスからなる)によって実行される。当業者であれば、コンピュータシステムが、ソフトウェア命令を格納するための1つ以上の物理的なメモリユニット、ディスク、または他の物理的なコンピュータ可読記録媒体、ならびにソフトウェア命令を実行するための1つ以上のプロセッサを有することを理解するであろう。当業者であれば、コンピュータシステムは、スタンドアロンであっても、サーバとしてコンピュータネットワークに接続されていてもよいことも理解するであろう。
当業者には理解されるように、本発明は、その精神または本質的特徴から逸脱することなく、他の特定の形態で具現化することができる。従って、上記の開示は、請求された発明の範囲を例示するものであって、限定するものではないことを意図している。
本出願は、2021年7月14日に出願された米国仮出願第63/221,872号、タイトルは「Cold-Start Item Advertisement for Small Businesses」、及び2022年4月5日に出願された米国出願第17/713,855、タイトルは「Reducing Sample Selection Bias in a Machine Learning-based Recommender System」、これらの利益を主張し、その内容は、参照により、本書に完全に開示されたように組み込まれる。

Claims (15)

  1. コンピュータシステムによって実行され、異なる販売量を有する異なるショップからの商品を含む電子商取引プラットフォーム上で、ユーザ-アイテム相互作用値を予測するための機械学習方法であって、
    訓練段階と予測段階を含み、
    前記訓練段階は、
    前もって訓練された機械学習モデルであって、前記異なる販売量を有する異なるショップを含む前記電子商取引プラットフォーム上のユーザデータとアイテムデータに基づいて、ユーザ-アイテム相互作用を予測する機械学習モデルを取得する取得ステップと、
    前記機械学習モデルを修正して、販売量の多いショップに有利なサンプル選択バイアスを低減させる修正ステップと、を備え、
    前記修正ステップは、
    (a)前記電子商取引プラットフォーム上のショップのサンプルバッチであって、小型ショップカテゴリのショップと大型ショップカテゴリのショップを含むサンプルバッチを特定するステップであって、前記小型ショップカテゴリと前記大型ショップカテゴリは、前記電子商取引プラットフォーム上の販売量閾値に関連して定義され、前記小型ショップカテゴリのショップは、前記大型ショップカテゴリのショップよりも前記電子商取引プラットフォーム上での販売量は少なく、
    (b)前記サンプルバッチ内の各ショップついて、第1訓練データセットと第2訓練データセットを取得するステップであって、各ショップについて、前記第1訓練データセットと前記第2訓練データセットはそれぞれ、前記ショップ内のアイテムに関するアイテムデータと、前記ショップ内のアイテムに関するユーザ-アイテム相互作用データを含むユーザデータと、を有し、
    (c)サンプルバッチの各ショップに対して、
    前記ショップが前記小型ショップカテゴリに含まれるのか、前記大型ショップカテゴリに含まれるのかを判断し、
    前記機械学習モデルを前記ショップの前記第1訓練データセットのユーザデータとアイテムデータに適用して、前記第1訓練データセットの各ユーザとアイテムのペアの予備的ユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル小型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル大型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記最終的なユーザ-アイテム相互作用スコアを用いて、前記第1訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
    前記ショップの前記第1訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第1ショップ固有損失を算出し、
    前記第1ショップ固有損失を減少させるために、
    前記機械学習モデルのパラメータの局所更新を算出して、ショップ固有パラメータ調整を算出し
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記ショップの前記小型ショップ重みパラメータの局所更新を算出し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記ショップの前記大型ショップ重みパラメータの局所更新を算出し、
    局所パラメータの更新を前記機械学習モデルに適用することにより、前記機械学習モデルのショップ固有バージョンを生成し、
    前記機械学習モデルの前記ショップ固有のバージョンを、前記ショップの前記第2訓練データセットのユーザデータとアイテムデータに適用して、前記第2訓練データセットの各ユーザとアイテムのペアに対する予備的ユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、局所小型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、局所大型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記最終的なユーザ-アイテム相互作用スコアを使用して、前記第2訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
    前記ショップの前記第2訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第2ショップ固有損失を算出する、ステップと、
    (d)前記サンプルバッチ内の全ショップの前記第2ショップ固有損失に基づいて、グローバル損失を算出するステップと、
    (e)前記グローバル損失を低減するため前記機械学習モデルのグローバルパラメータ調整を算出するステップと、
    (f)前記グローバル損失を低減するため前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータを調整するステップと、
    (g)前記グローバルパラメータ調整を用いて、前記機械学習モデルのパラメータを調整することにより、更新されたモデルを生成するステップと、
    (h)ステップ(c)-(g)を複数繰り返し、前の繰り返しの前記更新されたモデルが、次の繰り返しの前記機械学習モデルとなり、調整された前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータが、次の繰り返しで使用されるステップ、を実行し、
    前記予測段階は、
    前記更新されたモデルを使用して、相互作用値が知られていないユーザとアイテムのペアに関して、前記電子商取引プラットフォーム上でユーザ-アイテム相互作用値の予測を取得すること、を実行する、
    機械学習方法。
  2. 前記ショップ固有パラメータ調整と前記グローバルパラメータ調整は、勾配降下法を用いて算出され、前記ショップ固有パラメータ調整と前記グローバルパラメータ調整は、勾配ステップであることを特徴とする、
    請求項1に記載の機械学習方法。
  3. ショップにより前記電子商取引プラットフォーム上で販売されたアイテムと、複数のテストユーザのそれぞれについて、予測された相互作用値に基づいて、1人以上のテストユーザを前記ショップに推薦するステップを、さらに含む、
    請求項1に記載の機械学習方法。
  4. テストユーザと、前記商取引プラットフォーム上の複数のアイテムのそれぞれについて、予測された相互作用値に基づいて、前記テストユーザに1つ以上のアイテムを推薦すること、さらに含む、
    請求項1に記載の機械学習方法。
  5. 前記第1訓練データセットのサイズは、前記サンプルバッチ内の各ショップについて実質的に同じサイズである、
    請求項1に記載の機械学習方法。
  6. ショップの前記第2訓練データセットは、前記電子商取引プラットフォームにおける前記ショップの販売量の大きさに対応する、
    請求項1に記載の機械学習方法。
  7. コンピュータシステムによって実行され、異なる販売量を有する異なるショップからの商品を含む電子商取引プラットフォーム上で、ユーザ-アイテム相互作用値を予測するモデルを訓練するための訓練方法であって、
    前もって訓練された機械学習モデルであって、前記異なる販売量を有する異なるショップを含む前記電子商取引プラットフォーム上のユーザデータとアイテムデータに基づいて、ユーザ-アイテム相互作用を予測する機械学習モデルを取得する取得ステップと、
    前記機械学習モデルを修正して、販売量の多いショップに有利なサンプル選択バイアスを低減させる修正ステップと、を備え
    前記修正ステップは、
    (a)前記電子商取引プラットフォーム上のショップのサンプルバッチであって、小型ショップカテゴリのショップと大型ショップカテゴリのショップを含むサンプルバッチを特定するステップであって、前記小型ショップカテゴリと前記大型ショップカテゴリは、前記電子商取引プラットフォーム上の販売量閾値に関連して定義され、前記小型ショップカテゴリのショップは、前記大型ショップカテゴリのショップよりも前記電子商取引プラットフォーム上での販売量は少なく、
    (b)前記サンプルバッチ内の各ショップついて、第1訓練データセットと第2訓練データセットを取得するステップであって、各ショップについて、前記第1訓練データセットと前記第2訓練データセットはそれぞれ、前記ショップ内のアイテムに関するアイテムデータと、前記ショップ内のアイテムに関するユーザ-アイテム相互作用データを含むユーザデータと、を有し、
    (c)サンプルバッチの各ショップに対して、
    前記ショップが前記小型ショップカテゴリに含まれるのか、前記大型ショップカテゴリに含まれるのかを判断し、
    前記機械学習モデルを前記ショップの前記第1訓練データセットのユーザデータとアイテムデータに適用して、前記第1訓練データセットの各ユーザとアイテムのペアの予備的ユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル小型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル大型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記最終的なユーザ-アイテム相互作用スコアを用いて、前記第1訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
    前記ショップの前記第1訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第1ショップ固有損失を算出し、
    前記第1ショップ固有損失を減少させるために、
    前記機械学習モデルのパラメータの局所更新を算出して、ショップ固有パラメータ調整を算出し
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記ショップの前記小型ショップ重みパラメータの局所更新を算出し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記ショップの前記大型ショップ重みパラメータの局所更新を算出し、
    局所パラメータの更新を前記機械学習モデルに適用することにより、前記機械学習モデルのショップ固有バージョンを生成し、
    前記機械学習モデルの前記ショップ固有のバージョンを、前記ショップの前記第2訓練データセットのユーザデータとアイテムデータに適用して、前記第2訓練データセットの各ユーザとアイテムのペアに対する予備的ユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、局所小型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、局所大型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記最終的なユーザ-アイテム相互作用スコアを使用して、前記第2訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
    前記ショップの前記第2訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第2ショップ固有損失を算出する、ステップと、
    (d)前記サンプルバッチ内の全ショップの前記第2ショップ固有損失に基づいて、グローバル損失を算出するステップと、
    (e)前記グローバル損失を低減するため前記機械学習モデルのグローバルパラメータ調整を算出するステップと、
    (f)前記グローバル損失を低減するため前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータを調整するステップと、
    (g)前記グローバルパラメータ調整を用いて、前記機械学習モデルのパラメータを調整することにより、更新されたモデルを生成するステップと、
    (h)ステップ(c)-(g)を複数繰り返し、前の繰り返しの前記更新されたモデルが、次の繰り返しの前記機械学習モデルとなり、調整された前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータが、次の繰り返しで使用されるステップ、を実行する、
    訓練方法。
  8. ショップの前記第2訓練データセットのサイズは、前記電子商取引プラットフォームの前記ショップの販売量のサイズに対応する、
    請求項7に記載の訓練方法。
  9. 異なる販売量を有する異なるショップの商品を含む電子商取引プラットフォームにおいて、ユーザ-アイテム相互作用値を予測するための予測システムであって、
    機械コードのセットを使用してプログラムされた命令を実行するように構成されたプロセッサと、
    プロセッサに結合された1つ以上のメモリユニットと、
    当該システムの前記1つ以上のメモリユニットに格納され、ユーザ入力とアイテム入力を取得し、前記電子商取引プラットフォーム上のユーザとアイテムの予測されたユーザ-アイテム相互作用値に対応するユーザ相互作用スコアを出力する機械学習モデルであって、前記出力を生成するために前記機械コードに実装された算出命令を含み機械学習モデルと、を備え、
    前記機械学習モデルは、訓練方法に従って訓練され、
    前記訓練方法は、
    (a)前記電子商取引プラットフォーム上のショップのサンプルバッチであって、小型ショップカテゴリのショップと大型ショップカテゴリのショップを含むサンプルバッチを特定するステップであって、前記小型ショップカテゴリと前記大型ショップカテゴリは、前記電子商取引プラットフォーム上の販売量閾値に関連して定義され、前記小型ショップカテゴリのショップは、前記大型ショップカテゴリのショップよりも前記電子商取引プラットフォーム上での販売量は少なく、
    (b)前記サンプルバッチ内の各ショップついて、第1訓練データセットと第2訓練データセットを取得するステップであって、各ショップについて、前記第1訓練データセットと前記第2訓練データセットはそれぞれ、前記ショップ内のアイテムに関するアイテムデータと、前記ショップ内のアイテムに関するユーザ-アイテム相互作用データを含むユーザデータと、を有し、
    (c)サンプルバッチの各ショップに対して、
    前記ショップが前記小型ショップカテゴリに含まれるのか、前記大型ショップカテゴリに含まれるのかを判断し、
    前記機械学習モデルを前記ショップの前記第1訓練データセットのユーザデータとアイテムデータに適用して、前記第1訓練データセットの各ユーザとアイテムのペアの予備的ユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル小型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル大型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記最終的なユーザ-アイテム相互作用スコアを用いて、前記第1訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
    前記ショップの前記第1訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第1ショップ固有損失を算出し、
    前記第1ショップ固有損失を減少させるために、
    前記機械学習モデルのパラメータの局所更新を算出して、ショップ固有パラメータ調整を算出し
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記ショップの前記小型ショップ重みパラメータの局所更新を算出し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記ショップの前記大型ショップ重みパラメータの局所更新を算出し、
    局所パラメータの更新を前記機械学習モデルに適用することにより、前記機械学習モデルのショップ固有バージョンを生成し、
    前記機械学習モデルの前記ショップ固有のバージョンを、前記ショップの前記第2訓練データセットのユーザデータとアイテムデータに適用して、前記第2訓練データセットの各ユーザとアイテムのペアに対する予備的ユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、局所小型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、局所大型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記最終的なユーザ-アイテム相互作用スコアを使用して、前記第2訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
    前記ショップの前記第2訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第2ショップ固有損失を算出する、ステップと、
    (d)前記サンプルバッチ内の全ショップの前記第2ショップ固有損失に基づいて、グローバル損失を算出するステップと、
    (e)前記グローバル損失を低減するため前記機械学習モデルのグローバルパラメータ調整を算出するステップと、
    (f)前記グローバル損失を低減するため前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータを調整するステップと、
    (g)前記グローバルパラメータ調整を用いて、前記機械学習モデルのパラメータを調整することにより、更新されたモデルを生成するステップと、
    (h)ステップ(c)-(g)を複数繰り返し、前の繰り返しの前記更新されたモデルが、次の繰り返しの前記機械学習モデルとなり、調整された前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータが、次の繰り返しで使用されるステップ、を実行する、
    予測システム。
  10. 前記機械学習モデルは、
    前記ユーザ入力と前記アイテム入力を受け取り、前記ユーザ入力と前記アイテム入力を連結する連結モジュールと、
    連結された前記ユーザ入力と前記アイテム入力を受け取り、予備的ユーザ-アイテム相互作用の埋め込みを出力するニューラルネットワークエンコーダと、
    前記予備的ユーザ-アイテム相互作用の埋め込みに、小型ショップ重みパラメータまたは大型ショップの重みパラメータを適用し、前記最終的なユーザ-アイテム相互作用スコアを生成する重み層と、を備える、
    請求項9に記載の予測システム。
  11. 前記機械学習モデルは、
    前記アイテムデータを受け取り、アイテム特徴表現を出力するアイテムニューラルネットワークエンコーダと、
    前記ユーザデータを受け取り、ユーザ特徴表現を出力するためのユーザニューラルネットワークエンコーダであって、前記ユーザ特徴表現と前記アイテム特徴表現のドット積を取得することによって、前記予備的ユーザ-アイテム相互作用スコアを生成する、ユーザニューラルネットワークエンコーダと、
    前記予備的ユーザ-アイテム相互作用スコアに、小型ショップ重みパラメータ又は大型ショップの重みパラメータを適用し、前記最終的なユーザ-アイテム相互作用スコアを生成する重み層と、
    を備える、請求項9に記載の予測システム。
  12. ショップの前記第2訓練データセットは、前記電子商取引プラットフォームにおける前記ショップの販売量の大きさに対応する、
    請求項9に記載の予測システム。
  13. コンピュータシステムに、異なる販売量を有する異なるショップからの商品を含む電子商取引プラットフォームにおいて、ユーザ-アイテム相互作用値を予測する方法を実行させるためのコンピュータプログラムを記録した非一時的コンピュータ可読媒体であって、
    前記方法は、訓練段階と予測段階を備え、
    前記訓練段階は、
    前もって訓練された機械学習モデルであって、前記異なる販売量を有する異なるショップを含む前記電子商取引プラットフォーム上のユーザデータとアイテムデータに基づいて、ユーザ-アイテム相互作用を予測する機械学習モデルを取得する取得ステップと、
    前記機械学習モデルを修正して、販売量の多いショップに有利なサンプル選択バイアスを低減させる修正ステップと、を備え、
    前記修正ステップは、
    (a)前記電子商取引プラットフォーム上のショップのサンプルバッチであって、小型ショップカテゴリのショップと大型ショップカテゴリのショップを含むサンプルバッチを特定するステップであって、前記小型ショップカテゴリと前記大型ショップカテゴリは、前記電子商取引プラットフォーム上の販売量閾値に関連して定義され、前記小型ショップカテゴリのショップは、前記大型ショップカテゴリのショップよりも前記電子商取引プラットフォーム上での販売量は少なく、
    (b)前記サンプルバッチ内の各ショップついて、第1訓練データセットと第2訓練データセットを取得するステップであって、各ショップについて、前記第1訓練データセットと前記第2訓練データセットはそれぞれ、前記ショップ内のアイテムに関するアイテムデータと、前記ショップ内のアイテムに関するユーザ-アイテム相互作用データを含むユーザデータと、を有し、
    (c)サンプルバッチの各ショップに対して、
    前記ショップが前記小型ショップカテゴリに含まれるのか、前記大型ショップカテゴリに含まれるのかを判断し、
    前記機械学習モデルを前記ショップの前記第1訓練データセットのユーザデータとアイテムデータに適用して、前記第1訓練データセットの各ユーザとアイテムのペアの予備的ユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル小型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記予備的ユーザ-アイテム相互作用スコアに、グローバル大型ショップ重みパラメータを適用し、前記第1訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記最終的なユーザ-アイテム相互作用スコアを用いて、前記第1訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
    前記ショップの前記第1訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第1ショップ固有損失を算出し、
    前記第1ショップ固有損失を減少させるために、
    前記機械学習モデルのパラメータの局所更新を算出して、ショップ固有パラメータ調整を算出し
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、前記ショップの前記小型ショップ重みパラメータの局所更新を算出し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、前記ショップの前記大型ショップ重みパラメータの局所更新を算出し、
    局所パラメータの更新を前記機械学習モデルに適用することにより、前記機械学習モデルのショップ固有バージョンを生成し、
    前記機械学習モデルの前記ショップ固有のバージョンを、前記ショップの前記第2訓練データセットのユーザデータとアイテムデータに適用して、前記第2訓練データセットの各ユーザとアイテムのペアに対する予備的ユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記小型ショップカテゴリに含まれることに応答して、局所小型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記ショップが前記大型ショップカテゴリに含まれることに応答して、局所大型ショップ重みパラメータを前記予備的ユーザ-アイテム相互作用スコアに適用して、前記第2訓練データセットの最終的なユーザ-アイテム相互作用スコアを取得し、
    前記最終的なユーザ-アイテム相互作用スコアを使用して、前記第2訓練データセットにおける各ユーザとアイテムのペアのユーザ-アイテム相互作用を予測し、
    前記ショップの前記第2訓練データセットにおいて、予測されたユーザ-アイテム相互作用と、実際のユーザ-アイテム相互作用との間の第2ショップ固有損失を算出する、ステップと、
    (d)前記サンプルバッチ内の全ショップの前記第2ショップ固有損失に基づいて、グローバル損失を算出するステップと、
    (e)前記グローバル損失を低減するため前記機械学習モデルのグローバルパラメータ調整を算出するステップと、
    (f)前記グローバル損失を低減するため前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータを調整するステップと、
    (g)前記グローバルパラメータ調整を用いて、前記機械学習モデルのパラメータを調整することにより、更新されたモデルを生成するステップと、
    (h)ステップ(c)-(g)を複数繰り返し、前の繰り返しの前記更新されたモデルが、次の繰り返しの前記機械学習モデルとなり、調整された前記グローバル小型ショップ重みパラメータと前記グローバル大型ショップ重みパラメータが、次の繰り返しで使用されるステップ、を実行し、
    前記予測段階は、
    前記更新されたモデルを使用して、相互作用値が知られていないユーザとアイテムのペアに関して、前記電子商取引プラットフォーム上でユーザ-アイテム相互作用値の予測を取得すること、を実行する、
    非一時的コンピュータ可読媒体。
  14. 前記電子商取引プラットフォーム上でショップにより販売されるアイテムと、複数のテストユーザのそれぞれについて、予測される相互作用値に基づいて、前記ショップに1人以上のテストユーザを推薦するステップを、さらに含む、
    請求項13に記載の非一時的コンピュータ可読媒体。
  15. テストユーザと、前記電子商取引プラットフォーム上の複数のアイテムのそれぞれについて、予測される相互作用値に基づいて、前記テストユーザに、1つ以上のアイテムを推薦すること、をさらに含む、
    請求項13に記載の非一時的コンピュータ可読媒体。
JP2022096135A 2021-07-14 2022-06-14 機械学習方法、訓練方法、予測システム、及び非一時的コンピュータ可読媒体 Active JP7441270B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163221872P 2021-07-14 2021-07-14
US63/221,872 2021-07-14
US17/713,855 2022-04-05
US17/713,855 US20230036394A1 (en) 2021-07-14 2022-04-05 Reducing sample selection bias in a machine learning-based recommender system

Publications (2)

Publication Number Publication Date
JP2023017701A JP2023017701A (ja) 2023-02-07
JP7441270B2 true JP7441270B2 (ja) 2024-02-29

Family

ID=82016230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022096135A Active JP7441270B2 (ja) 2021-07-14 2022-06-14 機械学習方法、訓練方法、予測システム、及び非一時的コンピュータ可読媒体

Country Status (4)

Country Link
US (1) US20230036394A1 (ja)
EP (1) EP4120175A1 (ja)
JP (1) JP7441270B2 (ja)
TW (1) TW202309810A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116823410B (zh) * 2023-08-29 2024-01-12 阿里巴巴(成都)软件技术有限公司 数据处理方法、对象处理方法、推荐方法及计算设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020030324A1 (de) 2018-08-09 2020-02-13 Robert Bosch Gmbh Verfahren zum betreiben eines sensors zur detektion von teilchen in einem messgas
JP2020109631A (ja) 2018-12-28 2020-07-16 パロ アルト リサーチ センター インコーポレイテッド 深層ニューラルネットワークのアンサンブルを使用した迅速なビデオクエリ
JP2020144849A (ja) 2019-03-04 2020-09-10 富士通株式会社 メタ学習ネットワークを訓練する装置及び方法
JP2021099791A (ja) 2019-11-20 2021-07-01 楽天グループ株式会社 直接型ニューラルネットワーク構造を用いてアイテムを推奨するシステム、方法、及びコンピュータプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10354184B1 (en) * 2014-06-24 2019-07-16 Amazon Technologies, Inc. Joint modeling of user behavior

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020030324A1 (de) 2018-08-09 2020-02-13 Robert Bosch Gmbh Verfahren zum betreiben eines sensors zur detektion von teilchen in einem messgas
JP2020109631A (ja) 2018-12-28 2020-07-16 パロ アルト リサーチ センター インコーポレイテッド 深層ニューラルネットワークのアンサンブルを使用した迅速なビデオクエリ
JP2020144849A (ja) 2019-03-04 2020-09-10 富士通株式会社 メタ学習ネットワークを訓練する装置及び方法
JP2021099791A (ja) 2019-11-20 2021-07-01 楽天グループ株式会社 直接型ニューラルネットワーク構造を用いてアイテムを推奨するシステム、方法、及びコンピュータプログラム

Also Published As

Publication number Publication date
US20230036394A1 (en) 2023-02-02
TW202309810A (zh) 2023-03-01
EP4120175A1 (en) 2023-01-18
JP2023017701A (ja) 2023-02-07

Similar Documents

Publication Publication Date Title
JP6703575B2 (ja) レコメンダシステム用にユーザ、アイテム、及びレビューの表現を組み合せる方法及びシステム
CN111008858B (zh) 一种商品销量预测方法及系统
CN110969516B (zh) 一种商品推荐方法及装置
CN109102127B (zh) 商品推荐方法及装置
CN111460316B (zh) 一种面向知识系统的个性化推荐方法及计算机存储介质
US20230055699A1 (en) Recommender system and method using shared neural item representations for cold-start recommendations
JP7441270B2 (ja) 機械学習方法、訓練方法、予測システム、及び非一時的コンピュータ可読媒体
KR102422408B1 (ko) 협업 필터링 신경망을 이용하여 상품을 추천하는 방법 및 장치
JP5094643B2 (ja) 予想落札価格算出装置、予想落札価格算出方法、及びコンピュータプログラム
JP7423694B2 (ja) 機械学習方法、訓練方法、予測システム、及び非一時的コンピュータ可読媒体
Adam et al. Machine learning for demand estimation in long tail markets
JP7429260B2 (ja) 機械学習方法、訓練方法、予測システム、及び非一時的コンピュータ可読媒体
JP7431890B2 (ja) 機械学習方法、訓練方法、予測システム、及び非一時的コンピュータ可読媒体
KR102280301B1 (ko) 명시적 및 내연적 평가 정보를 이용한 아이템 추천 방법 및 장치
CN114926208A (zh) 一种用于产品改进策略制定的用户需求数据分析方法及系统
US11995665B2 (en) Reducing sample selection bias in a machine learning-based recommender system
Desrosiers et al. Solving the sparsity problem: collaborative filtering via indirect similarities
CN113743440A (zh) 一种信息处理方法及装置、存储介质
CN110880141A (zh) 一种深度双塔模型智能匹配算法及装置
US11797961B2 (en) Vectorization of transactions
JP7092845B2 (ja) 情報処理装置および情報処理方法
JP7201001B2 (ja) 品揃え支援装置、品揃え支援方法、及びプログラム
US20220092634A1 (en) Information processing device and non-transitory computer readable medium
Feng et al. Sparse regularization in marketing and economics
Kumari et al. Predicting Size and Fit in Fashion E-Commerce

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221114

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240216

R150 Certificate of patent or registration of utility model

Ref document number: 7441270

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150