JP2021099791A

JP2021099791A - 直接型ニューラルネットワーク構造を用いてアイテムを推奨するシステム、方法、及びコンピュータプログラム

Info

Publication number: JP2021099791A
Application number: JP2020189584A
Authority: JP
Inventors: ラミン・ラジパーチコライ; Raziperchikolaei Ramin
Original assignee: Rakuten Group Inc
Current assignee: Rakuten Group Inc
Priority date: 2019-11-20
Filing date: 2020-11-13
Publication date: 2021-07-01
Anticipated expiration: 2040-11-13
Also published as: US11494644B2; US20210150337A1; JP7267985B2

Abstract

【課題】ユーザデータ及びアイテムデータからアイテムに関して予測されるユーザのレイティングを、直接学習するニューラルネットワークアーキテクチャを用いて商品を推奨するシステム、方法及びコンピュータプログラムを提供する。【解決手段】方法は、符号化用ニューラルネットワークの組を、ユーザデータ及びアイテムデータの各入力ソースを低次元ベクトル空間に対応付ける。各符号化用ニューラルネットワークの低次元ベクトル出力を組み合わせて、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現を作成する。予測用ニューラルネットワークは、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現に基づいて、アイテムに関するユーザのレイティングを予測できるようにトレーニングし、ユーザの、アイテムに関して予測されたレイティングに基づいて対象ユーザにアイテムを推奨する。【選択図】図３

Description

本発明は概して推奨システムに関し、より具体的には、推奨システムにとってより効率的なニューラルネットワーク構造に関する。

推奨システムの目標は、ユーザが、多くのアイテムの集まりの中からユーザ個人の好みに最も合うアイテムを特定するのを手助けすることにある。ハイブリッド型の推奨システムは、ユーザのプロファイル情報と、アイテムの情報と、過去のユーザのレイティングとを用いて推奨を行う。

推奨システムによっては、ニューラルネットワークを用いて、アイテムに関するユーザのレイティングを予測する。ニューラルネットワークは、アイテムのデータ及びユーザのデータを予測に関係のあるものに圧縮し、この圧縮されたデータを用いて予測を行う。言い換えると、ニューラルネットワークは、レイティングの予測につながるユーザの特性及びアイテムの特性を特定するものである。ニューラルネットワークは、当該ネットワークが所望の出力を得ることを助ける目的関数を最適化することによりトレーニングされる。

図１に、推奨システムの最も一般的なニューラルネットワークのアーキテクチャを示す。このアーキテクチャは、２つのオートエンコーダ（自己符号化器）（１１０、１２０）を利用し、一方はユーザデータの圧縮された表現（１３０）を生成するためのものであり、他方はアイテムデータの圧縮された表現（１３５）を生成するためのものである。この圧縮された表現の生成は、ニューラルネットワークのエンコーダ（１２０ａ、１２０ｂ、１２５ａ、１２５ｂ）とニューラルネットワークのデコーダ（１４０ａ、１４０ｂ、１４５ａ、１４５ｂ）との双方の利用を伴う。オートエンコーダにおいて、エンコーダは入力を低次元表現に対応付けて、デコーダはその表現を取り込んで入力を復元する。オートエンコーダをトレーニングすることで、低次元のユーザ表現あるいはアイテム表現が得られるが、アイテムに関するユーザのレイティングを予測することはできない。

この問題を解決するために、２つの行列が導入される。１つは、全てのユーザの低次元表現を有する行列（行列Ｕ）であり、もう１つは、全てのアイテムの低次元表現を有する行列（行列Ｖ）である。これらの２つの行列は、ユーザ表現及びアイテム表現のドット積がレイティングを近似するものとなるように学習される。オートエンコーダのトレーニングにおいて、エンコーダの出力は、これらの２つのユーザ及びアイテムの表現行列に近づくように制約される。オートエンコーダに基づく推奨システムは、行列の変数と、ハイパーパラメータと、エンコーダ及びデコーダの関数とを含む目的関数を用いてトレーニングされる。オートエンコーダに基づく推奨システムの目的関数は、以下のように記述することができる。

ただし、
Ｌ（）は復元に伴う損失であり、
ｇ^ｕはユーザデータのエンコーダであり、
ｆ^ｕはユーザデータのデコーダであり、
ｇ^ｉはアイテムデータのエンコーダであり、
ｇ^ｕはアイテムデータのデコーダであり、
Ｕは、全てのユーザの低次元表現を有する行列であり、
Ｖは、全てのアイテムの低次元表現を有する行列である。

は、利用可能な、ｍ人のユーザ及びｎ個のアイテムのレイティングを含む。ただし、Ｒ_ｊｋは、ユーザｊの、アイテムｋに関するレイティングである。
θは、２つのオートエンコーダの全てのパラメータを含み、
λ_１、λ_２、及びλ_３はハイパーパラメータである。

この構造を用いることには不利な点がいくつかある。第１に、最適化が難しく、多くの時間を要する。その理由は、ユーザ行列及びアイテム行列（すなわち、行列Ｕ及び行列Ｖ）が非常に大きく、行列とニューラルネットワークのパラメータとの間の交互の最適化が必要となるからである。第２に、これらの行列変数を用いるためには、目的関数に３つのハイパーパラメータ（すなわち、λ_１、λ_２、及びλ_３）が必要となり、これらの設定が難しい可能性がある。第３に、オートエンコーダがエンコーダ及びデコーダの双方を有し各々が独自のパラメータを有するということは、効率的で正確な予測のために求められるものよりも多くの数のニューラルネットワークパラメータが存在することを意味する。

本開示は、ニューラルネットワークを用いて商品を推奨するシステム、方法、及びコンピュータプログラムに関する。この推奨システムは、ユーザに関係したデータの１つ以上のソースと、アイテムに関係したデータの１つ以上のソースとから、ユーザの、アイテムに関して予測されるレイティングを直接、学習するニューラルネットワークアーキテクチャを用いる。符号化用ニューラルネットワークの組は、入力されたユーザデータ及びアイテムデータの各ソースを低次元ベクトル空間へと対応付ける。符号化用ニューラルネットワークの個々の低次元ベクトルの出力が組み合わされて、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現が作成される。予測用ニューラルネットワークは、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現に基づいて、ユーザの、アイテムに関するレイティングを予測できるようにトレーニングされる。このシステムは、ユーザの、アイテムに関して予測されたレイティングに基づいてアイテムをユーザに推奨する。

図１のニューラルネットワーク構造を用いる推奨システムとは異なり、本明細書に開示される方法は、ニューラルネットワーク構造にデコーダの使用を必要としない。その結果、開示される方法によれば、ネットワークパラメータの数がより少なくなる結果、収束はより速くなる。また、本明細書に開示される方法では、従来の方法におけるユーザの表現及びアイテムの表現を有する大きな行列（例えば、図１における行列Ｕ及びＶ）の計算及び最適化が必要とされない。これは、全ての変数のエンドツーエンドのトレーニングをもたらし、このトレーニングは、従来の処理における交互の最適化手法よりも高速かつ容易である。これにより、ニューラルネットワークをトレーニングする目的関数に含まれるハイパーパラメータの数をより少なくする（すなわち、従来技術の３つとは異なり、１つとする）こともできる。

１つの実施の形態において、直接型ニューラルネットワーク構造を用いてユーザに商品を推奨する方法は、
トレーニングフェーズに関して、
（ａ）アイテムに関する既知のレイティングを有するトレーニング用データセットにおけるトレーニング用ユーザについて、前記トレーニング用ユーザのユーザデータを有する１つ以上の入力ベクトルと、アイテムのアイテムデータを有する１つ以上の入力ベクトルとを受け付けるステップと、
（ｂ）符号化用ニューラルネットワークの組を用いて、各入力ベクトルを低次元ベクトル空間へと対応付けて、ユーザデータの１つ以上の低次元ベクトルと、アイテムデータの１つ以上の低次元ベクトルとを得るステップであって、入力ベクトルごとに異なる符号化用ニューラルネットワークが用いられ、ユーザの低次元ベクトル及びアイテムの低次元ベクトルは、対応する入力ベクトルに比べて次元が低い、ステップと、
（ｃ）１つ以上のユーザの低次元ベクトル及び１つ以上のアイテムの低次元ベクトルに基づいて、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現を作成するステップと、
（ｄ）予測用ニューラルネットワークを用いて、トレーニング用のユーザデータ及びアイテムデータの単一の多次元ベクトル表現に基づき、トレーニング用ユーザの、アイテムについて予測されるレイティングを計算するステップと、
（ｅ）トレーニング用ユーザの、アイテムについて予測されたレイティングと、トレーニング用ユーザの、アイテムについての既知のレイティングとの間の誤差値を計算するステップと、
（ｆ）トレーニング用データセットにおける複数のトレーニング用ユーザに対してステップ（ａ）〜（ｅ）を実行するステップと、
（ｇ）複数のトレーニング用ユーザの誤差値が最小となるように、符号化用ニューラルネットワーク及び予測用ニューラルネットワークのパラメータを更新するステップと、
（ｈ）複数回にわたりステップ（ａ）〜（ｇ）を繰り返して、符号化用ニューラルネットワーク及び予測用ニューラルネットワークをトレーニングするステップと
を実行するステップと、
予測及び推奨フェーズに関して、
（ｉ）テスト対象ユーザのユーザデータを有する１つ以上の入力ベクトルと、テスト対象ユーザによって評価されていないアイテムのアイテムデータを有する１つ以上の入力ベクトルとを受け付けるステップと、
（ｊ）符号化用ニューラルネットワークの組を用いて、各入力ベクトルを低次元ベクトル空間へと対応付けて、ユーザデータの１つ以上の低次元ベクトルと、アイテムデータの１つ以上の低次元ベクトルとを得るステップであって、入力ベクトルごとに異なる符号化用ニューラルネットワークが用いられ、ユーザの低次元ベクトル及びアイテムの低次元ベクトルは、対応する入力ベクトルに比べて次元が低い、ステップと、
（ｋ）１つ以上のユーザの低次元ベクトル及び１つ以上のアイテムの低次元ベクトルに基づいて、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現を作成するステップと、
（ｌ）予測用ニューラルネットワークを用いて、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現に基づき、テスト対象ユーザによるアイテムについての予測されるレイティングを計算するステップと、
（ｍ）テスト対象ユーザと、テスト対象ユーザによって評価されていない複数のアイテムとに対してステップ（ｉ）〜（ｌ）を繰り返すステップと、
（ｎ）テスト対象ユーザの、複数のアイテムについて予測されたレイティングを用いて、１つ以上のアイテムをテスト対象ユーザに推奨するステップと
を実行するステップと
を含む。

従来の推奨システムにおいて用いられるニューラルネットワークのアーキテクチャを示す図である。アイテムのユーザレイティングを予測できるようにニューラルネットワークシステムをトレーニングするための、１つの実施形態による方法を示すフローチャートである。アイテムのユーザレイティングを予測できるようにニューラルネットワークシステムをトレーニングするための、１つの実施形態による方法を示すフローチャートである。複数のアイテムに関するユーザのレイティングを予測し、これらのレイティングに基づいてユーザにアイテムを推奨するための、１つの実施形態による方法を示すフローチャートである。推奨システムのための一例としての直接型ニューラルネットワークアーキテクチャのブロック図である。一例としての推奨システムのブロック図である。

本開示は、ニューラルネットワークを用いて商品を推奨するためのシステム、方法、及びコンピュータプログラムに関する。本明細書に開示される方法は、コンピュータシステム（「本システム」）によって実行される。

以下でより詳細に説明するように、本システムは、ユーザ及びアイテムに関係したデータから、そのアイテムに関して予測されるユーザのレイティングを直接、学習するニューラルネットワークのアーキテクチャを用いる。このプロセスは、本システムが、表現をデコードする必要がなく、全てのユーザ及び全てのアイテムの表現を有する非常に大きな行列のドット積を計算することもなく、特定のユーザ及び特定のアイテムに関係したデータを符号化し、符号化されたデータから予測を出力するという点において、直接的である。図４に、ニューラルネットワークアーキテクチャの一例を示す。本システムは、予測されたレイティングを用いて、ユーザに商品を推奨する。

本方法は、トレーニングフェーズと予測及び推奨フェーズとを含む。トレーニングフェーズにおいて、本システムのニューラルネットワークは、ユーザデータ及びアイテムデータの符号化された表現に基づいて、アイテムに関するユーザのレイティングを予測できるようにトレーニングされる。予測及び推奨フェーズにおいては、トレーニングがなされたニューラルネットワークを用いてユーザのレイティングが予測され、本システムは、予測されたレイティングを用いて商品を推奨する。これらのフェーズは、種々のエンティティによって実行することができる（例えば、１つのエンティティは、ニューラルネットワークをトレーニングすることができ、別のエンティティは、トレーニングがなされたネットワークを用いて商品の推奨を行うことができる）。これらのフェーズの各々を以下に説明する。

１．トレーニングフェーズ
１．１入力
図２Ａ及び図２Ｂに、アイテムに関するユーザのレイティングを予測できるよう本システムをトレーニングする方法を示す。本方法を、図４のニューラルネットワークアーキテクチャに関して説明する。本システムは、アイテムに関する既知のトレーニング用のユーザのレイティングを含む、トレーニング用ユーザデータ及びトレーニング用アイテムデータを有するトレーニング用データセットを取得する（ステップ２０５）。トレーニング用データセットは、１つ以上のユーザデータソース及び１つ以上のアイテムデータソース（例えば、図４のデータソース４０５ａ〜４０５ｆを参照）を有することができる。本システムは、このトレーニング用データセットから、トレーニング用ユーザのユーザデータを有する１つ以上の入力ベクトルと、トレーニング用ユーザによる既知のレイティングを有するアイテムのアイテムデータを有する１つ以上の入力ベクトル（例えば、図４の入力ベクトル４１０ａ〜４１０ｆを参照）とを取得する（ステップ２１０ａ、２１０ｂ）。

１つの実施形態では、ユーザデータは、ユーザの、アイテムに関する過去のレイティングとユーザのプロファイル情報とを含み、アイテムデータは、他のユーザによる、アイテムの過去のレイティングとアイテムのプロファイルデータとを含む。ユーザのプロファイルデータは、ユーザの年齢と、ユーザの所在地と、ユーザの性別と、ユーザの職業と、ユーザの所得の範囲と、ユーザの民族性とのうちの１つ以上を含むことができる。ユーザデータは、ユーザが提供することができるか、本システムが機械学習により導き出すことができるか、あるいはその両方でもよい。アイテムのプロファイルデータは、アイテムの説明と、アイテムの価格と、アイテムのカテゴリと、アイテムの画像とのうちの１つ以上を含むことができる。図４に示すように、各データソースは、別々の入力ベクトルに対応するものとすることができる。

入力ソースの数は一般に、レイティングの予測の精度と、予測に関連した計算時間及び計算コストとに比例する。言い換えると、入力及びユーザデータソースが多いほど、レイティングの予測はより正確になる可能性が高い。他方、入力ソースが多いほど、予測の実行に関連する計算時間及びコストはより増加する。

ユーザのデータ及びアイテムのデータをベクトルとしてどのように表すことができるのかの例を以下に示す。

ユーザの性別
ユーザのプロファイル情報の１つのタイプを、性別とすることができる。この例では、ユーザ＃０は女性であり、ユーザ＃０の性別に対応する入力ベクトルは以下のとおりである。

商品のカテゴリ
アイテムのプロファイルデータの１つのタイプは、アイテムのカテゴリとすることができる。この例では、全部でｎ個のカテゴリがあり（ただし、ｎはこの例では３よりも大きい整数である）、アイテム＃０はカテゴリ＿２に属する。アイテム＃０のカテゴリのプロファイル情報に対応する入力ベクトルは、以下のとおりである。

ユーザの過去のレイティング
この例は、ユーザの過去のレイティングをベクトルとしてどのように表すことができるのかを示す。簡単にするために、この例では、５つのアイテムとしてアイテム＿１からアイテム＿５があるものとする。第ｉ番目のユーザの過去のレイティングは、以下のとおりである。

アイテム＿２及びアイテム＿４に関するユーザｉのレイティングは、未知であることに留意されたい。ユーザｉの過去のレイティングに対応する入力ベクトルは、以下のように５次元のベクトルである。

このベクトルは、５つのアイテムがあることから５次元である。このベクトルの第１のインデックスはアイテム＿１のレイティングを含み、第２のインデックスはアイテム＿２のレイティングを含み、以下、他のインデックスについても同様である。未知のレイティングを有するアイテムについては、当該インデックスに０が挿入される。

１．２入力の低次元空間への対応付け
本システムは、第１のニューラルネットワークのエンコーダの組を用いて、各入力ベクトルを低次元（入力ベクトル空間に比べて低い次元）のベクトル空間へと対応付けて、アイテムデータの１つ以上の低次元ベクトル及びユーザデータの１つ以上の低次元ベクトルを得る（例えば、図４におけるニューラルネットワークのエンコーダ４２０ａ〜４２０ｆ、低次元ユーザベクトル４３０ａ〜４３０ｃ、及び低次元アイテムベクトル４３０ｄ〜４３０ｆを参照）（ステップ２２０）。入力ベクトルごとに別々のニューラルネットワークエンコーダがある。

ニューラルネットワークエンコーダ４２０は、多次元入力ベクトルを受け付けることができるとともにベクトルの低次元表現を生成することのできる任意のニューラルネットワークとすることができる。例えば、ニューラルネットワークエンコーダは、多層パーセプトロン、長・短期ネットワーク（ＬＳＴＭ）、又は畳込みネットワークとすることができる。

１つ以上の低次元ユーザベクトル及び１つ以上の低次元アイテムベクトルが組み合わされて、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現が作成される（ステップ２３０）。これを、図４の中間出力ベクトル４４０として示す。１つの実施形態では、中間出力ベクトルは、全ての低次元ユーザベクトル及び低次元アイテムベクトルを互いに連結することによって作られる。低次元ユーザベクトル及び低次元アイテムベクトルは、トレーニングフェーズ及び予測フェーズの双方において順序が同じであれば、任意の順序で連結することができる。他の実施形態では、低次元ユーザベクトル及び低次元アイテムベクトルは、連結とエントリごとの積との組み合わせ等の、より複雑な方法で組み合わされる。これにより、計算時間及び計算リソースが増加する場合があるものの、予測の精度を高めることができる。

１．３ユーザのレイティングの予測
続いて、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現は、別のニューラルネットワーク（例えば、図４における予測用ニューラルネットワーク４５０を参照）に入力される（ステップ２４０）。このニューラルネットワークは、ユーザデータ及びアイテムデータの多次元ベクトル表現を、アイテムについて予測されるユーザのレイティングへと対応付けるものである。本明細書では、このニューラルネットワークを「予測用ニューラルネットワーク」と呼ぶ。予測用ニューラルネットワークは、アイテムに関して予測されるユーザのレイティングを出力する。

予測用ニューラルネットワーク４５０は、多次元ベクトル入力を受け付けることができるとともにユーザのレイティングの予測となるスカラ値を出力することができる任意のニューラルネットワーク（例えば、多層パーセプトロン）とすることができる。

１．４ニューラルネットワークのパラメータの更新
本システムは、トレーニング用ユーザの、アイテムに関して予測されたレイティングと、トレーニング用ユーザの、同アイテムに関する既知のレイティングとの間の誤差値を計算する（ステップ２５０）。例えば、本システムは、以下のように、予測されたレイティングと実際のレイティングとの間の平均二乗誤差（mean square error）を計算することができる。

ただし、
ｍは、観測値（observation）の個数であり、
ｈ（ｘ）は、予測された応答であり、
ｙは、目標となる応答である。

誤差値の別の選択肢として、実際の応答と予測された応答との間の平均絶対誤差が挙げられる。

本システムは、トレーニング用データベース内のトレーニング用ユーザの全て又はその一部についてステップ２１０〜２５０を繰り返す（ステップ２６０）。本システムは、トレーニング用ユーザの集合あるいはその一部の誤差値が最小となるように符号化用ニューラルネットワーク及び予測用ニューラルネットワークのパラメータを更新する（ステップ２７０）。１つの実施形態では、ニューラルネットワークをトレーニングするために用いられる最適化関数は、以下のとおりである。

ただし、
θは、符号化用ニューラルネットワーク及び予測用ニューラルネットワークの全てのパラメータを含み、
Ｒ_ｊｋは、ユーザｊの、アイテムｋに関するレイティングであり、
ｚ_ｊｋは、ユーザデータ及びアイテムデータの単一の多次元表現（すなわち、符号化用ニューラルネットワークの出力を連結したもの）であり、
ｈ（）は、予測用ニューラルネットワークであり、
λ_１はハイパーパラメータである。

本システムは、複数回にわたりステップ２１０〜２７０を繰り返す（ステップ２８０）。各反復につき、トレーニング用ユーザの同じ集合又は異なった部分集合を用いることができる。１つの実施形態では、これらのステップは、収束するまで繰り返される。別の実施形態では、これらのステップは、一定の反復回数（例えば、１０００回）にわたり繰り返される。

２．予測及び推奨
図３に、複数のアイテムに関してユーザのレイティングを予測し、これらのレイティングに基づいてアイテムをユーザに推奨する方法を示す。本方法は、前述のとおり、トレーニングがなされた符号化用ニューラルネットワーク及び予測用ニューラルネットワークを用いる。ステップ３１０〜３４０は、テスト対象ユーザ（すなわち、トレーニング用ユーザではないユーザ）と、このテスト対象ユーザによって評価されていないアイテムとに対して行われることを除いて、図２Ａにおけるステップ２１０〜２４０と同じである。具体的には、テスト対象ユーザのデータを有する１つ以上の入力ベクトルとアイテムデータを有する１つ以上のベクトルとが、符号化用ネットワーク内に入力され、テスト対象ユーザのデータに関する１つ以上の低次元ベクトルとアイテムデータに関する１つ以上の低次元ベクトルとが得られる（ステップ３１０及び３２０）。このフェーズでは、トレーニングフェーズと同じタイプのユーザデータ及びアイテムデータが用いられる。テスト対象ユーザ及びアイテムの低次元のベクトルを用いて、テスト対象ユーザのデータ及びアイテムデータの、単一の多次元ベクトル表現が作成される（ステップ３３０）。この単一の多次元ベクトルが予測用ニューラルネットワークに入力される。予測用ニューラルネットワークは、予測された、テスト対象ユーザによるアイテムのレイティングを出力する（ステップ３４０及び３５０）。

続いて、本システムは、テスト対象ユーザと、同テスト対象ユーザによって評価されていない複数のアイテムの各々とについて、上記ステップ（すなわち、ステップ３１０〜３５０）を繰り返す（ステップ３６０）。本システムは、予測されたレイティングを用いて、１つ以上のアイテムをテスト対象ユーザに推奨する（ステップ３７０）。例えば、本システムは、テスト対象ユーザについて予測された上位ｎ（例えば、ｎ＝５）個のレイティングを有するアイテムを推奨することができる。

３．利点
図１のニューラルネットワーク構造を用いる推奨システムとは異なり、図２〜図４を参照しながら開示された方法は、ニューラルネットワーク構造にデコーダを必要としない。そのため、開示された方法を用いれば、ネットワークパラメータの数が少なくなることから、収束がより速くなる。また、本明細書に開示された方法は、従来の方法における、ユーザの表現及びアイテムの表現を有する大きな行列（例えば、図１における行列Ｕ及びＶ）の計算及び最適化を必要としない。これは、全ての変数のエンドツーエンドのトレーニングをもたらし、このトレーニングは、従来の処理における交互の最適化手法よりも高速かつ容易である。これにより、ニューラルネットワークをトレーニングするための目的関数に含まれるハイパーパラメータの数をより少なくする（すなわち、従来技術の３つとは異なり、１つとする）こともできる。

４．推奨システムの例
図５に、一例として、推奨システムのソフトウェアアーキテクチャを示す。推奨システム５００は、複数のデータソース５１０、５２０からユーザデータ及びアイテムデータを受け付ける。予測モジュール５３０は、アイテムに関するユーザのレイティングを予測する。予測モジュールは、符号化用ニューラルネットワーク５５０と、ユーザデータ及びアイテムデータの単一の多次元ベクトル表現を作成する単一ベクトル作成ユニット５６０と、予測用ニューラルネットワーク５７０とを有する。トレーニングモジュール５８０は、図２Ａ及び図２Ｂの方法に従って予測モジュール５３０のトレーニングを行う。予測モジュール５３０は、図３の方法に基づいて予測を行う。推奨モジュール５４０は、予測されたユーザのレイティングを受け付け、その予測に基づいてユーザにアイテムを推奨する。例えば、推奨モジュールは、適用可能な任意のビジネスルールにおけるファクタリングの後に、予測された上位ｎ個のレイティングに関連する商品を選択することができる。当業者であれば、推奨システムが、本明細書における開示とは関係しない他のモジュールを有することができることを理解するであろう。

１つの実施形態では、符号化用ニューラルネットワーク及び予測用ネットワークの各々は、非線形な活性化関数を有する多層ネットワークである（すなわち、非線形関数がネットワークの各ニューロンの出力に適用され、これによって、ニューラルネットワークは入力の、複雑で非線形な関数となる）。別の実施形態では、符号化用ニューラルネットワーク及び予測用ニューラルネットワークの各々は、線形（恒等）活性化関数を有する単一の層を含む（すなわち、各ニューラルネットワークの出力は、入力を線形変換したものである）。線形な活性化関数を用いることにより、非線形な活性化関数を有するネットワークに比べて、精度は低くなるものの、予測に関連した計算時間及び計算コストが削減される。

５．一般的事項
図１〜図５に関して説明した方法は、ソフトウェアで具現化され、ソフトウェアを実行する（１つ以上の計算デバイスを備える）コンピュータシステムによって実行される。当業者であれば、コンピュータシステムが、ソフトウェア命令を記憶する１つ以上の物理メモリユニット、ディスク、又は他の物理的なコンピュータ可読記憶媒体と、これらのソフトウェア命令を実行する１つ以上のプロセッサとを有することを理解するであろう。当業者であれば、コンピュータシステムはスタンドアローンとすることもできるし、サーバとしてコンピュータネットワークに接続することもできることを理解するであろう。

本発明の趣旨又は不可欠な特徴から逸脱することなく、本発明が他の具体的な形態で具現化できることは当業者に理解されよう。したがって、上記の開示は、特許請求の範囲により定められる本発明の範囲の例示を目的としたものであり、限定するものではない。

Claims

ニューラルネットワークを用いて１つ以上のアイテムをユーザに自動的に推奨するための、コンピュータシステムによって実行される方法であって、
トレーニングフェーズに関して、
（ａ）アイテムに関する既知のレイティングを有するトレーニング用データセットにおけるトレーニング用ユーザについて、前記トレーニング用ユーザのユーザデータを有する１つ以上の入力ベクトルと、前記アイテムのアイテムデータを有する１つ以上の入力ベクトルとを受け付けるステップと、
（ｂ）符号化用ニューラルネットワークの組を用いて入力ベクトルの各々を低次元ベクトル空間に対応付けて、前記ユーザデータの１つ以上の低次元ベクトルと、前記アイテムデータの１つ以上の低次元ベクトルとを得るステップであって、入力ベクトルごとに異なる前記符号化用ニューラルネットワークが用いられ、前記ユーザの低次元ベクトル及び前記アイテムの低次元ベクトルは、対応する前記入力ベクトルに比べて次元が低い、ステップと、
（ｃ）１つ以上の前記ユーザの低次元ベクトルと１つ以上の前記アイテムの低次元ベクトルとに基づいて、前記ユーザデータ及び前記アイテムデータの単一の多次元ベクトル表現を作成するステップと、
（ｄ）予測用ニューラルネットワークを用いて、前記トレーニング用のユーザデータ及びアイテムデータの前記単一の多次元ベクトル表現から、前記トレーニング用ユーザによる、前記アイテムについての予測されるレイティングを計算するステップと、
（ｅ）前記トレーニング用ユーザの、前記アイテムについて予測されたレイティングと、前記トレーニング用ユーザの、前記アイテムについての既知のレイティングとの間の誤差値を計算するステップと、
（ｆ）前記トレーニング用データセットにおける複数のトレーニング用ユーザについて前記ステップ（ａ）〜（ｅ）を行うステップと、
（ｇ）前記複数のトレーニング用ユーザの誤差値が最小となるように、前記符号化用ニューラルネットワーク及び前記予測用ニューラルネットワークのパラメータを更新するステップと、
（ｈ）前記ステップ（ａ）〜（ｇ）を複数回にわたり繰り返して、前記符号化用ニューラルネットワーク及び前記予測用ニューラルネットワークをトレーニングするステップと
を行うステップと、
予測及び推奨フェーズに関して、
（ｉ）テスト対象ユーザのユーザデータを有する１つ以上の入力ベクトルと、前記テスト対象ユーザによって評価されていないアイテムのアイテムデータを有する１つ以上の入力ベクトルとを受け付けるステップと、
（ｊ）前記符号化用ニューラルネットワークの組を用いて入力ベクトルの各々を低次元ベクトル空間に対応付けて、前記ユーザデータの１つ以上の低次元ベクトルと、前記アイテムデータの１つ以上の低次元ベクトルとを得るステップであって、入力ベクトルごとに異なる前記符号化用ニューラルネットワークが用いられ、前記ユーザの低次元ベクトル及び前記アイテムの低次元ベクトルは、対応する入力ベクトルに比べて次元が低い、ステップと、
（ｋ）１つ以上の前記ユーザの低次元ベクトル及び１つ以上の前記アイテムの低次元ベクトルに基づいて、前記ユーザデータ及び前記アイテムデータの単一の多次元ベクトル表現を作成するステップと、
（ｌ）前記予測用ニューラルネットワークを用いて、前記ユーザデータ及び前記アイテムデータの前記単一の多次元ベクトル表現から、前記テスト対象ユーザによる前記アイテムについての予測されるレイティングを計算するステップと、
（ｍ）前記テスト対象ユーザと、前記テスト対象ユーザによって評価されていない複数のアイテムとに関して、前記ステップ（ｉ）〜（ｌ）を繰り返すステップと、
（ｎ）前記テスト対象ユーザの、前記複数のアイテムについて予測されたレイティングを用いて、１つ以上のアイテムを前記テスト対象ユーザに推奨するステップと
を行うステップと
を含む方法。
前記ユーザデータは、ユーザの過去のレイティングと、ユーザのプロファイルデータとを含み、前記アイテムデータは、前記アイテムについて別のユーザから受け付けられた過去のレイティングと、アイテムのプロファイルデータとを含む、請求項１に記載の方法。
前記ユーザのプロファイルデータは、ユーザの年齢と、ユーザの所在地と、ユーザの性別と、ユーザの職業と、ユーザの所得の範囲とのうちの１つ以上を含む、請求項２に記載の方法。
前記アイテムのプロファイルデータは、アイテムの説明と、アイテムの価格と、アイテムのカテゴリと、アイテムの画像とのうちの１つ以上を含む、請求項２に記載の方法。
前記誤差値は、前記トレーニング用ユーザの予測されたレイティングと前記トレーニング用ユーザの既知のレイティングとの平均二乗誤差であり、
前記ステップ（ｇ）において、前記符号化用ニューラルネットワーク及び前記予測用ニューラルネットワークのパラメータは、前記複数のトレーニング用ユーザについての前記平均二乗誤差が最小となるように調整される、請求項１に記載の方法。
前記予測用ニューラルネットワークが多層パーセプトロンであり、
前記符号化用ニューラルネットワークの組が、多層パーセプトロンと、長・短期記憶ネットワークと、畳込みニューラルネットワークとのうちの１つ以上を含む、請求項１に記載の方法。
前記トレーニングフェーズ及び前記予測フェーズの双方において、前記ユーザデータ及び前記アイテムデータの前記単一の多次元ベクトル表現は、１つ以上の前記ユーザの低次元ベクトルと１つ以上の前記アイテムの低次元ベクトルとを連結することにより得られる、請求項１に記載の方法。
前記ステップ（ａ）〜（ｇ）の各反復につき、前記トレーニング用データセットにおける前記トレーニング用ユーザの異なる部分集合が用いられる、請求項１に記載の方法。
コンピュータシステムにより実行されると、ニューラルネットワークを用いて１つ以上のアイテムをユーザに自動的に推奨する方法を前記コンピュータシステムに実行させるコンピュータプログラムを有する非一時的なコンピュータ可読媒体であって、
前記方法は、
トレーニングフェーズに関して、
（ａ）アイテムに関する既知のレイティングを有するトレーニング用データセットにおけるトレーニング用ユーザについて、前記トレーニング用ユーザのユーザデータを有する１つ以上の入力ベクトルと、前記アイテムのアイテムデータを有する１つ以上の入力ベクトルとを受け付けるステップと、
（ｂ）符号化用ニューラルネットワークの組を用いて入力ベクトルの各々を低次元ベクトル空間に対応付けて、前記ユーザデータの１つ以上の低次元ベクトルと、前記アイテムデータの１つ以上の低次元ベクトルとを得るステップであって、入力ベクトルごとに異なる前記符号化用ニューラルネットワークが用いられ、前記ユーザの低次元ベクトル及び前記アイテムの低次元ベクトルは、対応する前記入力ベクトルに比べて次元が低い、ステップと、
（ｃ）１つ以上の前記ユーザの低次元ベクトルと１つ以上の前記アイテムの低次元ベクトルとに基づいて、前記ユーザデータ及び前記アイテムデータの単一の多次元ベクトル表現を作成するステップと、
（ｄ）予測用ニューラルネットワークを用いて、前記トレーニング用のユーザデータ及びアイテムデータの前記単一の多次元ベクトル表現から、前記トレーニング用ユーザによる、前記アイテムについての予測されるレイティングを計算するステップと、
（ｅ）前記トレーニング用ユーザの、前記アイテムについて予測されたレイティングと、前記トレーニング用ユーザの、前記アイテムについての既知のレイティングとの間の誤差値を計算するステップと、
（ｆ）前記トレーニング用データセットにおける複数のトレーニング用ユーザについて前記ステップ（ａ）〜（ｅ）を行うステップと、
（ｇ）前記複数のトレーニング用ユーザの誤差値が最小となるように、前記符号化用ニューラルネットワーク及び前記予測用ニューラルネットワークのパラメータを更新するステップと、
（ｈ）前記ステップ（ａ）〜（ｇ）を複数回にわたり繰り返して、前記符号化用ニューラルネットワーク及び前記予測用ニューラルネットワークをトレーニングするステップと
を行うステップと、
予測及び推奨フェーズに関して、
（ｉ）テスト対象ユーザのユーザデータを有する１つ以上の入力ベクトルと、前記テスト対象ユーザによって評価されていないアイテムのアイテムデータを有する１つ以上の入力ベクトルとを受け付けるステップと、
（ｊ）前記符号化用ニューラルネットワークの組を用いて入力ベクトルの各々を低次元ベクトル空間に対応付けて、前記ユーザデータの１つ以上の低次元ベクトルと、前記アイテムデータの１つ以上の低次元ベクトルとを得るステップであって、入力ベクトルごとに異なる前記符号化用ニューラルネットワークが用いられ、前記ユーザの低次元ベクトル及び前記アイテムの低次元ベクトルは、対応する入力ベクトルに比べて次元が低い、ステップと、
（ｋ）１つ以上の前記ユーザの低次元ベクトル及び１つ以上の前記アイテムの低次元ベクトルに基づいて、前記ユーザデータ及び前記アイテムデータの単一の多次元ベクトル表現を作成するステップと、
（ｌ）前記予測用ニューラルネットワークを用いて、前記ユーザデータ及び前記アイテムデータの前記単一の多次元ベクトル表現から、前記テスト対象ユーザによる前記アイテムについての予測されるレイティングを計算するステップと、
（ｍ）前記テスト対象ユーザと、前記テスト対象ユーザによって評価されていない複数のアイテムとに関して、前記ステップ（ｉ）〜（ｌ）を繰り返すステップと、
（ｎ）前記テスト対象ユーザの、前記複数のアイテムについて予測されたレイティングを用いて、１つ以上のアイテムを前記テスト対象ユーザに推奨するステップと
を行うステップと
を含む、非一時的なコンピュータ可読媒体。
前記ユーザデータは、ユーザの過去のレイティングと、ユーザのプロファイルデータとを含み、前記アイテムデータは、前記アイテムについて別のユーザから受け付けられた過去のレイティングと、アイテムのプロファイルデータとを含む、請求項９に記載の非一時的なコンピュータ可読媒体。
前記ユーザのプロファイルデータは、ユーザの年齢と、ユーザの所在地と、ユーザの性別と、ユーザの職業と、ユーザの所得の範囲とのうちの１つ以上を含む、請求項１０に記載の非一時的なコンピュータ可読媒体。
前記アイテムのプロファイルデータは、アイテムの説明と、アイテムの価格と、アイテムのカテゴリと、アイテムの画像とのうちの１つ以上を含む、請求項１０に記載の非一時的なコンピュータ可読媒体。
前記誤差値は、前記トレーニング用ユーザの予測されたレイティングと前記トレーニング用ユーザの既知のレイティングとの平均二乗誤差であり、
前記ステップ（ｇ）において、前記符号化用ニューラルネットワーク及び前記予測用ニューラルネットワークのパラメータは、前記複数のトレーニング用ユーザについての前記平均二乗誤差が最小となるように調整される、請求項９に記載の非一時的なコンピュータ可読媒体。
前記予測用ニューラルネットワークが多層パーセプトロンであり、
前記符号化用ニューラルネットワークの組が、多層パーセプトロンと、長・短期記憶ネットワークと、畳込みニューラルネットワークとのうちの１つ以上を含む、請求項９に記載の非一時的なコンピュータ可読媒体。
前記トレーニングフェーズ及び前記予測フェーズの双方において、前記ユーザデータ及び前記アイテムデータの前記単一の多次元ベクトル表現は、１つ以上の前記ユーザの低次元ベクトルと１つ以上の前記アイテムの低次元ベクトルとを連結することにより得られる、請求項９に記載の非一時的なコンピュータ可読媒体。
前記ステップ（ａ）〜（ｇ）の各反復につき、前記トレーニング用データセットにおける前記トレーニング用ユーザの異なる部分集合が用いられる、請求項９に記載の非一時的なコンピュータ可読媒体。
コンピュータシステムにより実行されると、アイテムに関するユーザのレイティングを予測するニューラルネットワークシステムをトレーニングする方法を前記コンピュータシステムに実行させるコンピュータプログラムを有する非一時的なコンピュータ可読媒体であって、
前記方法は、
（ａ）アイテムに関する既知のレイティングを有するトレーニング用データセットにおけるトレーニング用ユーザについて、前記トレーニング用ユーザのユーザデータを有する１つ以上の入力ベクトルと、前記アイテムのアイテムデータを有する１つ以上の入力ベクトルとを受け付けるステップと、
（ｂ）符号化用ニューラルネットワークの組を用いて入力ベクトルの各々を低次元ベクトル空間に対応付けて、前記ユーザデータの１つ以上の低次元ベクトルと、前記アイテムデータの１つ以上の低次元ベクトルとを得るステップであって、入力ベクトルごとに異なる前記符号化用ニューラルネットワークが用いられ、前記ユーザの低次元ベクトル及び前記アイテムの低次元ベクトルは、対応する前記入力ベクトルに比べて次元が低い、ステップと、
（ｃ）１つ以上の前記ユーザの低次元ベクトルと１つ以上の前記アイテムの低次元ベクトルとに基づいて、前記ユーザデータ及び前記アイテムデータの単一の多次元ベクトル表現を作成するステップと、
（ｄ）予測用ニューラルネットワークを用いて、前記トレーニング用のユーザデータ及びアイテムデータの前記単一の多次元ベクトル表現から、前記トレーニング用ユーザによる、前記アイテムについての予測されるレイティングを計算するステップと、
（ｅ）前記トレーニング用ユーザの、前記アイテムについて予測されたレイティングと、前記トレーニング用ユーザの、前記アイテムについての既知のレイティングとの間の誤差値を計算するステップと、
（ｆ）前記トレーニング用データセットにおける複数のトレーニング用ユーザについて前記ステップ（ａ）〜（ｅ）を行うステップと、
（ｇ）前記複数のトレーニング用ユーザの誤差値が最小となるように、前記符号化用ニューラルネットワーク及び前記予測用ニューラルネットワークのパラメータを更新するステップと、
（ｈ）前記ステップ（ａ）〜（ｇ）を複数回にわたり繰り返して、前記符号化用ニューラルネットワーク及び前記予測用ニューラルネットワークをトレーニングするステップと
を含む、非一時的なコンピュータ可読媒体。
前記ユーザデータは、ユーザの過去のレイティングと、ユーザのプロファイルデータとを含み、前記アイテムデータは、前記アイテムについて別のユーザから受け付けられた過去のレイティングと、アイテムのプロファイルデータとを含む、請求項１７に記載の非一時的なコンピュータ可読媒体。
コンピュータシステムにより実行されると、ニューラルネットワークを用いて１つ以上のアイテムをユーザに自動的に推奨する方法を前記コンピュータシステムに実行させるコンピュータプログラムを有する非一時的なコンピュータ可読媒体であって、
前記方法は、
（ａ）ユーザのユーザデータを有する１つ以上の入力ベクトルと、前記ユーザによって評価されていないアイテムのアイテムデータを有する１つ以上の入力ベクトルとを受け付けるステップと、
（ｂ）符号化用ニューラルネットワークの組を用いて入力ベクトルの各々を低次元ベクトル空間に対応付けて、前記ユーザデータの１つ以上の低次元ベクトルと、前記アイテムデータの１つ以上の低次元ベクトルとを得るステップであって、入力ベクトルごとに異なる前記符号化用ニューラルネットワークが用いられ、前記ユーザの低次元ベクトル及び前記アイテムの低次元ベクトルは、対応する入力ベクトルに比べて次元が低い、ステップと、
（ｃ）１つ以上の前記ユーザの低次元ベクトル及び１つ以上の前記アイテムの低次元ベクトルに基づいて、前記ユーザデータ及び前記アイテムデータの単一の多次元ベクトル表現を作成するステップと、
（ｄ）予測用ニューラルネットワークを用いて、前記ユーザデータ及び前記アイテムデータの前記単一の多次元ベクトル表現から、前記ユーザによる前記アイテムについての予測されるレイティングを計算するステップであって、前記符号化用ニューラルネットワークの組及び前記予測用ニューラルネットワークは、前記ステップ（ｂ）〜（ｄ）を実行できるように既にトレーニングされている、ステップと、
（ｅ）前記ユーザと、前記ユーザによって評価されていない複数のアイテムとに関して、前記ステップ（ａ）〜（ｄ）を繰り返すステップと、
（ｆ）前記ユーザの、前記複数のアイテムについて予測されたレイティングを用いて、１つ以上のアイテムを前記ユーザに推奨するステップと
を行うステップと
を含む、非一時的なコンピュータ可読媒体。
前記ユーザデータは、ユーザの過去のレイティングと、ユーザのプロファイルデータとを含み、前記アイテムデータは、前記アイテムについて別のユーザから受け付けられた過去のレイティングと、アイテムのプロファイルデータとを含む、請求項１９に記載の非一時的なコンピュータ可読媒体。