WO2023095456A1

WO2023095456A1 - レコメンド装置

Info

Publication number: WO2023095456A1
Application number: PCT/JP2022/037344
Authority: WO
Inventors: 邦宏相場; 素平小野; 航明石; 翔前沖
Original assignee: 株式会社Ｎｔｔドコモ
Priority date: 2021-11-29
Filing date: 2022-10-05
Publication date: 2023-06-01

Abstract

レコメンド装置１０は、ユーザ端末３０に表示されたコンテンツを閲覧するユーザの視線の軌跡を画像化した視線画像を取得する取得部１２と、視線画像の特徴量を示す特徴ベクトルを抽出する抽出部１３と、特徴ベクトルに基づいて、コンテンツとユーザの視線の軌跡との対応関係をユーザコンテキストとして生成する生成部１４と、ユーザコンテキストを用いて、レコメンド候補の複数のコンテンツそれぞれのスコアを算出する算出部１５と、スコアに基づいて選択したコンテンツのレコメンド結果を出力する出力部１６と、を備える。

Description

レコメンド装置

　本開示の一側面は、ユーザにコンテンツを推薦するレコメンド装置に関する。

　オンラインショッピング等において、ユーザに応じた商品等をユーザに推薦するレコメンドシステムが知られている。このようなレコメンドシステムは、例えば、商品の選択に係るユーザのクリック又はページ遷移のログ等を用いてユーザの興味に関する情報を抽出する。そして、レコメンドシステムは、ユーザの興味に関する情報を用いて商品をソートし、ソートされた商品をユーザに推薦する。

　特許文献１には、ユーザに対して顔を含む画像を提示し、ユーザの視線の動きに関する視線情報に基づいて画像におけるユーザの視線の偏りを計算し、視線の偏りに基づいて決定したレコメンド情報をユーザに提示するレコメンド装置が開示されている。

特開２０１９－１９２０７２号公報

　商品の選択に係るユーザのクリック又はページ遷移のログ等は、誤操作等の影響があり得る。そのため、これらの情報に基づいてユーザの嗜好を十分に反映させたコンテンツをレコメンドできない場合がある。また、特許文献１に記載されたような単に視線の動きを用いてレコメンドするアルゴリズムにおいては、例えばオンラインショッピング等のように商品ごとに異なる視線の動きが生じる場合に、ユーザが何を注視していたのかを判別することが難しく、これによって、ユーザの嗜好を適切に判別できず、ユーザの嗜好を十分に反映させたコンテンツをレコメンドできない場合がある。

　そこで、本開示の一側面は、ユーザの嗜好に合ったコンテンツをレコメンドすることが可能なレコメンド装置を提供することを目的とする。

　本開示の一側面に係るレコメンド装置は、ユーザ端末に表示されたコンテンツを閲覧するユーザの視線の軌跡を画像化した視線画像を取得する取得部と、視線画像の特徴量を示す特徴ベクトルを抽出する抽出部と、特徴ベクトルに基づいて、コンテンツとユーザの視線の軌跡との対応関係をユーザコンテキストとして生成する生成部と、ユーザコンテキストを用いて、レコメンド候補の複数のコンテンツそれぞれのスコアを算出する算出部と、スコアに基づいて選択したコンテンツのレコメンド結果を出力する出力部と、を備える。

　本開示の一側面に係るレコメンド装置においては、視線画像が特徴量化されることによって、コンテンツを閲覧するユーザの視線の軌跡の特徴量を示す特徴ベクトルが抽出される。そして、特徴ベクトルに基づいてコンテンツとユーザの視線の軌跡との対応関係がユーザコンテキストとして生成される。さらに、このようなユーザコンテキストを基に各コンテンツのスコアが算出され、レコメンド結果が出力される。ユーザが何を注視していたのか（例えばコンテンツの情報である価格又は商品詳細等の何の情報を注視していたのか）を判別するのではなく、視線の軌跡が画像化されて各コンテンツのスコアが算出されることにより、ユーザの嗜好を行動ベースで抽象的に捉えることが可能になる。このような嗜好の捉え方によれば、ユーザが何を注視していたのかを判別することによるコンテンツの情報（例えば価格及び商品詳細等）に関するユーザの嗜好を判別する必要がない。そして、視線画像を基にしたスコアにより、ユーザの視線の軌跡に応じたコンテンツを選択できる。その結果、ユーザの嗜好に合ったコンテンツをレコメンドすることができる。

　本開示の一側面によれば、ユーザごとの嗜好を適切に捉え、ユーザの嗜好に合ったコンテンツをレコメンドすることが可能なレコメンド装置を提供することができる。

実施形態に係るレコメンド装置の機能構成を示す図である。商品を閲覧するための商品詳細画面の一例を示す図である。視線の軌跡の一例を説明する図である。特徴量化した視線画像の一例を説明する図である。視線ベクトルの抽出について説明する図である。ユーザコンテキストの生成について説明する図である。視線ベクトルを基にしたレコメンドの概略について説明する図である。レコメンド装置が実行する処理を示すフローチャートである。レコメンド装置のハードウェア構成を示す図である。

　以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。図面の説明において、同一又は同等の要素には同一符号を用い、重複する説明を省略する。

　図１は、本実施形態に係るレコメンド装置１０の機能構成を示す図である。レコメンド装置１０は、各ユーザの嗜好に沿ったコンテンツをユーザに推薦する（すなわち、ユーザのユーザ端末３０に配信する）装置である。コンテンツとは、例えば、有償または無償で取引される任意の有体物又は無体物のことをいい、商品及びサービスの提供を含む概念である。レコメンド装置１０は、ユーザ端末３０に表示されたコンテンツを閲覧するユーザの視線の軌跡を画像化した視線画像に基づいて、ユーザの嗜好を学習する。レコメンド装置１０は、ユーザの嗜好に沿ったコンテンツが配信対象となるように、ユーザに推薦するコンテンツを選択する。

　図１に示されるように、レコメンドシステム１は、レコメンド装置１０と、ユーザ端末３０とを含んで構成されている。ユーザ端末３０は、通信機能を有した通信端末であり、例えばスマートフォン、タブレット型端末、パーソナルコンピュータ等である。ユーザ端末３０は、ネットワークを介してレコメンド装置１０と通信可能に接続されている。ユーザ端末３０は、各種画面を表示する機能と、ユーザの視線の軌跡を検知する機能と、各種情報をレコメンド装置１０に送信する機能と、レコメンド装置１０からレコメンド対象のコンテンツの配信を受ける機能と、該コンテンツを表示する機能と、を少なくとも有している。図１においてはユーザ端末３０が１台のみ図示されているが、実際には各ユーザ分、複数台のユーザ端末３０がレコメンドシステム１に含まれている。

　例えば、ユーザ端末３０は、コンテンツである商品を閲覧するための商品詳細画面を表示する。また、ユーザ端末３０は、ユーザ端末３０に表示されたコンテンツを閲覧するユーザの視線の軌跡を検知する。視線の軌跡の検知方法は限定されない。一例として、ユーザ端末３０は、角膜反射法（ＰＣＣＲ）を用いてユーザの視点の軌跡を検知してもよい。角膜反射法を採用する場合、ユーザ端末３０はハードウェア構成として赤外線出射装置および赤外線カメラを備えてもよい。

　ユーザ端末３０は、検知したユーザの視線の軌跡を示す情報をレコメンド装置１０に送信する。また、ユーザ端末３０は、ユーザ端末３０に表示されたコンテンツに関するユーザの購入実績を示す情報をレコメンド装置１０に送信してもよい。さらに、ユーザ端末３０は、ユーザのデモグラフィックデータをレコメンド装置１０に送信してもよい。デモグラフィックデータとしては、例えば年齢、性別、居住地、家族構成、職業等が挙げられるがこれらに限られない。デモグラフィックデータは、例えば数値又は割り当てられた符号（性別コード、居住地コード、家族構成コード、職業コード等）として表され得る。さらに、ユーザ端末３０は、ユーザのコンテンツメタデータをレコメンド装置１０に送信してもよい。コンテンツメタデータとは、ユーザが最後（直前）に閲覧したコンテンツのメタ情報である。コンテンツメタデータとしては、例えば格帯、ジャンル、キャンペーン有無等が挙げられるがこれらに限られない。コンテンツメタデータは、例えば数値又は割り当てられた符号（価格帯コード、ジャンルコード、キャンペーンコード等）として表され得る。

　図２は、商品を閲覧するための商品詳細画面Ｇの一例を示す図である。商品詳細画面Ｇは、例えばオンラインショッピングのＷｅｂページである。商品詳細画面Ｇは、例えばレコメンド装置１０によってユーザ端末３０に提供されてもよいし、他の外部システムによってユーザ端末３０に提供されてもよい。商品詳細画面Ｇには、コンテンツに関する各種情報が表示されている。一例では、商品詳細画面Ｇには、ハンバーガーに関する商品画像Ｃ１、商品価格Ｃ２、詳細文Ｃ３、及び付帯情報Ｃ４が表示されている。

　ユーザ端末３０は、例えば商品詳細画面Ｇに対するアクセスごとにユーザの視線の軌跡を検知する。また、ユーザ端末３０は、コンテンツの閲覧時間を計測してもよい。コンテンツの閲覧時間は、例えば商品詳細画面Ｇの表示時間であってもよい。

　図３は、視線の軌跡Ｖの一例を説明する図である。視線の軌跡Ｖは、商品詳細画面Ｇに表示されたコンテンツに対するユーザの視線の軌跡である。一例では、視線の軌跡Ｖは、商品詳細画面Ｇの初回アクセス時に検知されたコンテンツに対するユーザの視線の軌跡である。図３において、視線の軌跡Ｖは、黒色の実線により表されている。例えば、視線の軌跡Ｖは、商品画像Ｃ１、商品価格Ｃ２、詳細文Ｃ３、付帯情報Ｃ４、詳細文Ｃ３の順に視線が移動したことを示す。

　ユーザ端末３０は、検知した視線の軌跡Ｖを示す情報をレコメンド装置１０に送信する。視線の軌跡Ｖを示す情報は、コンテンツの閲覧時間を有する。レコメンド装置１０は、視線の軌跡Ｖを示す情報を受信する。

　図１に戻り、レコメンド装置１０は、記憶部２と、視線画像生成部１１と、取得部１２と、抽出部１３と、生成部１４と、算出部１５と、出力部１６と、を備えている。

　記憶部２は、各ユーザのデモグラフィックデータ２１及びコンテンツメタデータ２２を記憶する。例えば、レコメンド装置１０は、各ユーザのユーザ端末３０から受信した各ユーザのデモグラフィックデータ及びコンテンツメタデータを記憶部２に記憶する。レコメンド装置１０は、ユーザ端末３０から受信した視線の軌跡を示す情報、及びユーザ端末３０に表示されたコンテンツに関するユーザの購入実績を示す情報を記憶部２に記憶してもよい。

　視線画像生成部１１は、ユーザの視線の軌跡を画像化した視線画像を生成する。例えば、視線画像生成部１１は、例えばユーザ端末３０から受信した視線の軌跡Ｖを示す情報に基づいて、視線の軌跡Ｖを画像化した視線画像を生成する。視線画像生成部１１は、生成した視線画像を取得部１２に出力する。

　取得部１２は、ユーザ端末３０に表示されたコンテンツを閲覧するユーザの視線の軌跡を画像化した視線画像を取得する。例えば、取得部１２は、視線画像生成部１１によって視線の軌跡Ｖが画像化された視線画像を取得する。

　取得部１２は、コンテンツを閲覧した閲覧時間及びユーザのデモグラフィックデータを取得する。例えば、取得部１２は、例えばユーザ端末３０から受信した視線の軌跡Ｖを示す情報に基づいて、ユーザがコンテンツを閲覧した閲覧時間を取得する。また、取得部１２は、記憶部２に記憶されている各ユーザのデモグラフィックデータを取得する。

　抽出部１３は、視線画像の特徴量を示す特徴ベクトル（視線ベクトル）を抽出する。例えば、抽出部１３は、視線画像を特徴量化した数値データを生成する。そして、抽出部１３は、数値データに対し主成分分析を行うことにより、第１主成分を視線ベクトルとして抽出する。

　図４は、特徴量化した視線画像の一例を説明する図である。図４に示される視線画像ＶＰは、視線の軌跡Ｖを画像化した視線画像である。例えば、抽出部１３は、視線画像ＶＰの特徴量を抽出し、二次元又は三次元の数値データを生成する。一例として、抽出部１３は、視線画像ＶＰを６×６の領域に分割し、分割した各領域における特徴量を取得する。そして、抽出部１３は、各領域における特徴量にそれぞれ対応する６行×６列の要素を有する二次元配列の数値データＶＡを生成する。

　数値データＶＡの各要素の数値は、ユーザがコンテンツのどの部分をどのぐらい見たかを示している。例えば、数値データＶＡの要素の数値が高いほど、視線画像ＶＰにおける視線の軌跡Ｖの密度が高い。また、数値データＶＡの要素の数値が低いほど、視線画像ＶＰにおける視線の軌跡Ｖの密度が低い。ここで、数値データＶＡの各要素の数値は、コンテンツに関する情報がどの位置にあるかについて考慮（判別）していない。より詳細には、数値データＶＡの各要素の数値は、商品詳細画面Ｇ１上の商品画像Ｃ１、商品価格Ｃ２、詳細文Ｃ３、及び付帯情報Ｃ４等の位置を考慮（判別）していない。

　図５は、視線ベクトルの抽出について説明する図である。例えば、抽出部１３は、数値データＶＡに対し主成分分析を行うことにより、第１主成分を視線ベクトルとして抽出する。一例では、抽出部１３は、取得した第１主成分を視線ベクトルＶ_ｔ，ａとして抽出する。ここで、ｔは試行回（訪問回）、ａはコンテンツである。このように抽出される視線ベクトルは、ユーザの視線の軌跡ごと、訪問回ごと、又はコンテンツごとに異なり得る。すなわち、視線ベクトルＶ_ｔ，ａは、「あるユーザの、あるコンテンツに対する、ある訪問回の」視線ベクトルと言える。

　図１に戻り、生成部１４は、特徴ベクトルである視線ベクトルに基づいて、コンテンツとユーザの視線の軌跡との対応関係をユーザコンテキストとして生成する。例えば、生成部１４は、特徴ベクトル、閲覧時間及びデモグラフィックデータに基づいて、コンテンツとユーザの視線の軌跡との対応関係をユーザコンテキストとして生成する。

　図６は、ユーザコンテキストの生成について説明する図である。例えば、取得部１２は、コンテンツメタデータＣ_ｔ，ａ、デモグラフィックデータＵ_ｔ，ａ、及び閲覧時間Ｔ_ｔ，ａを更に取得する。ｔは試行回（訪問回）、ａはコンテンツである。そして、生成部１４は、視線ベクトルＶ_ｔ，ａ、コンテンツメタデータＣ_ｔ，ａ、デモグラフィックデータＵ_ｔ，ａ、及び閲覧時間Ｔ_ｔ，ａに基づいて、ユーザコンテキストｚ_ｔ，ａを生成する。一例では、視線ベクトルＶ_ｔ，ａは、要素として特徴量の第１主成分をそれぞれ示す［ｖ＿１，ｖ＿２，・・・，ｖ＿ｎ］を有する。コンテンツメタデータＣ_ｔ，ａは、要素として［１，４，１］を有する。コンテンツメタデータＣ_ｔ，ａにおける各要素は、それぞれ価格帯コード、ジャンルコード、キャンペーンコードを示す。デモグラフィックデータＵ_ｔ，ａは、要素として［２９，１，２０］を有する。デモグラフィックデータＵ_ｔ，ａにおける各要素は、それぞれ年齢、性別コード、居住地コードを示す。閲覧時間Ｔ_ｔ，ａは、要素として閲覧時間の秒数を示す［２０］を有する。

　例えば、生成部１４は、視線ベクトルＶ_ｔ，ａ、コンテンツメタデータＣ_ｔ，ａ、デモグラフィックデータＵ_ｔ，ａ、及び閲覧時間Ｔ_ｔ，ａを結合させることによって、ユーザコンテキストｚ_ｔ，ａを生成する。生成部１４は、視線ベクトルＶ_ｔ，ａのみに基づいてユーザコンテキストｚ_ｔ，ａを生成してもよい。生成部１４は、視線ベクトルＶ_ｔ，ａ、コンテンツメタデータＣ_ｔ，ａ、デモグラフィックデータＵ_ｔ，ａ、及び閲覧時間Ｔ_ｔ，ａの一つ又は複数に基づいてユーザコンテキストｚ_ｔ，ａを生成してもよい。

　図１に戻り、算出部１５は、ユーザコンテキストを用いて、レコメンド候補の複数のコンテンツそれぞれのスコアを算出する。例えば、算出部１５は、Contextual Banditアルゴリズムを適用した次式（１）によりコンテンツのスコアｐ_ｔ，ａを算出する。

　ここで、ｔは試行回（訪問回）、ａはコンテンツ（ContextualBanditアルゴリズムにおけるarmに対応する）である。（θ_a）＾は、ユーザコンテキストに対して、各コンテンツがどのようなスコアをつければよいか過去のユーザ行動のフィードバックを受けて学習し、値が更新される項（活用項）である。α√ｓ_ｔ，ａは、（θ_a）＾の更新と共に更新され、各コンテンツに対するスコアの不確かさ（探索すべき度合い）を表す項（探索項）である。（θ_a）＾の数、及びα√ｓ_ｔ，ａの数は、コンテンツの数に対応して存在する。Contextual Banditアルゴリズムは、正解データがない状態で探索を行うことによりスコアを算出し、スコアの算出過程でユーザコンテキストを学習する。算出部１５は、例えば「このコンテンツにはこのような視線の動きをするユーザ」としてユーザコンテキストを学習する。なお、ユーザコンテキストにコンテンツメタデータが含まれる場合、「直前にこのような特徴のコンテンツを閲覧して、このような視線の動きをしたユーザ」の好みを学習するモデルが作成される。

　Contextual Banditアルゴリズムには、正解データが用いられてもよい。例えば、取得部１２は、ユーザがユーザ端末に表示されたコンテンツを購入した実績を示す正解データを更に取得する。そして、算出部１５は、スコアの算出において正解データを用いてユーザコンテキストｚ_ｔ，ａを学習する。

　出力部１６は、スコアに基づいて選択したコンテンツのレコメンド結果を出力する。例えば、出力部１６は、複数のコンテンツのうちからスコアｐ_ｔ，ａの降順に１つ又は複数のコンテンツを選択し、選択したコンテンツのレコメンド結果をユーザ端末３０に送信する。

　図７は、視線ベクトルを基にしたレコメンドの概略について説明する図である。例えば、生成部１４は、視線ベクトルＶ_ｔ，ａ、コンテンツメタデータＣ_ｔ，ａ、デモグラフィックデータＵ_ｔ，ａ、及び閲覧時間Ｔ_ｔ，ａを結合させることによって、ユーザコンテキストｚ_ｔ，ａを生成する。算出部１５は、ユーザコンテキストを用いて、レコメンド候補の複数のコンテンツそれぞれのスコアを算出する。また、算出部１５は、学習モデルＥ（例えばContextual Banditアルゴリズム）を用いたスコアの算出においてユーザコンテキストｚ_ｔ，ａを学習する。出力部１６は、複数のコンテンツのうちからスコアの降順に１つ又は複数のコンテンツを選択し、選択したコンテンツのレコメンド結果をユーザ端末３０に送信する。ユーザ端末３０は、受信したレコメンド結果を表示する。

　次に、レコメンドシステム１が実行する処理について、図８に示されるフローチャートを用いて説明する。

　ユーザ端末３０は、ユーザの視線の軌跡を検知する（ステップＳ１）。ユーザ端末３０は、図３に示される商品詳細画面Ｇの表示中に、コンテンツに対するユーザの視線の軌跡Ｖを検知する。ユーザ端末３０は、検知した視線の軌跡Ｖを示す情報をレコメンド装置１０に送信する。

　取得部１２は、ユーザ端末３０に表示されたコンテンツを閲覧するユーザの視線の軌跡を画像化した視線画像を取得する（ステップＳ２）。例えば、取得部１２は、視線画像生成部１１によって視線の軌跡Ｖが画像化された視線画像ＶＰを取得する。

　取得部１２は、コンテンツを閲覧した閲覧時間を取得する（ステップＳ３）。例えば、取得部１２は、例えばユーザ端末３０から受信した視線の軌跡Ｖを示す情報に基づいて、ユーザがコンテンツを閲覧した閲覧時間Ｔ_ｔ，ａを取得する。

　取得部１２は、ユーザのデモグラフィックデータを取得する（ステップＳ４）。例えば、取得部１２は、記憶部２に記憶されているユーザのデモグラフィックデータＵ_ｔ，ａを取得する。

　取得部１２は、ユーザのコンテンツメタデータを取得する（ステップＳ５）。例えば、取得部１２は、記憶部２に記憶されているユーザのコンテンツメタデータＣ_ｔ，ａを取得する。

　抽出部１３は、視線画像の特徴量を示す特徴ベクトル（視線ベクトル）を抽出する（ステップＳ６）。例えば、抽出部１３は、視線画像を特徴量化した数値データを生成する。そして、抽出部１３は、数値データに対し主成分分析を行うことにより、第１主成分を視線ベクトルとして抽出する。一例では、抽出部１３は、視線画像ＶＰを特徴量化した数値データＶＡを生成する（図４参照）。また、抽出部１３は、数値データＶＡに対し主成分分析を行うことにより、第１主成分を視線ベクトルＶ_ｔ，ａとして抽出する（図５参照）。

　生成部１４は、生成部１４は、特徴ベクトルである視線ベクトルに基づいて、コンテンツとユーザの視線の軌跡との対応関係をユーザコンテキストとして生成する（ステップＳ７）。例えば、生成部１４は、視線ベクトルＶ_ｔ，ａ、コンテンツメタデータＣ_ｔ，ａ、デモグラフィックデータＵ_ｔ，ａ、及び閲覧時間Ｔ_ｔ，ａを結合させることによって、ユーザコンテキストｚ_ｔ，ａを生成する。

　算出部１５は、ユーザコンテキストを用いて、レコメンド候補の複数のコンテンツそれぞれのスコアを算出する（ステップＳ８）。一例では、算出部１５は、式（１）によりコンテンツのスコアｐ_ｔ，ａを算出する。また、算出部１５は、スコアｐ_ｔ，ａの算出過程でユーザコンテキストｚ_ｔ，ａを学習する。

　ステップＳ８の処理において、取得部１２は、ユーザがユーザ端末３０に表示されたコンテンツを購入した実績を示す正解データを更に取得してもよい。算出部１５は、スコアの算出において正解データを用いてユーザコンテキストを学習してもよい。

　出力部１６は、スコアに基づいて選択したコンテンツのレコメンド結果を出力する（ステップＳ９）。例えば、出力部１６は、複数のコンテンツのうちからスコアｐ_ｔ，ａの降順に１つ又は複数のコンテンツを選択し、選択したコンテンツのレコメンド結果をユーザ端末３０に送信する。

　次に、本実施形態に係るレコメンド装置１０の作用効果について説明する。

　本実施形態に係るレコメンド装置１０は、ユーザ端末３０に表示されたコンテンツを閲覧するユーザの視線の軌跡を画像化した視線画像を取得する取得部１２と、視線画像の特徴量を示す特徴ベクトルを抽出する抽出部１３と、特徴ベクトルに基づいて、コンテンツとユーザの視線の軌跡との対応関係をユーザコンテキストとして生成する生成部１４と、ユーザコンテキストを用いて、レコメンド候補の複数のコンテンツそれぞれのスコアを算出する算出部１５と、スコアに基づいて選択したコンテンツのレコメンド結果を出力する出力部１６と、を備える。

　本実施形態に係るレコメンド装置１０では、視線画像が特徴量化されることによって、コンテンツを閲覧するユーザの視線の軌跡の特徴量を示す特徴ベクトルが抽出される。そして、特徴ベクトルに基づいてコンテンツとユーザの視線の軌跡との対応関係がユーザコンテキストとして生成される。さらに、このようなユーザコンテキストを基に各コンテンツのスコアが算出され、レコメンド結果が出力される。ユーザが何を注視していたのか（例えばコンテンツの情報である価格又は商品詳細等の何の情報を注視していたのか）を判別するのではなく、視線の軌跡が画像化されて各コンテンツのスコアが算出されることにより、ユーザの嗜好を行動ベースで抽象的に捉えることが可能になる。このような嗜好の捉え方によれば、ユーザが何を注視していたのかを判別することによるコンテンツの情報（例えば価格及び商品詳細等）に関するユーザの嗜好を判別する必要がない。そして、視線画像を基にしたスコアにより、ユーザの視線の軌跡に応じたコンテンツを選択できる。その結果、ユーザの嗜好に合ったコンテンツをレコメンドすることができる。

　なお、レコメンド装置１０の処理は、視線の軌跡を基にした強化学習であると言える。このような強化学習は、コンテンツごとに異なる視線の軌跡が生じる前提で学習可能であるため、単に視線を用いたアルゴリズムよりも個性を捉えやすい。レコメンド装置１０は、強化学習を用いることにより、どのような視線の軌跡がどのようなユーザの嗜好に繋がるかが分からない問題にも対処できる。

　上述したレコメンド装置１０において、取得部１２は、ユーザが最後に閲覧したコンテンツのメタ情報であるコンテンツメタデータ、コンテンツを閲覧した閲覧時間及びユーザのデモグラフィックデータを更に取得する。生成部１４は、特徴ベクトル、コンテンツメタデータ、デモグラフィックデータ、及び閲覧時間に基づいて、コンテンツとユーザの視線の軌跡との対応関係をユーザコンテキストとして生成する。ユーザコンテキストには、特徴ベクトルに加えてコンテンツメタデータ、デモグラフィックデータ、及び閲覧時間が反映される。そして、このようなユーザコンテキストを基に各コンテンツのスコアが算出され、レコメンド結果が出力される。ユーザの特性がレコメンド結果に反映されることにより、レコメンド結果には、ユーザの嗜好に沿ったコンテンツが出現されやすくなる。

　上述したレコメンド装置１０において、取得部１２は、ユーザがユーザ端末３０に表示されたコンテンツを購入した実績を示す正解データを更に取得する。算出部１５は、スコアの算出において正解データを用いてユーザコンテキストを学習する。ユーザコンテキストには、特徴ベクトルに加えて正解データが反映される。そして、このようなユーザコンテキストを基に各コンテンツのスコアが算出され、レコメンド結果が出力される。正解データがレコメンド結果に反映されることにより、レコメンド結果には、ユーザの嗜好に沿ったコンテンツが出現されやすくなる。

（変形例）
　上述の実施形態では、図４に示される数値データＶＡの各要素の数値は、コンテンツに関する情報がどの位置にあるかについて考慮していないと説明したが、抽出部１３は、コンテンツに関する情報の位置を考慮して数値データを生成してもよい。例えば、抽出部１３は、視線画像とコンテンツに関する情報（例えば商品画像Ｃ１、商品価格Ｃ２、詳細文Ｃ３、及び付帯情報Ｃ４等）とを対応付けた領域に分割し、分割した各領域における特徴量を取得してもよい。或いは、取得部１２は、ユーザ端末３０からコンテンツに関する情報の位置を更に取得してもよい。そして、生成部１４は、特徴ベクトル、コンテンツメタデータ、デモグラフィックデータ、閲覧時間、及びコンテンツに関する情報の位置に基づいて、コンテンツとユーザの視線の軌跡との対応関係をユーザコンテキストとして生成してもよい。これらの処理によれば、ユーザコンテキストにコンテンツに関する情報の位置が反映される。算出部１５は、スコアの算出においてコンテンツに関する情報の位置が反映されたユーザコンテキストをさらに学習してもよい。

　上述の実施形態では、ユーザ端末３０は、検知した視線の軌跡Ｖをレコメンド装置１０に送信しているが、ユーザ端末３０は、検知した視線の軌跡Ｖを画像化した視線画像をレコメンド装置１０に送信してもよい。この場合、レコメンド装置１０は、視線の軌跡Ｖが画像化された視線画像を受信する。

　なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック（構成部）は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した１つの装置を用いて実現されてもよいし、物理的又は論理的に分離した２つ以上の装置を直接的又は間接的に（例えば、有線、無線などを用いて）接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記１つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。

　機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知（broadcasting）、通知（notifying）、通信（communicating）、転送（forwarding）、構成（configuring）、再構成（reconfiguring）、割り当て（allocating、mapping）、割り振り（assigning）などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック（構成部）は、送信部（transmitting　unit）や送信機（transmitter）と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。

　例えば、本開示の一実施の形態におけるレコメンド装置１０は、本開示の情報処理を行うコンピュータとして機能してもよい。図９は、本開示の一実施の形態に係るレコメンド装置１０のハードウェア構成の一例を示す図である。上述のレコメンド装置１０は、物理的には、プロセッサ１００１、メモリ１００２、ストレージ１００３、通信装置１００４、入力装置１００５、出力装置１００６、バス１００７などを含むコンピュータ装置として構成されてもよい。また、ユーザ端末３０のハードウェア構成も、ここで説明するものであってもよい。

　なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。レコメンド装置１０のハードウェア構成は、図に示した各装置を１つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。

　レコメンド装置１０における各機能は、プロセッサ１００１、メモリ１００２などのハードウェア上に所定のソフトウェア（プログラム）を読み込ませることによって、プロセッサ１００１が演算を行い、通信装置１００４による通信を制御したり、メモリ１００２及びストレージ１００３におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。

　プロセッサ１００１は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ１００１は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置（ＣＰＵ：Central　Processing　Unit）によって構成されてもよい。例えば、上述のレコメンド装置１０における各機能は、プロセッサ１００１によって実現されてもよい。

　また、プロセッサ１００１は、プログラム（プログラムコード）、ソフトウェアモジュール、データなどを、ストレージ１００３及び通信装置１００４の少なくとも一方からメモリ１００２に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、レコメンド装置１０における各機能は、メモリ１００２に格納され、プロセッサ１００１において動作する制御プログラムによって実現されてもよい。上述の各種処理は、１つのプロセッサ１００１によって実行される旨を説明してきたが、２以上のプロセッサ１００１により同時又は逐次に実行されてもよい。プロセッサ１００１は、１以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。

　メモリ１００２は、コンピュータ読み取り可能な記録媒体であり、例えば、ＲＯＭ（Read　Only　Memory）、ＥＰＲＯＭ（Erasable　Programmable　ＲＯＭ）、ＥＥＰＲＯＭ（Electrically　Erasable　Programmable　ＲＯＭ）、ＲＡＭ（Random　Access　Memory）などの少なくとも１つによって構成されてもよい。メモリ１００２は、レジスタ、キャッシュ、メインメモリ（主記憶装置）などと呼ばれてもよい。メモリ１００２は、本開示の一実施の形態に係る情報処理を実施するために実行可能なプログラム（プログラムコード）、ソフトウェアモジュールなどを保存することができる。

　ストレージ１００３は、コンピュータ読み取り可能な記録媒体であり、例えば、ＣＤ－ＲＯＭ（Compact　Disc　ＲＯＭ）などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー（登録商標）ディスク、磁気ストリップなどの少なくとも１つによって構成されてもよい。ストレージ１００３は、補助記憶装置と呼ばれてもよい。レコメンド装置１０が備える記憶媒体は、例えば、メモリ１００２及びストレージ１００３の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。

　通信装置１００４は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア（送受信デバイス）であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。

　入力装置１００５は、外部からの入力を受け付ける入力デバイス（例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど）である。出力装置１００６は、外部への出力を実施する出力デバイス（例えば、ディスプレイ、スピーカー、LEDランプなど）である。なお、入力装置１００５及び出力装置１００６は、一体となった構成（例えば、タッチパネル）であってもよい。

　また、プロセッサ１００１、メモリ１００２などの各装置は、情報を通信するためのバス１００７によって接続される。バス１００７は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。

　また、レコメンド装置１０は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ：Digital　Signal　Processor）、ＡＳＩＣ（Application　Specific　Integrated　Circuit）、ＰＬＤ（Programmable　Logic　Device）、ＦＰＧＡ（Field　Programmable　Gate　Array）などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ１００１は、これらのハードウェアの少なくとも１つを用いて実装されてもよい。

　本開示において説明した各態様／実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。

　入出力された情報等は特定の場所（例えば、メモリ）に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。

　判定は、１ビットで表される値（０か１か）によって行われてもよいし、真偽値（Boolean：true又はfalse）によって行われてもよいし、数値の比較（例えば、所定の値との比較）によって行われてもよい。

　本開示において説明した各態様／実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）ことによって行われてもよい。

　以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。

　ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。

　また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術（同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ：Digital　Subscriber　Line）など）及び無線技術（赤外線、マイクロ波など）の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。

　本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。

　また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。

　本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking　up、search、inquiry)（例えば、テーブル、データベース又は別のデータ構造での探索）、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)（例えば、情報を受信すること）、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)（例えば、メモリ中のデータにアクセスすること）した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断（決定）」は、「想定する（assuming）」、「期待する（expecting）」、「みなす（considering）」などで読み替えられてもよい。

　「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、２又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された２つの要素間に１又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、２つの要素は、１又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光（可視及び不可視の両方）領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。

　本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。

　本開示において使用する「第１の」、「第２の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、２つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第１及び第２の要素への参照は、２つの要素のみが採用され得ること、又は何らかの形で第１の要素が第２の要素に先行しなければならないことを意味しない。

　本開示において、「含む（include）」、「含んでいる（including）」及びそれらの変形が使用されている場合、これらの用語は、用語「備える（comprising）」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は（or）」は、排他的論理和ではないことが意図される。

　本開示において、例えば、英語でのa,　an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。

　本開示において、「ＡとＢが異なる」という用語は、「ＡとＢが互いに異なる」ことを意味してもよい。なお、当該用語は、「ＡとＢがそれぞれＣと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。

　１０…レコメンド装置、１１…視線画像生成部、１２…取得部、１３…抽出部、１４…生成部、１５…算出部、１６…出力部、２１…デモグラフィックデータ、３０…ユーザ端末。

Claims

　ユーザ端末に表示されたコンテンツを閲覧するユーザの視線の軌跡を画像化した視線画像を取得する取得部と、
　前記視線画像の特徴量を示す特徴ベクトルを抽出する抽出部と、
　前記特徴ベクトルに基づいて、前記コンテンツと前記ユーザの視線の軌跡との対応関係をユーザコンテキストとして生成する生成部と、
　前記ユーザコンテキストを用いて、レコメンド候補の複数のコンテンツそれぞれのスコアを算出する算出部と、
　前記スコアに基づいて選択したコンテンツのレコメンド結果を出力する出力部と、
を備える、レコメンド装置。
　前記取得部は、前記ユーザが最後に閲覧したコンテンツのメタ情報であるコンテンツメタデータ、前記ユーザのデモグラフィックデータ、及び前記コンテンツを閲覧した閲覧時間を更に取得し、
　前記生成部は、前記特徴ベクトル、前記コンテンツメタデータ、前記デモグラフィックデータ、及び前記閲覧時間に基づいて、前記コンテンツと前記ユーザの視線の軌跡との対応関係を前記ユーザコンテキストとして生成する、
　請求項１に記載のレコメンド装置。
　前記取得部は、前記ユーザが前記ユーザ端末に表示された前記コンテンツを購入した実績を示す正解データを更に取得し、
　前記算出部は、前記スコアの算出において前記正解データを用いて前記ユーザコンテキストを学習する、
　請求項１又は２に記載のレコメンド装置。