JP5440394B2

JP5440394B2 - 評価予測装置、評価予測方法、及びプログラム

Info

Publication number: JP5440394B2
Application number: JP2010124165A
Authority: JP
Inventors: 正志関野
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-05-31
Filing date: 2010-05-31
Publication date: 2014-03-12
Anticipated expiration: 2030-05-31
Also published as: CN102262648A; US9275116B2; US20110302126A1; US8805757B2; US20140358755A1; JP2011248829A

Description

本発明は、評価予測装置、評価予測方法、及びプログラムに関する。

近年、広帯域化したネットワークを通じて膨大な量の情報がユーザに提供されるようになってきた。そのため、ユーザの側からすれば、提供される膨大な情報の中から、自身が求める情報を探すのが難しくなってしまった。一方、情報を提供する側からすれば、ユーザに提供したい情報が膨大な情報の中に埋もれてしまい、そうした情報がユーザに閲覧され難くなってしまった。こうした状況を改善するため、膨大な情報の中からユーザが好む情報を的確に抽出し、その情報をユーザに提供するための仕組み作りが進められている。

膨大な情報の中からユーザが好む情報を抽出する仕組みとしては、例えば、協調フィルタリング、内容ベースフィルタリングと呼ばれるフィルタリング手法が知られている。また、協調フィルタリングには、ユーザベース協調フィルタリング、アイテムベース協調フィルタリング、行列分解ベース協調フィルタリング（例えば、下記の非特許文献１を参照）などの種類がある。一方、内容ベースフィルタリングには、ユーザベース内容ベースフィルタリング、アイテムベース内容ベースフィルタリングなどの種類がある。

ユーザベース協調フィルタリングは、あるユーザＡと似た嗜好を持つユーザＢを検出し、あるアイテム群に対してユーザＢが行った評価に基づいて、ユーザＡが好むアイテムを抽出するといった手法である。例えば、ユーザＢがアイテムＸに対して好意的な評価を行っている場合、ユーザＡもアイテムＸを好むものと予想される。この予想に基づくと、ユーザＡが好む情報としてアイテムＸを抽出することができる。なお、行列分解ベース協調フィルタリングは、ユーザベース協調フィルタリングとアイテムベース協調フィルタリングの特徴を併せ持つ手法であり、詳細については下記の非特許文献１を参照されたい。

また、アイテムベース協調フィルタリングは、あるアイテムＡと似た特徴を持つアイテムＢを検出し、あるユーザ群がアイテムＢに対して行った評価に基づいて、アイテムＡを好むユーザを抽出するといった手法である。例えば、アイテムＢに対してユーザＸが好意的な評価を行っている場合、アイテムＡもユーザＸに好まれるものと予想される。この予想に基づくと、アイテムＡを好むユーザとしてユーザＸを抽出することができる。

また、ユーザベース内容フィルタリングとは、例えば、ユーザＡが好むアイテム群が存在する場合に、そのアイテム群の特徴に基づいてユーザＡの嗜好を解析し、ユーザＡの嗜好に合う特徴を持った新たなアイテムを抽出するといった手法である。そして、アイテムベース内容フィルタリングとは、例えば、アイテムＡを好むユーザ群が存在する場合に、そのユーザ群の嗜好に基づいてアイテムＡの特徴を解析し、アイテムＡの特徴を好む新たなユーザを抽出するといった手法である。

ＲｕｓｌａｎＳａｌａｋｈｕｔｄｉｎｏｖａｎｄＡｎｄｒｉｙＭｎｉｈ．Ｐｒｏｂａｂｉｌｉｓｔｉｃｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎ．ＩｎＡｄｖａｎｃｅｓｉｎＮｅｕｒａｌＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍｓ，ｖｏｌｕｍｅ２０，２００８．

上記のようなフィルタリング手法を利用すると、膨大な情報の中から、ユーザが好む情報を抽出することが可能になる。ユーザは、自身が好む情報だけに絞り込まれた情報群の中から所望の情報を抽出できるようになり、情報の検索性が大きく向上する。一方、情報を提供する側からすれば、ユーザが好む情報を的確に提供することができるようになり、効果的な情報提供が実現できるようになる。しかしながら、フィルタリングの精度が低いと、ユーザが好む情報の絞り込みが適切に行われず、検索性の向上や効果的な情報提供といった効果は得られない。そのため、精度の高いフィルタリング手法が求められている。

上記の協調フィルタリングを利用する場合、ユーザ数やアイテム数が少ない状況下において低い精度となることが知られている。一方、内容ベースフィルタリングを利用する場合、ユーザ数やアイテム数が多い状況下において協調フィルタリングよりも低い精度となることが知られている。また、内容ベースフィルタリングの場合、ユーザ群やアイテム群を特徴付ける特徴の種類を巧く選択しないと低い精度となることが知られている。

そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、より精度の高いフィルタリングを実現することが可能な、新規かつ改良された評価予測装置、評価予測方法、及びプログラムを提供することにある。

上記課題を解決するために、本発明のある観点によれば、複数の第１アイテムがそれぞれ潜在的に持つ特徴を表す複数の第１潜在ベクトルと、複数の第２アイテムがそれぞれ潜在的に持つ特徴を表す複数の第２潜在ベクトルと、前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、前記第１潜在ベクトルと前記第２潜在ベクトルとの内積で表現される評価値と、複数の前記第１アイテムがそれぞれ持つ既知の特徴を表す複数の第１特徴ベクトルと、複数の前記第２アイテムがそれぞれ持つ既知の特徴を表す複数の第２特徴ベクトルと、前記第１特徴ベクトルを前記第１潜在ベクトルの空間に射影する第１射影行列と、前記第２特徴ベクトルを前記第２潜在ベクトルの空間に射影する第２射影行列と、を定義し、前記第１射影行列による前記第１特徴ベクトルの射影値を期待値とする正規分布によって前記第１潜在ベクトルを表現し、前記第２射影行列による前記第２特徴ベクトルの射影値を期待値とする正規分布によって前記第２潜在ベクトルを表現し、前記第１特徴ベクトル、前記第２特徴ベクトル、及び既知の前記評価値を学習データとしてベイズ推定を実行し、前記第１潜在ベクトル、前記第２潜在ベクトル、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定部と、前記パラメータ群の事後分布に基づいて未知の前記評価値の分布を算出する予測部と、を備える、評価予測装置が提供される。

また、前記予測部は、前記パラメータ群の事後分布に基づいて前記未知の評価値の期待値を算出する、ように構成されていてもよい。

また、上記の評価予測装置は、前記予測部によって算出された前記未知の評価値の期待値が所定値よりも大きい場合に、当該未知の評価値に対応する第２アイテムを当該未知の評価値に対応する第１アイテムの推薦先に決定する推薦先決定部をさらに備えていてもよい。

また、前記第２アイテムはユーザを表していてもよい。この場合、上記の評価予測装置は、前記推薦先決定部によって第１アイテムの推薦先が決定された場合に、当該第１アイテムの推薦先に対応するユーザに当該第１アイテムを推薦する推薦部をさらに備えていてもよい。

また、上記課題を解決するために、本発明の別の観点によれば、時刻ｔにおいて、Ｎ個の第１アイテムがそれぞれ潜在的に持つ特徴を表すＮ個の第１潜在ベクトルｕ_ｉ（ｔ）（ｉ＝１，…，Ｎ）と、時刻ｔにおいて、Ｍ個の第２アイテムがそれぞれ潜在的に持つ特徴を表すＭ個の第２潜在ベクトルｖ_ｊ（ｔ）（ｊ＝１，…，Ｍ）と、前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、時刻ｔにおいて、前記第１潜在ベクトルｕ_ｉ（ｔ）と前記第２潜在ベクトルｖ_ｊ（ｔ）との内積で表現される評価値ｙ_ｉｊ（ｔ）と、時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を、時刻ｔにおける前記第１潜在ベクトルｕ_ｉ（ｔ）の空間に射影する第１射影行列と、時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を、時刻ｔにおける前記第２潜在ベクトルｖ_ｊ（ｔ）の空間に射影する第２射影行列と、を定義し、前記第１射影行列により時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）を表現し、前記第２射影行列により時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第２潜在ベクトルｖ_ｊ（ｔ）を表現し、時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）、第２潜在ベクトルｖ_ｊ（ｔ−１）、及び評価値ｙ_ｉｊ（ｔ−１）を学習データとしてベイズ推定を実行し、時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）、第２潜在ベクトルｖ_ｊ（ｔ）、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定部と、時刻ｔにおける前記パラメータ群の事後分布に基づいて時刻ｔにおける評価値ｙ_ｉｊ（ｔ）の期待値を算出する予測部と、を備える、評価予測装置が提供される。

また、前記予測部は、前記時刻ｔにおけるパラメータ群の事後分布に基づいて、時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）の期待値、第２潜在ベクトルｖ_ｊ（ｔ）の期待値、評価値ｙ_ｉｊ（ｔ）を算出し、前記推定部は、前記第１射影行列により時刻（ｔ）における第１潜在ベクトルｕ_ｉ（ｔ）の期待値を射影した射影値を期待値とする正規分布によって時刻（ｔ＋１）における第１潜在ベクトルｕ_ｉ（ｔ＋１）を表現し、前記第２射影行列により時刻ｔにおける第２潜在ベクトルｖ_ｊ（ｔ）の期待値を射影した射影値を期待値とする正規分布によって時刻（ｔ＋１）における第２潜在ベクトルｖ_ｊ（ｔ＋１）を表現し、時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）、第２潜在ベクトルｖ_ｊ（ｔ）、及び評価値ｙ_ｉｊ（ｔ）を学習データとして変分ベイズ推定を実行し、時刻（ｔ＋１）における第１潜在ベクトルｕ_ｉ（ｔ＋１）、第２潜在ベクトルｖ_ｊ（ｔ＋１）、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出し、前記予測部は、時刻（ｔ＋１）における前記パラメータ群の事後分布に基づいて時刻（ｔ＋１）における評価値ｙ_ｉｊ（ｔ＋１）の期待値を算出する、ように構成されていてもよい。

また、上記の評価予測装置は、前記予測部によって算出された評価値ｙ_ｉｊ（ｔ＋１）の期待値が所定値よりも大きい場合に、当該評価値ｙ_ｉｊ（ｔ＋１）に対応する第２アイテムを当該評価値ｙ_ｉｊ（ｔ＋１）に対応する第１アイテムの推薦先に決定する推薦先決定部をさらに備えていてもよい。

また、上記課題を解決するために、本発明の別の観点によれば、複数の第１アイテムがそれぞれ潜在的に持つ特徴を表す複数の第１潜在ベクトルと、複数の第２アイテムがそれぞれ潜在的に持つ特徴を表す複数の第２潜在ベクトルと、前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、前記第１潜在ベクトルと前記第２潜在ベクトルとの内積で表現される評価値と、複数の前記第１アイテムがそれぞれ持つ既知の特徴を表す複数の第１特徴ベクトルと、複数の前記第２アイテムがそれぞれ持つ既知の特徴を表す複数の第２特徴ベクトルと、前記第１特徴ベクトルを前記第１潜在ベクトルの空間に射影する第１射影行列と、前記第２特徴ベクトルを前記第２潜在ベクトルの空間に射影する第２射影行列と、を定義し、前記第１射影行列による前記第１特徴ベクトルの射影値を期待値とする正規分布によって前記第１潜在ベクトルを表現し、前記第２射影行列による前記第２特徴ベクトルの射影値を期待値とする正規分布によって前記第２潜在ベクトルを表現し、前記第１特徴ベクトル、前記第２特徴ベクトル、及び既知の前記評価値を学習データとしてベイズ推定を実行し、前記第１潜在ベクトル、前記第２潜在ベクトル、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定ステップと、前記パラメータ群の事後分布に基づいて未知の前記評価値の分布を算出する予測ステップと、を含む、評価予測方法が提供される。

また、上記課題を解決するために、本発明の別の観点によれば、時刻ｔにおいて、Ｎ個の第１アイテムがそれぞれ潜在的に持つ特徴を表すＮ個の第１潜在ベクトルｕ_ｉ（ｔ）（ｉ＝１，…，Ｎ）と、時刻ｔにおいて、Ｍ個の第２アイテムがそれぞれ潜在的に持つ特徴を表すＭ個の第２潜在ベクトルｖ_ｊ（ｔ）（ｊ＝１，…，Ｍ）と、前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、時刻ｔにおいて、前記第１潜在ベクトルｕ_ｉ（ｔ）と前記第２潜在ベクトルｖ_ｊ（ｔ）との内積で表現される評価値ｙ_ｉｊ（ｔ）と、時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を、時刻ｔにおける前記第１潜在ベクトルｕ_ｉ（ｔ）の空間に射影する第１射影行列と、時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を、時刻ｔにおける前記第２潜在ベクトルｖ_ｊ（ｔ）の空間に射影する第２射影行列と、を定義し、前記第１射影行列により時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）を表現し、前記第２射影行列により時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第２潜在ベクトルｖ_ｊ（ｔ）を表現し、時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）、第２潜在ベクトルｖ_ｊ（ｔ−１）、及び評価値ｙ_ｉｊ（ｔ−１）を学習データとしてベイズ推定を実行し、時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）、第２潜在ベクトルｖ_ｊ（ｔ）、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定ステップと、時刻ｔにおける前記パラメータ群の事後分布に基づいて時刻ｔにおける評価値ｙ_ｉｊ（ｔ）の期待値を算出する予測ステップと、を含む、評価予測方法が提供される。

また、上記課題を解決するために、本発明の別の観点によれば、複数の第１アイテムがそれぞれ潜在的に持つ特徴を表す複数の第１潜在ベクトルと、複数の第２アイテムがそれぞれ潜在的に持つ特徴を表す複数の第２潜在ベクトルと、前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、前記第１潜在ベクトルと前記第２潜在ベクトルとの内積で表現される評価値と、複数の前記第１アイテムがそれぞれ持つ既知の特徴を表す複数の第１特徴ベクトルと、複数の前記第２アイテムがそれぞれ持つ既知の特徴を表す複数の第２特徴ベクトルと、前記第１特徴ベクトルを前記第１潜在ベクトルの空間に射影する第１射影行列と、前記第２特徴ベクトルを前記第２潜在ベクトルの空間に射影する第２射影行列と、を定義し、前記第１射影行列による前記第１特徴ベクトルの射影値を期待値とする正規分布によって前記第１潜在ベクトルを表現し、前記第２射影行列による前記第２特徴ベクトルの射影値を期待値とする正規分布によって前記第２潜在ベクトルを表現し、前記第１特徴ベクトル、前記第２特徴ベクトル、及び既知の前記評価値を学習データとしてベイズ推定を実行し、前記第１潜在ベクトル、前記第２潜在ベクトル、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定機能と、前記パラメータ群の事後分布に基づいて未知の前記評価値の分布を算出する予測機能と、をコンピュータに実現させるためのプログラムが提供される。

また、上記課題を解決するために、本発明の別の観点によれば、時刻ｔにおいて、Ｎ個の第１アイテムがそれぞれ潜在的に持つ特徴を表すＮ個の第１潜在ベクトルｕ_ｉ（ｔ）（ｉ＝１，…，Ｎ）と、時刻ｔにおいて、Ｍ個の第２アイテムがそれぞれ潜在的に持つ特徴を表すＭ個の第２潜在ベクトルｖ_ｊ（ｔ）（ｊ＝１，…，Ｍ）と、前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、時刻ｔにおいて、前記第１潜在ベクトルｕ_ｉ（ｔ）と前記第２潜在ベクトルｖ_ｊ（ｔ）との内積で表現される評価値ｙ_ｉｊ（ｔ）と、時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を、時刻ｔにおける前記第１潜在ベクトルｕ_ｉ（ｔ）の空間に射影する第１射影行列と、時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を、時刻ｔにおける前記第２潜在ベクトルｖ_ｊ（ｔ）の空間に射影する第２射影行列と、を定義し、前記第１射影行列により時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）を表現し、前記第２射影行列により時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第２潜在ベクトルｖ_ｊ（ｔ）を表現し、時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）、第２潜在ベクトルｖ_ｊ（ｔ−１）、及び評価値ｙ_ｉｊ（ｔ−１）を学習データとしてベイズ推定を実行し、時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）、第２潜在ベクトルｖ_ｊ（ｔ）、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定機能と、時刻ｔにおける前記パラメータ群の事後分布に基づいて時刻ｔにおける評価値ｙ_ｉｊ（ｔ）の期待値を算出する予測機能と、をコンピュータに実現させるためのプログラムが提供される。

また、上記課題を解決するために、本発明の別の観点によれば、上記のプログラムが記録された、コンピュータにより読み取り可能な記録媒体が提供される。

以上説明したように本発明によれば、より精度の高いフィルタリングを実現することが可能になる。

ユーザベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成を説明するための説明図である。ユーザベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。ユーザベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。アイテムベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成を説明するための説明図である。アイテムベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。アイテムベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。ユーザベース内容ベースフィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成を説明するための説明図である。ユーザベース内容ベースフィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。ユーザベース内容ベースフィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。アイテムベース内容ベースフィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成を説明するための説明図である。アイテムベース内容ベースフィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。アイテムベース内容ベースフィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。行列分解ベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成を説明するための説明図である。行列分解ベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。行列分解ベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。行列分解ベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。行列分解ベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムの動作を説明するための説明図である。本発明の第１実施形態に係る評価値予測装置の機能構成について説明するための説明図である。本発明の第１実施形態に係る評価値予測装置の動作について説明するための説明図である。本発明の第１実施形態に係る評価値予測装置の動作について説明するための説明図である。本発明の第１実施形態に係る評価値予測装置の動作について説明するための説明図である。本発明の第２実施形態に係る評価値予測装置の動作について説明するための説明図である。本発明の第２実施形態に係る評価値予測装置の動作について説明するための説明図である。本発明の各実施形態に係る評価値予測装置の機能を実現することが可能な情報処理装置のハードウェア構成例について説明するための説明図である。

以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

［説明の流れについて］
ここで、以下に記載する本発明の実施形態に関する説明の流れについて簡単に述べる。まず、図１〜図３を参照しながら、ユーザベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成及びその動作について説明する。次いで、図４〜図６を参照しながら、アイテムベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成及びその動作について説明する。

次いで、図７〜図９を参照しながら、ユーザベース内容ベースフィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成及びその動作について説明する。次いで、図１０〜図１２を参照しながら、アイテムベース内容ベースフィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成及びその動作について説明する。次いで、図１３〜図１７を参照しながら、行列分解ベース協調フィルタリングに基づくアイテムの推薦を実現可能な推薦システムのシステム構成及びその動作について説明する。

次いで、図１８〜図２１を参照しながら、本発明の第１実施形態に係る確率的行列分解ベース協調フィルタリングに基づく評価値の予測及びアイテムの推薦を実現可能な評価値予測装置（推薦システム）の機能構成及びその動作について説明する。次いで、図２２、図２３を参照しながら、本発明の第２実施形態に係る確率的行列分解ベース協調フィルタリングに基づく評価値の時系列予測を実現可能な評価値予測装置の機能構成及びその動作について説明する。次いで、図２４を参照しながら、本発明の第１及び第２実施形態に係る評価値予測装置の機能を実現可能な情報処理装置のハードウェア構成について説明する。

（説明項目）
１：はじめに
１−１：ユーザベース協調フィルタリングについて
１−１−１：推薦システム１０の構成
１−１−２：推薦システム１０の動作
１−２：アイテムベース協調フィルタリングについて
１−２−１：推薦システム２０の構成
１−２−２：推薦システム２０の動作
１−３：ユーザベース内容ベースフィルタリングについて
１−３−１：推薦システム３０の構成
１−３−２：推薦システム３０の動作
１−４：アイテムベース内容ベースフィルタリングについて
１−４−１：推薦システム４０の構成
１−４−２：推薦システム４０の動作
１−５：行列分解ベース協調フィルタリングについて
１−５−１：推薦システム５０の構成
１−５−２：推薦システム５０の動作
２：第１実施形態
２−１：着眼点について
２−２：評価値予測装置１００の機能構成
２−３：評価値予測装置１００の動作
３：第２実施形態
３−１：評価値予測装置１３０の機能構成
３−２：評価値予測装置１３０の動作
４：ハードウェア構成例

＜１：はじめに＞
はじめに、ユーザベース協調フィルタリング、アイテムベース協調フィルタリング、ユーザベース内容ベースフィルタリング、アイテムベース内容ベースフィルタリング、及び行列分解ベース協調フィルタリングについて簡単に説明する。そして、これら一般的なフィルタリング手法が抱える問題点について纏める。なお、後述する本実施形態のフィルタリング手法（以下、本手法と呼ぶ場合がある。）は、これら一般的なフィルタリング手法が抱える問題点を解決するものである。

［１−１：ユーザベース協調フィルタリングについて］
まず、ユーザベース協調フィルタリングについて説明する。ユーザベース協調フィルタリングは、あるユーザに対して推薦するアイテムを決めるために、そのユーザと似た嗜好を持つ他のユーザの評価値を用いる手法である。

（１−１−１：推薦システム１０の構成）
まず、図１を参照しながら、ユーザベース協調フィルタリングを実現することが可能な推薦システム１０の機能構成について述べる。図１は、ユーザベース協調フィルタリングを実現することが可能な推薦システム１０の機能構成を示す説明図である。

図１に示すように、推薦システム１０は、主に、評価値データベース１１と、嗜好解析部１２と、推薦部１３とにより構成される。

（評価値データベース１１）
評価値データベース１１は、図３に示すように、ユーザとアイテムの組み合わせに対する評価値が格納されたデータベースである。例えば、図３において、ユーザＩＤ＝０００１のユーザが、アイテムＩＤ＝０００１のアイテムに付けた評価値は３である。同様に、評価値データベース１１には、各ユーザが各アイテムに対して付けた評価値が格納されている。もちろん、評価値が付いていないユーザとアイテムの組み合わせも存在する。

図３の例において、ユーザＩＤ＝０００２のユーザは、アイテムＩＤ＝０００２のアイテムに対して評価値を付けていない。そのため、評価値データベース１１には、ユーザＩＤ＝０００２のユーザとアイテムＩＤ＝０００２のアイテムの組み合わせに対する評価値が格納されていない。同様に、ユーザＩＤ＝０００３のユーザは、アイテムＩＤ＝０００３のアイテムに対して評価値を付けていない。そのため、評価値データベース１１には、ユーザＩＤ＝０００３のユーザとアイテムＩＤ＝０００３のアイテムの組み合わせに対する評価値が格納されていない。

図３に示した評価値データベース１１の構成は一例であるが、評価値データベース１１には、このようなアイテムとユーザの組み合わせに対する評価値が格納されている。

（嗜好解析部１２）
再び図１を参照する。嗜好解析部１２は、評価値データベース１１に格納された評価値を利用して各ユーザの嗜好を解析する手段である。まず、嗜好解析部１２は、評価値データベース１１に評価値が格納されていない欄を検出し、その欄に対応するユーザを特定する。図３の例において、嗜好解析部１２は、例えば、ユーザＩＤ＝０００３のユーザを特定する。次いで、嗜好解析部１２は、ユーザＩＤ＝０００３のユーザが各アイテムに付けた評価値の組み合わせを参照し、この組み合わせと似た評価値の組み合わせを付けたユーザ（嗜好の似たユーザ）を検出する。

図３の例において、ユーザＩＤ＝０００３のユーザは、アイテムＩＤ＝０００１、０００４のアイテムに評価値３（比較的高評価）を付し、アイテムＩＤ＝０００２のアイテムに評価値１（最低評価）を付している。そこで、嗜好解析部１２は、アイテムＩＤ＝０００１、０００４のアイテムを高く評価し、アイテムＩＤ＝０００２のアイテムを低く評価しているユーザを特定する。図３の例において、嗜好解析部１２は、このようなユーザ（ユーザＩＤ＝０００３と嗜好の似たユーザ）として、ユーザＩＤ＝０００１のユーザを特定する。

次いで、嗜好解析部１２は、ユーザＩＤ＝０００３のユーザが評価値を付していないアイテム（アイテムＩＤ＝０００３のアイテム）に対する評価値を予測する。このとき、嗜好解析部１２は、先に特定したユーザ（ユーザＩＤ＝０００１のユーザ）がアイテムＩＤ＝０００３に付した評価値を参照する。ユーザＩＤ＝０００１のユーザは、アイテムＩＤ＝０００３のアイテムに評価値５（最高評価）を付している。そのため、嗜好解析部１２は、ユーザＩＤ＝０００３のユーザも、アイテムＩＤ＝０００３のアイテムを高く評価するものと予測する。

そこで、この予測に基づき、嗜好解析部１２は、アイテムＩＤ＝０００３のアイテムに対するユーザＩＤ＝０００３のユーザの評価を「高」（例えば、評価値４又は５）に設定する。そして、嗜好解析部１２は、設定した評価又は評価値を推薦部１３に通知する。同様に、嗜好解析部１２は、ユーザＩＤ＝０００２のユーザが評価値を付していないアイテムＩＤ＝０００２のアイテムに対しても、ユーザＩＤ＝０００２のユーザの評価を予測し、その予測結果を推薦部１３に通知する。このように、嗜好解析部１２は、嗜好が似たユーザ同士で評価値を比較し合うことにより未評価のアイテムに対する評価を予測する。

（推薦部１３）
再び図１を参照する。上記の通り、嗜好解析部１２により予測された未評価のアイテムに対する評価又は評価値は、推薦部１３に通知される。推薦部１３は、未評価のアイテムに対して予測された評価又は評価値に基づき、ユーザに対してアイテムを推薦する。図３の例において、ユーザＩＤ＝０００３のユーザとアイテムＩＤ＝０００３のアイテムの組み合わせに対する評価が「高」と通知された場合、推薦部１３は、ユーザＩＤ＝０００３のユーザに対してアイテムＩＤ＝０００３のアイテムを推薦する。また、ユーザＩＤ＝０００２のユーザとアイテムＩＤ＝０００２のアイテムの組み合わせに対する評価が「低」と通知された場合、推薦部１３は、ユーザＩＤ＝０００２のユーザに対してアイテムＩＤ＝０００２のアイテムを推薦しない。

以上説明したように、ユーザベース協調フィルタリングの処理を実現する推薦システム１０は、あるユーザＡと嗜好の似た他のユーザＢの評価値を利用して、ユーザＡが未評価のアイテムに対するユーザＡの嗜好（評価）を予測する。そして、この推薦システム１０は、予測した評価が高い場合に、そのアイテムをユーザＡに推薦し、予測した評価が低い場合に、そのアイテムをユーザＡに推薦しないという処理を実行する。なお、上記説明においては簡単のために、嗜好の似たユーザを１人だけ検出し、そのユーザの評価値を参照する構成としたが、実際には嗜好の似た複数のユーザの評価値を利用して、未評価のアイテムに対する評価を予測する方法が用いられる。

（１−１−２：推薦システム１０の動作）
次に、図２を参照しながら、推薦システム１０の動作について述べ、ユーザベース協調フィルタリングに係る処理の流れについて説明する。図２は、ユーザベース協調フィルタリングに係る処理の流れについて説明するための説明図である。

まず、推薦システム１０は、嗜好解析部１２の機能により、評価値データベース１１から評価値の付いていないユーザとアイテムの組み合わせを検出する（Ｓｔｅｐ．１）。次いで、推薦システム１０は、嗜好解析部１２の機能により、Ｓｔｅｐ．１で検出したユーザと嗜好が似たユーザを検出する（Ｓｔｅｐ．２）。次いで、推薦システム１０は、嗜好解析部１２の機能により、Ｓｔｅｐ．２で検出した嗜好の似たユーザが、Ｓｔｅｐ．１で検出したアイテムに付した評価値を参照する（Ｓｔｅｐ．３）。

次いで、推薦システム１０は、嗜好解析部１２の機能により、Ｓｔｅｐ．３で参照した評価値に基づき、Ｓｔｅｐ．１で検出したユーザとアイテムの組み合わせに対応する評価値（評価）を予測する（Ｓｔｅｐ．４）。Ｓｔｅｐ．４における予測結果は、嗜好解析部１２から推薦部１３に通知される。次いで、推薦システム１０は、推薦部１３の機能により、Ｓｔｅｐ．４で予測された評価値が高い場合に、Ｓｔｅｐ．１で検出されたユーザに対し、Ｓｔｅｐ．１で検出されたアイテムを推薦する（Ｓｔｅｐ．５）。もちろん、評価値が低い場合、推薦システム１０は、そのアイテムを推薦しない。

以上説明したように、ユーザベース協調フィルタリングにおいて、あるユーザが未評価のアイテムに対する評価予測は、そのユーザに嗜好の似たユーザの評価値を用いて行われる。そして、その評価が高い場合に、アイテムの推薦が行われる。

（ユーザベース協調フィルタリングの問題点）
これまで説明したユーザベース協調フィルタリングにおける評価予測の方法からも推察されるように、ユーザベース協調フィルタリングは、ユーザ数やアイテム数が多く、評価値データベース１１に評価値のログが多く格納されている場合に高い精度が得られる。しかし、ユーザ数が少ないと、嗜好が似たユーザがうまく検出されず、評価予測の精度が低くなってしまう。また、未評価のアイテムが多いユーザに対しては、嗜好が似たユーザをうまく検出することができないため、評価予測の精度が低くなってしまう。つまり、ユーザベース協調フィルタリングは、ユーザ数やアイテム数が多く、評価値のログが多い状況下にないと、ユーザの嗜好に合った適切なアイテムの推薦を行うことが難しいという問題を抱えている。

［１−２：アイテムベース協調フィルタリングについて］
次に、アイテムベース協調フィルタリングについて説明する。アイテムベース協調フィルタリングは、あるアイテムの推薦先となるユーザを決めるために、そのアイテムと特徴の似た他のアイテムの評価値を用いる手法である。

（１−２−１：推薦システム２０の構成）
まず、図４を参照しながら、アイテムベース協調フィルタリングを実現することが可能な推薦システム２０の機能構成について述べる。図４は、アイテムベース協調フィルタリングを実現することが可能な推薦システム２０の機能構成を示す説明図である。

図４に示すように、推薦システム２０は、主に、評価値データベース２１と、特徴解析部２２と、推薦部２３とにより構成される。

（評価値データベース２１）
評価値データベース２１は、図６に示すように、ユーザとアイテムの組み合わせに対する評価値が格納されたデータベースである。例えば、図６において、ユーザＩＤ＝０００１のユーザが、アイテムＩＤ＝０００１のアイテムに付けた評価値は３である。同様に、評価値データベース２１には、各ユーザが各アイテムに対して付けた評価値が格納されている。もちろん、評価値が付いていないユーザとアイテムの組み合わせも存在する。

図６の例において、ユーザＩＤ＝０００２のユーザは、アイテムＩＤ＝０００２のアイテムに対して評価値を付けていない。そのため、評価値データベース２１には、ユーザＩＤ＝０００２のユーザとアイテムＩＤ＝０００２のアイテムの組み合わせに対する評価値が格納されていない。同様に、ユーザＩＤ＝０００３のユーザは、アイテムＩＤ＝０００３のアイテムに対して評価値を付けていない。そのため、評価値データベース２１には、ユーザＩＤ＝０００３のユーザとアイテムＩＤ＝０００３のアイテムの組み合わせに対する評価値が格納されていない。

図６に示した評価値データベース２１の構成は一例であるが、評価値データベース２１には、このようなアイテムとユーザの組み合わせに対する評価値が格納されている。

（特徴解析部２２）
再び図４を参照する。特徴解析部２２は、評価値データベース２１に格納された評価値を利用して各アイテムの特徴を解析する手段である。まず、特徴解析部２２は、評価値データベース２１に評価値が格納されていない欄を検出し、その欄に対応するアイテムを特定する。図６の例において、特徴解析部２２は、例えば、アイテムＩＤ＝０００３のアイテムを特定する。次いで、特徴解析部２２は、アイテムＩＤ＝０００３のアイテムに対して各ユーザが付けた評価値の組み合わせを参照し、この組み合わせと似た評価値の組み合わせが付けられたアイテム（特徴の似たアイテム）を検出する。

図６の例において、アイテムＩＤ＝０００３のアイテムは、ユーザＩＤ＝０００１のユーザにより評価値５（最高評価）が付されており、ユーザＩＤ＝０００４のユーザにより評価値１（最低評価）が付されている。そこで、特徴解析部２２は、ユーザＩＤ＝０００１により高く評価され、ユーザＩＤ＝０００４のユーザにより低く評価されているアイテムを特定する。図６の例において、特徴解析部２２は、このようなアイテム（アイテムＩＤ＝０００３と特徴の似たアイテム）として、アイテムＩＤ＝０００４のアイテムを特定する。

次いで、特徴解析部２２は、アイテムＩＤ＝０００３のアイテムに対して評価値を付していないユーザ（ユーザＩＤ＝０００３のユーザ）が付するであろう評価値を予測する。このとき、特徴解析部２２は、先に特定したアイテム（アイテムＩＤ＝０００４のアイテム）に対してユーザＩＤ＝０００４が付した評価値を参照する。アイテムＩＤ＝０００４のアイテムには、ユーザＩＤ＝０００３のユーザが評価値４（比較的高評価）を付している。そのため、特徴解析部２２は、アイテムＩＤ＝０００３のアイテムも、ユーザＩＤ＝０００３のユーザに高く評価されるものと予測する。

そこで、この予測に基づき、特徴解析部２２は、ユーザＩＤ＝０００３のユーザがアイテムＩＤ＝０００３のアイテムに付するであろう評価を「高」（例えば、評価値４又は５）に設定する。そして、特徴解析部２２は、設定した評価又は評価値を推薦部２３に通知する。同様に、特徴解析部２２は、アイテムＩＤ＝０００２のアイテムに対して評価値を付していないユーザＩＤ＝０００２のユーザについても、アイテムＩＤ＝０００２のアイテムに対する評価を予測し、その予測結果を推薦部１３に通知する。このように、特徴解析部２２は、特徴が似たアイテム同士で評価値を比較し合うことにより未評価のユーザが付するであろう評価を予測する。

（推薦部１３）
再び図４を参照する。上記の通り、特徴解析部２２により予測された未評価のユーザに対応する評価又は評価値は、推薦部１３に通知される。推薦部１３は、未評価のユーザに対して予測された評価又は評価値に基づき、ユーザに対してアイテムを推薦する。図６の例において、ユーザＩＤ＝０００３のユーザとアイテムＩＤ＝０００３のアイテムの組み合わせに対する評価が「高」と通知された場合、推薦部１３は、ユーザＩＤ＝０００３のユーザに対してアイテムＩＤ＝０００３のアイテムを推薦する。また、ユーザＩＤ＝０００２のユーザとアイテムＩＤ＝０００２のアイテムの組み合わせに対する評価が「低」と通知された場合、推薦部１３は、ユーザＩＤ＝０００２のユーザに対してアイテムＩＤ＝０００２のアイテムを推薦しない。

以上説明したように、アイテムベース協調フィルタリングの処理を実現する推薦システム２０は、あるアイテムＡと嗜好の似た他のアイテムＢに付された評価値を利用して、アイテムＡを未評価のユーザについてアイテムＡに対する嗜好（評価）を予測する。そして、この推薦システム２０は、予測した評価が高い場合に、そのユーザにアイテムＡを推薦し、予測した評価が低い場合に、そのユーザにユーザＡを推薦しないという処理を実行する。なお、上記説明においては簡単のために、特徴の似たアイテムを１つだけ検出し、そのアイテムに付された評価値を参照する構成としたが、実際には特徴の似た複数のアイテムの評価値を利用して、未評価のアイテムに対する評価を予測する方法が用いられる。

（１−２−２：推薦システム２０の動作）
次に、図５を参照しながら、推薦システム２０の動作について述べ、アイテムベース協調フィルタリングに係る処理の流れについて説明する。図５は、アイテムベース協調フィルタリングに係る処理の流れについて説明するための説明図である。

まず、推薦システム２０は、特徴解析部２２の機能により、評価値データベース２１から評価値の付いていないユーザとアイテムの組み合わせを検出する（Ｓｔｅｐ．１）。次いで、推薦システム２０は、特徴解析部２２の機能により、Ｓｔｅｐ．１で検出したアイテムと特徴が似たアイテムを検出する（Ｓｔｅｐ．２）。次いで、推薦システム２０は、特徴解析部２２の機能により、Ｓｔｅｐ．２で検出した特徴の似たアイテムに対して、Ｓｔｅｐ．１で検出したユーザが付した評価値を参照する（Ｓｔｅｐ．３）。

次いで、推薦システム２０は、特徴解析部２２の機能により、Ｓｔｅｐ．３で参照した評価値に基づき、Ｓｔｅｐ．１で検出したユーザとアイテムの組み合わせに対応する評価値（評価）を予測する（Ｓｔｅｐ．４）。Ｓｔｅｐ．４における予測結果は、特徴解析部２２から推薦部２３に通知される。次いで、推薦システム２０は、推薦部２３の機能により、Ｓｔｅｐ．４で予測された評価値が高い場合に、Ｓｔｅｐ．１で検出されたユーザに対し、Ｓｔｅｐ．１で検出されたアイテムを推薦する（Ｓｔｅｐ．５）。もちろん、評価値が低い場合、推薦システム２０は、そのアイテムを推薦しない。

以上説明したように、アイテムベース協調フィルタリングにおいて、あるアイテムに対して評価を付していないユーザに対する評価予測は、そのアイテムと特徴の似たアイテムに付された評価値を用いて行われる。そして、その評価が高い場合に、アイテムの推薦が行われる。

（アイテムベース協調フィルタリングの問題点）
これまで説明したアイテムベース協調フィルタリングにおける評価予測の方法からも推察されるように、アイテムベース協調フィルタリングは、ユーザ数やアイテム数が多く、評価値データベース２１に評価値のログが多く格納されている場合に高い精度が得られる。しかし、アイテム数が少ないと、特徴が似たアイテムがうまく検出されず、評価予測の精度が低くなってしまう。また、未評価の特徴が多いアイテムに対しては、特徴が似たアイテムをうまく検出することができないため、評価予測の精度が低くなってしまう。つまり、アイテムベース協調フィルタリングは、ユーザ数やアイテム数が多く、評価値のログが多い状況下にないと、ユーザの嗜好に合った適切なアイテムの推薦を行うことが難しいという問題を抱えている。

［１−３：ユーザベース内容ベースフィルタリングについて］
次に、ユーザベース内容ベースフィルタリングについて説明する。ユーザベース内容ベースフィルタリングは、あるユーザに対して推薦するアイテムを決めるために、そのユーザが購入したアイテム群の特徴を用いる手法である。

（１−３−１：推薦システム３０の構成）
まず、図７を参照しながら、ユーザベース内容ベースフィルタリングを実現することが可能な推薦システム３０の機能構成について述べる。図７は、ユーザベース内容ベースフィルタリングを実現することが可能な推薦システム３０の機能構成を示す説明図である。

図７に示すように、推薦システム３０は、主に、特徴量データベース３１と、特徴解析部３２と、推薦部３３とにより構成される。

（特徴量データベース３１）
特徴量データベース３１は、図９に示すように、ユーザと特徴の組み合わせに対して付されたスコアを格納するデータベースである。この特徴としては、例えば、「クラシックの音楽が好き」「ロックの音楽が好き」「ポップスの音楽が好き」「明るい曲調が好き」「暗い曲調が好き」「女性ボーカルが好き」「男性ボーカルが好き」などが例として挙げられる。その他にも、「花の写真が好き」「風景写真が好き」「動物写真が好き」や、「ホラー映画が好き」「時代劇が好き」など、多種多様な特徴が例示できる。各特徴に対する適合度を示すスコアは、各ユーザが過去に購入したアイテムや頻繁に利用するアイテムなどを解析することにより得られる。

図９の例では、ユーザＩＤ＝０００１のユーザと特徴ＩＤ＝０００１、０００３の特徴の組み合わせに対するスコアは３（最高の適合度）である。同様に、ユーザＩＤ＝０００１のユーザと特徴ＩＤ＝０００２の特徴の組み合わせに対するスコアは０（最低の適合度）である。また、ユーザＩＤ＝０００１のユーザと特徴ＩＤ＝０００４の特徴の組み合わせに対するスコアは２（比較的高い適合度）である。このように、特徴量データベース３１には、ユーザと特徴の各組み合わせに付されたスコアが格納されている。そして、各ユーザは、所定の特徴群に対するスコアの組み合わせにより特徴付けられている。なお、図９に例示したデータベースの構成は一例であり、特徴量データベース３１の構成はこれに限定されない。

（特徴解析部３２）
再び図７を参照する。特徴解析部３２は、特徴量データベース３１に格納されたスコアを利用して各ユーザの特徴を解析する手段である。例えば、アイテムＡを推薦するユーザを決めるために、特徴量データベース３１に格納されたスコアを解析してアイテムＡを好むユーザを抽出する処理について考える。まず、特徴解析部３２は、過去にアイテムＡを購入したユーザの特徴を解析する。図９の例では、過去にアイテムＡを購入したユーザ（ユーザＩＤ＝０００１、０００２）と特徴ＩＤ＝０００１、０００３の特徴の組み合わせに高いスコアが付されている。

そこで、特徴解析部３２は、過去にアイテムＡを購入したユーザの特徴として、特徴ＩＤ＝０００１、０００３の特徴に高いスコアが付されていることを検出する。次いで、特徴解析部３２は、過去にアイテムＡを購入していないユーザの中から、特徴ＩＤ＝０００１、０００３の特徴に対するスコアの高いユーザを抽出する。図９の例において、特徴ＩＤ＝０００１、０００３の特徴に対するスコアの高いユーザは、ユーザＩＤ＝１００１のユーザである。そこで、特徴解析部３２は、アイテムＡを推薦すべきユーザとして、ユーザＩＤ＝１００１のユーザを抽出する。このようにして抽出されたユーザの情報（例えば、ユーザＩＤ）は、推薦部３３に通知される。

（推薦部３３）
再び図７を参照する。上記の通り、特徴解析部３２により抽出されたユーザの情報は、推薦部３３に通知される。例えば、特徴解析部３２から推薦部３３にユーザＩＤ＝１００１が通知されたものとする。この場合、推薦部３３は、ユーザＩＤ＝１００１のユーザに対してアイテムＡを推薦する。

以上説明したように、ユーザベース内容ベースフィルタリングの処理を実現する推薦システム３０は、所定の特徴群に対する各ユーザの適合度を示したスコアの組み合わせにより各ユーザを特徴付け、そのスコアの組み合わせを利用してアイテムの推薦先を決める。つまり、推薦システム３０は、あるアイテムを過去に購入したユーザを上記スコアの組み合わせにより特徴付け、そのスコアの組み合わせと似たスコアの組み合わせに対応するユーザに対して当該アイテムを推薦する。

（１−３−２：推薦システム３０の動作）
次に、図８を参照しながら、推薦システム３０の動作について述べ、ユーザベース内容ベースフィルタリングに係る処理の流れについて説明する。図８は、ユーザベース内容ベースフィルタリングに係る処理の流れについて説明するための説明図である。

まず、推薦システム３０は、特徴解析部３２の機能により、特徴量データベース３１に格納されたスコアを参照してユーザの特徴を解析し、アイテムＡを好むユーザの特徴を検出する（Ｓｔｅｐ．１）。次いで、推薦システム３０は、特徴解析部３２の機能により、アイテムＡを未購入のユーザの中から、Ｓｔｅｐ．１で検出されたアイテムＡを好むユーザと似た特徴を持つユーザを検出する（Ｓｔｅｐ．２）。Ｓｔｅｐ．２で検出されたユーザの情報は、特徴解析部３２から推薦部３３に通知される。次いで、推薦システム３０は、推薦部３３の機能により、Ｓｔｅｐ．２で検出されたユーザに対してアイテムＡを推薦する（Ｓｔｅｐ．３）。

以上説明したように、ユーザベース内容ベースフィルタリングにおいては、あるアイテムを未購入のユーザの中から、そのアイテムの推薦先を決める場合、そのアイテムを過去に購入したユーザと似た特徴を持つユーザを検出する処理が行われる。そして、その処理により検出されたユーザに対してアイテムの推薦が行われる。

（ユーザベース内容ベースフィルタリングの問題点）
ユーザベース内容ベースフィルタリングは、先に説明した協調フィルタリングとは異なり、推薦対象のアイテムを過去に購入したユーザの特徴が分かれば、そのアイテムの推薦先を決めることができる。そのため、ユーザ数やアイテム数が少ない状況下においても、ある程度の精度でアイテムの推薦先となるユーザを決めることができる。しかし、ユーザベース内容ベースフィルタリングの場合、他のアイテムの情報を推薦先の決定判断に利用しないため、アイテム数が増えても精度が向上しない。そのため、アイテム数やユーザ数が多い状況下では協調フィルタリングよりも精度が低いという問題を抱えている。

ユーザベース内容ベースフィルタリングは、事前に用意した特徴量によってユーザの特徴を表現する。そのため、ユーザベース内容ベースフィルタリングは、その性能が、用いている特徴量に制限されてしまうという問題も抱えている。例えば、特徴量が粗すぎれば、あるアイテムを好むユーザと好まないユーザの特徴が等しくなってしまい性能が低下してしまうし、細かすぎれば、同じアイテムを好むユーザ同士が異なる特徴を持つことになり、やはり性能が低下してしまう。

［１−４：アイテムベース内容ベースフィルタリングについて］
次に、アイテムベース内容ベースフィルタリングについて説明する。アイテムベース内容ベースフィルタリングは、あるアイテムの推薦先となるユーザを決めるために、そのアイテムを購入したユーザ群の特徴を用いる手法である。

（１−４−１：推薦システム４０の構成）
まず、図１０を参照しながら、アイテムベース内容ベースフィルタリングを実現することが可能な推薦システム４０の機能構成について述べる。図１０は、アイテムベース内容ベースフィルタリングを実現することが可能な推薦システム４０の機能構成を示す説明図である。

図１０に示すように、推薦システム４０は、主に、特徴量データベース４１と、特徴解析部４２と、推薦部４３とにより構成される。

（特徴量データベース４１）
特徴量データベース４１は、図１２に示すように、ユーザと特徴の組み合わせに対して付されたスコアを格納するデータベースである。この特徴としては、例えば、ジャンル、出演者、制作者、提供媒体、シリーズ、曲調、雰囲気などが例として挙げられる。各特徴に対する適合度を示すスコアは、制作者などが各アイテムに予め付しているか、多数の学習用アイテムを利用して機械学習することにより得られる（例えば、特開２００８−１２３０１１号公報などを参照）。

図１２の例では、アイテムＩＤ＝０００１のアイテムと特徴ＩＤ＝０００１、０００３の特徴の組み合わせに対するスコアは３（最高の適合度）である。同様に、アイテムＩＤ＝０００１のアイテムと特徴ＩＤ＝０００２の特徴の組み合わせに対するスコアは０（最低の適合度）である。また、アイテムＩＤ＝０００１のアイテムと特徴ＩＤ＝０００４の特徴の組み合わせに対するスコアは２（比較的高い適合度）である。このように、特徴量データベース４１には、アイテムと特徴の各組み合わせに付されたスコアが格納されている。そして、各アイテムは、所定の特徴群に対するスコアの組み合わせにより特徴付けられている。なお、図１２に例示したデータベースの構成は一例であり、特徴量データベース４１の構成はこれに限定されない。

（特徴解析部４２）
再び図１０を参照する。特徴解析部４２は、特徴量データベース４１に格納されたスコアを利用して各アイテムの特徴を解析する手段である。例えば、ユーザＡに推薦するアイテムを決めるために、特徴量データベース４１に格納されたスコアを解析してユーザＡが好むアイテムを抽出する処理について考える。まず、特徴解析部４２は、過去にユーザＡが購入したアイテムの特徴を解析する。図１２の例では、過去にユーザＡが購入したアイテム（アイテムＩＤ＝０００１、０００２）と特徴ＩＤ＝０００１、０００３の特徴の組み合わせに高いスコアが付されている。

そこで、特徴解析部４２は、過去にユーザＡが購入したアイテムの特徴として、特徴ＩＤ＝０００１、０００３の特徴に高いスコアが付されていることを検出する。次いで、特徴解析部４２は、過去にユーザＡが購入していないアイテムの中から、特徴ＩＤ＝０００１、０００３の特徴に対するスコアの高いアイテムを抽出する。図１２の例において、特徴ＩＤ＝０００１、０００３の特徴に対するスコアの高いアイテムは、アイテムＩＤ＝１００１のアイテムである。そこで、特徴解析部４２は、ユーザＡに推薦すべきアイテムとして、アイテムＩＤ＝１００１のアイテムを抽出する。このようにして抽出されたアイテムの情報（例えば、アイテムＩＤ）は、推薦部４３に通知される。

（推薦部４３）
再び図１０を参照する。上記の通り、特徴解析部４２により抽出されたアイテムの情報は、推薦部４３に通知される。例えば、特徴解析部４２から推薦部４３にアイテムＩＤ＝１００１が通知されたものとする。この場合、推薦部４３は、アイテムＩＤ＝１００１のアイテムをユーザＡに対して推薦する。

以上説明したように、アイテムベース内容ベースフィルタリングの処理を実現する推薦システム４０は、所定の特徴群に対する各アイテムの適合度を示したスコアの組み合わせにより各アイテムを特徴付け、そのスコアの組み合わせを利用してユーザに推薦するアイテムを決める。つまり、推薦システム４０は、あるユーザが過去に購入したアイテムを上記スコアの組み合わせにより特徴付け、そのスコアの組み合わせと似たスコアの組み合わせに対応するアイテムを当該ユーザに推薦する。

（１−４−２：推薦システム４０の動作）
次に、図１１を参照しながら、推薦システム４０の動作について述べ、アイテムベース内容ベースフィルタリングに係る処理の流れについて説明する。図１１は、アイテムベース内容ベースフィルタリングに係る処理の流れについて説明するための説明図である。

まず、推薦システム４０は、特徴解析部４２の機能により、特徴量データベース４１に格納されたスコアを参照してアイテムの特徴を解析し、ユーザＡが好むアイテムの特徴を検出する（Ｓｔｅｐ．１）。次いで、推薦システム４０は、特徴解析部４２の機能により、ユーザＡが未購入のアイテムの中から、Ｓｔｅｐ．１で検出されたユーザＡが好むアイテムと似た特徴を持つアイテムを検出する（Ｓｔｅｐ．２）。Ｓｔｅｐ．２で検出されたアイテムの情報は、特徴解析部４２から推薦部４３に通知される。次いで、推薦システム４０は、推薦部４３の機能により、Ｓｔｅｐ．２で検出されたアイテムをユーザＡに対して推薦する（Ｓｔｅｐ．３）。

以上説明したように、アイテムベース内容ベースフィルタリングにおいては、あるユーザが未購入のアイテムの中から、そのユーザに推薦するアイテムを決める場合、そのユーザが過去に購入したアイテムと似た特徴を持つアイテムを検出する処理が行われる。そして、その処理により検出されたアイテムをユーザに推薦する処理が行われる。

（アイテムベース内容ベースフィルタリングの問題点）
アイテムベース内容ベースフィルタリングは、先に説明した協調フィルタリングとは異なり、推薦対象のユーザが過去に購入したアイテムの特徴が分かれば、そのユーザに推薦するアイテムを決めることができる。そのため、ユーザ数やアイテム数が少ない状況下においても、ある程度の精度で推薦すべきアイテムを決めることができる。しかし、アイテムベース内容ベースフィルタリングの場合、他のユーザの情報を推薦先の決定判断に利用しないため、ユーザ数が増えても精度が向上しない。そのため、アイテム数やユーザ数が多い状況下では協調フィルタリングよりも精度が低いという問題を抱えている。

アイテムベース内容ベースフィルタリングは、事前に用意した特徴量によってアイテムの特徴を表現する。そのため、アイテムベース内容ベースフィルタリングは、その性能が、用いている特徴量に制限されてしまうという問題も抱えている。例えば、特徴量が粗すぎれば、あるユーザに好まれるアイテムと好まれないアイテムの特徴が等しくなってしまい性能が低下してしまうし、細かすぎれば、同じユーザに好まれるアイテム同士が異なる特徴を持つために、やはり性能が低下してしまう。

［１−５：行列分解ベース協調フィルタリングについて］
次に、行列分解ベース協調フィルタリングについて説明する。行列分解ベース協調フィルタリングは、ユーザとアイテムの組み合わせに対する既知の評価値がうまく説明されるように、ユーザの嗜好に対応するベクトルとアイテムの特徴に対応するベクトルを推定し、その推定結果に基づいて未知の評価値を予測する手法である。なお、行列分解ベース協調フィルタリングは、先に説明したユーザベース協調フィルタリングやアイテムベース協調フィルタリングよりも精度が高いことが知られている。

（１−５−１：推薦システム５０の構成）
まず、図１３を参照しながら、行列分解ベース協調フィルタリングを実現することが可能な推薦システム５０の機能構成について述べる。図１３は、行列分解ベース協調フィルタリングを実現することが可能な推薦システム５０の機能構成を示す説明図である。

図１３に示すように、推薦システム５０は、主に、評価値データベース５１と、行列分解部５２と、評価値予測部５３と、推薦部５４とにより構成される。

（評価値データベース５１）
評価値データベース５１は、図１５に示すように、ユーザｉとアイテムｊの組み合わせに対する評価値が格納されたデータベースである。なお、以下では説明の都合上、各ユーザを識別するためのＩＤをｉ＝１，…，Ｍ、アイテムを識別するためのＩＤをｊ＝１，…，Ｎと表記する。先に説明した評価値データベース１１などと同様、評価値が付されていないユーザとアイテムの組み合わせも存在する。行列分解ベース協調フィルタリングは、ユーザの潜在的な特徴とアイテムの潜在的な特徴を考慮して、このような評価値が付されていないユーザとアイテムの組み合わせに対する評価値を予測する手法である。

（行列分解部５２）
ユーザｉ、アイテムｊに対応する評価値をｙｉｊと表記すると、評価値データベース５１に格納された評価値の集合は、ｙ_ｉｊを要素とする評価値行列｛ｙ_ｉｊ｝（ｉ＝１，…，Ｍ、ｊ＝１，…，Ｎ）とみなすことができる。行列分解部５２は、ユーザｉの潜在的な特徴を表す潜在特徴ベクトルｕ_ｉ（図１７を参照）、アイテムｊ（ｊ＝１，…，Ｎ）の潜在的な特徴を表す潜在特徴ベクトルｖ_ｊ（図１６を参照）を導入し、既知の評価値ｙ_ｉｊ全体がうまく説明されるように、評価値行列｛ｙ_ｉｊ｝を分解して潜在特徴ベクトルｕ_ｉ，ｖ_ｊで表現する。なお、既知の評価値ｙ_ｉｊとは、評価値データベース５１に評価値が格納された評価値ｙ_ｉｊのことである。

なお、潜在特徴ベクトルｕ_ｉの各要素は、ユーザの潜在的な特徴を表すものである。同様に、潜在特徴ベクトルｖ_ｊの各要素は、アイテムの潜在的な特徴を表すものである。但し、ここで「潜在的な」という表現を用いていることからも理解されるように、潜在特徴ベクトルｕ_ｉ，ｖ_ｊの各要素がユーザやアイテムの具体的な特徴を表すものではなく、後述するモデル計算の中で得られる単なるパラメータである。但し、潜在特徴ベクトルｕ_ｉを構成するパラメータ群は、ユーザの好みを反映したものとなる。また、潜在特徴ベクトルｖ_ｊを構成するパラメータ群は、アイテムの特徴を反映したものとなる。

さて、行列分解部５２による具体的な処理について説明する。まず、行列分解部５２は、下記の式（１）に示すように、評価値ｙ_ｉｊを潜在特徴ベクトルｕ_ｉ，ｖ_ｊの内積で表現する。但し、上付きのＴは転置を表す。また、潜在特徴ベクトルｕ_ｉ，ｖ_ｊの次元数はＨとする。既知の評価値ｙ_ｉｊ全体がうまく説明されるように潜在特徴ベクトルｕ_ｉ，ｖ_ｊを求めるには、例えば、下記の式（２）で定義される二乗誤差Ｊが最小となる潜在特徴ベクトルｕ_ｉ，ｖ_ｊを算出すればよいと考えられる。しかし、実際には、二乗誤差Ｊを最小とする潜在特徴ベクトルｕ_ｉ，ｖ_ｊを用いて未知の評価値ｙ_ｉｊを予測しても、十分な予測精度が得られないことが知られている。

そこで、行列分解部５２は、下記の式（３）で定義される正規化項Ｒを用いて潜在特徴ベクトルｕ_ｉ，ｖ_ｊを算出する。具体的には、行列分解部５２は、二乗誤差Ｊと正規化項Ｒの線形結合で表現される目的関数Ｑ（下記の式（４）を参照）が最小化されるような潜在特徴ベクトルｕ_ｉ，ｖ_ｊを算出する。なお、βは、正規化項Ｒの重みを表現するためのパラメータである。下記の式（３）から明らかなように、正規化項Ｒは、目的関数Ｑが最小となる潜在特徴ベクトルｕ_ｉ，ｖ_ｊを算出する際に、潜在特徴ベクトルｕ_ｉ，ｖ_ｊが０に近づくように作用する。なお、目的関数Ｑが最小となる潜在特徴ベクトルｕ_ｉ，ｖ_ｊを算出する際に、潜在特徴ベクトルｕ_ｉ，ｖ_ｊがベクトルμ_ｕ，μ_ｖに近づくように作用させるには、正規化項Ｒを下記の式（５）のように変形すればよい。

なお“ＲｕｓｌａｎＳａｌａｋｈｕｔｄｉｎｏｖａｎｄＡｎｄｒｉｙＭｎｉｈ．Ｐｒｏｂａｂｉｌｉｓｔｉｃｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎ．ＩｎＡｄｖａｎｃｅｓｉｎＮｅｕｒａｌＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍｓ，ｖｏｌｕｍｅ２０，２００８．”に記載の一般的な行列分解ベース協調フィルタリングにおいて、上記のベクトルμ_ｕは潜在特徴ベクトルｕ_ｉの平均、上記のベクトルμ_ｖは潜在特徴ベクトルｖ_ｊの平均とされている。

このように、行列分解部５２は、上記の式（４）に示した目的関数Ｑが最小となる潜在特徴ベクトルｕ_ｉ，ｖ_ｊを算出する。そして、行列分解部５２により算出された潜在特徴ベクトルｕ_ｉ，ｖ_ｊは、評価値予測部５３に入力される。

（評価値予測部５３）
行列分解部５２から潜在特徴ベクトルｕ_ｉ，ｖ_ｊ（ｉ＝１，…，Ｍ、ｊ＝１，…，Ｎ）が入力されると、評価値予測部５３は、上記の式（１）に基づき、入力された潜在特徴ベクトルｕ_ｉ，ｖ_ｊを用いて未知の評価値を算出する。例えば、評価値ｙ_ｍｎが未知の場合、評価値予測部５３は、潜在特徴ベクトルｕ_ｍ，ｖ_ｎを用いて評価値ｙ_ｍｎ＝ｕ_ｍ ^Ｔｖ_ｎを算出する。このようにして評価値予測部５３により算出された未知の評価値は、推薦部５４に入力される。

（推薦部５４）
評価値予測部５３から未知の評価値ｙ_ｍｎが入力されると、推薦部５４は、入力された未知の評価値ｙ_ｍｎに基づいて、ユーザｍにアイテムｎを推薦するか否かを判断する。例えば、未知の評価値ｙ_ｍｎが所定の閾値を上回る場合、推薦部５４は、ユーザｍにアイテムｎを推薦する。一方、未知の評価値ｙ_ｍｎが所定の閾値を下回る場合、推薦部５４は、ユーザｍにアイテムｎを推薦しない。なお、推薦部５４は、閾値を基準に推薦するアイテムを決定するのではなく、例えば、ランキング上位となる一定数のアイテムを推薦するように構成されていてもよい。

以上、行列分解ベース協調フィルタリングを実現可能な推薦システム５０の機能構成について説明した。これまで説明してきた通り、上記の行列分解ベース協調フィルタリングにおいては、既知の評価値しか利用されていない。そのため、ユーザ数やアイテム数が少なかったり、評価値のログが少なかったりする状況下では予測精度が低くなる。

（１−５−２：推薦システム５０の動作）
次に、図１４を参照しながら、推薦システム５０の動作について述べ、行列分解ベース協調フィルタリングに係る処理の流れについて説明する。図１４は、行列分解ベース協調フィルタリングに係る処理の流れについて説明するための説明図である。

まず、推薦システム５０は、行列分解部５２の機能により、評価値データベース５１から評価値ｙ_ｉｊの集合｛ｙ_ｉｊ｝を取得する（Ｓｔｅｐ．１）。次いで、推薦システム５０は、行列分解部５２の機能により、Ｓｔｅｐ．１で取得した既知の評価値集合｛ｙ_ｉｊ｝を用いて、上記の式（３）で定義される目的関数Ｑを最小化する潜在特徴ベクトル｛ｕ_ｉ｝｛ｖ_ｊ｝を算出する（Ｓｔｅｐ．２）。行列分解部５２により算出された潜在特徴ベクトル｛ｕ_ｉ｝｛ｖ_ｊ｝は、評価値予測部５３に入力される。

次いで、推薦システム５０は、評価値予測部５３の機能により、Ｓｔｅｐ．２で算出された潜在特徴ベクトル｛ｕ_ｉ｝｛ｖ_ｊ｝を用いて、未知の評価値｛ｙ_ｍｎ｝を算出（予測）する（Ｓｔｅｐ．３）。評価値予測部５３により算出された未知の評価値｛ｙ_ｍｎ｝は、推薦部５４に入力される。次いで、推薦システム５０は、推薦部５４の機能により、Ｓｔｅｐ．３で算出された評価値｛ｙ_ｍｎ｝が所定の閾値を上回る場合に、ユーザｍにアイテムｎを推薦する（Ｓｔｅｐ．４）。もちろん、Ｓｔｅｐ．３で算出された評価値｛ｙ_ｍｎ｝が所定の閾値を下回る場合、ユーザｍに対するアイテムｎの推薦は行われない。

以上説明したように、行列分解ベース協調フィルタリングにおいては、既知の評価値｛ｙ_ｉｊ｝を利用して潜在特徴ベクトル｛ｕ_ｉ｝｛ｖ_ｊ｝が算出され、その算出結果に基づいて未知の評価値｛ｙ_ｍｎ｝が予測される。そして、その予測結果に基づいてユーザｍに対するアイテムｎの推薦が行われる。

（行列分解ベース協調フィルタリングの問題点）
行列分解ベース協調フィルタリングは、先に説明したユーザベース協調フィルタリングやアイテムベース協調フィルタリングに比べて評価値の予測精度が高い。しかし、行列分解ベース協調フィルタリングにおいても既知の評価値しか利用されないため、ユーザ数やアイテム数が少なかったり、評価値のログが少なったりする状況下では予測精度が低くなるという問題点がある。こうした問題点を解決するために考案されたのが後述する本実施形態のフィルタリング手法である。

＜２：第１実施形態＞
以下、本発明の第１実施形態について説明する。本実施形態は、行列分解ベース協調フィルタリングに関する。但し、本実施形態は、先に説明した行列分解ベース協調フィルタリングとは異なり、既知の評価値のみならずユーザやアイテムが有する既知の特徴を考慮した新たなフィルタリング手法に関するものである。そのため、本実施形態に係るフィルタリング手法を適用すると、ユーザ数やアイテム数が少なかったり、評価値のログが少ない状況下においても、十分に高い精度で評価値を予測することが可能になる。また、協調フィルタリングがベースとなっているため、ユーザ数やアイテム数が増加するにつれ、評価値の予測精度が向上するという利点も有する。以下、詳細に説明する。

［２−１：着眼点について］
上記の通り、先に説明した行列分解ベース協調フィルタリングにおいては、既知の評価値しか考慮されていなかった。そこで、本実施形態に係るフィルタリング手法（以下、本手法）においては、既知の評価値に加えてユーザやアイテムが持つ既知の特徴を考慮し、これら既知の特徴を潜在特徴ベクトル｛ｕ_ｉ｝｛ｖ_ｊ｝に反映させる。例えば、本手法においては、先の行列分解ベース協調フィルタリングにおいて上記の式（５）で表現されていた正規化項Ｒを下記の式（６）に示す正規化項Ｒに変更する。但し、下記の式（６）に含まれるＤ_ｕ，Ｄ_ｖは、特徴ベクトルｘ_ｕｉ，ｘ_ｖｊをそれぞれ潜在特徴ベクトルｕ_ｉ，ｖ_ｊの空間に射影するための回帰行列である。

上記の式（６）のように正規化項Ｒを変更した場合、上記の式（４）で表現される目的関数Ｑを最小化するように潜在特徴ベクトル｛ｕ_ｉ｝｛ｖ_ｊ｝を算出する際、潜在特徴ベクトルｕ_ｉはＤ_ｕｘ_ｕｉに近づくように、ｖ_ｊはＤ_ｖｘ_ｖｊに近づくように制限される。そのため、既知の特徴が似たユーザの潜在特徴ベクトルｕ_ｉ同士が近づくことになる。同様に、既知の特徴が似たアイテムの潜在特徴ベクトルｖ_ｊ同士も近づくことになる。従って、既知の評価値が少ないユーザやアイテムであっても、既知の特徴に基づいて他のユーザやアイテムと似た潜在特徴ベクトルが得られるようになる。その結果、既知の評価値が少ない状況下にあるユーザやアイテムに対しても、高い精度で評価値を予測することが可能になる。以下、具体的な計算手法及び当該計算手法を実現可能な評価値予測装置１００の構成について説明する。

［２−２：評価値予測装置１００の機能構成］
図１８を参照しながら、本実施形態に係るフィルタリング手法を実現することが可能な評価値予測装置１００の機能構成について説明する。図１８は、本実施形態に係る評価値予測装置１００の機能構成について説明するための説明図である。なお、図１８に例示した評価値予測装置１００の構成には、ユーザにアイテムを推薦する構成要素を含んでいるが、未知の評価値を予測する部分だけを切り出して評価値予測装置１００としてもよい。但し、以下では、先に説明した推薦システム５０などとの対比を容易にするため、評価値予測装置１００を推薦システムの一例として説明する。

図１８に示すように、評価値予測装置１００は、評価値データベース１０１と、特徴量データベース１０２と、事後分布算出部１０３と、パラメータ保持部１０４とを有する。さらに、さらに、評価値予測装置１００は、評価値予測部１０５と、予測評価値データベース１０６と、推薦部１０７と、通信部１０８とを有する。また、評価値予測装置１００は、例えば、ネットワーク２００を介してユーザ端末３００に接続されている。

（評価値データベース１０１）
評価値データベース１０１は、図１５に示すように、ユーザｉとアイテムｊの組み合わせに対して付された評価値が格納されたデータベースである。なお、先に説明した行列分解ベース協調フィルタリングの場合と同様、説明の都合上、各ユーザを識別するためのＩＤをｉ＝１，…，Ｍ、アイテムを識別するためのＩＤをｊ＝１，…，Ｎと表記する。また、各評価値をｙ_ｉｊと表記し、その評価値の集合を｛ｙ_ｉｊ｝と表記する。なお、評価値データベース１０１に格納されていない未知の評価値を予測する点でも、上記の行列分解ベース協調フィルタリングと同様である。

（特徴量データベース１０２）
特徴量データベース１０２は、図２０、図２１に示すように、ユーザが持つ既知の特徴を表した特徴ベクトル｛ｘ_ｕｉ｝の各要素、及びアイテムが持つ既知の特徴を表した特徴ベクトル｛ｘ_ｖｊ｝の各要素が格納されたデータベースである。ユーザが持つ既知の特徴としては、例えば、年齢、性別、出身地、職業などがある。一方、アイテムが持つ既知の特徴としては、例えば、ジャンル、著者、出演者、監督、出版年、曲調などがある。

（事後分布算出部１０３、パラメータ保持部１０４）
さて、本手法では、上記の式（６）に示すように、回帰行列Ｄ_ｕ，Ｄ_ｖがパラメータとして追加された。そのため、パラメータ数の増加が推定の精度に与える影響を最小限に留めるため、本実施形態においてはベイズ推定のような推定手法を用いることにする。ベイズ推定は、確率モデルを用い、学習データが与えられた状況下で未知のパラメータを推定する手法である。本実施形態の場合、学習データとして、既知の評価値集合｛ｙ_ｉｊ｝と特徴ベクトル｛ｘ_ｕｉ｝｛ｘ_ｖｊ｝が与えられる。また、未知のパラメータとして、未知の評価値集合｛ｙ_ｍｎ｝、回帰行列Ｄ_ｕ，Ｄ_ｖ、その他確率モデルに含まれるパラメータが存在する。まず、本手法で用いる確率モデルについて説明する。

本手法で用いる確率モデルは、下記の式（７）〜式（９）で表現される。但し、Ｎ（μ，Σ）は、平均がμ、共分散行列がΣの正規分布を表す。また、ｄｉａｇ（…）は、…を対角成分に持つ対角行列を表す。なお、λ、β_ｕ、β_ｖは、確率モデルの中で導入されたパラメータである。λはスカラー量であり、β_ｕ＝（β_ｕ１，…，β_ｕＨ）、β_ｖ＝（β_ｖ１，…，β_ｖＨ）である。下記の式（７）〜式（９）で表現される確率モデルは、上記の式（６）で表現した正規化項Ｒを用いて目的関数Ｑを最小化するように潜在特徴ベクトル｛ｕ_ｉ｝｛ｖ_ｊ｝を算出する演算と等価である。但し、上記の式（４）に現れるスカラー量のパラメータβがベクトル量のβ_ｕ、β_ｖに変更されている点で、より柔軟なモデルへと変更されている。

事後分布算出部１０３は、上記の確率モデルに基づいてベイズ推定を行い、潜在特徴ベクトル｛ｕ_ｉ｝｛ｖ_ｊ｝、回帰行列Ｄ_ｕ，Ｄ_ｖ、確率モデルに含まれるパラメータλ，β_ｕ，β_ｖの事後分布を算出する手段である。なお、以下の説明において、潜在特徴ベクトル｛ｕ_ｉ｝｛ｖ_ｊ｝、回帰行列Ｄ_ｕ，Ｄ_ｖ、確率モデルに含まれるパラメータλ，β_ｕ，β_ｖをまとめてパラメータと呼ぶ場合がある。また、事後分布算出部１０３により設定又は算出されたパラメータは、パラメータ保持部１０４に格納される。さらに、ここではベイズ推定の近似解法である変分ベイズ推定を用いることにする。

ベイズ推定は、確率モデルに基づき、学習データが与えられた状況下で各パラメータの事後分布を求める推定ステップと、求めた事後分布を周辺化してパラメータの分布やその期待値を求める予測ステップとで構成される。複雑な確率モデルを用いると、事後分布も非常に複雑になり、予測ステップで求めたいパラメータの分布や期待値を求めることが難しくなる。一方、変分ベイズ推定の場合は、事後分布を計算しやすい分布で近似することにより事後分布の複雑化が回避されるため、パラメータの分布や期待値が求めやすくなる。

いま、学習データをベクトル量Ｘ、パラメータの集合をΘ＝｛θ_１，…，θ_Ｋ｝と表現すると、変分ベイズ推定の場合、事後分布ｐ（Θ｜Ｘ）は、下記の式（１０）のように近似される。また、このように近似した場合、パラメータθ_ｋ（ｋ＝１，…，Ｋ）の変分事後分布ｑ（θ_ｋ）は、下記の式（１１）及び式（１２）となることが知られている。但し、Ｅ_ｐ（ｘ）［ｆ（ｘ）］は、分布ｐ（ｘ）の下におけるｆ（ｘ）の期待値を表す。また、ｃｏｎｓｔ．は定数を表す。なお、各変分事後分布ｑ（θ_ｋ）（ｋ＝１，…，Ｋ）は、他の分布に依存している。そのため、最適な変分事後分布を算出するには、適当な初期化処理の下、各変分事後分布のパラメータを他の変分事後分布の下で更新する処理を繰り返し実行する必要がある。この処理に関する具体的なアルゴリズムについては後述する。

ここで、上記の変分ベイズ推定に関するアルゴリズムを上記の式（７）〜式（９）で表現した確率モデルに当てはめる。まず、事後分布ｐ（Θ｜Ｘ）は、下記の式（１３）のように表現される。但し、回帰行列Ｄ_ｕ，Ｄ_ｖをＤ_ｕ＝（ｄ_ｕ１，…，ｄ_ｕＨ）^Ｔ、Ｄ_ｖ＝（ｄ_ｖ１，…，ｄ_ｖＨ）^Ｔと表現した。なお、ｄ_ｕｈ，ｄ_ｖｈ（ｈ＝１，…，Ｈ）はベクトル量である。

ところで、潜在特徴ベクトルｕ_ｉ、ｖ_ｊの間には対称性がある。そこで、以下ではｕ_ｉの分布だけについて考えることにする。また、表記を簡単にするため、β_ｕを単にβ＝（β_１，…，β_Ｈ）と表記し、Ｄ_ｕを単にＤと表記し、ｄ_ｕｈをｄ_ｈと表記し、ｘ_ｕｉをｘ_ｉと表記する。そして、特徴量ｘ_ｉ及び回帰ベクトルｄ_ｈとその事前分布のパラメータγ_ｈはＫ次元とする。ここで、パラメータｄ_ｈ、βの事前分布を下記の式（１４）、式（１５）のように定義する。また、下記の式（１４）に現れるパラメータγ＝（γ_１，…，γ_Ｋ）の分布を下記の式（１６）のように定義する。これらの分布は、事後分布も同じ分布となる共役事前分布である。なお、事前知識がない場合には、事前分布のパラメータを一様分布に設定しておけばよい。また、事前知識を反映させる場合には、事前分布のパラメータを調整すればよい。

なお、Ｇａｍ（…）はガンマ分布を表す。事後分布算出部１０３は、上記の式（１３）〜式（１６）に示した条件の下で、上記の式（１１）の変分事後分布を算出する。まず、潜在特徴ベクトルｕ_ｉの変分事後分布ｑ（ｕ_ｉ）は、下記の式（１７）となる。但し、下記の式（１７）に現れるパラメータμ’_ｕｉ，Σ’_ｕｉは、下記の式（１８）及び式（１９）で表現される。また、回帰行列Ｄの要素ｄ_ｈに関する変分事後分布ｑ（ｄ_ｈ）は、下記の式（２０）となる。但し、下記の式（２０）に現れるパラメータμ’_ｄｈ，Σ’_ｄｈは、下記の式（２１）及び式（２２）で表現される。

なお、上記の式（１８）及び式（１９）に現れるベクトルπ_ｉ＝（π_ｉ１，…，π_ｉＮ）^Ｔは、評価値ｙ_ｉｊが既知の場合にπ_ｉｊ＝１、未知の場合にπ_ｉｊ＝０をとるベクトルである。また、上記の式（１８）に現れるベクトルｙ_ｉは、評価値ｙ_ｉｊを要素とするベクトルｙ_ｉ＝（ｙ_ｉ１，…，ｙ_ｉＮ）^Ｔである。そして、上記の式（１８）及び式（１９）に現れるＶは、潜在特徴ベクトルｖ_ｊを要素とする行列Ｖ＝（ｖ_１，…，ｖ_Ｎ）^Ｔである。さらに、上記の式（２１）及び式（２２）に現れるＸは、特徴ベクトルｘ_ｉを要素とする行列Ｘ＝（ｘ_１，…，ｘ_Ｎ）^Ｔである。

また、確率モデルのパラメータβ、γに関する変分事後分布ｑ（β）、ｑ（γ）は、それぞれ下記の式（２３）、式（２６）となる。但し、下記の式（２３）に現れるパラメータａ’β_ｈ、ｂ’β_ｈは、それぞれ下記の式（２４）、式（２５）で表現される。そして、下記の式（２６）に現れるパラメータａ’γ_ｋ、ｂ’γ_ｋは、それぞれ下記の式（２７）、式（２８）で表現される。

上記の式（１７）〜式（２８）を用いて各パラメータの変分事後分布が表現されることから、下記のアルゴリズムに基づいて各変分事後分布のパラメータを他の変分事後分布の下で更新することにより、各パラメータの最適な変分事後分布が得られる。以下、潜在特徴ベクトルｕ_ｉ（ｉ＝１，…，Ｍ）の更新アルゴリズムを示す。

潜在特徴ベクトルｖ_ｊ（ｊ＝１，…，Ｎ）の更新アルゴリズムも同様に、以下のようになる。但し、潜在特徴ベクトルｖ_ｊの更新アルゴリズムにおいて、β＝（β_１，…，β_Ｈ）はβ_ｖを表し、ＤはＤ_ｖを表し、ｄ_ｈはｄ_ｖｈを表し、ｘ_ｊはｘ_ｖｊを表す。また、特徴量ｘ_j及び回帰ベクトルｄ_ｈとその事前分布のパラメータγ_ｈはＫ次元とする。さらに、π_ｊ＝（π_１ｊ，…，π_Ｍｊ）^Ｔは、評価値ｙ_ｉｊが既知の場合にπ_ｉｊ＝１、未知の場合にπ_ｉｊ＝０をとるベクトルである。また、ｙ_ｊは、評価値ｙ_ｉｊを要素とするベクトルｙ_ｊ＝（ｙ_１ｊ，…，ｙ_Ｍｊ）^Ｔである。そして、Ｕは、潜在特徴ベクトルｕ_ｉを要素とする行列Ｕ＝（ｕ_１，…，ｕ_Ｍ）^Ｔである。さらに、Ｘは、特徴ベクトルｘ_ｊを要素とする行列Ｘ＝（ｘ_１，…，ｘ_Ｍ）^Ｔである。

事後分布算出部１０３は、パラメータが収束するまで、上記の更新アルゴリズムをＵ、Ｖについて交互に反復実行する。この処理により、各パラメータの変分事後分布が得られる。ここで得られた変分事後分布は、事後分布算出部１０３から評価値予測部１０５に入力される。ここまでの処理が推定ステップである。この推定ステップを終えると、評価値予測装置１００は、処理を予測ステップに進める。

（パラメータλの変分事後分布について）
ここで、パラメータλの変分事後分布を推定する処理について説明を補足する。パラメタλの変分事後分布ｑ（λ）は、λの事前分布ｐ（λ）を下記の式（２９）で表現すると、下記の式（３０）のようになる。但し、下記の式（３０）に現れるａ’λ、ｂ’λは、それぞれ下記の式（３１）及び式（３２）のように表現される。従って、この変分事後分布ｑ（λ）を用いてパラメータλを推定することは可能であるが、パラメータλ、その期待値Ｅ［λ］は、予備実験などを通じて設定することもできる。

（評価値予測部１０５）
さて、評価値予測部１０５は、予測ステップの処理として、事後分布算出部１０３から入力された各パラメータの変分事後分布に基づいて評価値ｙ_ｉｊの期待値を算出する。上記の通り、事後分布算出部１０３によって潜在特徴ベクトルの変分事後分布ｑ（ｕ_ｉ），ｑ（ｖ_ｊ）が求められている。そこで、評価値予測部１０５は、下記の式（３３）に示すように、潜在特徴ベクトルｕ_ｉ，ｖ_ｊの内積（評価値ｙ_ｉｊ）に対する期待値を算出する。このようにして評価値予測部１０５により算出された評価値の期待値は、予測評価値データベース１０６に格納される。

（推薦部１０７、通信部１０８）
推薦部１０７は、予測評価値データベース１０６に格納された未知の評価値に対する期待値（以下、予測評価値）を参照し、予測評価値が高い場合にはユーザにアイテムを推薦する。例えば、推薦部１０７は、予測評価値ｙ_ｍｎが所定の閾値を上回る場合、ユーザｍに対してアイテムｎを推薦する。また、推薦部１０７は、予測評価値データベース１０６を参照して、あるユーザが評価を行っていないアイテムに対して予測評価値が高い順にアイテムをソートしてリストを生成し、そのリストを当該ユーザに提示してもよい。例えば、推薦部１０７は、通信部１０８を介して、生成したリストをユーザ端末３００に送信する。そして、送信されたリストは、ネットワーク２００を通じてユーザ端末３００に伝達され、ユーザ端末３００の表示手段（非図示）に表示される。

以上、評価値予測装置１００の機能構成について説明した。

（メモリの節約について）
ところで、ある程度大きな次元の潜在特徴ベクトルｕ_ｉ，ｖ_ｊを用いて本実施形態に係るフィルタリング手法を実現するには、十分なメモリ容量が必要になる。例えば、上記の更新アルゴリズムに現れるΣ’_ｕｉ（ｉ＝１，…，Ｍ）及びΣ’_ｖｊ（ｊ＝１，…，Ｎ）をメモリに保持するには、それぞれＯ（ＭＨ^２）［ｂｉｔ］及びＯ（ＮＨ^２）［ｂｉｔ］のメモリ領域が必要になる。そのため、ユーザ数Ｍ、アイテム数Ｎ、潜在特徴ベクトルの次元数Ｈが大きいと、これらを保持するだけで膨大なメモリ容量が必要になる。

同様に、Σ’_ｄｈ（ｈ＝１，…，Ｈ）を保持するためにもＯ（ＨＫ^２）［ｂｉｔ］のメモリ領域が必要になる。そのため、潜在ベクトルの次元数Ｈや特徴量数Ｋが大きいと、これを保持するだけで膨大なメモリ容量が必要となる。そこで、必要となるメモリ容量を減らすため、平均ベクトルμ’_ｕｉ，μ’_ｖｊ，μ’_ｄｈを共役勾配法などによって更新するようにし、Σ’_ｕｉ，Σ’_ｖｊ，Σ’_ｄｈは対角成分のみを保持するようにする。この方法を用いることにより、上記の更新アルゴリズムを実現する際に必要となるメモリ容量を大幅に削減することが可能になる。

［２−３：評価値予測装置１００の動作］
次に、図１９を参照しながら、評価値予測装置１００の動作について述べ、本実施形態のフィルタリング手法に係る処理の流れについて説明する。図１９は、本実施形態のフィルタリング手法に係る処理の流れについて説明するための説明図である。

まず、評価値予測装置１００は、事後分布算出部１０３の機能により、評価値データベース１０１から既知の評価値｛ｙ_ｉｊ｝を取得し、特徴量データベース１０２から特徴ベクトル｛ｘ_ｕｉ｝｛ｘ_ｖｊ｝を取得する（Ｓｔｅｐ．１）。次いで、評価値予測装置１００は、事後分布算出部１０３の機能により、確率モデルに含まれるパラメータを初期化する（Ｓｔｅｐ．２）。次いで、評価値予測装置１００は、事後分布算出部１０３の機能により、Ｓｔｅｐ．１で取得した既知の評価値｛ｙ_ｉｊ｝、特徴ベクトル｛ｘ_ｕｉ｝｛ｘ_ｖｊ｝を変分ベイズ推定アルゴリズムに入力し、各パラメータの変分事後分布を算出する（Ｓｔｅｐ．３）。

Ｓｔｅｐ．３で算出された変分事後分布は、事後分布算出部１０３から評価値予測部１０５に入力される。次いで、評価値予測装置１００は、評価値予測部１０５の機能により、Ｓｔｅｐ．３で算出された変分事後分布から、未知の評価値の期待値（予測評価値）を算出する（Ｓｔｅｐ．４）。ここで算出された予測評価値は、予測評価値データベース１０６に格納される。次いで、評価値予測装置１００は、推薦部１０７の機能により、Ｓｔｅｐ．４で算出された予測評価値が高いアイテムをユーザに推薦する（Ｓｔｅｐ．５）。

以上説明したように、本実施形態に係るフィルタリング手法は、行列分解ベース協調フィルタリングの要素を含みつつ、既知の特徴ベクトルを考慮した新たなフィルタリング手法である。そのため、ユーザ数やアイテム数が少なかったり、既知の評価値が少ない状況下においても、高い推定精度を実現することが可能になる。

（応用例）
これまで、ユーザとアイテムの組み合わせに対する評価値を対象に、未知の評価値を予測する方法について説明してきた。しかし、本手法は、あるアイテム群Ａのアイテムと、あるアイテム群Ｂのアイテムとの組み合わせに対して付される任意のラベルを対象に、未知のラベルを予測する任意の方法に応用することが可能である。

（例１）本手法は、ユーザとアイテムの組み合わせに対して、ユーザのアイテムに対する評価値や購入確率を予測して推薦するシステムに応用することができる。この場合、ユーザの特徴量としては、例えば、年齢、性別、職業、出身地などが利用される。一方、アイテムの特徴量としては、例えば、ジャンル、著者、出演者、年代などが利用される。

（例２）また、本手法は、ユーザと疾患の組み合わせに対して、ユーザが疾患にかかる確率を予測するシステムに応用することができる。この場合、ユーザの特徴量としては、例えば、年齢、性別、生活習慣、遺伝子に基づく特徴量などが利用される。なお、遺伝子に基づく特徴量のみを利用すれば、遺伝子と疾患の対応付けを行うシステムに応用することができる。

（例３）また、本手法は、銘柄と市場の組み合わせに対して、銘柄の価格を予測するシステムに応用することができる。この場合、銘柄の特徴量としては、例えば、企業の財務諸表に基づく特徴量や、市場平均や同業他社の価格などの時刻に依存した特徴量などが利用される。

（例４）また、本手法は、ユーザとコンテンツの組み合わせに対して、ユーザのコンテンツに対する評価語を予測して、単語に合ったコンテンツを提示するシステムに応用することができる。この場合、コンテンツの特徴量としては、例えば、画像特徴量や１２音解析により得られた特徴量などが利用される。

（例５）また、本手法は、ユーザとユーザの組み合わせに対して、ユーザ間のつながりやすさを予測するＳＮＳ支援システムに応用することができる。この場合、ユーザの特徴量としては、例えば、年齢、性別、日記、友人の特徴量などが利用される。

（例６）また、本手法は、画像と単語の組み合わせに対して、画像に単語が指す物体が存在するか否かを予測するシステムに応用することもできる。

このように、本手法は、多様なアイテム群Ａ、Ｂの組み合わせに対して付されるラベルを予測するシステムに応用することが可能である。

以上、本発明の第１実施形態について説明した。

＜３：第２実施形態＞
次に、本発明の第２実施形態について説明する。本実施形態は、上記の第１実施形態を時系列データの予測に応用した時系列解析方法に関する。

時系列解析方法としては、例えば、カルマンフィルタが知られている。カルマンフィルタは、誤差のある観測値を用いて、時間的に変化する量を推定するために用いられる手法である。一方、本実施形態は、例えば、ユーザとアイテムの組み合わせに対する評価値の集合が時間的に変化する場合に、その集合の観測値から将来観測されるであろう評価値の集合を予測するシステムを実現することを目的としている。

なお、本実施形態で取り上げる上記のような目的は、カルマンフィルタを２次元に拡張しても達成することは困難である。例えば、ある時点における評価値の集合に未評価の要素が含まれていると、その要素に対応する将来の評価値をカルマンフィルタにより予測することはできない。そこで、本実施形態は、ある時点における評価値集合から次の時点における評価値集合を予測すると共に、次の時点における既知の評価値集合から、同じ時点における未知の評価値を予測する方法（以下、本手法）を提案する。

［３−１：評価値予測装置１３０の機能構成］
まず、図２２を参照しながら、本手法を実現することが可能な本実施形態に係る評価値予測装置１３０の機能構成について説明する。図２２は、本実施形態に係る評価値予測装置１３０の機能構成について説明するための説明図である。

図２２に示すように、評価値予測装置１３０は、主に、評価値データベース１３１と、特徴量データベース１３２と、事後分布算出部１３３と、パラメータ保持部１３４と、評価値予測部１３５とにより構成される。

評価値データベース１３１の構成は、上記の第１実施形態に係る評価値予測装置１００が有する評価値データベース１０１と実質的に同じである。但し、評価値データベース１３１には、ユーザとアイテムの組み合わせに対する評価値が時点毎に格納されている。また、後述する評価値予測部１３５により予測された評価値が評価値データベース１３１に格納される。一方、特徴量データベース１３２の構成は、上記の第１実施形態に係る評価値予測装置１００が有する特徴量データベース１０２と実質的に同じである。

上記の第１実施形態に係る評価値予測装置１００と本実施形態に係る評価値予測装置１３０との大きな違いは、事後分布算出部１３３が利用する確率モデルの違いにある。事後分布算出部１３３は、下記の式（３４）〜式（３６）で表現される確率モデルを利用する。なお、ｙ_ｉｊ（ｔ）は、時刻ｔにおける評価値ｙ_ｉｊを示す。また、ｕ_ｉ（ｔ），ｖ_ｊ（ｔ）は、時刻ｔにおける潜在特徴ベクトルｕ_ｉ，ｖ_ｊを示す。

上記の第１実施形態に係る確率モデル（上記の式（７）〜式（９））との大きな違いは、上記の式（８）及び式（９）に現れる特徴ベクトルｘ_ｕｉ，ｘ_ｖｊが前時刻（ｔ−１）における潜在特徴ベクトルｕ_ｉ（ｔ−１），ｖ_ｊ（ｔ−１）に置換されている点である。なお、初期（ｔ＝０）の時点では、ｕ_ｉ（０）＝ｘ_ｕｉ，ｖ_ｊ（０）＝ｘ_ｖｊとすればよい。その後は、上記の第１実施形態と同様に変分ベイズ推定アルゴリズムにより得られる潜在特徴ベクトルｕ_ｉ（ｔ−１），ｖ_ｊ（ｔ−１）（ｔ＞１）を利用して逐次的に潜在特徴ベクトルｕ_ｉ（ｔ），ｖ_ｊ（ｔ）の分布を求めていけばよい。潜在特徴ベクトルｕ_ｉ（ｔ），ｖ_ｊ（ｔ）の分布が得られれば、時刻ｔにおける評価値ｙ_ｉｊの期待値が得られる。つまり、逐次的に評価値集合の未評価要素が予測される。

なお、潜在特徴ベクトルｕ_ｉ（ｔ），ｖ_ｊ（ｔ）の変分事後分布を算出するための変分ベイズ推定アルゴリズムは上記の第１実施形態と実質的に同じであるため、これら変分事後分布の算出方法については詳細な説明を省略する。このようにして得られた評価値集合の時系列データは、例えば、ユーザの嗜好変化を捉えるために利用することができる。また、ユーザの嗜好変化に応じたアイテムの推薦に応用することも可能である。さらに、上記の第１実施形態と同様、様々な分野（上記の（例１）〜（例６）など）への応用も考えられる。

［３−２：評価値予測装置１３０の動作］
次に、図２３を参照しながら、評価値予測装置１３０の動作について説明する。図２３は、評価値予測装置１３０の動作について説明するための説明図である。

（初期処理ステップ）
まず、評価値予測装置１３０は、評価値データベース１３１から、時刻ｔ＝０（初期時点）における既知の評価値｛ｙ_ｉｊ｝を取得する。次いで、評価値予測装置１３０は、上記の第１実施形態と同様に、特徴量データベース１３２から特徴ベクトル｛ｘ_ｕｉ｝｛ｘ_ｖｊ｝を取得する。そして、評価値予測装置１３０は、上記の第１実施形態と同様の確率モデルに基づいて未知の評価値を予測し、その予測評価値を評価値データベース１３１に格納する。この時点で、時刻ｔ＝０については、全てのユーザとアイテムの組み合わせに対する評価値｛ｙ_ｉｊ｝が評価値データベース１３１に格納されたことになる。また、事後分布算出部１３３により時刻ｔ＝０の時点における潜在特徴ベクトル｛ｕ_ｉ（０）｝｛ｖ_ｊ（０）｝の変分事後分布が得られ、パラメータ保持部１３４に格納されている。

（逐次処理ステップ）
次いで、評価値予測装置１３０は、評価値データベース１３１から、時刻ｔ＝１における既知の評価値｛ｙ_ｉｊ｝を取得する。次いで、評価値予測装置１３０は、時刻ｔ＝０における潜在特徴ベクトル｛ｕ_ｉ（０）｝｛ｖ_ｊ（０）｝の変分事後分布から得られた時刻ｔ＝１における確率モデルを用いて、時刻ｔ＝１における各パラメータの変分事後分布を算出する。そして、評価値予測装置１３０は、算出した変分事後分布を用いて、時刻ｔ＝１における未知の評価値を予測し、その予測評価値を評価値データベース１３１に格納する。この時点で、時刻ｔ＝１については、全てのユーザとアイテムの組み合わせに対する評価値｛ｙ_ｉｊ｝が評価値データベース１３１に格納されたことになる。また、なお、事後分布算出部１３３により時刻ｔ＝１の時点における潜在特徴ベクトル｛ｕ_ｉ（１）｝｛ｖ_ｊ（１）｝の変分事後分布が得られ、パラメータ保持部１３４に格納されている。

上記の逐次処理ステップの処理を所定の時刻まで逐次的に繰り返すことにより、評価値集合｛ｙ_ｉｊ｝の時系列予測が実現される。上記説明からも明らかなように、本手法の場合、ある時点ｔにおける既知の評価値と、その前の時点（ｔ−１）における既知の評価値及び潜在特徴ベクトルから、時点ｔにおける未知の評価値が算出される。そのため、カルマンフィルタとは異なり、連続する時点において評価値が未入力の部分（ユーザとアイテムの組み合わせ）が存在しても、評価値を時系列予測することが可能である。

以上、本発明の第２実施形態について説明した。

＜４：ハードウェア構成例＞
上記の評価値予測装置１００、１３０が有する各構成要素の機能は、例えば、図２４に示す情報処理装置のハードウェア構成を用いて実現することが可能である。つまり、当該各構成要素の機能は、コンピュータプログラムを用いて図２４に示すハードウェアを制御することにより実現される。なお、このハードウェアの形態は任意であり、例えば、パーソナルコンピュータ、携帯電話、ＰＨＳ、ＰＤＡ等の携帯情報端末、ゲーム機、又は種々の情報家電がこれに含まれる。但し、上記のＰＨＳは、ＰｅｒｓｏｎａｌＨａｎｄｙ−ｐｈｏｎｅＳｙｓｔｅｍの略である。また、上記のＰＤＡは、ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔの略である。

図２４に示すように、このハードウェアは、主に、ＣＰＵ９０２と、ＲＯＭ９０４と、ＲＡＭ９０６と、ホストバス９０８と、ブリッジ９１０と、を有する。さらに、このハードウェアは、外部バス９１２と、インターフェース９１４と、入力部９１６と、出力部９１８と、記憶部９２０と、ドライブ９２２と、接続ポート９２４と、通信部９２６と、を有する。但し、上記のＣＰＵは、ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略である。また、上記のＲＯＭは、ＲｅａｄＯｎｌｙＭｅｍｏｒｙの略である。そして、上記のＲＡＭは、ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙの略である。

ＣＰＵ９０２は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ９０４、ＲＡＭ９０６、記憶部９２０、又はリムーバブル記録媒体９２８に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。ＲＯＭ９０４は、ＣＰＵ９０２に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ９０６には、例えば、ＣＰＵ９０２に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。

これらの構成要素は、例えば、高速なデータ伝送が可能なホストバス９０８を介して相互に接続される。一方、ホストバス９０８は、例えば、ブリッジ９１０を介して比較的データ伝送速度が低速な外部バス９１２に接続される。また、入力部９１６としては、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力部９１６としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。

出力部９１８としては、例えば、ＣＲＴ、ＬＣＤ、ＰＤＰ、又はＥＬＤ等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。但し、上記のＣＲＴは、ＣａｔｈｏｄｅＲａｙＴｕｂｅの略である。また、上記のＬＣＤは、ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙの略である。そして、上記のＰＤＰは、ＰｌａｓｍａＤｉｓｐｌａｙＰａｎｅｌの略である。さらに、上記のＥＬＤは、Ｅｌｅｃｔｒｏ−ＬｕｍｉｎｅｓｃｅｎｃｅＤｉｓｐｌａｙの略である。

記憶部９２０は、各種のデータを格納するための装置である。記憶部９２０としては、例えば、ハードディスクドライブ（ＨＤＤ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。但し、上記のＨＤＤは、ＨａｒｄＤｉｓｋＤｒｉｖｅの略である。

ドライブ９２２は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体９２８に記録された情報を読み出し、又はリムーバブル記録媒体９２８に情報を書き込む装置である。リムーバブル記録媒体９２８は、例えば、ＤＶＤメディア、Ｂｌｕ−ｒａｙメディア、ＨＤＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体９２８は、例えば、非接触型ＩＣチップを搭載したＩＣカード、又は電子機器等であってもよい。但し、上記のＩＣは、ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔの略である。

接続ポート９２４は、例えば、ＵＳＢポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ、ＲＳ−２３２Ｃポート、又は光オーディオ端子等のような外部接続機器９３０を接続するためのポートである。外部接続機器９３０は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダ等である。但し、上記のＵＳＢは、ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓの略である。また、上記のＳＣＳＩは、ＳｍａｌｌＣｏｍｐｕｔｅｒＳｙｓｔｅｍＩｎｔｅｒｆａｃｅの略である。

通信部９２６は、ネットワーク９３２に接続するための通信デバイスであり、例えば、有線又は無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ用の通信カード、光通信用のルータ、ＡＤＳＬ用のルータ、又は各種通信用のモデム等である。また、通信部９２６に接続されるネットワーク９３２は、有線又は無線により接続されたネットワークにより構成され、例えば、インターネット、家庭内ＬＡＮ、赤外線通信、可視光通信、放送、又は衛星通信等である。但し、上記のＬＡＮは、ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋの略である。また、上記のＷＵＳＢは、ＷｉｒｅｌｅｓｓＵＳＢの略である。そして、上記のＡＤＳＬは、ＡｓｙｍｍｅｔｒｉｃＤｉｇｉｔａｌＳｕｂｓｃｒｉｂｅｒＬｉｎｅの略である。

以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。

（備考）
上記のユーザは、第１アイテムの一例である。上記のアイテムは、第２アイテムの一例である。上記の潜在特徴ベクトルｕｉは、第１潜在ベクトルの一例である。上記の潜在特徴ベクトルｖｊは、第２潜在ベクトルの一例である。上記の特徴ベクトルｘｕｉは、第１特徴ベクトルの一例である。上記の特徴ベクトルｘｖｊは、第２特徴ベクトルの一例である。上記の回帰行列Ｄｕは、第１射影行列の一例である。上記の回帰行列Ｄｖは、第２射影行列の一例である。上記の事後分布算出部１０３は、推定部の一例である。上記の評価値予測部１０５は、予測部の一例である。

１０、２０、３０、４０、５０推薦システム
１１、２１、５１評価値データベース
３１、４１特徴量データベース
１２嗜好解析部
１３、２３、３３、４３、５４推薦部
２２、３２、４２特徴解析部
５２行列分解部
５３評価値予測部
１００、１３０評価値予測装置
１０１、１３１評価値データベース
１０２、１３２特徴量データベース
１０３、１３３事後分布算出部
１０４、１３４パラメータ保持部
１０５、１３５評価値予測部
１０６予測評価値データベース
１０７推薦部
１０８通信部
２００ネットワーク
３００ユーザ端末

Claims

複数の第１アイテムがそれぞれ潜在的に持つ特徴を表す複数の第１潜在ベクトルと、
複数の第２アイテムがそれぞれ潜在的に持つ特徴を表す複数の第２潜在ベクトルと、
前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、前記第１潜在ベクトルと前記第２潜在ベクトルとの内積で表現される評価値と、
複数の前記第１アイテムがそれぞれ持つ既知の特徴を表す複数の第１特徴ベクトルと、
複数の前記第２アイテムがそれぞれ持つ既知の特徴を表す複数の第２特徴ベクトルと、
前記第１特徴ベクトルを前記第１潜在ベクトルの空間に射影する第１射影行列と、
前記第２特徴ベクトルを前記第２潜在ベクトルの空間に射影する第２射影行列と、
を定義し、
前記第１射影行列による前記第１特徴ベクトルの射影値を期待値とする正規分布によって前記第１潜在ベクトルを表現し、前記第２射影行列による前記第２特徴ベクトルの射影値を期待値とする正規分布によって前記第２潜在ベクトルを表現し、
前記第１特徴ベクトル、前記第２特徴ベクトル、及び既知の前記評価値を学習データとしてベイズ推定を実行し、前記第１潜在ベクトル、前記第２潜在ベクトル、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定部と、
前記パラメータ群の事後分布に基づいて未知の前記評価値の分布を算出する予測部と、
を備える、
評価予測装置。
前記予測部は、前記パラメータ群の事後分布に基づいて前記未知の評価値の期待値を算出する、
請求項１に記載の評価予測装置。
前記予測部によって算出された前記未知の評価値の期待値が所定値よりも大きい場合に、当該未知の評価値に対応する第２アイテムを当該未知の評価値に対応する第１アイテムの推薦先に決定する推薦先決定部をさらに備える、
請求項２に記載の評価予測装置。
前記第２アイテムはユーザを表し、
前記推薦先決定部によって第１アイテムの推薦先が決定された場合に、当該第１アイテムの推薦先に対応するユーザに当該第１アイテムを推薦する推薦部をさらに備える、
請求項３に記載の評価予測装置。
時刻ｔにおいて、Ｎ個の第１アイテムがそれぞれ潜在的に持つ特徴を表すＮ個の第１潜在ベクトルｕ_ｉ（ｔ）（ｉ＝１，…，Ｎ）と、
時刻ｔにおいて、Ｍ個の第２アイテムがそれぞれ潜在的に持つ特徴を表すＭ個の第２潜在ベクトルｖ_ｊ（ｔ）（ｊ＝１，…，Ｍ）と、
前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、時刻ｔにおいて、前記第１潜在ベクトルｕ_ｉ（ｔ）と前記第２潜在ベクトルｖ_ｊ（ｔ）との内積で表現される評価値ｙ_ｉｊ（ｔ）と、
時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を、時刻ｔにおける前記第１潜在ベクトルｕ_ｉ（ｔ）の空間に射影する第１射影行列と、
時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を、時刻ｔにおける前記第２潜在ベクトルｖ_ｊ（ｔ）の空間に射影する第２射影行列と、
を定義し、
前記第１射影行列により時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）を表現し、前記第２射影行列により時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第２潜在ベクトルｖ_ｊ（ｔ）を表現し、
時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）、第２潜在ベクトルｖ_ｊ（ｔ−１）、及び評価値ｙ_ｉｊ（ｔ−１）を学習データとしてベイズ推定を実行し、時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）、第２潜在ベクトルｖ_ｊ（ｔ）、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定部と、
時刻ｔにおける前記パラメータ群の事後分布に基づいて時刻ｔにおける評価値ｙ_ｉｊ（ｔ）の期待値を算出する予測部と、
を備える、
評価予測装置。
前記予測部は、前記時刻ｔにおけるパラメータ群の事後分布に基づいて、時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）の期待値、第２潜在ベクトルｖ_ｊ（ｔ）の期待値、評価値ｙ_ｉｊ（ｔ）を算出し、
前記推定部は、前記第１射影行列により時刻（ｔ）における第１潜在ベクトルｕ_ｉ（ｔ）の期待値を射影した射影値を期待値とする正規分布によって時刻（ｔ＋１）における第１潜在ベクトルｕ_ｉ（ｔ＋１）を表現し、前記第２射影行列により時刻ｔにおける第２潜在ベクトルｖ_ｊ（ｔ）の期待値を射影した射影値を期待値とする正規分布によって時刻（ｔ＋１）における第２潜在ベクトルｖ_ｊ（ｔ＋１）を表現し、
時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）、第２潜在ベクトルｖ_ｊ（ｔ）、及び評価値ｙ_ｉｊ（ｔ）を学習データとして変分ベイズ推定を実行し、時刻（ｔ＋１）における第１潜在ベクトルｕ_ｉ（ｔ＋１）、第２潜在ベクトルｖ_ｊ（ｔ＋１）、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出し、
前記予測部は、時刻（ｔ＋１）における前記パラメータ群の事後分布に基づいて時刻（ｔ＋１）における評価値ｙ_ｉｊ（ｔ＋１）の期待値を算出する、
請求項５に記載の評価予測装置。
前記予測部によって算出された評価値ｙ_ｉｊ（ｔ＋１）の期待値が所定値よりも大きい場合に、当該評価値ｙ_ｉｊ（ｔ＋１）に対応する第２アイテムを当該評価値ｙ_ｉｊ（ｔ＋１）に対応する第１アイテムの推薦先に決定する推薦先決定部をさらに備える、
請求項６に記載の評価予測装置。
前記第２アイテムはユーザを表し、
前記推薦先決定部によって第１アイテムの推薦先が決定された場合に、当該第１アイテムの推薦先に対応するユーザに当該第１アイテムを推薦する推薦部をさらに備える、
請求項７に記載の評価予測装置。
複数の第１アイテムがそれぞれ潜在的に持つ特徴を表す複数の第１潜在ベクトルと、
複数の第２アイテムがそれぞれ潜在的に持つ特徴を表す複数の第２潜在ベクトルと、
前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、前記第１潜在ベクトルと前記第２潜在ベクトルとの内積で表現される評価値と、
複数の前記第１アイテムがそれぞれ持つ既知の特徴を表す複数の第１特徴ベクトルと、
複数の前記第２アイテムがそれぞれ持つ既知の特徴を表す複数の第２特徴ベクトルと、
前記第１特徴ベクトルを前記第１潜在ベクトルの空間に射影する第１射影行列と、
前記第２特徴ベクトルを前記第２潜在ベクトルの空間に射影する第２射影行列と、
を定義し、
前記第１射影行列による前記第１特徴ベクトルの射影値を期待値とする正規分布によって前記第１潜在ベクトルを表現し、前記第２射影行列による前記第２特徴ベクトルの射影値を期待値とする正規分布によって前記第２潜在ベクトルを表現し、
前記第１特徴ベクトル、前記第２特徴ベクトル、及び既知の前記評価値を学習データとしてベイズ推定を実行し、前記第１潜在ベクトル、前記第２潜在ベクトル、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定ステップと、
前記パラメータ群の事後分布に基づいて未知の前記評価値の分布を算出する予測ステップと、
を含む、
評価予測方法。
時刻ｔにおいて、Ｎ個の第１アイテムがそれぞれ潜在的に持つ特徴を表すＮ個の第１潜在ベクトルｕ_ｉ（ｔ）（ｉ＝１，…，Ｎ）と、
時刻ｔにおいて、Ｍ個の第２アイテムがそれぞれ潜在的に持つ特徴を表すＭ個の第２潜在ベクトルｖ_ｊ（ｔ）（ｊ＝１，…，Ｍ）と、
前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、時刻ｔにおいて、前記第１潜在ベクトルｕ_ｉ（ｔ）と前記第２潜在ベクトルｖ_ｊ（ｔ）との内積で表現される評価値ｙ_ｉｊ（ｔ）と、
時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を、時刻ｔにおける前記第１潜在ベクトルｕ_ｉ（ｔ）の空間に射影する第１射影行列と、
時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を、時刻ｔにおける前記第２潜在ベクトルｖ_ｊ（ｔ）の空間に射影する第２射影行列と、
を定義し、
前記第１射影行列により時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）を表現し、前記第２射影行列により時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第２潜在ベクトルｖ_ｊ（ｔ）を表現し、
時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）、第２潜在ベクトルｖ_ｊ（ｔ−１）、及び評価値ｙ_ｉｊ（ｔ−１）を学習データとしてベイズ推定を実行し、時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）、第２潜在ベクトルｖ_ｊ（ｔ）、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定ステップと、
時刻ｔにおける前記パラメータ群の事後分布に基づいて時刻ｔにおける評価値ｙ_ｉｊ（ｔ）の期待値を算出する予測ステップと、
を含む、
評価予測方法。
複数の第１アイテムがそれぞれ潜在的に持つ特徴を表す複数の第１潜在ベクトルと、
複数の第２アイテムがそれぞれ潜在的に持つ特徴を表す複数の第２潜在ベクトルと、
前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、前記第１潜在ベクトルと前記第２潜在ベクトルとの内積で表現される評価値と、
複数の前記第１アイテムがそれぞれ持つ既知の特徴を表す複数の第１特徴ベクトルと、
複数の前記第２アイテムがそれぞれ持つ既知の特徴を表す複数の第２特徴ベクトルと、
前記第１特徴ベクトルを前記第１潜在ベクトルの空間に射影する第１射影行列と、
前記第２特徴ベクトルを前記第２潜在ベクトルの空間に射影する第２射影行列と、
を定義し、
前記第１射影行列による前記第１特徴ベクトルの射影値を期待値とする正規分布によって前記第１潜在ベクトルを表現し、前記第２射影行列による前記第２特徴ベクトルの射影値を期待値とする正規分布によって前記第２潜在ベクトルを表現し、
前記第１特徴ベクトル、前記第２特徴ベクトル、及び既知の前記評価値を学習データとしてベイズ推定を実行し、前記第１潜在ベクトル、前記第２潜在ベクトル、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定機能と、
前記パラメータ群の事後分布に基づいて未知の前記評価値の分布を算出する予測機能と、
をコンピュータに実現させるためのプログラム。
時刻ｔにおいて、Ｎ個の第１アイテムがそれぞれ潜在的に持つ特徴を表すＮ個の第１潜在ベクトルｕ_ｉ（ｔ）（ｉ＝１，…，Ｎ）と、
時刻ｔにおいて、Ｍ個の第２アイテムがそれぞれ潜在的に持つ特徴を表すＭ個の第２潜在ベクトルｖ_ｊ（ｔ）（ｊ＝１，…，Ｍ）と、
前記第１アイテムと前記第２アイテムとの各組み合わせに対応し、時刻ｔにおいて、前記第１潜在ベクトルｕ_ｉ（ｔ）と前記第２潜在ベクトルｖ_ｊ（ｔ）との内積で表現される評価値ｙ_ｉｊ（ｔ）と、
時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を、時刻ｔにおける前記第１潜在ベクトルｕ_ｉ（ｔ）の空間に射影する第１射影行列と、
時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を、時刻ｔにおける前記第２潜在ベクトルｖ_ｊ（ｔ）の空間に射影する第２射影行列と、
を定義し、
前記第１射影行列により時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）を表現し、前記第２射影行列により時刻（ｔ−１）における第２潜在ベクトルｖ_ｊ（ｔ−１）を射影した射影値を期待値とする正規分布によって時刻ｔにおける第２潜在ベクトルｖ_ｊ（ｔ）を表現し、
時刻（ｔ−１）における第１潜在ベクトルｕ_ｉ（ｔ−１）、第２潜在ベクトルｖ_ｊ（ｔ−１）、及び評価値ｙ_ｉｊ（ｔ−１）を学習データとしてベイズ推定を実行し、時刻ｔにおける第１潜在ベクトルｕ_ｉ（ｔ）、第２潜在ベクトルｖ_ｊ（ｔ）、前記第１射影行列、及び前記第２射影行列を含むパラメータ群の事後分布を算出する推定機能と、
時刻ｔにおける前記パラメータ群の事後分布に基づいて時刻ｔにおける評価値ｙ_ｉｊ（ｔ）の期待値を算出する予測機能と、
をコンピュータに実現させるためのプログラム。