JP5483576B2 - 推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラム - Google Patents

推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラム Download PDF

Info

Publication number
JP5483576B2
JP5483576B2 JP2010131407A JP2010131407A JP5483576B2 JP 5483576 B2 JP5483576 B2 JP 5483576B2 JP 2010131407 A JP2010131407 A JP 2010131407A JP 2010131407 A JP2010131407 A JP 2010131407A JP 5483576 B2 JP5483576 B2 JP 5483576B2
Authority
JP
Japan
Prior art keywords
user
item
content
recommended
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010131407A
Other languages
English (en)
Other versions
JP2011257955A (ja
Inventor
彰 中山
仁志 瀬下
聡 深田
達郎 石田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010131407A priority Critical patent/JP5483576B2/ja
Publication of JP2011257955A publication Critical patent/JP2011257955A/ja
Application granted granted Critical
Publication of JP5483576B2 publication Critical patent/JP5483576B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ユーザの嗜好に応じたアイテムを推薦するための推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラムに関する。
協調フィルタリングとは、多くのユーザの嗜好情報を蓄積し、あるユーザと嗜好の類似した他のユーザの情報を用いて、該当ユーザにアイテムやコンテンツを推薦する技術である。これらの技術は、利用者間型とアイテム間型に分類される。利用者間型は、推薦を受けるユーザ(以下「推薦ユーザ」と記載)と嗜好パターンが似ているサンプルとなるユーザ(以下「標本ユーザ」と記述する)をまず見つけ、その標本ユーザが好むアイテム群を推薦ユーザへの推薦候補とする技術である。利用者間型の実装では、ユーザ同士の類似度を、同じアイテムにつけた評価をピアソン相関、順位相関等の相関係数を用いて表す。また、嗜好の予測には、推薦ユーザに対して類似度の高い標本ユーザを抽出し、そのアイテムへの評価値を、標本ユーザと推薦ユーザ間の類似度で重みを付けし、それらの評価値の加重平均値を嗜好予測として用いる。嗜好予測値の大きなものから、推薦アイテムとして推薦ユーザへの推薦を行う。アイテム推薦の際には、推薦ユーザに提示する表示画面の広さに制約もあるため、小さな予測値を持つアイテムを削除したり、上位3〜10個程度のアイテムを表示するように画面構成を行う。
アイテム間型では、不特定多数利用者に同じような評価を受けているアイテムは似ており、関心があるアイテムの類似アイテムに利用者は関心を持つという仮定を置き、推薦ユーザの直近の利用履歴にあるアイテムに類似しているアイテムを推薦するものである。アイテム間型の実装としては、アイテムの利用ユーザの共起性等でアイテム間の類似度を測り、推薦ユーザの直近の利用履歴にあるアイテムの類似アイテムの推薦を行う(非特許文献1参照)。
上嶌敏弘, "推薦システムのアルゴリズム(2)," 人工知能学会誌 23巻1号, pp.89−103, 2008年1月
しかしながら、特許文献1の手法では、利用者間型の推薦方法を用いる場合、アイテムへの評価値の加重平均値を利用するため、新規アイテムがコンテンツ登録された場合など、新規アイテムへの評価ログが少ない段階においては、新規アイテム以外の他のアイテムの評価値が新規アイテムに比較して大きな値を持つと考えられるため、推薦として表示されないという問題があった。
アイテム間型の推薦方法を用いる場合、アイテムの利用ユーザの共起性などでアイテム間の類似度を測るため、利用者間型の推薦方法を用いる場合と同様に、新規アイテムへの評価ログが少ない段階においては、新規アイテム以外の他のアイテムへの類似度が新規アイテムに比較して大きな値を持つとかんがえられるため、推薦として表示されないという問題があった。
上記2つの問題はコールドスタート問題として知られている。
従来そのような場合は、特定利用者のプロファイルを用いる直接指定型内容ベースフィルタリングが用いられてきたが、そのための新規アイテムの内容の解析や、また新規アイテムについて記述する「メタデータ」の処理・作成および利用者のプロファイルの作成・管理が前提として必要となるという課題があった。また内容ベースフィルタリングを用いると、協調フィルタリングのような、類似アイテム、標本ユーザ間における発見性に富む推薦ができないといった課題もあった。
本発明の目的は、上記の問題を解決する為になされたものであり、新規アイテムへの評価ログが少ない段階においても、新規アイテムについて発見性に富み、かつ的確な推薦を行うことができる推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラムを提供することを目的とする。
上記問題点を解決する為、本発明の第1の特徴は、(イ)コンテンツにアクセスするユーザの嗜好情報を蓄積し、嗜好情報の類似した標本ユーザの情報を用いて、推薦サーバがアイテムを推薦すべき推薦ユーザにアイテムを推薦する推薦アイテムフィルタリング方法であって、コンテンツに人気及びブームの少なくとも片方が発生する直前の段階から閲覧を行っていた先進的利用者を先進的利用者抽出手段が抽出するステップと、(ロ)抽出された先進的利用者に対して、ユーザ重要度重みの算出式を用いて重み付けを行い、重み付け結果をユーザ重要度重みとして、利用者重みテーブル作成手段が利用者重みテーブル記憶部に格納するステップと、(ハ)各ユーザの各アイテムに対する評価値を列化したユーザ・アイテム間評価行列をユーザ・アイテム間評価行列作成手段が作成するステップと、(ニ)ユーザ・アイテム間評価行列の評価値に対し、ユーザ・アイテム間評価行列重み付け手段が、利用者重みテーブル記憶部より取得するユーザ重要度重みを重み付けするステップと、(ホ)標本ユーザと推薦ユーザ間の類似度を利用者類似度算出手段が算出するステップと、(ヘ)類似度値及び重み付けされた評価値を含む数値を基に、推薦ユーザへの各アイテムの推定評価値をアイテム評価推定値算出手段が算出するステップと、(ト)算出された各アイテムの推定評価値の内、推薦アイテム回答手段が推定評価値の高いものを推薦アイテムとして推薦ユーザに回答するステップとを備える推薦アイテムフィルタリング方法であることを要旨とする。
本発明の第1の特徴は更に、(チ)ユーザ重要度重みの算出式は、標本ユーザが所定コンテンツを閲覧した時刻から、所定コンテンツがいずれかのユーザに最初に閲覧された時刻を引いた値の単調減数関数、又は、標本ユーザが所定コンテンツを閲覧した時刻から、最初に所定単位時間当たりのアクセスが所定傾斜閾値を超えたブーム発生時刻を引いた値の単調減数関数のうち少なくとも一つを含む関数を用いること、(リ)ユーザ重要度重みの算出式は、コンテンツ閲覧回数の単調増加関数を更に含み、(ヌ)ユーザ重要度重みの算出式は、コンテンツの単位時間当たりの最高閲覧回数の単調増加関数を更に含むこと、(ル)アクセスが所定の絶対数閾値を超える人気コンテンツ群を人気コンテンツ抽出手段が抽出するステップと、所定単位時間当たりのアクセスが所定傾斜閾値を超えるブームコンテンツ群をブームコンテンツ抽出手段が抽出するステップとを更に備え、抽出するステップは、人気コンテンツ群又はブームコンテンツ群の少なくとも一つ以上を閲覧したユーザから先進的利用者を抽出することを加えても良い。
本発明の第2の特徴は、請求項1乃至5に記載の推薦アイテムフィルタリング方法を推薦サーバに実行させるための推薦アイテムフィルタリングプログラムであることを要旨とする。
本発明の推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラムによると、コンテンツ内における先進的利用者(イノベータ)の新規アイテムの評価値に基づき、新規アイテムが将来どの程度流行するのか推定できる。更にその推定に基づき協調フィルタリングを行うことで早期適応者(アーリアダプタ)、追随者(フォロワー)に対して、新規アイテムへの評価値が少ない場合でも、アイテムの推薦を適切に行うことができる。
本発明の実施の形態に係る推薦アイテムフィルタリングシステムの構造を示すシステム図である。 コンテンツサーバの内部構造を示す図である。 アクセスログのデータ構造を示す図である。 アイテム登録更新データの構造を示す図である。 推薦サーバの内部構造を示す図である。 利用者重み記憶装置の内部を示す図である。 ユーザ・アイテム間評価行列記憶部の内部を示す図である。 利用者類似度表記憶部の内部を示す図である。 先進的ユーザ抽出処理の動作を示すフロー図である。 推薦アイテム抽出処理の動作を示すフロー図である。 利用者重要度重み付加処理の動作を示すフロー図である。
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。ただし、図面は模式的なものであることに留意すべきである。
(実施の形態)
(推薦アイテムフィルタリングシステム)
本発明の実施の形態に係る推薦アイテムフィルタリングシステム100は、図1に示すように、コンテンツサーバ1、推薦サーバ2、ユーザ端末3a、3b、3c、インターネット回線網4等を備えている。
コンテンツサーバ1は、ユーザ端末3a〜3cからコンテンツ要求を受信し、要求されたコンテンツをユーザ端末3a〜3cに返信するサーバである。更に、本発明の実施の形態においてはコンテンツサーバ1は、コンテンツ要求をユーザ端末3a〜3cより受信した際に、推薦サーバ2に要求受信の旨を送信し、推薦サーバ2は、当該ユーザが好むと思われる推薦アイテムのデータを当該ユーザのユーザ端末3a〜3cに送信する。
推薦サーバ2は、コンテンツサーバ1がユーザ端末3a〜3cからコンテンツ要求を受信した際に、当該ユーザが好むと思われる推薦アイテムを選出し、ユーザ端末3a〜3cに送信する。
ユーザ端末3a〜3cは、コンテンツサーバ1や推薦サーバ2と通信を行うユーザが使用するパーソナルコンピュータ等の端末である。ユーザ端末3a〜3cは、コンテンツサーバ1または推薦サーバ2から提供されるコンテンツの表示や再生を行う為の入力装置、出力装置、通信制御装置、CPU、記憶装置、表示装置等を備えている。
インターネット回線網4は、アナログ回線、ディジタル回線、PHS回線、携帯電話回線、ケーブル回線等の公衆通信回線網である。インターネット回線網4は、コンテンツサーバ1とユーザ端末3a〜3c間、コンテンツサーバ1と推薦サーバ2間を接続する。尚、コンテンツサーバ1と推薦サーバ2はインターネット回線網4の他、有線無線の高速専用回線で接続されていても構わない。
(コンテンツサーバ)
コンテンツサーバ1は、図2に示すように、入力装置11、出力装置12、通信制御装置13、一時記憶装置14、中央制御装置(以下「CPU」と記載)15、アクセス記憶部16、アイテム登録更新記憶部17等を備える。
アクセス記憶部16は、ユーザ端末3a〜3cからコンテンツサーバ1へのアクセス記録を格納する。アクセス記憶部では図3に示すように、コンテンツへのアクセスの一回分が一レコードとして記録し、アクセスのあった「日時」、アクセスしてきたユーザの「ユーザID」、当該ユーザがアクセスした「コンテンツID」等をアクセス記録テーブルとして記憶する。
アイテム登録更新記憶部17は、コンテンツが新規登録、更新処理等された場合に新規に登録されたアイテムをその登録日と共に記憶する。アイテム登録更新記憶部17では図4に示すように「新規アイテムID」「登録日」等を新規アイテム登録テーブルとして記憶する。
CPU15は、アクセス記録生成手段15a、コンテンツ登録更新手段15b、コンテンツ要求受信手段15c、推薦アイテム要求送信手段15d、要求コンテンツ送信手段15eを備える。CPU15がこれらの手段を適宜実行することでプログラムは実行される。
アクセス記録生成手段15aは、ユーザ端末3a〜3cからコンテンツサーバ1へのアクセスがあった際に、そのアクセス記録を作成しアクセス記憶部16に格納する。
コンテンツ登録更新手段15bは、コンテンツが新規登録、更新処理等された場合に新規に登録されたアイテムをその登録日と共にアイテム登録更新記憶部17に格納する。
コンテンツ要求受信手段15cは、ユーザ端末3a〜3cからコンテンツサーバ1へのコンテンツ要求を受信する。
推薦アイテム要求送信手段15dは、コンテンツ要求を受信後、要求のあったユーザに推薦するアイテムを当該ユーザのユーザ端末に送信するように推薦サーバ2に依頼する。
要求コンテンツ送信手段15eは、当該ユーザに要求されたコンテンツを、当該ユーザのユーザ端末3a〜3cに送信する。
入力装置11は、キーボード、マウス、又はハードディスク等の外部記憶装置からの入力信号を受信するインタフェースである。出力装置12は、処理結果等を出力するための装置であり、具体的には液晶ディスプレイ、CRTディスプレイ、プリンタ等を指す。通信制御装置13は、外部の装置間においてデータを送受信する為の制御信号を生成する。一時記憶装置14は、演算処理等を行う際に使用する作業用メモリである。
(推薦サーバ)
推薦サーバ2は、図5に示すように、入力装置21、出力装置22、通信制御装置23、一時記憶装置24、CPU25、利用者重みテーブル記憶部26、ユーザ・アイテム間評価行列記憶部27、重み付けユーザ・アイテム間評価行列記憶部28、利用者類似度表記憶部29、人気コンテンツ記憶部30、ブームコンテンツ記憶部31等を備える。CPU25は、人気コンテンツ抽出手段25a、ブームコンテンツ抽出手段25b、先進的利用者抽出手段25c、利用者重みテーブル作成手段25d、推薦アイテム要求受信手段25e、ユーザ・アイテム間評価行列作成手段25f、ユーザ・アイテム間評価行列重み付け手段25g、利用者類似度算出手段25h、アイテム評価推定値算出手段25i、推薦アイテム回答手段25j等を備える。尚、CPU25がこれらの手段を適宜実行することでプログラムは実行される。
利用者重みテーブル記憶部26は、図6に示すように、ユーザを特定する「ユーザID」と各ユーザIDが保有する「ユーザ重要度重み」等から構成される利用者重みテーブルを格納する。
ユーザ・アイテム間評価行列記憶部27は、どのユーザがどのアイテムを何回閲覧したか等によりユーザ毎の各アイテムの評価を保有するユーザ・アイテム間評価行列テーブルを格納する。ユーザ・アイテム間評価行列テーブルは、図7に示すように、各「ユーザID」と各「アイテムID」から構成される表であり、この表内には特定ユーザ特定アイテムに対する評価値が格納される。尚、新規に追加されたアイテムで、当該行列のユーザから未だ評価がなされていないアイテムに対しては「Null」値が格納される。
重み付けユーザ・アイテム間評価行列記憶部28は、ユーザ・アイテム間評価行列記憶部27のユーザ・アイテム間評価行列テーブルに格納される各評価値に、ユーザ毎の重み付けを行った結果値を、重み付けユーザ・アイテム間評価値として格納する。重み付けは先進的利用者が閲覧したアイテムに対して特に重くなるように行う。先進的利用者とは、過去において、多くの人に評価されたアイテムを初期の段階で発見した利用者のことを指す。
利用者類似度表記憶部29は、図8に示すように、ユーザ・ユーザ間の類似度値を格納する利用者類似度テーブルを格納する。類似度値とは、二人のユーザaとユーザiが存在する場合の、ユーザaとユーザiが共通に評価したアイテムをピアソン相関関係があるとし、これを所定数式で算出したものである。数式の詳細については後述する。
人気コンテンツ記憶部30は、一定の閲覧数閾値を超えたユーザ間で人気のあるコンテンツ群を格納する。ブームコンテンツ記憶部31は、所定単位時間内にての所定の傾斜閾値を超えた、急激にユーザ間で人気の出てきたコンテンツ群を格納する。
人気コンテンツ抽出手段25aは、コンテンツサーバ1から送信されるアクセス記憶部16内のアクセス記録に基づいて、所定の絶対値閾値を超えて、多くのユーザに閲覧・再生された、つまりユーザ間にて、人気のあるコンテンツID群(以下「人気コンテンツ群」と記載)を求める。人気コンテンツ抽出手段25aは、所定閾値を超えた人気コンテンツ群の各々のコンテンツjのコンテンツID毎の閲覧回数をカウントし、一時記憶する。
ブームコンテンツ抽出手段25bは、コンテンツサーバ1から送信されるアクセス記憶部16内のアクセス記録テーブルデータに基づいて、所定閾値を超えて、所定単位時間τあたりに急激にユーザ数が増えた履歴を持つコンテンツ群(以下「ブームコンテンツ群」と記載)を抽出する。
先進的利用者抽出手段25cは、人気コンテンツ群とブームコンテンツ群の少なくとも一つ以上を閲覧したユーザの内、人気又はブームが発生する初期の段階から閲覧を行っていたユーザ、すなわち先進的利用者を抽出する。
利用者重みテーブル作成手段25dは、先進的利用者抽出手段25cにて抽出された先進的利用者に対して重み付けを行い、図6の利用者重みテーブル記憶部26内の利用者重みテーブルの「ユーザID」毎に「ユーザ重要度重み」を格納する。重み付けは新規コンテンツの閲覧の時期に応じて増減させる。人気又はブームの発生直前又は初期から人気コンテンツ群とブームコンテンツ群を閲覧していたユーザは先進的利用者であるとして重み付けを重くし、その後時間の経過と共に重み付を軽くするようにする。
推薦アイテム要求受信手段25eは、コンテンツサーバ1より所定ユーザに対する推薦アイテムの送信要求を受信する。
ユーザ・アイテム間評価行列作成手段25fは、図7のユーザ・アイテム間評価行列記憶部27内のユーザ・アイテム間評価行列テーブルを作成する。ユーザ・アイテム間評価値は、どのユーザがどのアイテムを何回閲覧したか等により決定する。
ユーザ・アイテム間評価行列重み付け手段25gは、ユーザ・アイテム間評価行列テーブル内のユーザ・アイテム間評価値に重み付け処理を行う。重み付け処理は図6の利用者重みテーブル記憶部26に格納されるユーザ重要度重み値をユーザ・アイテム間評価値に対して加算、乗算等することで行われ、この結果、重み付きユーザ・アイテム間評価値が算出される。尚、重み付け処理は直近に登録された又は更新されたアイテムに対してのみ行う。これらの新規アイテムに対して起こるコールドスタート問題を解決するためである。直近に登録又は更新されたアイテムであるか否かは、コンテンツサーバ1から送信される図4のアイテム登録更新記憶部17内の新規アイテム記録テーブルのデータより判断される。
利用者類似度算出手段25hは、二人のユーザが共通に評価したアイテムにはピアソン相関関係があるとの前提により、二人のユーザ間の類似度を所定数式を用いて算出し、利用者類似度表記憶部29内の利用者類似度テーブル内に格納する。所定数式については後述する。
アイテム評価推定値算出手段25iは、ユーザ類似度値や重み付きユーザ・アイテム間評価値を基に、所定数式を用いて、推薦ユーザへの各アイテムの推定評価値を算出する。各アイテムとは、新規アイテムも含めた全てのアイテムを指す。
推薦アイテム回答手段25jは、算出された各アイテムの推定評価値を昇順ソートし、推定評価値の高いもの、すなわち推薦ユーザが好むと推測されるものの上位いくつかを推薦アイテムとしてユーザ端末3a〜3cに対して送信する。
尚、その他の装置21〜24についてはコンテンツサーバ1と同様であるため説明を省略する。
(推薦アイテムフィルタリングシステムの動作)
次に、推薦アイテムフィルタリングシステム100の動作について説明する。推薦アイテムフィルタリングシステム100の動作は大きく先進的ユーザ抽出処理と推薦アイテム抽出処理の2つに分けられる。先進的ユーザ抽出処理では、推薦サーバ2が先進者ユーザを発見し、重み付け値を決定する。推薦アイテム抽出処理では、コンテンツサーバ1が、ユーザ端末3a〜3cからのコンテンツ要求に応じコンテンツをユーザクライアントに提供する際、推薦サーバ2に当該ユーザに対する推薦アイテムを要求し、推薦サーバ2がこれに応答する推薦アイテムをユーザ端末3a〜3cに送信する処理である。これら2つの処理は並列的に行われても構わないし、前処理として先進的ユーザ抽出処理を行い、その後推薦アイテム抽出処理を行うようにしても構わない。
以下これらの動作について詳細に説明する。
(先進的ユーザ抽出処理)
先進的ユーザ抽出処理について図9のフローチャートを用いて詳細に説明する。尚、前処理として、コンテンツサーバ1のアクセス記録生成手段15aは、ユーザ端末3a〜3cからのコンテンツへのアクセス毎に、アクセスの日時、ユーザID、コンテンツID等から成るアクセスログを作成し、アクセス記憶部16内のアクセス記録テーブルに格納しているのとする。
(a)ステップS101において、コンテンツサーバ1は所定間隔毎、又は推薦サーバ2からの要求により当該アクセス記録テーブルを推薦サーバ2に送信する。推薦サーバ2の人気コンテンツ抽出手段25aがコンテンツサーバ1よりアクセス記録テーブルデータを受信し、コンテンツjにユニークに付与されたコンテンツID毎に、その閲覧回数fjを集計し、所定の絶対数閾値Th_popを超えた、即ちユーザ間で人気のある人気コンテンツ群Item_popを抽出し、人気コンテンツ記憶部30へ記憶させる。
(b)ステップS102において、ブームコンテンツ抽出手段25bは、コンテンツサーバ1より図3のアクセス記録テーブルデータを受信し、当該アクセス記録テーブルに存在するコンテンツ集合Jの内、あるコンテンツjが最初に閲覧された時刻Tjを求め、ステップS103において、最初に閲覧された時刻Tjからある時間T(ただしT=l*τ)経過後までの閲覧履歴を抽出する。ステップS104において、ブームコンテンツ抽出手段25bは、閲覧時刻TjからT間を、更に所定の単位時間τに分割し、単位時間τ毎のコンテンツjの閲覧回数Vj=[v1, v2, …,vl]をカウントする。ステップS105において、所定の分割単位時間τにおいて、単位時間τあたりに急激にコンテンツjの閲覧回数が増えた、即ち所定の傾斜閾値Th_boomを超えたか否かを判定し、所定の傾斜閾値Th_boomを超えた分割単位時間τがあれば、ステップS106へ進み、これらのコンテンツjをブームコンテンツ群Item_boomとして抽出する。また最初にコンテンツjの閲覧増加傾斜が所定の傾斜閾値Th_boomを超えた時刻をTboom_jと定義する。分割単位時間τ毎のコンテンツjの閲覧回数、又最高閲覧回数はブームコンテンツ記憶部31にて格納する。尚、ステップS102〜S106の処理を全てのコンテンツjに対して行う(ステップS107)。
(c)ステップS108において、先進的利用者抽出手段25cは、人気コンテンツ記憶部30に格納される人気コンテンツ群Item_pop、ブームコンテンツ記憶部31に格納されるブームコンテンツ群Item_boomをコンテンツIDでデータ結合する(結合されたコンテンツ群を以下「結合コンテンツ群」と記載する)。尚、結合コンテンツ群は、「Item_pop ∪Item_boom」、「Item_pop ∩ Item_boom」等の条件式で求めるものとする。次にステップS109において、先進的利用者抽出手段25cは、図6の利用者重みテーブル記憶部26の利用者重みテーブルの初期化を行う。尚、利用者重みテーブルの準備は、全ての重みにデフォルト値を入力してもよいし、これまでの先進的ユーザとしての実績値を使用した利用者重み値を設定し使用してもよい。ステップS110において、先進的利用者抽出手段25cは、結合コンテンツ群に対し、ブーム初期T_earlythの段階でコンテンツjを閲覧でアクセスしていたユーザiを抽出する。抽出する区間は、ブーム発生直前のブーム黎明時Tjからブーム初期の頃 Tj+T_earlythまでの間に限定する。尚、ユーザiのコンテンツjへのアクセス時間はTijと表記する。
(d)ステップS110においては、アクセス記録テーブルデータに存在する全ユーザiの内のあるユーザiに対し重みwiを算出する。重みwiの算出は、ブーム黎明時Tj近くに閲覧したユーザほど大きく、Tjから時間的に後ろに閲覧したユーザほど軽くつけることが望ましい。また、増加する前に予測するという観点を入れるために、ブームが起こったと判断できる時刻Tboom_jからのユーザアクセス時刻を加味するようにしても良い。一例として、重みwiの算出には下記の式1を用いる。式1では全てのコンテンツ群Jについて加算を行う。
wi = Σp0(Tij-Tj)+ p1(Tij-Tboom_j)+p2(fj) +p3(max[Vj])+wi_init…(式1)
式1においては、コンテンツ閲覧回数fj、単位時間τ毎のコンテンツjの最高閲覧回数max[Vi]を用いる。関数p0、p1は単調減少関数、関数p2、p3は単調増加関数である。重み初期値wi_initとしては上述のようにこれまでの先進的ユーザの実績値や、初期値としての1.0を使用する。本計算により利用者重みテーブルを作成し、利用者重みテーブル記憶部26に格納する。尚、これらステップS110〜S111のコンテンツjに対する処理を全てのコンテンツ群Jに対して行う(ステップS112)。
(推薦アイテム抽出処理)
次に、推薦アイテム抽出処理について図10のフローチャートを用いて詳細に説明する。
(a)ステップS201においては、コンテンツサーバ1がユーザ端末3a〜3cの内のあるユーザaよりコンテンツ要求を受けると、当該ユーザaに相応しい推薦アイテムを送信するよう推薦サーバ2へ要求する。推薦サーバ2の推薦アイテム要求受信手段25eは、コンテンツサーバ1からのこのユーザaに対する推薦アイテムの要求を受信する。
(b)ステップS202においては、ユーザ・アイテム間評価行列作成手段25fが、図7に示すユーザ・アイテム間評価値行列Sを作成する。ユーザ・アイテム間評価値行列Sとは、n人の全ユーザの集合(x={1,2,…,n})を行、m種類の全アイテムの集合(y={1,2,…,m})を列としたもので、ユーザiのアイテムjへの評価値Sijを要素とする行列である。ユーザ・アイテム間評価行列作成手段25fは、図3のアクセス記憶部16に格納されるアクセス記録テーブルレコードをコンテンツサーバ1から送信してもらい、アクセス記録テーブルレコード一行毎に、Sijの値を、ユーザiがアイテムjを閲覧済みならば「+1」と、未閲覧ならば「Null」とする。複数回の閲覧についてもその回数に応じて、Sijの値を増加させる。また、すべてのSijに対して、対数関数等の増加関数を適用し、閲覧回数の極端に大きなアイテムSijについては、圧縮を行うようにしてもよい。尚、図7のユーザ・アイテム間評価値行列Sにおいては、ユーザAは先進的利用者iであり、アイテム2は新規アイテムであるとする。アイテム2は新規アイテムであるため、先進的利用者iのみが既に3回も閲覧をしているが、他のユーザにおいては未閲覧「Null」のままとなっている。
(c)ステップS203においては、ユーザ・アイテム間評価行列重み付け手段25gが、直近に登録又は更新されたアイテムのユーザ・アイテム間評価値行列Sに対して、ユーザ重要度重みを付加する処理を行う。S203の処理を図11のフローチャートを参照し詳細に説明すると、全てのアイテムJの内のあるアイテムjに本処理を行う場合、ステップS301においてコンテンツサーバ1より図4のアイテム登録更新記憶部17内の新規登録更新されたアイテムデータを取得し、ステップS302にて、取得したアイテムjが直近登録new_dateから所定期間以内に登録されたか判断する。
所定直近期間内に登録されているのならばステップS303にて式2のように当該アイテムjのユーザ・アイテム間評価値行列Sに対して、図6の利用者重みテーブル記憶部26のユーザ重要度重みを式2のように付加する。
Sij =Sij+wj …(式2)
このように重みを付加することで、ユーザ・アイテム間評価値行列Sに対して、ユーザの重要度を反映させることができる。本処理により図7の「Null」の欄には所定の推測値が入力され、重み付けユーザ・アイテム間評価行列記憶部28に格納される。尚、本計算では重みの加算を行っているが、未閲覧Sijの値を「1」等とし、重みを乗算して求めることも可能である。ステップS304では次のアイテムjのデータを取得するよう処理をおこなう。
(d)図10に戻り、ステップS204においては、利用者類似度算出手段25hが、下記のピアソン相関係数を用いた式3を用いてユーザ・ユーザ間の類似度値ρaiを算出する。尚、一方のユーザは先進的利用者であるユーザi、もう片方は推薦アイテムを提供すべき推薦ユーザaである。
Figure 0005483576
ただし、式3において、Yaiはユーザaとユーザiの二人が共通に評価したアイテムの集合であり、即ち下記の式4を満たすものとする。式5はYaiにおけるユーザa及びユーザiの評価値の平均である。
Yai=Ya ∩ Yi …(式4)
Figure 0005483576
尚、|Yai|≦1、即ちユーザaとユーザiが共通に評価したアイテムが1つ以下ならば、ピアソン相関は計算できないので、ρai=0とする。また式5のsi’はYaiにおけるユーザiの評価値の平均値である。
(e)ステップS205においては、アイテム評価推定値算出手段25iが、推薦アイテムを受けるユーザaのアイテムjへの評価値の推定値Sajを、式3で求めた類似度値ρai等を用いて下記の式6を用いて算出する。
Figure 0005483576
ただし、Xjはアイテムjを評価済みのユーザの集合である。
Figure 0005483576
式6における
Figure 0005483576
はYにおけるユーザiの評価値の平均値である。尚、a∈Xjなる状況では、Sajの推定が不要になるので想定しなくてもよい。
(f)ステップS206においては、推薦アイテム回答手段25jが、アイテムj毎の推定値Sajを昇順ソートし、ステップS207においては、推定値Sajが高い、上位の数アイテムからユーザaの推薦アイテムを選択し、推薦アイテム要求の回答結果として、ユーザ端末3a〜3cに対して返信する。
尚、本実施の形態においてはユーザ・アイテム間評価行列を用いて推薦アイテムへの評価値を求めているが、アイテム・アイテム間評価行列を用いて推薦アイテムへの評価値を求めるようにすることも可能である。
このように本発明によると、コンテンツ内における先進的利用者の新規アイテムの評価値に基づき、新規アイテムが将来どの程度流行するのか推測し、その推測に基づき協調フィルタリングを行うことで、新規アイテムへの評価値が少ない場合でも、アイテムの推薦を適切に行うことができる。
1…コンテンツサーバ
2…推薦サーバ
3a、3b、3c…ユーザ端末
4…インターネット回線網
11…入力装置
12…出力装置
13…通信制御装置
14…一時記憶装置
15…CPU
15a…アクセス記録生成手段
15b…コンテンツ登録更新手段
15c…コンテンツ要求受信手段
15d…推薦アイテム要求送信手段
16…アクセス記憶部
17…アイテム登録更新記憶部
21…入力装置
22…出力装置
23…通信制御装置
24…一時記憶装置
25…CPU
25a…人気コンテンツ抽出手段
25b…ブームコンテンツ抽出手段
25c…先進的利用者抽出手段
25d…利用者重みテーブル作成手段
25e…推薦アイテム要求受信手段
25f…ユーザ・アイテム間評価行列作成手段
25g…ユーザ・アイテム間評価行列重み付け手段
25h…利用者類似度算出手段
25i…アイテム評価推定値算出手段
25j…推薦アイテム回答手段
26…利用者重みテーブル記憶部
27…ユーザ・アイテム間評価行列記憶部
28…重み付けユーザ・アイテム間評価行列記憶部
29…利用者類似度表記憶部
30…人気コンテンツ記憶部
31…ブームコンテンツ記憶部
100…推薦アイテムフィルタリングシステム

Claims (6)

  1. コンテンツにアクセスするユーザの嗜好情報を蓄積し、前記嗜好情報の類似した標本ユーザの情報を用いて、推薦サーバがアイテムを推薦すべき推薦ユーザにアイテムを推薦する推薦アイテムフィルタリング方法であって、
    前記コンテンツに人気及びブームの少なくとも片方が発生する直前の段階から閲覧を行っていた先進的利用者を先進的利用者抽出手段が抽出するステップと、
    抽出された前記先進的利用者に対して、ユーザ重要度重みの算出式を用いて重み付けを行い、重み付け結果をユーザ重要度重みとして、利用者重みテーブル作成手段が利用者重みテーブル記憶部に格納するステップと、
    各ユーザの各アイテムに対する評価値を列化したユーザ・アイテム間評価行列をユーザ・アイテム間評価行列作成手段が作成するステップと、
    前記ユーザ・アイテム間評価行列の前記評価値に対し、ユーザ・アイテム間評価行列重み付け手段が、前記利用者重みテーブル記憶部より取得する前記ユーザ重要度重みを重み付けするステップと、
    前記標本ユーザと前記推薦ユーザ間の類似度を利用者類似度算出手段が算出するステップと、
    前記類似度値及び重み付けされた前記評価値を含む数値を基に、前記推薦ユーザへの各アイテムの推定評価値をアイテム評価推定値算出手段が算出するステップと、
    算出された前記各アイテムの推定評価値の内、推薦アイテム回答手段が前記推定評価値の高いものを推薦アイテムとして前記推薦ユーザに回答するステップ
    とを備えることを特徴とする推薦アイテムフィルタリング方法。
  2. 前記ユーザ重要度重みの算出式は、前記標本ユーザが所定コンテンツを閲覧した時刻から、前記所定コンテンツがいずれかのユーザに最初に閲覧された時刻を引いた値の単調減数関数、又は、前記標本ユーザが所定コンテンツを閲覧した時刻から、最初に所定単位時間当たりの前記アクセスが所定傾斜閾値を超えたブーム発生時刻を引いた値の単調減数関数のうち少なくとも一つを含む関数を用いることを特徴とする請求項1に記載の推薦アイテムフィルタリング方法。
  3. 前記ユーザ重要度重みの算出式は、コンテンツ閲覧回数の単調増加関数を更に含むことを特徴とする請求項2に記載の推薦アイテムフィルタリング方法。
  4. 前記ユーザ重要度重みの算出式は、コンテンツの単位時間当たりの最高閲覧回数の単調増加関数を更に含むことを特徴とする請求項2又は3に記載の推薦アイテムフィルタリング方法。
  5. 前記アクセスが所定の絶対数閾値を超える人気コンテンツ群を人気コンテンツ抽出手段が抽出するステップと、
    所定単位時間当たりの前記アクセスが所定傾斜閾値を超えるブームコンテンツ群をブームコンテンツ抽出手段が抽出するステップとを更に備え、
    前記抽出するステップは、
    前記人気コンテンツ群又はブームコンテンツ群の少なくとも一つ以上を閲覧したユーザから先進的利用者を抽出する
    ことを特徴とする請求項1乃至4のいずれかに記載の推薦アイテムフィルタリング方法。
  6. 請求項1乃至5のいずれかに記載の推薦アイテムフィルタリング方法を前記推薦サーバに実行させるための推薦アイテムフィルタリングプログラム。
JP2010131407A 2010-06-08 2010-06-08 推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラム Expired - Fee Related JP5483576B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010131407A JP5483576B2 (ja) 2010-06-08 2010-06-08 推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010131407A JP5483576B2 (ja) 2010-06-08 2010-06-08 推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラム

Publications (2)

Publication Number Publication Date
JP2011257955A JP2011257955A (ja) 2011-12-22
JP5483576B2 true JP5483576B2 (ja) 2014-05-07

Family

ID=45474072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010131407A Expired - Fee Related JP5483576B2 (ja) 2010-06-08 2010-06-08 推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラム

Country Status (1)

Country Link
JP (1) JP5483576B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5885558B2 (ja) * 2012-03-28 2016-03-15 株式会社ゼンリンデータコム 情報処理装置、及び情報処理方法
JP5891905B2 (ja) * 2012-03-29 2016-03-23 大日本印刷株式会社 サーバ装置、プログラム及び通信システム
KR101459537B1 (ko) * 2012-12-21 2014-11-11 서울대학교산학협력단 링크 예측을 이용한 소셜 추천 방법
CN104239338A (zh) * 2013-06-19 2014-12-24 阿里巴巴集团控股有限公司 信息推荐方法及装置
US9552055B2 (en) 2013-07-15 2017-01-24 Facebook, Inc. Large scale page recommendations on online social networks
JP6566515B2 (ja) * 2015-07-24 2019-08-28 大学共同利用機関法人情報・システム研究機構 アイテム推薦システム及びアイテム推薦方法
KR20170019944A (ko) * 2015-08-13 2017-02-22 정진호 상대 비교를 통한 상품 추천 서비스 방법 및 이를 위한 추천 서비스 장치
JP2020190948A (ja) * 2019-05-22 2020-11-26 ヤフー株式会社 推定装置、推定方法及び推定プログラム
JP6751803B1 (ja) * 2019-06-25 2020-09-09 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
CN110851737B (zh) * 2019-11-13 2024-03-12 哈工大机器人湖州国际创新研究院 推荐方法、装置、电子设备及计算机存储介质
CN113254773B (zh) * 2021-06-02 2023-07-07 南京邮电大学 一种基于预测值分析的新项目推荐方法
CN113449210B (zh) * 2021-07-01 2023-01-31 深圳市数字尾巴科技有限公司 基于时空特征的个性化推荐方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7440943B2 (en) * 2000-12-22 2008-10-21 Xerox Corporation Recommender system and method
JP4411417B2 (ja) * 2004-11-02 2010-02-10 独立行政法人産業技術総合研究所 統合情報サービスシステム
JP2008059099A (ja) * 2006-08-29 2008-03-13 Access Co Ltd 情報表示装置、情報表示プログラム、および情報表示システム

Also Published As

Publication number Publication date
JP2011257955A (ja) 2011-12-22

Similar Documents

Publication Publication Date Title
JP5483576B2 (ja) 推薦アイテムフィルタリング方法及び推薦アイテムフィルタリングプログラム
US11567989B2 (en) Media unit retrieval and related processes
JP6967612B2 (ja) 情報検索方法、装置及びシステム
US20220122099A1 (en) Analytical precursor mining for personalized recommendation
WO2015192667A1 (zh) 推荐广告的方法及广告推荐服务器
CN103348342A (zh) 基于用户话题简档的个人内容流
KR101947667B1 (ko) 비디오 검색용 시청 시간 클러스터링
US20160299899A1 (en) Generating a user-specific ranking model on a user electronic device
CN108460082B (zh) 一种推荐方法及装置,电子设备
EP2407897A1 (en) Device for determining internet activity
CN111159563B (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN107735766A (zh) 用于向计算设备的用户前摄性地提供推荐的系统和方法
US8396746B1 (en) Privacy preserving personalized advertisement delivery system and method
JP2010128927A (ja) レコメンド情報生成装置およびレコメンド情報生成方法
JP6059314B1 (ja) 推定装置、推定方法及び推定プログラム
EP3267386A1 (en) Method and apparatus for generating a content recommendation in a recommendation system
Liu et al. Online recommendations based on dynamic adjustment of recommendation lists
JP6470965B2 (ja) 広告選択装置、広告選択方法及びプログラム
JP2011257953A (ja) 日時別推薦アイテムフィルタリング方法及び日時別推薦アイテムフィルタリングプログラム
JP2018088051A (ja) 情報処理装置、情報処理方法、およびプログラム
WO2018202127A1 (zh) 信息推送方法及装置、存储介质和电子装置
CN111966887A (zh) 动态缓存方法及装置、电子设备、存储介质
CN112218114B (zh) 视频缓存控制方法、装置和计算机可读存储介质
CN113536131B (zh) 一种数据处理方法和装置,存储介质和电子设备
EP3267389A1 (en) Method and apparatus for selecting a network resource as a source of content for a recommendation system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121024

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130917

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140214

R150 Certificate of patent or registration of utility model

Ref document number: 5483576

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees