JP2005222297A - リコメンダシステムの評価方法 - Google Patents

リコメンダシステムの評価方法 Download PDF

Info

Publication number
JP2005222297A
JP2005222297A JP2004029357A JP2004029357A JP2005222297A JP 2005222297 A JP2005222297 A JP 2005222297A JP 2004029357 A JP2004029357 A JP 2004029357A JP 2004029357 A JP2004029357 A JP 2004029357A JP 2005222297 A JP2005222297 A JP 2005222297A
Authority
JP
Japan
Prior art keywords
recommender system
item
user
access history
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004029357A
Other languages
English (en)
Other versions
JP4212043B2 (ja
Inventor
Keiichiro Hoashi
啓一郎 帆足
Kazunori Matsumoto
一則 松本
Fumiaki Sugaya
史昭 菅谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2004029357A priority Critical patent/JP4212043B2/ja
Publication of JP2005222297A publication Critical patent/JP2005222297A/ja
Application granted granted Critical
Publication of JP4212043B2 publication Critical patent/JP4212043B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】実際にユーザに推薦結果を提示することなく、事前にリコメンダシステムの有効性を評価できるリコメンダシステムの評価方法を提供すること。
【解決手段】推薦対象アイテム情報31の内から各ユーザが利用したアイテムをアクセス履歴32として保持する。リコメンダシステムの評価に際し、リコメンダシステム1,2,・・・,nにより推薦されたアイテムを推薦結果一覧33(1〜n)として保持する。アクセス履歴ベクトル化処理34、推薦結果ベクトル化処理36は各アイテムに付随する属性情報に基づいてアクセス履歴32、推薦結果一覧33をそれぞれベクトル化する。生成された両ベクトルの類似度がベクトル類似度算出処理38で算出される。
【選択図】図3

Description

本発明は、リコメンダシステムの評価方法に関し、特に、各アイテムに対するユーザのアクセス履歴などに基づいてユーザの嗜好を推測し、アイテムを推薦して提示するリコメンダシステムの評価方法に関する。
従来、各アイテムに対する全ユーザのアクセス履歴を収集し、アクセス履歴におけるユーザ間の相関値や類似度に基づいて対象ユーザの未評価アイテムに対する予測評価値を算出し、算出された予測評価値に従ってアイテム(商品など)を推薦するリコメンダシステムが知られている。
リコメンダシステム自体に関する特許、論文は多数公開されており、例えば予測評価値の算出に協調フィルタリング手法を採用したリコメンダシステムが下記特許文献1,2に記載されている。
また、協調フィルタリング手法を採用したリコメンダシステムの有効性を測るための評価方式には、下記非特許文献1で提案されたGiven-n方式やAll-but-1方式がある。
Given-n方式は、評価データ内の各ユーザのアクセス履歴からn件の履歴を除く全ての履歴を取り除いた上で、取り除かれた履歴に対する評価値と実際に協調フィルタリングにより得られた評価値の差分を算出することにより評価を行う手法であり、All-but-1方式は、評価データ内の各ユーザの履歴から1件だけのアクセス履歴を取り除いた上で、取り除かれた履歴に対する評価値と実際に協調フィルタリングにより得られた評価値の差分を算出することにより評価を行う手法である。
Given-n方式は、All-but-1方式に比較してユーザのアクセス履歴が少ない状況下での協調フィルタリング手法の頑強性を評価できる方式であるとされている。
特開平9−265478号公報 特開平10−240749号公報 John S.Breese et al:"Empirical Analysis of Predictive Algorithms for Collaborative Filtering"Proceedings of the 14th Annual Conference of Uncertainty in Artificial Intelligence, pp.43-52,1998
リコメンダシステムの有効性を測るための評価指標は、ユーザに対して推薦されたアイテムがそのユーザに適合し、その結果、該ユーザがそのアイテムを購入・利用するか否か測るべきものである。
しかしながら、上記記非特許文献1で提案されたGiven-n方式やAll-but-1方式では、ユーザが既に評価した結果から構成される評価データ内のアクセス履歴から一部履歴を取り除いた履歴に対する評価値と、実際に協調フィルタリングにより得られた評価値の差分を算出することにより評価を行う手法であるため、ユーザにとって既知のアイテムに対する評価しか行われていない。
つまり、リコメンダシステムは、本来、ユーザにとって未知のアイテムを推薦するシステムであり、未知のアイテムをユーザが購入・利用するか否かを評価すべきであるにもかかわらず、従来手法では既知のアイテムに対する評価しか得られていないため、リコメンダシステムの有効性を厳密に表す評価が行われていないといえる。
リコメンダシステムの有効性を厳密に評価するためには、実験システムなどを構築し、実際にユーザに対してアイテムの推薦を行い、その推薦結果がどの程度ユーザに受け入れられるかを測定する必要がある。しかし、この方法では有効性評価に手間がかかる上、複数の協調フィルタリングアルゴリズムを評価したい場合にはそれぞれに対応した複数の実験システムを構築する必要があり、現実的でない。
本発明の目的は、上記課題を解決し、実際にユーザに推薦結果を提示することなく、事前にリコメンダシステムの有効性を評価できるリコメンダシステムの評価方法を提供することにある。
上記課題を解決するために、本発明は、各アイテムに対する全ユーザのアクセス履歴を利用して対象ユーザへの推薦アイテムを抽出して提示するリコメンダシステムの評価方法において、リコメンダシステムで利用される各ユーザのアクセス履歴とリコメンダシステムから出力される推薦アイテム一覧との間の類似度に基づいてリコメンダシステムの有効性評価を行う点に第1の特徴がある。
また、本発明は、前記アクセス履歴と前記推薦アイテム一覧を各アイテムに付与されている属性情報に基づいてそれぞれベクトル化し、これにより生成された両ベクトル間の類似度を算出することにより、前記アクセス履歴と前記推薦アイテム一覧との間の類似度を算出する点に第2の特徴がある。
また、本発明は、アイテムが着信メロディであり、属性情報がアーティストおよびジャンルの少なくとも一方を含む点に第3の特徴がある。
さらに、本発明は、アイテムが携帯サイトあるいは携帯コンテンツである点に第4の特徴がある。
本発明では、リコメンダシステムで利用される各ユーザのアクセス履歴とリコメンダシステムから出力される推薦アイテム一覧との間の類似度に基づいてリコメンダシステムの有効性評価を行うので、実際にユーザに推薦結果を提示することなく、事前にリコメンダシステムの有効性を評価できる。
また、複数の協調フィルタリングアルゴリズムを評価したい場合にも、各協調フィルタリングアルゴリズムによる推薦アイテム一覧を得るだけでよいので、それぞれに対応した複数の実験システムを構築する必要がない。
また、アクセス履歴と推薦アイテム一覧を各アイテムに付与された属性情報に基づいてベクトル化することにより、アクセス履歴と推薦アイテム一覧の類似度を容易に算出できる。
以下、本発明を説明する前に、まず、リコメンダシステム自体について説明する。図1は、本発明が適用されるリコメンダシステムのブロック図である。
ログ収集モジュール1は、ユーザa,b,c,dが各アイテムを利用したときの評価値を収集する。収集された評価値は、アクセス履歴2として蓄積される。スコア算出モジュール3は、ユーザの未評価アイテムに対する予測評価値を算出する。算出された予測評価値はスコア算出結果4として保持される。推薦アイテム抽出モジュール5は、スコア算出結果4に基づいて予測評価値が高いアイテムをユーザに推薦する。
図2は、スコア算出の動作概要の説明図である。ここでは、ユーザa,b,c,d、アイテム(イ),(ロ),(ハ),(ニ),(ホ),・・・,(ヘ)が存在する場合を想定している。図2に示すように、ユーザaのアイテム(イ),(ロ),(ハ),(ニ),(ホ)に対する評価値(「5,1,4,2,3」)が既に収集されており、ユーザb,c,dについてはアイテム(イ),(ロ),(ハ),(ニ),(ホ)に対する評価値に加えてさらにアイテム(ヘ)に対する評価値が収集されていると仮定する。なお、本例では、数値の大きさで評価程度まで表しているが、評価する場合を「1」、評価しない場合を「0」などによって表すようにしてもよい。
ユーザaのアイテム(ヘ)に対する予測評価値を算出する場合、つまり、ユーザaを対象ユーザとする場合、ユーザaと他のユーザb,c,dとの間で既に収集されている評価値の相関あるいは類似度を調べる。
本例の場合、ユーザaとユーザcの相関あるいは類似度が大である。従って、ユーザaのアイテム(ヘ)に対する評価値は、ユーザcのアイテム(ヘ)に対する評価値「5」程度になると予測できる。上記のようにして未評価アイテムに対する予測評価値が算出され、予測評価値の高い上位数件の未評価アイテムが推薦アイテムとして抽出される。これにより抽出された推薦アイテムがユーザaに提示される。
図3は、本発明の実施形態における処理過程の一例を示すフロー図である。リコメンダシステム1,2,・・・,nはそれぞれ図1に示したような構成を有する。アクセス履歴32は、ログ収集モジュール1により上記のようにして収集されたものであり、予め蓄積されている推薦対象アイテム情報31の内から各ユーザが利用したアイテムを表している。
また、リコメンダシステム1,2,・・・,nは、リコメンダシステムの評価に際し、予め蓄積されている推薦対象アイテム情報31の内からユーザに推薦するアイテムを抽出する。各々のリコメンダシステム1,2,・・・,nにより推薦されたアイテムは推薦結果一覧33(1〜n)として保持される。
推薦対象アイテム情報31には各アイテムに対する属性情報が含まれている。アクセス履歴ベクトル化処理34はこの属性情報に基づいてアクセス履歴32をベクトル化し、アクセス履歴ベクトル35を生成する。また、推薦結果ベクトル化処理36は属性情報に基づいて推薦結果一覧33をベクトル化し、推薦結果ベクトル37を生成する。
ベクトル類似度算出処理38は、アクセス履歴ベクトル35と推薦結果ベクトル37の類似度を算出し、類似度算出結果39を出力する。各リコメンダシステム1,2,・・・,nで推薦された推薦結果一覧33(1〜n)について類似度算出結果39を算出することによりリコメンダシステム1,2,・・・,nの有効性を評価することができる。
以下、アイテムが着信メロディである場合を例とした図4を参照して具体的に説明する。図4(a)は、各着信メロディに対して付与される属性情報の例を示す。各着信メロディには、ID番号の他に、タイトル、アーティスト、ジャンルなどの属性情報が付与される。このような情報は推薦対象アイテム情報31として予め蓄積される。
図4(b)は、協調フィルタリングにより抽出されてユーザに提示され、実際に該ユーザがダウンロードしたダウンロード履歴の例であり、ダウンロードされた着信メロディのID番号、日付、時刻を含む。これらの情報はアクセス履歴32として蓄積される。
アクセス履歴ベクトル化処理34は、ダウンロード履歴をアーティストおよびジャンルの属性情報に基づいてベクトル化し、アーティストの属性を表すベクトル(アーティストベクトル)とジャンルの属性を表すベクトル(ジャンルベクトル)を生成する。
ベクトルを〈 〉付き文字で表し、アクセス履歴ベクトル化処理34で生成されるアーティストベクトルを〈A〉、ジャンルベクトルを〈G〉とすると、アーティストベクトル〈A〉、ジャンルベクトル〈G〉の次元数はそれぞれ、下記(1)式で示すように、ジャンル、アーティストの総数によって決定される。ベクトル〈A〉、〈G〉の各要素には該当するダウンロード件数が格納される。

〈A〉=(宇多田ヒカル, SMAP, 氷川きよし, 渡る世間は鬼ばかり, Aerosmith, サザンオールスターズ,・・・)
〈G〉=(J-POP, 演歌, TVドラマ,洋楽、クラシック, アニメ,・・・) (1)
図4(b)のダウンロード履歴の例ではアーティストの属性がそれぞれ、「氷川きよし」,「ベートーベン」,「SMAP」,「Aerosmith」である着信メロディがそれぞれ1件ずつダウンロードされているため、下記(2)式のアーティストベクトル〈A〉が生成される。また、それぞれのジャンルの属性は「演歌」,「クラシック」,「J-POP」,「洋楽」であるため、下記(3)式のジャンルベクトル〈G〉が生成される。

〈A〉=(0,1,1,0,1,0,・・・) (2)
〈G〉=(1,1,0,1,1,0,・・・) (3)
一方、上記ダウンロード履歴を持つユーザに対し、例えばリコメンダシステム1から図4(c)に示すような推薦アイテム一覧1が提示されたとする。なお、推薦アイテム一覧にはユーザが既にダウンロードした既知のアイテムは含まれない。
推薦結果ベクトル化処理36は、アクセス履歴と同様に、推薦アイテム一覧1からアーティストベクトル〈A〉とジャンルベクトル〈G〉を生成する。図4(c)の推薦アイテム一覧の例では下記(4),(5)式のアーティストベクトル〈A〉とジャンルベクトル〈G〉が生成される。

〈A〉=(1,0,0,1,0,・・・) (4)
〈G〉=(2,0,1,0,0,・・・) (5)
次に、ダウンロード履歴から生成されたアーティストベクトル〈A〉と推薦アイテム一覧から生成されたアーティストベクトル〈A〉のベクトル類似度を算出することにより、ダウンロード履歴と推薦アイテム一覧間のアーティストでの類似度を測る。また、ダウンロード履歴から生成されたジャンルベクトル〈G〉と推薦アイテム一覧から生成されたジャンルベクトル〈G〉のベクトル類似度を算出することによりダウンロード履歴と推薦アイテム一覧間のジャンルでの類似度を測る。
なお、ベクトル類似度は、例えばベクトル〈A〉と〈A〉、または〈G〉と〈G〉がなす角のコサイン値、ベクトル〈A〉と〈A〉、または〈G〉と〈G〉間の距離などで算出できる。
これにより得られたアーティストおよびジャンルでの類似度により、ユーザに実際に推薦アイテムを提示することなくリコメンダシステムの有効性を評価することができ、その評価結果を考慮したシステム設計ができる。
例えば、アーティストでの類似度およびジャンルでの類似度がともに高い場合、ユーザの嗜好に適合しているが、発見性が低いシステムであるなどと評価でき、アーティストでの類似度が低く、ジャンルでの類似度が高い場合には、ジャンルでの類似度が高いのでユーザの嗜好に適合しており、アクセス履歴と異なるアーティストが推薦されるので発見性が高いシステムであるなどと評価できる。
以上、実施形態を説明したが、本発明は上記実施形態に限定されない。例えば、アクセス履歴と推薦アイテム一覧との間の類似度は、それらに付随する種々の情報に基づいて算出でき、アーティストやジャンルなどの属性情報に限られず、また、ベクトル化しての算出にも限られない。
さらに、アイテムは着信メロディに限らず、携帯サイトあるいは携帯コンテンツ(待ち受け画像など)などであってもよい。携帯サイトには種々のサービスを提供するものがあり、それらの携帯サイトをサービス分野、天気予報や交通案内やエンタテイメント(ゲームやカラオケなど)や株価情報などといったサービス内容により、あるいはさらに細かく分類して属性情報とすることができる。また、待ち受け画像の場合には画像の種類や内容を属性情報とすることができる。
本発明が適用されるリコメンダシステムのブロック図である。 リコメンダシステムにおけるスコア算出の動作概要の説明図である。 本発明の実施形態における処理過程の一例を示すフロー図である。 本発明の具体例を説明するための図である。
符号の説明
1・・・ログ収集モジュール、2,32・・・アクセス履歴、3・・・スコア算出モジュール、4・・・スコア算出結果、5・・・推薦アイテム抽出モジュール、31・・・推薦対象アイテム情報、33・・・推薦結果一覧、34・・・アクセス履歴ベクトルか処理、35・・・アクセス履歴ベクトル、36・・・推薦結果ベクトル化処理、37・・・推薦結果ベクトル、38・・・ベクトル類似度算出処理、39・・・類似度算出結果、a〜d・・・ユーザ、(イ)〜(ヘ)・・・アイテム

Claims (4)

  1. 各アイテムに対する全ユーザのアクセス履歴を利用して対象ユーザへの推薦アイテムを抽出して提示するリコメンダシステムの評価方法において、
    リコメンダシステムで利用される各ユーザのアクセス履歴とリコメンダシステムから出力される推薦アイテム一覧との間の類似度に基づいてリコメンダシステムの有効性評価を行うことを特徴とするリコメンダシステムの評価方法。
  2. 前記アクセス履歴と前記推薦アイテム一覧を各アイテムに付与されている属性情報に基づいてそれぞれベクトル化し、これにより生成された両ベクトル間の類似度を算出することにより、前記アクセス履歴と前記推薦アイテム一覧との間の類似度を算出することを特徴とする請求項1に記載のリコメンダシステムの評価方法。
  3. アイテムが着信メロディであり、属性情報がアーティストおよびジャンルの少なくとも一方を含むことを特徴とする請求項2に記載のリコメンダシステムの評価方法。
  4. アイテムが携帯サイトあるいは携帯コンテンツであることを特徴とする請求項1または2に記載のリコメンダシステムの評価方法。
JP2004029357A 2004-02-05 2004-02-05 リコメンダシステムの評価方法 Expired - Fee Related JP4212043B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004029357A JP4212043B2 (ja) 2004-02-05 2004-02-05 リコメンダシステムの評価方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004029357A JP4212043B2 (ja) 2004-02-05 2004-02-05 リコメンダシステムの評価方法

Publications (2)

Publication Number Publication Date
JP2005222297A true JP2005222297A (ja) 2005-08-18
JP4212043B2 JP4212043B2 (ja) 2009-01-21

Family

ID=34997877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004029357A Expired - Fee Related JP4212043B2 (ja) 2004-02-05 2004-02-05 リコメンダシステムの評価方法

Country Status (1)

Country Link
JP (1) JP4212043B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226880A (ja) * 2006-02-22 2007-09-06 Kenwood Corp 再生装置、検索方法、及び、コンピュータプログラム
JP2012014659A (ja) * 2010-07-05 2012-01-19 Ntt Communications Corp レコメンド装置、レコメンド方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226880A (ja) * 2006-02-22 2007-09-06 Kenwood Corp 再生装置、検索方法、及び、コンピュータプログラム
JP2012014659A (ja) * 2010-07-05 2012-01-19 Ntt Communications Corp レコメンド装置、レコメンド方法、及びプログラム

Also Published As

Publication number Publication date
JP4212043B2 (ja) 2009-01-21

Similar Documents

Publication Publication Date Title
US20200372369A1 (en) System and method for machine learning architecture for partially-observed multimodal data
US9836539B2 (en) Content quality filtering without use of content
CN108108821A (zh) 模型训练方法及装置
CN106484777B (zh) 一种多媒体数据处理方法以及装置
CN110598037B (zh) 一种图像搜索方法、装置和存储介质
JP2007102407A (ja) レコメンド方法およびシステムならびにレコメンドプログラムおよびその記憶媒体
Pereira et al. Why so many people? explaining nonhabitual transport overcrowding with internet data
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
JP2007287139A (ja) 消費者に製品を推奨するためのコンピュータ実施方法及びシステム
JP2007213401A (ja) ユーザ嗜好の音楽データに基づいてコミュニティを構成するコミュニティサイトサーバ及びプログラム
JP6472573B2 (ja) データ分析手法候補決定装置
KR20130055748A (ko) 콘텐츠 추천 시스템 및 방법
Vosoughi et al. Digital stylometry: Linking profiles across social networks
CN116595398A (zh) 基于元宇宙的资源智能匹配方法及相关装置
KR20170107868A (ko) 사용자 맥락, 추천 음악, 이용 행태로 구성된 데이터베이스를 활용한 음악 콘텐츠 추천 방법 및 시스템
JP2008203933A (ja) カテゴリ作成方法および装置、文書分類方法および装置
JP5730741B2 (ja) 話題推薦装置及び方法及びプログラム
CN112000776A (zh) 基于语音语义的话题匹配方法、装置、设备及存储介质
Bigdeli et al. Comparing accuracy of cosine-based similarity and correlation-based similarity algorithms in tourism recommender systems
Song et al. Semi-automatic construction of a named entity dictionary for entity-based sentiment analysis in social media
JP2008117122A (ja) 推薦情報検出提供装置および推薦情報検出提供方法ならびにそのプログラム
Galety et al. Personalized music recommendation model based on Machine Learning
JP4212043B2 (ja) リコメンダシステムの評価方法
US11410706B2 (en) Content pushing method for display device, pushing device and display device
JP5197491B2 (ja) 行動推薦装置及び方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080730

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081022

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081024

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4212043

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131107

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141107

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees