JP2014115839A - Content recommendation device and program - Google Patents
Content recommendation device and program Download PDFInfo
- Publication number
- JP2014115839A JP2014115839A JP2012269663A JP2012269663A JP2014115839A JP 2014115839 A JP2014115839 A JP 2014115839A JP 2012269663 A JP2012269663 A JP 2012269663A JP 2012269663 A JP2012269663 A JP 2012269663A JP 2014115839 A JP2014115839 A JP 2014115839A
- Authority
- JP
- Japan
- Prior art keywords
- content
- negative
- positive
- evaluation value
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、コンテンツ推薦装置、及びプログラムに関する。 The present invention relates to a content recommendation device and a program.
従来より、ある人物の興味に合致するテレビ番組や、ある人物が購入する可能性が高い商品を特定するための情報(目的評価値)を、本人、及び不特定多数の人物から収集した、別のコンテンツ集合に対する評価値のデータセット(参照評価値)を元に算出する技術がある。 Conventionally, TV programs that match a person's interests and information (objective evaluation values) for identifying products that are likely to be purchased by a person have been collected from the person and a large number of unspecified persons. There is a technique for calculating based on the evaluation value data set (reference evaluation value) for the content set.
不特定多数の人物について収集したコンテンツ集合に対する評価値のデータから、対象とする人物の評価値を予測する技術としては、不特定多数の人物について収集した評価値を参照し、嗜好が類似する人物のデータを参照、及び統合して、目的評価値を予測する手法(協調フィルタリング)が広く知られおり、実用化が進んでいる。しかしながら、与えられる参照評価値のデータに欠損値が多く含まれる場合、すなわち、参照評価値のテーブルが疎である場合には、目的評価値を予測可能なコンテンツが限定されるため、実用上、大きな問題となる。この問題は、一般的には「希薄問題」と呼ばれる。 As a technique for predicting the evaluation value of the target person from the evaluation value data for the content set collected for an unspecified number of people, refer to the evaluation values collected for an unspecified number of people and have similar preferences A method (collaborative filtering) for predicting the objective evaluation value by referring to and integrating the data is widely known, and its practical application is progressing. However, when a lot of missing values are included in the given reference evaluation value data, that is, when the reference evaluation value table is sparse, the content that can predict the target evaluation value is limited. It becomes a big problem. This problem is generally called the “sparse problem”.
希薄問題に対処可能な従来技術としては、例えば、グラフマイニングを用いた関連コンテンツの探索法がある(例えば非特許文献1参照)。この手法は、ユーザ参加型の音楽推薦サービスが収集したデータに基づいて、ある特定のユーザの嗜好に合致する楽曲を予測する技術として考案された手法である。この手法では、同サービスが提供する、各々のユーザの楽曲に対する評価値、ならびに、各楽曲についてのタグ情報(ジャンル)などを1つのグラフの形式に記述し、ユーザと楽曲との推移関係を、グラフマイニング法の一手法であるRWR法(Random Walk with Restart)を用いて推定することによって、目的のユーザの嗜好に合致したコンテンツを予測する。 As a conventional technique capable of dealing with the sparse problem, for example, there is a related content search method using graph mining (see, for example, Non-Patent Document 1). This technique is a technique devised as a technique for predicting music that matches the taste of a specific user based on data collected by a user participation type music recommendation service. In this method, the evaluation value for each user's music provided by the service and tag information (genre) for each music are described in one graph format, and the transition relationship between the user and the music is expressed as follows: By using the RWR method (Random Walk with Restart), which is one of the graph mining methods, the content that matches the target user's preference is predicted.
上述した従来技術によるRWR法は、解析対象のグラフのエッジに評価値を「重み」として記述する方法を採用する。このため、評価値が正の値と負の値の両方の値を取りうる場合には、どちらか一方の値(例えば、負の評価値)を無視して、残りの一方の評価値(例えば、正の評価値)のみしか利用していない。そのため従来技術によるRWR法では、目的評価値を高精度で予測できないので、目的のユーザの嗜好に合致したコンテンツを高精度に推定することができなかった。その結果、ユーザに嗜好に合致したコンテンツの推薦が得られない場合があり、ユーザの利便性が低いという問題があった。 The RWR method according to the related art described above employs a method of describing an evaluation value as a “weight” at an edge of a graph to be analyzed. For this reason, when the evaluation value can take both a positive value and a negative value, one of the values (for example, the negative evaluation value) is ignored, and the other evaluation value (for example, the negative value) Only positive evaluation value). Therefore, the RWR method according to the prior art cannot predict the target evaluation value with high accuracy, and therefore cannot accurately estimate the content that matches the target user's preference. As a result, the user may not be able to obtain content recommendations that match the user's preference, and there is a problem that user convenience is low.
本発明の一態様は、このような事情を考慮してなされたものであり、その目的は、コンテンツ推薦時におけるユーザの利便性を向上させることができるコンテンツ推薦装置、及びプログラムを提供することにある。 One aspect of the present invention has been made in view of such circumstances, and an object thereof is to provide a content recommendation device and a program that can improve the convenience of the user at the time of content recommendation. is there.
上述した課題を解決するために、本発明の一態様は、複数のコンテンツそれぞれに対する各ユーザの正の評価値を用いて、前記複数のコンテンツのうち、目的ユーザが評価していないコンテンツに対する正の評価値の予測確率値であるポジティブスコアを算出するポジティブスコア算出部と、前記複数のコンテンツそれぞれに対する各ユーザの負の評価値を用いて、前記複数のコンテンツのうち、前記目的ユーザが評価していないコンテンツに対する負の評価値の予測確率値であるネガティブスコアを算出するネガティブスコア算出部と、前記ポジティブスコア算出部が算出したポジティブスコアと前記ネガティブスコア算出部が算出したネガティブスコアとに基づいて、前記目的ユーザに推薦するコンテンツを決定する推薦コンテンツ決定部と、を備えることを特徴とするコンテンツ推薦装置である。 In order to solve the above-described problem, according to one aspect of the present invention, a positive evaluation value for a content that is not evaluated by a target user among the plurality of contents is obtained using a positive evaluation value of each user for each of the plurality of contents. Of the plurality of contents, the target user is evaluating using a positive score calculation unit that calculates a positive score that is a prediction probability value of the evaluation value and a negative evaluation value of each user for each of the plurality of contents. Based on a negative score calculation unit that calculates a negative score that is a predicted probability value of a negative evaluation value for no content, a positive score calculated by the positive score calculation unit, and a negative score calculated by the negative score calculation unit, Determination of recommended content for determining content recommended for the target user When a content recommendation apparatus comprising: a.
本発明の一態様は、上記のコンテンツ推薦装置において、前記推薦コンテンツ決定部は、前記ポジティブスコアと前記ネガティブスコアとに基づいて、前記目的ユーザが評価していない未評価コンテンツの評価値間の大小関係を推定し、該推定した大小関係に基づいて、前記目的ユーザに推薦するコンテンツを決定する。 According to an aspect of the present invention, in the content recommendation device, the recommended content determination unit may determine whether the evaluation value of the unevaluated content not evaluated by the target user is large or small based on the positive score and the negative score. A relationship is estimated, and content recommended to the target user is determined based on the estimated magnitude relationship.
本発明の一態様は、上記のコンテンツ推薦装置において、前記ポジティブスコア算出部は、前記各ユーザ間の嗜好の類似度と前記各ユーザの各コンテンツに対する正の評価値と前記コンテンツ間の類似度とを参照して、前記ポジティブスコアを算出し、前記ネガティブスコア算出部は、前記各ユーザ間の嗜好の類似度と前記各ユーザの各コンテンツに対する負の評価値と前記コンテンツ間の類似度とを参照して、前記ネガティブスコアを算出することを特徴とする。 One aspect of the present invention is the content recommendation device, wherein the positive score calculation unit includes a similarity degree of preference between the users, a positive evaluation value for each content of each user, and a similarity degree between the contents. The negative score calculation unit refers to the preference similarity between the users, the negative evaluation value for each content of each user, and the similarity between the contents. Then, the negative score is calculated.
本発明の一態様は、上記のコンテンツ推薦装置において、前記複数のコンテンツの各々に対する各ユーザの評価を示す評価値を、前記正の評価値の集合と前記負の評価値の集合に分割する分割部と、各コンテンツ、及び各ユーザをノードとし、前記正の評価値の集合を各ノードを接続するエッジ重みとして記述したポジティブグラフと、各コンテンツ、及び各ユーザをノードとし、前記負の評価値の集合を、各ノードを接続するエッジ重みとして記述したネガティブグラフとを作成する作成部とを更に備え、前記ポジティブスコア算出部は、前記ポジティブグラフに基づいて、前記ポジティブスコアを算出し、前記ネガティブスコア算出部は、前記ネガティブグラフに基づいて、前記ネガティブスコアを算出することを特徴とする。 One aspect of the present invention is the above content recommendation device, in which an evaluation value indicating an evaluation of each user for each of the plurality of contents is divided into the set of positive evaluation values and the set of negative evaluation values Section, each content and each user as a node, and a positive graph describing the set of positive evaluation values as edge weights connecting each node, and each content and each user as a node and the negative evaluation value And a creation unit that creates a negative graph describing the set of nodes as edge weights connecting each node, and the positive score calculation unit calculates the positive score based on the positive graph, and the negative score The score calculation unit calculates the negative score based on the negative graph.
また、上述した課題を解決するために、本発明の一態様は、コンピュータに、複数のコンテンツそれぞれに対する各ユーザの正の評価値を用いて、前記複数のコンテンツのうち、目的ユーザが評価していないコンテンツに対する正の評価値の予測確率値であるポジティブスコアを算出するポジティブスコア算出ステップと、前記複数のコンテンツそれぞれに対する各ユーザの負の評価値を用いて、前記複数のコンテンツのうち、前記目的ユーザが評価していないコンテンツに対する負の評価値の予測確率値であるネガティブスコアを算出するネガティブスコア算出ステップと、前記ポジティブスコア算出ステップで算出されたポジティブスコアと前記ネガティブスコア算出ステップで算出されたネガティブスコアとに基づいて、前記目的ユーザに推薦するコンテンツを決定する推薦コンテンツ決定ステップと、を実行させるためのプログラムである。 In order to solve the above-described problem, according to one embodiment of the present invention, a target user evaluates a plurality of contents using a positive evaluation value of each user for each of the plurality of contents. A positive score calculation step of calculating a positive score that is a predicted probability value of a positive evaluation value for a non-content, and a negative evaluation value of each user for each of the plurality of contents, and the purpose among the plurality of contents A negative score calculating step for calculating a negative score that is a predicted probability value of a negative evaluation value for content not evaluated by the user, a positive score calculated in the positive score calculating step, and a negative score calculating step Based on the negative score, the target user Is a program for executing the the recommended content determining step of determining a content to be recommended to.
この発明によれば、コンテンツ推薦時におけるユーザの利便性を向上させることができる。 According to the present invention, it is possible to improve the convenience for the user at the time of content recommendation.
以下、本発明の一実施形態を、図面を参照して説明する。まず、本実施形態の概要について説明する。本実施形態におけるコンテンツ推薦装置1は、ある同一のコンテンツ集合に対する不特定人物それぞれの評価値のデータ集合、並びに、先のコンテンツ集合に含まれる一部のコンテンツに対する特定の人物の評価値のデータ集合のセット(以後、「参照評価値」と呼ぶ)が与えられた条件の下で、先のコンテンツ集合のうち、特定人物の評価がまだ与えられていないコンテンツに対する評価値(以後、「目的評価値」と呼ぶ)を予測する。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. First, an outline of the present embodiment will be described. The
本実施形態におけるコンテンツ推薦装置1は、参照評価値が正の評価(例えば買いたい商品、または、見たい番組である度合い)と負の評価(例えば買いたくない商品、または、見たくない番組)との相反する2つの方向に沿った尺度が得られる場合において、それぞれの方向についての評価を統合的に評価し、解析する。それによって、コンテンツ推薦装置1は、高精度に目的評価値を推定することができる。特に、コンテンツ推薦装置1は、目的評価値の算出根拠である参照評価値に未評価のデータ、すなわち欠損値が多く存在する条件(以後、「疎な条件」と呼ぶ)であっても頑健な予測が可能である。
In the
本実施形態におけるコンテンツ推薦装置1は、同一、かつ大量なコンテンツ集合に対する不特定多数の人物の評価値を網羅的に調査することが難しい状況において、各々のコンテンツに対する評価値を、好意的な反応(以後、「正の評価」と呼ぶ)、並びに反好意的な反応(以後、「負の評価」と呼ぶ)を調査し、解析する。それによって、コンテンツ推薦装置1は、より高い精度で目的評価値を予測することができる。
In the situation where it is difficult to comprehensively investigate the evaluation values of an unspecified number of persons with respect to the same and a large amount of content sets, the
ここで、例えば、放送番組を解析対象のコンテンツと仮定した場合、ある特定の人物が見たい番組を予測するために、日本国内の地上波で放送している放送番組全てについての全世帯の評価値を網羅的に調査することは現実的ではない。多くの場合、統計的に優位な回答数が得られるだけの数の協力者について調査した一部の放送番組に対する評価値を、基礎データ(すなわち、参照評価値)とする場合がほとんどである。 Here, for example, assuming that a broadcast program is the content to be analyzed, in order to predict a program that a specific person wants to watch, all household evaluations of all broadcast programs broadcast on terrestrial waves in Japan Exhaustive investigation of values is not practical. In many cases, the evaluation value for a part of broadcast programs investigated for the number of collaborators who can obtain a statistically superior number of responses is often used as basic data (ie, reference evaluation value).
解析対象のコンテンツの総数、あるいは、調査対象の人物の総数が比較的少数である場合には、用意した全てのコンテンツに対する評価値(参照評価値)を網羅的に調査することは可能である。しかしながら、どちらか一方の数が千以上の大規模な調査となった場合、全ての調査対象のコンテンツに対する評価値を正確に回収することは非常に困難であり、ある確率で未評価のデータ、すなわち、欠損値が含まれることを考慮する必要がある。 When the total number of contents to be analyzed or the total number of persons to be investigated is relatively small, it is possible to comprehensively investigate evaluation values (reference evaluation values) for all prepared contents. However, if one of the surveys is a large survey of more than a thousand, it is very difficult to accurately collect the evaluation values for all the surveyed content, That is, it is necessary to consider that missing values are included.
従来、与えられる参照評価値に多くの欠損値が含まれる状況であっても高精度に目的評価値を予測可能な手法として、RWR法が知られている。しかしながら、RWR手法は、各コンテンツに対する評価値を、グラフの「重さ」として記述して解析する。このため、各々のコンテンツに対する好意的な評価(正の評価)は記述可能であるが、それと併せて反好意的な評価(負の評価)を同時に記述することが原理的に不可能であり、両者の情報を統合して解析するためには、別途新たな工夫が必要である。 Conventionally, the RWR method is known as a method capable of predicting a target evaluation value with high accuracy even in a situation where a lot of missing values are included in a given reference evaluation value. However, in the RWR method, the evaluation value for each content is described and analyzed as the “weight” of the graph. For this reason, favorable evaluation (positive evaluation) for each content can be described, but it is impossible in principle to describe anti-favorable evaluation (negative evaluation) at the same time, In order to integrate and analyze the information of both, a new device is required separately.
それに対して本実施形態におけるコンテンツ推薦装置1は、参照評価値が正の評価、並びに負の評価の2つの方向が与えられるとき、両者の評価値をそれぞれ別のグラフに記述する。そして、コンテンツ推薦装置1は、各々のグラフを独立に解析した後に、それら2つの解析結果を1つの確率分布に統合する。それによって、コンテンツ推薦装置1は、正負両方の参照評価値に基づいた高精度な目的評価値を予測することができる。
On the other hand, the
図1は、本発明の一実施形態によるコンテンツ推薦装置1の構成を示すブロック図である。図1において、コンテンツ推薦装置1は、基礎評価値記録部10、グラフ作成部20、目的評価値予測部30、及び推薦コンテンツ決定部40を備える。
FIG. 1 is a block diagram showing a configuration of a
基礎評価値記録部10は、基礎コンテンツリストと、参照ユーザIDと、参照ユーザ評価値とを記録する。上記基礎コンテンツリストは、解析対象であるコンテンツ全てを記載したリストである。上記参照ユーザIDは、基礎コンテンツリストに記載された各々のコンテンツに対する評価値を調査する不特定多数のユーザのそれぞれを識別する番号である。上記参照ユーザ評価値は、各々の参照ユーザについて調査した基礎コンテンツリストに記載された、それぞれのコンテンツに対する評価値である。
The basic evaluation
グラフ作成部20は、参照ユーザID別に記録された参照ユーザ評価値(以下、この参照ユーザ別の評価値のリストを基礎評価値と呼ぶ)を、基礎評価値記録部10から受け取るとともに、目的ユーザIDと目的ユーザ評価値とを入力とし、ポジティブ・グラフとネガティブ・グラフとを作成して出力する。上記目的ユーザIDは、推薦リストを提示する対象のユーザ(以後、目的ユーザと呼ぶ)を識別するための識別情報である。上記目的ユーザ評価値は、目的ユーザが先のコンテンツ集合の部分集合の各コンテンツに対して下した評価値のリストである。
The
より具体的には、グラフ作成部20は、分割部21と作成部22とを備えている。分割部21は、参照ユーザ評価値を正の評価値(参照評価値の正の成分)と負の評価値(参照評価値の負の成分)とに分離する。作成部22は、各コンテンツ、及び各ユーザをノードとし、各コンテンツに対する各々のユーザ(参照ユーザ、並びに目的ユーザ)の正の評価値(参照評価値の正の成分)を、各ノードを接続するエッジ重みとして記述したポジティブ・グラフと、各コンテンツに対する各々のユーザ(参照ユーザ、並びに目的ユーザ)の負の評価値(参照評価値の負の成分)をエッジ重みとして記述したネガティブ・グラフとを作成して出力する。
More specifically, the
目的評価値予測部30は、ポジティブ・スコア算出部31(ポジティブスコア算出部)とネガティブ・スコア算出部(ネガティブスコア算出部)32とを備えている。ポジティブ・スコア算出部31は、グラフ作成部20から受け取ったポジティブ・グラフを、別途、入力として与えられるRWR実行パラメータ(具体的には、リスタート確率α、及び収束判定閾値ε)に記述された各種設定値に従って解析し、解析結果として、ポジティブ・スコアを算出して出力する。また、ネガティブ・スコア算出部32は、グラフ作成部20から受け取ったネガティブ・グラフを、別途、入力として与えられるRWR実行パラメータ(具体的には、リスタート確率α、及び収束判定閾値ε)に記述された各種設定値に従って解析し、解析結果としてネガティブ・スコアを算出して出力する。
The objective evaluation
ポジティブ・スコアは、目的ユーザの基礎コンテンツリストに記載されたコンテンツのうち、未評価のコンテンツに対する正の評価値の予測確率分布を近似したものである。また、ネガティブ・スコアは、同目的ユーザの未評価コンテンツに対する負の評価値の予測確率分布を近似したものである。 The positive score is obtained by approximating the predicted probability distribution of the positive evaluation value for the unevaluated content among the contents described in the basic content list of the target user. The negative score approximates the predicted probability distribution of negative evaluation values for the unevaluated content of the same user.
推薦コンテンツ決定部40は、推定部41と決定部42とを備えている。推定部41は、具体的なコンテンツ(番組など)を推薦する際に必要な各種設定値の集合体である推薦コンテンツ決定パラメータと、先に目的評価値予測部30で算出したポジティブ・スコア、並びにネガティブ・スコアとに基づいて、目的ユーザが未評価のコンテンツに対する評価値(すなわち、目的評価値)のコンテンツ毎の予測確率値(大小関係)を算出(推定)する。決定部42は、コンテンツ毎の予測確率値の大小に応じて降順に並べ替え、上位の確率値を与えるコンテンツのリスト、すなわち、推薦コンテンツリストを出力する。
The recommended
次に、本実施形態の動作について説明する。
図2、及び図3は、本実施形態によるコンテンツ推薦装置1の動作を説明するためのフローチャートである。なお、基礎評価値記録部10は、一例として、内部にメモリを有するものとして説明する。
基礎評価値記録部10は、まず、基礎コンテンツリストを受け取り、内部のメモリに記録する(ステップS100)。次に、基礎評価値記録部10は、参照ユーザIDと、参照ユーザ評価値とを受け取り、内部のメモリに記録する(ステップS101)。そして、基礎評価値記録部10は、基礎コンテンツリストに記載された各コンテンツに対する参照ユーザごとに評価値を記録した基礎評価値(テーブル)UIbaseを、グラフ作成部20に送る(ステップS102)。
Next, the operation of this embodiment will be described.
2 and 3 are flowcharts for explaining the operation of the
First, the basic evaluation
図4は、本実施形態による基礎評価値UIbaseの一例を示す概念図である。図4において、基礎評価値UIbaseには、各参照ユーザuser#1、user#2ごとに、基礎コンテンツリストに記載された各コンテンツcontents#1〜#4に対する評価値が記録されている。ここで、contents#1〜#4は、コンテンツを識別する情報であるコンテンツIDである。図示の例では、参照ユーザuser#1には、各コンテンツcontents#1〜#4に対して、評価値「0」、「+2」、「−1」、「0」が記録されている。また、参照ユーザuser#2には、各コンテンツcontents#1〜#4に対して、評価値「+2」、「−1」、「0」、「+1」が記録されている。
FIG. 4 is a conceptual diagram illustrating an example of the basic evaluation value UI base according to the present embodiment. In FIG. 4, in the basic evaluation value UI base , evaluation values for the
図2に戻り、次に、グラフ作成部20は、推薦の対象である目的ユーザを特定するための目的ユーザIDと、目的ユーザが既に評価した基礎コンテンツリスト中の各コンテンツについての評価値(目的ユーザ評価値)のリストuitargetを受け取る(ステップS103)。次に、グラフ作成部20は、基礎評価値記録部10から基礎評価値UIbaseを受け取る(ステップS104)。次に、グラフ作成部20は、基礎評価値(テーブル)UIbaseと目的ユーザ評価値uitargetのリストとを結合して参照評価値(テーブル)UIrefを作成する(ステップS105)。
Returning to FIG. 2, the
図5は、本実施形態による目的ユーザ評価値uitargetの一例を示す概念図である。図5において、目的ユーザ評価値uitargetには、目的ユーザの基礎コンテンツリスト中の各コンテンツについて既に評価した評価値が記録されている。図示の例では、目的ユーザ#0について、各コンテンツcontents#1〜#4に対して、評価値「+1」、「NA」、「−2」、「NA」が記録されている。
FIG. 5 is a conceptual diagram showing an example of the target user evaluation value ui target according to the present embodiment. In FIG. 5, an evaluation value that has already been evaluated for each content in the basic content list of the target user is recorded in the target user evaluation value ui target . In the illustrated example, evaluation values “+1”, “NA”, “−2”, and “NA” are recorded for the
図6は、本実施形態による参照評価値UIrefの一例を示す概念図である。図6において、参照評価値UIrefには、目的ユーザ#0、参照ユーザuser#1、user#2ごとに、基礎コンテンツリスト中の各コンテンツについての評価値が記録されている。すなわち、図4に示す基礎評価値UIbaseと、図5に示す目的ユーザ評価値uitargetとが結合されている。
FIG. 6 is a conceptual diagram illustrating an example of the reference evaluation value UI ref according to the present embodiment. In FIG. 6, the reference evaluation value UI ref records the evaluation value for each content in the basic content list for each
次に、グラフ作成部20は、参照評価値UIrefを正の成分と負の成分とに分離し、各々をポジティブ・グラフGposと、ネガティブ・グラフGnegとする(ステップS106)。具体的には、グラフ作成部20は、作成した参照評価値UIrefの各要素を、正の成分(正の評価値)あるいは負の成分(負の評価値)のいずれか一方のみを抽出した2つのテーブルに分離し、各々の欠損値NAを0で埋める。
Next, the
グラフ作成部20は、得られた2つのテーブルそれぞれについて、各ユーザと各コンテンツをノードとし、各々のユーザのノードと、当該ユーザが評価したコンテンツのノードとをエッジで結び、その評価値を当該エッジに重みとして割り当てる。但し、参照評価値UIrefの負の成分については、その評価値(負の値)の絶対値を当該エッジの重みとして付与するものとする。そして、グラフ作成部20は、参照評価値UIrefの正の成分、並びに負の成分、各々について得られたグラフを、それぞれ、ポジティブ・グラフGposと、ネガティブ・グラフGnegとして出力する。
For each of the two obtained tables, the
図7は、本実施形態によるポジティブ・グラフGposの一例を示す概念図である。図7において、丸印が各ユーザと各コンテンツを示すノードであり、ノード間を結ぶエッジ(線分)の太さがその評価値に相当する。各エッジの数字は評価値である。 FIG. 7 is a conceptual diagram illustrating an example of the positive graph G pos according to the present embodiment. In FIG. 7, circles are nodes indicating each user and each content, and the thickness of an edge (line segment) connecting the nodes corresponds to the evaluation value. The numbers at each edge are evaluation values.
図8は、本実施形態によるネガティブ・グラフGnegの一例を示す概念図である。図8においても、図7と同様に、丸印が各ユーザと各コンテンツを示すノードであり、ノード間を結ぶエッジ(線分)の太さがその評価値に相当する。各エッジの数字は評価値である。 FIG. 8 is a conceptual diagram showing an example of the negative graph G neg according to the present embodiment. In FIG. 8, as in FIG. 7, the circles are nodes indicating the users and the contents, and the thickness of the edge (line segment) connecting the nodes corresponds to the evaluation value. The numbers at each edge are evaluation values.
図2に戻り、次に、グラフ作成部20は、基礎コンテンツリストの中で、目的ユーザの評価が未評価(評価値がNA(欠損値)となっているコンテンツ)を、予測対象の目的コンテンツとして検出し、それらを指し示すコンテンツIDを目的コンテンツIDとして出力する(ステップS107)。
Returning to FIG. 2, next, the
次に、目的評価値予測部30は、まず、グラフ作成部20からポジティブ・グラフGposとネガティブ・グラフGnegとを読み込む(ステップS108)。次に、目的評価値予測部30は、RWR実行パラメータの各要素、すわなち、リスタート確率α、収束判定閾値εを読み込む(ステップS109)。
Next, the objective evaluation
次に、目的評価値予測部30は、ポジティブ・グラフGposから抽出した隣接行列Aposの各要素aijを、数式(2)の右辺に代入して行列A*を求め、ネガティブ・グラフGnegから抽出した隣接行列Anegの各要素aijを、数式(2)の右辺に代入して行列A*を求める(ステップS110、S111)。
Next, the objective evaluation
具体的には、目的評価値予測部30は、ポジティブ・グラフGposとネガティブ・グラフGnegとのそれぞれについて、以下で説明する手順に従い、前者のグラフの各ノード間の接続関係から隣接行列Aposを、後者のグラフの接続関係から隣接行列Anegを、各々、抽出する。
Specifically, the objective evaluation
図9は、本実施形態による隣接行列Aposの一例を示す概念図である。図9に示すように、隣接行列Aposは、ポジティブ・グラフGposから抽出した、各ユーザuser#0〜#2、各コンテンツcontents#1〜#4のそれぞれの間の評価値を要素とする行列である。
FIG. 9 is a conceptual diagram illustrating an example of the adjacency matrix A pos according to the present embodiment. As shown in FIG. 9, the adjacency matrix A pos includes evaluation values between the
図10は、本実施形態による隣接行列Anegの一例を示す概念図である。図10に示すように、隣接行列Anegは、ネガティブ・グラフGnegから抽出した、各ユーザuser#0〜#2、各コンテンツcontents#1〜#4のそれぞれの間の評価値を要素とする行列である。
FIG. 10 is a conceptual diagram illustrating an example of the adjacency matrix A neg according to the present embodiment. As shown in FIG. 10, the adjacency matrix A neg has an evaluation value between each
そして、それら2つの行列を、それぞれ数式(1)の行列Aの項に代入し、さらに、各々、数式(2)に従って正規化処理を実行して、2通りの正規化隣接行列A*を得る。 Then, these two matrices are substituted into the terms of the matrix A in the equation (1), respectively, and further, normalization processing is executed according to the equation (2), respectively, to obtain two types of normalized adjacency matrices A * . .
行列Aは、与えられたポジティブ・グラフGpos、または、ネガティブ・グラフGnegのノード間の接続関係、及び接続の強さ(すなわちエッジ重み)によって決定される隣接行列を表し、4つの部分行列UU、UI、IU、IIから構成される。 A matrix A represents an adjacency matrix determined by a connection relation between nodes of a given positive graph G pos or negative graph G neg and a connection strength (ie, edge weight), and four submatrices. It consists of UU, UI, IU, and II.
部分行列UUは、各ユーザ間の嗜好の類似関係を記述した行列であり、そのa行b列成分は、a番目のユーザの基礎コンテンツリスト内の各コンテンツに対する評価値を並べたベクトルvaと、b番目のユーザの同コンテンツに対する評価値を並べたベクトルvbとの間の相関係数である。但し、負の相関係数が得られたユーザの組については、該当する行列UUの値を0で置き換えるものとする。 The submatrix UU is a matrix describing the preference similarity between the users, and the a row and b column components thereof are a vector v a in which evaluation values for each content in the basic content list of the a-th user are arranged. , A correlation coefficient with the vector v b in which evaluation values for the same content of the b-th user are arranged. However, for a set of users for which a negative correlation coefficient is obtained, the value of the corresponding matrix UU is replaced with 0.
部分行列UIは、各ユーザの各コンテンツに対する評価値の分布を表す行列であり、そのa行c列成分は、ベクトルvaのc番目の要素(すなわち、a番目のユーザのc番目のコンテンツに対する評価値)である。また、部分行列IUは、UIの行と列を入れ替えた転置行列である。 Submatrix UI is a matrix representing the distribution of the evaluation value for each content for each user, that a row c columns component, c th element of the vector v a (i.e., for the c-th content a th user Evaluation value). The submatrix IU is a transposed matrix in which the UI rows and columns are interchanged.
部分行列IIは、コンテンツ間の類似度を記述した行列であり、そのc行d列成分は、c番目のコンテンツとd番目のコンテンツとの類似度である。コンテンツ間の類似度は、コンテンツの内容に基づいた類似の度合の大小関係を表現可能な指標でれば何でもよい。例えば、放送番組コンテンツについては、EPG(Electronic Program Guide)で配信される各々の番組の概要文に出現した名詞の集合の対について、共通して出現した名詞の数の割合を類似度として算出してもよい。 The submatrix II is a matrix describing the degree of similarity between contents, and the c-row and d-column component is the degree of similarity between the c-th content and the d-th content. The similarity between the contents may be any index as long as it can express the magnitude relationship of the similarity based on the contents. For example, for broadcast program content, the ratio of the number of nouns that appear in common is calculated as the similarity for the pair of nouns that appear in the summary sentence of each program delivered by EPG (Electronic Program Guide). May be.
図11は、本実施形態による部分行列IIの一例を示す概念図である。図11において、部分行列IIには、コンテンツcontents#1〜#4ごとに、他のコンテンツとの類似度が記述されている。図示の例では、一致を「1」とし、類似しているほど「1」に近くなり、類似していないほど「1」より小さい値となる指標を用いている。
FIG. 11 is a conceptual diagram showing an example of the submatrix II according to the present embodiment. In FIG. 11, in the partial matrix II, the degree of similarity with other contents is described for each of the
また、行列A*は、数式(2)に示したように、行列Aの要素を、各々の列についての要素の和が1となるように正規化した行列である。 The matrix A * is a matrix obtained by normalizing the elements of the matrix A so that the sum of the elements for each column becomes 1 as shown in the equation (2).
次に、目的評価値予測部30は、ポジティブ・グラフGposとネガティブ・グラフGnegとのそれぞれについて、目的ユーザIDに対応するノードの値のみを1とし、その他の値を0とした初期ベクトルp(0)を設定し(ステップS111、S115)、隣接行列Apos、Anegを、それぞれ正規化した隣接行列A*、及び初期ベクトルp(0)を用いて、数式(3)に従いベクトルp(t)を更新する(ステップS111、S115)。
Next, the objective evaluation
図12は、本実施形態による初期ベクトルp(0)の一例を示す概念図である。図12に示すように、初期ベクトルp(0)は、上述したように、目的ユーザIDに対応するノードの値のみを1とし、その他の値を0とした行列である。 FIG. 12 is a conceptual diagram illustrating an example of the initial vector p (0) according to the present embodiment. As shown in FIG. 12, the initial vector p (0) is a matrix in which only the value of the node corresponding to the target user ID is 1 and the other values are 0, as described above.
具体的には、ステップS110、S114で得られた2つの異なる行列A*について、各々独立に数式(3)で定義される更新処理を各ノードの滞留確率を表すベクトルpに対して実行する。 Specifically, for the two different matrices A * obtained in steps S110 and S114, the update process defined by Equation (3) is independently performed on the vector p representing the retention probability of each node.
ここで、ベクトルp(t+1)は、目的ユーザからみた各ユーザへの近接度の期待値を表わす列ベクトルと、目的ユーザから見た各コンテンツへの近接度の期待値を表わす列ベクトルとを、縦に連結したベクトルpの、第t番目の更新ステップにおける値を表わす。その長さは、与えられたポジティブ・グラフGpos、あるいはネガティブ・グラフGnegに記載されたノードの総数(すなわち、本システムが取り扱うユーザの総数とコンテンツの総数との和)に一致する。 Here, the vector p (t + 1) is a column vector that represents the expected value of the proximity to each user as viewed from the target user and a column vector that represents the expected value of the proximity to each content viewed from the target user. It represents the value of the vertically connected vector p in the t-th update step. The length corresponds to the total number of nodes described in a given positive graph G pos or negative graph G neg (that is, the sum of the total number of users handled by the system and the total number of contents).
また、ベクトルの初期値p(0)は、目的ユーザに対応する要素の値のみを1に、それ以外の要素を全て0に設定したベクトル(共通の固定値)である。 The initial value p (0) of the vector is a vector (common fixed value) in which only the value of the element corresponding to the target user is set to 1 and all other elements are set to 0.
次に、目的評価値予測部30は、更新結果が収束したか否か、すなわち、各ステップ単位でのベクトルp(t)の変化量(具体的には、p(t+1)とベクトルp(t)との差分の絶対値の合計値)が、収束判定閾値εを下回ったか否かを判定する(ステップS113、S117)。そして、更新結果が収束していない場合には(ステップS113のNO、S117のNO)、それぞれステップS112、S116に戻り、更新処理を繰り返し実行する。
Next, the objective evaluation
一方、p(t)の変化量が収束判定閾値εを下回り、更新が終了した場合には(ステップS113のYES、S117のYES)、目的評価値予測部30は、ポジティブ・グラフGposから抽出した隣接行列Aposについて数式(1)〜数式(3)を実行し、最終的に得られた更新結果ppos、並びに、ネガティブ・グラフGnegから抽出した隣接行列Aposについて同様の処理を実行して最終的に得られた更新結果pnegのそれぞれついて、目的コンテンツIDに対応する成分をベクトル形式で抽出し、それぞれ、ポジティブ・スコアspos、及びネガティブ・スコアsnegとして出力する(ステップS118)。
On the other hand, when the amount of change in p (t) falls below the convergence determination threshold value ε and the update is completed (YES in step S113, YES in S117), the objective evaluation
図13は、本実施形態による最終的に目的評価値予測部30が算出した更新結果pposの一例(α=0.7,ε=10−10の場合)を示す概念図である。図13に示すように、最終的に得られた更新結果pposは、ユーザuser#0〜#2、コンテンツcontents#1〜#4に対応して、「0.772、0.065、0.072、0.072、0.011、0.001、0.008」となる要素を有する。
FIG. 13 is a conceptual diagram illustrating an example of the update result p pos finally calculated by the objective evaluation
図14は、本実施形態による最終的に目的評価値予測部30が算出した更新結果pnegの一例(α=0.7,ε=10−10の場合)を示す概念図である。図14に示すように、最終的に得られた更新結果pnegは、ユーザuser#0〜#2、コンテンツcontents#1〜#4に対応して、「0.772、0.060、0.053、0.002、0.007、0.106、0.000」となる要素を有する。
FIG. 14 is a conceptual diagram illustrating an example of the update result p neg finally calculated by the objective evaluation
図15は、本実施形態によるポジティブ・スコアsposの一例を示す概念図である。図15には、ポジティブ・スコアsposの一例として、目的コンテンツID(=#2、#4)に対応する成分からなる行列が示されている。ポジティブ・スコア算出部31は、例えば、図15に示されたポジティブ・スコアsposを算出し、算出したポジティブ・スコアsposを保持する。
FIG. 15 is a conceptual diagram illustrating an example of a positive score s pos according to the present embodiment. FIG. 15 illustrates a matrix including components corresponding to the target content IDs (= # 2, # 4) as an example of the positive score s pos . For example, the positive
図16は、本実施形態によるネガティブ・スコアsnegの一例を示す概念図である。図16には、ネガティブ・スコアsnegの一例として、目的コンテンツID(=#2、#4)に対応する成分からなる行列が示されている。ネガティブ・スコア算出部32は、例えば、図16に示されたネガティブ・スコアsnegを算出し、算出したネガティブ・スコアsnegを保持する。
FIG. 16 is a conceptual diagram illustrating an example of a negative score s neg according to the present embodiment. FIG. 16 illustrates a matrix including components corresponding to the target content IDs (= # 2, # 4) as an example of the negative score s neg . For example, the negative
次に、推薦コンテンツ決定部40は、目的評価値予測部30からポジティブ・スコアsposとネガティブ・スコアsnegとを読み込み(ステップS119)、推薦コンテンツ決定パラメータ(wpos,wneg,θ)を読み込む(ステップS120)。次に、推薦コンテンツ決定部40は、予測対象のコンテンツ(目的コンテンツ)に対する目的ユーザの正の評価値を近似したポジティブ・スコアsposと、同目的コンテンツに対する目的ユーザの負の評価値を近似したネガティブ・スコアsnegとの重み付き差分を用いて、次式(4)に従って、統合スコアstotalを算出する(ステップS121)。
Next, the recommended
図17は、本実施形態による統合スコアstotal(wpos=wneg=1.0の場合)の一例を示す概念図である。図17には、統合スコアstotalの一例として、目的コンテンツID(=#2、#4)に対応する成分「0.004、0.008」からなる行列が示されている。推薦コンテンツ決定部40は、例えば図17に示された統合スコアstotalを算出する。
FIG. 17 is a conceptual diagram showing an example of the integrated score s total (when w pos = w neg = 1.0) according to the present embodiment. 17, as an example of the total score s total, object content ID (= # 2, # 4 ) matrix of component "0.004,0.008" corresponding to is shown. For example, the recommended
そして、推薦コンテンツ決定部40は、統合スコアstotalの値を降順に並べ替え、上位θ個に対応するコンテンツのIDとスコアとを、推薦コンテンツリストとして出力する(ステップS122)。
Then, the recommended
図18は、本実施形態による推薦コンテンツリストの一例(閾値θ=1の場合)を示す概念図である。図18には、推薦コンテンツリストの一例としては、[user#0. contents#4, 0.008]が示されている。これは、図17における統合スコアstotalを表す行列の成分のうち値が最も大きい成分である0.008と、それに対応する目的コンテンツID#4とが推薦コンテンツ決定部40によって推薦コンテンツリストとして抽出されたからである。
FIG. 18 is a conceptual diagram showing an example of the recommended content list according to the present embodiment (when threshold θ = 1). In FIG. 18, as an example of the recommended content list, [
次に、上述した実施形態の従来技術に対する有効性について説明する。
図19乃至図22は、本実施形態による処理結果と従来のRWR法を用いた処理結果の比較を示すグラフである。図19は、推薦番組の上位1番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。図20は、推薦番組の上位5番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。図21は、推薦番組の上位10番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。図22は、推薦番組の上位20番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。
Next, the effectiveness of the above-described embodiment with respect to the prior art will be described.
19 to 22 are graphs showing a comparison between the processing result according to the present embodiment and the processing result using the conventional RWR method. FIG. 19 is a graph comparing the prediction accuracy for the top first recommended program between the processing result according to the present embodiment and the processing result using the conventional RWR method. FIG. 20 is a graph comparing the prediction accuracy of the top five recommended programs between the processing result according to the present embodiment and the processing result using the conventional RWR method. FIG. 21 is a graph comparing the prediction accuracy for the top 10 recommended programs between the processing result according to the present embodiment and the processing result using the conventional RWR method. FIG. 22 is a graph comparing the prediction accuracy for the top 20 recommended programs with the processing result according to the present embodiment and the processing result using the conventional RWR method.
図19乃至図22のグラフを得るために、コンテンツとして用意した300番組に対する、ユーザ1228名の5段階評価(5:見たい、4:まあ見たい、3:どちらともいえない、2:あまり見たくない、1:見たくない)が用いられている。図19乃至図22において、グラフの横軸は、データの間引き率(%Pruning rate)である。ここでデータの間引き率は、システムが参照する番組評価値のうち、欠損値(未評価番組)として隠すデータの割合である。グラフの縦軸は、推薦番組の上位k番目についての予測精度である。ここで推薦番組の上位k番目についての予測精度は、算出したスコアの上位k番組(kは1、5、10、または20)のうち、ユーザ評価が「4:まあ見たい」以上であった割合である。グラフ中では、推薦番組の上位k番目についての予測精度は、%Precision@kと表されている。以後、推薦番組の上位k番目についての予測精度を「P@k」と呼ぶ。 In order to obtain the graphs of FIGS. 19 to 22, five-stage evaluation of 1228 users for 300 programs prepared as contents (5: I want to see, 4: I want to see, 3: I can't say either, 2: I see too much) I do not want to see 1: I do not want to see). 19 to 22, the horizontal axis of the graph represents the data thinning rate (% Pruning rate). Here, the data thinning rate is the ratio of data to be hidden as a missing value (unrated program) among the program evaluation values referred to by the system. The vertical axis of the graph represents the prediction accuracy for the top k-th recommended program. Here, the prediction accuracy for the top k-th recommended program was the user evaluation of “4: Well want to see” among the top k programs (k is 1, 5, 10, or 20) of the calculated score. It is a ratio. In the graph, the prediction accuracy for the top k-th recommended program is expressed as% Precision @ k. Hereinafter, the prediction accuracy for the top k of the recommended programs is referred to as “P @ k”.
また、図19乃至図22において、黒丸は、従来の標準的なRWR法によるデータである。5段階評価のうち、正の評価値(5&4)のみを隣接行列に用いたRWR法による番組評価値の予測精度(従来の標準的なRWR法を用いた5回の試行の結果の平均値)が黒丸としてプロットされている。また、白丸は、本実施形態のRWR法によるデータである。従来技術と同じく、5段階評価の正の評価値(5&4)と負の評価値(2&1)を、各々、別の隣接行列に反映させ、それぞれの隣接行列が対応するグラフを、独立なRWRアルゴリズムで解析した結果を統合したときの予測精度(各々のユーザの300番組に対する評価値のうち、設定した間引き率に相当する数の番組を無作為に決定し、その評価値を欠損値として隠した条件において、本発明の方法で予測した5回の試行の結果の平均値)が白丸としてプロットされている。 In FIG. 19 to FIG. 22, black circles are data by a conventional standard RWR method. Prediction accuracy of program evaluation value by RWR method using only positive evaluation value (5 & 4) as adjacency matrix among five-level evaluation (average value of results of five trials using conventional standard RWR method) Is plotted as a black circle. White circles are data according to the RWR method of the present embodiment. As in the prior art, the positive evaluation value (5 & 4) and the negative evaluation value (2 & 1) of the five-level evaluation are reflected in different adjacency matrices, and the graph corresponding to each adjacency matrix is represented by an independent RWR algorithm. Prediction accuracy when integrating the results analyzed in (Randomly determine the number of programs corresponding to the set thinning rate out of the evaluation values for each user's 300 programs, and hidden the evaluation values as missing values Under the conditions, the average value of the results of five trials predicted by the method of the present invention is plotted as a white circle.
また、図19乃至図22において、白丸及び黒丸の上に伸びる線分に相当する割合または下に伸びる線分の割合は、各々の間引き率の設定において、各々、5回ずつ実施した無作為抽出の結果についての予測精度のバラツキを評価するための標準偏差に相当する割合である。 19 to 22, the proportion corresponding to the line segment extending above the white circle and the black circle or the proportion extending below the line segment is a random sampling performed five times for each thinning rate setting. This is a ratio corresponding to the standard deviation for evaluating the variation in the prediction accuracy for the result.
図19に示すように、推薦番組の上位1番目についての予測精度(P@1)の場合には、両者の間に有為な差は見られない。これに対して、図20、図21、及び図22に示す2番目以降の推薦番組を含めた予測精度(P@5、P@10、P@20)の場合には、どのpruning rateの設定においても、本発明による方法を用いた結果の曲線(白丸)が、従来の標準的なRWR法を用いた結果の曲線(黒丸)よりも、エラーバーの上下幅を考慮した変動分よりも、さらに上の領域を通過していることが分かる。すなわち、本実施形態による方法は、従来法よりも有為に予測精度が高いと結論付けることができる。 As shown in FIG. 19, in the case of the prediction accuracy (P @ 1) for the top first recommended program, there is no significant difference between the two. On the other hand, in the case of the prediction accuracy (P @ 5, P @ 10, P @ 20) including the second and subsequent recommended programs shown in FIG. 20, FIG. 21, and FIG. Also, the curve (white circle) of the result using the method according to the present invention is more than the fluctuation amount considering the vertical width of the error bar than the curve (black circle) of the result using the conventional standard RWR method. It can also be seen that it passes through the upper region. That is, it can be concluded that the method according to the present embodiment has a significantly higher prediction accuracy than the conventional method.
以上、本実施形態におけるコンテンツ推薦装置1において、ポジティブ・スコア算出部31は、各ユーザ間の嗜好の類似度と各ユーザの各コンテンツに対する正の評価値とコンテンツ間の類似度とを参照して、目的ユーザから前記各ユーザへの近接度の期待値と前記目的ユーザからみた各コンテンツへの近接度の期待値とを更新することで、ポジティブ・スコアを算出する。また、ネガティブ・スコア算出部32は、各ユーザ間の嗜好の類似度と各ユーザの各コンテンツに対する負の評価値と前記コンテンツ間の類似度とを参照して、目的ユーザから前記各ユーザへの近接度の期待値と目的ユーザからみた各コンテンツへの近接度の期待値とを更新することで、ネガティブ・スコアを算出する。
As described above, in the
本実施形態におけるコンテンツ推薦装置1は、基礎コンテンツリストに記載されたコンテンツの一部についてしか評価値が得られない条件でも、希薄問題に対して頑健であるRWR法を、参照評価値の相反する成分、すなわち正の評価値(ポジティブ・グラフ)、並びに負の評価値(ネガティブ・グラフ)の各々について独立に実行する。そして、コンテンツ推薦装置1は、それぞれの解析結果を最終的に1つの確率分布に統合する。このように同一コンテンツに対する相反する評価の成分を統合的に解析することにより、コンテンツ推薦装置1は、希薄問題に対して頑健でありながら、RWR法を正の評価値のみに対して単独で実行した場合よりも、目的評価値をより高精度に予測することができる。その結果、コンテンツ推薦装置1は、目的ユーザの嗜好に合致したコンテンツを高精度に推薦することができるので、目的ユーザの利便性を向上させることができる。
The
なお、複数の装置を備えるシステムが、本実施形態のコンテンツ推薦装置1の各処理を、それらの複数の装置で分散して処理してもよい。
また、本実施形態のコンテンツ推薦装置1の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、コンテンツ推薦装置1に係る上述した種々の処理を行ってもよい。
Note that a system including a plurality of devices may process each process of the
Further, a program for executing each process of the
なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。 Here, the “computer system” may include an OS and hardware such as peripheral devices. Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used. The “computer-readable recording medium” means a flexible disk, a magneto-optical disk, a ROM, a writable nonvolatile memory such as a flash memory, a portable medium such as a CD-ROM, a hard disk built in a computer system, etc. This is a storage device.
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。 Further, the “computer-readable recording medium” refers to a volatile memory (for example, DRAM (Dynamic) in a computer system serving as a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. Random Access Memory)) that holds a program for a certain period of time is also included. The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではない。各実施形態における各構成及びそれらの組み合わせ等は一例であり、本発明の趣旨から逸脱しない範囲内で、構成の付加、省略、置換、およびその他の変更が可能である。また、本発明は実施形態によって限定されることはなく、特許請求の範囲によってのみ限定される。 As mentioned above, although embodiment of this invention was explained in full detail with reference to drawings, a specific structure is not restricted to this embodiment. Each configuration in each embodiment, a combination thereof, and the like are examples, and the addition, omission, replacement, and other changes of the configuration can be made without departing from the spirit of the present invention. Further, the present invention is not limited by the embodiments, and is limited only by the scope of the claims.
1 コンテンツ推薦装置
10 基礎評価値記録部
20 グラフ作成部
21 分割部
22 作成部
30 目的評価値予測部
31 ポジティブ・スコア算出部(ポジティブスコア算出部)
32 ネガティブ・スコア算出部(ネガティブスコア算出部)
40 推薦コンテンツ決定部
41 推定部
42 決定部
DESCRIPTION OF
32 Negative score calculator (negative score calculator)
40 Recommended
Claims (5)
前記複数のコンテンツそれぞれに対する各ユーザの負の評価値を用いて、前記複数のコンテンツのうち、前記目的ユーザが評価していないコンテンツに対する負の評価値の予測確率値であるネガティブスコアを算出するネガティブスコア算出部と、
前記ポジティブスコア算出部が算出したポジティブスコアと前記ネガティブスコア算出部が算出したネガティブスコアとに基づいて、前記目的ユーザに推薦するコンテンツを決定する推薦コンテンツ決定部と、
を備えるコンテンツ推薦装置。 Using the positive evaluation value of each user for each of the plurality of contents, a positive score calculation that calculates a positive score that is a prediction probability value of a positive evaluation value for the content not evaluated by the target user among the plurality of contents And
Negative that calculates a negative score that is a predicted probability value of a negative evaluation value for content that is not evaluated by the target user among the plurality of contents, using negative evaluation values of each user for each of the plurality of contents A score calculator;
Based on the positive score calculated by the positive score calculation unit and the negative score calculated by the negative score calculation unit, a recommended content determination unit that determines content recommended for the target user;
A content recommendation device comprising:
前記ネガティブスコア算出部は、前記各ユーザ間の嗜好の類似度と前記各ユーザの各コンテンツに対する負の評価値と前記コンテンツ間の類似度とを参照して、前記ネガティブスコアを算出することを特徴とする請求項1または2のいずれか一項に記載のコンテンツ推薦装置。 The positive score calculation unit calculates the positive score with reference to the similarity of preference between the users, the positive evaluation value for each content of each user and the similarity between the contents,
The negative score calculation unit calculates the negative score by referring to a preference similarity between the users, a negative evaluation value of each user for each content, and a similarity between the contents. The content recommendation device according to any one of claims 1 and 2.
各コンテンツ、及び各ユーザをノードとし、前記正の評価値の集合を、各ノードを接続するエッジ重みとして記述したポジティブグラフと、各コンテンツ、及び各ユーザをノードとし、前記負の評価値の集合を、各ノードを接続するエッジ重みとして記述したネガティブグラフとを作成する作成部と
を更に備え、
前記ポジティブスコア算出部は、前記ポジティブグラフに基づいて、前記ポジティブスコアを算出し、
前記ネガティブスコア算出部は、前記ネガティブグラフに基づいて、前記ネガティブスコアを算出することを特徴とする請求項1から3のいずれか一項にコンテンツ推薦装置。 A dividing unit that divides an evaluation value indicating an evaluation of each user for each of the plurality of contents into the set of positive evaluation values and the set of negative evaluation values;
Each content and each user as a node, and the positive evaluation value set described as an edge weight connecting each node, and each content and each user as a node and the negative evaluation value set And a creation unit for creating a negative graph describing as an edge weight connecting each node,
The positive score calculation unit calculates the positive score based on the positive graph,
The content recommendation device according to any one of claims 1 to 3, wherein the negative score calculation unit calculates the negative score based on the negative graph.
複数のコンテンツそれぞれに対する各ユーザの正の評価値を用いて、前記複数のコンテンツのうち、目的ユーザが評価していないコンテンツに対する正の評価値の予測確率値であるポジティブスコアを算出するポジティブスコア算出ステップと、
前記複数のコンテンツそれぞれに対する各ユーザの負の評価値を用いて、前記複数のコンテンツのうち、前記目的ユーザが評価していないコンテンツに対する負の評価値の予測確率値であるネガティブスコアを算出するネガティブスコア算出ステップと、
前記ポジティブスコア算出ステップで算出されたポジティブスコアと前記ネガティブスコア算出ステップで算出されたネガティブスコアとに基づいて、前記目的ユーザに推薦するコンテンツを決定する推薦コンテンツ決定ステップと、
を実行させるためのプログラム。 On the computer,
Using the positive evaluation value of each user for each of the plurality of contents, a positive score calculation that calculates a positive score that is a prediction probability value of a positive evaluation value for the content not evaluated by the target user among the plurality of contents Steps,
Negative that calculates a negative score that is a predicted probability value of a negative evaluation value for content that is not evaluated by the target user among the plurality of contents, using negative evaluation values of each user for each of the plurality of contents A score calculating step;
Based on the positive score calculated in the positive score calculation step and the negative score calculated in the negative score calculation step, a recommended content determination step for determining content recommended for the target user;
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012269663A JP6101477B2 (en) | 2012-12-10 | 2012-12-10 | Content recommendation device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012269663A JP6101477B2 (en) | 2012-12-10 | 2012-12-10 | Content recommendation device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014115839A true JP2014115839A (en) | 2014-06-26 |
JP6101477B2 JP6101477B2 (en) | 2017-03-22 |
Family
ID=51171768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012269663A Expired - Fee Related JP6101477B2 (en) | 2012-12-10 | 2012-12-10 | Content recommendation device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6101477B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019503006A (en) * | 2016-04-29 | 2019-01-31 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | Method and apparatus for obtaining user caricature |
JP2020510910A (en) * | 2017-02-17 | 2020-04-09 | キンダイ、インコーポレイテッドKyndi, Inc. | Machine learning method and apparatus for ranking network nodes after using a network with software agents at network nodes |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011039811A (en) * | 2009-08-12 | 2011-02-24 | Sony Corp | Information processor, information processing method, and program |
-
2012
- 2012-12-10 JP JP2012269663A patent/JP6101477B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011039811A (en) * | 2009-08-12 | 2011-02-24 | Sony Corp | Information processor, information processing method, and program |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019503006A (en) * | 2016-04-29 | 2019-01-31 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | Method and apparatus for obtaining user caricature |
JP2020510910A (en) * | 2017-02-17 | 2020-04-09 | キンダイ、インコーポレイテッドKyndi, Inc. | Machine learning method and apparatus for ranking network nodes after using a network with software agents at network nodes |
JP7105789B2 (en) | 2017-02-17 | 2022-07-25 | キンダイ、インコーポレイテッド | Machine learning method and apparatus for ranking network nodes after using a network with software agents at the network nodes |
US11481456B2 (en) | 2017-02-17 | 2022-10-25 | Kyndi, Inc. | Model and pattern structure online unital learning: mapsoul |
US11782992B2 (en) | 2017-02-17 | 2023-10-10 | Kyndi, Inc. | Method and apparatus of machine learning using a network with software agents at the network nodes and then ranking network nodes |
Also Published As
Publication number | Publication date |
---|---|
JP6101477B2 (en) | 2017-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Foody et al. | Accurate attribute mapping from volunteered geographic information: issues of volunteer quantity and quality | |
Stillwell et al. | Internal migration around the world: comparing distance travelled and its frictional effect | |
Chen et al. | The impact of sampling and network topology on the estimation of social intercorrelations | |
Miller | Virtual species distribution models: using simulated data to evaluate aspects of model performance | |
Bagchi | Performance and quality assessment of similarity measures in collaborative filtering using mahout | |
Olivera | Changes in inequality and generalized trust in Europe | |
KR101620748B1 (en) | Item recommendation method and apparatus | |
KR101579376B1 (en) | Personalized place recommendation system and method by using subjectivity analysis for user classification | |
US9558273B2 (en) | System and method for generating influencer scores | |
Yesilyurt et al. | Meta-analysis, military expenditures and growth | |
KR102150660B1 (en) | Method to recommend digital contents based on search log and apparatus therefor | |
Bellogín et al. | The magic barrier of recommender systems–no magic, just ratings | |
McGovern et al. | On the assumption of bivariate normality in selection models: a copula approach applied to estimating HIV prevalence | |
US20130031093A1 (en) | Information processing system, information processing method, program, and non-transitory information storage medium | |
KR20150113644A (en) | Method for selecting recommendation type in product recommeding system | |
Westphal et al. | Evaluation of multiple prediction models: A novel view on model selection and performance assessment | |
US10296924B2 (en) | Document performance indicators based on referral context | |
US9922315B2 (en) | Systems and methods for calculating actual dollar costs for entities | |
Moradian et al. | Dynamic estimation with random forests for discrete‐time survival data | |
JP6101477B2 (en) | Content recommendation device and program | |
Thielsch et al. | How informative is informative? Benchmarks and optimal cut points for E-Health Websites | |
Yucel et al. | Sequential hierarchical regression imputation | |
KR20200145346A (en) | A program for the product or content recommendation service | |
Gmeiner et al. | A review of pornography use research: Methodology and results from four sources | |
JP2017021613A (en) | Cross-modal perception analysis system, presentation information determination system, information presentation system, cross-modal perception analysis program, presentation information determination program, and information presentation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151102 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170131 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6101477 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |