JP2011244340A - Program recommendation apparatus, method, and program - Google Patents
Program recommendation apparatus, method, and program Download PDFInfo
- Publication number
- JP2011244340A JP2011244340A JP2010116543A JP2010116543A JP2011244340A JP 2011244340 A JP2011244340 A JP 2011244340A JP 2010116543 A JP2010116543 A JP 2010116543A JP 2010116543 A JP2010116543 A JP 2010116543A JP 2011244340 A JP2011244340 A JP 2011244340A
- Authority
- JP
- Japan
- Prior art keywords
- program
- interest
- storage means
- user
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
本発明は、番組推薦装置及び方法及びプログラムに係り、特に、インターネット回線による映像配信サービスで提供されるユーザのテレビ番組視聴における、番組推薦装置及び方法及びプログラムに関する。 The present invention relates to a program recommendation apparatus, method, and program, and more particularly, to a program recommendation apparatus, method, and program for viewing a television program of a user provided by a video distribution service using an Internet line.
情報推薦の手法はいくつも提案されている。例えば、ニュース記事を推薦するために、各ニュース記事についてユーザに5段階の評価をつけさせ、過去の評価履歴を見てユーザ間の嗜好の類似度を測り、嗜好が似たユーザの好むニュース記事を推薦する手法が提案されている(例えば、非特許文献1参照)。 A number of information recommendation methods have been proposed. For example, in order to recommend a news article, the user is given a five-step evaluation for each news article, the past evaluation history is viewed, the degree of preference similarity between users is measured, and the news article preferred by a user with a similar preference Has been proposed (see, for example, Non-Patent Document 1).
また、上記の手法と同様に、各情報に対してユーザに評価をつけさせ、過去の評価履歴でユーザが評価している情報に含まれるテキストに着目する。そのテキストがユーザの興味を反映していると考え、そのテキストと同じような単語が出現している情報を推薦する手法が提案されている(例えば、非特許文献2参照)。 Similarly to the above-described method, the user is evaluated for each piece of information, and attention is paid to text included in the information evaluated by the user in the past evaluation history. There has been proposed a method for recommending information in which words similar to the text appear, considering that the text reflects the user's interest (for example, see Non-Patent Document 2).
また、利用者に興味を持つ部分のテキストを指定させ、そこに含まれる単語の出現頻度に基づいてユーザの興味を推定し、ユーザの興味を表す単語に基づいてコミュニティ内の情報を検索し、ユーザの興味のある箇所のみの情報を提示する手法がある(例えば、特許文献1参照)。 Also, let the user specify the text of the part of interest, estimate the user's interest based on the appearance frequency of the words contained therein, search the information in the community based on the word representing the user's interest, There is a method of presenting only information of a portion that is of interest to the user (for example, see Patent Document 1).
インターネット回線を利用した映像配信サービスについて、多チャンネル化が進んでいる。こういった中でユーザが本当に興味のある番組を見つけるのは困難である。また興味ある番組をすべて把握し録画することもまた、困難である。 Multi-channel video distribution services using internet lines are progressing. Under these circumstances, it is difficult for the user to find a program that is really interesting. It is also difficult to grasp and record all the programs of interest.
上記の特許文献1の手法を用いて番組を推薦する場合、ユーザが指定した興味のある語に関連する番組が推薦される。この場合、語を指定しなければならないという問題がある。また、指定した語が十分でなければ、ユーザにうまく番組が推薦されない。
When a program is recommended using the technique disclosed in
非特許文献1、2に記載の手法で番組を推薦する場合、ユーザの視聴した番組の情報を用いてユーザに番組を推薦するが、その番組情報の中でユーザが録画した情報は考慮しない。あるいは録画した番組の情報を用いれば、ユーザが視聴したという情報は考慮されない。視聴・録画の両方の情報を用いなければ、ユーザにさらに適切な番組を推薦することはできない。
When a program is recommended by the methods described in Non-Patent
本発明は上記の点に鑑みなされたもので、インターネット回線を利用した映像配信サービスにおいて、ユーザの視聴と録画に関するログを利用することでさらに適切に番組を推薦することが可能な番組推薦装置及び方法及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and in a video distribution service using an Internet line, a program recommendation device capable of recommending a program more appropriately by using a log relating to user viewing and recording, and An object is to provide a method and a program.
上記の課題を解決するために、本発明(請求項1)は、インターネット回線を利用した映像配信サービスにおいて、利用者の視聴履歴、中でも番組がユーザにより録画されたかどうかの情報を利用する番組推薦装置であって、
インターネット回線を利用した映像配信サービスにおける番組の情報を取得し、番組情報記憶手段に格納する番組情報取得手段と、
番組情報中の内容の要約テキストから単語を抽出する単語抽出手段と、
各番組情報における各単語の統計量を算出し、統計量記憶手段に格納する統計量算出手段と、
インターネット回線を利用した映像配信サービスにおける各ユーザの視聴または録画の視聴情報を取得し、視聴情報記憶手段に格納する視聴情報取得手段と、
取得した視聴情報からユーザと、視聴情報の対象である番組の番組情報記憶手段に格納されている内容の要約テキストから算出した各単語の統計量から、該ユーザの該単語に対する興味量を算出し、ユーザの識別子と、単語と共に興味量記憶手段に格納する興味量算出手段と、
興味量記憶手段に格納されている各ユーザの各単語に対する統計量と、番組情報記憶手段に格納されている番組のうち、放送前の番組のみの各単語の統計量から、該ユーザの該質問に対する興味合致度を算出し、該ユーザの識別子と、該番組の識別子と共に興味合致度記憶手段に格納する興味合致度算出手段と、
番組情報記憶手段の番組のうち、視聴情報記憶手段を参照して、録画された番組のみを選出し、統計量記憶手段に格納されている該録画の対象である番組の各単語の統計量から、該ユーザの該単語に対する良興味量を算出し、ユーザの識別子と、単語と共に良興味量記憶手段に格納する良興味量算出手段と、
良興味量記憶手段に格納されている各ユーザの各単語に対する統計量と、番組情報記憶手段に格納されている番組のうち、放送前の番組のみの各単語の統計量から、該ユーザの該番組に対する良興味合致度を算出し、該ユーザの識別子と、該番組の識別子と共に良興味合致度記憶手段に格納する良興味合致度算出手段と、
番組情報記憶手段に格納されている番組のうち、放送済の番組と、該番組情報記憶手段に格納されているユーザのうち、視聴したことのある番組との全ての組合せについて、該番組情報記憶手段に格納されている該番組について該ユーザが録画したかどうかと、興味合致度記憶手段に格納されている興味合致度と、良興味合致度記憶手段に格納されている良興味合致度とを用いて、重みパラメータを算出し、重みパラメータ記憶手段に格納する重みパラメータ算出手段と、
ユーザの識別子が与えられると、該ユーザの番組情報記憶手段に格納されている放送前の各番組に対して、興味合致度記憶手段に格納されている興味合致度と、良興味合致度記憶手段に格納されている良興味合致度と、重みパラメータ記憶手段に格納された重みパラメータとを用いて、該ユーザの各番組に対する推薦スコアを算出し、推薦スコアの上位N件の質問の識別子を推薦番組として選択する番組推薦手段と、を有する。
In order to solve the above-mentioned problems, the present invention (Claim 1) is directed to a program recommendation that uses a user's viewing history, particularly information about whether or not a program has been recorded by a user, in a video distribution service using an Internet line. A device,
Program information acquisition means for acquiring program information in a video distribution service using an Internet line and storing the information in a program information storage means;
Word extraction means for extracting words from summary text of contents in program information;
A statistic calculating means for calculating a statistic of each word in each program information and storing it in a statistic storage means;
Viewing information acquisition means for acquiring viewing information of viewing or recording of each user in a video distribution service using the Internet line, and storing the viewing information in the viewing information storage means;
From the acquired viewing information, the user's interest amount for the word is calculated from the statistics of each word calculated from the summary text of the content stored in the program information storage means of the program that is the target of the viewing information. , An interest amount calculating means for storing the identifier of the user and the interest amount storage means together with the word;
From the statistics for each word of each user stored in the interest amount storage means and the statistics for each word of only the pre-broadcast program among the programs stored in the program information storage means, the user's question Interest matching degree calculating means for calculating the interest matching degree for the user and storing the user identifier in the interest matching degree storage means together with the program identifier;
Of the programs in the program information storage means, refer to the viewing information storage means to select only the recorded programs, and from the statistics of each word of the program to be recorded stored in the statistics storage means Calculating a good interest amount for the word of the user, and storing a good interest amount calculating means for storing the user identifier and the good interest amount storage means together with the word;
From the statistics for each word of each user stored in the good interest amount storage means and the statistics for each word of only the pre-broadcast program among the programs stored in the program information storage means, the user's A good interest match degree calculating means for calculating a good interest match degree for a program, and storing the user identifier in the good interest match degree storage means together with the identifier of the program;
Of the programs stored in the program information storage means, the program information storage for all combinations of the broadcasted programs and the programs that have been viewed among the users stored in the program information storage means. Whether or not the user has recorded the program stored in the means, the interest match degree stored in the interest match degree storage means, and the good interest match degree stored in the good interest match degree storage means. A weight parameter calculating means for calculating a weight parameter and storing it in a weight parameter storage means;
Given a user identifier, for each pre-broadcast program stored in the user's program information storage means, the interest match degree stored in the interest match degree storage means and the good interest match degree storage means The recommended score for each program of the user is calculated using the degree of good interest matching stored in the weight parameter and the weight parameter stored in the weight parameter storage means, and the identifiers of the top N questions of the recommended score are recommended. Program recommendation means for selecting as a program.
また、本発明(請求項2)は、統計量算出手段において、
各単語の統計量を算出する際に、重要と見做される単語を抽出するためのTF値(単語の出現頻度)、TFIDF値(単語の出現頻度と逆出現頻度)を用いる。
Further, the present invention (Claim 2), in the statistic calculation means,
When calculating the statistic of each word, a TF value (word appearance frequency) and a TFIDF value (word appearance frequency and reverse appearance frequency) for extracting words regarded as important are used.
また、本発明(請求項3)は、重みパラメータ算出手段において、
番組情報記憶手段に格納されている該番組に対して該ユーザが録画したかどうかと、興味合致度記憶手段に格納されている興味合致度と、良興味合致度記憶手段に格納されている良興味合致度に基づいて、ロジスティック回帰分析によって重みパラメータを算出する手段を含む。
Further, the present invention (Claim 3) is a weight parameter calculating means,
Whether or not the user has recorded the program stored in the program information storage unit, the interest match level stored in the interest match level storage unit, and the good match level stored in the good interest match level storage unit Means for calculating a weight parameter by logistic regression analysis based on the degree of interest match.
また、本発明(請求項4)は、インターネット回線を利用した映像配信サービスにおいて、利用者の視聴履歴、中でも番組がユーザにより録画されたかどうかの情報を利用する番組推薦方法であって、
記憶媒体に、番組情報記憶手段、統計量記憶手段、視聴情報記憶手段、興味量記憶手段、興味合致度記憶手段、良興味量記憶手段、良興味合致度記憶手段、重みパラメータ記憶手段、を格納し、番組情報取得手段、単語抽出手段、視聴情報取得手段、興味量算出手段、興味合致度算出手段、良興味量算出手段、良興味合致度算出手段、重みパラメータ算出手段、番組推薦手段と、を有する装置において、
番組情報取得手段が、インターネット回線を利用した映像配信サービスにおける番組の情報を取得し、番組情報記憶手段に格納する番組情報取得ステップと、
単語抽出手段が、番組情報中の内容の要約テキストから単語を抽出する単語抽出ステップと、
統計量算出手段が、各番組情報における各単語の統計量を算出し、統計量記憶手段に格納する統計量算出ステップと、
視聴情報取得手段が、インターネット回線を利用した映像配信サービスにおける各ユーザの視聴または録画の視聴情報を取得し、視聴情報記憶手段に格納する視聴情報取得ステップと、
興味量算出手段が、取得した視聴情報からユーザと、視聴情報の対象である番組の番組情報記憶手段に格納されている内容の要約テキストから算出した各単語の統計量から、該ユーザの該単語に対する興味量を算出し、ユーザの識別子と、単語と共に興味量記憶手段に格納する興味量算出ステップと、
興味合致度算出手段が、興味量記憶手段に格納されている各ユーザの各単語に対する統計量と、番組情報記憶手段に格納されている番組のうち、放送前の番組のみの各単語の統計量から、該ユーザの該質問に対する興味合致度を算出し、該ユーザの識別子と、該番組の識別子と共に興味合致度記憶手段に格納する興味合致度算出ステップと、
量興味量算出手段が、番組情報記憶手段の番組のうち、視聴情報記憶手段を参照して、録画された番組のみを選出し、統計量記憶手段に格納されている該録画の対象である番組の各単語の統計量から、該ユーザの該単語に対する良興味量を算出し、ユーザの識別子と、単語と共に良興味量記憶手段に格納する良興味量算出ステップと、
良興味合致度算出手段が、良興味量記憶手段に格納されている各ユーザの各単語に対する統計量と、番組情報記憶手段に格納されている番組のうち、放送前の番組のみの各単語の統計量から、該ユーザの該番組に対する良興味合致度を算出し、該ユーザの識別子と、該番組の識別子と共に前期良興味合致度記憶手段に格納する良興味合致度算出ステップと、
重みパラメータ算出手段が、番組情報記憶手段に格納されている番組のうち、放送済の番組と、該番組情報記憶手段に格納されているユーザのうち、視聴したことのある番組との全ての組合せについて、該番組情報記憶手段に格納されている該番組について該ユーザが録画したかどうかと、興味合致度記憶手段に格納されている興味合致度と、良興味合致度記憶手段に格納されている良興味合致度とを用いて、重みパラメータを算出し、重みパラメータ記憶手段に格納する重みパラメータ算出ステップと、
番組推薦手段が、ユーザの識別子が与えられると、該ユーザの番組情報記憶手段に格納されている放送前の各番組に対して、興味合致度記憶手段に格納されている興味合致度と、良興味合致度記憶手段に格納されている良興味合致度と、重みパラメータ記憶手段に格納された重みパラメータとを用いて、該ユーザの各番組に対する推薦スコアを算出し、推薦スコアの上位N件の質問の識別子を推薦番組として選択する番組推薦ステップと、を行う。
Further, the present invention (Claim 4) is a program recommendation method that uses a user's viewing history, particularly information on whether or not a program has been recorded by a user, in a video distribution service using an Internet line,
Program information storage means, statistics amount storage means, viewing information storage means, interest amount storage means, interest match degree storage means, good interest amount storage means, good interest match degree storage means, weight parameter storage means are stored in the storage medium. Program information acquisition means, word extraction means, viewing information acquisition means, interest amount calculation means, interest match degree calculation means, good interest amount calculation means, good interest match degree calculation means, weight parameter calculation means, program recommendation means, In a device having
A program information acquisition unit acquires program information in a video distribution service using an Internet line, and stores the program information in a program information storage unit;
A word extracting means for extracting a word from the summary text of the content in the program information;
A statistic calculating unit calculates a statistic of each word in each program information and stores it in the statistic storage unit;
Viewing information acquisition means acquires viewing information of each user's viewing or recording in the video distribution service using the Internet line, and stores the viewing information in the viewing information storage means; and
From the statistics of each word calculated by the interest amount calculating means from the acquired viewing information and the summary text of the contents stored in the program information storage means of the program that is the target of the viewing information, the word of the user An interest amount calculation step of calculating an interest amount with respect to the user and storing it in the interest amount storage means together with the identifier of the user and the word;
The interest match degree calculation means is a statistic for each word of each user stored in the interest amount storage means, and a statistic for each word of only the pre-broadcast program among the programs stored in the program information storage means An interest matching degree calculation step of calculating an interest matching degree with respect to the question of the user and storing it in the interest matching degree storage means together with the identifier of the user and the identifier of the program;
The amount of interest calculation means refers to the viewing information storage means among the programs in the program information storage means, selects only the recorded programs, and is the recording target program stored in the statistics storage means A good interest amount calculation step of calculating a good interest amount for the user from the statistic of each word, and storing the user's identifier and the good interest amount storage unit together with the word;
The good interest coincidence calculating means calculates the statistics for each word of each user stored in the good interest amount storage means and the words of only the pre-broadcast programs among the programs stored in the program information storage means. From the statistics, the good interest match degree for the program of the user is calculated, and the good interest match degree calculation step of storing the identifier of the user and the good interest match degree storage means together with the identifier of the program;
The weight parameter calculation means includes all combinations of broadcasted programs among programs stored in the program information storage means and programs that have been viewed among users stored in the program information storage means. About whether the user has recorded the program stored in the program information storage means, the interest match degree stored in the interest match degree storage means, and the good interest match degree storage means A weight parameter calculating step for calculating a weight parameter using the good interest match degree and storing the weight parameter in a weight parameter storage means;
When the program recommendation means is given a user identifier, the interest match degree stored in the interest match degree storage means for each program before the broadcast stored in the program information storage means of the user, and good Using the good interest match degree stored in the interest match degree storage means and the weight parameter stored in the weight parameter storage means, a recommendation score for each program of the user is calculated, and the top N of the recommended scores are calculated. And a program recommendation step of selecting an identifier of the question as a recommended program.
また、本発明(請求項5)は、統計量算出ステップにおいて、
各単語の統計量を算出する際に、重要と見做される単語を抽出するためのTF値(単語の出現頻度)、TFIDF値(単語の出現頻度と逆出現頻度)を用いる。
Further, the present invention (Claim 5) is, in the statistic calculation step,
When calculating the statistic of each word, a TF value (word appearance frequency) and a TFIDF value (word appearance frequency and reverse appearance frequency) for extracting words regarded as important are used.
また、本発明(請求項6)は、重みパラメータ算出ステップにおいて、
番組情報記憶手段に格納されている該番組に対して該ユーザが録画したかどうかと、興味合致度記憶手段に格納されている興味合致度と、良興味合致度記憶手段に格納されている良興味合致度に基づいて、ロジスティック回帰分析によって重みパラメータを算出する。
Further, the present invention (claim 6), in the weight parameter calculation step,
Whether or not the user has recorded the program stored in the program information storage unit, the interest match level stored in the interest match level storage unit, and the good match level stored in the good interest match level storage unit Based on the degree of interest match, a weight parameter is calculated by logistic regression analysis.
また、本発明(請求項7)は、請求項1乃至請求項3のいずれか1項に記載の番組推薦装置を構成する各手段としてシステムを機能させるための番組推薦プログラムである。
The present invention (Claim 7) is a program recommendation program for causing a system to function as each means constituting the program recommendation apparatus according to any one of
上記のように本発明によれば、視聴情報だけでなく録画情報を用いて、ユーザの興味により適合した番組を推薦する手法を実現したことにより、従来の技術では不可能であった、インターネット回線を利用した映像配信サービスにおいて、ユーザにより適切な番組を推薦することが可能となる。これはインターネット回線を利用した映像配信サービスにおける視聴/録画の増加につながる。 As described above, according to the present invention, an Internet line, which was impossible with the conventional technology, was realized by realizing a method of recommending a program more suited to the user's interest using not only viewing information but also recorded information. It is possible to recommend an appropriate program by the user in the video distribution service using the. This leads to an increase in viewing / recording in video distribution services using the Internet line.
以下図面と共に、本発明の実施の形態を説明する。 Embodiments of the present invention will be described below with reference to the drawings.
図1は、本発明の一実施の形態における番組推薦装置の構成を示す。 FIG. 1 shows the configuration of a program recommendation device according to an embodiment of the present invention.
同図に示す番組推薦装置1は、番組情報取得部10、視聴情報テーブル更新部20、興味情報テーブル更新部30、良興味情報テーブル更新部40、興味合致度テーブル更新部50、良興味合致度テーブル更新部60、番組推薦部70、重みパラメータ更新部80、記憶部90、通信部A0、入出力部B0から構成され、通信部A0はネットワーク3に接続されており、入出力部B0は、入力装置や表示装置等の外部装置4に接続されている。
The
記憶部90は、番組情報テーブル91、視聴情報テーブル92、興味情報テーブル93、良興味情報テーブル94、興味合致度テーブル95、良興味合致度テーブル96、重みパラメータ記録部97を格納するディスク等の記憶媒体である。以下に、記憶部90内の各テーブルについて説明する。
The
<番組情報テーブル>
番組情報テーブル91には、図2に示すように、番組IDフィールド、内容フィールド、放送時間フィールドが含まれる。
<Program information table>
As shown in FIG. 2, the program information table 91 includes a program ID field, a content field, and a broadcast time field.
番組IDフィールドは、その番組を特定する識別子であり、番組情報取得部10により設定される。
The program ID field is an identifier that identifies the program, and is set by the program
内容フィールドは、該番組の内容に関する要約が、番組情報取得部10によりテキストデータにて設定される。
In the content field, a summary about the content of the program is set as text data by the program
放送時間フィールドは、該番組の放送時間が、番組情報取得部10により設定される。
In the broadcast time field, the broadcast time of the program is set by the program
<視聴情報テーブル>
視聴情報テーブル92には、図3に示すように、番組IDフィールド、ユーザIDフィールド、視聴/録画種別フィールドが含まれる。
<Viewing information table>
As shown in FIG. 3, the viewing information table 92 includes a program ID field, a user ID field, and a viewing / recording type field.
番組IDフィールドは、番組情報テーブルに出現する番組の識別子と対応し、視聴情報テーブル更新部20により設定される。
The program ID field corresponds to the identifier of the program that appears in the program information table, and is set by the viewing information
ユーザIDフィールドは、番組を視聴/録画したユーザを特定する識別子が、視聴情報テーブル更新部20により設定される。
In the user ID field, an identifier for identifying a user who has watched / recorded a program is set by the viewing information
視聴/録画種別フィールドは、該視聴/録画が視聴か、録画かを判定するための値が、視聴情報テーブル更新部20により設定される。
In the viewing / recording type field, the viewing information
<興味情報テーブル>
興味情報テーブル93には、図4に示すように、ユーザIDフィールドと、単語フィールドと、特徴量フィールドとが含まれる。
<Interest information table>
As shown in FIG. 4, the interest information table 93 includes a user ID field, a word field, and a feature amount field.
ユーザIDフィールドは、ユーザIDが、興味情報テーブル更新部30により設定される。
In the user ID field, the user ID is set by the interest information
単語フィールドは、単語 w が、興味情報テーブル更新部30により設定される。
In the word field, the word w is set by the interest information
特徴量フィールドは、ユーザ u の視聴した番組の内容中に出現する単語 w の統計量 interest0(u,w) であり、興味情報テーブル更新部30により設定される。
The feature amount field is a statistic interest 0 (u, w) of the word w that appears in the content of the program viewed by the user u, and is set by the interest information
<良興味情報テーブル>
良興味情報テーブル94には、図5に示すように、ユーザIDフィールドと、単語フィールドと、特徴量フィールドとが含まれる。
<Good interest information table>
As shown in FIG. 5, the good / interest information table 94 includes a user ID field, a word field, and a feature field.
ユーザIDフィールドは、ユーザIDが、良興味情報テーブル更新部40により設定される。
In the user ID field, the user ID is set by the good / interest information
単語フィールドは、単語 w が、良興味情報テーブル更新部40により設定される。
In the word field, the word w is set by the good interest information
特徴量フィールドは、ユーザ u の録画した番組の内容中に出現する単語 w の統計量 interest1(u,w)であり、良興味情報テーブル更新部50により設定される。
The feature amount field is a statistic interest 1 (u, w) of the word w appearing in the content of the program recorded by the user u, and is set by the good interest information
<興味合致度テーブル>
興味合致度テーブル95には、図6に示すように、ユーザIDフィールドと、番組IDフィールドと、興味合致度フィールドとが含まれる。
<Interest match table>
The interest match degree table 95 includes a user ID field, a program ID field, and an interest match degree field, as shown in FIG.
興味合致度フィールドは、当該行のユーザ u の過去に視聴した番組と、当該行の番組 pとの内容の類似度 score0(p,u) が興味合致度テーブル更新部40により設定される。
In the interest match degree field, the similarity score score 0 (p, u) between the contents of the program u viewed in the past by the user u of the row and the program p of the row is set by the interest match degree
<良興味合致度テーブル>
良興味合致度テーブル96には、図7に示すように、ユーザIDフィールドと、番組IDフィールドと、良興味合致度フィールドとが含まれる。
<Good interest match degree table>
As shown in FIG. 7, the good interest match degree table 96 includes a user ID field, a program ID field, and a good interest match degree field.
良興味合致度フィールドは、当該行のユーザ u の過去に録画した番組と、当該行の番組 p との内容の類似度 score1(p,u) が良興味合致度テーブル更新部60により設定される。
In the good interest match degree field, the similarity score 1 (p, u) between the contents of the program u recorded in the past of the user u in the row and the program p in the row is set by the good interest match
<重みパラメータ記録部>
重みパラメータ記録部97には、番組推薦部70がユーザ u に番組 p を推薦するための推薦スコア score(p,u) を以下の式(1)のように算出するための重み λ0、λ1 が格納されている。
<Weight parameter recording section>
The weight
以下に、上記の構成における番組視聴時の処理を説明する。 Below, the process at the time of program viewing in the above configuration will be described.
図8は、本発明の一実施形態における番組視聴時の処理のフローチャートである。 FIG. 8 is a flowchart of processing when viewing a program according to an embodiment of the present invention.
ステップ110)視聴情報テーブル更新部10が、視聴情報テーブル92に、視聴された番組、視聴したユーザに応じて番組IDフィールド、ユーザIDフィールドを設定する。また、視聴/録画種別フィールドを「視聴」と設定する。そのような行 v を視聴情報テーブル92に挿入する。
Step 110) The viewing information
ステップ120)興味情報テーブル更新部30が、上記行 v の情報を元に興味情報テーブル82を更新する。
Step 120) The interest information
ステップ130)興味合致度テーブル更新部50が、上記行 v の情報を元に興味合致度テーブル84を更新する。
Step 130) The interest coincidence degree
次に、上記の図8のステップ120の処理を詳細に説明する。 Next, the processing of step 120 in FIG. 8 will be described in detail.
図9は、本発明の一実施の形態における図8のステップ120の詳細な処理のフローチャートである。今、行 v のユーザ、対象となっている番組がそれぞれ u、p であるとする。 FIG. 9 is a flowchart of detailed processing of step 120 in FIG. 8 according to the embodiment of the present invention. Now, assume that the user in row v and the target program are u and p, respectively.
ステップ121)番組情報取得部10が、番組情報テーブル91を参照し、番組IDが p である行の内容フィールドの値を取得する。
Step 121) The program
ステップ122)興味情報テーブル更新部30が、形態素解析器の分かち書き機能を用いて前記番組 p の内容に含まれる単語集合 W を取得する。
Step 122) The interest information
ステップ123)興味情報テーブル更新部30が、上記単語集合 W に含まれる個々の単語 w に対して、番組 p の内容における統計量、例えば、出現頻度(文献3(Manning, C.D. et al., "Introduction to information retrieval", 2008)記載の「TF値」) tf(p,w) を算出する。単語 w の番組 p の内容における重みを算出するにあたって、出現頻度だけでなく、別の尺度(文献3記載の「TFIDF値」等)を用いても構わない。
Step 123) The interest information
ステップ124)興味情報テーブル更新部30が、興味情報テーブル93を参照し、ユーザIDフィールドの値が u、単語フィールドの値が wの行の特徴量フィールドの値 interest0(u,w) を取得する。ただし、ユーザIDフィールドの値が u、単語フィールドの値が wの行が存在しない場合は interest0(u,w) の値は0とする。
Step 124) The interest information
ステップ125)興味情報テーブル更新部30が、興味情報テーブル93に、ユーザIDフィールドの値が u、単語フィールドの値が w の行の特徴量フィールドの値を interest0(u,w)+ tf(p,w) とするように更新または挿入する。
Step 125) The interest information
次に、上記の図8のステップ130の処理を詳細に説明する。 Next, the processing of step 130 in FIG. 8 will be described in detail.
図10は、本発明の一実施の形態における図8のステップ130の詳細な処理のフローチャートである。今、行 v のユーザがそれぞれ u であるとする。 FIG. 10 is a flowchart of detailed processing of step 130 in FIG. 8 according to the embodiment of the present invention. Suppose now that each user in row v is u.
ステップ131)興味合致度テーブル更新部50が、興味情報テーブル93を参照し、ユーザIDが u の行に出現する単語フィールドの値の集合を W とする。
Step 131) The interest match degree
ステップ132)興味合致度テーブル更新部50が、上記単語集合 W に含まれる個々の単語 w に対して、興味情報テーブル93を参照し、ユーザIDが u で単語が w の行の特徴量フィールドの値 interest0(u,w) を取得する。
Step 132) The interest coincidence degree
ステップ133)興味合致度テーブル更新部50が、番組情報テーブル91を参照し、放送時間フィールドの値が現在時刻よりも未来の番組集合 P を取得する。
Step 133) The interest match degree
ステップ134)興味合致度テーブル更新部50が、前記番組集合 P 中の各番組 p の内容フィールドにおける、前記単語集合 W 内の各単語 w の統計量(例えば文献3記載の「TF値」) tf(p,w) を算出する。もし番組 p の本文フィールドに単語 w が含まれない場合は、tf(p,w)=0とする。
Step 134) The interest coincidence degree
ステップ135)興味合致度テーブル更新部50が、前記番組 p のユーザu に対する興味合致度 score0(p,u) を以下の式(2)を用いて算出する。
Step 135) The interest coincidence degree
ステップ136)興味合致度テーブル更新部50が、興味合致度テーブル95を、ユーザIDが u で、番組IDが p の行の興味合致度フィールドの値が前記興味合致度 score0(p,u) となるように更新する。
Step 136) The interest coincidence degree
次に、番組録画時の処理を説明する。 Next, processing at the time of program recording will be described.
図11は、本発明の一実施形態における番組録画時の処理のフローチャートである。 FIG. 11 is a flowchart of processing at the time of program recording in one embodiment of the present invention.
ステップ210)視聴情報テーブル更新部10が、視聴情報テーブル92に、視聴された番組、視聴したユーザに応じて番組IDフィールド、ユーザIDフィールドを設定する。また、視聴/録画種別フィールドを「録画」と設定する。そのような行 r を視聴情報テーブル92に挿入する。
Step 210) The viewing information
ステップ220)良興味情報テーブル更新部50が、上記行 r の情報を元に良興味情報テーブル94を更新する。
Step 220) The good / interest information
ステップ230)良興味合致度テーブル更新部50が、上記行 r の情報を元に良興味合致度テーブル96を更新する。
Step 230) The good interest coincidence degree
次に、上記の図11のステップ220の処理を詳細に説明する。 Next, the processing of step 220 in FIG. 11 will be described in detail.
図12は、本発明の一実施の形態における図11のステップ220の詳細な処理のフローチャートである。今、行 r のユーザ、対象となっている番組がそれぞれ u、p であるとする。 FIG. 12 is a flowchart of detailed processing of step 220 in FIG. 11 according to the embodiment of this invention. Assume that the user in row r and the target programs are u and p, respectively.
ステップ221)番組情報取得部10が、番組情報テーブル91を参照し、番組IDが p である行の内容フィールドの値を取得する。
Step 221) The program
ステップ222)良興味情報テーブル更新部40が、形態素解析器の分かち書き機能を用いて前記番組 p の内容に含まれる単語集合 W を取得する。
Step 222) The good interest information
ステップ223)良興味情報テーブル更新部40が、上記単語集合 W に含まれる個々の単語 w に対して、番組 p の内容における統計量、例えば出現頻度(文献3(Manning, C.D. et al., "Introduction to information retrieval", 2008)記載の「TF値」) tf(p,w) を算出する。単語 w の番組 p の内容における重みを算出するにあたって、出現頻度だけでなく、別の尺度(文献3記載の「TFIDF値」等)を用いても構わない。
Step 223) The good interest information
ステップ224)良興味情報テーブル更新部40が、良興味情報テーブル94を参照し、ユーザIDフィールドの値が u、単語フィールドの値が wの行の特徴量フィールドの値 interest1(u,w) を取得する。但し、ユーザIDフィールドの値が u、単語フィールドの値が wの行が存在しない場合は interest1(u,w) の値は0とする。
Step 224) The good interest information
ステップ225)良興味情報テーブル更新部40が、良興味情報テーブル94に、ユーザIDフィールドの値が u、単語フィールドの値が w の行の特徴量フィールドの値を interest1(u,w)+ tf(p,w) とするように更新または挿入する。
Step 225) The good interest information
次に、上記の図11のステップ230の処理を詳細に説明する。
Next, the processing of
図13は、本発明の一実施の形態における図11のステップ230の詳細な処理のフローチャートである。今、行 r のユーザがそれぞれ u であるとする。
FIG. 13 is a flowchart of detailed processing of
ステップ231)良興味合致度テーブル更新部60が、良興味情報テーブル94を参照し、ユーザIDが u の行に出現する単語フィールドの値の集合を W とする。
Step 231) The good interest coincidence degree
ステップ232)良興味合致度テーブル更新部60が、上記単語集合 W に含まれる個々の単語 w に対して、良興味情報テーブル94を参照し、ユーザIDが u で単語が w の行の特徴量フィールドの値 interest1(u,w) を取得する。
Step 232) The good interest coincidence degree
ステップ233)良興味合致度テーブル更新部60が、番組情報テーブル91を参照し、放送時間フィールドの値が現在時刻よりも未来の番組集合 P を取得する。
Step 233) The good interest coincidence degree
ステップ234)良興味合致度テーブル更新部60が、前記番組集合 P 中の各番組 p の内容フィールドにおける、前記単語集合 W 内の各単語 w の統計量(例えば文献3記載の「TF値」) tf(p,w) を算出する。もし番組 p の本文フィールドに単語 w が含まれない場合は、tf(p,w)=0とする。
Step 234) The good interest coincidence degree
ステップ235)良興味合致度テーブル更新部60が、前記番組 p のユーザuに対する興味合致度 score1(p,u) を以下の式(3)を用いて算出する。
Step 235) The good interest match degree
ステップ236)良興味合致度テーブル更新部60が、良興味合致度テーブル96を、ユーザIDが u で、番組IDが p の行の良興味合致度フィールドの値が前記良興味合致度 score1(p,u) となるように更新する。
Step 236) The good interest match degree
図14は、本発明の一実施の形態におけるユーザログオン時の処理のフローチャートである。 FIG. 14 is a flowchart of processing at the time of user logon according to an embodiment of the present invention.
ユーザ u がログオンすると、
ステップ310)番組推薦部70が、興味合致度テーブル95を参照し、ユーザIDフィールドが u の行 I0 u を取得する。
When user u logs on,
Step 310) The
ステップ320)番組推薦部70が、良興味合致度テーブル96を参照し、ユーザIDフィールドが u の行 I1 u を取得する。
Step 320) The
ステップ330)番組推薦部70が、重みパラメータ記録部97を参照し、重みパラメータ λ0、λ1 を取得する。
Step 330) The
ステップ340)番組推薦部70が、番組情報テーブル91を参照し、放送時間フィールドの値が現在時刻よりも未来の番組集合 P を取得する。
Step 340) The
ステップ350)番組推薦部70が、前記番組集合 P の各番組 p について、前記興味合致度テーブル95内のユーザIDがユーザ uのもの I0 u のうち番組IDが pの行の興味合致度score0(p,u)と、前記良興味合致度テーブル96内のユーザIDがユーザ u のもの I1 uのうち番組IDが p の行の良興味合致度score1(p,u)とを取得し、式(1)を用いてユーザ u への番組 p の推薦スコア score(p,u)を算出する。
Step 350) The
ステップ360)番組推薦部70が、前期番組集合 P 内の各番組 p のユーザ u に対する推薦スコア score(p,u) の値を用いてユーザ u に推薦すべき番組を決定する。その際、推薦スコアフィールドの値が大きいものから順に予め設定した任意の件数 N (N=1,2,3,…)件を推薦すべき番組としてもよいし、推薦スコアに対し、ある閾値を設けて、 推薦スコアがその値を超えるものを推薦すべき番組としてもよい。
Step 360) The
次に、重みパラメータ更新部80による重みパラメータの更新処理を説明する。
Next, weight parameter update processing by the weight
図16は、本発明の一実施の形態における重みパラメータ更新時の処理のフローチャートである。重みパラメータは、本実施の形態のように、文献4(Hosmer, D.W. et al., "Applied logistic regression", 2000)記載のロジスティック回帰モデルを用いて自動で算出してもよいし、文献5(Cristianini, N. et al., "An introduction to support Vector Machines: and other kernel-based learning methods", 2000)記載のサポートベクトルマシン等を用いて自動で算出してもよいし、人手にて適当な重みパラメータを設定してもよい。重みパラメータの更新は、システムの管理者の明示的な入力で開始するようにしてもよいし、定期的にバッチ処理するようにしてもよい。 FIG. 16 is a flowchart of processing when updating the weight parameter according to the embodiment of the present invention. The weight parameter may be automatically calculated using a logistic regression model described in Reference 4 (Hosmer, DW et al., “Applied logistic regression”, 2000) as in the present embodiment, or Reference 5 ( Cristianini, N. et al., "An introduction to support Vector Machines: and other kernel-based learning methods", 2000) A weight parameter may be set. The update of the weight parameter may be started by an explicit input from the system administrator, or may be periodically batch processed.
ステップ410)重みパラメータ更新部80は、視聴情報テーブル92のユーザIDフィールドに出現するユーザ集合 U を取得する。
Step 410) The weight
ステップ420)重みパラメータ更新部80は、番組情報テーブル91を参照し、放送時間フィールドの値が現在時刻よりも過去の番組集合 P を取得する。
Step 420) The weight
ステップ430)重みパラメータ更新部80は、興味合致度テーブル95、良興味合致度テーブル96を参照し、前記番組集合 P の各質問と、前記ユーザ集合 U の各ユーザとの各質問との組合せ (p,u) について、興味合致度 score0(p,u) と、良興味合致度 score1(p,u) を取得し、以下の式を用いて l(p,u)を算出する。
Step 430) The weight
ステップ440)重みパラメータ更新部80は、前記番組集合 P 内の各番組 p と、前記ユーザ集合 U 内の各ユーザ u について、視聴情報テーブル92に、ユーザIDが u で、番組IDが p で、視聴/録画フィールドの値が「録画」の行が存在する場合 b(p,u)=α とし、ユーザIDが u で、番組IDが p で、視聴/録画フィールドの値が「録画」の行は存在しないが、「視聴」の行が存在する場合は b(p,u)=β とし、ユーザIDが u で、番組IDが pの行が存在しない場合は b(p,u)=0 とする。このとき、L(λ0,λ1) を以下の式を用いて算出する。
Step 440) The weight
上記の式(5)は、λ0とλ1の尤度と呼ばれる尺度で、過去に u が p を録画したか、視聴したか b(p,u) と、各番組のユーザ毎の式(4)で表わされる l(p,u)から、設定したλ0とλ1がどれだけ過去の視聴情報とマッチしているかを表す尺度である。従って、式(5)を最大にするようなλ0、λ1が最も適切な重みパラメータであると考えられる。 The above equation (5) is a measure called the likelihood of λ 0 and λ 1 , and whether u has recorded or watched p in the past b (p, u) and the equation for each program user ( This is a scale that represents how much the set λ 0 and λ 1 match the past viewing information from l (p, u) represented by 4). Therefore, λ 0 and λ 1 that maximize Equation (5) are considered to be the most appropriate weight parameters.
ステップ450)重みパラメータ更新部80は、文献6(Liu, D.C. et al., "On the limited memory BFGS method for large scale optimization", 1989)記載の準ニュートン法等による最適化手法により、式(4)で表わされる L(λ0,λ1) を最大にするλ0、λ1 を算出する。
Step 450) The weight
ステップ460)重みパラメータ更新部80は、重みパラメータ記録部97にさきほど算出した重みパラメータλ0、λ1 を記録する。
Step 460) The weight
なお、上記の番組推薦装置の各構成要素の処理をプログラムとして構築し、番組推薦装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。 It should be noted that the processing of each component of the program recommendation device can be constructed as a program and installed in a computer used as the program recommendation device for execution, or distributed via a network.
また、構築されたプログラムをハードディスクや、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。 In addition, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
1 番組推薦装置
2 外部端末
3 ネットワーク
4 外部装置
A0 通信部
B0 入出力部
10 番組情報取得部
20 視聴情報テーブル更新部
30 興味情報テーブル更新部
40 良興味情報テーブル更新部
50 興味合致度テーブル更新部
60 良興味合致度テーブル更新部
70 番組推薦部
80 重みパラメータ更新部
90 記憶部
91 番組情報テーブル
92 視聴情報テーブル
93 興味情報テーブル
94 良興味情報テーブル
95 興味合致度テーブル
96 良興味合致度テーブル
97 重みパラメータ記憶部
DESCRIPTION OF
Claims (7)
前記インターネット回線を利用した映像配信サービスにおける番組の情報を取得し、番組情報記憶手段に格納する番組情報取得手段と、
前記番組情報中の内容の要約テキストから単語を抽出する単語抽出手段と、
各番組情報における各単語の統計量を算出し、統計量記憶手段に格納する統計量算出手段と、
前記インターネット回線を利用した映像配信サービスにおける各ユーザの視聴または録画の視聴情報を取得し、視聴情報記憶手段に格納する視聴情報取得手段と、
取得した前記視聴情報からユーザと、前記視聴情報の対象である番組の前記番組情報記憶手段に格納されている内容の要約テキストから算出した前記各単語の統計量から、該ユーザの該単語に対する興味量を算出し、前記ユーザの識別子と、前記単語と共に興味量記憶手段に格納する興味量算出手段と、
前記興味量記憶手段に格納されている各ユーザの各単語に対する統計量と、前記番組情報記憶手段に格納されている番組のうち、放送前の番組のみの前記各単語の統計量から、該ユーザの該質問に対する興味合致度を算出し、該ユーザの識別子と、該番組の識別子と共に興味合致度記憶手段に格納する興味合致度算出手段と、
前記番組情報記憶手段の前記番組のうち、前記視聴情報記憶手段を参照して、録画された番組のみを選出し、前記統計量記憶手段に格納されている該録画の対象である番組の前記各単語の統計量から、該ユーザの該単語に対する良興味量を算出し、前記ユーザの識別子と、前記単語と共に良興味量記憶手段に格納する良興味量算出手段と、
前記良興味量記憶手段に格納されている各ユーザの各単語に対する統計量と、前記番組情報記憶手段に格納されている番組のうち、放送前の番組のみの前記各単語の統計量から、該ユーザの該番組に対する良興味合致度を算出し、該ユーザの識別子と、該番組の識別子と共に良興味合致度記憶手段に格納する良興味合致度算出手段と、
前記番組情報記憶手段に格納されている番組のうち、放送済の番組と、該番組情報記憶手段に格納されているユーザのうち、視聴したことのある番組との全ての組合せについて、該番組情報記憶手段に格納されている該番組について該ユーザが録画したかどうかと、前記興味合致度記憶手段に格納されている興味合致度と、前記良興味合致度記憶手段に格納されている良興味合致度とを用いて、重みパラメータを算出し、重みパラメータ記憶手段に格納する重みパラメータ算出手段と、
ユーザの識別子が与えられると、該ユーザの前記番組情報記憶手段に格納されている放送前の各番組に対して、前記興味合致度記憶手段に格納されている興味合致度と、前記良興味合致度記憶手段に格納されている良興味合致度と、前記重みパラメータ記憶手段に格納された重みパラメータとを用いて、該ユーザの各番組に対する推薦スコアを算出し、前記推薦スコアの上位N件の質問の識別子を推薦番組として選択する番組推薦手段と、
を有することを特徴とする番組推薦装置。 In a video distribution service using an Internet line, a program recommendation device that uses information about whether a user has recorded a viewing history, particularly whether a program has been recorded by a user,
Program information acquisition means for acquiring program information in the video distribution service using the Internet line and storing the program information in the program information storage means;
Word extraction means for extracting words from summary text of contents in the program information;
A statistic calculating means for calculating a statistic of each word in each program information and storing it in a statistic storage means;
Viewing information acquisition means for acquiring viewing information of viewing or recording of each user in the video distribution service using the Internet line, and storing the viewing information in the viewing information storage means;
From the acquired viewing information, the user's interest in the word from the statistics of each word calculated from the summary text of the content stored in the program information storage means of the program that is the target of the viewing information An interest amount calculating means for calculating an amount, and storing the user identifier in the interest amount storage means together with the word;
From the statistics for each word of each user stored in the amount-of-interest storage means and the statistics for each word of only the pre-broadcast program among the programs stored in the program information storage means, the user Interest matching degree calculation means for calculating the interest matching degree for the question and storing the user identifier and the program identifier together with the interest matching degree storage means;
Of the programs in the program information storage means, referring to the viewing information storage means, only recorded programs are selected, and each of the programs to be recorded stored in the statistics storage means A good interest amount calculating means for calculating a good interest amount for the user from the statistic of the word, and storing the user identifier in the good interest amount storage means together with the word;
From the statistics for each word of each user stored in the good interest amount storage means and the statistics for each word of only the pre-broadcast program among the programs stored in the program information storage means, A good interest match degree calculating means for calculating a good interest match degree for the program of the user, and storing the user identifier in the good interest match degree storage means together with the identifier of the program;
Of all the programs stored in the program information storage means, the program information for all combinations of broadcasted programs and programs that have been viewed among the users stored in the program information storage means. Whether or not the user has recorded the program stored in the storage means, the interest match degree stored in the interest match degree storage means, and the good interest match stored in the good interest match degree storage means A weight parameter calculating means for calculating a weight parameter using the degree and storing the weight parameter in the weight parameter storage means;
Given a user identifier, for each pre-broadcast program stored in the program information storage means of the user, the interest match degree stored in the interest match degree storage means and the good interest match The recommendation score for each program of the user is calculated using the good interest match degree stored in the degree storage means and the weight parameter stored in the weight parameter storage means, and the top N of the recommended scores are calculated. Program recommendation means for selecting an identifier of a question as a recommended program;
A program recommendation device characterized by comprising:
前記各単語の統計量を算出する際に、重要と見做される単語を抽出するためのTF値(単語の出現頻度)、TFIDF値(単語の出現頻度と逆出現頻度)を用いる
請求項1記載の番組推薦装置。 The statistic calculation means includes:
2. A TF value (word appearance frequency) and a TFIDF value (word appearance frequency and reverse appearance frequency) for extracting a word regarded as important are used when calculating the statistic of each word. The program recommendation device described.
前記番組情報記憶手段に格納されている該番組に対して該ユーザが録画したかどうかと、前記興味合致度記憶手段に格納されている興味合致度と、前記良興味合致度記憶手段に格納されている良興味合致度に基づいて、ロジスティック回帰分析によって重みパラメータを算出する手段を含む
請求項1記載の番組推薦装置。 The weight parameter calculating means includes
Whether the user has recorded the program stored in the program information storage means, the interest match degree stored in the interest match degree storage means, and the good interest match degree storage means. The program recommendation device according to claim 1, further comprising means for calculating a weight parameter by logistic regression analysis based on the degree of good interest match.
記憶媒体に、番組情報記憶手段、統計量記憶手段、視聴情報記憶手段、興味量記憶手段、興味合致度記憶手段、良興味量記憶手段、良興味合致度記憶手段、重みパラメータ記憶手段、を格納し、番組情報取得手段、単語抽出手段、視聴情報取得手段、興味量算出手段、興味合致度算出手段、良興味量算出手段、良興味合致度算出手段、重みパラメータ算出手段、番組推薦手段と、を有する装置において、
前記番組情報取得手段が、前記インターネット回線を利用した映像配信サービスにおける番組の情報を取得し、前記番組情報記憶手段に格納する番組情報取得ステップと、
前記単語抽出手段が、前記番組情報中の内容の要約テキストから単語を抽出する単語抽出ステップと、
統計量算出手段が、各番組情報における各単語の統計量を算出し、前記統計量記憶手段に格納する統計量算出ステップと、
前記視聴情報取得手段が、前記インターネット回線を利用した映像配信サービスにおける各ユーザの視聴または録画の視聴情報を取得し、前記視聴情報記憶手段に格納する視聴情報取得ステップと、
前記興味量算出手段が、取得した前記視聴情報からユーザと、前記視聴情報の対象である番組の前記番組情報記憶手段に格納されている内容の要約テキストから算出した前記各単語の統計量から、該ユーザの該単語に対する興味量を算出し、前記ユーザの識別子と、前記単語と共に前記興味量記憶手段に格納する興味量算出ステップと、
前記興味合致度算出手段が、前記興味量記憶手段に格納されている各ユーザの各単語に対する統計量と、前記番組情報記憶手段に格納されている番組のうち、放送前の番組のみの前記各単語の統計量から、該ユーザの該質問に対する興味合致度を算出し、該ユーザの識別子と、該番組の識別子と共に前記興味合致度記憶手段に格納する興味合致度算出ステップと、
前記量興味量算出手段が、前記番組情報記憶手段の前記番組のうち、前記視聴情報記憶手段を参照して、録画された番組のみを選出し、前記統計量記憶手段に格納されている該録画の対象である番組の前記各単語の統計量から、該ユーザの該単語に対する良興味量を算出し、前記ユーザの識別子と、前記単語と共に前記良興味量記憶手段に格納する良興味量算出ステップと、
前記良興味合致度算出手段が、前記良興味量記憶手段に格納されている各ユーザの各単語に対する統計量と、前記番組情報記憶手段に格納されている番組のうち、放送前の番組のみの前記各単語の統計量から、該ユーザの該番組に対する良興味合致度を算出し、該ユーザの識別子と、該番組の識別子と共に前期良興味合致度記憶手段に格納する良興味合致度算出ステップと、
前記重みパラメータ算出手段が、前記番組情報記憶手段に格納されている番組のうち、放送済の番組と、該番組情報記憶手段に格納されているユーザのうち、視聴したことのある番組との全ての組合せについて、該番組情報記憶手段に格納されている該番組について該ユーザが録画したかどうかと、前記興味合致度記憶手段に格納されている興味合致度と、前記良興味合致度記憶手段に格納されている良興味合致度とを用いて、重みパラメータを算出し、前記重みパラメータ記憶手段に格納する重みパラメータ算出ステップと、
前記番組推薦手段が、ユーザの識別子が与えられると、該ユーザの前記番組情報記憶手段に格納されている放送前の各番組に対して、前記興味合致度記憶手段に格納されている興味合致度と、前記良興味合致度記憶手段に格納されている良興味合致度と、前記重みパラメータ記憶手段に格納された重みパラメータとを用いて、該ユーザの各番組に対する推薦スコアを算出し、前記推薦スコアの上位N件の質問の識別子を推薦番組として選択する番組推薦ステップと、
を行うことを特徴とする番組推薦方法。 In a video distribution service using an Internet line, a program recommendation method that uses information about whether a user has recorded a viewing history, particularly whether a program has been recorded by a user,
Program information storage means, statistics amount storage means, viewing information storage means, interest amount storage means, interest match degree storage means, good interest amount storage means, good interest match degree storage means, weight parameter storage means are stored in the storage medium. Program information acquisition means, word extraction means, viewing information acquisition means, interest amount calculation means, interest match degree calculation means, good interest amount calculation means, good interest match degree calculation means, weight parameter calculation means, program recommendation means, In a device having
The program information acquisition unit acquires program information in a video distribution service using the Internet line, and stores the program information in the program information storage unit;
A word extracting step in which the word extracting means extracts a word from the summary text of the content in the program information;
A statistic calculating unit calculates a statistic of each word in each program information and stores it in the statistic storage unit;
The viewing information acquisition unit acquires viewing information of viewing or recording of each user in the video distribution service using the Internet line, and stores the viewing information in the viewing information storage unit;
From the statistics of each word calculated from the summary text of the content stored in the program information storage means of the user and the program that is the target of the viewing information, the interest amount calculating means from the acquired viewing information, An interest amount calculation step of calculating an interest amount of the user for the word, and storing the user identifier in the interest amount storage unit together with the word;
The interest match degree calculating means includes a statistical quantity for each word of each user stored in the interest amount storage means, and each of the programs stored in the program information storage means for only the program before broadcasting. An interest matching degree calculating step of calculating an interest matching degree with respect to the question of the user from a statistic of a word, and storing the user's identifier and the interest matching degree storage unit together with the identifier of the program;
The amount-of-interest calculation means selects only the recorded programs from among the programs stored in the program information storage means with reference to the viewing information storage means, and stores the recorded programs stored in the statistics storage means A good interest amount calculation step of calculating a good interest amount for the word of the user from the statistics of the word as a target of the program and storing the user's identifier and the word together with the good interest amount storage unit When,
The good interest coincidence calculation means calculates only the pre-broadcast programs among the statistics for each word of each user stored in the good interest quantity storage means and the programs stored in the program information storage means. A good interest match degree calculating step of calculating a good interest match degree for the program from the statistic of each word, and storing the user's identifier in the previous good interest match degree storage means together with the identifier of the program; ,
Of the programs stored in the program information storage unit, the weight parameter calculation unit includes all broadcasted programs and programs that have been viewed among the users stored in the program information storage unit. Whether the user has recorded the program stored in the program information storage means, the interest match degree stored in the interest match degree storage means, and the good interest match degree storage means A weight parameter calculating step of calculating a weight parameter using the stored good interest match degree and storing it in the weight parameter storage means;
When the program recommendation means is given a user identifier, the interest match degree stored in the interest match degree storage means for each pre-broadcast program stored in the program information storage means of the user Using the good interest match degree stored in the good interest match degree storage means and the weight parameter stored in the weight parameter storage means, the recommendation score for each program of the user is calculated, and the recommendation A program recommendation step of selecting identifiers of the top N questions in the score as recommended programs;
A program recommendation method characterized by:
前記各単語の統計量を算出する際に、重要と見做される単語を抽出するためのTF値(単語の出現頻度)、TFIDF値(単語の出現頻度と逆出現頻度)を用いる
請求項4記載の番組推薦方法。 In the statistic calculation step,
5. When calculating the statistic of each word, a TF value (word appearance frequency) and a TFIDF value (word appearance frequency and reverse appearance frequency) for extracting a word regarded as important are used. The program recommendation method described.
前記番組情報記憶手段に格納されている該番組に対して該ユーザが録画したかどうかと、前記興味合致度記憶手段に格納されている興味合致度と、前記良興味合致度記憶手段に格納されている良興味合致度に基づいて、ロジスティック回帰分析によって重みパラメータを算出する
請求項4記載の番組推薦方法。 In the weight parameter calculating step,
Whether the user has recorded the program stored in the program information storage means, the interest match degree stored in the interest match degree storage means, and the good interest match degree storage means. The program recommendation method according to claim 4, wherein the weight parameter is calculated by logistic regression analysis based on the degree of good interest match.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010116543A JP5235940B2 (en) | 2010-05-20 | 2010-05-20 | Program recommendation device, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010116543A JP5235940B2 (en) | 2010-05-20 | 2010-05-20 | Program recommendation device, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011244340A true JP2011244340A (en) | 2011-12-01 |
JP5235940B2 JP5235940B2 (en) | 2013-07-10 |
Family
ID=45410508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010116543A Active JP5235940B2 (en) | 2010-05-20 | 2010-05-20 | Program recommendation device, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5235940B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014045264A (en) * | 2012-08-24 | 2014-03-13 | Nippon Hoso Kyokai <Nhk> | Recommended program presentation apparatus and program for the same |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001160955A (en) * | 1999-12-01 | 2001-06-12 | Sony Corp | Broadcast system and receiver |
JP2004194107A (en) * | 2002-12-12 | 2004-07-08 | Sony Corp | Information processor and information processing method, information processing system, recording medium, and program |
JP2009070364A (en) * | 2007-09-14 | 2009-04-02 | Palo Alto Research Center Inc | Recommendation system with special dynamic model composition |
JP2009141753A (en) * | 2007-12-07 | 2009-06-25 | Fujitsu Ltd | Recorder of broadcast program |
JP2010003106A (en) * | 2008-06-20 | 2010-01-07 | Nippon Telegr & Teleph Corp <Ntt> | Classification model generation device, classification device, classification model generation method, classification method, classification model generation program, classification program and recording medium |
-
2010
- 2010-05-20 JP JP2010116543A patent/JP5235940B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001160955A (en) * | 1999-12-01 | 2001-06-12 | Sony Corp | Broadcast system and receiver |
JP2004194107A (en) * | 2002-12-12 | 2004-07-08 | Sony Corp | Information processor and information processing method, information processing system, recording medium, and program |
JP2009070364A (en) * | 2007-09-14 | 2009-04-02 | Palo Alto Research Center Inc | Recommendation system with special dynamic model composition |
JP2009141753A (en) * | 2007-12-07 | 2009-06-25 | Fujitsu Ltd | Recorder of broadcast program |
JP2010003106A (en) * | 2008-06-20 | 2010-01-07 | Nippon Telegr & Teleph Corp <Ntt> | Classification model generation device, classification device, classification model generation method, classification method, classification model generation program, classification program and recording medium |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014045264A (en) * | 2012-08-24 | 2014-03-13 | Nippon Hoso Kyokai <Nhk> | Recommended program presentation apparatus and program for the same |
Also Published As
Publication number | Publication date |
---|---|
JP5235940B2 (en) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106331778B (en) | Video recommendation method and device | |
US7620551B2 (en) | Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet | |
CN107832437B (en) | Audio/video pushing method, device, equipment and storage medium | |
KR102008000B1 (en) | Computing similarity between media programs | |
US8380727B2 (en) | Information processing device and method, program, and recording medium | |
US9467744B2 (en) | Comment-based media classification | |
CN109511015B (en) | Multimedia resource recommendation method, device, storage medium and equipment | |
CN105653572A (en) | Resource processing method and apparatus | |
CN102265276A (en) | Context-based recommender system | |
KR20100086676A (en) | Method and apparatus of predicting preference rating for contents, and method and apparatus for selecting sample contents | |
US8174579B2 (en) | Related scene addition apparatus and related scene addition method | |
KR102150660B1 (en) | Method to recommend digital contents based on search log and apparatus therefor | |
CN107977678B (en) | Method and apparatus for outputting information | |
CN111966909B (en) | Video recommendation method, device, electronic equipment and computer readable storage medium | |
CN105718545A (en) | Recommendation method and device of multimedia resources | |
JP5244746B2 (en) | Question recommendation device, method and program | |
JP5404662B2 (en) | Product recommendation device, method and program | |
JP5356286B2 (en) | Question recommendation device, method and program | |
CN113626638A (en) | Short video recommendation processing method and device, intelligent terminal and storage medium | |
JP5373670B2 (en) | Question recommendation device, method and program | |
CN106445922B (en) | Method and device for determining title of multimedia resource | |
JP5235940B2 (en) | Program recommendation device, method and program | |
JP2012222569A (en) | Broadcast-program recommending device, method and program | |
JP5398648B2 (en) | Work recommendation device, method and program | |
JP5018148B2 (en) | Information processing apparatus, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110913 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121126 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130208 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5235940 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |