JP6069245B2 - Information processing apparatus, information processing apparatus control method, and program - Google Patents
Information processing apparatus, information processing apparatus control method, and program Download PDFInfo
- Publication number
- JP6069245B2 JP6069245B2 JP2014055093A JP2014055093A JP6069245B2 JP 6069245 B2 JP6069245 B2 JP 6069245B2 JP 2014055093 A JP2014055093 A JP 2014055093A JP 2014055093 A JP2014055093 A JP 2014055093A JP 6069245 B2 JP6069245 B2 JP 6069245B2
- Authority
- JP
- Japan
- Prior art keywords
- interest
- degree
- genre
- character string
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 66
- 238000000034 method Methods 0.000 title claims description 40
- 238000010801 machine learning Methods 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 27
- 238000004422 calculation algorithm Methods 0.000 description 22
- 238000006243 chemical reaction Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 9
- 238000009826 distribution Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 6
- 229920006395 saturated elastomer Polymers 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本発明は、情報処理装置、情報処理装置の制御方法、及びプログラムに関する。 The present invention relates to an information processing apparatus, a control method for the information processing apparatus, and a program.
近年、番組のジャンル等の情報を含む番組メタデータに基づいて、ユーザに番組を推薦するシステムやサービスが提案されている。これは、ユーザの番組視聴履歴を元に番組に対するユーザの嗜好を学習し、その学習結果に基づいてユーザの嗜好に合った番組を推薦するものである。 In recent years, systems and services that recommend programs to users based on program metadata including information such as program genres have been proposed. This learns the user's preference for the program based on the user's program viewing history, and recommends a program that matches the user's preference based on the learning result.
特許文献1には、第1計算部で計算された視聴履歴を参照し電子番組ガイド(EPG:Electronic Program Guide)から抽出されたトピックに対するユーザの嗜好度合いを示す数値と、第2計算部で計算された電子番組ガイド(EPG)と視聴履歴とに基づいてユーザの番組に対する嗜好度合いを示す数値とを用いて、ユーザに推薦するトピックとそれに対応する推薦番組とをユーザに提示する番組推薦装置が開示されている。
In
非特許文献1には、バラエティ番組や音楽番組だったら、ユーザが好んでいると思われる出演者によって選ぶとか、旅の番組だったら登場する地方で分析するとか、番組のジャンルだけでは分からない部分もカバーするようなテレビ番組のレコメンデーションのための技術が開示されている。
Non-Patent
しかしながら、上記従来の技術では、ユーザ自身が認める嗜好(興味度)と、ユーザの視聴履歴を元に学習した嗜好(興味度)との双方を反映させた状態で番組をお勧めすることは行われていなかった。そのため、例えば、サッカー中継の番組説明文には、お気に入りのチーム名やそのチームに所属する選手名が含まれることがある。そうすると、当該チームに所属する選手のファンであっても、その選手が出演しているバラエティ番組やトーク番組は、ユーザの視聴履歴を元に学習した嗜好(興味度)には属しないため、たとえユーザ自身が認める嗜好(興味度)に属したとしてもユーザに対して推薦されないという問題がある。 However, in the above conventional technique, it is not recommended to recommend a program in a state that reflects both the preference (interest) recognized by the user and the preference (interest) learned based on the user's viewing history. It wasn't. Therefore, for example, a program description for a soccer broadcast may include a favorite team name or a player name belonging to the team. Then, even if it is a fan of a player who belongs to the team, the variety program or talk program in which the player appears does not belong to the preference (degree of interest) learned based on the user's viewing history. There is a problem that even if it belongs to the preference (degree of interest) recognized by the user, it is not recommended for the user.
また、上記特許文献1に記載された番組推薦装置では、何れの計算部においても、ユーザの視聴履歴を参照することによりユーザの嗜好度合いの高いトピックに対応する番組を推薦しているため、ユーザの嗜好を自動的に学習した興味度に対応することはできても、ユーザ自身が認める嗜好や、ユーザがマニュアルで設定する興味度に対して対応できないという問題がある。
Further, in the program recommendation device described in
また、非特許文献1に記載された技術では、ユーザに対して特にお勧めする番組をピンポイントで抽出することはできるが、レコメンデーションのやり方に融通性がなく、ユーザの嗜好、興味度の変動に対しフレキシブルに対応したお勧め番組を提示することができないという問題がある。
In addition, with the technology described in Non-Patent
そこで本発明は、上記従来の問題点に鑑みてなされたもので、コンテンツのジャンルに対する興味度とコンテンツの文字列(ワード、単語)に対する興味度とを合成することにより、ユーザの嗜好にフレキシブルに対応したコンテンツを推薦することが可能な情報処理装置、情報処理装置の制御方法、及びプログラムを提供することを目的とする。 Therefore, the present invention has been made in view of the above-described conventional problems, and by combining the degree of interest with respect to the content genre and the degree of interest with respect to the character string (word, word) of the content, it is possible to flexibly meet the user's preference. An object of the present invention is to provide an information processing apparatus capable of recommending corresponding content, a method for controlling the information processing apparatus, and a program.
上記課題を解決するため、請求項1に記載の本発明における情報処理装置は、コンテンツの内容に基づく分類であるジャンル毎に予めジャンル興味度を設定するジャンル興味度設定手段と、ユーザの視聴履歴を分析することにより得られた文字列に対する前記ユーザの興味度を推定する文字列興味度推定手段と、前記文字列興味度推定手段により推定された前記ユーザの興味度を、前記ジャンル興味度設定手段により設定された前記ジャンル興味度を用いて変換して得られたお勧め度に対し、前記ジャンル興味度が設定されたコンテンツがすべてのコンテンツに対して如何なる割合でお勧めされるかを決定するための閾値を設定する閾値設定手段と、を含むことを特徴とする。 In order to solve the above-described problem, the information processing apparatus according to the first aspect of the present invention includes a genre interest degree setting unit that sets a genre interest degree in advance for each genre, which is a classification based on the content, and a user's viewing history. a string interestingness estimation means for estimating the degree of interest of the user for the character string obtained by analyzing a degree of interest of the user estimated by the character string interestingness estimation means, wherein the genre degree of interest set Decide what proportion of content with the genre interest level recommended for all content with respect to the recommendation level obtained by conversion using the genre interest level set by means And a threshold value setting means for setting a threshold value for doing so.
また、請求項2に記載の本発明における情報処理装置は、請求項1に記載の情報処理装置において、前記文字列に対する前記ユーザの興味度は、前記ユーザの嗜好を反映した視聴履歴に基づいて機械学習により作成された文字列に対する興味度であることを特徴とする。 An information processing apparatus according to a second aspect of the present invention is the information processing apparatus according to the first aspect, wherein the degree of interest of the user with respect to the character string is based on a viewing history reflecting the user's preference. wherein the interest degree der Rukoto for string produced by machine learning.
さらに、請求項3に記載の本発明における情報処理装置は、請求項1又は2に記載の情報処理装置において、前記文字列に対する前記ユーザの興味度は、前記文字列に対する興味度と前記文字列の順位との関係のうち、少なくとも非線形領域を正規化することにより推定されることを特徴とする。
Furthermore, the information processing apparatus according to the present invention described in
また、請求項4に記載の本発明における情報処理装置は、請求項1から3の何れか1項に記載の情報処理装置において、前記得られたお勧め度に対し、前記閾値設定手段により設定された閾値に基づいて、所定のジャンル興味度が設定されたジャンルに属するコンテンツの、全ジャンルのコンテンツに占めるお勧め割合を推定する手段をさらに含むことを特徴とする。 An information processing apparatus according to a fourth aspect of the present invention is the information processing apparatus according to any one of the first to third aspects , wherein the threshold setting means sets the obtained recommendation level. The method further includes means for estimating a recommended ratio of content belonging to a genre for which a predetermined genre interest degree is set based on the set threshold to the content of all genres .
そして、上記課題を解決するために、請求項5に記載の本発明における情報処理装置の制御方法は、コンテンツの内容に基づく分類であるジャンル毎に予めジャンル興味度を設定するジャンル興味度設定工程と、ユーザの視聴履歴を分析することにより得られた文字列に対する前記ユーザの興味度を推定する文字列興味度推定工程と、前記文字列興味度推定工程により推定された前記ユーザの興味度を、前記ジャンル興味度設定工程により設定された前記ジャンル興味度を用いて変換して得られたお勧め度に対し、前記ジャンル興味度が設定されたコンテンツがすべてのコンテンツに対して如何なる割合でお勧めされるかを決定するための閾値を設定する閾値設定工程と、を含むことを特徴とする。 And in order to solve the said subject, the control method of the information processing apparatus in this invention of Claim 5 sets the genre interest degree beforehand for every genre which is a classification | category based on the content content, The genre interest degree setting process When a string interestingness estimating step of estimating the degree of interest of the user with respect to the resulting string by analyzing the viewing history of the user, the interest degree of the user estimated by the character string interestingness estimating step The content set with the genre interest level is in any ratio with respect to the recommended level obtained by converting the genre interest level set in the genre interest level setting step . And a threshold value setting step for setting a threshold value for determining whether to be recommended.
また、上記課題を解決するために、請求項6に記載の本発明におけるプログラムは、情報処理装置のコンピュータに、コンテンツの内容に基づく分類であるジャンル毎に予めジャンル興味度を設定するジャンル興味度設定処理と、ユーザの視聴履歴を分析することにより得られた文字列に対する前記ユーザの興味度を推定する文字列興味度推定処理と、前記文字列興味度推定処理により推定された前記ユーザの興味度を、前記ジャンル興味度設定処理により設定された前記ジャンル興味度を用いて変換して得られたお勧め度に対し、前記ジャンル興味度が設定されたコンテンツがすべてのコンテンツに対して如何なる割合でお勧めされるかを決定するための閾値を設定する閾値設定処理と、を実行させることを特徴とする。 In order to solve the above problem, the program according to the present invention described in claim 6 sets a genre interest degree in advance for each genre, which is a classification based on the content content, in the computer of the information processing apparatus. and setting process, and the string interestingness estimate processing for estimating the degree of interest of the user with respect to the resulting string by analyzing the viewing history of the user, interests of the user estimated by the character string interestingness estimation process The ratio of the content set with the genre interest level to all the content with respect to the recommendation level obtained by converting the degree using the genre interest level set by the genre interest level setting process And a threshold value setting process for setting a threshold value for determining whether or not it is recommended.
本発明によれば、コンテンツのジャンルに対する興味度とコンテンツの文字列(ワード、単語)に対する興味度とを合成することにより、ユーザの嗜好にフレキシブルに対応したコンテンツを推薦することが可能な情報処理装置、情報処理装置の制御方法、及びプログラムが得られる。 According to the present invention, information processing that can recommend content flexibly corresponding to a user's preference by combining the interest level with respect to the genre of the content and the interest level with respect to the character string (word, word) of the content. Apparatus, information processing apparatus control method, and program are obtained.
次に、本発明を実施するための形態について図面を参照して詳細に説明する。なお、各図中、同一又は相当する部分には同一の符号を付しており、その重複説明は適宜に簡略化乃至省略する。本発明の内容を簡潔に説明すると、コンテンツのジャンル毎に予め設定された設定興味度と、コンテンツの視聴により推定された推定興味度とを合成する合成手段と、合成により、推定興味度に対する設定興味度のジャンルに属するコンテンツのお勧め度を生成する生成手段と、任意の設定興味度を有するジャンルに属するコンテンツの、全ジャンルのコンテンツに占めるお勧め割合を決定するための閾値を、生成されたお勧め度に対して設定する設定手段と、を含むことにより、ユーザの嗜好にフレキシブルに対応したコンテンツを推薦することができるのである。 Next, embodiments for carrying out the present invention will be described in detail with reference to the drawings. In addition, in each figure, the same code | symbol is attached | subjected to the part which is the same or it corresponds, The duplication description is simplified thru | or abbreviate | omitted suitably. Briefly explaining the contents of the present invention, a setting means for setting the estimated interest level by combining the setting interest degree preset for each content genre and the estimated interest degree estimated by viewing the content, and the composition. A generating means for generating a recommendation level of content belonging to a genre of interest level and a threshold value for determining a recommended ratio of content belonging to a genre having an arbitrary set interest level in all genres are generated. In addition, by including setting means for setting the recommendation level, it is possible to recommend content that flexibly corresponds to the user's preference.
すなわち、ユーザが設定したコンテンツのジャンル毎の興味度に応じた非線形の数式で、自動的に学習した興味度の推定値を変換している。この変換において、自動的に学習した興味度の推定値の分布を制御することを目的としている。そして、ジャンルに対する興味度に対して平均的なお勧め度を生成する場合と比較して、ジャンルに対する興味度が設定されたコンテンツが、全ジャンルのコンテンツに対してどれくらいの割合でお勧めされるかを決定するために閾値を設けることとしている。要するに、どれくらいの重み付け(傾斜)をつけてジャンルに対する興味度毎にお勧め度を生成するかを決定するために閾値を設けることとしている。 That is, the estimated value of the degree of interest learned automatically is converted by a non-linear expression corresponding to the degree of interest for each genre of content set by the user. The purpose of this conversion is to control the distribution of the estimated values of the degree of interest learned automatically. And, what percentage of content with the genre interest level recommended for all genre content compared to the case of generating an average recommendation level for the genre interest level? In order to determine the threshold value, a threshold value is provided. In short, a threshold value is provided to determine how much weight (gradient) is added and a recommendation level is generated for each degree of interest in a genre.
まず、本発明の実施形態における情報処理装置を含む情報処理システム全体の構成について説明する。図1は、本発明の実施形態における情報処理装置を含む情報処理システム全体の構成を示す図である。図1を参照すると、本発明の実施形態における情報処理装置を含む情報処理システム10は、例えば、パーソナルコンピュータ(以下、PCともいう。)を一例とする情報処理装置200が、インターネット等の広く公衆によって接続可能なネットワーク300を介してWebサーバ400に接続されている。また、PC200は、放送局100から送信される放送波や、Webサーバ400から送出されるコンテンツを受信することができるようになっている。なお、情報処理装置200には、PC以外に図示しないスマートフォン等の携帯情報端末も含まれることは勿論である。
First, the configuration of the entire information processing system including the information processing apparatus according to the embodiment of the present invention will be described. FIG. 1 is a diagram illustrating a configuration of an entire information processing system including an information processing apparatus according to an embodiment of the present invention. Referring to FIG. 1, an
また、Webサーバ400は、PC200、及び図示しないスマートフォン等と、インターネット等のネットワーク300を介して接続されている。そして、PC200、及び図示しないスマートフォン等から発せられた任意のWebページに接続したい旨のアクセス要求に対して、URL(Uniform Resource Locator)で特定されたWebサーバ400から提供されるWebページの閲覧が可能となる。なお、図1中には、インターネット等のネットワーク300に対してPC200のみ接続されているが、情報処理装置は1台に限定されず、複数台接続されていることはいうまでも無い。
The
次に、本発明の実施形態における情報処理装置の全体構成について説明する。図2は、本発明の実施形態における情報処理装置の全体構成について説明する概略ブロック図である。PC200は、TVチューナ部201と、ネットワーク接続部205と、CPU(Central Processing Unit)206と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、HDD(Hard Disk Drive)204と、表示部207と、入力部208と、電源部209とから構成される。
Next, the overall configuration of the information processing apparatus according to the embodiment of the present invention will be described. FIG. 2 is a schematic block diagram illustrating the overall configuration of the information processing apparatus according to the embodiment of the present invention. The
TVチューナ部201は、放送局100(図1)から送信される地上デジタル、BS(Broadcasting Satellite)、及びCS(Communications Satellite)放送をアンテナから受信し復調するものである。ネットワーク接続部205は、インターネットに代表されるネットワーク300に接続され、ネットワーク300とのインタフェースを図るものである。CPU206は、PC200全体の動作を制御するものであり、ROM202に格納された制御プログラムをロードし、PC200の動作によって得られた様々なデータをRAM203に展開するものである。HDD204は、PC200のアプリケーションソフトウェアプログラムを格納したり、TVチューナ部201によって受信されたテレビ番組や、Webサーバ400から送出されるコンテンツ(以下、これ等をまとめてコンテンツともいう。)を録画したりするものである。
The
表示部207は、LCD(Liquid Crystal Display)等で構成される表示画面であり、PC200によって実行されたアプリケーションソフトウェアプログラムの結果やTVチューナ部201によって受信されたテレビ番組、及びWebサーバ400から受信したコンテンツを表示するものである。入力部208は、キーボード、マウス、タッチパネル等、ユーザがPC200に対して指示を与えるものである。そして、電源部209は、PC200に対してAC(Alternative Current:交流)、又はDC(Direct Current:直流)電源を与えるものである。
The
次に、本発明の実施形態におけるWebサーバの全体構成について説明する。図3は、本発明の実施形態におけるWebサーバの全体構成について説明する概略ブロック図である。Webサーバ400は、ネットワーク接続部403と、CPU404と、ROM401と、データベース部402と、表示部405と、操作部406と、電源部407とから構成される。
Next, the overall configuration of the Web server in the embodiment of the present invention will be described. FIG. 3 is a schematic block diagram illustrating the overall configuration of the Web server according to the embodiment of the present invention. The
ネットワーク接続部403は、インターネットに代表されるネットワーク300(図1)に接続され、ネットワーク300とのインタフェースを図るものである。CPU404は、Webサーバ400全体の動作を制御するものであり、ROM401に格納された制御プログラムをロードし、CPU404の動作によって得られた様々なデータをデータベース部402に展開したり、後述するように、ユーザの嗜好に合致するコンテンツを送出したりするものである。表示部405は、LCD等で構成される表示画面であり、Webサーバ400によってデータベース部402に格納されたデータの格納状況等を表示するものである。操作部406は、キーボード、マウス、タッチパネル等、Webサーバ400の保守者が、Webサーバ400に対して指示を与えるものである。そして、電源部407は、Webサーバ400に対してAC又はDC電源を与えるものである。
The
次に、本発明の実施形態における情報処理装置の機能ブロックについて説明する。図4は、本発明の実施形態における情報処理装置の機能ブロック図である。 Next, functional blocks of the information processing apparatus according to the embodiment of the present invention will be described. FIG. 4 is a functional block diagram of the information processing apparatus according to the embodiment of the present invention.
図4において、PC200は、放送局100(図1)から送信される放送波を受信する複数のチューナ部210、211、212、及び213と、チューナ部210、211、212、及び213により復調されたテレビ番組や、Webサーバ400から送出されるコンテンツを記録し再生するするコンテンツ記録再生部214と、放送局100から送信される電波の隙間を使って送信される電子番組ガイド(EPG)を管理するEPG情報管理部217と、液晶(LCD)等のディスプレイ221にテレビ番組やコンテンツを表示する動画表示処理部215と、を含んで構成されている。なお、チューナ部の数は、4個に限定されないことは勿論である。
In FIG. 4, the
また、ディスプレイ221には、ライブ放送されているテレビ番組の画面、録画されたテレビ番組の再生画面、録画されたテレビ番組の一覧表、Webサーバ400から受信するコンテンツが表示されることは勿論であるが、後述するEPG情報管理部217により取得された、過去に放送された番組、現在放送されている番組、又は今後放送される予定の番組の番組表も表示される。また、テレビ番組とFacebook(登録商標)画面とを並べて表示したり、Facebook画面をテレビ画面のバックグラウンドで表示したりすることも可能である。
The
さらに、PC200は、インターネット等の公衆に利用可能なネットワーク300(図1)を介してWebサーバ400に接続するためのネットワーク接続処理部220と、チューナ部210、211、212、及び213により受信されたテレビ番組や、Webサーバ400から取得されたコンテンツに対するユーザの視聴履歴に基づいて、文字列(ワード、単語)を取得し記録する動画情報取得記録部219と、EPG情報管理部217から送信される電子番組表、及び興味情報取得部218を介して設定されたコンテンツのジャンル毎の興味度と、受信されたユーザの視聴履歴に基づいて機械学習により作成した文字列(ワード、単語)に対する興味度と順位との関係を正規化したものとの間で所定の演算を実行し、お勧め度を解析する映像解析処理部216と、映像解析処理部216で解析されたお勧め度をディスプレイ221に表示する動画表示処理部215と、PC200の動作を遠隔操作するリモコン222と、を含んで構成されている。
Further, the
次に、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の設定について説明する。図5は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の設定について説明する図である。 Next, setting of the degree of interest for each genre of content in the information processing apparatus according to the embodiment of the present invention will be described. FIG. 5 is a diagram illustrating setting of the degree of interest for each genre of content in the information processing apparatus according to the embodiment of the present invention.
図5に示すように、PC200のユーザは、チューナ部210、211、212、及び213を介して受信されるテレビ番組について、番組ジャンル501と各番組ジャンルに対する興味度502とを設定することができる。番組ジャンル501は、ニュース/報道、スポーツ、情報/ワイドショー、ドラマ、音楽、バラエティ、映画、アニメ/特撮、ドキュメンタリー/教養、劇場/公演、趣味/教育、福祉といった12ジャンルに分類されている。このジャンル分けは、ARIB(Association of Radio Industries and Business:社団法人電波産業界)で定められたジャンル分類にしたがっているが、これ以外にも任意のジャンル分類を用いることができる。また、興味度502は、興味なし(0)から興味あり(4)の5段階で設定することができる。
As shown in FIG. 5, the user of the
図5の例では、ニュース/報道は興味度1、スポーツは興味なし(0)、情報/ワイドショーは興味度1、ドラマは興味度2、音楽は興味あり(4)、バラエティは興味度2、映画は興味度3、アニメ・特撮は興味度3、ドキュメンタリー/教養は興味度2、劇場/公演は興味度3、趣味/教育は興味度1、福祉は興味なし(0)、にそれぞれ設定されている。この各番組ジャンルに対する興味度の設定は、ユーザがPC200を購入した直後、又はユーザがPC200を購入後、ある一定期間コンテンツを視聴した後に設定するようにしても良い。そして、この各番組ジャンルに対する興味度の設定は、表示部207に図5に示す画面が表示された状態で、興味情報取得部218(図4)に対してユーザがPC200の入力部208を用いて行うようにする。
In the example of FIG. 5, news / report coverage is
次に、本発明の実施形態における情報処理装置において視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係について説明する。図6は、本発明の実施形態における情報処理装置において視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を示す図である。 Next, the relationship between the degree of interest and the ranking for the character string created by machine learning based on the viewing history in the information processing apparatus according to the embodiment of the present invention will be described. FIG. 6 is a diagram showing the relationship between the degree of interest and the ranking for the character string created by machine learning based on the viewing history in the information processing apparatus according to the embodiment of the present invention.
図6に示すように、ユーザの嗜好を反映した視聴履歴に基づいて機械学習(マシンラーニング)により作成した文字列に対する興味度、換言すれば、視聴履歴に含まれる文字列(ワード、単語)を分析評価することにより得られた当該文字列(ワード、単語)に対する興味度を縦軸に、順位を横軸にとる。図6において、文字列に対する興味度が平均値にあるとき機械学習による順位は略網羅されるが、文字列に対する興味度が極端に大きくなるに連れて機械学習による順位は低下して飽和状態となり、文字列に対する興味度が極端に小さくなるに連れて機械学習による順位は増大して飽和状態となる。 As shown in FIG. 6, the degree of interest in the character string created by machine learning (machine learning) based on the viewing history reflecting the user's preference, in other words, the character string (word, word) included in the viewing history. The degree of interest for the character string (word, word) obtained by analyzing and evaluating is plotted on the vertical axis, and the rank is plotted on the horizontal axis. In FIG. 6, the ranking by machine learning is substantially covered when the degree of interest in the character string is an average value, but as the degree of interest in the character string becomes extremely large, the rank by machine learning decreases and becomes saturated. As the degree of interest in the character string becomes extremely small, the rank by machine learning increases and becomes saturated.
ここで、機械学習(マシンラーニング)について若干説明する。本実施形態では、お勧め度を生成する計算過程において、文字列による興味度推定アルゴリズムを利用している。文字列による興味度推定アルゴリズムは、電子番組ガイド(EPG)から取得される番組の概要や人名といった文字列情報から、ユーザの興味度を推定するものである。この推定は、例えば、TF/IDF(Term Frequency Inverse Document Frequency)、ナイーブベイズ、ベクトル空間法、サポートベクタマシン等、公知の機械学習(マシンラーニング)を用いて行っている。本実施形態では、図6に示した文字列に対する興味度と順位との関係のうち、非線形領域(飽和状態となっている領域)だけでなく、線形領域(文字列に対する興味度が略平均値にある非飽和領域)をも用いてコンテンツの推薦を行うことにより、推薦数の自由度を高めている。 Here, machine learning (machine learning) will be described briefly. In the present embodiment, an interest degree estimation algorithm based on a character string is used in a calculation process for generating a recommendation degree. The interest level estimation algorithm based on a character string estimates a user's interest level from character string information such as an outline of a program and a person's name acquired from an electronic program guide (EPG). This estimation is performed using known machine learning (machine learning) such as TF / IDF (Term Frequency Inverse Document Frequency), naive Bayes, vector space method, support vector machine, and the like. In the present embodiment, not only the nonlinear region (saturated region) but also the linear region (the degree of interest with respect to the character string is approximately the average value) of the relationship between the degree of interest and the ranking with respect to the character string illustrated in FIG. The degree of freedom of the number of recommendations is increased by recommending content using the non-saturated region in FIG.
次に、図6で作成した機械学習により作成した文字列に対する興味度と順位との関係を正規化したものについて説明する。図7は、図6で作成した機械学習により作成した文字列に対する興味度と順位との関係を正規化した図である。 Next, what normalized the relationship between the degree of interest and the ranking for the character string created by the machine learning created in FIG. 6 will be described. FIG. 7 is a diagram in which the relationship between the degree of interest and the rank for the character string created by the machine learning created in FIG. 6 is normalized.
図7において、図6における非線形曲線を線形式で正規化すると、図7の曲線Cに示すように、順位の平均値である0.5を中心として歪んでいる。本実施形態では、(0、1)の正規化を行うことにより、曲線Cを直線Dに近くなるように計算し変換している。そうすると、順位0.9の点を境として文字列に対する興味度が、約9対1に分割される。このように直線Dに近似しておけば、直線Dから超えた曲線Cの部分の長さは、全体に占める番組数と合い易くなる。 In FIG. 7, when the non-linear curve in FIG. 6 is normalized in a linear format, as shown by a curve C in FIG. In the present embodiment, the curve C is calculated and converted so as to be close to the straight line D by performing normalization of (0, 1). If it does so, the interest degree with respect to a character string will be divided | segmented into about 9 to 1 by the point of the order 0.9. When approximated to the straight line D in this way, the length of the portion of the curve C exceeding the straight line D can easily match the number of programs in the whole.
次に、本発明の実施形態における情報処理装置のお勧め度計算アルゴリズムについて説明する。図8は、本発明の実施形態における情報処理装置のお勧め度計算アルゴリズムについて説明する機能ブロック図である。 Next, the recommendation level calculation algorithm of the information processing apparatus in the embodiment of the present invention will be described. FIG. 8 is a functional block diagram for explaining the recommendation level calculation algorithm of the information processing apparatus according to the embodiment of the present invention.
図8に示すように、本実施形態の対象となるお勧め度計算アルゴリズム804は、1週間分の電子番組ガイド(EPG)801と、図5で説明したジャンル興味度802と、閾値803とを入力とし、最終的に閾値以上のお勧め度付き番組リスト806を出力するものである。1週間分のEPG801は、EPG情報管理部217(図4)によりテレビ放送の各番組の情報を格納したテーブルである。番組毎にタイトル、ジャンル、放送日時、放送局、その他のテキスト情報を保持する。
As shown in FIG. 8, the recommendation
ジャンル興味度802は、図5において説明したように、明示的にユーザが各ジャンルに対して設定した興味度である。“ドラマ”、“ニュース/報道”、“バラエティ”等の各ジャンルに対して、興味度を段階的に設定可能なものとする。
The
閾値803は、ジャンルに対する興味度毎に生成されたお勧め度に対する切り捨て位置(お勧め度の割合)を設定するものである。この閾値に関して、お勧め度計算アルゴリズム804と相関性を持たせることも本実施形態の特徴である。お勧め度計算アルゴリズム804は、本実施形態の主眼となる機能であり、お勧め度計算アルゴリズム804の計算過程において、図7で説明した文字列による興味度推定アルゴリズム805を利用する。
The
なお、1週間分の電子番組ガイド(EPG)801は、EPG情報管理部217(図4)によって取得された後、RAM203(図2)に格納され、ジャンル興味度802、及び閾値803は、入力部208を用いて入力された後、HDD204に格納される。文字列による興味度推定アルゴリズム805、及びお勧め度計算アルゴリズム804は、CPU206によって実行され、閾値以上のお勧め度付き番組リスト806は、HDD204又はRAM203に格納される。
The electronic program guide (EPG) 801 for one week is acquired by the EPG information management unit 217 (FIG. 4) and then stored in the RAM 203 (FIG. 2), and the
次に、本発明の実施形態における情報処理装置の動作について説明する。図9は、本発明の実施形態における情報処理装置の動作について説明するフローチャートである。 Next, the operation of the information processing apparatus in the embodiment of the present invention will be described. FIG. 9 is a flowchart for explaining the operation of the information processing apparatus according to the embodiment of the present invention.
本実施形態のお勧め度計算アルゴリズムは、特に興味度の正規化手順を有すること、ジャンル興味度による非線形変換を有することを特徴としている。また、足切りに用いる閾値設定も、本実施形態の特徴である。以下、動作の流れについて説明する。 The recommendation degree calculation algorithm of the present embodiment is characterized in that it particularly has an interest degree normalization procedure and a non-linear transformation based on genre interest degree. In addition, threshold setting used for cut off is also a feature of this embodiment. The operation flow will be described below.
図9において、まず、ステップ(以下、Sという。)901の処理では、文字列による番組の興味度が計算される。具体的には、図6で説明したような、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係が求められる。S902の処理では、コンテンツの数分ループしたか否かが判断される。コンテンツの数分ループしていない(S902:NO)と判断されると、コンテンツの数分ループするまで待機する。コンテンツの数分ループした(S902:YES)と判断されると、S903の処理へ移行する。 In FIG. 9, first, in the processing of step (hereinafter referred to as “S”) 901, the degree of interest of a program by a character string is calculated. Specifically, as described with reference to FIG. 6, the relationship between the degree of interest and the ranking for the character string created by machine learning based on the viewing history is obtained. In the process of S902, it is determined whether or not the number of contents has been looped. If it is determined that the number of contents is not looped (S902: NO), the process waits until the number of contents is looped. If it is determined that the number of contents has been looped (S902: YES), the process proceeds to S903.
S903の処理では、興味度の正規化が行われる。具体的には、図7で説明したような、図6で作成した機械学習により作成した文字列に対する興味度と順位との関係を正規化する処理である。興味度の正規化は、文字列による番組の興味度の推定値に対して、最大値を1、平均値を0.5、最小値を0とするような変換を行う。以後の計算の精度のためには、まず第1に、最大値、平均値、最小値は、直近のある期間の統計量を用いることである。例えば、TF/IDFやナイーブベイズを用いた演算の場合、理論的な最大/最小を規定することができないので、学習状況や番組表の状況に応じて、異なる統計量となる。状況に応じて最適に制御するためには、ある期間での統計量を用いることが望ましい。 In the process of S903, the interest level is normalized. Specifically, this is a process for normalizing the relationship between the degree of interest and the rank for the character string created by the machine learning created in FIG. 6 as described in FIG. In the normalization of the interest level, a conversion is performed such that the maximum value is 1, the average value is 0.5, and the minimum value is 0 with respect to the estimated value of the interest level of the program by the character string. For the accuracy of the subsequent calculations, first, the maximum value, the average value, and the minimum value are to use statistics for a certain period. For example, in the case of calculation using TF / IDF or naïve Bayes, the theoretical maximum / minimum cannot be defined, so that the statistic varies depending on the learning situation and the situation of the program guide. In order to optimally control according to the situation, it is desirable to use statistics over a certain period.
第2に、非線形な変換を用いて、正規化後の興味度の分布を一様分布に近づけることである。一様分布から大きく離れる場合、ジャンル興味度を用いた非線形変換による分布の制御が困難となるからである。 Secondly, the normalized interest distribution is brought close to a uniform distribution using a non-linear transformation. This is because if the distribution is far from the uniform distribution, it becomes difficult to control the distribution by non-linear transformation using the genre interest degree.
S904の処理では、コンテンツの数分ループしたか否かが判断される。コンテンツの数分ループしていない(S904:NO)と判断されると、コンテンツの数分ループするまで待機する。コンテンツの数分ループした(S904:YES)と判断されると、S905の処理へ移行する。 In the process of S904, it is determined whether or not the number of contents has been looped. If it is determined that the number of contents has not been looped (S904: NO), the process waits until the number of contents is looped. If it is determined that the number of contents has been looped (S904: YES), the process proceeds to S905.
S905の処理では、ジャンル興味度による非線形変換が行われる。ジャンル興味度による非線形変換は、図10に示すように正規化された文字列による興味度を非線形に変換する操作である。入力、出力共に、0−1の範囲を領域とするが、ジャンル興味度により、分布が制御される。変換式のイメージを図10に示す。図10は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の離散値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係を示す図である。 In the process of S905, non-linear conversion based on the genre interest is performed. The non-linear conversion based on the genre interest is an operation for converting the interest based on the normalized character string non-linearly as shown in FIG. Although both the input and output ranges from 0 to 1, the distribution is controlled by the degree of genre interest. An image of the conversion formula is shown in FIG. FIG. 10 normalizes the relationship between the discrete value of the degree of interest for each genre of content in the information processing apparatus according to the embodiment of the present invention and the degree of interest for the character string created by machine learning based on the viewing history. It is a figure which shows the relationship between the degree of interest and the recommendation degree with respect to the normalized character string when calculating a thing.
ジャンル興味度は1から3で、数値が大きいほど興味があるものとする。図10では、興味度3の変換式で生成されるお勧め度は高い方向に、興味度1の変換式で生成されるお勧め度は低い方向に、分布が移動することが分かる。また、興味度3の変換式で生成されるお勧め度は、正規化済み文字列に対する興味度が少しでも高くなればお勧め度は高くなり、興味度1の変換式で生成されるお勧め度は、正規化済み文字列に対する興味度が高くならない限り、お勧め度は高くならない。興味度1の変換式で生成されるお勧め度は、視聴履歴中に非常に興味度が高い文字列(ワード、単語)が書かれている番組に対しては高くなる傾向にある。したがって、ジャンル興味度が低いジャンルに属するコンテンツであっても、当該コンテンツに関連する派生コンテンツに対する視聴履歴に基づいて機械学習により作成された正規化文字列に対する興味度が高ければ、お勧め度が高くなるため、録画対象に成り易くなる。
The genre interest level is 1 to 3, and the greater the value, the more interested. In FIG. 10, it can be seen that the distribution moves in a direction in which the recommendation degree generated by the conversion formula of
分布を制御するため、ジャンル興味度が1(興味度1の変換式)であっても、正規化済み文字列による興味度推定値が十分高い場合には、お勧め度として上位に入ることができる。このような変換式は、べき乗や、座標点(0、0)、(1、1)を通る円弧形状等、複数想定される。何れの場合であっても類似する効果を与えることが可能である。このように、文字列による興味度推定値を、ジャンルに対する興味度を用いて変換し、順位を振り直している。その際、文字列による興味度を正規化し、番組の属するジャンルに設定されている興味度に応じてさらにお勧め度を上下させているのである。 In order to control the distribution, even if the genre interest level is 1 (conversion formula of interest level 1), if the estimated interest level based on the normalized character string is sufficiently high, the recommendation level may be higher. it can. A plurality of such conversion expressions are assumed, such as a power and an arc shape passing through coordinate points (0, 0) and (1, 1). In any case, it is possible to give a similar effect. Thus, the interest level estimated value based on the character string is converted using the interest level with respect to the genre , and the order is reassigned. At that time, the degree of interest by the character string is normalized, and the recommendation degree is further increased or decreased according to the degree of interest set in the genre to which the program belongs.
図9に戻り、S906の処理では、コンテンツの数分ループしたか否かが判断される。コンテンツの数分ループしていない(S906:NO)と判断されると、コンテンツの数分ループするまで待機する。コンテンツの数分ループした(S906:YES)と判断されると、S907の処理へ移行する。 Returning to FIG. 9, in the processing of S <b> 906, it is determined whether or not the number of contents has been looped. If it is determined that the content is not looped (S906: NO), the process waits until the content is looped. If it is determined that the number of contents has been looped (S906: YES), the process proceeds to S907.
S907の処理では、お勧め度によるソートが行われる。具体的には、図10に示すように、お勧め度の高い方から低い方へソートが行われ、お勧め度が生成される。S908の処理では、閾値による足切り処理が行われる。閾値設定方法のイメージを図11に示す。図11は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の離散値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係に対して閾値を設定したときの状態について説明する図である。 In the processing of S907, sorting is performed according to the recommendation level. Specifically, as shown in FIG. 10, sorting is performed from a higher recommendation level to a lower recommendation level to generate a recommendation level. In the process of S908, a cut-off process using a threshold value is performed. An image of the threshold setting method is shown in FIG. FIG. 11 normalizes the relationship between the discrete value of the degree of interest for each genre of content and the degree of interest and rank for a character string created by machine learning based on the viewing history in the information processing apparatus according to the embodiment of the present invention. It is a figure explaining the state when a threshold value is set with respect to the relationship between the degree of interest and the recommendation degree with respect to the normalized character string when the one is calculated.
各興味度に対応するコンテンツが、全ジャンルのコンテンツに対して平均的な割合で録画されるように閾値を設定する場合、正規化済みの文字列に対する興味度が0.5の場合の、各興味度における変換式の値を閾値に設定すれば良い。この場合、閾値は、閾値1、閾値2、閾値3のように設定する。同様に、例えば、各興味度に対応するコンテンツが、全ジャンルのコンテンツに対して30%の割合で録画されるように閾値を設定する場合には、正規化済みの文字列に対する興味度が0.7の場合の、各興味度における変換式の値を閾値に設定すれば良い。この場合、閾値は、閾値1´、閾値2´、閾値3´のように設定する。S908の処理における閾値による足切りが行われた後、処理を終了する。
When setting the threshold value so that the content corresponding to each degree of interest is recorded at an average ratio to the content of all genres, each of the cases where the degree of interest in the normalized character string is 0.5 What is necessary is just to set the value of the conversion formula in an interest degree to a threshold value. In this case, the thresholds are set as
ここで、ユーザに対し閾値に対する意味をどのようにして提示するかについて若干説明する。具体的には、閾値を十番単位の切り番となるように設定しておき、例えば閾値が50の場合には、画面イメージとして録画される番組と録画されない番組とに色分けして表示したり、録画されない番組はどれであり、全体的にいくつの番組が録画されるかをGUI(Graphical User Interface)で表示したりする等、閾値に対する意味を報知するユーザインタフェースは任意の形態を取り得る。 Here, how the meaning for the threshold value is presented to the user will be described briefly. Specifically, the threshold value is set to be a turn number in units of ten. For example, when the threshold value is 50, a program recorded as a screen image and a program not recorded are displayed in different colors. The user interface for informing the meaning of the threshold can take any form, such as displaying which program is not recorded and how many programs are recorded as a whole with a GUI (Graphical User Interface).
このように、本実施形態では、ユーザが設定したコンテンツのジャンル毎の興味度に応じた非線形の数式で、自動的に学習した興味度の推定値を変換している。この変換において、自動的に学習した興味度の推定値の分布を制御することを目的としている。そして、ジャンルに対する興味度に対して平均的なお勧め度を生成する場合と比較して、どれくらいの重み付け(傾斜)をつけてジャンルに対する興味度毎にお勧め度を生成するかを決定するために閾値を設けることとしている。 Thus, in this embodiment, the estimated value of the degree of interest learned automatically is converted by a non-linear mathematical expression corresponding to the degree of interest for each genre of content set by the user. The purpose of this conversion is to control the distribution of the estimated values of the degree of interest learned automatically. And, in order to determine how much weight (slope) to generate the recommendation degree for each degree of interest in the genre, compared to the case of generating the average recommendation degree for the interest degree in the genre A threshold is set.
次に、本発明の実施形態における情報処理装置のお勧め度逆計算アルゴリズムのシステム構成について説明する。図12は、本発明の実施形態における情報処理装置のお勧め度逆計算アルゴリズムについて説明する機能ブロック図である。 Next, the system configuration of the recommended degree inverse calculation algorithm of the information processing apparatus according to the embodiment of the present invention will be described. FIG. 12 is a functional block diagram illustrating the recommended degree reverse calculation algorithm of the information processing apparatus according to the embodiment of this invention.
図8では、閾値を離散的に設定する方法について説明した。ここまでの説明を応用すれば、ユーザが閾値を連続値として設定した場合であっても、閾値に対応する各ジャンルの興味度の変換式を用いて、ジャンル毎にどれくらいの割合で録画されるかを推定することができる。図12に示す機能ブロック図では、ジャンル興味度121と閾値122とを入力とし、お勧め度の逆算を行うアルゴリズムであるお勧め度逆算アルゴリズム123を用いてジャンル毎の推定録画割合124を提示することにより、設定された閾値の意味するところをユーザに対して提示することができる。
In FIG. 8, the method of setting the threshold values discretely has been described. Applying the description so far, even if the user sets the threshold value as a continuous value, the ratio is recorded for each genre using the interest level conversion formula for each genre corresponding to the threshold value. Can be estimated. In the functional block diagram shown in FIG. 12, the
お勧め度を逆算するアルゴリズムのイメージを図13に示す。図13は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の離散値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係に対して設定された閾値から逆算するときの状態について説明する図である。 FIG. 13 shows an image of the algorithm for calculating the recommended degree. FIG. 13 normalizes the relationship between the discrete value of the degree of interest for each genre of content in the information processing apparatus according to the embodiment of the present invention and the degree of interest for the character string created by machine learning based on the viewing history. It is a figure explaining the state at the time of calculating backward from the threshold set with respect to the relationship between the degree of interest and the recommendation degree with respect to the normalized character string when the one is calculated.
コンテンツのジャンル毎の興味度と、文字列に対する興味度と順位との関係を正規化したものと、を演算したときに生成されたお勧め度に対して、ユーザによって連続値として設定された任意の閾値と、ジャンル興味度1から3の変換式との交点を求める。交点の正規化済み文字列に対する興味度が、それぞれ、0.4、0.76、0.96となったとする。その結果、ジャンル興味度3の番組は、全ジャンルの番組に対して60%、ジャンル興味度2の番組は、全ジャンルの番組に対して24%、ジャンル興味度1の番組は、全ジャンルの番組に対して4%録画されるものと推定される。
Arbitrary value set as a continuous value by the user for the recommendation level generated when computing the interest level for each genre of content and the normalized relationship between the level of interest and ranking for the character string And the intersection of the
また、上記実施形態では、ジャンル興味度が1、2、3といった離散値を取るという想定で説明した。ジャンル興味度については、実数値として表現することも可能である。ジャンル興味度毎の変換式について、パラメータを興味度に応じて変化する実数として表現すれば良い。 Moreover, in the said embodiment, it demonstrated on the assumption that a genre interest degree takes discrete values, such as 1, 2, and 3. The genre interest level can also be expressed as a real value. The conversion formula for each genre interest level may be expressed as a real number that changes according to the interest level.
具体的には、べき乗を用いる場合には、べき数を実数としてジャンル興味度から算出すれば良い。すなわち、y=xnを用いる場合には、nを興味度にしたがって加減すれば良い。要するに、ジャンル興味度3の場合にはn=1/2、ジャンル興味度2の場合にはn=1、ジャンル興味度1の場合にはn=2のように、nを興味度に応じて連続値に設定すれば良い。
Specifically, when a power is used, the power may be calculated from the genre interest degree as a real number. That is, when y = x n is used, n may be adjusted according to the degree of interest. In short, n is 1/2 according to the
また、円弧を用いる場合には、中心点が上下どちらにあるかという点と、円弧の半径をジャンル興味度から算出するようにすれば良い。図14に、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の実数値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係を示す。図14におけるE領域が、コンテンツのジャンル毎の興味度を実数とした場合の領域である。 Also, when using an arc, the point of whether the center point is above and below and the radius of the arc may be calculated from the genre interest. In FIG. 14, the relationship between the real value of the degree of interest for each genre of content and the degree of interest for the character string created by machine learning based on the viewing history is normalized in the information processing apparatus according to the embodiment of the present invention. The relationship between the degree of interest and the recommendation degree for the normalized character string when the one is calculated. The area E in FIG. 14 is an area when the degree of interest for each genre of content is a real number.
さらに、上記実施形態では、ジャンル興味度は、図5に示すようにユーザが明示的に設定するものとしていたが、異なる方式により学習するようにしても良い。例えば、自動的に学習するようにしても良い。図14ではジャンル興味度を実数化できることを説明したが、ジャンル興味度として自動学習の値を用いても良い。特に、ユーザの意識と番組表の表現とがずれている場合に有効となる。さらに、お勧め度を録画目的以外の用途に用いることも可能である。 Further, in the above embodiment, the genre interest level is explicitly set by the user as shown in FIG. 5, but may be learned by a different method. For example, you may make it learn automatically. Although it has been explained in FIG. 14 that the genre interest level can be converted into a real number, an automatic learning value may be used as the genre interest level. This is particularly effective when the user's consciousness is different from the program guide expression. Furthermore, the recommendation level can be used for purposes other than recording purposes.
また、上記実施形態では、文字列(ワード、単語)に対する興味度推定値を正規化済み興味度として採用しているが、適当な判断手段を搭載することが可能であれば、画像データや音声データに対する興味度を、正規化済み興味度として採用することも可能である。さらに、各ジャンルに対する興味度をWebサーバから取得したりすることも可能である。 Further, in the above embodiment, the interest level estimated value for the character string (word, word) is adopted as the normalized interest level. However, if it is possible to mount an appropriate determination means, image data and audio The degree of interest in data can be adopted as the normalized degree of interest. Furthermore, it is possible to acquire the degree of interest for each genre from a Web server.
また、本実施形態では、テレビ番組を一例として説明しているが、同様な情報量が存在する他の分野に応用することが可能である。例えば、YouTube(登録商標)を一例とするVOD(Voice On Demand)やWebニュースといった、何らかのコンテンツがジャンル分けされており、ジャンル以外に興味度を取得することができ、ジャンル自体も別途興味度を評価できるものであれば、お勧め度を生成することが可能である。例えば、コンテンツに関するテキスト情報が一緒になっており、コンテンツに対する操作履歴に基づいて興味度又は好みを学習して行く。そして、テキスト情報の単語ベースでの学習に対して順位、得点を付与して行き、最終的に正規化されていれば良いのである。また、ジャンルに対する興味度が別途設定されており、ジャンルに対する興味度に対し、この正規化された重み付けを用いて変換すればお勧め度を生成することができる。 In the present embodiment, a television program is described as an example, but the present invention can be applied to other fields where a similar amount of information exists. For example, some contents such as VOD (Voice On Demand) and Web news, which are examples of YouTube (registered trademark), are classified into genres, and the degree of interest can be acquired in addition to the genre. If it can be evaluated, a recommendation degree can be generated. For example, text information related to the content is combined, and the degree of interest or preference is learned based on the operation history for the content. Then, the ranking and the score are assigned to the word-based learning of the text information, and it is only necessary to be normalized in the end. In addition, the degree of interest in the genre is set separately, and the degree of recommendation can be generated by converting the degree of interest in the genre using this normalized weight.
以上説明したように、本発明によれば、ジャンルに対する興味度と、文字列に対する興味度推定値の双方を合成したお勧めを行うことができる。そして、興味度が低いジャンルであっても、文字列に対する興味度推定値が特に高い場合には、お勧め度が高くなる。また、閾値を設定することにより、各ジャンルの録画割合の推定値という形で、提示することができる。 As described above, according to the present invention, it is possible to make a recommendation that combines both an interest level for a genre and an estimated interest level for a character string. Even if the genre has a low interest level, the recommendation level is high when the interest level estimation value for the character string is particularly high. Also, by setting a threshold value, it can be presented in the form of an estimated value of the recording ratio of each genre.
なお、図9に示した本発明の実施形態における情報処理装置(PC)200を構成する各機能ブロックの各動作は、コンピュータ上のプログラムに実行させることもできる。すなわち、情報処理装置200のCPU206が、ROM202、RAM203等から構成される記憶部に格納されたプログラムをロードし、プログラムの各処理ステップが順次実行されることによって行われる。
In addition, each operation | movement of each functional block which comprises the information processing apparatus (PC) 200 in embodiment of this invention shown in FIG. 9 can also be made to perform the program on a computer. That is, the processing is performed by the
以上説明してきたように、本発明によれば、コンテンツのジャンル毎に予め設定された設定興味度と、コンテンツの視聴により推定された推定興味度とを合成する合成手段と、合成により、推定興味度に対する設定興味度のジャンルに属するコンテンツのお勧め度を生成する生成手段と、任意の設定興味度を有するジャンルに属するコンテンツの、全ジャンルのコンテンツに占めるお勧め割合を決定するための閾値を、生成されたお勧め度に対して設定する設定手段と、を含むことにより、ユーザの嗜好にフレキシブルに対応したコンテンツを推薦することができるのである。 As described above, according to the present invention, the setting interest degree set in advance for each content genre and the estimated interest degree estimated by viewing the content are combined, and the combined interest is estimated by combining. Generating means for generating a recommendation degree of content belonging to the genre of the set interest degree with respect to the degree, and a threshold value for determining a recommended ratio of the content belonging to the genre having an arbitrary set interest degree in the content of all genres By including setting means for setting the generated recommendation level, it is possible to recommend content that flexibly corresponds to the user's preference.
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範囲な趣旨及び範囲から逸脱することなく、これら具体例に様々な修正及び変更が可能である。 The present invention has been described above by the preferred embodiments of the present invention. While the invention has been described with reference to specific embodiments thereof, various modifications and changes can be made to these embodiments without departing from the broader spirit and scope of the invention as defined in the claims. is there.
10 情報処理システム
100 放送局
121、802 ジャンル興味度
122、803 閾値
123 お勧め度逆算アルゴリズム
124 ジャンル毎の推定録画割合
200 情報処理装置(PC)
201 TVチューナ部
202、401 ROM
203 RAM
204 HDD
205、403 ネットワーク接続部
206、404 CPU
207、405 表示部
208 入力部
209、407 電源部
210、211、212、213 チューナ部
214 コンテンツ記録再生部
215 動画表示処理部
216 映像解析処理部
217 EPG情報管理部
218 興味情報取得部
219 動画情報取得記録部
220 ネットワーク接続処理部
221 ディスプレイ
222 リモコン
300 ネットワーク
400 Webサーバ
402 データベース部
406 操作部
501 番組ジャンル
502 興味度
801 1週間分のEPG
804 お勧め度計算アルゴリズム
805 文字列による興味度推定アルゴリズム
806 閾値以上のお勧め度付き番組リスト
DESCRIPTION OF
201
203 RAM
204 HDD
205, 403
207, 405
804 Recommended
Claims (6)
ユーザの視聴履歴を分析することにより得られた文字列に対する前記ユーザの興味度を推定する文字列興味度推定手段と、
前記文字列興味度推定手段により推定された前記ユーザの興味度を、前記ジャンル興味度設定手段により設定された前記ジャンル興味度を用いて変換して得られたお勧め度に対し、前記ジャンル興味度が設定されたコンテンツがすべてのコンテンツに対して如何なる割合でお勧めされるかを決定するための閾値を設定する閾値設定手段と、
を含むことを特徴とする情報処理装置。 A genre interest level setting means for setting a genre interest level in advance for each genre, which is a classification based on the content of the content;
Character string interest degree estimating means for estimating the user's interest degree with respect to the character string obtained by analyzing the user's viewing history;
The genre interest with respect to the recommendation degree obtained by converting the interest degree of the user estimated by the character string interest degree estimation means using the genre interest degree set by the genre interest degree setting means. A threshold setting means for setting a threshold for determining the proportion of recommended content for all content;
An information processing apparatus comprising:
ユーザの視聴履歴を分析することにより得られた文字列に対する前記ユーザの興味度を推定する文字列興味度推定工程と、
前記文字列興味度推定工程により推定された前記ユーザの興味度を、前記ジャンル興味度設定工程により設定された前記ジャンル興味度を用いて変換して得られたお勧め度に対し、前記ジャンル興味度が設定されたコンテンツがすべてのコンテンツに対して如何なる割合でお勧めされるかを決定するための閾値を設定する閾値設定工程と、を含むことを特徴とする情報処理装置の制御方法。 A genre interest level setting step for setting a genre interest level in advance for each genre, which is a classification based on the content of the content;
A character string interest degree estimating step for estimating the user's interest degree with respect to the character string obtained by analyzing the user's viewing history;
The genre interest with respect to the recommendation degree obtained by converting the interest degree of the user estimated in the character string interest degree estimation step using the genre interest degree set in the genre interest degree setting step. And a threshold value setting step for setting a threshold value for determining at what ratio the set content is recommended for all contents.
コンテンツの内容に基づく分類であるジャンル毎に予めジャンル興味度を設定するジャンル興味度設定処理と、
ユーザの視聴履歴を分析することにより得られた文字列に対する前記ユーザの興味度を推定する文字列興味度推定処理と、
前記文字列興味度推定処理により推定された前記ユーザの興味度を、前記ジャンル興味度設定処理により設定された前記ジャンル興味度を用いて変換して得られたお勧め度に対し、前記ジャンル興味度が設定されたコンテンツがすべてのコンテンツに対して如何なる割合でお勧めされるかを決定するための閾値を設定する閾値設定処理と、
を実行させるためのプログラム。 In the computer of the information processing device,
A genre interest level setting process for setting a genre interest level for each genre, which is a classification based on the content,
A character string interest estimation process for estimating the user's interest in the character string obtained by analyzing the user's viewing history;
The genre interest with respect to the recommendation degree obtained by converting the interest degree of the user estimated by the character string interest degree estimation process using the genre interest degree set by the genre interest degree setting process. A threshold setting process for setting a threshold value for determining what ratio is recommended for all contents,
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014055093A JP6069245B2 (en) | 2014-03-18 | 2014-03-18 | Information processing apparatus, information processing apparatus control method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014055093A JP6069245B2 (en) | 2014-03-18 | 2014-03-18 | Information processing apparatus, information processing apparatus control method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015177525A JP2015177525A (en) | 2015-10-05 |
JP6069245B2 true JP6069245B2 (en) | 2017-02-01 |
Family
ID=54256236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014055093A Active JP6069245B2 (en) | 2014-03-18 | 2014-03-18 | Information processing apparatus, information processing apparatus control method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6069245B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6828274B2 (en) * | 2016-05-31 | 2021-02-10 | 富士ゼロックス株式会社 | Information processing equipment and programs |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005352754A (en) * | 2004-06-10 | 2005-12-22 | Sharp Corp | Information navigation device, method, program, and recording medium |
JP4219913B2 (en) * | 2005-05-31 | 2009-02-04 | 三菱電機株式会社 | Program recording device |
-
2014
- 2014-03-18 JP JP2014055093A patent/JP6069245B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015177525A (en) | 2015-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6935523B2 (en) | Methods and systems for displaying contextually relevant information about media assets | |
US20240211521A1 (en) | Methods and systems for determining media content to download | |
US9235574B2 (en) | Systems and methods for providing media recommendations | |
US9684656B2 (en) | Creating personalized and continuous playlists for a content sharing platform based on user history | |
CN106471498B (en) | Systems and methods for filtering techniques using metadata and usage data analysis | |
US20150256885A1 (en) | Method for determining content for a personal channel | |
US10575057B2 (en) | Systems and methods for improving accuracy in media asset recommendation models | |
US20130086159A1 (en) | Media content recommendations based on social network relationship | |
US20140324895A1 (en) | System and method for creating and maintaining a database of annotations corresponding to portions of a content item | |
US20140379456A1 (en) | Methods and systems for determining impact of an advertisement | |
US20160314410A1 (en) | Systems and methods for improving accuracy in media asset recommendations based on data from one data space | |
US20160314404A1 (en) | Systems and methods for improving accuracy in media asset recommendations based on data from multiple data spaces | |
US10127398B2 (en) | Methods and systems for implementing parental controls | |
US20240251135A1 (en) | Systems and methods for providing content recommendations | |
US20160316238A1 (en) | Systems and methods for improving accuracy in media asset recommendation models based on users' levels of enjoyment with respect to media assets | |
US10390110B2 (en) | Automatically and programmatically generating crowdsourced trailers | |
EP3256966B1 (en) | Relevance table aggregation in a database system | |
JP6069246B2 (en) | Information processing apparatus, information processing apparatus control method, and program | |
US20230209134A1 (en) | Systems and methods for increasing first user subscription | |
JP6069245B2 (en) | Information processing apparatus, information processing apparatus control method, and program | |
US20240357202A1 (en) | Determining a time point to skip to within a media item using user interaction events | |
JP2013143731A (en) | Television broadcast recording reservation device | |
JP2018156157A (en) | Information processing unit, and method and program to support content selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161017 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6069245 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |