JP2011166621A - Video-content recommendation apparatus, method for determining recommended video content, and computer program - Google Patents

Video-content recommendation apparatus, method for determining recommended video content, and computer program Download PDF

Info

Publication number
JP2011166621A
JP2011166621A JP2010029455A JP2010029455A JP2011166621A JP 2011166621 A JP2011166621 A JP 2011166621A JP 2010029455 A JP2010029455 A JP 2010029455A JP 2010029455 A JP2010029455 A JP 2010029455A JP 2011166621 A JP2011166621 A JP 2011166621A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
content
video
video content
plurality
ranking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010029455A
Other languages
Japanese (ja)
Inventor
Hiroyuki Nakamura
Zengo Ohashi
博之 中村
漸悟 大橋
Original Assignee
Nomura Research Institute Ltd
株式会社野村総合研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To specify a new or topical video content so as to recommend the video content. <P>SOLUTION: A video-content recommendation apparatus includes: a data collecting part 11 for collecting text data from websites and video sites on the Internet; a keyword extracting part 13 for extracting video-content-related keywords, being keywords related to a plurality of video contents, from the collected text data; and a recommended-content determining part 17 that makes a ranking of the plurality of video contents on the basis of the extracted video-content-related keywords so as to determine a recommended video content from among the plurality of video contents on the basis of the ranking. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、新規あるいは話題性のある映像コンテンツを特定し、その映像コンテンツをユーザへ推奨するための技術に関する。 The present invention identifies a video content with a new or topical, to techniques for recommending the video content to the user.

従来、テレビ番組などの映像コンテンツをユーザに対して推奨するための様々な技術が提案されている。 Conventionally, various techniques to recommend to the user video content such as TV programs have been proposed. 例えば、特許文献1には、ユーザによる映像コンテンツの視聴履歴、及びウェブサイトへのアクセス履歴などの行動履歴に基づいてユーザの嗜好を推定し、その嗜好にあわせて映像コンテンツの推奨を行うことが記載されている。 For example, Patent Document 1, the viewing history of the video content by the user, and can estimate the preferences of the user based on the behavior history, such as access history to web sites, make recommendations for video content to suit their tastes Are listed.

特開2004−343321号公報 JP 2004-343321 JP

特許文献1に記載されている技術のように、ユーザの過去の行動履歴に基づいて推薦コンテンツが決定されるということは、ユーザの顕在化した嗜好に基づいて映像コンテンツが推奨されているということである。 As in the technique described in Patent Document 1, that the recommended content based on past behavior history of the user is determined, that has been recommended video content based on the preference that arise and the user it is. 従って、そのような顕在化した嗜好に基づくコンテンツ推奨は、ユーザに新たな出会い、あるいは意外性を与えるものではない。 Therefore, content recommendation based on the preference that such a manifestation does not provide a new encounter or unexpectedness, to the user.

一方で、多くのユーザは、新規あるいは話題性のある映像コンテンツに関する情報をいち早く得たいという願望を持っている。 On the other hand, many users have a desire to quickly obtain the information related to the video content that is new or topicality. これに対して、特許文献1の技術では、ユーザの嗜好性ジャンルを設定し、これに基づいて推奨コンテンツを決定しているが、必ずしも十分ではない。 In contrast, in the technique of Patent Document 1, it sets the preference genre of the user, but to determine the recommended content based on this, not necessarily sufficient.

そこで、本発明の目的は、新規あるいは話題性のある映像コンテンツを特定し、その映像コンテンツを推奨することである。 An object of the present invention is to identify the video content with a new or topical, and to recommend the video content.

本発明の一つの実施態様に従う映像コンテンツの推奨装置は、インターネット上のウェブサイト及び動画サイトからテキストデータを収集する収集手段と、前記収集手段が収集したテキストデータから、複数の映像コンテンツに関連するキーワードである映像コンテンツ関連キーワードを抽出する抽出手段と、前記抽出手段が抽出した映像コンテンツ関連キーワードに基づいて、前記複数の映像コンテンツのランキングを行うランキング手段と、前記ランキング処理部によるランキングに基づいて、前記複数の映像コンテンツの中から推奨する映像コンテンツを決定する推奨手段と、を備える。 Recommending apparatus of a video content according to one embodiment of the present invention includes a collecting means for collecting the text data from the website and video sites on the Internet, from the text data to which the collecting means collects, associated with a plurality of video contents extracting means for extracting the video content related keywords of the keyword, based on the video content related keyword extracted by the extracting unit, and ranking means for performing ranking of said plurality of video contents, based on the ranking by the ranking unit , and a recommended means for determining the video content to be recommended from among the plurality of video contents.

好適な実施態様では、前記収集手段が収集したテキストデータにおいて、前記抽出手段が抽出した映像コンテンツ関連キーワード別の出現頻度を算出する出現頻度算出手段と、前記複数の映像コンテンツについて、それぞれの映像コンテンツに係るコンテンツ参照情報を記憶する記憶手段と、をさらに備えてもよい。 In a preferred embodiment, the text data to which the collecting means collects the occurrence frequency calculating means for calculating the video content related keywords different frequency extracted by the extracting unit, for the plurality of video content, each of the video content storage means for storing the content reference information relating to may further comprise a. そして、前記ランキング手段は、前記記憶手段に記憶されているコンテンツ参照情報に基づいて、前記映像コンテンツ関連キーワードを前記複数の映像コンテンツに関連づけ、各映像コンテンツ関連キーワード別の出現頻度に応じて、前記複数の映像コンテンツのランキングを行うようにしてもよい。 Then, the ranking unit, based on the content reference information stored in the storage means, the video content related keywords associated with the plurality of video content, in accordance with the video content related keywords by frequency of occurrence, the it may be carried out a ranking of the plurality of video content.

好適な実施態様では、前記収集手段が収集したテキストデータにおいて、前記抽出手段が抽出した映像コンテンツ関連キーワード別の出現頻度を算出する出現頻度算出手段と、前記複数の映像コンテンツについて、それぞれの映像コンテンツに係るコンテンツ参照情報を記憶する記憶手段と、前記算出手段が算出した映像コンテンツ関連キーワード別の出現頻度のうち、最新の出現頻度と過去の出現頻度とを対比し、映像コンテンツ関連キーワード別の出現頻度の増加率を算出する増加率算出手段と、をさらに備えてもよい。 In a preferred embodiment, the text data to which the collecting means collects the occurrence frequency calculating means for calculating the video content related keywords different frequency extracted by the extracting unit, for the plurality of video content, each of the video content storage means for storing the content reference information relating to, among video content related keywords by frequency of occurrence of said calculating means is calculated, and comparing the latest frequency and past frequency, the specific video content related keyword appearance and increase rate calculating means for calculating the rate of increase in frequency, it may further comprise a. そして、前記ランキング手段は、前記記憶手段に記憶されているコンテンツ参照情報に基づいて、前記映像コンテンツ関連キーワードを前記複数の映像コンテンツに関連づけ、各映像コンテンツ関連キーワード別の出現頻度の増加度合いに応じて、前記複数の映像コンテンツのランキングを行うようにしてもよい。 Then, the ranking unit, based on the content reference information stored in said memory means, associating the video content related keywords into the plurality of video contents, depending on the degree of increase in each of the video content-related keywords another frequency Te may be performed ranking the plurality of video contents.

本発明の一実施形態に係る映像コンテンツ推奨システムの全体構成図である。 It is an overall configuration diagram of a video content recommendation system according to an embodiment of the present invention. サーバ1の構成図である。 It is a configuration diagram of the server 1. 抽出キーワード記憶部33のデータ構造の一例を示す。 It shows an example of the data structure of the extracted keyword storage unit 33. 増加率の算出手順の説明図である。 It is an explanatory view of a procedure of calculating an increase rate. コンテンツ参照情報記憶部35のデータ構造の一例を示す。 It shows an example of a data structure of content reference information storage unit 35. 映像コンテンツのランキング処理の具体例を示す説明図である。 It is an explanatory diagram showing a specific example of the ranking process of the video content. 抽出キーワードの合計出現回数による推奨コンテンツ決定の処理手順を示すフローチャートである。 Is a flowchart illustrating a processing procedure recommended content determination according to the total number of occurrences of the extracted keyword. 抽出キーワードの最高増加率による推奨コンテンツ決定の処理手順を示すフローチャートである。 Is a flowchart illustrating a processing procedure recommended content determination according to the best rate of increase in the extracted keyword.

以下、本発明の一実施形態に係る映像コンテンツ推奨システムについて、図面を参照して説明する。 Hereinafter, the video content recommendation system according to an embodiment of the present invention will be described with reference to the drawings.

図1は、本発明の一実施形態に係る映像コンテンツ推奨システムの全体構成図を示す。 Figure 1 shows the overall configuration of a video content recommendation system according to an embodiment of the present invention.
本システムは、同図に示すように、テレビ番組などの映像コンテンツ(以下、単に「コンテンツ」という場合がある)の推奨に関する処理を行うサーバ1を備える。 The system, as shown in the figure, comprises a server 1 performs processing relating to the recommended video content such as television programs (hereinafter, simply referred to as "content"). サーバ1が、インターネットなどのネットワーク9を介して、ユーザ端末装置3及びユーザが利用しているSTB(セットトップボックス)4と接続されている。 Server 1 via the network 9 such as the Internet, and is connected to the STB (Set Top Box) 4 user terminal 3 and the user is using. さらに、サーバ1は、ネットワーク9を介してインターネット上のウェブサイト7,7,・・・及び動画サイト8,8,・・・に接続されている。 Further, the server 1 website 7,7 on the Internet via the network 9, ... and video sites 8,8, and is connected to ....

サーバ1は、例えば汎用的なコンピュータシステムにより構成され、以下に説明するサーバ1内の個々の構成要素または機能は、例えば、コンピュータプログラムを実行することにより実現される。 Server 1 includes, for example, a general-purpose computer system, the individual components or functions of the server 1 described below, for example, be realized by executing a computer program. このコンピュータプログラムは、コンピュータ読み取り可能な記録媒体に格納可能である。 The computer program may be stored in a computer-readable recording medium.

ユーザ端末装置3は、通信機能を有する端末装置であればよく、例えば、携帯電話機、携帯情報端末、あるいは汎用的なパーソナルコンピュータなどでもよい。 The user terminal 3 may be any terminal device having a communication function, for example, a mobile phone, or may be a general-purpose personal computer. ユーザ端末装置3は、液晶パネルなどの表示装置、及びプッシュボタン、ポインティングデバイス、あるいはタッチパネルなどの入力装置を有する。 The user terminal 3 includes a display device such as a liquid crystal panel, and a push button, an input device such as a pointing device or a touch panel. ユーザ端末装置3が携帯電話機などの場合は、無線基地局との間で無線通信を行う。 If the user terminal 3, such as a cellular phone performs wireless communication with the radio base station.

STB4は、サーバ1からの指示あるいはユーザからの指示に従って、映像コンテンツの受信及び録画(記憶装置への保存)を行う。 STB4 in accordance with an instruction from the instruction or the user from the server 1, for receiving and recording video content (stored in the storage device). さらに、STB4は、サーバ1からの指示あるいはユーザからの指示に従って、受信または録画した映像コンテンツを図示しないテレビ受像器へ出力して、映像コンテンツの再生を行う。 Additionally, STB 4 according to an instruction from the instruction or the user from the server 1, and outputs to the television receiver (not shown) the video content received or recorded, and reproduces the video content. なお、本実施形態では録画装置の一例としてSTBを例にとって説明するが、STB以外にも、例えば、HDDレコーダ、録画機能付きテレビ受像器(ワンセグ受像器を含む)、及び録画機能付きPC等でもよい。 Although describing the STB as an example of an example of a recording apparatus in the present embodiment, in addition to STB, for example, HDD recorder, recording via television receiver (including the one-segment receiver), and also a recording function PC etc. good.

図2は、映像コンテンツの推奨装置としてのサーバ1の構成図を示す。 Figure 2 shows a block diagram of the server 1 as the recommended device of the video content.

サーバ1は、データ収集部11と、キーワード抽出部13と、増加率判定部15と、推奨コンテンツ決定部17と、録画予約処理部19と、推奨メール生成部21と、コンテンツ関連キーワード記憶部31と、抽出キーワード記憶部33と、コンテンツ参照情報記憶部35と、を備える。 Server 1 includes a data acquisition unit 11, a keyword extraction section 13, and the increase rate determining section 15, the recommended content determination section 17, a recording reservation processing unit 19, a recommended mail generating section 21, the content-related keyword storage 31 comprising the, the extracted keyword storage unit 33, a content reference information storage unit 35, a.

データ収集部11は、インターネット上の種々のサイトからデータをクロールする。 Data collection unit 11, to crawl data from various sites on the Internet. 例えば、データ収集部11は、ウェブサイト7及び動画サイト8からテキストデータを収集する。 For example, the data collection unit 11, to collect text data from the web site 7 and video sites 8. データ収集部11が収集するデータは、例えば、ブログ及びSNS(ソーシャル・ネットワーキング・サービス)などで不特定多数の人が発信した情報、あるいは、著名人、マスメディアなど特定の人(組織)が発信した情報である。 Data is, for example, blogs and SNS (social networking service) information an unspecified number of people were sent in, such as or, celebrities, a particular person (organization) such as the mass media is calling the data collection unit 11 to collect is information. これらの情報には、話題性あるいは新規性の高い情報が含まれている。 These information includes the highly topical or new information.

データ収集部11は、任意のタイミングでデータ収集を行うことができる。 Data collection unit 11 may collect data at an arbitrary timing. 例えば、以下の実施形態では、1日に一回データ収集を行う。 For example, in the following embodiment, a single data collection day.

コンテンツ関連キーワード記憶部31は、複数の映像コンテンツに関連するキーワードであるコンテンツ関連キーワードを記憶する。 Content-related keyword storage 31 stores content-related keywords are keywords associated with a plurality of video contents. 本システムの管理者によって予め定められたコンテンツ関連キーワードが、コンテンツ関連キーワード記憶部31に登録されていてもよい。 Predetermined content related keyword by the administrator of the present system may be registered in the content-related keyword storage 31. あるいは、コンテンツ関連キーワードは、コンテンツ参照情報記憶部35に記憶されているコンテンツ参照情報から抽出されたものでもよい。 Alternatively, content-related keywords may have been extracted from the content reference information stored in the content reference information storage unit 35. あるいは、コンテンツ関連キーワードは、検索サイトやポータルサイトなどが公表している、検索ランキングなどから抽出されたものでもよい。 Alternatively, content-related keywords, such as search sites and portal sites have been published, it may be the one that has been extracted from such search rankings.

キーワード抽出部13は、データ収集部11が収集したテキストデータからコンテンツ関連キーワードを抽出する。 Keyword extracting unit 13 extracts the content-related keywords from the text data that the data collection unit 11 collects. 例えば、キーワード抽出部13は、データ収集部11が収集したテキストデータを形態素解析して、単語に分解する。 For example, the keyword extracting unit 13, the text data that the data collection unit 11 collects and morphological analysis, decompose into words. キーワード抽出部13は、ここで取得した単語のうち、コンテンツ関連キーワード記憶部31に保存されているコンテンツ関連キーワードと一致する単語を抽出する。 Keyword extracting unit 13, among the word acquired here, and extracts the word that matches the content-related keywords that are stored in the content-related keyword storage 31. ここで、キーワード抽出部13が抽出した単語(コンテンツ関連キーワード)を抽出キーワードと呼ぶ。 Here, words keyword extraction unit 13 extracts (content related keywords) is referred to as extracted keyword.

キーワード抽出部13は、さらに、データ収集部11が収集したテキストデータにおいて、ここで抽出した抽出キーワード別の出現頻度を算出する。 Keyword extracting unit 13, Further, in the text data that the data collection unit 11 collects, calculates the extracted extracted by keyword appearance frequency here. 例えば、キーワード抽出部13は、データ収集部11が収集したテキストデータに含まれる抽出キーワードの、それぞれの出現回数を計数してもよい。 For example, the keyword extracting unit 13, the extracted keyword data collection unit 11 is included in the collected text data, it may be counted each occurrence count. キーワード抽出部13は、上述の単語の切り出しと同時に出現回数を計数し、その後コンテンツ関連キーワードを抽出してもよい。 Keyword extracting unit 13 counts the time occurrence count and excision of the above words, may be subsequently extracted content-related keywords.

キーワード抽出部13は、ここで抽出した抽出キーワードと、それぞれの出現頻度とを対応付けて、抽出キーワード記憶部33に保存する。 Keyword extraction section 13 associates the extracted keywords extracted here, and respective frequency, stores the extracted keyword storage unit 33.

抽出キーワード記憶部33は、キーワード抽出部13で抽出されたキーワードを記憶する。 Extracted keyword storage unit 33 stores keywords extracted by the keyword extracting unit 13.

図3は、抽出キーワード記憶部33のデータ構造の一例を示す。 Figure 3 shows an example of the data structure of the extracted keyword storage unit 33. 同図に示すように、抽出キーワード記憶部33は、抽出日時331、抽出キーワード333、出現回数335及び増加率337をデータ項目として有する。 As shown in the figure, the extracted keyword storage unit 33 has extracted time 331, the extracted keyword 333, the number of occurrences 335 and increase rate 337 as a data item.

抽出日時331は、データ収集部11がデータ収集を行って、抽出キーワードが抽出された日時を示す。 Extraction time 331, the data acquisition unit 11 performs data collection, indicating the extracted keyword is extracted date.

抽出キーワード333は、キーワード抽出部13により抽出されたキーワードである。 Extracted keyword 333 is a keyword extracted by the keyword extracting unit 13.

出現回数335は、キーワード抽出部13が計数した抽出キーワード333の出現した回数である。 Occurrences 335 is the number of times emerging of extracted keyword 333 keyword extraction section 13 has counted.

増加率337は、前回抽出時の出現回数335に対する増加率である。 Increase rate 337 is a rate of increase for the number of occurrences 335 in the previous extraction. 増加率337は、次に説明する増加率判定部15が算出する。 Increase 337 increase rate determining section 15 to be described next is calculated.

改めて図2を参照すると、増加率判定部15は、抽出キーワード記憶部33を参照して、抽出キーワード別の出現頻度のうち、最新の出現頻度と過去の出現頻度とを対比し、抽出キーワード別の出現頻度の増加率を算出する。 With renewed reference to FIG. 2, the increase rate determining section 15, referring to the extracted keyword storage unit 33, among the extracted keyword-specific frequency, and comparing the latest frequency and past frequency, extracted by keyword to calculate the rate of increase of the frequency of occurrence of.

例えば、増加率判定部15は、ある抽出キーワード333の出現回数335と、同じ抽出キーワード333の過去(例えば前回抽出時)の出現回数335とを対比して、過去の出現回数335からの増加率を算出する。 For example, the increase rate determining section 15, the number of occurrences 335 in certain extracted keyword 333, and comparing the number of occurrences 335 in the past (e.g., the previous extraction) of the same extracted keyword 333, the rate of increase in the past number of occurrences 335 It is calculated.

増加率の算出手順について、図4を参照して具体的に説明する。 The calculation steps of the rate of increase will be specifically described with reference to FIG.

まず、この処理の前回処理時(2010年1月1日、21:15:45)に収集したデータから抽出されたキーワード及びその出現回数が図4Aに示すようになっている。 First, the previous treatment of the process (January 1, 2010 21: 15: 45) collected keywords and appearance frequency thereof is extracted from the data is as shown in Figure 4A. また、ここに示した各抽出キーワードと同じキーワードについて、今回処理時(2010年1月2日、10:02:32)の出現回数が図4Bに示すようになっている。 In addition, for the same keywords and each extracted keyword shown here, this processing time (January 2, 2010 10: 02: 32) the number of occurrences of is as shown in Figure 4B. このときに、増加率判定部15が、前回処理時の出現回数を分母、今回処理時の出現回数を分子として増加率を算出すると、図4Cのようになる。 At this time, the increase rate determining section 15, the denominator the number of occurrences of the previous process, when calculating the increase rate of the number of occurrences of this process at a molecule is shown in Figure 4C. ここで算出された増加率が、今回処理時の増加率337に保存される。 Calculated here the rate of increase is stored in increase 337 in this processing time.

また、増加率判定部15は、データ収集部11が収集したブログ、マイクロブログ及びSNS等に係るテキストデータから抽出した抽出キーワード別の出現頻度に基づいて、各抽出キーワード別の出現頻度の増加度合いを算出するようにしてもよい。 Furthermore, the increase rate determining section 15, blog data collection unit 11 collects, based on the extracted keyword-specific frequency extracted from the text data according to the micro-blog and SNS like, the degree of increase in the extracted keyword-specific frequency it may be calculated. これは、ブログ、マイクロブログ及びSNS等に記載される内容は、特に新しいものに対する記載が多く、流行を敏感に反映したものと考えられるからである。 This is what is described in the blog, micro-blog and SNS like is because many believed that sensitively reflect the epidemic described for particular new.

改めて図2を参照すると、コンテンツ参照情報記憶部35は、複数の映像コンテンツについて、それぞれの映像コンテンツに係るコンテンツ参照情報を記憶する。 With renewed reference to FIG. 2, the content reference information storage unit 35, a plurality of video content, storing the content reference information relating to each of the video content. コンテンツ参照情報とは、各映像コンテンツに関連する情報であって、例えば、EPG(Electric Program Guide)の番組情報、及び動画サイトの映像コンテンツ情報などでよい。 The content reference information is information associated with each video content, for example, program information of EPG (Electric Program Guide), and good in such as video content information video site.

図5は、コンテンツ参照情報記憶部35のデータ構造の一例を示す。 Figure 5 shows an example of the data structure of content reference information storage unit 35. 同図に示すように、コンテンツ参照情報記憶部35は、コンテンツのタイトル351、放送日352、時間帯353、放送局354、ジャンル355、コンテンツの概要356、コンテンツの詳細357、及び関連する人名358をデータ項目として含む。 As shown in the figure, content reference information storage unit 35, the title 351 of the content, broadcast date 352, the time zone 353, a broadcast station 354, the genre 355, outline 356 of the content, details 357 of the content, and associated names 358 including as a data item. 関連する人名358は、例えば、そのコンテンツの出演者などでよい。 The associated person's name 358, for example, good in such performer of the content. コンテンツ参照情報記憶部35は、この他に、番組に関連したコメントや評価などを含んでもよい。 Content reference information storage unit 35, in addition, may include the comments and evaluated and related to the program.

図2に戻ると、推奨コンテンツ決定部17は、抽出キーワードに基づいて、複数の映像コンテンツのランキングを行う。 Returning to FIG. 2, the recommended content determination section 17, based on the extracted keyword, perform ranking of a plurality of video contents. さらに推奨コンテンツ決定部17は、そのランキングに基づいて、複数の映像コンテンツの中から推奨する映像コンテンツを決定する。 Further recommended content determination section 17, based on the ranking, to determine the video content recommended from among a plurality of video contents.

推奨コンテンツ決定部17は、例えば、コンテンツ参照情報記憶部35に記憶されているコンテンツ参照情報に基づいて、抽出キーワードを複数の映像コンテンツに関連づけ、各抽出キーワード別の出現回数に応じて、複数の映像コンテンツをランキングする。 Recommended content determination unit 17, for example, on the basis of the content reference information stored in the content reference information storage unit 35 associates extracted keyword into a plurality of video content, in accordance with each extracted keyword-specific number of occurrences, a plurality of ranking the video content. 例えば、コンテンツ概要356、コンテンツ詳細357及び人名358などに含まれているテキストに抽出キーワードが含まれている場合、推奨コンテンツ決定部17は、その映像コンテンツと抽出キーワード333とを対応付ける。 For example, content outline 356, if it contains extracted keywords on the text contained in such content detailed 357 and names 358, the recommended content determination unit 17 associates the extracted keyword 333 and the video content. 推奨コンテンツ決定部17は、各コンテンツに対応付けられた抽出キーワード333の出現回数335を合計する。 Recommended content determination unit 17 sums the number of occurrences 335 of extracted keyword 333 associated with each content. 推奨コンテンツ決定部17は、この合計出現回数の多い順に映像コンテンツをランキングする。 Recommended content determination unit 17, ranking the video content in order of the most the total number of occurrences.

また、推奨コンテンツ決定部17は、例えば、コンテンツ参照情報記憶部35に記憶されているコンテンツ参照情報に基づいて、抽出キーワードを複数の映像コンテンツに関連づけ、各抽出キーワード別の出現頻度の増加度合いに応じて、複数の映像コンテンツをランキングする。 Also, the recommended content determination section 17, for example, on the basis of the content reference information stored in the content reference information storage unit 35, the extracted keyword associated with a plurality of video contents, the degree of increase in the extracted keyword-specific frequency in response, ranking the plurality of video content. 例えば、推奨コンテンツ決定部17は、上記と同様に、コンテンツ概要356、コンテンツ詳細357及び人名358などに含まれているテキストに抽出キーワードが含まれている場合、その映像コンテンツと抽出キーワード333とを対応付ける。 For example, the recommended content determination section 17, similarly to the above, content outline 356, if the text in the extracted keyword is included contained in such content detailed 357 and names 358, and an extracted keyword 333 and the video content associates. 推奨コンテンツ決定部17は、各コンテンツに対応付けられた抽出キーワード333の増加率337のうち、最も大きな数値(最高増加率)を特定する。 Recommended content determination unit 17, among the increasing rate 337 extracts keywords 333 associated with each content, to identify the most significant number (maximum rate of increase). 推奨コンテンツ決定部17は、この最高増加率の大きい順に映像コンテンツをランキングする。 Recommended content determination unit 17, ranking the video content in descending order of the highest rate of increase.

図6は、映像コンテンツのランキング処理の具体例を示す説明図である。 Figure 6 is an explanatory diagram showing a specific example of the ranking process of the video content.

まず、抽出キーワード記憶部33に抽出キーワード(「A」、「B」、「C」、「D」)が、それぞれの出現回数及び増加率とともに保存されている。 First, the extracted keyword in the extracted keyword storage unit 33 ( "A", "B", "C", "D") are stored with the respective number of occurrences and increase. ここで、推奨コンテンツ決定部17が、コンテンツ参照情報記憶部35のコンテンツ参照情報と抽出キーワードを対応付けると、 Here, the recommended content determining section 17, when associating the extracted keywords and the content reference information content reference information storage unit 35,
コンテンツ「あ」と抽出キーワード「A」、 Content "A" and the extracted keyword "A",
コンテンツ「い」と抽出キーワード「B」「C」、 And extracted keyword content "I", "B", "C",
コンテンツ「う」と抽出キーワード「D」、及びコンテンツ「え」と抽出キーワード「A」の対応関係が得られる。 Content "U" and the extracted keyword "D", and the content correspondence between the "e" and the extracted keyword "A" is obtained.

推奨コンテンツ決定部17が、各コンテンツの合計出現回数をそれぞれ算出すると、コンテンツ「い」が70、コンテンツ「あ」が50、コンテンツ「え」が50、コンテンツ「う」が20となる。 Recommended content determining section 17, and the total number of occurrences of each content is calculated respectively, content "i" is 70, the content "a" is 50, the content "e" is 50, the content "U" is 20. 従って、推奨コンテンツ決定部17は、合計出現回数によりコンテンツのランキング210を決定する。 Therefore, the recommended content determination section 17 determines the ranking 210 of the content by the total number of occurrences. なお、合計出現回数が同数の場合、放送日時が早いコンテンツをランキング上位としてもよい。 It should be noted that, if the total number of occurrences of the same number, may be used as the top ranking of the fast content is broadcast date and time.

一方、推奨コンテンツ決定部17が、各コンテンツの最高増加率をそれぞれ算出すると、コンテンツ「う」が1.4、コンテンツ「い」が1.2、コンテンツ「あ」が0.8、コンテンツ「え」が0.8となる。 On the other hand, when the recommended content determining unit 17, to calculate the highest rate of increase in each of the content, respectively, content "U" is 1.4, content "i" is 1.2, the content "a" is 0.8, content "e "it is 0.8. 従って、推奨コンテンツ決定部17は、最高増加率によりコンテンツのランキング220を決定する。 Therefore, the recommended content determination section 17 determines the ranking 220 of the content by the highest rate of increase. なお、最高増加率についても、同率であれば放送日時が早いコンテンツをランキング上位としてもよい。 It should be noted that, for the highest rate of increase, the content broadcast date and time is faster if the same rate may be used as the top ranking.

録画予約処理部19は、推奨コンテンツ決定部17によって決定された推奨コンテンツの録画予約をSTB4に指示する。 Recording reservation processing unit 19 instructs the recording reservation of the recommended content determined by the recommended content determination section 17 to the STB 4.

推奨メール生成部21は、推奨コンテンツ決定部17によって決定された推奨コンテンツを、ユーザ端末装置3へ推奨コンテンツを通知する推奨電子メールを送信する。 Recommended mail generating section 21, a recommended content determined by the recommended content determination section 17 transmits the recommended emails notifying a recommended content to the user terminal 3. ユーザ端末装置3が受信した推奨電子メールを表示させると、推奨コンテンツ決定部17によって決定された推奨コンテンツが表示される。 When the user terminal 3 displays the recommended e-mail received, recommended content determined by the recommended content determination section 17 is displayed.

なお、本実施形態では、電子メールを用いてユーザ端末装置3へ推奨コンテンツを通知しているが、これ以外にも、例えば、ユーザ端末装置3のWebブラウザがサーバ1へリクエストをして、推奨コンテンツを取得するようにしてもよい。 In the present embodiment, reporting the recommended content to the user terminal 3 by using e-mail, other than this, for example, Web browser of the user terminal 3 to the request to the server 1, the recommended it is also possible to get the content.

次に、上述した映像コンテンツ推奨システムでの推奨コンテンツ決定のための処理手順について、図7及び図8のフローチャートを用いて説明する。 Next, the processing procedure for the recommended content determination in the above-described video content recommendation system will be described with reference to flowcharts of FIGS.

図7は、抽出キーワードの合計出現回数による推奨コンテンツ決定の処理手順を示すフローチャートである。 Figure 7 is a flowchart illustrating a processing procedure recommended content determination according to the total number of occurrences of the extracted keyword.

まず、データ収集部11がインターネット上のウェブサイト7及び動画サイト8からテキストデータを収集する(S100)。 First, the data collection unit 11 to collect text data from the web site 7 and the video site 8 on the Internet (S100). キーワード抽出部13が、ステップS100で収集したテキストデータから形態素解析などによって単語を切り出し、それぞれの単語の出現回数を計数する(S110)。 Keyword extraction unit 13 cuts out a word such as by morphological analysis from the text data collected in step S100, counting the number of occurrences of each word (S110). 推奨コンテンツ決定部17は、コンテンツ関連キーワード記憶部31に保存されているコンテンツ関連キーワードと一致する単語を抽出キーワードとして抽出する(S120)。 Recommended content determination unit 17 extracts a word that matches the content-related keywords that are stored in the content-related keyword storage 31 as the extracted keyword (S120). ここで抽出された抽出キーワード及びその出現回数が抽出キーワード記憶部33に保存される。 The extracted extracted keywords and appearance count that is stored in the extracted keyword storage 33.

推奨コンテンツ決定部17は、抽出キーワード記憶部33及びコンテンツ参照情報記憶部35を参照して、各コンテンツと抽出キーワードとを対応付ける(S130)。 Recommended content determination unit 17, referring to the extracted keyword storage unit 33 and the content reference information storage unit 35 associates the extracted keywords with each content (S130). さらに、推奨コンテンツ決定部17は、対応付けられた各抽出キーワードの出現回数に基づいて、合計出現回数を算出し、各コンテンツをランキングする(S140)。 In addition, the recommended content determination section 17, based on the number of occurrences of each extracted keyword associated, calculates the total number of occurrences, for ranking each content (S140). 推奨コンテンツ決定部17は、このランキング結果に基づいて、推奨コンテンツを決定する(S150)。 Recommended content determination unit 17, based on the ranking result, determine the recommended content (S150).

録画予約処理部19は、ステップS150で決定された推奨コンテンツに基づく録画予約指示をし、また推奨メール生成部21は、ステップS150で決定された推奨コンテンツに基づくコンテンツ推奨メールを送信する(S160)。 Recording reservation processing unit 19, a recording reservation instruction based on the recommended content determined in step S150, the addition recommended mail generating unit 21 transmits the content recommendation mail based on the recommended content determined in step S150 (S160) . ユーザ端末装置3が受信した推奨電子メールを表示させると、推奨コンテンツ決定部17によって決定された推奨コンテンツが表示される。 When the user terminal 3 displays the recommended e-mail received, recommended content determined by the recommended content determination section 17 is displayed.

これにより、インターネット上で多くの書き込みがなされているキーワードと関連する映像コンテンツをいち早くユーザへ推奨することができる。 As a result, it is possible to recommend to quickly user video content associated with the keywords that have been made a lot of writing on the Internet.

図8は、抽出キーワードの最高増加率による推奨コンテンツ決定の処理手順を示すフローチャートである。 Figure 8 is a flowchart illustrating a processing procedure recommended content determination according to the best rate of increase in the extracted keyword. 図7のフローチャートと共通の処理は、同じステップ番号を付している。 Flowchart and common processing of FIG. 7 are denoted by the same step numbers.

まず、データ収集部11及びキーワード抽出部13によるステップS100〜S120までの処理は、図7の場合と同じである。 First, the processing of by the data acquisition unit 11 and the keyword extraction section 13 to the step S100~S120 are the same as in FIG.

増加率判定部15は、抽出キーワード記憶部33を参照して、各抽出キーワードの前回抽出時の出現回数に対する今回抽出時の出現回数の増加率を算出する(S200)。 Increase rate determining section 15, referring to the extracted keyword storage unit 33, calculates the increase rate of the number of occurrences of the extraction time for the number of occurrences of the previous extraction of the extracted keyword (S200).

推奨コンテンツ決定部17は、抽出キーワード記憶部33及びコンテンツ参照情報記憶部35を参照して、各コンテンツと抽出キーワードとを対応付ける(S130)。 Recommended content determination unit 17, referring to the extracted keyword storage unit 33 and the content reference information storage unit 35 associates the extracted keywords with each content (S130). さらに、推奨コンテンツ決定部17は、対応付けられた各抽出キーワードの増加率に基づいて、コンテンツ別の最高増加率を算出し、各コンテンツをランキングする(S210)。 In addition, the recommended content determination section 17, based on the increase rate of the extracted keyword associated calculates a content-specific maximum rate of increase, ranking each content (S210). 推奨コンテンツ決定部17は、このランキング結果に基づいて、推奨コンテンツを決定する(S150)。 Recommended content determination unit 17, based on the ranking result, determine the recommended content (S150).

録画予約処理部19及び推奨メール生成部21は、図7の場合と同様に、録画予約指示及び推奨メールの送信を行う(S160)。 Recording reservation processing section 19 and a recommended-mail generation unit 21, as in the case of FIG. 7, and transmits the recording reservation instruction and recommended mail (S160). ユーザ端末装置3が受信した推奨電子メールを表示させると、推奨コンテンツ決定部17によって決定された推奨コンテンツが表示される。 When the user terminal 3 displays the recommended e-mail received, recommended content determined by the recommended content determination section 17 is displayed.

これにより、インターネット上で急に話題に昇る回数が増えている新規なキーワードと関連する映像コンテンツをいち早くユーザへ推奨することができる。 As a result, it is possible to recommend video content associated with the new keywords that are increasing the number of times that rise suddenly topic on the Internet to quickly user.

上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。 Embodiments of the present invention described above are examples for explaining the present invention and are not intended to limit the scope of the present invention to those embodiments. 当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。 One skilled in the art, can be carried out without departing from the gist of the present invention, the present invention in various other aspects.

1 サーバ3 ユーザ端末装置7 ウェブサイト8 映像コンテンツ11 データ収集部13 キーワード抽出部15 増加率判定部17 推奨コンテンツ決定部19 録画予約処理部21 推奨メール生成部31 コンテンツ関連キーワード記憶部33 抽出キーワード記憶部35 コンテンツ参照情報記憶部 1 server 3 the user terminal device 7 website 8 video content 11 data acquisition unit 13 the keyword extracting unit 15 increase rate determining section 17 is recommended content determination unit 19 recording reservation processing section 21 recommendation mail generating section 31 content-related keyword storage 33 extracts keyword storage part 35 content reference information storage unit

Claims (5)

  1. インターネット上のウェブサイト及び動画サイトからテキストデータを収集する収集手段と、 And collection means for collecting the text data from Web sites and video sites on the Internet,
    前記収集手段が収集したテキストデータから、複数の映像コンテンツに関連するキーワードである映像コンテンツ関連キーワードを抽出する抽出手段と、 From the text data to which the collecting means collects, extracting means for extracting the video content related keywords are keywords associated with a plurality of video contents,
    前記抽出手段が抽出した映像コンテンツ関連キーワードに基づいて、前記複数の映像コンテンツのランキングを行うランキング手段と、 Based on the video content related keyword extracted by the extracting unit, and ranking means for performing ranking of said plurality of video content,
    前記ランキング処理部によるランキングに基づいて、前記複数の映像コンテンツの中から推奨する映像コンテンツを決定する推奨手段と、を備える映像コンテンツの推奨装置。 On the basis of the ranking by the ranking unit, recommending apparatus of a video content comprising a recommended means for determining the video content and the recommended among the plurality of video contents.
  2. 前記収集手段が収集したテキストデータにおいて、前記抽出手段が抽出した映像コンテンツ関連キーワード別の出現頻度を算出する出現頻度算出手段と、 In the text data to which the collecting means collects the occurrence frequency calculating means for calculating the video content related keywords different frequency extracted by the extracting unit,
    前記複数の映像コンテンツについて、それぞれの映像コンテンツに係るコンテンツ参照情報を記憶する記憶手段と、をさらに備え、 Wherein the plurality of image contents, further comprising storage means for storing the content reference information relating to each of the video content and,
    前記ランキング手段は、前記記憶手段に記憶されているコンテンツ参照情報に基づいて、前記映像コンテンツ関連キーワードを前記複数の映像コンテンツに関連づけ、各映像コンテンツ関連キーワード別の出現頻度に応じて、前記複数の映像コンテンツのランキングを行う、請求項1記載のコンテンツの推奨装置。 The ranking unit, based on the content reference information stored in said storage means, said associating the video content related keywords into the plurality of video content, in accordance with the video content related keywords by frequency of occurrence, the plurality of performing a ranking of the video content, the recommended device content of claim 1, wherein.
  3. 前記収集手段が収集したテキストデータにおいて、前記抽出手段が抽出した映像コンテンツ関連キーワード別の出現頻度を算出する出現頻度算出手段と、 In the text data to which the collecting means collects the occurrence frequency calculating means for calculating the video content related keywords different frequency extracted by the extracting unit,
    前記複数の映像コンテンツについて、それぞれの映像コンテンツに係るコンテンツ参照情報を記憶する記憶手段と、 For the plurality of video contents, a storage unit that stores content reference information relating to each of the video content,
    前記算出手段が算出した映像コンテンツ関連キーワード別の出現頻度のうち、最新の出現頻度と過去の出現頻度とを対比し、映像コンテンツ関連キーワード別の出現頻度の増加率を算出する増加率算出手段と、をさらに備え、 In the video content related keywords by frequency of occurrence of said calculating means is calculated, and comparing the latest frequency and past frequency, the increase rate calculating means for calculating an increase rate of the video content related keywords another frequency , further comprising a,
    前記ランキング手段は、前記記憶手段に記憶されているコンテンツ参照情報に基づいて、前記映像コンテンツ関連キーワードを前記複数の映像コンテンツに関連づけ、各映像コンテンツ関連キーワード別の出現頻度の増加度合いに応じて、前記複数の映像コンテンツのランキングを行う、請求項1記載のコンテンツの推奨装置。 The ranking unit, based on the content reference information stored in said memory means, associating the video content related keywords into the plurality of video content, in accordance with the rate of increase of the respective video contents related keywords another frequency, performing ranking of said plurality of video content recommending apparatus of a content according to claim 1, wherein.
  4. インターネット上のウェブサイト及び動画サイトからテキストデータを収集するステップと、 The method comprising the steps of: collecting text data from Web sites and video sites on the Internet,
    前記収集したテキストデータから、複数の映像コンテンツに関連するキーワードである映像コンテンツ関連キーワードを抽出するステップと、 From the text data said collecting, extracting video content related keywords are keywords associated with a plurality of video contents,
    前記抽出した映像コンテンツ関連キーワードに基づいて、前記複数の映像コンテンツのランキングを行うステップと、 A step of, based on the video content related keywords, performs ranking of said plurality of video content the extraction,
    前記ランキングに基づいて、前記複数の映像コンテンツの中から推奨する映像コンテンツを決定するステップと、を行う推奨する映像コンテンツの決定方法。 Based on the ranking, the method of determining the video content recommended to perform the steps of determining the image content and the recommended among the plurality of video contents.
  5. 推奨する映像コンテンツの決定するためのコンピュータプログラムであって、 A computer program for determining of the video content to be recommended,
    コンピュータに実行されると、 When executed on a computer,
    インターネット上のウェブサイト及び動画サイトからテキストデータを収集するステップと、 The method comprising the steps of: collecting text data from Web sites and video sites on the Internet,
    前記収集したテキストデータから、複数の映像コンテンツに関連するキーワードである映像コンテンツ関連キーワードを抽出するステップと、 From the text data said collecting, extracting video content related keywords are keywords associated with a plurality of video contents,
    前記抽出した映像コンテンツ関連キーワードに基づいて、前記複数の映像コンテンツのランキングを行うステップと、 A step of, based on the video content related keywords, performs ranking of said plurality of video content the extraction,
    前記ランキングに基づいて、前記複数の映像コンテンツの中から推奨する映像コンテンツを決定するステップと、が行われるコンピュータプログラム。 Based on the ranking, the computer program and determining the video content to be recommended from among the plurality of video contents, it is carried out.
JP2010029455A 2010-02-12 2010-02-12 Video-content recommendation apparatus, method for determining recommended video content, and computer program Pending JP2011166621A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010029455A JP2011166621A (en) 2010-02-12 2010-02-12 Video-content recommendation apparatus, method for determining recommended video content, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010029455A JP2011166621A (en) 2010-02-12 2010-02-12 Video-content recommendation apparatus, method for determining recommended video content, and computer program

Publications (1)

Publication Number Publication Date
JP2011166621A true true JP2011166621A (en) 2011-08-25

Family

ID=44596745

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010029455A Pending JP2011166621A (en) 2010-02-12 2010-02-12 Video-content recommendation apparatus, method for determining recommended video content, and computer program

Country Status (1)

Country Link
JP (1) JP2011166621A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013248292A (en) * 2012-06-01 2013-12-12 Nintendo Co Ltd Information processing program, information processing device, information processing system, and display method
JP2014075052A (en) * 2012-10-04 2014-04-24 Funai Electric Co Ltd Video recording and reproducing device and program retrieval method
JP2016031675A (en) * 2014-07-29 2016-03-07 Kddi株式会社 Content recommendation device and program
JP2017054269A (en) * 2015-09-08 2017-03-16 ヤフー株式会社 Extraction apparatus, extraction method, and extraction program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318398A (en) * 2005-05-16 2006-11-24 Nippon Telegr & Teleph Corp <Ntt> Vector generation method and device, information classifying method and device, and program, and computer readable storage medium with program stored therein
JP2007028310A (en) * 2005-07-19 2007-02-01 Sony Corp Information processing apparatus and method therefor, and program
JP2008040636A (en) * 2006-08-03 2008-02-21 Toshiba Corp Keyword presenting device, program, and keyword presenting method
JP2008070959A (en) * 2006-09-12 2008-03-27 Sony Corp Information processor and method, and program
JP2008134979A (en) * 2006-11-28 2008-06-12 Intelegal Co Ltd Moving picture retrieval method and moving picture retrieval system
JP2009116440A (en) * 2007-11-02 2009-05-28 Yahoo Japan Corp Information propagation extraction device and information propagation extraction method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318398A (en) * 2005-05-16 2006-11-24 Nippon Telegr & Teleph Corp <Ntt> Vector generation method and device, information classifying method and device, and program, and computer readable storage medium with program stored therein
JP2007028310A (en) * 2005-07-19 2007-02-01 Sony Corp Information processing apparatus and method therefor, and program
JP2008040636A (en) * 2006-08-03 2008-02-21 Toshiba Corp Keyword presenting device, program, and keyword presenting method
JP2008070959A (en) * 2006-09-12 2008-03-27 Sony Corp Information processor and method, and program
JP2008134979A (en) * 2006-11-28 2008-06-12 Intelegal Co Ltd Moving picture retrieval method and moving picture retrieval system
JP2009116440A (en) * 2007-11-02 2009-05-28 Yahoo Japan Corp Information propagation extraction device and information propagation extraction method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013248292A (en) * 2012-06-01 2013-12-12 Nintendo Co Ltd Information processing program, information processing device, information processing system, and display method
US9495074B2 (en) 2012-06-01 2016-11-15 Nintendo Co., Ltd. Information processing system, storing medium, information processing device, and display method
JP2014075052A (en) * 2012-10-04 2014-04-24 Funai Electric Co Ltd Video recording and reproducing device and program retrieval method
JP2016031675A (en) * 2014-07-29 2016-03-07 Kddi株式会社 Content recommendation device and program
JP2017054269A (en) * 2015-09-08 2017-03-16 ヤフー株式会社 Extraction apparatus, extraction method, and extraction program

Similar Documents

Publication Publication Date Title
Miller et al. MovieLens unplugged: experiences with an occasionally connected recommender system
US20070300258A1 (en) Methods and systems for providing media assets over a network
US20090216639A1 (en) Advertising selection and display based on electronic profile information
US20090144780A1 (en) Socially collaborative filtering
US20110246440A1 (en) Systems And Methods For Organizing And Displaying Electronic Media Content
US20080189272A1 (en) Collective Ranking of Digital Content
US8151194B1 (en) Visual presentation of video usage statistics
US20110320437A1 (en) Infinite Browse
US20080162437A1 (en) Method and system for image-based searching
US20120042022A1 (en) Methods and systems for analysis of real-time user-generated text messages
US20100153411A1 (en) Socially Collaborative Filtering for Providing Recommended Content to a Website for Presentation to an Identified User
US20100186041A1 (en) Recommending Video Programs
US20110202827A1 (en) Systems and Methods for Curating Content
US20090216741A1 (en) Prioritizing media assets for publication
US20100257184A1 (en) Method and apparatus for scoring electronic documents
US20130117329A1 (en) Providing relevant product reviews to the user to aid in purchasing decision
US7783622B1 (en) Identification of electronic content significant to a user
CN101079824A (en) A generation system and method for user interest preference vector
US20140278308A1 (en) Method and system for measuring user engagement using click/skip in content stream
JP2007220084A (en) System, program and method for managing information for evaluation
US20080097986A1 (en) Generic Online Ranking System and Method Suitable for Syndication
US8898713B1 (en) Content aggregation and presentation
US20100268776A1 (en) System and Method for Determining Information Reliability
US20110302152A1 (en) Presenting supplemental content in context
US8566315B1 (en) Sequenced video segment mix

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130716

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131112