JP2013003893A - Content relevance calculation device, content relevance calculation method and content relevance calculation program - Google Patents

Content relevance calculation device, content relevance calculation method and content relevance calculation program Download PDF

Info

Publication number
JP2013003893A
JP2013003893A JP2011135167A JP2011135167A JP2013003893A JP 2013003893 A JP2013003893 A JP 2013003893A JP 2011135167 A JP2011135167 A JP 2011135167A JP 2011135167 A JP2011135167 A JP 2011135167A JP 2013003893 A JP2013003893 A JP 2013003893A
Authority
JP
Japan
Prior art keywords
genre
relevance
content
ancestor
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011135167A
Other languages
Japanese (ja)
Other versions
JP5346992B2 (en
Inventor
Taiga Yoshida
大我 吉田
Akira Nakayama
彰 中山
Atsunobu Kimura
篤信 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011135167A priority Critical patent/JP5346992B2/en
Publication of JP2013003893A publication Critical patent/JP2013003893A/en
Application granted granted Critical
Publication of JP5346992B2 publication Critical patent/JP5346992B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

PROBLEM TO BE SOLVED: To recommend a more appropriate content.SOLUTION: A content relevance calculation device 10 includes: a content designation part 11 for designating a content as a calculation object of relevance; a genre system storage part 17 for storing a genre system expressed as a hierarchical structure; a relevance score storage part 18 for storing relevance scores showing the strength of inter-genre relationship; a genre relevance calculation part 13 for specifying the closest ancestor which is common to the genres of the content designated by the content designation part 11 in the hierarchical structure stored in the genre system storage part 17, and for, when the relevance scores stored in the relevance score storage part 18 is defined in the hierarchy which is deeper than the ancestor, calculating the inter-genre relevance on the basis of the relevance scores; and a content relevance calculation part 14 for calculating inter-content relevance designated by the content designation part 11 on the basis of the inter-genre relevance calculated by the genre relevance calculation part 13.

Description

本発明は、コンテンツ間の関連度を算出するコンテンツ関連度算出装置、コンテンツ関連度算出方法、およびコンテンツ関連度算出プログラムに関する。   The present invention relates to a content relevance calculation device, a content relevance calculation method, and a content relevance calculation program for calculating a relevance between contents.

あるコンテンツにアクセスしたユーザに対して別のコンテンツを提示することにより、コンテンツのアクセス数や売り上げを増加させる推薦技術が知られている。推薦技術の1つとして、コンテンツに付与されたメタデータのマッチングによりコンテンツの関連度を算出する手法がある。このような手法は内容ベースフィルタリングと呼ばれる。   There is known a recommendation technique for increasing the number of accesses and sales of content by presenting other content to a user who has accessed the content. As one of the recommendation techniques, there is a method of calculating the relevance level of content by matching metadata attached to the content. Such a technique is called content-based filtering.

内容ベースフィルタリングでは、コンテンツから抽出されたキーワードや特徴量、コンテンツに付与されたタグやコンテンツの属性等の情報を利用し、より多くの情報が共通しているコンテンツの関連度が高いと考え、推薦を行う。内容ベースフィルタリングに関する研究としては、ユーザが高く評価したコンテンツに付与されている属性の出現頻度を計測し、出現頻度の高い属性が付与されているコンテンツを推薦する手法がある(例えば、特許文献1)。   In content-based filtering, we use information such as keywords and features extracted from content, tags attached to content, and attributes of content, and we believe that the degree of relevance of content that has more information in common is high. Make a recommendation. As research on content-based filtering, there is a method of measuring the frequency of appearance of attributes assigned to content highly evaluated by the user and recommending content to which attributes with high appearance frequency are assigned (for example, Patent Document 1). ).

特開2009−205418号公報JP 2009-205418 A

ここで、内容ベースフィルタリングの推薦手法により、映像の推薦を行う場合を考える。例えば、あるユーザが「子供向けアニメ」というジャンルを持つ映像Aを視聴した場合、そのユーザは他の「子供向けアニメ」の映像も好む可能性が高い。そこで、内容ベースフィルタリングの推薦手法では、映像Aと別の「子供向けアニメ」の映像との関連度を高く算出する。特許文献1に開示される推薦手法でも、ユーザが「子供向けアニメ」を多く視聴している場合、「子供向けアニメ」に属する映像の推薦スコアを高く算出する。   Here, consider a case where video is recommended by a content-based filtering recommendation method. For example, when a user views a video A having a genre of “anime for children”, the user is likely to like another video for “anime for children”. Therefore, in the content-based filtering recommendation method, the degree of relevance between the video A and another “children's animation” video is calculated to be high. Also in the recommendation method disclosed in Patent Document 1, when the user is watching a lot of “anime for children”, the recommendation score of the video belonging to “anime for children” is calculated high.

「子供向けアニメ」を視聴するユーザは子供である場合が多く、「人形劇」や「特撮」などのジャンルの映像も嗜好する可能性が高いため、「子供向けアニメ」に加えて「人形劇」や「特撮」などの映像を推薦することは有効であると考えられる。一方、「政治」や「ホラー」などのジャンルの映像は嗜好しない可能性が高いため、推薦しない方が良いと思われる。   Users who watch “anime for children” are often children, and it is highly likely that they prefer videos of genres such as “puppet show” and “special effects”. It is considered effective to recommend images such as “SFX” and “Special effects”. On the other hand, video of genres such as “politics” and “horror” is likely not to be preferred, so it is better not to recommend it.

しかし、特許文献1などに開示される従来の内容ベースフィルタリングの推薦手法では、ユーザが視聴していないジャンルの映像については推薦スコアの増減を行わない。そのため、推薦されるべき「人形劇」や「特撮」ジャンルの映像が推薦されないという問題や、推薦されるべきでない「政治」や「ホラー」の映像が推薦されるという問題がある。   However, in the conventional content-based filtering recommendation method disclosed in Patent Document 1 or the like, the recommendation score is not increased or decreased for a video of a genre that is not viewed by the user. For this reason, there are problems that videos of the “puppet show” and “special effects” genres that should be recommended are not recommended, and videos of “politics” and “horror” that should not be recommended.

本発明は、前記従来の技術に鑑み、より適切なコンテンツを推薦することのできるコンテンツ関連度算出装置、コンテンツ関連度算出方法、およびコンテンツ関連度算出プログラムを提供することを目的とする。   An object of the present invention is to provide a content relevance calculation device, a content relevance calculation method, and a content relevance calculation program capable of recommending more appropriate content.

前記課題を解決するために、本発明の実施形態に係るコンテンツ関連度算出装置は、コンテンツ間の関連度を算出する装置であって、関連度の算出対象となるコンテンツを指定するコンテンツ指定部と、階層構造として表現されているジャンル体系を蓄積するジャンル体系蓄積部と、ジャンル間の関係性の強さを表す関係性スコアを蓄積する関係性スコア蓄積部と、前記ジャンル体系蓄積部に蓄積されている階層構造において前記コンテンツ指定部により指定されたコンテンツのジャンルに共通する最も近い祖先を特定し、その祖先より深い階層において前記関係性スコア蓄積部に蓄積されている関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出するジャンル関連度算出部と、前記ジャンル関連度算出部により算出されたジャンル間の関連度に基づいて前記コンテンツ指定部により指定されたコンテンツ間の関連度を算出するコンテンツ関連度算出部とを備えることを特徴とする。   In order to solve the above-described problem, a content relevance calculation device according to an embodiment of the present invention is a device that calculates a relevance between contents, and a content specification unit that specifies content for which the relevance is to be calculated; A genre system accumulating unit for accumulating a genre system expressed as a hierarchical structure, a relationship score accumulating unit for accumulating a relationship score representing the strength of the relationship between genres, and the genre system accumulating unit. The closest ancestor common to the genre of the content specified by the content specifying unit in the hierarchical structure is defined, and the relationship score stored in the relationship score storage unit is defined in a hierarchy deeper than the ancestor A genre relevance calculating unit that calculates a relevance between genres based on the relevance score, and the genre relevance Based on the relevance between calculated by output unit genre; and a content relevance calculator that calculates a degree of association between the designated content by the content specifying unit.

前記ジャンル関連度算出部は、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとすると、ジャンルaの祖先でジャンルcより深いジャンルa’とジャンルbの祖先でジャンルcより深いジャンルb’との間に前記関係性スコアが定義されている場合、その関係性スコアの絶対値が大きいほど高い関連度を算出するとともに、ジャンルa’およびb’の階層が深いほど高い関連度を算出してもよい。   If the closest ancestor common to genre a and genre b is genre c, the genre relevance calculating unit genre a 'is an ancestor of genre a and deeper than genre c, and genre b' is an ancestor of genre b and deeper than genre c. When the relationship score is defined between the genre a ′, the higher the absolute value of the relationship score, the higher the degree of relevance, and the higher the genre a ′ and b ′, the higher the degree of relevance. May be.

前記ジャンル関連度算出部は、ジャンルa’とb’の間に定義されている関係性スコアをC(a’,b’)とし、ジャンルa’およびb’がどれだけ詳細なジャンルであるかに基づくスコアを算出する関数をT(a’,b’)とし、ジャンルaとジャンルbにおいて最も近い共通の祖先以上に深い階層で定義されている関係性スコアがG’={(a’i,b’)|i=1,2,・・・}におけるi番目のジャンルの間であったとすると、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR’( G’)により算出してもよい。

Figure 2013003893
The genre relevance calculating unit sets a relationship score defined between genres a ′ and b ′ as C (a ′, b ′), and how detailed are the genres a ′ and b ′. Let T (a ′, b ′) be a function that calculates a score based on, and the relationship score defined at a deeper level than the closest common ancestor in genre a and genre b is G ′ = {(a ′ i , B ′ i ) | i = 1, 2,...}, The relation R G (a, b) between the genre a and the genre b is expressed as R G You may calculate by '(G').
Figure 2013003893

前記ジャンル関連度算出部は、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとすると、ジャンルaの祖先でジャンルcより深いジャンルa’とジャンルbの祖先でジャンルcより深いジャンルb’との間に前記関係性スコアが定義されていない場合、前記祖先にあたるジャンルの階層が深いほど高い関連度を算出してもよい。   If the closest ancestor common to genre a and genre b is genre c, the genre relevance calculating unit genre a 'is an ancestor of genre a and deeper than genre c, and genre b' is an ancestor of genre b and deeper than genre c. If the relationship score is not defined between the two, the higher the degree of relevance may be calculated as the genre hierarchy corresponding to the ancestor is deeper.

前記ジャンル関連度算出部は、ジャンルcがどれだけ詳細なジャンルであるかに基づくスコアを算出する関数をT(c,c)とすると、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR”(c)により算出してもよい。

Figure 2013003893
When the function for calculating a score based on how detailed the genre c is is a genre c, the genre relevance calculation unit calculates the relevance R G (a, b) between the genre a and the genre b. ) May be calculated by R G ″ (c) in the following equation.
Figure 2013003893

前記課題を解決するために、本発明の実施形態に係るコンテンツ関連度算出方法は、コンテンツ間の関連度を算出する方法であって、関連度の算出対象となるコンテンツを指定するコンテンツ指定ステップと、階層構造として表現されているジャンル体系を蓄積するジャンル体系蓄積ステップと、ジャンル間の関係性の強さを表す関係性スコアを蓄積する関係性スコア蓄積ステップと、前記ジャンル体系蓄積ステップで蓄積された階層構造において前記コンテンツ指定ステップで指定されたコンテンツのジャンルに共通する最も近い祖先を特定し、その祖先より深い階層において前記関係性スコア蓄積ステップで蓄積された関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出するジャンル関連度算出ステップと、前記ジャンル関連度算出ステップで算出されたジャンル間の関連度に基づいて前記コンテンツ指定ステップで指定されたコンテンツ間の関連度を算出するコンテンツ関連度算出ステップとを備えることを特徴とする。   In order to solve the above-mentioned problem, a content relevance calculation method according to an embodiment of the present invention is a method for calculating a relevance between contents, and a content designating step for designating content for which a relevance is to be calculated; A genre system accumulating step for accumulating a genre system expressed as a hierarchical structure, a relationship score accumulating step for accumulating a relationship score representing the strength of the relationship between genres, and the genre system accumulating step. In the hierarchical structure, the closest ancestor common to the content genre specified in the content specifying step is specified, and the relationship score stored in the relationship score storing step is defined in a hierarchy deeper than the ancestor , Genre relevance calculation that calculates the relevance between genres based on the relationship score And a content relevance level calculating step for calculating a relevance level between the contents specified in the content specifying step based on the relevance level between the genres calculated in the genre relevance level calculating step. .

前記課題を解決するために、本発明の実施形態に係るコンテンツ関連度算出プログラムは、前記コンテンツ関連度算出装置が備える各処理部としてコンピュータを機能させることを特徴とする。   In order to solve the above-described problem, a content relevance calculation program according to an embodiment of the present invention causes a computer to function as each processing unit included in the content relevance calculation device.

本発明によれば、ジャンル間の関係性を考慮するようにしているので、より適切なコンテンツを推薦することのできるコンテンツ関連度算出装置、コンテンツ関連度算出方法、およびコンテンツ関連度算出プログラムを提供することができる。   According to the present invention, since the relationship between genres is considered, a content relevance calculation device, a content relevance calculation method, and a content relevance calculation program capable of recommending more appropriate content are provided. can do.

本発明の実施の形態におけるコンテンツ関連度算出装置の構成図である。It is a block diagram of the content relevance calculation apparatus in embodiment of this invention. 本発明の実施の形態におけるジャンル体系の説明図である。It is explanatory drawing of the genre system in embodiment of this invention. 本発明の実施の形態におけるコンテンツ情報の一例を示す図である。It is a figure which shows an example of the content information in embodiment of this invention. 本発明の実施の形態におけるコンテンツ関連度算出装置のフローチャートである。It is a flowchart of the content relevance calculation apparatus in embodiment of this invention. 本発明の実施の形態における関係性スコアの一例を示す図である。It is a figure which shows an example of the relationship score in embodiment of this invention.

以下、本発明の実施の形態について図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明の実施の形態におけるコンテンツ関連度算出装置10の構成図である。このコンテンツ関連度算出装置10は、コンテンツ間の関連度を算出する装置であって、図1に示すように、コンテンツ指定部11と、ジャンルペア抽出部12と、ジャンル関連度算出部13と、コンテンツ関連度算出部14と、コンテンツ関連度出力部15と、コンテンツ情報蓄積部16と、ジャンル体系蓄積部17と、関係性スコア蓄積部18とを備えている。コンテンツ情報蓄積部16は、コンテンツ情報を蓄積する蓄積装置等である。ジャンル体系蓄積部17は、木構造として表現されているジャンル体系を蓄積する蓄積装置等である。関係性スコア蓄積部18は、ジャンル間の関係性の強さを表す関係性スコアを蓄積する蓄積装置等である。コンテンツ指定部11は、関連度の算出対象となる2コンテンツを指定する入力装置等である。ジャンルペア抽出部12は、コンテンツ情報蓄積部16に蓄積されているコンテンツ情報に基づいて、コンテンツ指定部11により指定された2コンテンツについてジャンルペアを抽出する。ジャンル関連度算出部13は、ジャンルペア抽出部12により抽出されたジャンルペアについてジャンル間の関連度を算出する。例えば、木構造においてジャンルペアに共通する最も近い祖先を特定し、その祖先より深い階層において関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出する。コンテンツ関連度算出部14は、ジャンル関連度算出部13により算出されたジャンル間の関連度に基づいて、コンテンツ指定部11により指定された2コンテンツ間の関連度を算出する。コンテンツ関連度出力部15は、コンテンツ関連度算出部14により算出された2コンテンツ間の関連度を出力する。   FIG. 1 is a configuration diagram of a content relevance calculation device 10 according to an embodiment of the present invention. The content relevance calculation device 10 is a device that calculates the relevance between contents, and as shown in FIG. 1, a content designation unit 11, a genre pair extraction unit 12, a genre relevance calculation unit 13, A content relevance calculation unit 14, a content relevance output unit 15, a content information storage unit 16, a genre system storage unit 17, and a relationship score storage unit 18 are provided. The content information storage unit 16 is a storage device or the like that stores content information. The genre system storage unit 17 is a storage device that stores a genre system expressed as a tree structure. The relationship score storage unit 18 is a storage device or the like that stores a relationship score representing the strength of the relationship between genres. The content designation unit 11 is an input device or the like that designates two contents that are targets of calculation of relevance. The genre pair extraction unit 12 extracts genre pairs for the two contents specified by the content specification unit 11 based on the content information stored in the content information storage unit 16. The genre association degree calculation unit 13 calculates the degree of association between genres for the genre pair extracted by the genre pair extraction unit 12. For example, when the closest ancestor common to a genre pair in a tree structure is specified and a relationship score is defined in a hierarchy deeper than the ancestor, the degree of association between genres is calculated based on the relationship score. The content relevance calculation unit 14 calculates the relevance between the two contents specified by the content specification unit 11 based on the relevance between genres calculated by the genre relevance calculation unit 13. The content relevance output unit 15 outputs the relevance between the two contents calculated by the content relevance calculation unit 14.

図2は、ジャンル体系蓄積部17に蓄積されているジャンル体系の説明図である。この図に示すように、ジャンル体系は木構造として定義されているものとする。このとき、異なるサービスにおけるジャンル体系が一つの木構造と表現されていてもよく、一番上の階層にルートジャンル、その下の階層に各サービスのジャンルが配置されているものとする。ここでは、関係性スコアが定義されているジャンル間を両矢印で表している。関係性スコアは、ユーザが独自に指定することができる。各コンテンツのジャンルの祖先・子孫・兄弟にあたるジャンル間もしくは自身との間に関係性が定義されている場合は、その関係性に基づいた関連度を算出するようになっている(後述する)。   FIG. 2 is an explanatory diagram of the genre system stored in the genre system storage unit 17. As shown in this figure, it is assumed that the genre system is defined as a tree structure. At this time, the genre system in different services may be expressed as one tree structure, and it is assumed that the root genre is arranged in the uppermost layer and the genre of each service is arranged in the lower layer. Here, the genre for which the relationship score is defined is indicated by a double arrow. The relationship score can be specified independently by the user. When a relationship is defined between genres corresponding to the ancestors, descendants, and siblings of each content genre, or with itself, the degree of association is calculated based on the relationship (described later).

図3は、コンテンツ情報蓄積部16に蓄積されているコンテンツ情報の一例を示す図である。この図に示すように、1つのコンテンツには複数のジャンルが付与される場合がある。コンテンツAに付与されているジャンルをG={a|i=1,2,・・・}、コンテンツBに付与されているジャンルをG={b|j=1,2,・・・}とおくと、コンテンツAとコンテンツBの関連度R(A,B)は以下の式により算出される。

Figure 2013003893
FIG. 3 is a diagram illustrating an example of content information stored in the content information storage unit 16. As shown in the figure, a plurality of genres may be assigned to one content. The genre assigned to the content A is G a = {a i | i = 1, 2,...}, And the genre assigned to the content B is G b = {b j | j = 1, 2,. ..., The degree of association R (A, B) between content A and content B is calculated by the following equation.
Figure 2013003893

ただし、R(a,b)はジャンルaとジャンルbの関連度である。コンテンツAまたはコンテンツBに1つ以上のジャンルが付与されていない場合は、R(A,B)=0とする。 Here, R G (a i , b j ) is the degree of association between genre a i and genre b j . When one or more genres are not assigned to the content A or the content B, R (A, B) = 0 is set.

図4は、コンテンツ関連度算出装置10の動作を示すフローチャートである。以下、あるコンテンツにアクセスしたユーザに対して別のコンテンツを提示する際の動作を説明する。   FIG. 4 is a flowchart showing the operation of the content relevance calculation apparatus 10. Hereinafter, an operation when presenting another content to a user who accesses a certain content will be described.

まず、関連度の算出対象となる2コンテンツを指定する(ステップS1)。例えば、2コンテンツのうちの一方は、ユーザがアクセスしたコンテンツであり、もう一方は、コンテンツ情報蓄積部16に蓄積されている任意のコンテンツである。   First, two contents for which the degree of association is to be calculated are designated (step S1). For example, one of the two contents is content accessed by the user, and the other is arbitrary content stored in the content information storage unit 16.

次いで、各コンテンツに付与された任意のジャンルペアについてステップS2〜S6を繰り返す。例えば、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとする。このとき、ジャンルaの祖先でジャンルcより深いジャンルa’と、ジャンルbの祖先でジャンルcより深いジャンルb’との間に、1つ以上の関係性スコアが定義されているか否かを判定する(ステップS2)。ただし、ジャンルa’はジャンルaであってもよく、ジャンルb’はジャンルbであってもよい。そして、関係性スコアが定義されている場合は、後述する数4により、関係性スコアに基づいてジャンルaとジャンルbの関連度を算出する(ステップS3)。一方、関係性スコアが定義されていない場合は、後述する数7により、共通の祖先の深さに基づいてジャンルaとジャンルbの関連度を算出する(ステップS4)。   Next, Steps S2 to S6 are repeated for an arbitrary genre pair assigned to each content. For example, genre c is the closest ancestor common to genre a and genre b. At this time, it is determined whether or not one or more relationship scores are defined between the genre a ′ that is an ancestor of the genre a and deeper than the genre c and the genre b ′ that is an ancestor of genre b and deeper than the genre c. (Step S2). However, the genre a ′ may be the genre a, and the genre b ′ may be the genre b. If the relationship score is defined, the degree of association between the genre a and the genre b is calculated based on the relationship score according to Equation 4 described later (step S3). On the other hand, when the relationship score is not defined, the degree of association between genre a and genre b is calculated based on the depth of the common ancestor by Equation 7 described later (step S4).

次いで、算出したジャンル間の関連度のうち、最も大きいものをXとする(ステップS5→S6)。すなわち、算出したジャンル間の関連度がXより大きい場合、またはXが未定義である場合は、算出したジャンル間の関連度をXとする。   Next, among the calculated relevance levels between genres, X is set to be the largest (steps S5 → S6). That is, when the calculated degree of association between genres is greater than X, or when X is undefined, the calculated degree of association between genres is X.

次いで、このXに基づいて2コンテンツ間の関連度を数3により算出し、算出した関連度を出力する(ステップS7→S8)。このような処理を繰り返せば、コンテンツ情報蓄積部16に蓄積されている全てのコンテンツについて、ユーザがアクセスしたコンテンツとの関連度を算出することができる。   Next, based on this X, the degree of association between the two contents is calculated by Equation 3, and the calculated degree of association is output (steps S7 → S8). If such processing is repeated, it is possible to calculate the degree of relevance of the content accessed by the user for all the content stored in the content information storage unit 16.

以下、ジャンルaとジャンルbに共通する最も近い祖先より深い階層で関係性スコアが定義されている場合について詳しく説明する。まず、関係性がG’={(a’i,b’)|i=1,2,・・・}におけるi番目のジャンルの間で定義されているとする。この場合、ジャンル関連度算出部13は、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR’( G’)により算出する。

Figure 2013003893
Hereinafter, the case where the relationship score is defined in a hierarchy deeper than the nearest ancestor common to the genre a and the genre b will be described in detail. First, it is assumed that the relationship is defined between the i-th genres in G ′ = {(a ′ i, b ′ i ) | i = 1, 2,. In this case, the genre relevance calculation unit 13 calculates the relevance R G (a, b) between the genre a and the genre b by R G ′ (G ′) in the following equation.
Figure 2013003893

C(a’,b’)は、ジャンルa’とb’の間に定義されている関係性スコアである。関係性スコアは任意の実数値をとる。ジャンルa’のコンテンツに対してジャンルb’のコンテンツの推薦を行いたい場合には正の値、推薦を行いたくない場合には負の値、どちらでもない場合には値は0として定義する。関係性スコアの絶対値が大きいほど高い関連度を算出する。例えば、「子供向け」と「ホラー」は関連度を低くするため、図5に示すように、C(子供向け,ホラー)=−1と定義されている。   C (a ′, b ′) is a relationship score defined between the genres a ′ and b ′. The relation score takes an arbitrary real value. A positive value is defined when the content of the genre b 'is recommended for the content of the genre a', a negative value when the recommendation is not desired, and a value is defined as 0 when neither is recommended. The higher the absolute value of the relationship score, the higher the degree of relevance is calculated. For example, in order to reduce the degree of association between “for children” and “horror”, C (for children, horror) = − 1 is defined as shown in FIG.

T(a’,b’)は、ジャンルa’およびb’がどれだけ詳細なジャンルであるかに基づくスコアを算出する関数であり、a’およびb’のジャンルが詳細であるほど大きい値となる。例えば、ジャンルaが「子供向けアニメ」、ジャンルbが「ホラー」であるとする。この場合、ジャンルaとジャンルbに共通する最も近い祖先は「VOD」であり、これより深い階層「子供向け」と「ホラー」の間に関係性スコアが定義されている。このとき、ジャンルa’は「子供向け」、ジャンルb’は「ホラー」となる。T(a’,b’)は、例えば、以下の式により算出することができる。

Figure 2013003893
T (a ′, b ′) is a function for calculating a score based on how detailed the genres a ′ and b ′ are, and the larger the genre of a ′ and b ′, the larger the value. Become. For example, it is assumed that the genre a is “anime for children” and the genre b is “horror”. In this case, the closest ancestor common to the genre a and the genre b is “VOD”, and a relationship score is defined between the deeper levels “for children” and “horror”. At this time, the genre a ′ is “for children” and the genre b ′ is “horror”. T (a ′, b ′) can be calculated by the following equation, for example.
Figure 2013003893

ただし、N(a’)は、全コンテンツのうちジャンルa’に属するコンテンツ数を返す関数であり、Nrootは全コンテンツ数である。αはパラメータであり、任意の値を設定することができる。Nroot=12000、α=100、N(子供向け)=1000、N(ホラー)=90であるとすると、T(子供向け,ホラー)=0.4となる。よって、「子供向けアニメ」と「ホラー」の関連度Rは、R’(子供向け,ホラー)=−1×0.4=−0.4となる。 However, N (a ′) is a function that returns the number of contents belonging to the genre a ′ among all contents, and N root is the number of all contents. α is a parameter, and an arbitrary value can be set. Assuming that N root = 12000, α = 100, N (for children) = 1000, and N (horror) = 90, T (for children, horror) = 0.4. Therefore, the degree of association R G between “anime for children” and “horror” is R G ′ (for children, horror) = − 1 × 0.4 = −0.4.

T(a’,b’)の別の算出方法を説明する。例えば、ジャンルa’およびb’がそれぞれ末端から何階層目に属しているかによりT(a’,b’)を算出してもよい。このとき、T(a’,b’)は以下の式により算出することができる。

Figure 2013003893
Another method for calculating T (a ′, b ′) will be described. For example, T (a ′, b ′) may be calculated according to the number of genres a ′ and b ′ belong to from the end. At this time, T (a ′, b ′) can be calculated by the following equation.
Figure 2013003893

ただし、D(a’)は、ジャンル体系の木構造においてジャンルa’が末端から何階層目に属しているかを返す関数であり、D(子供向け)=2となる。βはパラメータであり、任意の値を設定することができる。β=3、D(子供向け)=2、D(ホラー)=1であるとすると、T(子供向け,ホラー)=1となる。   However, D (a ′) is a function that returns the number of levels that the genre a ′ belongs to from the end in the tree structure of the genre system, and D (for children) = 2. β is a parameter, and an arbitrary value can be set. If β = 3, D (for children) = 2, and D (horror) = 1, then T (for children, horror) = 1.

次に、ジャンルaとジャンルbに共通する最も近い祖先より深い階層で関係性スコアが定義されていない場合について詳しく説明する。ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとする。この場合、ジャンル関連度算出部13は、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR”(c)により算出する。

Figure 2013003893
Next, the case where the relationship score is not defined in a hierarchy deeper than the nearest ancestor common to the genre a and the genre b will be described in detail. The nearest ancestor common to genre a and genre b is defined as genre c. In this case, the genre relevance calculation unit 13 calculates the relevance R G (a, b) between the genre a and the genre b by R G ″ (c) of the following equation.
Figure 2013003893

T(c,c)の値は、数5や数6により算出することができる。例えば、ジャンルaが「洋画−SF」、ジャンルbが「邦画−アクション」であるとする。この場合、ジャンルaとジャンルbに共通する最も近い祖先は「映画」であり、これより深い階層には関係性スコアが定義されていない。そこで、Nroot=12000、α=100、N(映画)=1000であるとすると、T(c,c)は、数5によりR”(映画)=0.12と算出することができる。 The value of T (c, c) can be calculated by Equation 5 or Equation 6. For example, it is assumed that the genre a is “foreign film-SF” and the genre b is “Japanese film-action”. In this case, the closest ancestor common to genre a and genre b is “movie”, and no relationship score is defined in a deeper hierarchy. Therefore, assuming that N root = 12000, α = 100, and N (movie) = 1000, T (c, c) can be calculated as R G ″ (movie) = 0.12 using Equation 5.

以上のように、コンテンツ関連度算出装置10によれば、ジャンル間の関係性を考慮するようにしているので、より適切なコンテンツを推薦することができる。すなわち、ジャンルの異なる2つのコンテンツに対しても、各コンテンツのジャンル間の関係性に基づいてコンテンツ間の関連度を算出することができるため、内容ベースフィルタリングの推薦技術による推薦において、より強く関連するコンテンツをより多く推薦することが可能になる。   As described above, according to the content relevance calculation device 10, since the relationship between genres is considered, more appropriate content can be recommended. That is, since the degree of association between contents can be calculated based on the relationship between the genres of each content even for two contents of different genres, it is more strongly related in the recommendation based on the recommendation technique of content-based filtering. More content can be recommended.

また、コンテンツ関連度算出装置10によれば、関係性スコアが定義されている場合、数4によりジャンル間の関連度を算出するようにしている。すなわち、関係性スコアの絶対値が大きいほど高い関連度を算出するとともに、ジャンルa’およびb’の階層が深いほど高い関連度を算出するようにしているので、適切にジャンル間の関連度を算出することができる。   Further, according to the content relevance calculation device 10, when the relevance score is defined, the relevance between genres is calculated by Equation 4. In other words, the higher the absolute value of the relationship score, the higher the degree of association is calculated, and the higher the degree of genre a ′ and b ′ is, the higher the degree of association is calculated. Can be calculated.

また、コンテンツ関連度算出装置10によれば、関係性スコアが定義されていない場合、数7によりジャンル間の関連度を算出するようにしている。すなわち、祖先にあたるジャンルの階層が深いほど高い関連度を算出するようにしているので、適切にジャンル間の関連度を算出することができる。   Further, according to the content relevance calculation device 10, when the relevance score is not defined, the relevance between genres is calculated by Equation 7. That is, since the higher the degree of association is calculated as the level of the genre corresponding to the ancestor is deeper, the degree of association between genres can be appropriately calculated.

なお、本発明は、前記の実施形態に限定されず、特許請求の範囲内において変更や応用が可能である。例えば、ジャンル体系蓄積部17は、木構造として表現されているジャンル体系を蓄積することとしているが、ジャンル体系は階層構造として表現されていればよく、木構造に限定されるものではない。また、ユーザが関係性スコアを指定することとしているが、ユーザ以外の者(例えばコンテンツ提供者)が関係性スコアを指定することも可能である。   In addition, this invention is not limited to the said embodiment, A change and application are possible within a claim. For example, the genre system storage unit 17 stores the genre system expressed as a tree structure. However, the genre system only needs to be expressed as a hierarchical structure, and is not limited to the tree structure. In addition, although the user designates the relationship score, a person other than the user (for example, a content provider) can also designate the relationship score.

また、本発明は、コンテンツ関連度算出装置10として実現することができるだけでなく、コンテンツ関連度算出装置10が備える特徴的な処理部をステップとする画像処理方法として実現したり、それらの各処理部としてコンピュータを機能させるコンテンツ関連度算出プログラムとして実現したりすることもできる。このようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのはいうまでもない。   In addition, the present invention can be realized not only as the content relevance calculation device 10, but also as an image processing method using a characteristic processing unit included in the content relevance calculation device 10 as a step, It can also be realized as a content relevance calculation program that causes a computer to function as a unit. It goes without saying that such a program can be distributed via a recording medium such as a CD-ROM or a transmission medium such as the Internet.

10…コンテンツ関連度算出装置
11…コンテンツ指定部
13…ジャンル関連度算出部
14…コンテンツ関連度算出部
17…ジャンル体系蓄積部
18…関係性スコア蓄積部
DESCRIPTION OF SYMBOLS 10 ... Content relevance calculation apparatus 11 ... Content designation | designated part 13 ... Genre relevance degree calculation part 14 ... Content relevance degree calculation part 17 ... Genre system storage part 18 ... Relevance score storage part

Claims (7)

コンテンツ間の関連度を算出するコンテンツ関連度算出装置であって、
関連度の算出対象となるコンテンツを指定するコンテンツ指定部と、
階層構造として表現されているジャンル体系を蓄積するジャンル体系蓄積部と、
ジャンル間の関係性の強さを表す関係性スコアを蓄積する関係性スコア蓄積部と、
前記ジャンル体系蓄積部に蓄積されている階層構造において前記コンテンツ指定部により指定されたコンテンツのジャンルに共通する最も近い祖先を特定し、その祖先より深い階層において前記関係性スコア蓄積部に蓄積されている関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出するジャンル関連度算出部と、
前記ジャンル関連度算出部により算出されたジャンル間の関連度に基づいて前記コンテンツ指定部により指定されたコンテンツ間の関連度を算出するコンテンツ関連度算出部と、
を備えることを特徴とするコンテンツ関連度算出装置。
A content relevance calculation device that calculates relevance between contents,
A content designating unit for designating content for which relevance is to be calculated;
A genre system storage unit that stores genre systems expressed as a hierarchical structure;
A relationship score accumulating unit for accumulating a relationship score representing the strength of the relationship between genres;
In the hierarchical structure stored in the genre system storage unit, the closest ancestor common to the genre of the content specified by the content specification unit is specified, and stored in the relationship score storage unit in a hierarchy deeper than the ancestor If a relationship score is defined, a genre relevance calculating unit that calculates a relevance between genres based on the relationship score;
A content relevance calculating unit that calculates a relevance between contents specified by the content specifying unit based on a relevance between genres calculated by the genre relevance calculating unit;
A content relevance calculation device comprising:
前記ジャンル関連度算出部は、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとすると、ジャンルaの祖先でジャンルcより深いジャンルa’とジャンルbの祖先でジャンルcより深いジャンルb’との間に前記関係性スコアが定義されている場合、その関係性スコアの絶対値が大きいほど高い関連度を算出するとともに、ジャンルa’およびb’の階層が深いほど高い関連度を算出することを特徴とする請求項1記載のコンテンツ関連度算出装置。   If the closest ancestor common to genre a and genre b is genre c, the genre relevance calculating unit genre a 'is an ancestor of genre a and deeper than genre c, and genre b' is an ancestor of genre b and deeper than genre c. If the relationship score is defined between and the higher the absolute value of the relationship score, the higher the degree of relevance is calculated, and the higher the degree of genre a ′ and b ′ is, the higher the degree of relevance is calculated The content relevance calculating apparatus according to claim 1, wherein: 前記ジャンル関連度算出部は、ジャンルa’とb’の間に定義されている関係性スコアをC(a’,b’)とし、ジャンルa’およびb’がどれだけ詳細なジャンルであるかに基づくスコアを算出する関数をT(a’,b’)とし、ジャンルaとジャンルbにおいて最も近い共通の祖先以上に深い階層で定義されている関係性スコアがG’={(a’i,b’)|i=1,2,・・・}におけるi番目のジャンルの間であったとすると、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR’( G’)により算出することを特徴とする請求項2記載のコンテンツ関連度算出装置。
Figure 2013003893
The genre relevance calculating unit sets a relationship score defined between genres a ′ and b ′ as C (a ′, b ′), and how detailed are the genres a ′ and b ′. Let T (a ′, b ′) be a function that calculates a score based on, and the relationship score defined at a deeper level than the closest common ancestor in genre a and genre b is G ′ = {(a ′ i , B ′ i ) | i = 1, 2,...}, The relation R G (a, b) between the genre a and the genre b is expressed as R G The content relevance calculating apparatus according to claim 2, wherein the content relevance calculating apparatus calculates by “(G ′)”.
Figure 2013003893
前記ジャンル関連度算出部は、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとすると、ジャンルaの祖先でジャンルcより深いジャンルa’とジャンルbの祖先でジャンルcより深いジャンルb’との間に前記関係性スコアが定義されていない場合、前記祖先にあたるジャンルの階層が深いほど高い関連度を算出することを特徴とする請求項1記載のコンテンツ関連度算出装置。   If the closest ancestor common to genre a and genre b is genre c, the genre relevance calculating unit genre a 'is an ancestor of genre a and deeper than genre c, and genre b' is an ancestor of genre b and deeper than genre c. 2. The content relevance calculation apparatus according to claim 1, wherein when the relationship score is not defined between the two, the relevance degree is higher as the genre hierarchy corresponding to the ancestor is deeper. 前記ジャンル関連度算出部は、ジャンルcがどれだけ詳細なジャンルであるかに基づくスコアを算出する関数をT(c,c)とすると、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR”(c)により算出することを特徴とする請求項4記載のコンテンツ関連度算出装置。
Figure 2013003893
When the function for calculating a score based on how detailed the genre c is is a genre c, the genre relevance calculation unit calculates the relevance R G (a, b) between the genre a and the genre b. ) Is calculated by R G ″ (c) in the following equation.
Figure 2013003893
コンテンツ間の関連度を算出するコンテンツ関連度算出方法であって、
関連度の算出対象となるコンテンツを指定するコンテンツ指定ステップと、
階層構造として表現されているジャンル体系を蓄積するジャンル体系蓄積ステップと、
ジャンル間の関係性の強さを表す関係性スコアを蓄積する関係性スコア蓄積ステップと、
前記ジャンル体系蓄積ステップで蓄積された階層構造において前記コンテンツ指定ステップで指定されたコンテンツのジャンルに共通する最も近い祖先を特定し、その祖先より深い階層において前記関係性スコア蓄積ステップで蓄積された関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出するジャンル関連度算出ステップと、
前記ジャンル関連度算出ステップで算出されたジャンル間の関連度に基づいて前記コンテンツ指定ステップで指定されたコンテンツ間の関連度を算出するコンテンツ関連度算出ステップと、
を備えることを特徴とするコンテンツ関連度算出方法。
A content relevance calculation method for calculating relevance between contents,
A content designating step for designating content for which relevance is to be calculated;
A genre system accumulating step for accumulating a genre system expressed as a hierarchical structure;
A relationship score accumulation step for accumulating a relationship score representing the strength of the relationship between genres;
In the hierarchical structure accumulated in the genre system accumulation step, the closest ancestor common to the genre of the content designated in the content designation step is specified, and the relation accumulated in the relationship score accumulation step in a hierarchy deeper than the ancestor If a sex score is defined, a genre relevance calculating step for calculating a relevance between genres based on the relevance score;
A content relevance calculating step for calculating a relevance between the contents specified in the content specifying step based on the relevance between the genres calculated in the genre relevance calculating step;
A content relevance calculation method characterized by comprising:
請求項1乃至5のいずれか1項に記載した各処理部としてコンピュータを機能させることを特徴とするコンテンツ関連度算出プログラム。   A content relevance calculation program for causing a computer to function as each processing unit according to any one of claims 1 to 5.
JP2011135167A 2011-06-17 2011-06-17 Content relevance calculation device, content relevance calculation method, and content relevance calculation program Active JP5346992B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011135167A JP5346992B2 (en) 2011-06-17 2011-06-17 Content relevance calculation device, content relevance calculation method, and content relevance calculation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011135167A JP5346992B2 (en) 2011-06-17 2011-06-17 Content relevance calculation device, content relevance calculation method, and content relevance calculation program

Publications (2)

Publication Number Publication Date
JP2013003893A true JP2013003893A (en) 2013-01-07
JP5346992B2 JP5346992B2 (en) 2013-11-20

Family

ID=47672392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011135167A Active JP5346992B2 (en) 2011-06-17 2011-06-17 Content relevance calculation device, content relevance calculation method, and content relevance calculation program

Country Status (1)

Country Link
JP (1) JP5346992B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020205028A (en) * 2019-05-20 2020-12-24 アクセンチュア グローバル ソリューションズ リミテッド Facilitating merging of concept hierarchies

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002251408A (en) * 2001-02-23 2002-09-06 Fuji Xerox Co Ltd Information browsing support device
JP2005078627A (en) * 2003-08-28 2005-03-24 Samsung Electronics Co Ltd Method and system for recommending content

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002251408A (en) * 2001-02-23 2002-09-06 Fuji Xerox Co Ltd Information browsing support device
JP2005078627A (en) * 2003-08-28 2005-03-24 Samsung Electronics Co Ltd Method and system for recommending content

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020205028A (en) * 2019-05-20 2020-12-24 アクセンチュア グローバル ソリューションズ リミテッド Facilitating merging of concept hierarchies
JP7018924B2 (en) 2019-05-20 2022-02-14 アクセンチュア グローバル ソリューションズ リミテッド Promoting the merger of conceptual hierarchies
US11366845B2 (en) 2019-05-20 2022-06-21 Accenture Global Solutions Limited Facilitating merging of concept hierarchies

Also Published As

Publication number Publication date
JP5346992B2 (en) 2013-11-20

Similar Documents

Publication Publication Date Title
US9715731B2 (en) Selecting a high valence representative image
AU2016247184B2 (en) Attribute weighting for media content-based recommendation
JP6316409B2 (en) Generate a feed of content items associated with a topic from multiple content sources
US10250933B2 (en) Remote device activity and source metadata processor
US8804999B2 (en) Video recommendation system and method thereof
KR102457665B1 (en) Predict topics for potential relevance based on retrieved/generated digital media files
US20180101540A1 (en) Diversifying Media Search Results on Online Social Networks
US20170220580A1 (en) Topic Thread Creation
JP2010176327A (en) Learning device, learning method, information-processing device, data-selecting method, data-accumulating method, data-converting method, and program
US20140365468A1 (en) News Results through Query Expansion
WO2014100005A1 (en) Formation and description of user subgroups
JP2009289092A (en) Information processor, recommendation method, program and recording medium
JP2018073429A (en) Retrieval device, retrieval method, and retrieval program
US20140025666A1 (en) Identifying relevant data for pages in a social networking system
JP5367872B2 (en) How to provide users with selected content items
US9875443B2 (en) Unified attractiveness prediction framework based on content impact factor
JP5627002B2 (en) Similar video output method, similar video output device, and similar video output program
JP5346992B2 (en) Content relevance calculation device, content relevance calculation method, and content relevance calculation program
JP6321945B2 (en) Digest video generation device, digest video generation method, and digest video generation program
JP6040137B2 (en) Item recommendation device, item recommendation method, and item recommendation program
CN113657116B (en) Social media popularity prediction method and device based on visual semantic relationship
JP6310529B1 (en) SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM
EP3306555A1 (en) Diversifying media search results on online social networks
Fang Cannibalizing collective memory: Chinese history and political consciousness in Tsui Hark’s The Taking of Tiger Mountain
Agius et al. Experimenting with tagging and context for collaborative MPEG-7 metadata

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130416

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130819

R150 Certificate of patent or registration of utility model

Ref document number: 5346992

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350