JP6321945B2 - Digest video generation device, digest video generation method, and digest video generation program - Google Patents

Digest video generation device, digest video generation method, and digest video generation program Download PDF

Info

Publication number
JP6321945B2
JP6321945B2 JP2013237734A JP2013237734A JP6321945B2 JP 6321945 B2 JP6321945 B2 JP 6321945B2 JP 2013237734 A JP2013237734 A JP 2013237734A JP 2013237734 A JP2013237734 A JP 2013237734A JP 6321945 B2 JP6321945 B2 JP 6321945B2
Authority
JP
Japan
Prior art keywords
scene
video
scenes
similarity
digest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013237734A
Other languages
Japanese (ja)
Other versions
JP2015099958A (en
Inventor
大我 吉田
大我 吉田
新井 啓之
啓之 新井
行信 谷口
行信 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013237734A priority Critical patent/JP6321945B2/en
Publication of JP2015099958A publication Critical patent/JP2015099958A/en
Application granted granted Critical
Publication of JP6321945B2 publication Critical patent/JP6321945B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)

Description

本発明は、映像を編集してダイジェスト映像を生成するダイジェスト映像生成装置、ダイジェスト映像生成方法及びダイジェスト映像生成プログラムに関する。   The present invention relates to a digest video generation device, a digest video generation method, and a digest video generation program that edit video and generate a digest video.

映像の内容に興味があるか否かをユーザが判断するために、映像すべてを視聴すると非常に時間がかかる場合があるため、映像すべてを視聴してから判断することが困難なことがある。短時間で映像の内容を把握するために、映像のダイジェスト映像を生成してダイジェスト映像を視聴することが行われている。   Since it may take a very long time to view all the videos in order for the user to determine whether or not he / she is interested in the contents of the videos, it may be difficult to determine after viewing all the videos. In order to grasp the contents of a video in a short time, a digest video of the video is generated and the digest video is viewed.

ダイジェスト映像を生成する技術としては、例えば特許文献1に記載されている技術がある。この技術では、他のユーザの動作状況を分析し、他のユーザの興味情報に基づいてシーンの注目度を算出し、他のユーザ注目度の高いシーンを映像から選択し、選択したシーンでダイジェスト映像を生成し、提示している。   As a technique for generating a digest video, for example, there is a technique described in Patent Document 1. In this technology, the operation status of other users is analyzed, the attention level of the scene is calculated based on the interest information of the other users, the scene with the other user attention level is selected from the video, and the digest is selected in the selected scene. A video is generated and presented.

特開2012−248987号公報JP 2012-248987 A

しかしながら、注目度の高いシーンを見るだけでは、内容の前後関係やシーン間の関係を考慮していないダイジェスト映像が生成されることがあり、内容の把握が難しい場合がある。例えば、サッカーの試合映像では、得点が入った瞬間のシーンで注目度が高くなると考えられる。しかし、得点が入った瞬間のシーンだけを見ても、どのようなプレイがあって得点につながったのかといった得点が入ったシーンの前後関係を把握することができず、ユーザが十分に内容を把握できない可能性がある。また、例えば長時間に亘って生放送される映像の場合、時間帯によって視聴者数が異なり、視聴者数が少ない場合には、注目度の高い他のシーンと似ているシーンがあってもダイジェスト映像に加えることができないという問題もある。そのため、前述のように生成されたダイジェスト映像だけでは映像の内容に関して十分な情報を得ることができず、映像の内容を把握するために映像を視聴しなければならないことがあった。   However, simply viewing a scene with a high degree of attention may generate a digest video that does not consider the context of the content or the relationship between the scenes, which may make it difficult to grasp the content. For example, in a soccer game video, it is considered that the degree of attention increases in the scene at the moment when a score is entered. However, just looking at the scene at the moment when the score was entered, it was impossible to grasp the context of the scene with the score, such as what kind of play had led to the score. It may not be possible to grasp. For example, in the case of video that is broadcast live for a long time, if the number of viewers varies depending on the time zone and the number of viewers is small, even if there are scenes similar to other scenes with high attention, There is also a problem that it cannot be added to the video. For this reason, sufficient information regarding the content of the video cannot be obtained only with the digest video generated as described above, and the video has to be viewed in order to grasp the content of the video.

本発明は、前述の問題を解決するためのものであり、映像内容に対するユーザの把握の度合いを高めることができるダイジェスト映像を生成するダイジェスト映像生成装置、ダイジェスト映像生成方法及びダイジェスト映像生成プログラムを提供することを目的としている。   The present invention is intended to solve the above-described problems, and provides a digest video generation device, a digest video generation method, and a digest video generation program that generate a digest video that can increase the degree of user understanding of video content. The purpose is to do.

本発明の一態様は、指定された映像を複数のシーンに分割するシーン分割部と、前記複数のシーンごとに興味度を算出するユーザ興味度算出部と、前記複数のシーンにおける2つのシーンの組み合わせごとにシーン間の類似度を算出するシーン間類似度算出部と、前記ユーザ興味度算出部が算出した各シーンの興味度と前記シーン間類似度算出部が算出した各シーン間の類似度とに基づいて各シーンに対するスコアを算出するシーンスコア算出部と、前記複数のシーンそれぞれに対して算出されたスコアに基づいて前記複数のシーンからシーンを選択し、選択したシーンを含む前記映像のダイジェスト映像を生成するダイジェスト映像生成部と、を備え、前記シーンスコア算出部は、前記複数のシーンそれぞれをノードとし、シーン間の類似度をノード間のエッジとするグラフを生成し、ノードの興味度を初期状態における各ノードに対する存在確率としノード間のエッジに割り当てられた類似度を遷移確率としてノード間をランダムに移動した後の各ノードの存在確率をスコアとして算出することを特徴とするダイジェスト映像生成装置である。 One aspect of the present invention includes a scene dividing unit that divides a designated video into a plurality of scenes, a user interest degree calculating unit that calculates an interest level for each of the plurality of scenes, and two scenes in the plurality of scenes. Inter-scene similarity calculation unit that calculates the similarity between scenes for each combination, the interest degree of each scene calculated by the user interest calculation unit, and the similarity between scenes calculated by the inter-scene similarity calculation unit A scene score calculation unit that calculates a score for each scene based on the above, a scene is selected from the plurality of scenes based on the score calculated for each of the plurality of scenes, and the video including the selected scene is selected. It includes a digest video generation unit for generating a digest video, the said scene score calculation unit, each of the plurality of scenes to a node, similar between scenes Each node after moving randomly between nodes using the node's degree of interest as the existence probability for each node in the initial state and the similarity assigned to the edge between nodes as the transition probability a digest video generation device characterized that you calculate the existence probability of the node as the score.

また、本発明の一態様は、上記に記載のダイジェスト映像生成装置において、前記シーン間類似度算出部は、前記映像における前記複数のシーンそれぞれの開始時刻、シーンに関連するキーワード、シーンの映像特徴のうち少なくとも1つを用いてシーン間の類似度を算出することを特徴とする。   According to another aspect of the present invention, in the digest video generation device described above, the inter-scene similarity calculation unit includes a start time of each of the plurality of scenes in the video, a keyword related to the scene, and a video feature of the scene. The similarity between scenes is calculated using at least one of the above.

また、本発明の一態様は、指定された映像のダイジェスト映像を生成するダイジェスト映像生成装置が行うダイジェスト映像生成方法であって、前記映像を複数のシーンに分割するシーン分割ステップと、前記複数のシーンごとに興味度を算出するユーザ興味度算出ステップと、前記複数のシーンにおける2つのシーンの組み合わせごとにシーン間の類似度を算出するシーン間類似度算出ステップと、前記ユーザ興味度算出ステップにおいて算出した各シーンの興味度と前記シーン間類似度算出ステップにおいて算出した各シーン間の類似度とに基づいて各シーンに対するスコアを算出するシーンスコア算出ステップと、前記複数のシーンそれぞれに対して算出されたスコアに基づいて前記複数のシーンからシーンを選択し、選択したシーンを含む前記映像のダイジェスト映像を生成するダイジェスト映像生成ステップと、を含み、前記シーンスコア算出ステップでは、前記複数のシーンそれぞれをノードとしシーン間の類似度をノード間のエッジとするグラフを生成し、ノードの興味度を初期状態における各ノードに対する存在確率としノード間のエッジに割り当てられた類似度を遷移確率としてノード間をランダムに移動した後の各ノードの存在確率をスコアとして算出することを特徴とするダイジェスト映像生成方法である。 Another aspect of the present invention is a digest video generation method performed by a digest video generation apparatus that generates a digest video of a specified video, a scene division step for dividing the video into a plurality of scenes, A user interest level calculating step for calculating an interest level for each scene, an interscene similarity level calculating step for calculating a similarity level between scenes for each combination of two scenes in the plurality of scenes, and the user interest level calculating step. A scene score calculating step for calculating a score for each scene based on the calculated interest degree of each scene and the similarity between scenes calculated in the inter-scene similarity calculating step, and calculating for each of the plurality of scenes Selecting a scene from the plurality of scenes based on the score obtained, and selecting the selected scene Anda digest video generation step of generating a digest video of the video, including, in the scene score calculating step to generate a graph edge between the similarity nodes between scene each of the plurality of scenes and nodes, The node's degree of interest is the probability of existence for each node in the initial state, the similarity assigned to the edge between nodes is used as the transition probability, and the existence probability of each node after moving randomly between nodes is calculated as a score A digest video generation method.

また、本発明の一態様は、上記に記載のダイジェスト映像生成方法において、前記シーン間類似度算出ステップでは、前記映像における前記複数のシーンそれぞれの開始時刻、シーンに関連するキーワード、シーンの映像特徴のうち少なくとも1つを用いてシーン間の類似度を算出することを特徴とする。   According to another aspect of the present invention, in the digest video generation method described above, in the inter-scene similarity calculation step, a start time of each of the plurality of scenes in the video, a keyword related to the scene, and a video feature of the scene The similarity between scenes is calculated using at least one of the above.

また、本発明の一態様は、上記に記載のダイジェスト映像生成装置としてコンピュータを機能させるためのダイジェスト映像生成プログラムである。   One embodiment of the present invention is a digest video generation program for causing a computer to function as the digest video generation apparatus described above.

本発明によれば、シーンごとに算出した興味度とシーン間の類似度とに基づいてスコアを算出し、算出したスコアに基づいてダイジェスト映像に含めるシーンを選択することにより、映像に含まれる各シーンのうち興味をもたれやすいシーンと当該シーンに関連するシーンとを含めたダイジェスト映像を生成することができ、映像内容に対するユーザの把握の度合いを高めることができる。   According to the present invention, a score is calculated based on the degree of interest calculated for each scene and the similarity between scenes, and each scene included in the video is selected by selecting a scene to be included in the digest video based on the calculated score. It is possible to generate a digest video including a scene that is easily interesting among the scenes and a scene related to the scene, and it is possible to increase a user's level of understanding of the video content.

本実施形態におけるダイジェスト映像生成装置1の構成例を示すブロック図である。It is a block diagram which shows the structural example of the digest video generation apparatus 1 in this embodiment. 本実施形態における映像情報蓄積部11が記憶している映像情報管理テーブルの一例を示す図である。It is a figure which shows an example of the video information management table which the video information storage part 11 in this embodiment has memorize | stored. 本実施形態における映像情報蓄積部11が記憶している映像−シーン関係管理テーブルの一例を示す図である。It is a figure which shows an example of the video-scene relationship management table which the video information storage part 11 in this embodiment has memorize | stored. 本実施形態における映像情報蓄積部11が記憶しているキーワード情報管理テーブルの一例を示す図である。It is a figure which shows an example of the keyword information management table which the video information storage part 11 in this embodiment has memorize | stored. 本実施形態における映像情報蓄積部11が記憶している映像−キーワード関係管理テーブルの一例を示す図である。It is a figure which shows an example of the video-keyword relationship management table which the video information storage part 11 in this embodiment has memorize | stored. 本実施形態における映像情報蓄積部11が記憶しているシーン興味度管理テーブルの一例を示す図である。It is a figure which shows an example of the scene interest degree management table which the video information storage part 11 in this embodiment has memorize | stored. 本実施形態におけるシーンスコア算出部16がグラフを生成する対象のシーンの一例を示す図である。It is a figure which shows an example of the scene by which the scene score calculation part 16 in this embodiment produces | generates a graph. 本実施形態におけるシーンスコア算出部16が生成するグラフの一例を示す図である。It is a figure which shows an example of the graph which the scene score calculation part 16 in this embodiment produces | generates. 本実施形態におけるシーンスコア算出部16が算出したベクトルv(各シーンのスコア)の一例を示す図である。It is a figure which shows an example of the vector v (score of each scene) which the scene score calculation part 16 in this embodiment calculated. 本実施形態におけるダイジェスト映像生成装置1が行うダイジェスト映像生成処理を示すフローチャートである。It is a flowchart which shows the digest video generation process which the digest video generation apparatus 1 in this embodiment performs.

以下、図面を参照して、本発明に係る実施形態におけるダイジェスト映像生成装置、ダイジェスト映像生成方法及びダイジェスト映像生成プログラムを説明する。図1は、本実施形態におけるダイジェスト映像生成装置1の構成例を示すブロック図である。図1に示すように、ダイジェスト映像生成装置1は、映像情報蓄積部11、映像指定部12、シーン分割部13、ユーザ興味度算出部14、シーン間類似度算出部15、シーンスコア算出部16、ダイジェスト映像生成部17、及び、ダイジェスト映像出力部18を備えている。   Hereinafter, a digest video generation device, a digest video generation method, and a digest video generation program according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram illustrating a configuration example of a digest video generation apparatus 1 according to the present embodiment. As shown in FIG. 1, the digest video generation device 1 includes a video information storage unit 11, a video designation unit 12, a scene division unit 13, a user interest level calculation unit 14, an interscene similarity calculation unit 15, and a scene score calculation unit 16. A digest video generation unit 17 and a digest video output unit 18.

映像情報蓄積部11には、映像及び映像に付随する情報が記憶されている。映像に付随する情報には、例えば映像情報管理テーブル、映像−シーン関係管理テーブル、キーワード情報管理テーブル、映像−キーワード関係管理テーブル、シーン興味度管理テーブルが含まれている。以下に各テーブルの一例を示して説明する。   The video information storage unit 11 stores video and information accompanying the video. The information accompanying the video includes, for example, a video information management table, a video-scene relationship management table, a keyword information management table, a video-keyword relationship management table, and a scene interest level management table. An example of each table will be described below.

図2は、本実施形態における映像情報蓄積部11が記憶している映像情報管理テーブルの一例を示す図である。図2に示すように、映像情報管理テーブルは、映像ID、映像タイトル、及び、内容の説明の各項目の列を有している。映像情報管理テーブルにおいて各行は、映像ごとに存在する。映像IDは、映像情報蓄積部11に記憶されている映像を識別するための識別子である。映像タイトルは、記憶されている映像のタイトルである。内容の説明は、記憶されている映像の内容を示すテキスト情報である。映像情報蓄積部11に記憶されている映像は、映像ID、映像タイトルや内容の説明に含まれるキーワードを指定することにより読み出し可能になっている。   FIG. 2 is a diagram illustrating an example of a video information management table stored in the video information storage unit 11 according to the present embodiment. As shown in FIG. 2, the video information management table has columns of video ID, video title, and description of contents. Each row in the video information management table exists for each video. The video ID is an identifier for identifying a video stored in the video information storage unit 11. The video title is the title of the stored video. The description of the content is text information indicating the content of the stored video. The video stored in the video information storage unit 11 can be read out by designating a video ID, a video title, and a keyword included in the content description.

図3は、本実施形態における映像情報蓄積部11が記憶している映像−シーン関係管理テーブルの一例を示す図である。図3に示すように映像−シーン関係管理テーブルには、映像ID、シーンID、及び、タイムスタンプの各項目の列を有している。映像−シーン関係管理テーブルにおいて各行は、映像情報蓄積部11が記憶している映像に含まれるシーンごとに存在する。シーンIDは、映像IDで識別される映像に含まれる各シーンを識別するための識別子である。タイムスタンプは、映像IDで識別される映像の開始点からシーンが始まるまでの経過時間(開始時刻)である。映像情報蓄積部11に記憶されている映像に含まれる各シーンは、映像IDとシーンIDとを指定することによりで読み出し可能になっている。   FIG. 3 is a diagram illustrating an example of a video-scene relationship management table stored in the video information storage unit 11 according to the present embodiment. As shown in FIG. 3, the video-scene relationship management table has columns of items of video ID, scene ID, and time stamp. Each row in the video-scene relationship management table exists for each scene included in the video stored in the video information storage unit 11. The scene ID is an identifier for identifying each scene included in the video identified by the video ID. The time stamp is an elapsed time (start time) from the start point of the video identified by the video ID to the start of the scene. Each scene included in the video stored in the video information storage unit 11 can be read by designating the video ID and the scene ID.

図4は、本実施形態における映像情報蓄積部11が記憶しているキーワード情報管理テーブルの一例を示す図である。図4に示すように、キーワード情報管理テーブルは、キーワードIDとキーワード名との項目の列を有している。キーワード情報管理テーブルにおいて各行は、キーワードごとに存在する。キーワードIDは、キーワードを識別するための識別子である。キーワード名は、キーワードを示すテキスト情報である。   FIG. 4 is a diagram illustrating an example of the keyword information management table stored in the video information storage unit 11 according to the present embodiment. As shown in FIG. 4, the keyword information management table has columns of items of keyword ID and keyword name. Each row in the keyword information management table exists for each keyword. The keyword ID is an identifier for identifying a keyword. The keyword name is text information indicating the keyword.

図5は、本実施形態における映像情報蓄積部11が記憶している映像−キーワード関係管理テーブルの一例を示す図である。図5に示すように、映像−キーワード関係管理テーブルは、映像ID、シーンID、及び、キーワードIDの各項目の列を有している。映像−キーワード関係管理テーブルにおいて各行は、映像に含まれるシーンに対応付けられているキーワードごとに存在する。映像IDとシーンIDとを指定することにより、映像IDとシーンIDとで特定されるシーン(映像の一部)に対応付けられているキーワードのキーワードIDを得ることができる。   FIG. 5 is a diagram illustrating an example of a video-keyword relationship management table stored in the video information storage unit 11 according to the present embodiment. As shown in FIG. 5, the video-keyword relationship management table has columns of items of video ID, scene ID, and keyword ID. Each row in the video-keyword relationship management table exists for each keyword associated with a scene included in the video. By specifying the video ID and the scene ID, the keyword ID of the keyword associated with the scene (part of the video) specified by the video ID and the scene ID can be obtained.

図6は、本実施形態における映像情報蓄積部11が記憶しているシーン興味度管理テーブルの一例を示す図である。図6に示すように、シーン興味度管理テーブルは、映像ID、シーンID、及び、興味度の各項目の列を有している。興味度は、映像IDとシーンIDとで特定されるシーンに対するユーザの興味を数値化した値である。映像IDとシーンIDとを指定することにより、映像IDとシーンIDとで特定されるシーン(映像の一部)に対応付けられている興味度を得ることができる。   FIG. 6 is a diagram illustrating an example of a scene interest level management table stored in the video information storage unit 11 according to the present embodiment. As shown in FIG. 6, the scene interest level management table has columns of items of video ID, scene ID, and interest level. The degree of interest is a value obtained by quantifying the user's interest in the scene specified by the video ID and the scene ID. By specifying the video ID and the scene ID, it is possible to obtain the degree of interest associated with the scene (part of the video) specified by the video ID and the scene ID.

図1に戻り、ダイジェスト映像生成装置1の構成の説明を続ける。
映像指定部12は、ユーザの操作を受け付けてダイジェスト映像を生成する対象の映像と特定する情報を入力する。映像指定部12は、入力した情報をシーン分割部13に出力する。映像指定部12が入力する情報は、例えば映像の映像タイトルや、映像の内容を示す文言や、映像に関するキーワード、映像に割り当てられている映像IDなどである。
Returning to FIG. 1, the description of the configuration of the digest video generation device 1 will be continued.
The video designating unit 12 receives information specified by a user's operation as a target video for generating a digest video. The video designation unit 12 outputs the input information to the scene division unit 13. The information input by the video designating unit 12 includes, for example, a video title of the video, a word indicating the content of the video, a keyword related to the video, a video ID assigned to the video, and the like.

シーン分割部13は、映像指定部12から出力される情報と、映像情報蓄積部11に記憶されている各テーブルとに基づいて、ダイジェスト映像を生成する対象の映像を特定する。シーン分割部13は、特定した映像を読み出し、読み出した映像を複数のシーンに分割する。シーン分割部13が映像を複数のシーンに分割する際には、公知の方法、例えば参考文献1に記載されているカット点検出方法を用いる。シーン分割部13は、分割した複数のシーンそれぞれに対応するシーンIDを割り当て、シーンが始まる映像における経過時間をタイムスタンプとする。シーン分割部13は、映像IDとシーンIDとタイムスタンプとを対応付けてシーンごとに記憶させる。
[参考文献1]:特許第2869398号公報
The scene dividing unit 13 specifies a target video for generating a digest video based on information output from the video designating unit 12 and each table stored in the video information storage unit 11. The scene dividing unit 13 reads the specified video and divides the read video into a plurality of scenes. When the scene dividing unit 13 divides an image into a plurality of scenes, a known method, for example, a cut point detection method described in Reference Document 1 is used. The scene division unit 13 assigns a scene ID corresponding to each of the plurality of divided scenes, and uses the elapsed time in the video where the scene starts as a time stamp. The scene dividing unit 13 stores the video ID, the scene ID, and the time stamp in association with each scene.
[Reference 1]: Japanese Patent No. 2869398

ユーザ興味度算出部14は、シーン分割部13において得られた各シーンに対する興味度を算出し、算出した興味度とシーンIDと映像IDとを対応付けてシーン興味度管理テーブルに記憶させる。ユーザ興味度算出部14が算出する興味度として、例えば映像のシーンごとの視聴率を用いることができる。ユーザの興味度は、任意の方法で算出することができ、例えば視聴者のフィードバックを得ることが可能なシステムで映像が提供されている場合にはコメントの入力数や共感などを示すボタンの押下数を利用してフィードバックの頻度が高いほど興味度が高くなるように算出してもよい。   The user interest level calculation unit 14 calculates the interest level for each scene obtained by the scene division unit 13, and stores the calculated interest level, the scene ID, and the video ID in association with each other in the scene interest level management table. As the interest level calculated by the user interest level calculation unit 14, for example, an audience rating for each scene of the video can be used. The degree of interest of the user can be calculated by any method. For example, when the video is provided by a system capable of obtaining viewer feedback, the number of comments input, the push of a button indicating empathy, etc. The number may be used so that the degree of interest increases as the frequency of feedback increases.

シーン間類似度算出部15は、ダイジェスト映像を生成する対象の映像のシーン間の類似度を算出する。シーン間類似度算出部15は、シーンに付随するキーワードの共起度、シーンのタイムスタンプの近さ、あるいはシーンの映像特徴などに基づいて、類似度を算出する。   The inter-scene similarity calculation unit 15 calculates the similarity between scenes of a target video for generating a digest video. The inter-scene similarity calculation unit 15 calculates the similarity based on the co-occurrence of keywords associated with the scene, the proximity of the scene time stamp, or the video characteristics of the scene.

シーンに付随するキーワードの共起度を用いて類似度を算出する場合、シーン間類似度算出部15は、シーンAとシーンBとの類似度R(A,B)を次式(1)により算出する。   When calculating the similarity using the co-occurrence of keywords associated with the scene, the inter-scene similarity calculation unit 15 calculates the similarity R (A, B) between the scene A and the scene B by the following equation (1). calculate.

Figure 0006321945
Figure 0006321945

式(1)において、|K|はシーンAに付随するキーワードの数であり、|K|はシーンBに付随するキーワードの数であり、|K∩K|はシーンAとシーンBとに共通して付随するキーワードの数である。シーンに付随するキーワードとしては、字幕として映像に付与されているテキストから抽出したキーワードや、シーンに対して視聴者が入力したコメントに含まれるキーワードを利用することができる。シーン間類似度算出部15は、抽出したキーワードと当該キーワードを識別するキーワードIDとを対応付けてキーワード情報管理テーブルに記憶させる。また、シーン間類似度算出部15は、キーワードIDと映像IDとシーンIDと対応付けて映像−キーワード関係管理テーブルに記憶させる。 In equation (1), | K A | is the number of keywords associated with scene A, | K B | is the number of keywords associated with scene B, and | K A ∩K B | B is the number of keywords that accompany B. As keywords associated with the scene, keywords extracted from text attached to the video as subtitles or keywords included in comments input by the viewer to the scene can be used. The inter-scene similarity calculation unit 15 stores the extracted keyword and the keyword ID for identifying the keyword in association with each other in the keyword information management table. The inter-scene similarity calculation unit 15 stores the keyword ID, the video ID, and the scene ID in association with each other in the video-keyword relationship management table.

また、シーンのタイムスタンプの近さを用いて類似度を算出する場合、シーン類似度算出部15は、シーンAとシーンBとの類似度R(A,B)を次式(2)により算出する。なお、Tは映像の開始点からシーンAが開始するまでの経過時間であり、Tは映像の開始点からシーンBが開始するまでの経過時間である。 When calculating the similarity using the closeness of the time stamp of the scene, the scene similarity calculation unit 15 calculates the similarity R (A, B) between the scene A and the scene B by the following equation (2). To do. T A is an elapsed time from the start point of the video until the scene A starts, and T B is an elapsed time from the start point of the video to the start of the scene B.

Figure 0006321945
Figure 0006321945

また、シーンの映像特徴を用いて類似を算出する場合、シーン類似度算出部15は、シーンにおける映像の色や音、映像における動きの類似度を数値化して類似度R(A,B)を算出する。   When calculating the similarity using the video feature of the scene, the scene similarity calculation unit 15 quantifies the similarity of the color and sound of the video in the scene and the motion in the video, and calculates the similarity R (A, B). calculate.

シーン類似度算出部15は、シーン間の類似度R(A,B)として、前述の指標を含む複数の指標に基づく類似度を組み合わせて算出してもよい。この場合、類似度R(A,B)は、次式(3)により算出される。なお、R(A,B)は任意の指標に基づいて算出したシーンAとシーンBとの類似度であり、wは類似度R(A,B)に対する重み係数である。 The scene similarity calculation unit 15 may calculate the similarity R (A, B) between scenes by combining similarities based on a plurality of indices including the above-described indices. In this case, the similarity R (A, B) is calculated by the following equation (3). Note that R i (A, B) is the similarity between the scene A and the scene B calculated based on an arbitrary index, and w i is a weighting factor for the similarity R i (A, B).

Figure 0006321945
Figure 0006321945

シーンスコア算出部16は、シーン間類似度算出部15が算出したシーン間の類似度を用いて、各シーンのスコアを算出する。シーンスコア算出部16は、各シーンのスコアの算出を以下のように行う。シーンスコア算出部16は、シーンをノードとし、シーン間の類似度を該当するシーンのノード間のエッジとする無向グラフ(以下、グラフという。)を生成する。   The scene score calculation unit 16 calculates the score of each scene using the similarity between scenes calculated by the inter-scene similarity calculation unit 15. The scene score calculation unit 16 calculates the score of each scene as follows. The scene score calculation unit 16 generates an undirected graph (hereinafter referred to as a graph) in which a scene is a node and a similarity between scenes is an edge between nodes of the corresponding scene.

図7は、本実施形態におけるシーンスコア算出部16がグラフを生成する対象のシーンの一例を示す図である。図8は、本実施形態におけるシーンスコア算出部16が生成するグラフの一例を示す図である。ここでは、サッカーの試合映像に対してタイムスタンプに基づく類似度を算出してグラフを作成した例が示されている。図7には、グラフを作成する際のノードとなるシーン1〜シーン5に関する情報(タイムスタンプと興味度)が示されている。図8には、シーンスコア算出部16が生成したグラフが示されている。   FIG. 7 is a diagram illustrating an example of a scene for which the scene score calculation unit 16 according to the present embodiment generates a graph. FIG. 8 is a diagram illustrating an example of a graph generated by the scene score calculation unit 16 in the present embodiment. Here, an example is shown in which a graph is created by calculating a similarity based on a time stamp for a soccer game video. FIG. 7 shows information (time stamp and degree of interest) related to scenes 1 to 5 which are nodes when creating a graph. FIG. 8 shows a graph generated by the scene score calculation unit 16.

シーンスコア算出部16は、各シーンに対応する行と列とを有し、行に対応するシーンの興味度、及び、行と列とに対応するシーン間の類似度から算出する値を要素の値とする確率行列Pを算出する。確率行列Pのi行j列の要素pijは、例えば次式(4)により算出される。 The scene score calculation unit 16 has a row and a column corresponding to each scene, and calculates a value calculated from the degree of interest of the scene corresponding to the row and the similarity between the scenes corresponding to the row and the column. A probability matrix P as a value is calculated. The element pij of i row j column of the probability matrix P is calculated by following Formula (4), for example.

Figure 0006321945
Figure 0006321945

式(4)において、αは興味度と類似度とのいずれを重視するかを示す重み係数であり、I(S)は映像におけるi番目のシーンSiの興味度であり、R(S,S)は映像におけるi番目のシーンSとj番目のシーンSとのシーン間の類似度である。また、シーンスコア算出部16は、映像における各シーンの興味度の和(ΣI(S))と、シーン間の類似度の和(ΣR(S,S))とそれぞれが1になるように正規化する。 In Equation (4), α is a weighting factor indicating which of the interest level and the similarity level is important, I (S i ) is the interest level of the i-th scene Si in the video, and R (S i , S j ) is the similarity between the scenes of the i-th scene S i and the j-th scene S j in the video. In addition, the scene score calculation unit 16 includes a sum of the interest levels of each scene in the video (Σ i I (S i )) and a similarity level between the scenes (Σ i R (S i , S j )). Normalize so that becomes 1.

シーンスコア算出部16は、算出した確率行列Pに対して次式(5)を満たすベクトルvを算出する。   The scene score calculation unit 16 calculates a vector v satisfying the following expression (5) for the calculated probability matrix P.

Figure 0006321945
Figure 0006321945

算出されたベクトルvは、グラフにおいて任意のノードを出発点とし、シーンSにいる場合に確率pij(=αI(S)+(1−α)R(S,S))でシーンSへの移動を無限回繰り返したときの、各シーン(グラフにおけるノード)における存在確率である。ベクトルvは、確率行列Pの固有値が最大となるときの固有ベクトルに相当する。ベクトルvを長さ1に正規化したときの各次元の値を、ベクトルvの各次元に対応するシーンのスコアとする。 The calculated vector v has a probability p ij (= αI (S i ) + (1−α) R (S i , S j )) when an arbitrary node in the graph is the starting point and the user is in the scene S j. This is the existence probability in each scene (node in the graph) when the movement to the scene S i is repeated infinitely. The vector v corresponds to the eigenvector when the eigenvalue of the probability matrix P is maximized. The value of each dimension when the vector v is normalized to length 1 is set as the score of the scene corresponding to each dimension of the vector v.

例えば、図7と図8に示した5つのシーン1〜シーン5に対してα=0.5とした場合の各シーンのスコアを算出すると図9に示す値となる。図9は、本実施形態におけるシーンスコア算出部16が算出したベクトルv(各シーンのスコア)の一例を示す図である。図9において、例えば5行3列の要素の値は、シーン5の興味度にα(=0.5)を乗じた値と、シーン3とシーン5との類似度に(1−α)を乗じた値との和に基づいた値となっている。なお、確率行列Pの要素は各列における要素の和が1になるように正規化してある。ただし、図示している例では小数第2位までを表記しているため、第2列と第4列とにおいて誤差が生じている。   For example, when the score of each scene when α = 0.5 is calculated for the five scenes 1 to 5 shown in FIGS. 7 and 8, the values shown in FIG. 9 are obtained. FIG. 9 is a diagram illustrating an example of a vector v (score of each scene) calculated by the scene score calculation unit 16 in the present embodiment. In FIG. 9, for example, the value of the element in 5 rows and 3 columns is obtained by multiplying the degree of interest of the scene 5 by α (= 0.5) and the similarity between the scene 3 and the scene 5 by (1−α). The value is based on the sum of the multiplied value. The elements of the probability matrix P are normalized so that the sum of the elements in each column is 1. However, in the illustrated example, since the second decimal place is shown, an error occurs in the second column and the fourth column.

ダイジェスト映像生成部17は、シーンスコア算出部16が算出した各シーンのスコアに基づいて、映像からダイジェスト映像を生成する。ダイジェスト映像に加えるシーンは、シーンスコアの高いシーンから順に、シーン数又はシーンの合計時間が予め定められた閾値以内になるように選択する。例えば、ダイジェスト映像生成部17は、図7〜図9において例示したシーン1〜シーン5から2つのシーンを選択してダイジェスト映像を生成する場合、スコアの最も高いシーン3(得点シーン)と次にスコアの高いシーン2(攻撃シーン)とを選択する。ダイジェスト映像生成部17は、選択した2つのシーンをタイムスタンプの小さい順に並べてダイジェスト映像として出力する。   The digest video generation unit 17 generates a digest video from the video based on the score of each scene calculated by the scene score calculation unit 16. Scenes to be added to the digest video are selected in order from the scene with the highest scene score so that the number of scenes or the total time of the scenes is within a predetermined threshold. For example, when the digest video generation unit 17 selects two scenes from the scenes 1 to 5 illustrated in FIGS. 7 to 9 to generate a digest video, the digest 3 having the highest score and the next scene are scored next. Scene 2 (attack scene) with a high score is selected. The digest video generation unit 17 arranges the two selected scenes in ascending order of time stamps and outputs them as a digest video.

ダイジェスト映像出力部18は、ダイジェスト映像生成部17が生成したダイジェスト映像を表示することにより、ユーザに提示する。なお、ダイジェスト映像生成装置1とユーザとが位置する場所が離れている場合などにおいては、ダイジェスト映像出力部18は、ユーザが操作している装置へダイジェスト映像を送信することになる。また、ダイジェスト映像がネットワーク上に設けられたサーバ装置を介して配信される場合には、ダイジェスト映像出力部18はダイジェスト映像をサーバ装置に送信して記憶させる。   The digest video output unit 18 displays the digest video generated by the digest video generation unit 17 and presents it to the user. In addition, when the place where the digest video production | generation apparatus 1 and a user are located apart, the digest video output part 18 will transmit a digest video to the apparatus which the user is operating. When the digest video is distributed via a server device provided on the network, the digest video output unit 18 transmits the digest video to the server device for storage.

図10は、本実施形態におけるダイジェスト映像生成装置1が行うダイジェスト映像生成処理を示すフローチャートである。ダイジェスト映像生成処理が開始されると、映像指定部12は、ユーザの操作を受け付けてダイジェスト映像を提示する対象となる映像を指定する情報を入力する(ステップS11)。   FIG. 10 is a flowchart showing digest video generation processing performed by the digest video generation device 1 according to this embodiment. When the digest video generation process is started, the video designating unit 12 receives information from the user and inputs information for designating a video to be presented as a digest video (step S11).

シーン分割部13は、映像指定部12が入力した情報と映像情報蓄積部11に記憶されている各テーブルとに基づいて映像を特定し、特定した映像を複数のシーンに分割する(ステップS12)。   The scene dividing unit 13 specifies a video based on the information input by the video designating unit 12 and each table stored in the video information storage unit 11, and divides the specified video into a plurality of scenes (step S12). .

ユーザ興味度算出部14は、シーン分割部13により得られた複数のシーンごとに、シーンに対するユーザの興味度を算出する処理を繰り返して行う(ステップS13)。   The user interest level calculation unit 14 repeatedly performs the process of calculating the user interest level for the scene for each of the plurality of scenes obtained by the scene division unit 13 (step S13).

シーン間類似度算出部15は、シーン分割部13により得られた複数のシーンにおける2つのシーンのすべての組み合わせごとに、シーン間の類似度を算出する処理を繰り返して行う(ステップS14)。   The inter-scene similarity calculation unit 15 repeatedly performs the process of calculating the similarity between scenes for every combination of two scenes in the plurality of scenes obtained by the scene division unit 13 (step S14).

シーンスコア算出部16は、ステップS13において算出された各シーンのユーザの興味度と、ステップS14において算出された2つのシーン間の類似度とに基づいて、各シーンのスコアを算出する(ステップS15)。   The scene score calculation unit 16 calculates the score of each scene based on the degree of interest of the user of each scene calculated in step S13 and the similarity between the two scenes calculated in step S14 (step S15). ).

ダイジェスト映像生成部17は、シーンスコア算出部16により算出された各シーンのスコアに基づいてダイジェスト映像に含めるシーンを選択し、選択したシーンを映像情報蓄積部11に記憶されている映像から抽出し、抽出したシーンの映像をタイムスタンプ順に連結してダイジェスト映像を生成する(ステップS16)。   The digest video generation unit 17 selects a scene to be included in the digest video based on the score of each scene calculated by the scene score calculation unit 16, and extracts the selected scene from the video stored in the video information storage unit 11. The extracted scene images are connected in the order of time stamps to generate a digest image (step S16).

ダイジェスト映像出力部18は、ステップS16において生成されたダイジェスト映像をユーザに提示し(ステップS17)、ダイジェスト映像生成処理を終了させる。   The digest video output unit 18 presents the digest video generated in step S16 to the user (step S17), and ends the digest video generation process.

本実施形態のダイジェスト映像生成装置1は、ユーザの指定した映像を分割して得られたシーンごとに、他のユーザ(視聴者)の行動に基づいた興味度を算出して付与する。続いて、時間、キーワード、映像特徴などの情報に基づいてシーン間の類似度を算出する。そして、興味度の高いシーンだけでなく、シーン間の類似度に基づいて興味度の高いシーンに関連するシーン、すなわちユーザの興味度が高い可能性があるシーンを含める選択をし、興味をもたれたシーンと類似するシーンを含めたダイジェスト映像を生成して提示することにより、映像内容に対するユーザの把握の度合いを高めることができる。   The digest video generation apparatus 1 of the present embodiment calculates and assigns an interest level based on the behavior of another user (viewer) for each scene obtained by dividing a video specified by the user. Subsequently, the degree of similarity between scenes is calculated based on information such as time, keywords, and video features. Then, select not only high-interest scenes but also scenes related to high-interest scenes based on the similarity between scenes, that is, scenes that may be of high interest to the user. By generating and presenting a digest video including a scene similar to the scene, it is possible to increase the user's level of understanding of the video content.

また、本実施形態のダイジェスト映像生成装置1は、映像の視聴者の反応として得られたコメントや、映像の特徴の類似性を分析することにより、興味をもたれやすいシーンに類似したシーンをダイジェスト映像に含めることができる。これにより、視聴者が少ないシーンであっても、興味をもたれやすいシーンをダイジェスト映像に含めて生成し提示することができる。   In addition, the digest video generation apparatus 1 according to the present embodiment analyzes a comment that is obtained as a reaction of the viewer of the video and a similarity of the feature of the video, so that a scene similar to a scene that is likely to be interesting is digest video. Can be included. Thereby, even if it is a scene with few viewers, the scene which is easy to be interesting can be included in a digest image | video, and can be shown and produced.

また、本実施形態のダイジェスト映像生成装置1は、各シーンをグラフにおけるノードとし、シーン間の類似度をエッジとしたグラフを生成し、各シーンの興味度の値を初期状態での各ノードの存在確率として、シーン間の類似度を遷移確率としてノード間をランダムに移動した後の各ノードにおける存在確率をシーンのスコアとしている。スコアを算出する際に用いる確率行列Pの各要素の値を、興味度の高さ及びシーン間の類似度のいずれを重視するかを表すパラメータαによって調節することができるため、柔軟なダイジェストの生成が可能になる。   In addition, the digest video generation apparatus 1 according to the present embodiment generates a graph in which each scene is a node in the graph and the similarity between the scenes is an edge, and the interest value of each scene is set to the initial value of each node. As the existence probability, the similarity between scenes is used as a transition probability, and the existence probability at each node after moving randomly between nodes is used as the score of the scene. Since the value of each element of the probability matrix P used for calculating the score can be adjusted by the parameter α indicating which of the high degree of interest and the similarity between scenes is important, a flexible digest Generation is possible.

本実施形態のダイジェスト映像生成装置1は、上記の特徴を有しているので、例えばサッカーの試合映像に対して、得点が入った瞬間のシーンに加え、得点が入る前の攻撃中のシーンや、ゴールを決めた選手による他のプレイのシーンをダイジェスト映像に含めてユーザに提示することができる。   Since the digest video generation apparatus 1 of the present embodiment has the above-described features, for example, in addition to a scene at the moment when a score is entered for a soccer game video, an attacking scene before the score is entered, The scene of another play by the player who has scored the goal can be included in the digest video and presented to the user.

なお、本実施形態では、ダイジェスト映像装置1が映像情報蓄積部11を備える構成について説明したが、映像情報蓄積部11はダイジェスト映像生成装置1がネットワークなどを介してアクセス可能なサーバ装置であってもよい。この場合、ダイジェスト映像装置1が備える各機能部は、ネットワークを介してサーバ装置にアクセスをして上述の処理を行うことになる。   In the present embodiment, the configuration in which the digest video device 1 includes the video information storage unit 11 has been described. However, the video information storage unit 11 is a server device that can be accessed by the digest video generation device 1 via a network or the like. Also good. In this case, each functional unit included in the digest video device 1 accesses the server device via the network and performs the above-described processing.

上述した実施形態におけるダイジェスト映像生成装置1をコンピュータで実現するようにしてもよい。その場合、ダイジェスト映像生成装置1が備える各機能部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。更に「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、更に前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。   You may make it implement | achieve the digest image | video production | generation apparatus 1 in embodiment mentioned above with a computer. In that case, a program for realizing each functional unit included in the digest video generation apparatus 1 is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed. It may be realized. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” is a program that dynamically holds a program for a short time, like a communication line when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory inside a computer system serving as a server or a client in that case may be included and a program held for a certain period of time. Further, the program may be for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in the computer system. It may be realized using hardware such as PLD (Programmable Logic Device) or FPGA (Field Programmable Gate Array).

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。   The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes designs and the like that do not depart from the gist of the present invention.

映像に含まれる部分映像を組み合わせたダイジェスト映像によって、映像内容に対するユーザの把握の度合いを高めることが不可欠な用途にも適用できる。   It can also be applied to applications where it is indispensable to increase the degree of grasp of the user with respect to the video content by digest video combining partial videos included in the video.

1…ダイジェスト映像生成装置
11…映像情報蓄積部
12…映像指定部
13…シーン分割部
14…ユーザ興味度算出部
15…シーン間類似度算出部
16…シーンスコア算出部
17…ダイジェスト映像生成部
18…ダイジェスト映像出力部
DESCRIPTION OF SYMBOLS 1 ... Digest image | video production | generation apparatus 11 ... Image | video information storage part 12 ... Image | video designation | designated part 13 ... Scene division | segmentation part 14 ... User interest degree calculation part 15 ... Interscene similarity calculation part 16 ... Scene score calculation part 17 ... Digest image generation part 18 ... Digest video output section

Claims (5)

指定された映像を複数のシーンに分割するシーン分割部と、
前記複数のシーンごとに興味度を算出するユーザ興味度算出部と、
前記複数のシーンにおける2つのシーンの組み合わせごとにシーン間の類似度を算出するシーン間類似度算出部と、
前記ユーザ興味度算出部が算出した各シーンの興味度と前記シーン間類似度算出部が算出した各シーン間の類似度とに基づいて各シーンに対するスコアを算出するシーンスコア算出部と、
前記複数のシーンそれぞれに対して算出されたスコアに基づいて前記複数のシーンからシーンを選択し、選択したシーンを含む前記映像のダイジェスト映像を生成するダイジェスト映像生成部と、
を備え、
前記シーンスコア算出部は、
前記複数のシーンそれぞれをノードとし、シーン間の類似度をノード間のエッジとするグラフを生成し、ノードの興味度を初期状態における各ノードに対する存在確率としノード間のエッジに割り当てられた類似度を遷移確率としてノード間をランダムに移動した後の各ノードの存在確率をスコアとして算出する
ことを特徴とするダイジェスト映像生成装置。
A scene dividing unit that divides the specified video into a plurality of scenes;
A user interest degree calculation unit for calculating an interest degree for each of the plurality of scenes;
An inter-scene similarity calculation unit that calculates the similarity between scenes for each combination of two scenes in the plurality of scenes;
A scene score calculator that calculates a score for each scene based on the interest of each scene calculated by the user interest calculator and the similarity between scenes calculated by the inter-scene similarity calculator;
A digest video generation unit that selects a scene from the plurality of scenes based on the score calculated for each of the plurality of scenes, and generates a digest video of the video including the selected scene;
With
The scene score calculation unit
A graph in which each of the plurality of scenes is a node and the similarity between scenes is an edge between the nodes is generated, and the similarity that is assigned to the edge between the nodes is defined as the existence probability for each node in the initial state. A digest video generation device characterized by calculating, as a score, the existence probability of each node after randomly moving between nodes using as a transition probability.
請求項1に記載のダイジェスト映像生成装置において、
前記シーン間類似度算出部は、
前記映像における前記複数のシーンそれぞれの開始時刻、シーンに関連するキーワード、シーンの映像特徴のうち少なくとも1つを用いてシーン間の類似度を算出する
ことを特徴とするダイジェスト映像生成装置。
The digest video generation device according to claim 1 ,
The inter-scene similarity calculation unit
A digest video generation apparatus, wherein the similarity between scenes is calculated using at least one of a start time of each of the plurality of scenes in the video, a keyword related to the scene, and a video feature of the scene.
指定された映像のダイジェスト映像を生成するダイジェスト映像生成装置が行うダイジェスト映像生成方法であって、
前記映像を複数のシーンに分割するシーン分割ステップと、
前記複数のシーンごとに興味度を算出するユーザ興味度算出ステップと、
前記複数のシーンにおける2つのシーンの組み合わせごとにシーン間の類似度を算出するシーン間類似度算出ステップと、
前記ユーザ興味度算出ステップにおいて算出した各シーンの興味度と前記シーン間類似度算出ステップにおいて算出した各シーン間の類似度とに基づいて各シーンに対するスコアを算出するシーンスコア算出ステップと、
前記複数のシーンそれぞれに対して算出されたスコアに基づいて前記複数のシーンからシーンを選択し、選択したシーンを含む前記映像のダイジェスト映像を生成するダイジェスト映像生成ステップと、
を含み、
前記シーンスコア算出ステップでは、
前記複数のシーンそれぞれをノードとしシーン間の類似度をノード間のエッジとするグラフを生成し、ノードの興味度を初期状態における各ノードに対する存在確率としノード間のエッジに割り当てられた類似度を遷移確率としてノード間をランダムに移動した後の各ノードの存在確率をスコアとして算出する
ことを特徴とするダイジェスト映像生成方法。
A digest video generation method performed by a digest video generation device that generates a digest video of a specified video,
A scene dividing step of dividing the video into a plurality of scenes;
A user interest degree calculating step for calculating an interest degree for each of the plurality of scenes;
An inter-scene similarity calculation step of calculating a similarity between scenes for each combination of two scenes in the plurality of scenes;
A scene score calculation step for calculating a score for each scene based on the interest level of each scene calculated in the user interest level calculation step and the similarity level between scenes calculated in the inter-scene similarity calculation step;
Selecting a scene from the plurality of scenes based on the score calculated for each of the plurality of scenes, and generating a digest video of the video including the selected scene; and
Including
In the scene score calculation step,
Generate a graph in which each of the plurality of scenes is a node and the similarity between the scenes is an edge between the nodes, and the interest degree of the node is the existence probability for each node in the initial state, and the similarity assigned to the edge between the nodes is A digest video generation method characterized by calculating, as a score, the existence probability of each node after moving randomly between nodes as a transition probability.
請求項に記載のダイジェスト映像生成方法において、
前記シーン間類似度算出ステップでは、
前記映像における前記複数のシーンそれぞれの開始時刻、シーンに関連するキーワード、シーンの映像特徴のうち少なくとも1つを用いてシーン間の類似度を算出する
ことを特徴とするダイジェスト映像生成方法。
The digest video generation method according to claim 3 ,
In the inter-scene similarity calculation step,
A digest video generation method, wherein the similarity between scenes is calculated using at least one of a start time of each of the plurality of scenes in the video, a keyword related to the scene, and video characteristics of the scene.
請求項1又は請求項2に記載のダイジェスト映像生成装置としてコンピュータを機能させるダイジェスト映像生成プログラム。 A digest video generation program for causing a computer to function as the digest video generation device according to claim 1 .
JP2013237734A 2013-11-18 2013-11-18 Digest video generation device, digest video generation method, and digest video generation program Expired - Fee Related JP6321945B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013237734A JP6321945B2 (en) 2013-11-18 2013-11-18 Digest video generation device, digest video generation method, and digest video generation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013237734A JP6321945B2 (en) 2013-11-18 2013-11-18 Digest video generation device, digest video generation method, and digest video generation program

Publications (2)

Publication Number Publication Date
JP2015099958A JP2015099958A (en) 2015-05-28
JP6321945B2 true JP6321945B2 (en) 2018-05-09

Family

ID=53376349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013237734A Expired - Fee Related JP6321945B2 (en) 2013-11-18 2013-11-18 Digest video generation device, digest video generation method, and digest video generation program

Country Status (1)

Country Link
JP (1) JP6321945B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018166314A (en) * 2017-03-28 2018-10-25 カシオ計算機株式会社 Image processing apparatus, image processing method, and program
JP7133433B2 (en) * 2018-10-24 2022-09-08 ヤフー株式会社 Generation device, generation method, generation program
JP7420243B2 (en) * 2020-05-26 2024-01-23 日本電気株式会社 Information processing device, control method and program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7904813B1 (en) * 1998-12-28 2011-03-08 Sony Corporation Method for editing video information and editing device
JP2004007342A (en) * 2002-03-29 2004-01-08 Fujitsu Ltd Automatic digest preparation method
JP2006211311A (en) * 2005-01-28 2006-08-10 Victor Co Of Japan Ltd Digested video image forming device
JP2010245856A (en) * 2009-04-07 2010-10-28 Panasonic Corp Video editing device
JP5627002B2 (en) * 2011-04-05 2014-11-19 日本電信電話株式会社 Similar video output method, similar video output device, and similar video output program

Also Published As

Publication number Publication date
JP2015099958A (en) 2015-05-28

Similar Documents

Publication Publication Date Title
CN111143610B (en) Content recommendation method and device, electronic equipment and storage medium
US10210462B2 (en) Video content analysis for automatic demographics recognition of users and videos
WO2017181612A1 (en) Personalized video recommendation method and device
CN108028962B (en) Processing video usage information to deliver advertisements
US10223438B1 (en) System and method for digital-content-grouping, playlist-creation, and collaborator-recommendation
KR102112973B1 (en) Estimating and displaying social interest in time-based media
TWI510064B (en) Video recommendation system and method thereof
US9098807B1 (en) Video content claiming classifier
KR20160057475A (en) System and method for actively obtaining social data
US20090006368A1 (en) Automatic Video Recommendation
KR20160079830A (en) Systems and methods for dynamically determining influencers in a social data network using weighted analysis
KR20140108552A (en) Video Recommendation based on Video Co-occurrence Statistics
Tran et al. Exploiting character networks for movie summarization
US20160210367A1 (en) Transition event detection
US9449231B2 (en) Computerized systems and methods for generating models for identifying thumbnail images to promote videos
Yamasaki et al. Social popularity score: Predicting numbers of views, comments, and favorites of social photos using only annotations
Chen et al. Livesense: Contextual advertising in live streaming videos
JP2018073429A (en) Retrieval device, retrieval method, and retrieval program
CN112464100A (en) Information recommendation model training method, information recommendation method, device and equipment
JP6321945B2 (en) Digest video generation device, digest video generation method, and digest video generation program
JP2020042770A (en) Data search method and data search system
JP6434954B2 (en) Information processing apparatus, information processing method, and program
JP5627002B2 (en) Similar video output method, similar video output device, and similar video output program
JP6040137B2 (en) Item recommendation device, item recommendation method, and item recommendation program
JP5880558B2 (en) Video processing system, viewer preference determination method, video processing apparatus, control method thereof, and control program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180406

R150 Certificate of patent or registration of utility model

Ref document number: 6321945

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees