JP2014187687A - Device and method for extracting highlight scene of moving image - Google Patents
Device and method for extracting highlight scene of moving image Download PDFInfo
- Publication number
- JP2014187687A JP2014187687A JP2014017221A JP2014017221A JP2014187687A JP 2014187687 A JP2014187687 A JP 2014187687A JP 2014017221 A JP2014017221 A JP 2014017221A JP 2014017221 A JP2014017221 A JP 2014017221A JP 2014187687 A JP2014187687 A JP 2014187687A
- Authority
- JP
- Japan
- Prior art keywords
- scene
- feature
- moving image
- highlight
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、動画像のハイライトシーン抽出装置及び方法に関し、特に、動画像中から人物の顔を含む特定のハイライトシーンを抽出する装置及び方法に関する。 The present invention relates to a moving image highlight scene extraction apparatus and method, and more particularly to an apparatus and method for extracting a specific highlight scene including a human face from a moving image.
動画像から人物の顔を抽出し、顔インデックスを作成する技術として、例えば特許文献1の発明が知られている。
As a technique for extracting a human face from a moving image and creating a face index, for example, the invention of
特許文献1の発明は、動画像蓄積部、顔画像追跡部、代表顔決定部、顔インデックス構築部を備える。動画像蓄積部から取り出された各フレーム画像に対して、顔画像追跡部は、各フレーム画像中の顔を検出し、連続フレーム中で、検出された顔がフレーム中の同じ位置にある場合、同一人物の画像として追跡し、1つのまとまったフレーム群情報を生成する。次いで、代表顔決定部は、まとまったフレーム群から正面顔に近いものを代表顔画像として選択する。顔インデックス構築部は、この選択された代表顔画像を顔画像キーとして用いて、顔インデックスを構築する。ユーザは、例えばサムネイル画像として表示された顔画像キーを選ぶことで、その顔画像の人物が登場しているシーンを検索して再生することができる。
The invention of
動画像は、その内容に応じて、さまざまなハイライトシーンを含む。例えば、ドラマの盛り上がるシーンでは、2人の人物の顔が大きく表示されることがあり、また、重要なシーン又はスポーツ等のインタビューでは、1人の人物が大きく表示されることがある。 The moving image includes various highlight scenes according to the content. For example, in a scene where a drama is exciting, the faces of two people may be displayed large, and in an important scene or an interview such as sports, one person may be displayed large.
特許文献1の発明では、ユーザが動画像から選択できるシーンは、顔画像キーで特定されるものに限られていた。従って、特許文献1の発明では、ユーザは、顔画像キーの人物が登場しているシーンを検索して再生することができるが、特定のハイライトシーンを検索して再生することが困難であった。
In the invention of
本発明の目的は、以上の問題点を解決し、動画像中から人物の顔を含む特定のハイライトシーンを抽出する動画像のハイライトシーン抽出装置及び方法を提供することにある。 An object of the present invention is to solve the above-described problems and provide a moving image highlight scene extraction apparatus and method for extracting a specific highlight scene including a human face from a moving image.
本発明の態様に係る動画像のハイライトシーン抽出装置は、
動画像のフレームから人物の顔を検出する手段と、
上記フレームにおける上記検出された顔の位置及び大きさによって決まる複数の特徴値を含むシーン構図特徴を生成する手段と、
少なくとも1つの特定のハイライトシーンにおける人物の顔の位置及び大きさによって決まる複数の特徴値の範囲をシーン構図条件として予め格納した格納手段と、
上記シーン構図特徴の特徴値が上記シーン構図条件の特徴値の範囲内にあるか否かを判定する第1の判定手段と、
上記シーン構図特徴の特徴値が上記シーン構図条件の特徴値の範囲内にあるとき、上記フレームにハイライトシーンのインデックスを付与するインデックス手段とを備えたことを特徴とする。
A highlight scene extraction device for moving images according to an aspect of the present invention includes:
Means for detecting a human face from a frame of a moving image;
Means for generating a scene composition feature including a plurality of feature values determined by the position and size of the detected face in the frame;
Storage means for storing in advance a plurality of feature value ranges determined by the position and size of a person's face in at least one specific highlight scene as scene composition conditions;
First determination means for determining whether or not a feature value of the scene composition feature is within a range of feature values of the scene composition condition;
Indexing means for assigning an index of a highlight scene to the frame when the feature value of the scene composition feature is within the range of the feature value of the scene composition condition is provided.
本発明によれば、動画像中から人物の顔を含む特定のハイライトシーンを抽出することができる。 According to the present invention, a specific highlight scene including a human face can be extracted from a moving image.
以下、図面を参照して、本発明の実施の形態について説明する。各図面にわたって、同様の構成要素は、同じ符号により示す。 Embodiments of the present invention will be described below with reference to the drawings. Throughout the drawings, similar components are designated by the same reference numerals.
実施の形態1.
図1は、本発明の実施の形態1に係るハイライトシーン抽出装置の構成を示すブロック図である。図1のハイライトシーン抽出装置は、動画像入力回路1、フレーム抽出回路2、顔検出回路3、シーン構図決定回路4、シーン記憶装置5、ハイライトシーン判定回路6、インデックス生成回路7、及び動画像記憶装置8を備える。
FIG. 1 is a block diagram showing a configuration of a highlight scene extraction apparatus according to
動画像入力回路1は、チューナ、DVDもしくはブルーレイなどの記録媒体、又は、LANもしくはインターネットなどのネットワークから動画像を取得する。動画像入力回路1は、後述する動画像記憶装置8から動画像を取得してもよい。フレーム抽出回路2は、入力された動画像から一連のフレーム画像を生成する。顔検出回路3は、生成された各フレーム画像から人物の顔を検出する。フレーム画像から顔を検出するために、例えば非特許文献1の方法を使用可能である。
The moving
図3は、図1の顔検出回路3により、フレーム画像100から人物P0の顔を検出する例を示す図である。図4は、図1の顔検出回路3により、フレーム画像101から複数の人物P0及びP1の顔を検出する例を示す図である。図3のフレーム画像100は、サイズh×wを有する。図3のフレーム画像100は人物P0を含み、人物P0の顔は、頂点A0,B0を有する矩形領域F0として検出される。人物P0の顔F0は、例えば正方形領域であり、その位置は重心G0=(x0,y0)により特定され、その大きさは辺の長さl0により特定される。また、図4のフレーム画像101は人物P0,P1を含み、人物P1の顔F1は、例えば正方形領域であり、その位置は重心G1=(x1,y1)により特定され、その大きさは辺の長さl1により特定される。
FIG. 3 is a diagram showing an example of detecting the face of the person P0 from the
シーン構図決定回路4は、フレーム画像における検出された顔の位置及び大きさによって決まる複数の特徴値を含むシーン構図特徴Cを生成する。動画像において盛り上がるシーン又は重要なシーン等は、登場人物の空間的な配置により定義することができる。従って、シーン構図特徴Cの特徴値は、この登場人物の空間的な配置を定義する。
The scene
図5は、図1のシーン構図決定回路4により決定された、複数の人物P0〜PNを含むフレーム画像のシーン構図特徴Cを示す表である。シーン構図特徴Cの各要素Cij(1≦i,j≦N)は、任意の一対の人物Pi,Pjについて、以下のように定義される。
FIG. 5 is a table showing a scene composition feature C of a frame image including a plurality of persons P0 to PN determined by the scene
[数1]
Cij=(xi,yi,hi,sij,dij)
[数2]
hi=li/h
[数3]
sij=lj/li
[数4]
dij=sqrt((xi−xj)2+(yi−yj)2)/h
[Equation 1]
C ij = (x i , y i , h i , s ij , d ij )
[Equation 2]
h i = l i / h
[Equation 3]
s ij = l j / l i
[Equation 4]
d ij = sqrt ((x i -x j ) 2 + (y i -y j ) 2 ) / h
ここで、xi,yiは、人物Piの顔の位置(重心)を示す。hiは、フレーム画像のサイズhで正規化された人物Piの顔の大きさである。sijは、人物Pi,Pjの顔の大きさの比である。dijは、フレーム画像のサイズhで正規化された人物Pi,Pjの顔の間の距離である。言い換えると、シーン構図特徴Cの各要素Cijは、人物Pi自体の顔を特定する特徴値(位置xi,yi及び大きさhi)と、他の人物Pjの顔との関係を示す特徴値(大きさの比sij及び距離dij)とを含む。なお、一般的なフレーム画像は横長であり(w>h)、このため、数2及び数4では、短辺の長さhを用いている。
Here, x i and y i indicate the position (center of gravity) of the face of the person Pi. h i is the size of the face of the person Pi normalized by the size h of the frame image. s ij is a ratio of the face sizes of the persons Pi and Pj. d ij is a distance between the faces of the persons Pi and Pj normalized by the size h of the frame image. In other words, each element C ij of the scene composition feature C indicates the relationship between the feature value (position x i , y i and size h i ) that identifies the face of the person Pi itself and the face of another person Pj. And feature values (size ratio s ij and distance d ij ). Note that a general frame image is horizontally long (w> h), and therefore the length h of the short side is used in
シーン記憶装置5は、少なくとも1つの特定のハイライトシーンにおける人物の顔の位置及び大きさによって決まる複数の特徴値の範囲をシーン構図条件Dとして予め格納している。言い換えると、シーン構図条件Dは、フレーム画像が特定のハイライトシーンであるときに、当該ハイライトシーンが有すると考えられるシーン構図特徴Cの特徴値の予め決められた範囲を示す。
The
例示的なシーン構図条件Dを以下に示す。 An exemplary scene composition condition D is shown below.
[数5]
r0/3≦xi/h≦r0×2/3
[数6]
1/3≦yi/h≦2/3
[数7]
1/2≦hi≦1
[数8]
0.8≦sij≦1.2
[数9]
hi×1.5≦dij≦hi×2.5
[Equation 5]
r 0/3 ≦ x i / h ≦ r 0 × 2/3
[Equation 6]
1/3 ≦ y i / h ≦ 2/3
[Equation 7]
1/2 ≦ h i ≦ 1
[Equation 8]
0.8 ≦ s ij ≦ 1.2
[Equation 9]
h i × 1.5 ≦ d ij ≦ h i × 2.5
ここで、係数r0=w/hである。数5〜数9のシーン構図条件Dは、動画像がドラマである場合を示す。ドラマの場合、主人公と、それと主に関係する重要人物とが存在し、シナリオの展開の中で重要なシーンでは、主人公とその重要人物とが大きく表示されることが多い。このようなシーンのシーン構図特徴C及びシーン構図条件Dについて、図6〜図8を参照して以下に説明する。
Here, the coefficient r 0 = w / h. The scene composition conditions D in
図6は、ドラマのハイライトシーンを含むフレーム画像110の例を示す図である。図7は、図6のフレーム画像110における注目領域111及び注目人物Piの顔Fiを示す図である。図8は、図6のフレーム画像110におけるシーン構図特徴Cを示す図である。図6のフレーム画像110は、注目人物(主人公)となる人物Piと、その周辺人物となる人物Pjとを含む。まず、フレーム画像110の中央の注目領域111で大きく表示されている顔Fiを有する人物Piを、注目人物として決定し(図7)、また、注目人物である人物Piの近くにおいて、人物Piと同様に大きく表示されている顔Fjを有する人物Pjを、周辺人物として決定する(図8)。注目人物及び周辺人物は、その顔の位置(xi,yi;xj,yj)及び大きさ(hi;hj)が数5〜数7を満たす人物である。さらに、フレーム画像110は、数8及び数9をさらに満たすとき、ドラマのハイライトシーンであると判断される。なお、数5〜数9に例示した特徴値の範囲は、固定値ではなく、設計時に任意に設定できる。
FIG. 6 is a diagram illustrating an example of a
シーン記憶装置5に格納されるシーン構図条件Dは、数5〜数9に例示された特徴値の範囲に限定されるものではなく、また、ドラマ以外の他のハイライトシーンが有すると考えられるシーン構図特徴Cの特徴値の範囲を格納してもよい。
The scene composition condition D stored in the
ハイライトシーン判定回路6は、シーン構図決定回路4によって生成されたシーン構図特徴Cの特徴値が、シーン記憶装置5に格納されたシーン構図条件Dの特徴値の範囲内にあるか否かを判定する。次いで、インデックス生成回路7は、シーン構図特徴Cの特徴値がシーン構図条件Dの特徴値の範囲内にあるとき、フレーム画像にハイライトシーンのインデックスを付与する。
The highlight
ハイライトシーン判定回路6による判定を、以下のコードにより説明する。
The determination by the highlight
[数10]
for i:=1 to N do
for j:=1 to N do
if i≠j then
val:=calc_corr(Cij,D)
if val==true then
make_index(i,j,D)
end
end
[Equation 10]
for i: = 1 to N do
for j: = 1 to N do
if i ≠ j then
val: = calc_corr (C ij , D)
if val == true then
make_index (i, j, D)
end
end
数10によれば、あるフレーム画像のシーン構図特徴Cの各要素Cij(1≦i,j≦N)のうち、i≠jのすべての要素について、関数calc_corr(Cij,D)を実行し、関数calc_corr(Cij,D)がtrue(真)の値を返すとき、関数make_index(i,j,D)を実行する。関数calc_corr(Cij,D)は、あるフレーム画像のシーン構図特徴Cの特徴値が数5〜数9のシーン構図条件Dの特徴値の範囲内にあるか否かを判定し、YESのときtrue(真)の値を返し、NOのときfalse(偽)の値を返す。ここで、関数calc_corr(Cij,D)がtrueの値を返すとき、インデックス生成回路7は、関数make_index(i,j,D)を実行することで、フレーム画像にハイライトシーンのインデックスを付与する。詳しくは、インデックス生成回路7は、フレーム画像のタイムスタンプ情報を動画像記憶装置8に記憶することで、当該フレーム画像にハイライトシーンが含まれることを示す。
According to Equation 10, the function calc_corr (C ij , D) is executed for all elements of i ≠ j among the elements C ij (1 ≦ i, j ≦ N) of the scene composition feature C of a certain frame image. When the function calc_corr (C ij , D) returns a value of true (true), the function make_index (i, j, D) is executed. The function calc_corr (C ij , D) determines whether or not the feature value of the scene composition feature C of a certain frame image is within the range of the feature values of the scene composition condition D of
動画像記憶装置8は、ハイライトシーンのインデックスを記憶するとともに、動画像入力回路1によって取得された動画像を記憶する。ユーザは、動画像の再生時にハイライトシーンのインデックスを用いて、動画中のハイライトシーンを検索することができる。なお、ハイライトシーンのインデックスを記憶する記憶装置と、動画像入力回路1によって取得された動画像を記憶する記憶装置とが、別個に設けられてもよい。
The moving
図2は、図1のハイライトシーン抽出装置によって実行されるインデックス生成処理を示すフローチャートである。図2のステップS1において、動画像入力回路1は動画像を取得する。ステップS2において、フレーム抽出回路2は、取得された動画像からフレーム画像を生成する。ステップS3において、顔検出回路3は、生成されたフレーム画像から顔を検出する。ステップS4において、シーン構図決定回路4は、検出された顔情報を用いてシーン構図特徴を生成する。ステップS5のシーン選択処理において、ハイライトシーン判定回路6は、シーン構図条件をシーン記憶装置5から読み出す。ステップS6において、ハイライトシーン判定回路6は、シーン構図特徴の特徴値が、シーン構図条件の特徴値の予め決められた範囲内にあるか否かを判定し、YESのときはステップS7に進み、NOのときはステップS8に進む。ステップS7において、インデックス生成回路7は、フレームにハイライトシーンのインデックスを付与し、当該インデックスを動画像記憶装置8に記憶する。ステップS8において、シーン構図決定回路4は、取得された動画像から次のフレーム画像を生成し、ステップS3に戻る。
FIG. 2 is a flowchart showing an index generation process executed by the highlight scene extraction apparatus of FIG. In step S1 of FIG. 2, the moving
以上説明したように、本発明の実施の形態1に係るハイライトシーン抽出装置によれば、動画像中から人物の顔を含む特定のハイライトシーンを抽出することができる。
As described above, the highlight scene extraction apparatus according to
本発明では、動画像の撮影者の意図(ハイライトシーンであるか否か)がフレーム画像中における人物の配置として現れることに着目している。本発明では、人物の配置として、フレーム画像における検出された顔の位置及び大きさによって決まる複数の特徴値を含むシーン構図特徴を生成する。本発明によれば、フレーム画像から生成されたシーン構図特徴の特徴値が、予め格納されたシーン構図条件の特徴値の範囲内にあるか否かを判定し、動画像の中から特定のハイライトシーンだけを検索して再生することができる。 In the present invention, attention is paid to the fact that the intention of the photographer of the moving image (whether it is a highlight scene) appears as the arrangement of persons in the frame image. In the present invention, a scene composition feature including a plurality of feature values determined by the position and size of the detected face in the frame image is generated as the arrangement of the person. According to the present invention, it is determined whether or not the feature value of the scene composition feature generated from the frame image is within the range of the feature value of the scene composition condition stored in advance, and a specific high level is selected from the moving image. Only light scenes can be searched and played.
従来技術の手法では、動画像中に顔が現れるか否かという点だけに注目し、各フレーム画像から顔を検出し、顔が現れる部分に対して検索用の顔インデックスを作成していた。これに対して、本発明の実施の形態1では、シーン構図特徴を用いることで、ある人物が登場する特定のハイライトシーンを抽出することができる。 In the conventional technique, attention is paid only to whether or not a face appears in a moving image, a face is detected from each frame image, and a search face index is created for a portion where the face appears. On the other hand, in the first embodiment of the present invention, a specific highlight scene in which a certain person appears can be extracted by using the scene composition feature.
実施の形態2.
一般に、動画像は特定のジャンルに関連付けられ、ジャンルに応じて、異なるハイライトシーンを含む可能性がある。本発明の実施の形態2では、動画像のジャンルに応じて異なるシーン構図条件を選択する。
In general, a moving image is associated with a specific genre and may include different highlight scenes depending on the genre. In the second embodiment of the present invention, different scene composition conditions are selected according to the genre of moving images.
図9は、本発明の実施の形態2に係るハイライトシーン抽出装置の構成を示すブロック図である。図9のハイライトシーン抽出装置は、図1のハイライトシーン抽出装置の構成要素に加えて、動画像ジャンル決定回路11、シーン構図選択回路12、及び顔追跡回路13を備える。また、図9のハイライトシーン抽出装置は、図1のインデックス生成回路7に代えて、顔追跡回路13から出力される信号に応じて動作するインデックス生成回路7Aを備える。シーン記憶装置5は、少なくとも1つの特定のジャンルのハイライトシーンにおける人物の顔の位置及び大きさによって決まる複数の特徴値の範囲をシーン構図条件として予め格納している。
FIG. 9 is a block diagram showing a configuration of a highlight scene extraction apparatus according to
動画像ジャンル決定回路11は、例えば放送波中のEPG(電子番組ガイド)情報から、動画像のジャンルを示すジャンル情報(ドラマ、ニュース、スポーツなど)を取得する。次いで、動画像ジャンル決定回路11は、動画像がインタビューシーンを含むジャンルであるか否かを判定する。動画像がインタビューシーンを含むジャンル(ニュース又はスポーツなど)であるとき、シーン構図選択回路12は、当該ジャンルと同じジャンルのハイライトシーンに対応するシーン構図条件をシーン記憶装置5から選択してハイライトシーン判定回路6に送り、顔追跡回路13は、フレーム画像における検出された顔を一定時間にわたって追跡する。一方、動画像がインタビューシーンを含まないジャンル(ドラマなど)であるとき、シーン構図選択回路12は、当該ジャンルと同じジャンルのハイライトシーンに対応するシーン構図条件をシーン記憶装置5から選択してハイライトシーン判定回路6に送り、顔追跡回路13は顔の追跡を実行しない。
The moving image
ここで、図11及び図12を参照して、顔追跡回路13による顔の追跡について説明する。
Here, with reference to FIG. 11 and FIG. 12, face tracking by the
図11は、インタビューシーンを含むフレーム画像120の例を示す図である。図12は、インタビューシーンを含む動画像のシーン構図特徴の例を示す図である。動画像入力回路1、フレーム抽出回路2、及び顔検出回路3は、実施の形態1の場合と同様に動作する。図12の時間t0においてフレーム画像120に含まれる人物P10の顔F10が検出されたとき、顔追跡回路13は、時間t0におけるフレーム画像から時間的に連続した複数のフレーム画像のうちの各隣接したフレーム画像において検出される顔の位置又は大きさの変化量が、所定のしきい値より小さいか否かを判定する。言い換えると、顔追跡回路13は、顔の位置の変化量のしきい値thd、又は、顔の大きさの変化量のしきい値thhに対して、次式のいずれかを満たすか否かを判定する。
FIG. 11 is a diagram illustrating an example of a
[数11]
thd≦sqrt((x(n+1)−x(n))2+(y(n+1)−y(n))2)
[数12]
thh≦abs|h(n+1)−h(n)|
[Equation 11]
th d ≦ sqrt ((x (n + 1) −x (n)) 2 + (y (n + 1) −y (n)) 2 )
[Equation 12]
th h ≦ abs | h (n + 1) −h (n) |
ここで、整数nは、離散化された時間tを示す。 Here, the integer n indicates the discretized time t.
図12の例では、時間t0から時間t1までの時間期間にわたって、フレーム画像120は実質的に一定の顔F10を含み、従って、数11及び数12のいずれも成立しない。時間t0から時間t1までの時間期間では、顔の位置又は大きさの変化量がしきい値thd又はthhより小さいフレーム画像が連続し、この時間期間を「追跡時間長ta」と呼ぶ。
In the example of FIG. 12, over the time period from time t 0 to time t 1 , the
顔追跡回路13は、数11及び数12のいずれかが満たされたとき、追跡時間長taが所定のしきい値th1を超えているか否かを判定する。追跡時間長taがしきい値th1を超えているとき、フレーム画像120はインタビューシーン(すなわち、フレーム画像の中央に同一人物の顔が長時間にわたって大きく表示されているシーン)を含むと考えられる。このとき、顔追跡回路13は、インタビューシーンに対応するシーン構図条件をシーン記憶装置5から選択してハイライトシーン判定回路6に送るようにシーン構図選択回路12に指示し、さらに、顔追跡回路13は、追跡時間長taの開始時間t0をインデックス生成回路7Aに通知する。一方、追跡時間長taがしきい値th1を超えていないとき、フレーム画像120はインタビューシーンを含まないと考えられる。このとき、顔追跡回路13は、動画像ジャンル決定回路11によって判定された動画像のジャンルに対応するシーン構図条件をシーン記憶装置5から選択してハイライトシーン判定回路6に送るようにシーン構図選択回路12に指示する。
The
ハイライトシーン判定回路6は、シーン構図選択回路12により送られたシーン構図条件に基づいて、実施の形態1の場合と同様に、シーン構図特徴の特徴値がシーン構図条件の特徴値の範囲内にあるか否かを判定する。
Based on the scene composition condition sent from the scene
インデックス生成回路7Aは、追跡時間長taがしきい値th1を超えているとき(すなわち、顔追跡回路13から追跡時間長taが入力されているとき)、かつ、シーン構図特徴の特徴値がシーン構図条件の特徴値の範囲内にあるとき、追跡時間長taの開始時間t0のフレーム画像にハイライトシーンのインデックスを付与する。なお、追跡時間長taがしきい値th1以下であるとき(すなわち、顔追跡回路13から追跡時間長taが入力されていないとき)、かつ、シーン構図特徴の特徴値がシーン構図条件の特徴値の範囲内にあるとき、現在のフレーム画像にハイライトシーンのインデックスを付与する。 When the tracking time length ta exceeds the threshold th 1 (that is, when the tracking time length ta is input from the face tracking circuit 13), the index generation circuit 7A has a feature value of the scene composition feature. when in the range of feature values of the scene composition condition is indexed highlight scene frame image of the start time t 0 of the track duration ta. When the tracking time length ta is equal to or less than the threshold th 1 (that is, when the tracking time length ta is not input from the face tracking circuit 13), the feature value of the scene composition feature is the feature of the scene composition condition. When it is within the value range, the index of the highlight scene is given to the current frame image.
図10は、図9の動画像ジャンル決定回路11、シーン構図選択回路12、及び顔追跡回路13によって実行されるシーン選択処理S5Aを示すフローチャートである。図10のシーン選択処理S5Aは、図2のシーン選択処理S5に代えて実行される。図10のステップS11において、動画像ジャンル決定回路11は、動画像のジャンル情報を取得する。ステップS12において、動画像ジャンル決定回路11は、動画像がインタビューシーンを含むジャンルであるか否かを判定し、YESのときはステップS13に進み、NOのときはステップS16に進む。ステップS13において、顔追跡回路13は、フレーム画像における検出された顔を一定時間にわたって追跡する。ステップS14において、顔追跡回路13は、顔画像の追跡時間長taがしきい値th1を超えているか否かを判定し、YESのときはステップS15に進み、NOのときはステップS16に進む。ステップS15において、シーン構図選択回路12は、インタビューシーンに対応するシーン構図条件をハイライトシーン判定回路6に送り、図2のステップS6に進む。ステップS16において、動画像ジャンル決定回路11によって判定された動画像のジャンルに対応するシーン構図条件をハイライトシーン判定回路6に送り、図2のステップS6に進む。
FIG. 10 is a flowchart showing a scene selection process S5A executed by the moving image
以上説明したように、本発明の実施の形態2に係るハイライトシーン抽出装置によれば、動画像のジャンルに応じて異なるシーン構図条件を選択することができる。
As described above, according to the highlight scene extraction apparatus according to
ハイライトシーンのシーン構図は、動画像のジャンルによって異なる。そこで、動画像のジャンルを示すジャンル情報を取得し、動画像のジャンルと同じジャンルのハイライトシーンに対応するシーン構図条件を用いることで、特定のジャンルの動画像から特定のハイライトシーンを抽出することができる。 The scene composition of the highlight scene differs depending on the genre of the moving image. Therefore, genre information indicating the genre of the moving image is acquired, and a specific highlight scene is extracted from the moving image of the specific genre by using a scene composition condition corresponding to a highlight scene of the same genre as the moving image genre. can do.
実施の形態3.
一般に、動画像において映像情報と音声情報とは互いに密接に関係しているので、ハイライトシーンを決定するとき、シーン構図特徴と、そのシーン構図特徴に高い関連性を有する音声特徴とを利用することで、ハイライトシーンをより正確に抽出することが可能になる。
In general, since video information and audio information are closely related to each other in a moving image, when determining a highlight scene, a scene composition feature and an audio feature having high relevance to the scene composition feature are used. As a result, the highlight scene can be extracted more accurately.
図13は、本発明の実施の形態3に係るハイライトシーン抽出装置の構成を示すブロック図である。図13のハイライトシーン抽出装置は、図1のシーン記憶装置5及びハイライトシーン判定回路6に代えてシーン記憶装置5B及びハイライトシーン判定回路6Bを備え、さらに、音声特徴生成回路21を備える。音声特徴生成回路21は、動画像から音声情報を分離して音声特徴を生成し、音声特徴をハイライトシーン判定回路6Bに送る。シーン記憶装置5Bは、シーン構図条件の特徴値の範囲に加えて、少なくとも1つの特定のハイライトシーンの前後における音声情報に係る複数の特徴値の範囲を音声条件として予め格納している。言い換えると、音声条件は、フレーム画像が特定のハイライトシーンであるときに、当該ハイライトシーンの前後の音声情報が有すると考えられる音声特徴の特徴値の範囲を示す。
FIG. 13 is a block diagram showing a configuration of a highlight scene extraction apparatus according to
図14は、図13のハイライトシーン抽出装置によって実行されるインデックス生成処理を示すフローチャートである。図14のステップS1〜S4は、図2のステップS1〜S4と同様である。音声特徴生成回路21は、ステップS21において、動画像入力回路1により取得された動画像(ステップS1)から音声情報を分離し、ステップS22において、音声情報から音声特徴を生成してハイライトシーン判定回路6Bに送る。ステップS5Bのシーン選択処理において、ハイライトシーン判定回路6Bは、シーン構図条件及び音声条件をシーン記憶装置5Bから読み出す。ステップS6Bにおいて、ハイライトシーン判定回路6Bは、シーン構図特徴及び音声特徴の各特徴値が、シーン構図条件及び音声条件の各特徴値の予め決められた範囲内にあるか否かを判定し、YESのときはステップS7に進み、NOのときはステップS8に進む。図14のステップS7〜S8は、図2のステップS7〜S8と同様である。
FIG. 14 is a flowchart showing an index generation process executed by the highlight scene extraction apparatus of FIG. Steps S1 to S4 in FIG. 14 are the same as steps S1 to S4 in FIG. In step S21, the audio
音声特徴としては、抽出しようとするシーン構図特徴と関連性の高いものを用いることができる。例えば、ハイライトシーンでは音量(音の大きさ)|V|が大きくなることが多いので、音声特徴として音量|V|を使用し、音声条件として音量のしきい値|Vth|を使用してもよい。この場合、ステップS6Bにおいて、ハイライトシーン判定回路6Bは、音量|V|がしきい値|Vth|より大きいかどうかを判定する。また、ハイライトシーンにおいて観客が興奮するようなケースでは音の周波数が高くなるので、音声特徴として音の周波数|Fv|を使用し、音声条件として周波数のしきい値|Fth|を使用してもよい。ハイライトシーン判定回路6Bは、周波数|Fv|がしきい値|Fth|より高いかどうかを判定する。
As the audio feature, a feature highly relevant to the scene composition feature to be extracted can be used. For example, in a highlight scene, the volume (sound volume) | V | is often large, so the volume | V | is used as an audio feature, and the volume threshold value | Vth | is used as an audio condition. Also good. In this case, in step S6B, the highlight
以上説明したように、本発明の実施の形態3に係るハイライトシーン抽出装置によれば、映像情報からのシーン構図特徴と、音声情報からの音声特徴とを組み合わせることで、動画像中から人物の顔を含む特定のハイライトシーンをより精度良く抽出することができる。
As described above, according to the highlight scene extraction apparatus according to
本発明の動画像のハイライトシーン抽出装置及び方法は、動画像を記録するハードディスクレコーダなどに適用可能である。 The moving image highlight scene extracting apparatus and method of the present invention can be applied to a hard disk recorder or the like for recording moving images.
1 動画像入力回路、2 フレーム抽出回路、3 顔検出回路、4 シーン構図決定回路、5,5B シーン記憶装置、6,6B ハイライトシーン判定回路、7,7A インデックス生成回路、8 動画像記憶装置、11 動画像ジャンル判定回路、12 シーン構図選択回路、13 顔追跡回路、100,101,110,120 フレーム画像、111 注目領域、A0,B0 頂点、F0,F1,Fi,Fj,F10 顔、G0,G1,Gi,Gj,G10 重心、P0,P1,Pi,Pj,P10 人物。
DESCRIPTION OF
Claims (10)
上記フレームにおける上記検出された顔の位置及び大きさによって決まる複数の特徴値を含むシーン構図特徴を生成する手段と、
少なくとも1つの特定のハイライトシーンにおける人物の顔の位置及び大きさによって決まる複数の特徴値の範囲をシーン構図条件として予め格納した格納手段と、
上記シーン構図特徴の特徴値が上記シーン構図条件の特徴値の範囲内にあるか否かを判定する第1の判定手段と、
上記シーン構図特徴の特徴値が上記シーン構図条件の特徴値の範囲内にあるとき、上記フレームにハイライトシーンのインデックスを付与するインデックス手段とを備えたことを特徴とする動画像のハイライトシーン抽出装置。 Means for detecting a human face from a frame of a moving image;
Means for generating a scene composition feature including a plurality of feature values determined by the position and size of the detected face in the frame;
Storage means for storing in advance a plurality of feature value ranges determined by the position and size of a person's face in at least one specific highlight scene as scene composition conditions;
First determination means for determining whether or not a feature value of the scene composition feature is within a range of feature values of the scene composition condition;
A highlight scene of a moving image comprising: index means for assigning an index of a highlight scene to the frame when the feature value of the scene composition feature is within the range of the feature value of the scene composition condition Extraction device.
上記格納手段は、少なくとも1つの特定のジャンルのハイライトシーンにおける人物の顔の位置及び大きさによって決まる複数の特徴値の範囲をシーン構図条件として予め格納し、
上記動画像のハイライトシーン抽出装置は、
上記動画像のジャンルを示すジャンル情報を取得する手段と、
上記動画像のジャンルと同じジャンルのハイライトシーンに対応するシーン構図条件を上記格納手段から選択する手段とをさらに備え、
上記第1の判定手段は、上記シーン構図特徴の特徴値が上記選択されたシーン構図条件の特徴値の範囲内にあるか否かを判定することを特徴とする請求項1記載の動画像のハイライトシーン抽出装置。 The above video is associated with a specific genre,
The storage means stores in advance as a scene composition condition a plurality of feature value ranges determined by the position and size of a person's face in a highlight scene of at least one specific genre,
The moving image highlight scene extraction device is:
Means for acquiring genre information indicating the genre of the moving image;
Means for selecting a scene composition condition corresponding to a highlight scene of the same genre as the moving image genre from the storage means;
2. The moving image according to claim 1, wherein the first determination unit determines whether or not a feature value of the scene composition feature is within a range of feature values of the selected scene composition condition. Highlight scene extraction device.
上記シーン構図条件は、複数の人物の顔の大きさの比の範囲、及び、複数の人物の顔の間の距離の範囲を含むことを特徴とする請求項1又は2記載の動画像のハイライトシーン抽出装置。 The feature value of the scene composition feature includes, when the frame includes a plurality of persons, a ratio of face sizes of the plurality of persons, and a distance between the faces of the plurality of persons,
3. The moving image high image according to claim 1, wherein the scene composition condition includes a range of a ratio of face sizes of a plurality of persons and a range of a distance between the faces of the plurality of persons. Light scene extraction device.
第1のフレームから時間的に連続した複数のフレームのうちの各隣接したフレームにおいて検出される顔の位置又は大きさの変化量が第1のしきい値より小さいか否かを判定し、上記変化量が上記第1のしきい値より小さいフレームが連続する時間長が第2のしきい値を超えているか否かを判定する第2の判定手段をさらに備え、
上記インデックス手段は、上記変化量が上記第1のしきい値より小さいフレームが連続する時間長が第2のしきい値を超えているとき、かつ、上記シーン構図特徴の特徴値が上記シーン構図条件の特徴値の範囲内にあるとき、上記第1のフレームにハイライトシーンのインデックスを付与することを特徴とする請求項1〜3のうちのいずれか1つに記載の動画像のハイライトシーン抽出装置。 The moving image highlight scene extraction device is:
Determining whether or not the amount of change in the position or size of the face detected in each adjacent frame among a plurality of frames temporally continuous from the first frame is smaller than the first threshold, A second determination means for determining whether or not a time length of continuous frames having a change amount smaller than the first threshold exceeds a second threshold;
The index means is configured such that when the time length for which the amount of change is smaller than the first threshold exceeds a second threshold and the feature value of the scene composition feature is the scene composition The highlight of a moving image according to any one of claims 1 to 3, wherein an index of a highlight scene is assigned to the first frame when it is within a range of feature values of a condition. Scene extraction device.
上記ハイライトシーン抽出装置は、上記音声情報に係る複数の特徴値を含む音声特徴を生成する手段をさらに備え、
上記格納手段は、少なくとも1つの特定のハイライトシーンの前後における音声情報に係る複数の特徴値の範囲を音声条件として予め格納し、
上記第1の判定手段は、上記シーン構図特徴及び上記音声特徴の各特徴値が上記シーン構図条件及び上記音声条件の各特徴値の範囲内にあるか否かを判定し、
上記インデックス手段は、上記シーン構図特徴及び上記音声特徴の各特徴値が上記シーン構図条件及び上記音声条件の各特徴値の範囲内にあるとき、上記フレームにハイライトシーンのインデックスを付与することを特徴とする請求項1〜4のうちのいずれか1つに記載の動画像のハイライトシーン抽出装置。 The moving image includes video information and audio information,
The highlight scene extraction device further includes means for generating an audio feature including a plurality of feature values related to the audio information,
The storage means stores in advance as a sound condition a range of a plurality of feature values related to sound information before and after at least one specific highlight scene,
The first determination means determines whether each feature value of the scene composition feature and the audio feature is within a range of each feature value of the scene composition condition and the audio condition,
The index means assigns an index of a highlight scene to the frame when the feature values of the scene composition feature and the audio feature are within the range of the feature values of the scene composition condition and the audio condition. The highlight scene extraction apparatus for moving images according to any one of claims 1 to 4.
上記フレームにおける上記検出された顔の位置及び大きさによって決まる複数の特徴値を含むシーン構図特徴を生成するステップと、
少なくとも1つの特定のハイライトシーンにおける人物の顔の位置及び大きさによって決まる複数の特徴値の範囲をシーン構図条件として格納手段に予め格納するステップと、
上記シーン構図特徴の特徴値が上記シーン構図条件の特徴値の範囲内にあるか否かを判定するステップと、
上記シーン構図特徴の特徴値が上記シーン構図条件の特徴値の範囲内にあるとき、上記フレームにハイライトシーンのインデックスを付与するステップとを含むことを特徴とする動画像のハイライトシーン抽出方法。 Detecting a human face from a frame of a moving image;
Generating a scene composition feature including a plurality of feature values determined by the position and size of the detected face in the frame;
Pre-stored in the storage means as a scene composition condition a range of a plurality of feature values determined by the position and size of a person's face in at least one specific highlight scene;
Determining whether the feature value of the scene composition feature is within the range of the feature value of the scene composition condition;
A highlight scene extraction method for moving images, comprising: a step of assigning an index of a highlight scene to the frame when a feature value of the scene composition feature is within a range of feature values of the scene composition condition .
上記格納手段は、少なくとも1つの特定のジャンルのハイライトシーンにおける人物の顔の位置及び大きさによって決まる複数の特徴値の範囲をシーン構図条件として予め格納し、
上記動画像のハイライトシーン抽出方法は、
上記動画像のジャンルを示すジャンル情報を取得するステップと、
上記動画像のジャンルと同じジャンルのハイライトシーンに対応するシーン構図条件を上記格納手段から選択するステップと、
上記シーン構図特徴の特徴値が上記選択されたシーン構図条件の特徴値の範囲内にあるか否かを判定するステップとを含むことを特徴とする請求項6記載の動画像のハイライトシーン抽出方法。 The above video is associated with a specific genre,
The storage means stores in advance as a scene composition condition a plurality of feature value ranges determined by the position and size of a person's face in a highlight scene of at least one specific genre,
The highlight scene extraction method of the above moving image is as follows:
Acquiring genre information indicating the genre of the moving image;
Selecting from the storage means a scene composition condition corresponding to a highlight scene of the same genre as the moving image genre;
7. The highlight scene extraction of a moving image according to claim 6, further comprising a step of determining whether or not the feature value of the scene composition feature is within the range of the feature value of the selected scene composition condition. Method.
上記シーン構図条件は、複数の人物の顔の大きさの比の範囲、及び、複数の人物の顔の間の距離の範囲を含むことを特徴とする請求項6又は7記載の動画像のハイライトシーン抽出方法。 The feature value of the scene composition feature includes, when the frame includes a plurality of persons, a ratio of face sizes of the plurality of persons, and a distance between the faces of the plurality of persons,
8. The moving image high level according to claim 6, wherein the scene composition condition includes a range of a ratio of face sizes of a plurality of persons and a range of a distance between the faces of the plurality of persons. Light scene extraction method.
第1のフレームから時間的に連続した複数のフレームのうちの各隣接したフレームにおいて検出される顔の位置又は大きさの変化量が第1のしきい値より小さいか否かを判定し、上記変化量が上記第1のしきい値より小さいフレームが連続する時間長が第2のしきい値を超えているか否かを判定するステップと、
上記変化量が上記第1のしきい値より小さいフレームが連続する時間長が第2のしきい値を超えているとき、かつ、上記シーン構図特徴の特徴値が上記シーン構図条件の特徴値の範囲内にあるとき、上記第1のフレームにハイライトシーンのインデックスを付与するステップとを含むことを特徴とする請求項6〜8のうちのいずれか1つに記載の動画像のハイライトシーン抽出方法。 The highlight scene extraction method of the above moving image is as follows:
Determining whether or not the amount of change in the position or size of the face detected in each adjacent frame among a plurality of frames temporally continuous from the first frame is smaller than the first threshold, Determining whether or not a time length of continuous frames having a change amount smaller than the first threshold exceeds a second threshold;
When the length of time for which the amount of change is smaller than the first threshold exceeds the second threshold, and the feature value of the scene composition feature is the feature value of the scene composition condition The moving image highlight scene according to claim 6, further comprising a step of assigning an index of a highlight scene to the first frame when it is within the range. Extraction method.
上記動画像のハイライトシーン抽出方法は、
上記音声情報に係る複数の特徴値を含む音声特徴を生成するステップと、
少なくとも1つの特定のハイライトシーンの前後における音声情報に係る複数の特徴値の範囲を音声条件として予め格納するステップと、
上記シーン構図特徴及び上記音声特徴の各特徴値が上記シーン構図条件及び上記音声条件の各特徴値の範囲内にあるか否かを判定するステップと、
上記シーン構図特徴及び上記音声特徴の各特徴値が上記シーン構図条件及び上記音声条件の各特徴値の範囲内にあるとき、上記フレームにハイライトシーンのインデックスを付与するステップとをさらに含むことを特徴とする請求項6〜9のうちのいずれか1つに記載の動画像のハイライトシーン抽出方法。 The moving image includes video information and audio information,
The highlight scene extraction method of the above moving image is as follows:
Generating a voice feature including a plurality of feature values related to the voice information;
Pre-stored as a sound condition a range of feature values related to sound information before and after at least one specific highlight scene;
Determining whether each feature value of the scene composition feature and the audio feature is within a range of each feature value of the scene composition condition and the audio condition;
Adding a highlight scene index to the frame when the feature values of the scene composition feature and the audio feature are within the range of the feature values of the scene composition condition and the audio condition. The highlight scene extraction method for moving images according to any one of claims 6 to 9.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014017221A JP2014187687A (en) | 2013-02-21 | 2014-01-31 | Device and method for extracting highlight scene of moving image |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013032126 | 2013-02-21 | ||
JP2013032126 | 2013-02-21 | ||
JP2014017221A JP2014187687A (en) | 2013-02-21 | 2014-01-31 | Device and method for extracting highlight scene of moving image |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014187687A true JP2014187687A (en) | 2014-10-02 |
JP2014187687A5 JP2014187687A5 (en) | 2016-01-07 |
Family
ID=51834750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014017221A Pending JP2014187687A (en) | 2013-02-21 | 2014-01-31 | Device and method for extracting highlight scene of moving image |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014187687A (en) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106383636A (en) * | 2016-09-23 | 2017-02-08 | 珠海市魅族科技有限公司 | Index information display method and apparatus |
JP2018501533A (en) * | 2014-10-09 | 2018-01-18 | スーズ,インコーポレイテッド | Generate customized highlight sequences that depict one or more events |
US10536758B2 (en) | 2014-10-09 | 2020-01-14 | Thuuz, Inc. | Customized generation of highlight show with narrative component |
KR20200072238A (en) * | 2018-12-12 | 2020-06-22 | 인하대학교 산학협력단 | Apparatus of character area extraction in video |
KR20200072237A (en) * | 2018-12-12 | 2020-06-22 | 인하대학교 산학협력단 | Extraction apparatus of character conflict information in video |
US11025985B2 (en) | 2018-06-05 | 2021-06-01 | Stats Llc | Audio processing for detecting occurrences of crowd noise in sporting event television programming |
US11138438B2 (en) | 2018-05-18 | 2021-10-05 | Stats Llc | Video processing for embedded information card localization and content extraction |
US11264048B1 (en) | 2018-06-05 | 2022-03-01 | Stats Llc | Audio processing for detecting occurrences of loud sound characterized by brief audio bursts |
US11863848B1 (en) | 2014-10-09 | 2024-01-02 | Stats Llc | User interface for interaction with customized highlight shows |
US11908192B2 (en) | 2018-05-29 | 2024-02-20 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008167063A (en) * | 2006-12-27 | 2008-07-17 | Fujifilm Corp | Imaging apparatus and method |
JP2009135754A (en) * | 2007-11-30 | 2009-06-18 | Oki Electric Ind Co Ltd | Digest creating apparatus and method |
JP2010206609A (en) * | 2009-03-04 | 2010-09-16 | Canon Inc | Image playback apparatus, control method of the same, and program |
JP2012070283A (en) * | 2010-09-24 | 2012-04-05 | Toshiba Corp | Video processing apparatus, method, and video processing system |
JP2012105205A (en) * | 2010-11-12 | 2012-05-31 | Nikon Corp | Key frame extractor, key frame extraction program, key frame extraction method, imaging apparatus, and server device |
-
2014
- 2014-01-31 JP JP2014017221A patent/JP2014187687A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008167063A (en) * | 2006-12-27 | 2008-07-17 | Fujifilm Corp | Imaging apparatus and method |
JP2009135754A (en) * | 2007-11-30 | 2009-06-18 | Oki Electric Ind Co Ltd | Digest creating apparatus and method |
JP2010206609A (en) * | 2009-03-04 | 2010-09-16 | Canon Inc | Image playback apparatus, control method of the same, and program |
JP2012070283A (en) * | 2010-09-24 | 2012-04-05 | Toshiba Corp | Video processing apparatus, method, and video processing system |
JP2012105205A (en) * | 2010-11-12 | 2012-05-31 | Nikon Corp | Key frame extractor, key frame extraction program, key frame extraction method, imaging apparatus, and server device |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11778287B2 (en) | 2014-10-09 | 2023-10-03 | Stats Llc | Generating a customized highlight sequence depicting multiple events |
US11882345B2 (en) | 2014-10-09 | 2024-01-23 | Stats Llc | Customized generation of highlights show with narrative component |
US10536758B2 (en) | 2014-10-09 | 2020-01-14 | Thuuz, Inc. | Customized generation of highlight show with narrative component |
US11863848B1 (en) | 2014-10-09 | 2024-01-02 | Stats Llc | User interface for interaction with customized highlight shows |
JP2018501533A (en) * | 2014-10-09 | 2018-01-18 | スーズ,インコーポレイテッド | Generate customized highlight sequences that depict one or more events |
US11582536B2 (en) | 2014-10-09 | 2023-02-14 | Stats Llc | Customized generation of highlight show with narrative component |
US11290791B2 (en) | 2014-10-09 | 2022-03-29 | Stats Llc | Generating a customized highlight sequence depicting multiple events |
CN106383636A (en) * | 2016-09-23 | 2017-02-08 | 珠海市魅族科技有限公司 | Index information display method and apparatus |
US11594028B2 (en) | 2018-05-18 | 2023-02-28 | Stats Llc | Video processing for enabling sports highlights generation |
US11373404B2 (en) | 2018-05-18 | 2022-06-28 | Stats Llc | Machine learning for recognizing and interpreting embedded information card content |
US11615621B2 (en) | 2018-05-18 | 2023-03-28 | Stats Llc | Video processing for embedded information card localization and content extraction |
US11138438B2 (en) | 2018-05-18 | 2021-10-05 | Stats Llc | Video processing for embedded information card localization and content extraction |
US11908192B2 (en) | 2018-05-29 | 2024-02-20 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
US11922968B2 (en) | 2018-06-05 | 2024-03-05 | Stats Llc | Audio processing for detecting occurrences of loud sound characterized by brief audio bursts |
US11025985B2 (en) | 2018-06-05 | 2021-06-01 | Stats Llc | Audio processing for detecting occurrences of crowd noise in sporting event television programming |
US11264048B1 (en) | 2018-06-05 | 2022-03-01 | Stats Llc | Audio processing for detecting occurrences of loud sound characterized by brief audio bursts |
KR102179591B1 (en) | 2018-12-12 | 2020-11-17 | 인하대학교 산학협력단 | Apparatus of character area extraction in video |
KR102179590B1 (en) * | 2018-12-12 | 2020-11-17 | 인하대학교 산학협력단 | Extraction apparatus of character conflict information in video |
KR20200072237A (en) * | 2018-12-12 | 2020-06-22 | 인하대학교 산학협력단 | Extraction apparatus of character conflict information in video |
KR20200072238A (en) * | 2018-12-12 | 2020-06-22 | 인하대학교 산학협력단 | Apparatus of character area extraction in video |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2014187687A (en) | Device and method for extracting highlight scene of moving image | |
KR20150093425A (en) | Method and apparatus for recommending content | |
JP2008271268A (en) | Image processor, imaging apparatus and image display control method, and computer program | |
KR20150127070A (en) | Pictorial summary for video | |
JP2009089032A (en) | Electronic apparatus and scene-type display method | |
JP2011217209A (en) | Electronic apparatus, content recommendation method, and program | |
JP2008148077A (en) | Moving picture playback device | |
US20050264703A1 (en) | Moving image processing apparatus and method | |
JP4047264B2 (en) | Moving image processing apparatus, moving image processing method, and moving image processing program | |
JPWO2006016590A1 (en) | Information signal processing method, information signal processing device, and computer program recording medium | |
JP6096548B2 (en) | Viewing level setting method for audio-visual content | |
KR102505973B1 (en) | Image processing apparatus, control method thereof and computer readable medium having computer program recorded therefor | |
JP2011504034A (en) | How to determine the starting point of a semantic unit in an audiovisual signal | |
Lin et al. | Automatic highlights extraction for drama video using music emotion and human face features | |
US20230290382A1 (en) | Method and apparatus for matching music with video, computer device, and storage medium | |
JP5096259B2 (en) | Summary content generation apparatus and summary content generation program | |
JP2005536937A (en) | Unit and method for detection of content characteristics in a series of video images | |
JP2005136810A (en) | Content quality evaluation device, method therefor and program thereofor | |
JP2014130536A (en) | Information management device, server, and control method | |
JP4491009B2 (en) | Moving image processing device | |
JP2006014084A (en) | Video editing apparatus, video editing program, recording medium, and video editing method | |
JPWO2011161820A1 (en) | Video processing apparatus, video processing method, and video processing program | |
JP6164445B2 (en) | Chapter setting device | |
JP2005167456A (en) | Method and device for extracting interesting features of av content | |
JP2006054622A (en) | Information signal processing method, information signal processor and program recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151116 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161025 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170425 |