JP3377679B2 - Coded interlaced video cut detection method and apparatus - Google Patents
Coded interlaced video cut detection method and apparatusInfo
- Publication number
- JP3377679B2 JP3377679B2 JP13733196A JP13733196A JP3377679B2 JP 3377679 B2 JP3377679 B2 JP 3377679B2 JP 13733196 A JP13733196 A JP 13733196A JP 13733196 A JP13733196 A JP 13733196A JP 3377679 B2 JP3377679 B2 JP 3377679B2
- Authority
- JP
- Japan
- Prior art keywords
- field
- inter
- similarity
- calculation
- interlaced video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明は、符号化映像からカ
ットを検出する方法および装置に関し、具体的にはイン
タレース映像信号を符号化した映像データからカットを
検出するのに好適な符号化インタレース映像カット検出
方法および装置に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and apparatus for detecting a cut from coded video, and more specifically, to a coded interface suitable for detecting a cut from video data obtained by coding an interlaced video signal. The present invention relates to a race video cut detection method and device.
【0002】[0002]
【従来の技術】映像の概要を把握するためには、映像を
時間順に見ていくのが一般的であるが、映像データから
カット(場面の切り替わり)を自動検出できれば、場面
の一覧を自動的に作成できるので、効率的に映像の概略
を把握したり、必要な場面を検索したりすることができ
るようになる。2. Description of the Related Art In order to grasp the outline of a video, it is common to watch the video in time sequence. However, if a cut (change of scene) can be automatically detected from the video data, a list of scenes can be automatically displayed. Since it can be created, you can efficiently grasp the outline of the video and search for the necessary scene.
【0003】近年、通信、放送、エンターテイメント等
の様々な分野でデジタル化された映像のアプリケーショ
ンが広がりつつあり、符号化された映像データから直接
(復号化を行うことなく)カットを検出する技術が必要
とされている。In recent years, applications of digitized video have been spreading in various fields such as communication, broadcasting and entertainment, and there is a technique for detecting a cut directly (without decoding) from encoded video data. is necessary.
【0004】従来のカット検出方法の多くは、符号化さ
れていない映像データを対象としたもので、符号化映像
データを扱うためには、復号処理を行う必要があり、ソ
フトウェア的に実現するには処理時間がかかるという問
題があった。また、ハードウェア的に実現するようにし
ても、ハードウェア規模が大きくなるという問題があっ
た。Most of the conventional cut detection methods are intended for non-encoded video data. In order to handle the encoded video data, it is necessary to perform a decoding process, and it is necessary to implement it by software. Had a problem that it took a long time to process. Further, even if it is realized by hardware, there is a problem that the hardware scale becomes large.
【0005】「シーンチェンジ検出装置」(特開平6−
22304号公報)では、1フレーム毎の予測誤差の累
計値、符号化データのデータ量、またはフレーム内符号
化された画素数などの、動画像の符号化/復号化に際し
て計算される特徴量を用いて、カットを自動検出してい
る。そのカット検出の原理を図11で説明する。図11
のフレーム列においては、連続しているフレーム22と
フレーム23の間にカットがある(場面が白から黒に切
り替わっている)ので、フレーム22とフレーム23の
間で相関が小さくなり、上記の特徴量はいずれも大きな
値をとる。従って、上記の特徴量を閾値と比較すること
によって、カットを自動で検出することができるという
わけである。"Scene change detecting device" (Japanese Patent Laid-Open No. 6-
No. 22304), a feature amount calculated at the time of encoding / decoding of a moving image, such as a cumulative value of prediction errors for each frame, a data amount of encoded data, or the number of pixels encoded in a frame, is described. It is used to detect the cut automatically. The principle of the cut detection will be described with reference to FIG. Figure 11
In the frame sequence of, since there is a cut between the continuous frames 22 and 23 (the scene switches from white to black), the correlation between the frames 22 and 23 becomes small, and The amount is large. Therefore, the cut can be automatically detected by comparing the above feature amount with the threshold value.
【0006】[0006]
【発明が解決しようとする課題】ところで、NTSCア
ナログ信号(テレビ放送で一般的に用いられている映像
信号方式)に代表されるインタレース映像を符号化した
映像データ(以下、符号化インタレース映像データ)に
対して、上記従来のカット検出の技術を適用した場合の
問題点について説明する。By the way, video data (hereinafter, coded interlaced video) encoded by interlaced video represented by NTSC analog signal (video signal system generally used in television broadcasting) is used. Data) will be described with respect to problems when the above-described conventional cut detection technique is applied.
【0007】図12に示すフレーム列を例に考える。図
12では、フレーム31とフレーム32の奇数フィール
ドが一つの場面(白)を構成し、フレーム32の偶数フ
ィールドとフレーム33がもう一つの場面(黒)を構成
している。このように偶奇フィールドの間にカットがあ
る状況は、フィルム映像(秒24こま)をNTSC信号
(秒30フレーム)に変換(テレシネ変換)したときに
頻繁に生じるものである。このようなフレーム列に対し
て、上記従来のカット検出の技術を適用すると、フレー
ム32とフレーム33の両方で上記特徴量が高い値を持
つため、連続する2フレーム(32,33)をカットと
重複して検出してしまう。これを回避するために、2フ
レーム連続したカットは一つのカットとみなすことがで
きるが、次のような別の問題を生じる。Consider the frame sequence shown in FIG. 12 as an example. In FIG. 12, the odd fields of the frame 31 and the frame 32 form one scene (white), and the even field of the frame 32 and the frame 33 form another scene (black). Such a situation where there is a cut between the even and odd fields frequently occurs when a film image (24 frames per second) is converted into an NTSC signal (30 frames per second) (telecine conversion). When the above-described conventional cut detection technique is applied to such a frame sequence, the consecutive two frames (32, 33) are cut because the feature amount has a high value in both the frame 32 and the frame 33. Duplicately detected. In order to avoid this, a continuous cut of two frames can be regarded as one cut, but another problem as described below occurs.
【0008】図13に示すフレーム列を例に考える。こ
のフレーム列は、撮影時にフラッシュ光が映り込んだ状
況を模式的に示したもので、フレーム41では真っ暗な
画像だったものが、フレーム42の偶数フィールドで一
瞬明るくなって、次のフレーム43で元に戻る。このフ
レーム列に対して、上記の方法を適用すると、特徴量
は、図12のフレーム列の場合と同様に、フレーム42
とフレーム43の両方で高い値を持つ。従って、偶数フ
ィールドと奇数フィールドの間にあるカットを検出しよ
うとすると、図13に示した状況でフラッシュ光などの
ノイズをカットと誤って検出してしまう。Consider the frame sequence shown in FIG. 13 as an example. This frame sequence schematically shows the situation in which the flash light is reflected at the time of shooting. The image that was completely dark in the frame 41 was momentarily brightened in the even field of the frame 42 and then in the next frame 43. Return to the original. When the above method is applied to this frame sequence, the feature amount is the same as that of the frame sequence of FIG.
And the frame 43 both have high values. Therefore, if an attempt is made to detect a cut between the even field and the odd field, noise such as flash light will be erroneously detected as a cut in the situation shown in FIG.
【0009】従来技術では、奇数フィールドと偶数フィ
ールドの間で生じたカットを検出しようとすると、フラ
ッシュ光などの瞬間的なノイズをカットとして誤って検
出してしまい、逆に、フラッシュ光の誤検出を回避しよ
うとすれば、フィールドの間で生じたカットを検出でき
なくなるという問題点を有していた。In the prior art, when trying to detect a cut generated between an odd field and an even field, instantaneous noise such as flash light is erroneously detected as a cut, and conversely erroneous detection of flash light is detected. However, there is a problem that the cut generated between the fields cannot be detected if the above problem is avoided.
【0010】本発明は、上記問題点を解決するためにな
されたものであり、MPEG2等のフィールド予測方式
を用いて符号化された映像データから、復号処理を行う
ことなくカットを高速かつ正確に検出できる(フラッシ
ュ光をカットと誤検出せず、奇数フィールドと偶数フィ
ールドの間で生じたカットを正しく検出できる)カット
検出方法および装置を提供することを目的とする。The present invention has been made in order to solve the above-mentioned problems, and cuts video data encoded using a field prediction method such as MPEG2 at high speed and accurately without performing a decoding process. It is an object of the present invention to provide a cut detection method and apparatus that can detect (the flash light is not erroneously detected as a cut and a cut generated between an odd field and an even field can be correctly detected).
【0011】[0011]
【課題を解決するための手段】上記の目的を達成するた
め、本発明の請求項1に記載の発明は、フィールド予測
方式を含む符号化方式によって符号化された映像データ
からカットを検出する符号化インタレース映像カット検
出方法であって、奇数フィールドか偶数フィールドのい
ずれかのフィールドを参照するかを選択する参照フィー
ルド選択情報に基づいて、フィールド毎に、フィールド
間の類似度を算出するフィールド間類似度算出工程と、
複数のフィールドから算出された前記フィールド間類似
度に対応して所定の演算を施す演算工程と、前記演算の
結果が所定の値より大きい場合にカットが存在すると判
定する比較工程と、を具備することを特徴とする。In order to achieve the above object, the invention according to claim 1 of the present invention is a code for detecting a cut from video data coded by a coding method including a field prediction method. Interlaced video cut detection method for calculating the inter-field similarity for each field based on reference field selection information for selecting whether to reference an odd field or an even field A similarity calculation step,
The method further comprises a calculation step of performing a predetermined calculation corresponding to the inter-field similarity calculated from a plurality of fields, and a comparison step of determining that a cut exists when the calculation result is larger than a predetermined value. It is characterized by
【0012】また、本発明の請求項2に記載の発明は、
前記フィールド間類似度算出工程が、差分データに所定
の演算を施した後で、それを参照フィールド別に累計し
た値をフィールド間類似度とする、ことを特徴とする。The invention according to claim 2 of the present invention is
In the inter-field similarity calculation step, the difference data is subjected to a predetermined operation, and a value obtained by accumulating the difference data for each reference field is set as the inter-field similarity.
【0013】また、本発明の請求項3に記載の発明は、
前記演算工程が、着目フィールドと過去のフィールドの
間のフィールド間類似度が小さいという第一の条件と、
着目フィールドと未来のフィールドの間のフィールド間
類似度が大きいという第二の条件とを共に満たすときだ
け大きな値を出力する演算を含む、ことを特徴とする。The invention according to claim 3 of the present invention is
A first condition that the inter-field similarity between the field of interest and the past field is small,
It is characterized by including an operation for outputting a large value only when both the second condition that the inter-field similarity between the field of interest and the future field is large are satisfied.
【0014】また、本発明の請求項4に記載の発明は、
前記演算工程が、着目フィールドと過去および未来のフ
ィールドの間のフィールド間類似度が共に小さいとき大
きな値を出力する演算を含み、前記比較工程が、該演算
の結果が所定の値より大きい場合に一時的画像変化が存
在すると判定する、ことを特徴とする。The invention according to claim 4 of the present invention is
The calculation step includes a calculation that outputs a large value when the inter-field similarities between the field of interest and the past and future fields are both small, and the comparison step includes a case where the result of the calculation is larger than a predetermined value. It is characterized by determining that there is a temporary image change.
【0015】さらに、本発明の請求項5に記載の発明
は、フィールド予測方式を含む符号化方式によって符号
化された映像データからカットを検出する符号化インタ
レース映像カット検出装置であって、前記参照フィール
ド選択信号に基づいて、フィールド間類似度を算出する
フィールド間類似度算出手段と、前記算出されたフィー
ルド間類似度を複数フィールドに渡って保持するフィー
ルド間類似度保持手段と、前記保持された複数のフィー
ルド間類似度に対して所定の演算を施す演算手段と、前
記演算の結果を所定の値と比較しカット有無の信号を出
力する比較手段と、を具備することを特徴とする。Further, the invention according to claim 5 of the present invention is a coded interlaced video cut detection apparatus for detecting a cut from video data coded by a coding method including a field prediction method, wherein: Inter-field similarity calculation means for calculating inter-field similarity based on a reference field selection signal; inter-field similarity holding means for holding the calculated inter-field similarity across a plurality of fields; Further, it is characterized in that it comprises: arithmetic means for performing a predetermined arithmetic operation on a plurality of inter-field similarities; and comparing means for comparing the result of the arithmetic operation with a predetermined value and outputting a signal indicating the presence or absence of a cut.
【0016】本発明の請求項1に記載の発明では、フィ
ールド間類似度算出工程が、参照フィールド選択情報に
基づいて、フィールド毎に、フィールドとの間の類似度
を複数算出し、演算工程は、1フィールド分のフィール
ド間類似度が算出される度に、その時点までに算出され
ている数フィールド分のフィールド間類似度に対して所
定の演算を施す。比較工程は、演算結果が所定の値より
大きい場合にカットが存在すると判定する。このように
符号化映像データから復号処理を行うことなく抽出でき
る参照フィールド選択情報に基づいて、フィールド間類
似度を算出することにより、高速にカットを検出可能と
する。また、フレーム単位でなくフィールド単位に類似
度を算出することにより、符号化インタレース映像デー
タに対しても正しくカットを検出可能とする。In the invention according to claim 1 of the present invention, the inter-field similarity calculation step calculates a plurality of similarities with each field based on the reference field selection information, and the calculation step is performed. Each time the inter-field similarity for one field is calculated, a predetermined calculation is performed on the inter-field similarity calculated for several fields up to that point. The comparison step determines that a cut exists when the calculation result is larger than a predetermined value. In this way, the cut can be detected at high speed by calculating the inter-field similarity based on the reference field selection information that can be extracted from the encoded video data without performing the decoding process. Further, by calculating the similarity in field units rather than in frame units, it is possible to correctly detect cuts in encoded interlaced video data.
【0017】また、本発明の請求項2に記載の発明で
は、フィールド間類似度算出工程が、符号化映像データ
から復号処理を経ないで得られる差分データに所定の演
算を施した後で、それを参照フィールド別に累計した値
をフィールド間類似度とすることにより、高速にカット
を検出可能とする。Further, in the invention according to claim 2 of the present invention, after the inter-field similarity calculation step performs a predetermined calculation on the difference data obtained without performing the decoding process from the encoded video data, Cuts can be detected at high speed by using the value obtained by accumulating them for each reference field as the inter-field similarity.
【0018】また、本発明の請求項3に記載の発明で
は、演算工程が着目フィールドと(着目フィールドから
見て)過去のフィールドの間のフィールド間類似度が小
さいという第一の条件と着目フィールドと未来のフィー
ルドの間のフィールド間類似度が大きいという第二の条
件とを共に満たすときだけ大きな値を出力する演算を実
行することにより、演算結果がカットの場合だけ大きな
値を取り、フラッシュ光等のノイズに対しては小さな値
を取るようにして、符号化インタレース映像データに対
しても正しくカットを検出可能とする。Further, in the invention according to claim 3 of the present invention, the first condition that the calculation step has a small inter-field similarity between the field of interest and the past field (as viewed from the field of interest) and the field of interest. By executing the operation that outputs a large value only when the second condition that the inter-field similarity between the future field and the future field is large is satisfied, a large value is obtained only when the operation result is a cut, and the flash light By taking a small value for noise such as, the cut can be correctly detected even for the encoded interlaced video data.
【0019】また、本発明の請求項4に記載の発明で
は、演算工程が、着目フィールドと過去および未来のフ
ィールドの間のフィールド間類似度が共に小さいとき大
きな値を出力する演算を実行し、比較工程が該演算結果
が所定の値より大きい場合に一時的画像変化が存在する
と判定することにより、一時的画像変化(フラッシュ光
等)をカットとは区別して検出可能とする。Further, in the invention according to claim 4 of the present invention, the calculation step executes a calculation for outputting a large value when the inter-field similarities between the field of interest and the past and future fields are both small, When the comparison step determines that there is a temporary image change when the calculation result is larger than a predetermined value, the temporary image change (flash light or the like) can be detected separately from the cut.
【0020】さらに、請求項5に記載の発明では、フィ
ールド間類似度算出手段が符号化映像データから復号処
理を経ないで得られる参照フィールド選択信号に基づい
て、フィールド間の類似度を算出し、フィールド間類似
度保持手段がその類似度の値を複数フィールドに渡って
保持する。演算手段は、フィールド間類似度保持手段か
ら入力される複数のフィールド間類似度に対して所定の
演算を施し、比較手段で演算結果を所定の値と比較しカ
ット有無を示す信号を出力する。このように、復号化を
行うことなく符号化データから直接得られる参照フィー
ルド選択信号に基づいてフィールド間類似度を算出する
ことにより、復号化のためのハードウェアを不要とす
る。また、フレーム単位ではなくフィールド単位に類似
度を算出することにより、符号化インタレース映像デー
タに対しても正しくカットを検出可能とする。Further, in the invention according to claim 5, the inter-field similarity calculation means calculates the inter-field similarity based on the reference field selection signal obtained from the encoded video data without undergoing the decoding process. The inter-field similarity holding means holds the value of the similarity over a plurality of fields. The calculation means performs a predetermined calculation on the plurality of inter-field similarities input from the inter-field similarity holding means, compares the calculation result with a predetermined value by the comparison means, and outputs a signal indicating the presence or absence of the cut. As described above, by calculating the inter-field similarity based on the reference field selection signal obtained directly from the encoded data without performing decoding, hardware for decoding is unnecessary. In addition, by calculating the degree of similarity in units of fields rather than in units of frames, it is possible to correctly detect a cut in encoded interlaced video data.
【0021】[0021]
【発明の実施の形態】以下、本発明の四つの実施形態例
を図を用いて説明する。BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, four embodiments of the present invention will be described with reference to the drawings.
【0022】以下の実施形態例では、MPEG2(フレ
ーム構造、フィールド予測)の順方向予測ピクチャ(p
ピクチャ)を符号化映像データの例にとって説明する。
まず、図14を用いてMPEG2符号化の仕組みの概略
を説明する。In the following embodiments, MPEG2 (frame structure, field prediction) forward prediction pictures (p
(Picture) will be described as an example of encoded video data.
First, the outline of the MPEG2 encoding mechanism will be described with reference to FIG.
【0023】MPEG2ではフレーム51を16×16
画素のマクロブロック52に分割し、それぞれのマクロ
ブロックを以下のように符号化する。マクロブロックを
前フレームから動き予測できるか否かで、(1)ノンイ
ントラモード、(2)イントラモードのいずれかを選択
する。(1)のイントラモードでは、フレーム間の相関
を用いずフレーム内で閉じた符号化を行う。具体的に
は、16×16画素のマクロブロックを、輝度の場合、
更に四つの8×8画素ブロックに分割し、ブロック毎に
DCT変換を行い、DCT係数を符号化データとして出
力する。(2)のノンイントラモードでは、フレーム構
造またはフィールド構造を選択できるが、ここではフレ
ーム構造のみについて説明する。フレーム構造のフィー
ルド予測方式では16×16画素のマクロブロックを奇
数フィールドと偶数フィールドに分けて二つの16×8
画素ブロック53および54を構成し、それぞれの16
×8画素ブロックに対して動き予測を行い、マクロブロ
ック毎に、(A)二つの動きベクトルと、(B)二組の
予測誤差(差分)のDCT係数と、(C)二つの参照フ
ィールド選択フラグ、を符号化データとして出力する。
(C)の参照フィールド選択フラグは、復号時に偶数フ
ィールドから動き補償を行うか、奇数フィールドから動
き補償を行うかを選択できるようにするためのフラグで
ある。In MPEG2, the frame 51 is 16 × 16
It is divided into macroblocks 52 of pixels and each macroblock is encoded as follows. Either (1) non-intra mode or (2) intra mode is selected depending on whether or not the motion prediction of the macro block can be performed from the previous frame. In the intra mode of (1), closed coding is performed within a frame without using correlation between frames. Specifically, for a 16 × 16 pixel macroblock, in the case of luminance,
Further, it is divided into four 8 × 8 pixel blocks, DCT conversion is performed for each block, and DCT coefficients are output as encoded data. In the non-intra mode (2), a frame structure or a field structure can be selected, but only the frame structure will be described here. In the field structure field prediction method, a macro block of 16 × 16 pixels is divided into an odd field and an even field and divided into two 16 × 8 fields.
The pixel blocks 53 and 54 are formed, and
Motion estimation is performed on a × 8 pixel block, and (A) two motion vectors, (B) two sets of prediction error (difference) DCT coefficients, and (C) two reference field selections for each macroblock. The flag is output as encoded data.
The reference field selection flag in (C) is a flag for enabling selection of whether to perform motion compensation from an even field or motion compensation from an odd field during decoding.
【0024】〈実施形態例1〉図1に、本発明の請求項
1、2の発明を含んだ請求項3の発明に対応する、第1
の実施形態例のフロー図を示す。このフロー図は、1フ
レーム分の符号化映像データ(t番目のフレーム)を処
理して、前フレーム(t−1番目)にカットが存在する
か否かを判定する手続きを示したものであり、主要な工
程として、フィールド間類似度算出工程、演算工程、比
較工程を有する。<Embodiment 1> FIG. 1 shows a first embodiment corresponding to the invention of claim 3 including the inventions of claims 1 and 2 of the present invention.
FIG. 6 shows a flow diagram of an example embodiment of FIG. This flow chart shows a procedure for processing one frame of encoded video data (t-th frame) and determining whether or not a cut exists in the previous frame (t-1). The main steps include an inter-field similarity calculation step, a calculation step, and a comparison step.
【0025】(a)フィールド間類似度算出工程(12
0)
まず、フィールド間類似度の値を格納する配列sim
(t,k,m)(k=0,1;m=0,1)をすべて0
に初期化する(ステップ101)。ただし、変数k,m
のとる値0/1は奇数フィールド/偶数フィールドにそ
れぞれ対応する。1フレーム分の符号化映像データを読
み込む(ステップ102)。マクロブロック毎に、符号
化モードフラグ(イントラ/ノンイントラ)を符号化映
像データから抽出する(ステップ103)。符号化モー
ドフラグがイントラモードを示していればステップ11
3に処理を移す(ステップ104)。ノンイントラモー
ドであれば、符号化映像データを更に解析して、奇数フ
ィールドに対応する参照フィールド選択フラグfiel
d_sel(=0 or 1)を抽出する(ステップ1
05)。field_sel=0であれば、前フレーム
の奇数フィールドを参照して動き補償を行うことを示し
ており、field_sel=1であれば偶数フィール
ドを参照することを示す。続いて予測誤差(差分デー
タ)を表すDCT係数のうちDC成分だけを符号化映像
データから抽出する(ステップ106)。DC成分の絶
対値を閾値TH1と比較し(ステップ107)、閾値よ
りも小さい場合だけsim(t,0,field_se
l)に1を加算する(ステップ108)。偶数フィール
ドに対しても、奇数フィールドに対する手続き(ステッ
プ105〜108)と同等のものを実行する(ステップ
109〜112)。ステップ103〜112の処理を、
最後のマクロブロックに達するまで繰り返し(ステップ
113)、結果として得られるsim(t,k,m)を
フィールド間類似度とする(ステップ114)。フィー
ルド間類似度sim(t,k,m)の持つ特性について
は後述する。(A) Inter-field similarity calculation step (12
0) First, an array sim that stores values of inter-field similarity
(T, k, m) (k = 0,1; m = 0,1) are all 0
(Step 101). However, variables k and m
The value 0/1 taken by corresponds to the odd field / even field, respectively. One frame of encoded video data is read (step 102). The coding mode flag (intra / non-intra) is extracted from the coded video data for each macroblock (step 103). Step 11 if the encoding mode flag indicates intra mode
The process is moved to 3 (step 104). In the non-intra mode, the encoded video data is further analyzed, and the reference field selection flag field corresponding to the odd field is
Extract d_sel (= 0 or 1) (step 1
05). If field_sel = 0, it indicates that the motion compensation is performed by referring to the odd field of the previous frame, and if field_sel = 1, it indicates that the even field is referenced. Subsequently, only the DC component of the DCT coefficient representing the prediction error (difference data) is extracted from the encoded video data (step 106). The absolute value of the DC component is compared with the threshold value TH1 (step 107), and only when it is smaller than the threshold value, sim (t, 0, field_se).
1 is added to l) (step 108). The procedure equivalent to the odd field (steps 105 to 108) is executed for the even field (steps 109 to 112). The processing of steps 103 to 112
The process is repeated until the final macroblock is reached (step 113), and the resulting sim (t, k, m) is used as the inter-field similarity (step 114). The characteristics of the inter-field similarity sim (t, k, m) will be described later.
【0026】なお、本実施形態例では差分データのDC
成分を抽出して(ステップ106)、その絶対値を閾値
処理する(ステップ107)ようにしたが、差分データ
のDCT計数の二乗和を閾値処理するようにしてもよ
い。また、ステップ106〜108を省いて、差分デー
タに対する処理を省略することもできる。In the present embodiment, the difference data DC
Although the component is extracted (step 106) and the absolute value thereof is thresholded (step 107), the sum of squares of the DCT count of the difference data may be thresholded. Further, it is also possible to omit steps 106 to 108 and omit the processing on the difference data.
【0027】(b)演算工程と比較工程
次に、フィールド間類似度sim(t,k,m)に対し
て次の演算を施して、Dframe(t−1),Dfield(t
−1)の二つの値を得る(ステップ115)。(B) Calculation step and comparison step Next, the following calculation is performed on the inter-field similarity sim (t, k, m) to obtain D frame (t-1) and D field (t).
Two values of -1) are obtained (step 115).
【0028】[0028]
【数1】 [Equation 1]
【0029】[0029]
【数2】 [Equation 2]
【0030】ただし、MBはフレームに含まれるマクロ
ブロックの数を表す。この式の意味については後述す
る。However, MB represents the number of macroblocks included in the frame. The meaning of this expression will be described later.
【0031】Dframe(t−1)とDfield(t−1)を
二つの閾値TH2,TH3と比較し(ステップ11
6)、いずれかが成り立てばフレーム(t−1)にカッ
トが存在すると判断する(ステップ117)。そうでな
ければ、カットが無かったと判定する(ステップ11
8)。次のフレームの処理に移る(ステップ119)。D frame (t-1) and D field (t-1) are compared with two thresholds TH2 and TH3 (step 11).
6) If either of them holds, it is judged that a cut exists in the frame (t-1) (step 117). Otherwise, it is determined that there was no cut (step 11).
8). The process moves to the next frame (step 119).
【0032】なお、演算工程で行う演算は式(1),
(2)に限られる訳ではない。例えば、The calculation performed in the calculation step is expressed by equation (1),
It is not limited to (2). For example,
【0033】[0033]
【数3】 [Equation 3]
【0034】[0034]
【数4】 [Equation 4]
【0035】としてもよいし、本実施形態例では2フレ
ーム分のフィールド間類似度を用いているが、より多く
のフレームから得られたフィールド間類似度を用いるよ
うにしてもよい。Although the inter-field similarity for two frames is used in this embodiment, the inter-field similarity obtained from more frames may be used.
【0036】(c)フィールド間類似度の持つ性質
フィールド間類似度sim(t,k,m)の持つ性質に
ついて図2を用いて説明する。図2は、連続する3フレ
ームをフィールドに分けて図示したものであり、その間
を結んだ線がフィールド間類似度に対応している。フレ
ームtに対して上述した手続きを実行すると四つのフィ
ールド間類似度sim(t,k,m)(k=0,1;m
=0,1)が得られる。sim(t,k,m)の下限は
0であり、上限はマクロブロック数MBである。“フレ
ームtの奇数フィールド”62と“フレーム(t−1)
の奇数フィールド”61の間のフィールド間類似度がs
im(t,0,0)であり、フィールド61と62の絵
柄が類似していれば大きな値をとる。なぜなら、フィー
ルド61の絵柄がフィールド62と類似していれば、動
き補償時にフィールド62からフィールド61が参照さ
れる回数が多くなり、ステップ108が実行される回数
が増えるからである。同様に、sim(t,0,1)は
フィールド62と63の間の、sim(t,1,0)は
フィールド61と64の間の、sim(t,1,1)は
フィールド63と64の間のフィールド間類似度を表
す。(C) Property of inter-field similarity degree The property of the inter-field similarity degree sim (t, k, m) will be described with reference to FIG. FIG. 2 shows continuous three frames divided into fields, and a line connecting the three frames corresponds to the inter-field similarity. When the procedure described above is executed for the frame t, the four inter-field similarities sim (t, k, m) (k = 0,1; m
= 0, 1) is obtained. The lower limit of sim (t, k, m) is 0, and the upper limit is the number of macroblocks MB. "Odd field of frame t" 62 and "frame (t-1)"
The field-to-field similarity between the odd fields "61
im (t, 0,0), and takes a large value if the patterns in the fields 61 and 62 are similar. This is because if the pattern of the field 61 is similar to that of the field 62, the number of times the field 62 is referred to by the field 62 during motion compensation increases, and the number of times step 108 is executed increases. Similarly, sim (t, 0,1) is between fields 62 and 63, sim (t, 1,0) is between fields 61 and 64, and sim (t, 1,1) is fields 63 and 64. Represents the similarity between fields.
【0037】カットが無い場合、すなわち図2のフィー
ルド61,62,63,64の絵柄がすべて類似してい
る場合にはsim(t,k,m)はすべて大きな値をと
る。カットがフレーム(t−2)とフレーム(t−1)
の間にある場合は、図3に実線で示したフィールド間類
似度は大きな値をもつが、点線で示したフィールド間類
似度は小さな値を持つ。フレーム(t−1)の奇数フィ
ールドと偶数フィールドの間にカットがある場合は、図
4のように、実線で示したフィールド間類似度が大きな
値を持ち、点線で示したフィールド間類似度が小さな値
を持つ。フレーム(t−1)の偶数フィールドでフラッ
シュ光が映り込んでいる場合を図5に示す。図4とは異
なるフィールド間類似度のパターンを持つ。従来技術で
は、フレーム間での絵柄の違いを評価する量である特徴
量(予測誤差の累計値等)を用いていたため、図4と図
5の状況を区別することができなかったが、本発明では
フレーム間でなくフィールド間類似度を算出するように
したので、図4と図5を区別できるようになる。When there is no cut, that is, when the patterns in the fields 61, 62, 63, 64 of FIG. 2 are all similar, sim (t, k, m) takes a large value. Cut is frame (t-2) and frame (t-1)
, The inter-field similarity indicated by the solid line in FIG. 3 has a large value, while the inter-field similarity indicated by the dotted line has a small value. When there is a cut between the odd field and the even field of frame (t-1), the inter-field similarity indicated by the solid line has a large value and the inter-field similarity indicated by the dotted line is large as shown in FIG. Has a small value. FIG. 5 shows the case where the flash light is reflected in the even field of the frame (t-1). It has a pattern of inter-field similarity different from that of FIG. In the conventional technique, since the feature amount (cumulative value of prediction errors, etc.), which is the amount for evaluating the difference in the pattern between the frames, is used, it is impossible to distinguish the situations of FIG. 4 and FIG. According to the invention, the similarity between fields is calculated instead of between frames, so that FIG. 4 and FIG. 5 can be distinguished.
【0038】(d)演算工程の役割
続いて、演算工程において計算される式(1)と式
(2)について説明する。式(1)は図3に示した状態
のカットを検出するためのものである。図3に示した状
況では、sim(t,k,m)/MBが1に近い値をと
り、sim(t−1,k,m)/MBが0に近い値をと
る。従って、式(1)によって計算されるDframe(t
−1)は1に近い値をとり、その他の状況(図4、図
5)では0に近い値をとる。ゆえに、ステップ116で
閾値TH2と比較することによって、図3に示した状況
のカットをその他と区別して検出できる。式(2)は、
図4に示した状況が生じている場合だけ、1に近い値を
取りその他の状況(図3、図5)では0に近い値をとる
ように設計されている。従ってステップ116で閾値T
H3と比較することで、図4の状況のカットを検出でき
る。図5の状況ではDframe(t−1)とDfield(t−
1)がともに、小さな値を持つのでフラッシュ光等のノ
イズをカットとして誤検出することがなくなる。(D) Role of Calculation Step Next, the equations (1) and (2) calculated in the calculation step will be described. Expression (1) is for detecting the cut in the state shown in FIG. In the situation shown in FIG. 3, sim (t, k, m) / MB has a value close to 1, and sim (t-1, k, m) / MB has a value close to 0. Therefore, D frame (t
-1) takes a value close to 1, and in other situations (FIGS. 4 and 5) takes a value close to 0. Therefore, by comparing with the threshold value TH2 in step 116, the cut of the situation shown in FIG. 3 can be detected separately from the others. Equation (2) is
It is designed to take a value close to 1 only when the situation shown in FIG. 4 occurs, and take a value close to 0 in other situations (FIGS. 3 and 5). Therefore, in step 116, the threshold T
By comparing with H3, the cut in the situation of FIG. 4 can be detected. In the situation of FIG. 5, D frame (t-1) and D field (t-
Since both 1) have a small value, noise such as flash light will not be erroneously detected as a cut.
【0039】〈実施形態例2〉図6に、本発明の請求項
4の発明に対応する、本発明の第2の実施形態例のフロ
ー図を示す。フィールド間類似度算出工程は実施形態例
1と同一であるので省略する。また、演算工程、比較工
程のうち第1の実施形態例と共通する部分は図1と同一
の番号を付して説明を省略する。<Embodiment 2> FIG. 6 shows a flow chart of a second embodiment of the present invention, which corresponds to the invention of claim 4 of the present invention. Since the inter-field similarity calculation step is the same as that of the first embodiment, it will be omitted. Further, of the calculation process and the comparison process, the same parts as those of the first embodiment are denoted by the same reference numerals as those in FIG.
【0040】本実施形態例では、ステップ118で、カ
ットなしと判定された場合に、次式で算出される値をD
flash(t−1)とする(ステップ1001)。In the present embodiment, the value calculated by the following equation is D when it is determined in step 118 that there is no cut.
Flash (t-1) is set (step 1001).
【0041】[0041]
【数5】 [Equation 5]
【0042】Dflash(t−1)が閾値TH4よりも大
きい場合(ステップ1002)、フレーム(t−1)に
一時的な画像変化が存在すると判定する(ステップ10
03)。この方法によれば、ニュースなどでフラッシュ
が炊かれたフレームを検出することができる。また、映
像の中にサブリミナル効果を狙って挿入された瞬間的な
(1フレームの)画像を検出する装置が得られる。If Dflash (t-1) is larger than the threshold TH4 (step 1002), it is determined that there is a temporary image change in frame (t-1) (step 10).
03). According to this method, it is possible to detect the frame in which the flash is cooked in news or the like. Further, it is possible to obtain a device that detects an instantaneous (one frame) image inserted for the subliminal effect in a video.
【0043】〈実施形態例3〉以下、本発明の請求項5
の発明に係るカット検出装置の実施形態例について、図
7のブロック図を用いて説明する。<Embodiment 3> Hereinafter, claim 5 of the present invention
An embodiment of the cut detection device according to the invention will be described with reference to the block diagram of FIG.
【0044】1101の信号分離手段は、入力される符
号化映像データから、(A)ノンイントラ/イントラモ
ード選択信号と、(B)差分信号と、(C)参照フィー
ルド選択信号を分離・抽出する。1102の比較手段は
差分信号(B)の絶対値和をとり、それが閾値TH1よ
り小さいときに1を出力する。その信号はスイッチ11
03に入力される。スイッチ1103は、ノンイントラ
/イントラモード選択信号(A)に従って切り替わり、
ノンイントラモードの時には比較手段1102からきた
信号がスイッチ1104に送られ、イントラモードの場
合には0(接地)がスイッチ1104に送られる。スイ
ッチ1104は参照フィールド選択信号(C)に従って
切り替わるようになっており、参照フィールド選択信号
が奇数フィールドを参照することを示していれば、11
05の計数手段に信号が入力され、偶数フィールドを参
照することを示していれば1106の計数手段に信号が
入力される。1105と1106の計数手段は、信号と
して1が入力された数を計数する。1フィールド分の計
数が終ると、1105と1106の計数手段から計数値
がフィールド間類似度としてそれぞれ出力される。図7
の点線で囲んだ部分1113が、請求項5の発明でいう
フィールド間類似度算出手段に対応する部分である。1
107のフィールド間類似度保持手段でNフィールド
分、すなわち2N個のフィールド間類似度が保持される
(最も古いフィールド間類似度が格納されている領域に
新たな値を上書きする)。1108の演算手段は、フィ
ールド間類似度保持手段から入力されるフィールド間類
似度に対して式(1)の演算を実行する。1110の演
算手段は、式(2)の演算を実行する。演算結果を11
09と1111の比較手段にそれぞれ入力し、閾値(T
H2とTH3)と比較し、閾値より大きな値を持ってい
る場合に比較手段1109,1111が信号を出力す
る。二つの信号のORをOR回路1112でとり、カッ
ト検出信号として出力する。The signal separating means 1101 separates and extracts (A) non-intra / intra mode selection signal, (B) difference signal, and (C) reference field selection signal from the input encoded video data. . The comparing means 1102 takes the sum of absolute values of the difference signal (B) and outputs 1 when it is smaller than the threshold value TH1. The signal is switch 11
It is input to 03. The switch 1103 switches according to the non-intra / intra mode selection signal (A),
In the non-intra mode, the signal from the comparing means 1102 is sent to the switch 1104, and in the intra mode, 0 (ground) is sent to the switch 1104. The switch 1104 is adapted to switch in accordance with the reference field selection signal (C), and if the reference field selection signal indicates that it refers to an odd field, then 11
A signal is input to the counting means 05, and a signal is input to the counting means 1106 if it indicates that the even field is referred to. The counting means 1105 and 1106 count the number of inputs of 1 as a signal. When the counting for one field is completed, the count values of 1105 and 1106 are output as the inter-field similarity, respectively. Figure 7
A portion 1113 surrounded by a dotted line is a portion corresponding to the inter-field similarity calculation means in the invention of claim 5. 1
The inter-field similarity holding means 107 holds N fields, that is, 2N inter-field similarities (overwrites a new value in the area in which the oldest inter-field similarity is stored). The calculation unit 1108 executes the calculation of Expression (1) on the inter-field similarity input from the inter-field similarity holding unit. The calculation unit 1110 executes the calculation of Expression (2). The calculation result is 11
09 and 1111 are respectively inputted to the comparing means, and the threshold value (T
H2 and TH3), and if they have a value larger than the threshold value, the comparison means 1109, 1111 outputs a signal. The OR circuit 1112 takes the OR of the two signals and outputs it as a cut detection signal.
【0045】図8を用いて、フィールド間類似度算出手
段のもう一つの実施形態例を説明する。1301のスイ
ッチは、イントラ/ノンイントラモード選択信号に従っ
て切り替わり、イントラモードの時0を、ノンイントラ
モードのとき1を出力する。1302のスイッチは参照
フィールド選択信号に従って切り替わり、参照フィール
ドが奇数フィールドである場合、1303の計数手段に
信号を送り、偶数フィールドである場合1304の計数
手段に信号を送る。1303,1304の計数手段は、
それぞれ、“奇数フィールド”を参照したマクロブロッ
クの数と、“偶数フィールド”を参照したマクロブロッ
クの数を計数している。1フィールド分の計数が終る
と、計数値がフィールド間類似度保持手段(1107)
にフィールド間類似度として出力される。Another embodiment of the inter-field similarity calculation means will be described with reference to FIG. The switch 1301 switches according to the intra / non-intra mode selection signal and outputs 0 in the intra mode and 1 in the non-intra mode. The switch 1302 switches according to the reference field selection signal, and sends a signal to the counting means 1303 when the reference field is an odd field and a signal to the counting means 1304 when the reference field is an even field. The counting means of 1303 and 1304 are
Each counts the number of macroblocks that referred to the “odd field” and the number of macroblocks that referred to the “even field”. When the counting for one field is completed, the count value holds the inter-field similarity holding means (1107).
Is output as the inter-field similarity.
【0046】図9を用いて、フィールド間類似度算出手
段のさらにもう一つの実施形態例を説明する。この構成
はMPEG2のフレーム構造に対応したものである。M
PEG2のフレーム構造の符号化映像データを順に見た
とき、フレーム内で奇数フィールドと偶数フィールドの
符号化データが交互に現れる。図9は、このような符号
化映像データを扱う場合に好適な構成である。現在処理
しているデータがどちらのフィールドを復号するための
ものかを、信号分離手段がフィールド選択信号として出
力するようにして、その信号を使ってスイッチ1104
の二つの出力に接続した1401と1402の二つのス
イッチを切り替える。このスイッチの各出力に接続した
四つの計数手段1403〜1406は、1フレーム分の
計数が終了する度に、計数値をフィールド間類似度とし
て出力する。新たに二つのスイッチ1401,1402
を設けたことにより、第1の実施形態例で示した四つの
フィールド間類似度(sim(t,k,m)(k=0,
1;m=0,1))が同時に得られる。Still another embodiment of the inter-field similarity calculation means will be described with reference to FIG. This structure corresponds to the frame structure of MPEG2. M
When the encoded video data having the frame structure of PEG2 is viewed in order, the encoded data of the odd field and the even field appear alternately in the frame. FIG. 9 shows a configuration suitable for handling such encoded video data. The signal separating means outputs a field selection signal indicating which field the data currently being processed is for decoding, and the switch 1104 is used by using the signal.
The two switches 1401 and 1402 connected to the two outputs are switched. The four counting units 1403 to 1406 connected to the respective outputs of this switch output the count value as the inter-field similarity degree each time the counting for one frame is completed. Two new switches 1401 and 1402
By providing the four inter-field similarities (sim (t, k, m) (k = 0,
1; m = 0, 1)) is obtained at the same time.
【0047】〈実施形態例4〉図10に、本発明の第4
の実施形態例のブロック図を示す。この装置は、汎用的
な計算機とソフトウェアでカット検出装置を実現するも
のである。このブロック図において、CPU1201が
全体的な制御を行い、バス1208を介してデータの送
受信が行われる。1202は符号化映像データを蓄積し
たハードディスクであり、1205のフィールド間類似
度保持手段は計算機内のメモリーとして実現される。ま
た、信号分離手段1203、フィールド間類似度算出手
段1204、演算手段1206、比較手段1207の各
手段は計算機メモリーに格納されCPU1201によっ
て実行されるプログラムとして実現される。各手段は第
1の実施形態例に示した対応する手続きを、計算機プロ
グラムとして実行する。<Embodiment 4> FIG. 10 shows a fourth embodiment of the present invention.
2 shows a block diagram of an example embodiment of FIG. This device realizes a cut detection device with a general-purpose computer and software. In this block diagram, a CPU 1201 performs overall control, and data transmission / reception is performed via a bus 1208. A hard disk 1202 stores encoded video data, and the inter-field similarity holding unit 1205 is realized as a memory in the computer. Further, each of the signal separating unit 1203, the inter-field similarity calculating unit 1204, the calculating unit 1206, and the comparing unit 1207 is realized as a program stored in a computer memory and executed by the CPU 1201. Each means executes the corresponding procedure shown in the first embodiment as a computer program.
【0048】なお、本発明は上記実施形態例に限定され
るものではない。符号化データからカットを検出する装
置および方法としてではなく、符号化装置、符号化装置
の一部として実現することも可能である。例えば、符号
化装置において動き予測時に得られる、差分信号、参照
フィールド選択信号、イントラ/ノンイントラ選択信号
等を上述したカット検出装置に入力するような構成も可
能である。その場合、上述した信号分離手段は不要とな
る。The present invention is not limited to the above embodiment. The present invention can be implemented not as an apparatus and method for detecting a cut from encoded data but as an encoding apparatus or a part of an encoding apparatus. For example, a configuration is possible in which a differential signal, a reference field selection signal, an intra / non-intra selection signal, and the like, which are obtained at the time of motion prediction in the encoding device, are input to the cut detection device described above. In that case, the above-mentioned signal separation means becomes unnecessary.
【0049】[0049]
【発明の効果】本発明の請求項1に記載の発明によれ
ば、フィールド予測方式を含む符号化方式によって符号
化された映像データから復号処理を経ることなく抽出で
きる参照フィールド選択情報に基づいて、フィールド間
類似度を算出し、複数のフィールドから算出されたフィ
ールド間類似度に対して所定の演算を施し、演算結果が
所定の値より大きい場合にカットが存在すると判定する
ようにしたので、時間のかかる復号処理が不要となり高
速なカット検出方法が得られる。また、フレーム間では
なくフィールド間の類似度に基づいてカットを検出する
ので、正確に(奇数フィールドと偶数フィールドの間に
あるカットを正しく検出することができ、フラッシュ光
をカットとして誤って検出しない)カットを検出できる
ようになる効果が得られる。According to the invention described in claim 1 of the present invention, based on the reference field selection information which can be extracted from the video data encoded by the encoding method including the field prediction method without performing the decoding process. Since the inter-field similarity is calculated, a predetermined operation is performed on the inter-field similarity calculated from a plurality of fields, and it is determined that a cut exists when the operation result is larger than a predetermined value, A time-consuming decoding process is unnecessary and a high-speed cut detection method can be obtained. Also, since the cuts are detected based on the similarity between the fields, not between the frames, the cuts between the odd field and the even field can be accurately detected, and the flash light is not detected as a cut by mistake. ) The effect that the cut can be detected is obtained.
【0050】本発明の請求項2に記載の発明によれば、
フィールド間類似度算出工程が、復号処理を経ないで得
られる差分データに処理の演算を施した後で、それを参
照フィールド別に累計した値をフィールド間類似度とす
るので、高速にカットできる効果が得られる。According to the invention of claim 2 of the present invention,
In the inter-field similarity calculation step, the difference data obtained without undergoing the decoding process is subjected to a processing operation, and then the value obtained by accumulating it for each reference field is taken as the inter-field similarity degree, so that it is possible to cut at high speed. Is obtained.
【0051】本発明の請求項3に記載の発明によれば、
演算工程が着目フィールドと過去のフィールドの間のフ
ィールド間類似度が小さいという第一の条件と着目フィ
ールドと未来のフィールドの間のフィールド間類似度が
大きいという第二の条件とを共に満たすときだけ大きな
値を出力するように演算工程を設計したので、符号化イ
ンタレース映像に対しても正しくカットを検出できるよ
うになる効果が得られる。According to the invention of claim 3 of the present invention,
Only when the calculation process satisfies both the first condition that the inter-field similarity between the field of interest and the past field is small and the second condition that the inter-field similarity between the field of interest and the future field is large Since the calculation process is designed to output a large value, it is possible to obtain the effect that the cut can be correctly detected even in the encoded interlaced video.
【0052】本発明の請求項4に記載の発明によれば、
演算工程が着目フィールドと過去および未来のフィール
ドの間のフィールド間類似度が共に小さいとき大きな値
を出力するように演算工程を設計したので、一時的画像
変化をカットと区別して検出できる効果が得られる。According to the invention of claim 4 of the present invention,
Since the calculation process is designed to output a large value when the field similarity between the field of interest and the past and future fields is small, the effect that the temporary image change can be detected separately from the cut is obtained. To be
【0053】本発明の請求項5に記載の発明によれば、
復号処理を行わないで符号化データから直接得られる参
照フィールド選択信号に基づいて、フィールド間類似度
を算出するようにしたので、復号化のためのハードウェ
アが必要なくなる。また、フレーム間ではなくフィール
ド間の類似度を用いてカットを検出するようにしたの
で、符号化インタレース映像に対しても正しくカットを
検出できる効果が得られる。According to the invention of claim 5 of the present invention,
Since the inter-field similarity is calculated based on the reference field selection signal directly obtained from the encoded data without performing the decoding process, hardware for decoding becomes unnecessary. Further, since the cuts are detected by using the similarity between the fields instead of between the frames, it is possible to obtain the effect that the cuts can be correctly detected even in the encoded interlaced video.
【図1】本発明の第1の実施形態例を説明するためのフ
ロー図FIG. 1 is a flowchart for explaining a first embodiment example of the present invention.
【図2】フィールド間類似度の説明図FIG. 2 is an explanatory diagram of inter-field similarity.
【図3】フィールド間類似度の説明図(フレームで切り
替わるカットの場合)FIG. 3 is an explanatory diagram of inter-field similarity (in the case of a cut that switches between frames).
【図4】フィールド間類似度の説明図(奇数フィールド
と偶数フィールドの間のカットの場合)FIG. 4 is an explanatory diagram of inter-field similarity (in the case of cutting between an odd field and an even field).
【図5】フィールド間類似度の説明図(フラッシュ光の
映り込みがある場合)FIG. 5 is an explanatory diagram of inter-field similarity (when flash light is reflected)
【図6】本発明の第2の実施形態例を説明するためのフ
ロー図FIG. 6 is a flowchart for explaining a second embodiment example of the present invention.
【図7】本発明の第3の実施形態例を説明するためのブ
ロック図FIG. 7 is a block diagram for explaining a third exemplary embodiment of the present invention.
【図8】フィールド間類似度算出手段の別の実施形態例
のブロック図FIG. 8 is a block diagram of another embodiment of inter-field similarity calculation means.
【図9】フィールド間類似度算出手段のさらに別の実施
形態例のブロック図FIG. 9 is a block diagram of yet another embodiment of inter-field similarity calculation means.
【図10】本発明の第4の実施形態例を説明するための
ブロック図FIG. 10 is a block diagram for explaining a fourth exemplary embodiment of the present invention.
【図11】従来技術の問題点を説明するための図(フレ
ームで切り替わるカットの場合)FIG. 11 is a diagram for explaining the problems of the conventional technology (in the case of a cut that switches between frames).
【図12】従来技術の問題点を説明するための図(奇数
フィールドと偶数フィールドの間のカットの場合)FIG. 12 is a diagram for explaining a problem of the conventional technique (in the case of cutting between an odd field and an even field).
【図13】従来技術の問題点を説明するための図(フラ
ッシュ光の映り込みがある場合)FIG. 13 is a diagram for explaining the problems of the prior art (when there is a glare of flash light).
【図14】MPEG2符号化方式の仕組みを説明するた
めの図FIG. 14 is a diagram for explaining the mechanism of the MPEG2 encoding system.
1101…信号分離手段 1102…比較手段 1103,1104…スイッチ 1105,1106…計数手段 1107…フィールド間類似度保持手段 1108,1110…演算手段 1109,1111…比較手段 1112…OR回路 1113…フィールド間類似度算出手段 1201…CPU 1202…磁気ディスク 1203…信号分離手段 1204…フィールド間類似度算出手段 1205…フィールド間類似度保持手段 1206…演算手段 1207…比較手段 1301,1302…スイッチ 1303,1304…計数手段 1401,1402…スイッチ 1403,1404,1405,1406…計数手段 1101 ... Signal separation means 1102 ... Comparison means 1103, 1104 ... Switch 1105, 1106 ... Counting means 1107 ... Inter-field similarity holding means 1108, 1110 ... Computing means 1109, 1111 ... Comparison means 1112 ... OR circuit 1113 ... Inter-field similarity calculation means 1201 ... CPU 1202 ... magnetic disk 1203 ... Signal separation means 1204 ... Inter-field similarity calculation means 1205 ... Inter-field similarity holding means 1206 ... Computing means 1207 ... Comparison means 1301, 1302 ... Switch 1303, 1304 ... Counting means 1401, 1402 ... switch 1403, 1404, 1405, 1406 ... Counting means
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−288840(JP,A) 特開 平6−22304(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04N 5/76 - 5/956 H04N 5/262 - 5/278 H04N 7/24 - 7/68 ─────────────────────────────────────────────────── ─── Continuation of the front page (56) Reference JP-A-7-288840 (JP, A) JP-A-6-22304 (JP, A) (58) Fields investigated (Int.Cl. 7 , DB name) H04N 5/76-5/956 H04N 5/262-5/278 H04N 7/24-7/68
Claims (5)
よって符号化された映像データからカットを検出する符
号化インタレース映像カット検出方法であって、 奇数フィールドか偶数フィールドのいずれかのフィール
ドを参照するかを選択する参照フィールド選択情報に基
づいて、フィールド毎に、フィールド間の類似度を算出
するフィールド間類似度算出工程と、 複数のフィールドから算出された前記フィールド間類似
度に対応して所定の演算を施す演算工程と、 前記演算の結果が所定の値より大きい場合にカットが存
在すると判定する比較工程と、 を具備することを特徴とする符号化インタレース映像カ
ット検出方法。1. A coded interlaced video cut detection method for detecting a cut from video data coded by a coding method including a field prediction method, which refers to either an odd field or an even field. Based on the reference field selection information for selecting whether or not the field-to-field similarity calculation step is performed for each field, and a predetermined value corresponding to the field-to-field similarity calculated from a plurality of fields. A coded interlaced video cut detection method comprising: a calculation step of performing a calculation; and a comparison step of determining that a cut is present when a result of the calculation is larger than a predetermined value.
像カット検出方法において、 フィールド間類似度算出工程が、差分データに所定の演
算を施した後で、それを参照フィールド別に累計した値
をフィールド間類似度とする、 ことを特徴とする符号化インタレース映像カット検出方
法。2. The coded interlaced video cut detection method according to claim 1, wherein the inter-field similarity calculation step performs a predetermined operation on the difference data, and then sums the accumulated values for each reference field. A method for detecting coded interlaced video cuts, characterized in that the degree of similarity is between fields.
インタレース映像カット検出方法において、 演算工程が、着目フィールドと過去のフィールドの間の
フィールド間類似度が小さいという第一の条件と、着目
フィールドと未来のフィールドの間のフィールド間類似
度が大きいという第二の条件とを共に満たすときだけ大
きな値を出力する演算を含む、 ことを特徴とする符号化インタレース映像カット検出方
法。3. The coded interlaced video cut detection method according to claim 1, wherein the calculation step has a first condition that the inter-field similarity between the field of interest and the past field is small. A coded interlaced video cut detection method characterized by including an operation of outputting a large value only when the second condition that the inter-field similarity between the field of interest and the future field is large is both satisfied.
に記載の符号化インタレース映像カット検出方法におい
て、 演算工程が、着目フィールドと過去および未来のフィー
ルドの間のフィールド間類似度が共に小さいとき大きな
値を出力する演算を含み、 比較工程が、該演算の結果が所定の値より大きい場合に
一時的画像変化が存在すると判定する、 ことを特徴とする符号化インタレース映像カット検出方
法。4. Claim 1 or claim 2 or claim 3.
In the coded interlaced video cut detection method described in, the calculation step includes a calculation that outputs a large value when the inter-field similarities between the field of interest and the past and future fields are both small, and the comparison step includes A coded interlaced video cut detection method, characterized in that it is determined that there is a temporary image change when the calculation result is larger than a predetermined value.
よって符号化された映像データからカットを検出する符
号化インタレース映像カット検出装置であって、 前記参照フィールド選択信号に基づいて、フィールド間
類似度を算出するフィールド間類似度算出手段と、 前記算出されたフィールド間類似度を複数フィールドに
渡って保持するフィールド間類似度保持手段と、 前記保持された複数のフィールド間類似度に対して所定
の演算を施す演算手段と、 前記演算の結果を所定の値と比較しカット有無の信号を
出力する比較手段と、 を具備することを特徴とする符号化インタレース映像カ
ット検出装置。5. A coded interlaced video cut detection device for detecting a cut from video data coded by a coding method including a field prediction method, the inter-field similarity based on the reference field selection signal. Inter-field similarity calculation means for calculating, the inter-field similarity retention means for retaining the calculated inter-field similarity across a plurality of fields, and a predetermined value for the retained inter-field similarity. An encoded interlaced video cut detection device comprising: a calculation unit that performs a calculation; and a comparison unit that compares the calculation result with a predetermined value and outputs a signal indicating whether or not there is a cut.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13733196A JP3377679B2 (en) | 1996-05-31 | 1996-05-31 | Coded interlaced video cut detection method and apparatus |
US08/841,200 US5911008A (en) | 1996-04-30 | 1997-04-29 | Scheme for detecting shot boundaries in compressed video data using inter-frame/inter-field prediction coding and intra-frame/intra-field coding |
MYPI97001873A MY118360A (en) | 1996-04-30 | 1997-04-29 | Scheme for detecting shot boundaries in compressed video data using inter-frame/inter field prediction coding and intra-frame/intra-field coding |
KR1019970016700A KR100274082B1 (en) | 1996-04-30 | 1997-04-30 | Inter frame/field prediction coding and shot boundary of compression video data using intra frame/field coding |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13733196A JP3377679B2 (en) | 1996-05-31 | 1996-05-31 | Coded interlaced video cut detection method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09322120A JPH09322120A (en) | 1997-12-12 |
JP3377679B2 true JP3377679B2 (en) | 2003-02-17 |
Family
ID=15196170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13733196A Expired - Lifetime JP3377679B2 (en) | 1996-04-30 | 1996-05-31 | Coded interlaced video cut detection method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3377679B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7031385B1 (en) | 1999-10-01 | 2006-04-18 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for detecting scene change of a compressed moving-picture, and program recording medium therefor |
-
1996
- 1996-05-31 JP JP13733196A patent/JP3377679B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH09322120A (en) | 1997-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5911008A (en) | Scheme for detecting shot boundaries in compressed video data using inter-frame/inter-field prediction coding and intra-frame/intra-field coding | |
JP3738939B2 (en) | Moving image cut point detection device | |
US7054367B2 (en) | Edge detection based on variable-length codes of block coded video | |
US7046731B2 (en) | Extracting key frames from a video sequence | |
KR100326993B1 (en) | Methods and apparatus for interlaced scan detection and field removal | |
US20060193387A1 (en) | Extracting key frames from a video sequence | |
US6404461B1 (en) | Method for detecting static areas in a sequence of video pictures | |
US20040170326A1 (en) | Image-processing method and image processor | |
US6823011B2 (en) | Unusual event detection using motion activity descriptors | |
JP4874167B2 (en) | Image processing apparatus and imaging apparatus equipped with the same | |
JPH10257436A (en) | Automatic hierarchical structuring method for moving image and browsing method using the same | |
EP0985318B1 (en) | System for extracting coding parameters from video data | |
US7995793B2 (en) | Occlusion detector for and method of detecting occlusion areas | |
KR101281850B1 (en) | Video descriptor generator | |
US8311269B2 (en) | Blocker image identification apparatus and method | |
KR100327649B1 (en) | Method and apparatus for interlaced detection | |
EP1480170A1 (en) | Method and apparatus for processing images | |
US20030058947A1 (en) | Scene cut detection in a video bitstream | |
JP3676670B2 (en) | Motion vector histogram processing for recognizing interlaced or progressive characters in pictures | |
JP3377679B2 (en) | Coded interlaced video cut detection method and apparatus | |
JP2003508941A (en) | Method and apparatus for encoding a sequence of frames containing video-type or film-type images | |
JP2006518960A (en) | Shot break detection | |
EP1983761A1 (en) | Moving-vector detecting device and moving-vector detecting method | |
JPH10112863A (en) | Method and device for extracting motion subject information | |
US20060158513A1 (en) | Recognizing film and video occurring in parallel in television fields |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071206 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081206 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091206 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101206 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101206 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111206 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111206 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121206 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121206 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131206 Year of fee payment: 11 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |