JP3333956B2 - カット点検出方法および装置 - Google Patents

カット点検出方法および装置

Info

Publication number
JP3333956B2
JP3333956B2 JP13861396A JP13861396A JP3333956B2 JP 3333956 B2 JP3333956 B2 JP 3333956B2 JP 13861396 A JP13861396 A JP 13861396A JP 13861396 A JP13861396 A JP 13861396A JP 3333956 B2 JP3333956 B2 JP 3333956B2
Authority
JP
Japan
Prior art keywords
block
cut point
prediction
change amount
motion prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP13861396A
Other languages
English (en)
Other versions
JPH09322172A (ja
Inventor
康巨 新倉
行信 谷口
洋 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP13861396A priority Critical patent/JP3333956B2/ja
Priority to US08/841,200 priority patent/US5911008A/en
Priority to MYPI97001873A priority patent/MY118360A/en
Priority to KR1019970016700A priority patent/KR100274082B1/ko
Publication of JPH09322172A publication Critical patent/JPH09322172A/ja
Application granted granted Critical
Publication of JP3333956B2 publication Critical patent/JP3333956B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、圧縮符号化映像デ
ータからカット点を検出する方法および装置に関する。
【0002】
【従来の技術】映像データはデータ量が膨大であり、そ
の内容を知るためには映像を時間順に全て見ていくしか
なかった。映像がある基準に基づいて分割されていれ
ば、映像を飛ばし見したり、内容を大雑把に把握するた
めに役立つ。
【0003】映像を時間順に見ていったとき、ショット
の切り替わった時点をカット点と呼ぶ。カット点前後で
は画像の内容が急激に変化するので、「時間順に隣り合
う画像間の差を計算し、差が大きいところをカット点と
みなす」という方法で、カット点を検出することができ
る。この方法の例として、例えば、連続する画像フレー
ムの位置(x,y)の輝度、色等の物理量が変化した画
素数から連続するフレームの変化を算出し、カット点を
検出する「動画のカット自動分割方法」(特開平5−3
7853)等があげられる。画像の内容が急激に変化す
る一般的なカット点を安定に検出し、フレーム単位のシ
ーンチェンジだけでなく、フラッシュ等のノイズを誤っ
てカット点として検出することを防ぐことが課題であっ
た。フラッシュが発生すると、2フレームに渡って高い
変化量が示される。その変化量の値はほとんど一致して
いる。そこで、連続する2フレームに渡って変化量が高
い値を示した場合は、フラッシュであると判定し、カッ
ト点として検出しない等の処理を行う「突出検出フィル
タを用いた映像カット点検出法」(大辻、外村、信学論
(D−II),J77−D−II,3,pp.519・52
8)等の方法が提案されている。しかしながら、これら
のカット点検出方法は、アナログ映像信号をデジタル化
した非圧縮映像データを対象としたものであった。
【0004】MPEG方式を始めとする圧縮符号化映像
からカット点を検出するために、データを一度復号して
非圧縮ディジタル映像を復元し、従来技術を用いてカッ
ト点を検出することは可能である。しかし、復号処理は
計算時間のかかる処理である。そこで、復号処理を行わ
ずに、MPEG映像からカット点を検出する「動画像管
理装置」(特開平4−207876)等が提案されてい
る。これは、Pピクチャ中のブロック内符号化ブロック
の個数を利用してカット点を検出する技術である。カッ
ト点が存在すると画面間予測が外れるので、ブロック内
符号化ブロックの個数が急増するという性質を利用して
いる。オリジナルの映像に含まれるカメラの動きや被写
体の動きは、予測時の類似領域の位置のずれである動き
ベクトルとして記録され、カメラや被写体の動きがあっ
ても予測が外れることは少ない。したがって、ブロック
内符号化ブロックを基に算出した変化量は、カメラの動
きや被写体の動きが反映しないため、カメラや被写体の
動きを誤ってカット点として検出することが少ない。
【0005】しかし、フラッシュがたかれた場合、フレ
ーム間予測を行っている符号化映像では、2フレームに
渡ってほぼ対応する位置に動き予測が外れ、ブロック内
符号化ブロックが出現し、その個数が急増するが、各フ
レームのそれぞれの個数は一致していない。個数が一致
していないので、フラッシュの影響を除去するため、従
来方法の突出検出フィルタを応用しても、有効ではな
く、フラッシュの影響を完全に除去することができな
い。これは、フラッシュがたかれたときに発生する物体
の影領域が関係している。
【0006】これを図8によって説明する。図8(1)
は原画像列を示している。2番目のフレームではフラッ
シュが被写体にたかれたために、被写体の明度は急激に
上昇するが、被写体による影の部分40も発生する。図
8(2)は図8(1)の原画像列上のブロック内符号化
ブロックを示している。被写体にフラッシュがたかれた
フレームでは、明度が急激に上昇した領域は、動き予測
が外れブロック内符号化ブロックとなるが、影の部分4
0は、フラッシュがたかれる以前と変化がないため、予
測が当たったブロック(フレーム間予測符号化ブロッ
ク)41となる。フラッシュがたかれたフレームの次の
フレーム(3番目のフレーム)では、全体の明度が元に
戻り急激に下がるため、フラッシュがたかれたフレーム
で予測が外れた領域のほとんどは再度予測が外れ、ブロ
ック内符号化ブロックとして符号化される。ブロック内
符号化ブロックが出現する位置は、フラッシュがたかれ
たフレームと次のフレーム上でほぼ一致しており、連続
するフレームの対応する位置にブロック内符号化ブロッ
クが出現している。しかし、被写体の影40となってい
た部分の周辺の領域は、影の領域とほぼ明度が変らない
ため、影領域からの予測が当たり、ブロック間予測符号
化ブロック42となる。すなわち、影領域の周辺領域
は、2フレームの対応する位置に異なる種類のブロック
が出現し、フラッシュがたかれたフレームの直後のフレ
ームにおけるブロック内符号化ブロックの個数は、フラ
ッシュがたかれたフレームよりも少なくなり、図8
(3)に示すように、被写体の影40となっていた部分
の周辺の領域がフラッシュによる誤差45として残る。
実際には、図8に示す例よりも画像の内容が複雑であ
り、多くの領域で影が発生する。ブロック内符号化ブロ
ックの個数を一致させ、ノイズを除去し、カット点を強
調する突出検出フィルタ等の従来方法が動作するように
する処理が必要となる。
【0007】
【発明が解決しようとする課題】上述した従来技術は、
フレームまたはフィールド間予測符号化が外れた領域を
変化量として算出する際に、フラッシュの影響を除去で
きずカット点として誤って検出してしまうという問題点
がある。
【0008】本発明の目的は、前記した従来技術の問題
点を解決し、圧縮符号化映像から復号化処理を行わず高
速に、かつ、フラッシュ光をカット点として誤検出せ
ず、カット点のみを正確に検出するカット点検出方法お
よび装置を提供することにある。
【0009】
【課題を解決するための手段】本発明のカット点検出方
法は、フレーム間またはフィールド間予測符号化方式を
含む圧縮符号化方式によって圧縮された画像データ列か
ら変化量DP t を算出し、その変化量DP t を基にカット点を
検出するカット点検出方法であって、フレーム間または
フィールド間順方向予測符号化方式で圧縮された画像
ータ列Pt に含まれる符号化情報を基に、フレーム間ま
たはフィールド間予測を行った際に動き予測が当たらな
かった領域において、動き予測が当たった領域との境界
から、動き予測の影響が及ぶ範囲に含まれるブロックを
動き予測が当たったブロックに変更し、動き予測が当た
らなかった領域を縮小する空間演算を施し、その結果得
られた縮小領域X t (i,j)に動き予測が当たらなか
ったブロックが存在するとき、隣接する前後のPピクチ
ャP t-1 (i,j)とP t+1 (i,j)の対応するブロッ
クが、両方とも動き予測が当たったブロックのときのみ
有効なブロック、他の場合は無効なブロックとし、有効
ブロック数の全画面に占める割合を画像列P t の変化量
DP t として算出するPピクチャ変化量算出段階と、
記Pピクチャ変化量算出段階によって算出された変化量
DPt所定の閾値を上回っているとき、カット点が存
在すると判定するカット点判定段階とを有する。本発明
の他のカット点検出方法は、フレーム間またはフィール
ド間予測符号化方式を含む圧縮符号化方式によって圧縮
された画像データ列から変化量DP t を算出し、その変化
DP t を基にカット点を検出するカット点検出方法であ
って、フレーム間またはフィールド間順方向予測符号化
方式で圧縮された画像データ列Pt に含まれる符号化情
報を基に、フレーム間またはフィールド間予測を行った
際に動き予測が当たらなかった領域において、動き予測
が当たった領域との境界から、動き予測の影響が及ぶ範
囲に含まれるブロックを動き予測が当たったブロックに
変更し、動き予測が当たらなかった領域を縮小する空間
演算を施し、その結果得られた縮小領域X t (i,j)
中の動き予測が当たらなかったブロックの個数NX
t と、隣接する前後のPピクチャP t-1 (i,j)とP
t+1 (i,j)中の動き予測が当たらなかったブロック
の個数の大きい方max{NP t-1 ,N t+1 }との差分
DN t =NX t −max{NP t-1 ,NP t+1 }が1フレー
ムの全ブロック数に占める割合を画像データ列P t の変
化量DP t として算出するPピクチャ変化量算出段階
と、前記Pピクチャ変化量算出段階によって算出された
変化量DPt所定の閾値を上回っているとき、カット
点が存在すると判定するカット点判定段階とを有する。
【0010】本発明は、フレーム間またはフィールド間
予測符号化方式で圧縮された画像データ列に含まれる符
号化情報から、動き予測の外れた領域に対し、動き予測
が当たった領域との境界から動き予測の影響が及ぶ範囲
に応じた幅だけ領域を縮小し、画像列の変化量を算出
し、変化量が閾値よりも大きい値を示すとき、カット点
が存在しているとしている。変化量を算出する際には、
フラッシュ等のノイズを相殺し、カット点のみを強調す
るような演算方法によって変化量を算出する手法が望ま
しい。
【0011】このように、従来の空間演算において悪影
響を及ぼしそうな領域を予め除去しておくことで、フラ
ッシュの影響を排除できる。
【0012】本発明の実施態様によれば、前記Pピクチ
ャ変化量算出段階は、入力された圧縮符号化画像データ
列を解析し、該圧縮符号化画像データ列に含まれる動き
ベクトルの値から、動き予測の影響が及ぶ範囲を推定す
る段階を含む。
【0013】
【0014】本発明のカット点検出装置は、フレーム間
またはフィールド間予測符号化方式を含む圧縮符号化方
式によって圧縮された画像データ列から変化量DP t を算
出し、その変化量DP t を基にカット点を検出するカット
点検出装置であって、フレーム間またはフィールド間順
方向予測符号化方式で圧縮された画像データ列Pt に含
まれる符号化情報を基に、フレーム間またはフィールド
間予測を行った際に動き予測が当たらなかった領域にお
いて、動き予測が当たった領域との境界から、動き予測
の影響が及ぶ範囲に含まれるブロックを動き予測が当た
ったブロックに変更し、動き予測が当たらなかった領域
縮小する空間演算を施し、その結果得られた縮小領域
t (i,j)に動き予測が当たらなかったブロックが
存在するとき、隣接する前後のPピクチャP t-1 (i,
j)とP t+1 (i,j)の対応するブロックが、両方と
も動き予測が当たったブロックのときのみ有効なブロッ
ク、他の場合は無効なブロックとし、有効ブロック数の
全画面に占める割合を画像データ列P t の変化量DP t
して算出するPピクチャ変化量算出部と、前記Pピクチ
ャ変化量算出部によって算出された変化量DPt所定
の閾値を上回っているとき、カット点が存在すると判定
するカット点判定部とを有する。本発明の他のカット点
検出装置は、フレーム間またはフィールド間予測符号化
方式を含む圧縮符号化方式によって圧縮された画像デー
タ列から変化量DP t を算出し、その変化量DP t を基に
カット点を検出するカット点検出装置であって、フレー
ム間またはフィールド間順方向予測符号化方式で圧縮さ
れた画像データ列P t に含まれる符号化情報を基に、フ
レーム間またはフィールド間予測を行った際に動き予測
が当たらなかった領域において、動き予測が当たった領
域との境界から、動き予測の影響が及ぶ範囲に含まれる
ブロックを動き予測が当たったブロックに変更し、動き
予測が当たらなかった領域を縮小する空間演算を施し、
その結果得られた縮小領域X t (i,j)中の動き予測
が当たらなかったブロックの個数NX t と、隣接する前
後のPピクチャP t-1 (i,j)とP t+1 (i,j)中の
動き予測が当たらなかったブロックの個数の大きい方m
ax{NP t-1 ,NP t+1 }との差分DN t =NX t −ma
x{NP t-1 ,NP t+1 }が1フレームの全 ブロック数に
占める割合を画像データ列P t の変化量DP t として算出
するPピクチャ変化量算出部と、 前記Pピクチャ変化量
算出部によって算出された変化量DP t が所定の閾値を
上回っているとき、カット点が存在すると判定するカッ
ト点判定部とを有する
【0015】
【発明の実施の形態】次に、本発明の実施形態を図面を
参照して詳しく説明する。
【0016】図1は本発明の一実施形態のカット点検出
方法の流れ図である。入力圧縮画像データ1からフレー
ム間順方向予測符号化画像列2を抽出する。フレーム間
順方向予測符号化画像列2をPピクチャ変化量算出段階
3に入力する。ここで、フレーム内符号化領域4に注目
し、空間演算段階5で、その境界部分を動き予測時の探
索範囲分だけ縮小し、縮小領域6を、Pピクチャ変化量
算出段階3に返す。Pピクチャ変化量算出段階3では縮
小領域6を基にPピクチャ変化量7を算出する。この時
点でフラッシュの影響は排除され、カット点のみ高い変
化量を示すようにする。そこで、これらの変化量の大小
を基にカット点が存在するかどうかの判定をカット点判
定段階8で行う。すなわち、順方向予測符号化画像列1
から一部の領域を縮小し、空間演算を行うことでフラッ
シュの影響を完全に除去し、フレーム間の変化量を算出
し、その変化量を評価することによってカット点を検出
している。
【0017】図2は本発明の一実施形態のカット点検出
装置の構成を示すブロック図である。このカット点検出
装置は、入力圧縮画像データ列1からカット点9を検出
する。本実施形態では、入力圧縮画像データ列1は、フ
レーム間またはフィールド間予測符号化方式によって圧
縮されたPピクチャで構成された画像データ列{P
t- 2 ,Pt-1 ,Pt ,Pt+1 ,Pt+2 }とする。Pピク
チャの構造および予測単位はフレーム構造、フレーム予
測とする。なお、入力圧縮画像データ列1は、ハードデ
ィスクやCD−ROM等の蓄積装置に保存されている画
像ファイルであったり、ネットワークに接続され、伝送
される画像ファイルであったりする。サイズ、サンプル
レートは任意であるが、フレーム間予測符号化方式を取
り入れてなければならない。例として、H.261やM
PEG1,MPEG2等の形式がある。これらの圧縮符
号化方式では、フレームまたはフィールド内符号化画
像、フレームまたはフィールド間順方向予測符号化画
像、フレームまたはフィールド間双方向予測符号化画像
が出現するが、その出現頻度は任意で構わない。その構
造および予測方法は、どの構造を有していても構わな
い。入力圧縮画像データ列1を符号化情報解析部10で
解析し、ピクチャデータ、先頭ピクチャからの通し番
号、ピクチャ種別、ブロック種別、各ブロックが動き予
測が当ったブロック(pブロック)であるか、動き予測
が外れたブロック(iブロック)であるか等を解析し、
数十フレームに渡ってデータをデータ列メモリ12にそ
れらの情報を併せて格納する。データ列メモリ12に
は、符号化データの全部ないし一部、画像の先頭ファイ
ルからのフレーム番号や、前処理によって得られる特徴
量等の補足情報以外に、外部の機器を用いて入手し、付
加される撮影時間、撮影場所等の外部情報や、利用者が
必要に応じて登録するユーザーデータである外部データ
11を必要に応じて登録してもよい。
【0018】データ列メモリ12から読み出された画像
列のうちPピクチャ列2(Pt )をPピクチャ変化量算
出部16に入力する。Pピクチャ変化量算出部16か
ら、ブロック内符号化領域に対し、空間演算部15に
て、ブロック内符号化領域とフレーム間符号化領域との
間の境界領域の一部を除去する。除去する際に、フレー
ム間符号化予測における影響範囲がどの程度の大きさな
のかを予め知っておく必要があるため、符号化情報を解
析し、動き予測が影響を及ぼす範囲を動きベクトル最大
値推定部13によって推定し、動きベクトルの最大値1
4を空間演算部15に入力し、空間演算部15で、動き
ベクトルの最大値14を参考にして縮小領域6を作成す
る。縮小領域6を基にPピクチャ変化量算出部16によ
ってPピクチャ変化量7を算出する。算出されたPピク
チャ変化量7を基にカット点判定部17によって、変化
量の大小を基にカット点9を検出する。
【0019】次に、動きベクトル最大値推定部13、空
間演算部15、Pピクチャ変化量算出部16について順
次説明する。
【0020】動きベクトル最大値推定部13では、符号
化情報に含まれる動きベクトルの最大値14を検出す
る。動き予測が影響を及ぼす範囲とは、動きベクトルの
最大値14と対応している。そこで、先頭の数フレーム
の符号化情報に含まれる動きベクトルから最大の値を示
すものを算出する。具体的な処理を図3のフローチャー
トに示す。Pピクチャ列2が入力される。フレームの先
頭から、処理を開始し、かつ動きベクトルの最大値Ma
xVx,MaxVyを初期化しておく(ステップ2
0)。ついでi,jを初期化し(ステップ21)、各P
ピクチャ毎にブロック(i,j)を調べていく。ステッ
プ22で、ブロック(i,j)が予測の当たったブロッ
ク(pブロック)であれば、ブロックに含まれる動きベ
クトルの水平成分Vx(i,j)のサイズが、これまで
の動きベクトルの水平成分の最大値MaxVxを上回る
かどうかを調べ(ステップ23)、上回る場合は置き換
える(ステップ24)。同様に、垂直成分Vy(i,
j)とこれまでの動きベクトルの垂直成分の最大値Ma
xVyとを比較し、上回る場合は置き換える(ステップ
25,26)。iとjの値をインクリメントし(ステッ
プ28)、全てのブロックについて比較処理を終了した
ら(ステップ27)、tの値をインクリメントして(ス
テップ30)、次のフレームについて処理を行い、先頭
からTフレームまでの全フレーム及び全ブロックについ
て処理を終えた時点(ステップ29)で最終的な出力1
4(MaxVx,MaxVy)を得る。
【0021】本実施形態では、Tフレームを先頭のPピ
クチャ15フレームと仮定しているが、映像によっては
長くしてもよいし、もっと短くしてもよい。全フレーム
についてこの処理を行うことが、MaxVx及びMax
Vyを算出する際に確実である。また、MaxVx及び
MaxVyの値があらかじめ判っている場合には、動き
ベクトル最大値推定部13の処理は不要となる。また、
水平成分、垂直成分に分解せず、単純にベクトルの大き
さだけを算出してもよい。
【0022】空間演算部15では、Pピクチャ列2にお
けるフレーム間予測が外れた領域に対して、動き予測が
当たった領域との境界部分の周辺部分を、動き予測の影
響が及ぶ範囲だけ縮小する。図4にその概念図を示す。
図4(1),(2)は、図8(1),(2)に示したも
のと全く同一のものである。図4(3)に示すように、
フラッシュによる被写体の影40から、予測符号化が影
響を及ぼす範囲分43だけ、動き予測の外れた領域(フ
レーム内予測符号化ブロック)を縮小する(縮小領域4
4)。そして隣接する前後のフレームとの間で演算を行
うと、図4(4)に示すように、フラッシュによるノイ
ズを除去でき、フラッシュの誤差を相殺できる。空間演
算部15の具体的な処理を図5に示す流れ図によって説
明する。ここで用いる変数は、MaxVx及びMaxV
yは図3で求めた動きベクトルの最大値の水平方向及び
垂直方向成分である。(i,j)はそれぞれブロックの
位置を示し、iは横方向のブロックの位置、jは縦方向
のブロックの位置を示す。なお、Xt(i,j)は、フレ
ーム番号tのPピクチャの空間演算部15によって予測
の当たらなかった領域の一部を縮小した画像である。
【0023】まず、i,jを初期化する(ステップ5
0)。ブロック(i,j)が動き予測が当ったブロック
(pブロック)かどうか判定する(ステップ51)。ブ
ロック(i,j)が動き予測が当ったブロック(pブロ
ック)である場合には、X(i,j)はpブロックであ
るとする(ステップ54)。ブロック(i,j)が動き
予測が当たらなかったブロック(iブロック)である場
合には、各iブロック周辺の動き予測が影響を及ぼす範
囲内(ステップ55、57)に、pブロックが存在する
かどうかを判定する(ステップ53)。pブロックが存
在するとき、対象としているiブロックは、領域の境界
部分でかつ動き予測が影響を及ぼす範囲内に存在するi
ブロックであり、縮小処理の対象となるiブロックであ
り、対象iブロック(i,j)に対応するX(i,j)
をpとする(ステップ54)。対象iブロックの周辺内
にpブロックが存在しなければ、対象iブロックは境界
領域に属していないと判断し、X(i,j)をiとする
(ステップ59)。以上の処理を全ブロックについて行
う(ステップ60〜63)。これによって、画像列のう
ち、予測の当たらなかった領域部分の境界部分から、動
きベクトルの最大値を基にした動き予測分だけ縮小させ
た縮小領域Xt(i,j)を得る。
【0024】Pピクチャ変化量算出部16では、Pピク
チャ列2から得られた縮小領域と、該領域に隣接する画
像列との間で、フラッシュ等の影響を排除し、カット点
のみを強調し、変化量を算出する演算を行って、フラッ
シュなどの影響を排除し、カット点のみを強調する処理
を行う。図6にその処理の概念図を示す。縮小領域71
に隣接するPピクチャ70,72との間でフラグ73に
よりノイズを除去する処理を行う。これらの処理の方法
は、いくつか考えられるが、本実施形態の第一の例で
は、縮小領域にiブロックが存在するとき、隣接する前
後のPピクチャの対応するブロックが、pブロックのと
きのみ有効なブロックとし、他の場合は無効なブロック
とする。これにより、図4(4)に示すような効果を得
ることができ、フラッシュの誤差を除去できる。一方、
カット点の場合は、カット点を含むフレームのほとんど
はiブロックとなり、カット点前後のフレームは類似し
ているため、動き予測が当たりpブロックのみとなり、
強調処理を行ってもカット点が除去されることはない。
フレーム内の有効ブロック数が全画面に占める割合を基
にPピクチャ変化量を算出する。具体的な処理を図7の
フローチャートを用いて説明する。縮小領域Xt とその
前後のPピクチャPt-1 ,Pt+1 を入力する。Xt の各
ブロックについて処理を行う。縮小領域上のブロックX
t(i,j)がiブロックであり(ステップ81)、か
つ、前後のPピクチャの対応する位置に存在するブロッ
クPt-1(i,j),Pt+1(i,j)が、双方ともpブロックであ
った場合(ステップ82)のみ、変数Cntの個数を増
加させる(ステップ83)。全てのブロックについて、
同様の計測処理を終了したら(ステップ83,84,8
5)、変数Cntの値が全体のブロック数に占める割合
を変化量として算出する(ステップ86)。
【0025】Pピクチャ変化量算出部16の第2の例で
は、縮小領域Xt(i,j)のiブロックの個数NXt
計測し、隣接する前後のPピクチャPt-1(i,j),P
t+1(i,j)中に含まれるiブロックの個数NPt-1 ,NP
t+1 を同様に計測する。縮小領域中のiブロックの個数
NXt と、前後のPピクチャ中のiブロックの個数の大
きい方max{NPt-1 ,NPt+1 }との差分DNt
以下の演算によって算出する。
【0026】 DNt =NXt −max{NPt-1 ,NPt+1 } 演算の結果得られる値DNt が1フレームの全ブロック
数に占める割合を変化量DPt として算出する。第1の
例では、対応する位置を基に変化量を算出したが、第2
の例では、位置とは無関係にiブロックの総数を比較
し、変化量を算出している。
【0027】上述の例では、縮小領域に対し、前後に隣
接するPピクチャ内のブロックを比較し、対応する位置
のブロックの情報から変化量を算出した。第2の例では
前後のPピクチャから選択し、差分演算を行いカット点
を検出した。こうした比較および演算を、過去のPピク
チャのみを対象として行ってもよいし、数フレームに渡
って積算していく等の処理を行ってもよい。
【0028】Pピクチャ変化量算出部16によって算出
された変化量DPt を基に、カット点判定部17によっ
て、変化量がある閾値を上回っている場合、カット点が
存在すると判定し、カット点を出力する。本実施形態で
は、閾値をあらかじめ与えられた一定の値としている
が、画像によって変化させても構わない。また、ユーザ
が与えるなどしてもよい。
【0029】なお、本実施形態で、入力される映像は、
フレーム間順方向予測符号化方式による画像列(Pピク
チャ列)のみであったが、MPEG方式においては、こ
れ以外に、フレーム間またはフィールド間双方向予測符
号化方式による画像(Bピクチャ)や、フレーム内また
はフィールド内符号化方式による画像(Iピクチャ)等
が出現する。本実施形態では、IピクチャやBピクチャ
は無視することにしている。Pピクチャ列の間にIピク
チャが出現する場合は、Iピクチャ以前のPピクチャと
以降のPピクチャとの間には関連性が存在しないとする
等の処理を行ってカット点を検出する。また、本実施形
態では、閾値はカット点検出装置によって自動的に与え
られているが、ユーザインタフェース部を付加し、任意
に閾値を変化させることも可能である。例えば、ユーザ
が圧縮符号化映像の内容をブラウジングしやすいように
カット点直後の画像を表示する機能と、ユーザインタフ
ェース部とを共に付加し、閾値を任意に設定させること
で、ユーザが圧縮符号化映像の内容を表示する画像の個
数を調節し、希望するシーンをアクセスしやすいように
本装置を応用したアプリケーションも考えられる。
【0030】
【発明の効果】以上説明したように本発明は、圧縮符号
化された画像データ列に対し、フレームまたはフィール
ド間順方向予測符号化画像に含まれている各種情報を用
いて、カット点を検出することにより、データを復号す
ることなく高速で、かつ、フラッシュ光等のノイズをカ
ット点と誤検出せずに正確にカット点を検出することが
可能である。
【図面の簡単な説明】
【図1】本発明の一実施形態のカット点検出方法を示す
フローチャートである。
【図2】本発明の一実施形態のカット点検出装置の構成
を示すブロック図である。
【図3】空間演算部15の処理を示すフローチャートで
ある。
【図4】空間演算部15の処理と効果を示す模式図であ
る。
【図5】空間演算部15の処理を示す流れ図である。
【図6】Pピクチャ変化量算出部16における強調処理
の概念図である。
【図7】Pピクチャ変化量算出部16の処理を示す流れ
図である。
【図8】フラッシュ時の影の影響を示す図である。
【符号の説明】
1 入力圧縮画像データ 2 フレーム間順方向予測符号化画像列 3 Pピクチャ変化量算出段階 4 フレーム内符号化領域 5 空間演算段階 6 縮小領域 7 Pピクチャ変化量 8 カット点判定段階 9 カット点 10 符号化情報解析部 11 外部データ 12 データ列メモリ 13 動きベクトル最大値推定部 14 動きベクトルの最大値 15 空間演算部 16 Pピクチャ変化量算出部 17 カット判定部 20〜30 ステップ 40 被写体の影 41 フレーム間予測符号化ブロック 42 フレーム間予測符号化ブロック 43 影響の及ぶ範囲 44 縮小領域 45 フラッシュによる誤差 50〜67 ステップ 70,72 Pピクチャ 71 縮小領域 73 フラグ 80〜86 ステップ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H04N 7/24 - 7/68 H04N 5/262 - 5/278

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 フレーム間またはフィールド間予測符号
    化方式を含む圧縮符号化方式によって圧縮された画像デ
    ータ列から変化量DP t を算出し、その変化量DP t を基にカ
    ット点を検出するカット点検出方法であって、 フレーム間またはフィールド間順方向予測符号化方式で
    圧縮された画像データ列Pt に含まれる符号化情報を基
    に、フレーム間またはフィールド間予測を行った際に動
    き予測が当たらなかった領域において、動き予測が当た
    った領域との境界から、動き予測の影響が及ぶ範囲に
    まれるブロックを動き予測が当たったブロックに変更
    し、動き予測が当たらなかった領域を縮小する空間演算
    を施し、その結果得られた縮小領域X t (i,j)に動
    き予測が当たらなかったブロックが存在するとき、隣接
    する前後のPピクチャP t-1 (i,j)とP t+1 (i,
    j)の対応するブロックが、両方とも動き予測が当たっ
    たブロックのときのみ有効なブロック、他の場合は無効
    なブロックとし、有効ブロック数の全画面に占める割合
    を画像データ列P t の変化量DP t として算出するPピク
    チャ変化量算出段階と、前記Pピクチャ変化量算出段階によって 算出された変化
    量DPt所定の閾値を上回っているとき、カット点が
    存在すると判定するカット点判定段階とを有するカット
    点検出方法。
  2. 【請求項2】 フレーム間またはフィールド間予測符号
    化方式を含む圧縮符号化方式によって圧縮された画像デ
    ータ列から変化量DP t を算出し、その変化量DP t を基にカ
    ット点を検出するカット点検出方法であって、 フレーム間またはフィールド間順方向予測符号化方式で
    圧縮された画像列P t に含まれる符号化情報を基に、フ
    レーム間またはフィールド間予測を行った際に動き予測
    が当たらなかった領域において、動き予測が当たった領
    域との境界から、動き予測の影響が及ぶ範囲に含まれる
    ブロックを動き予測が当たったブロックに変更し、動き
    予測が当たらなかった領域を縮小する空間演算を施し、
    その結果得られた縮小領域X t (i,j)中の動き予測
    が当たらなかったブロックの個数NX t と、隣接する前
    後のPピクチャP t-1 (i,j)とP t+1 (i,j)中の
    動き予測が当たらなかったブロックの個数の大きい方m
    ax{NP t-1 ,NP t+1 }との差分DN t =NX t −ma
    x{NP t-1 ,NP t+1 }が1フレームの全ブロック 数に
    占める割合を画像データ列P t の変化量DP t として算出
    するPピクチャ変化量算出段階と、 前記Pピクチャ変化量算出段階によって算出された変化
    量DP t が所定の閾値を上回っているとき、カット点が
    存在すると判定するカット点判定段階とを有するカット
    点検出方法。
  3. 【請求項3】 前記Pピクチャ変化量算出段階は、入力
    された圧縮符号化画像データ列を解析し、該圧縮符号化
    画像データ列に含まれる動きベクトルの値から、動き予
    測の影響が及ぶ範囲を推定する段階を含む、請求項1
    たは2に記載のカット点検出方法。
  4. 【請求項4】 フレーム間またはフィールド間予測符号
    化方式を含む圧縮符号化方式によって圧縮された画像デ
    ータ列から変化量DP t を算出し、その変化量DP t を基にカ
    ット点を検出するカット点検出装置であって、 フレーム間またはフィールド間順方向予測符号化方式で
    圧縮された画像データ列Pt に含まれる符号化情報を基
    に、フレーム間またはフィールド間予測を行った際に動
    き予測が当たらなかった領域において、動き予測が当た
    った領域との境界から、動き予測の影響が及ぶ範囲に
    まれるブロックを動き予測が当たったブロックに変更
    し、動き予測が当たらなかった領域を縮小する空間演算
    を施し、その結果得られた縮小領域X t (i,j)に動
    き予測が当たらなかったブロックが存在するとき、隣接
    する前後のPピクチャP t-1 (i,j)とP t+1 (i,
    j)の対応するブロックが、両方とも動き予測が当たっ
    たブロックのときのみ有効なブロック、他の場合は無効
    なブロックとし、有効ブロック数の全画面に占める割合
    を画像データ列P t の変化量DP t として算出するPピク
    チャ変化量算出部と、前記Pピクチャ変化量算出部によって 算出された変化量
    DPt所定の閾値を上回っているとき、カット点が存
    在すると判定するカット点判定部とを有するカット点検
    出装置。
  5. 【請求項5】 フレーム間またはフィールド間予測符号
    化方式を含む圧縮符号化方式によって圧縮された画像デ
    ータ列から変化量DP t を算出し、その変化量DP t を基
    にカット点を検出するカット点検出装置であって、 フレーム間またはフィールド間順方向予測符号化方式で
    圧縮された画像データ 列P t に含まれる符号化情報を基
    に、フレーム間またはフィールド間予測を行った際に動
    き予測が当たらなかった領域において、動き予測が当た
    った領域との境界から、動き予測の影響が及ぶ範囲に含
    まれるブロックを動き予測が当たったブロックに変更
    し、動き予測が当たらなかった領域を縮小する空間演算
    を施し、その結果得られた縮小領域X t (i,j)中の
    動き予測が当たらなかったブロックの個数NX t と、隣
    接する前後のPピクチャP t-1 (i,j)とP t+1 (i,
    j)中の動き予測が当たらなかったブロックの個数の大
    きい方max{NP t-1 ,NP t+1 }との差分DN t =N
    t −max{NP t-1 ,NP t+1 }が1フレームの全ブ
    ロック数に占める割合を画像データ列P t の変化量DP t
    として算出するPピクチャ変化量算出部と、 前記Pピクチャ変化量算出部によって算出された変化量
    DP t が所定の閾値を上回っているとき、カット点が存
    在すると判定するカット点判定部とを有するカット点検
    出装置。
  6. 【請求項6】 前記Pピクチャ変化量算出部は、入力さ
    れた圧縮符号化画像データ列を解析し、圧縮符号化画像
    データ列に含まれる動きベクトルの値から、動き予測の
    影響が及ぶ範囲を指定する、請求項4または5に記載の
    カット点検出装置
JP13861396A 1996-04-30 1996-05-31 カット点検出方法および装置 Expired - Lifetime JP3333956B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP13861396A JP3333956B2 (ja) 1996-05-31 1996-05-31 カット点検出方法および装置
US08/841,200 US5911008A (en) 1996-04-30 1997-04-29 Scheme for detecting shot boundaries in compressed video data using inter-frame/inter-field prediction coding and intra-frame/intra-field coding
MYPI97001873A MY118360A (en) 1996-04-30 1997-04-29 Scheme for detecting shot boundaries in compressed video data using inter-frame/inter field prediction coding and intra-frame/intra-field coding
KR1019970016700A KR100274082B1 (ko) 1996-04-30 1997-04-30 프레임간/필드간 예측 부호화와 프레임내/필드내 부호화를 사용하는 압축 비디오 데이터에서의 화면 경계 검출 구조

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13861396A JP3333956B2 (ja) 1996-05-31 1996-05-31 カット点検出方法および装置

Publications (2)

Publication Number Publication Date
JPH09322172A JPH09322172A (ja) 1997-12-12
JP3333956B2 true JP3333956B2 (ja) 2002-10-15

Family

ID=15226185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13861396A Expired - Lifetime JP3333956B2 (ja) 1996-04-30 1996-05-31 カット点検出方法および装置

Country Status (1)

Country Link
JP (1) JP3333956B2 (ja)

Also Published As

Publication number Publication date
JPH09322172A (ja) 1997-12-12

Similar Documents

Publication Publication Date Title
US5911008A (en) Scheme for detecting shot boundaries in compressed video data using inter-frame/inter-field prediction coding and intra-frame/intra-field coding
US7046731B2 (en) Extracting key frames from a video sequence
Meng et al. Scene change detection in an MPEG-compressed video sequence
KR100698106B1 (ko) 엠펙(mpeg)압축 비디오 환경에서 계층적 혼합형장면 변화 검출 방법
JP3719933B2 (ja) 階層的ディジタル動画要約及び閲覧方法、並びにその装置
KR100468967B1 (ko) 썸네일 영상 생성장치 및 방법
Patel et al. Compressed video processing for cut detection
US7469010B2 (en) Extracting key frames from a video sequence
US6940910B2 (en) Method of detecting dissolve/fade in MPEG-compressed video environment
JP3363039B2 (ja) 動画像内の移動物体検出装置
KR100865248B1 (ko) 비디오 신호에서의 자막 검출
Nakajima et al. Universal scene change detection on MPEG-coded data domain
US6823011B2 (en) Unusual event detection using motion activity descriptors
JP3714871B2 (ja) サンプリングされたディジタル動画シーケンス中の推移を検出する方法
Sugano et al. A fast scene change detection on MPEG coding parameter domain
Smeaton et al. An evaluation of alternative techniques for automatic detection of shot boundaries in digital video
JP2869398B2 (ja) カット点検出方法及び装置
JP3333956B2 (ja) カット点検出方法および装置
KR100286742B1 (ko) 압축된 뉴스 영상의 장면전환 및 기사 검출방법
JP2004112678A (ja) 映像検索装置
JPH10112863A (ja) 動き被写体情報抽出方法及び装置
JP3339544B2 (ja) ディゾルブ検出方法および装置
JP2003016454A (ja) 物体認識装置及び物体認識方法
JP4349542B2 (ja) 動画像内のテロップ領域検出装置
JPH10112864A (ja) カメラワーク算出方法及び装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070802

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080802

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080802

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090802

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090802

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100802

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100802

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110802

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120802

Year of fee payment: 10

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130802

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term