JP2000299816A - ビデオセグメンテーションシステム - Google Patents
ビデオセグメンテーションシステムInfo
- Publication number
- JP2000299816A JP2000299816A JP2000069801A JP2000069801A JP2000299816A JP 2000299816 A JP2000299816 A JP 2000299816A JP 2000069801 A JP2000069801 A JP 2000069801A JP 2000069801 A JP2000069801 A JP 2000069801A JP 2000299816 A JP2000299816 A JP 2000299816A
- Authority
- JP
- Japan
- Prior art keywords
- video
- frames
- frame
- dissolve
- fade
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/147—Scene change detection
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Studio Circuits (AREA)
Abstract
又はディゾルブをロバストに検出する。 【解決手段】 ビデオセグメンテーションシステムにお
いて、ビデオセグメントの一対の不連続カット間の少な
くとも2つのフレームのヒストグラムを決定するヒスト
グラムコンパレータ132と、該少なくとも2つのフレ
ーム間の分散を決定する分散値判定部134と、該少な
くとも2つのフレーム間の分散に基づく漸次変化を識別
するセグメント識別子136とによって、不連続カット
間の漸次変化を検出する。
Description
ンテーションに関する。特に、本発明は、フェード(フ
ェード・アウト又はフェード・イン)、及び/又はビデ
オシーケンスにおけるディゾルブ(フェード・アウトと
同時に発生するフェード・イン)をロバストに検出する
システムならびに方法のためのものである。
いる主な技術は、ヒストグラム比較、画素の明度比較、
動作に基づく比較、圧縮要素又は差分の比較、及び小部
分エッジ比較として要約することができる。
るか否かを検出するための最も簡単な方法は、これら2
個のフレームにおける対応する画素を比較することであ
る。対象画素と第2のフレームにおける空間的に対応す
る画素との差が閾値よりも大きいとされる画素の数によ
って、これら2個のフレーム間の距離(違い)の測定が
なされる。これらの方法の大きな欠点は、対象を移動さ
せることと、及びカメラの動作に対する敏感さである。
例えば、カメラパンニング又はフレームの小領域におけ
る大きな変化によって、誤った検出をもたらすことがあ
る。
の比較技術よりもうまく機能するように思われる。この
カテゴリーにおいて2つの基本的技術がある。一つは、
2つの連続するフレームのヒストグラムの差分が閾値を
超えると境界が宣言されるという、大域ヒストグラム比
較であり、もう一つは、フレームを最初にオーバーラッ
プしない領域に分割して、さらにそれぞれの個別の領域
のヒストグラムを決定する、という、局所ヒストグラム
比較である。しかしながら、これらの方法は、画面がま
ったく異なるように見える一方で同様な分布を有する場
合に、カットを見落とすことがある。
ームにおける動作に対する速度比、即ち、動作の変化
率、及び平均フレーム間相関係数に基づいている。動作
に基づく比較では、境界点は、フレーム間の相関が低く
且つ動作する速度の比率が高い点として定義される。
徴に基づく技術では、連続するフレーム間で入出するエ
ッジの割合が決定され、これは境界を検出するために使
用される。しかしながら、この技術では、連続するフレ
ームを位置合わせするために事前に動作を予測すること
が要求される。このセグメントの検出の成否は、動作予
測技術のロバスト性に左右される。
連続境界に対して適正な結果を付与する一方、これらの
方法は、ディゾルブ、ワイプ、フェード・イン、フェー
ド・アウト、及び連続カットによる境界を検出すること
においてロバストではない。
ンは、ディジタルビデオシーケンスの自動注釈に対する
第1のステップである。ビデオソースをセグメント化す
ることは、連続する2つのフレーム、Ik及びIk+1の関
数、S(Ik,Ik+1)を評価することによってビデオの
中断のない連続したセグメント間の境界、即ち、シーン
の変わり目を検出することを含む。ビデオシーケンス内
で、連続するフレームは、対象及び/又はカメラの動
作、照明変化、漸次(緩やかな)変化、例えば、連続カ
ット、又は急激な変化、例えば、カメラカット及び/又
は非連続カットにより、相違することもある。画面変化
検出方法はどれも、漸次変化及び急激変化に対し感知可
能である必要があるが、照明変化と同様に対象及びカメ
ラの動作を可能な限り無視する必要もある。これを実施
するための一つの方法は、画面変化の検出の前にフレー
ムデータ上で大きな空間的平均化を実行することであ
る。しかしながら、これによって急激変化と漸次変化を
同時に検出することは困難である。
上でカメラカットを検出し、高解像度画像上で漸次変化
を検出する2路式手順を用いる。カメラカット検出で
は、ヒストグラム比較技術をそのロバスト性のために使
用する。明度比較とフレーム構造技術を用いて予め検出
された不連続カット間のフレームを検査することによっ
て、漸次変化が検出される。
メントシステム10を示している。ビデオセグメントシ
ステム10は、不連続カット検出器20、漸次変化検出
器30、フレーム取得装置40、コントローラ50、I
/Oインターフェース55、データバス90、及びメモ
リ60を有する。ビデオセグメントシステム10はビデ
オデータソース70からビデオ信号を入力され、セグメ
ント化されたビデオデータ信号をセグメント化されたビ
デオデータシンク80へ出力する。セグメント化された
ビデオデータ信号はさらに出力されてもよい。
メラ、又はビデオセグメントシステム10にビデオ信号
を付与することができるその他のビデオ画像データソー
スでもよい。ビデオセグメントシステム10は、信号ラ
イン又はリンク71を介してビデオ画像データを付与す
るビデオ画像データソース70と接続され、さらに、ビ
デオセグメントシステム10によって出力されたセグメ
ント化ビデオを信号ライン又はリンク81を介して受信
するセグメント化ビデオデータ受信装置80と接続され
ている。一般に、ビデオ画像データソース70は、ビデ
オレコーダ、カムコーダ、ビデオカセットプレーヤ/レ
コーダ、ディジタルビデオディスクプレーヤ/レコー
ダ、又は、ケーブルテレビネットワークやインターネッ
ト、特にワールドワイド・ウェブ等のネットワークのク
ライアントやサーバー等、電子ビデオ画像データを格納
及び/又は転送するのに適切な装置、などの多数の異な
るソースのいずれかであればよい。
は、本発明のビデオセグメントシステム10にアナログ
又はディジタルビデオ画像データを付与することのでき
る、周知のソース又は後日開発されるソースでもよい。
同様に、セグメント化ビデオデータ受信装置80は、ビ
デオセグメント化システム10によって出力されたセグ
メント化ビデオデータを受信し、且つ該セグメント化ビ
デオデータを格納、転送、又は表示することができる周
知の装置、又は後日開発される装置でもよい。したがっ
て、セグメント化ビデオデータ受信装置は、表示又は格
納のためのセグメント化ビデオデータを転送するための
チャネルデバイス、及び、セグメント化ビデオデータを
表示又は、さらに転送する必要性が生じるまで、該セグ
メント化ビデオデータを無期限に格納するための記憶装
置、のいずれか、又はこれら両装置でもよい。
化システム10にビデオ画像データを転送するための、
又は、ビデオセグメント化システム10から物理的に離
れた、もしくは物理的に配列された記憶装置あるいは表
示装置へビデオ画像データを転送するための周知の構造
又は装置でもよい。したがって、リンク71及び81
は、ハードワイヤ(配線)リンク、ワイヤレスリンク、
公衆交換電話回線網、局所又は広域ネットワーク、イン
トラネット、インターネット、ワイヤレス伝送チャネ
ル、その他の分散ネットワーク等でもよい。同様に、記
憶装置はセグメント化ビデオデータを格納するための周
知構造の装置、例えば、RAM、ハードドライブ及びデ
ィスク、フロッピードライブ及びディスク、光ドライブ
及びディスク、フラッシュメモリ等であってもよい。
インタフェース55を介して入力されたビデオ画像デー
タを受信する。不連続カット検出器20は、コントロー
ラ50の指令によって、ヒストグラム比較技術を用いて
不連続カットを検出する。ヒストグラム比較技術は、
「記録済みビデオ処理技術」(Y.トノムラ他著、NT
Tレビュー、第5巻、82乃至60ページ、1993年
3月)("Stored Video Handling Techniques," Y.Tonom
ura, et al., NTT Review, vol.5, pp.82-60, March 19
93)に詳細に記載され、参照によりその全体が本明細書
に組み込まれる。しかしながら、本発明の方法ならびに
システムがこのヒストグラム技術に依存されないことを
認識しなければならない。周知の、又は後日開発される
技術を用いて入力ビデオ信号における不連続カットを決
定することができ、かかる技術が本発明の方法及びシス
テムと同程度に機能するであろうことは、いずれの当業
者によっても理解され得る。
の比較技術よりもうまく機能するように思われる。しか
しながら、ヒストグラム技術の欠点は、シーンが異なる
ように見える一方で、同様の分散を有する場合にカット
を見落とす可能性があるということである。
当な結果が付与されるとはいえ、該手順は、ディゾル
ブ、ワイプ、フェード・イン、及びフェード・アウトに
よる境界を検出する際にロバストではない。本発明のシ
ステムならびに方法は、不連続カット検出器20を漸次
変化検出器30と組み合わせて、連続カット及び不連続
カットの両者を同時に且つロバストに検出する。
フレーム取得装置40、コントローラ50、及びメモリ
60と協働して、不連続カットを検出する。
グメントは静止フレームと、漸次遷移、局所動作又は大
域動作、例えば、パン、ズーム等、の影響を受けたフレ
ームを含むこともある。これらの作用は漸次変化検出器
30によって容易に検出することができる。
ト、及びディゾルブは、いかなるビデオ処理においても
見ることのできる一般的な効果である。フェード・アウ
トでは、画像の明度は低下し、時間の経過によりゼロに
近づく。ブランクフレームとして始まるフェード・イン
では、画像は時間の経過により出現し始める。ディゾル
ブでは、1つの画像が消滅する一方で、別の画像が同時
に出現する。したがって、異なるビデオセグメント間の
円滑な遷移をもたらすために、これらの作用を操作する
ことができる。
に詳細に示している。漸次変化検出器30は、明度判定
部32、エッジカウンタ34、フェード検出器36、及
びディゾルブ検出器38から構成される。漸次変化検出
器30はデータバス90を介し、不連続カット検出器2
0によって検出された不連続カット間に生じるビデオセ
グメントを受信する。明度判定部32は不連続カットセ
グメント内の各フレームの明度を判定する。
るエッジ画素の数、即ち、エッジカウントを決定する。
フレーム内のエッジ情報は、フレームの構造に関する情
報を提供する。しかしながら、エッジカウント情報はロ
バストな緩やかに変化するシーンの変わり目の検出に対
して不十分である。
する明度値特性を識別しているフェード検出器36は、
フェードの最初と最後のフレームとして、一定の閾値エ
ッジ情報でフレームをラベル付けする。同様に、ディゾ
ルブ検出器38は、エッジカウント情報を使用すること
に加えて、エッジカウンタ34によって認識される最小
エッジカウントのあるフレームの両側においてエッジカ
ウント最大値を決定する。ディゾルブ検出器38はこの
ように、検出された最大値の間にあるすべてのフレーム
に対して2重色差(以下に詳述される)を決定する。大
域最小2重色差が一定の範囲内にあれば、セグメントは
ディゾルブと識別される。
性を識別することに基づいている。したがって、漸次変
化を検出するために、漸次遷移の間隔を抽出し且つ分類
する。フェードにおいて、第1のシーンは第2のシーン
が徐々に出現する前に徐々に消滅する。ディゾルブにお
いては、第1のシーンが徐々に消滅するのと同時に、第
2のシーンが徐々に出現する。このため、図3を参照す
ると、時間(t)における漸次変化内での明度は、E
(x、y、t)としてモデル化される。詳細には、x及
びyはフレーム内の画素を位置決めするための座標であ
り、tは画素が発生するフレームを示す。時間tが大き
くなるにつれて、フレーム番号も大きくなる。特に、時
間tにおけるフェードアウトに対する明度E(x、y、
t)は、以下の式としてモデル作成され得る。
ードインに対する明度E(x、y、t)は、以下の式と
してモデル作成され得る。
明度E(x、y、t)は、以下の式としてモデル作成さ
れ得る。
プ関数から得られるビデオ画像データ信号値であり、t
1及びt2は漸次変化の開始地点及び終了地点であり、I
(x,y,t)は時間(t)で発生するフレームにおけ
る空間位置(x,y)における画素の明度であり、B
(x,y)は、使用されるのであれば任意の背景画像の
空間位置(x,y)における画素の明度であり、O
(x,y,t)は時間(t)で発生するフレーム内での
空間位置(x,y)における黒色画素値を示すように、
すべてのxとyに対して、以下の式が設定される。 O(x,y,t1)=O(x,y,t2)=0 ・・・(4)
ドアウトに対する減少ランプ関数であってもよく、α
(t1)=1及びα(t2)=0である。フェード・イン
及びディゾルブに対するランプ関数は、漸次変化内のフ
レームの時間的位置に基づいてビデオ画像データ信号の
明度の重みづけに対応するランプ関数と同様である。例
えば、フェード・インに対する信号明度レベルはフェー
ド・インの進行とともに最大値に向かうことになる。デ
ィゾルブについては、1つの画像がフェード・インし、
他の画像がフェード・アウトするαに対し、両者の重み
づけの組み合わせが使用される。
のフレームに共通の画像、例えば、ニュースプログラム
におけるステーションロゴ等の、漸次変化内におけるす
べてのフレームに存在するテキスト又はラベルである。
間的方向におけるぼけ関数であることを理解すべきであ
る。したがって、フレーム内のエッジ情報は該フレーム
の構造に関する情報を提供する。例えば、時間の関数と
してエッジカウントは漸次変化の際に局所最小値を有す
ることになる。しかしながら、図5に示されるように、
エッジカウントは漸次変化に関する限り、ズーム、パ
ン、又はワイプの際に同一のふるまいを示すこともあ
る。詳細には、図5においてフレーム番号が600乃至
650ではディゾルブが行なわれている。対照的に、フ
レーム番号が700乃至800ではズームが行なわれて
いる。明確に、これら2つの関数が生じると、エッジカ
ウントは同様となる。そこで、エッジ画素の数に加え
て、本発明のシステムと方法は、シーンの変わり目の検
出に対して、例えば、ディゾルブ及び/又はフェードの
ような漸次変化の発生の背後にある原理を利用する。
定数の、即ち、単一の明度値を有する、式(1)と
(2)に示されるような画像である。そのため、エッジ
画素の数は、これら開始画像又は最終画像においてゼロ
に近い数でなければならない。即ち、既存するエッジは
背景画像B(x,y)に帰すべきものにすぎない。さら
に、エッジ画素の数は、フェード・イン又はフェード・
アウトの特性に基づいて最小値から漸次的に増加しなけ
ればならない。
における画素の明度が判定される。したがって、フェー
ド・アウトの開始時に画素の明度は以下の式(5)によ
って表わすことができる。 I(x,y,t1)+B(x,y) ...(5)
が存在する画素位置を除いたすべての画素値がゼロであ
る黒色の画面が残存する。これら画素値は以下の式
(6)によって与えられる。 O(x,y,t2)+B(x,y) ...(6)
され得る。したがって、図6を参照すると、フェードを
検出するための方法は、(1)所与の一対の不連続カッ
ト、ki及びki+1のエッジ画素の数を決定し、(2)ノ
イズを除去又は低減するためにエッジ画素の画像を平滑
化し、(3)所与の閾値よりも小さな局所最小値を決定
し、(4)決定された局所最小値jの各々に対して、決
定した最小値の左右両側に第1の局所最大値を見出し、
(5)位置決めされた局所最大値に対応するフレームを
識別し、(6)識別されたフレームをiO及びiNとして
ラベル付けし、(7)iO及びiN間のエッジカウントの
変化を決定することを有する。
るための方法の一つの具体的な実施の形態を概略図示し
ている。制御はステップS100から開始する。ステッ
プS200では、不連続カットが決定される。さらに、
ステップS300では、不連続カット間のフレームのエ
ッジカウントが決定される。次に、ステップS400で
は、ノイズフィルターを不連続カット間のエッジ画素の
画像を平滑化するために適用する。制御はさらにステッ
プS500に続く。
される。次に、ステップS600では、現在の局所最小
値の左側にある第1の局所最大値が決定される。さら
に、ステップS700では、現在の局所最小値の右側に
ある第1の局所最大値が決定される。制御はさらにステ
ップS800に続く。
C’の変化が第1と第2のそれぞれの閾値の間にあるか
否かが判断される。エッジカウントEC’の変化が第1
と第2の各閾値の間にあると、制御はステップS900
に移行する。そうでない場合には、制御はステップS1
000へとジャンプする。ステップS900では、セグ
メントはフェード・アウトとして識別される。制御はさ
らにステップS1300へとジャンプする。
EC’の変化が第3と第4の閾値の間にあるか否かが判
断される。エッジカウントEC’の変化が第3と第4の
各閾値の間にないと、制御はステップS1200へとジ
ャンプする。そうでない場合には、制御はステップS1
100に進む。ステップS1100では、セグメントは
フェード・インとして識別される。制御はさらにステッ
プS1300へとジャンプする。
析して、該セグメントがディゾルブであるか否かを判断
する。さらに、ステップS1300では、すべての局所
最小値が解析されたか否かを判断する。すべての局所最
小値の解析が完了されていないと、制御はステップS6
00に戻る。そうでない場合、制御はステップS140
0に移行して、制御ルーチンは終了する。
が、t=i及びt=i+1におけるフレーム間のエッジ
カウントの変化であるとすれば、iO及びj間のすべて
のフレームに対する変化の和は以下の通りである。
はエッジカウントにおける変化であり、セグメント(i
0,j]はフェード・アウトを表わす。フレームi0から
(但し、フレームi0は含まれない)フレームj(但
し、フレームjは含む)までの中間フレーム、即ち、デ
ィゾルブの中間フレーム、の左側にあるすべてのフレー
ムに対しての合計が求められる。
れば、セグメント(iO,j]はフェード・アウトであ
る。中間フレームから最小値の右側にあるフレームiN
(但し、iNは含まれない)の右側までの合計は以下の
通りである。
ント[j,iN)はフェード・インを表わす。さらに、
フレームj(jを含む)からフレームiN(iNは含まれ
ない)までの中間フレームの右側にあるすべてのフレー
ムに対しての合計が求められる。合計が閾値α3及びα4
の間にあるとすれば、セグメント[j,iN)はフェード・
インである。
ゾルブ内の任意のフレームを補償するために、本発明の
方法とシステムは局所動作が小さいことを想定してい
る。しかしながら、同一の論証はズーム又はパンに対し
ては無効である。図8を参照すると、ディゾルブを検出
するために、中間フレーム内の画素、例えば、ikの、
ディゾルブのどこかにあるフレーム内の画素、例えば、
id、に対する比較を実行しなければならない。このた
め、図7を参照すると、ディゾルブに対してはI(x,
y,ik)となり、以下のように表わされる。
ブの開始、中間、終了を示し、Iは明度を示す。この事
実に基づき、さらに図9乃至図11を参照すると、ディ
ゾルブidの中間にはないフレームに対する2重色差
(DCD)は次の式で表わされる。
フレームidに対する2重色差のプロットを示してい
る。図9はズームが行なわれたシーケンスに対する2重
色差を示し、図10はパンが行なわれたシーケンスに対
する2重色差を示し、図11はディゾルブが行なわれた
シーケンスに対する2重色差を示している。
ルブを検出するための工程は、(1)所与の一対の不連
続カットki及びki+1間のエッジカウントを決定し、
(2)ノイズを除去又は低減するためにエッジ画素の画
像を平滑化し、(3)局所最小値、即ち、ディゾルブの
中間を指示する点、を見出し、(4)各々の局所最小値
jについて、最小値の左右両側にある第1の局所最大値
を見出し、これらフレームをiO及びiNとしてラベル付
けし、(5)iO及びiN間の各フレームについて2重色
差(DCD)を演算することから成る。
のフレーム番号は以下の通りである。
り、mDCDはフレーム番号、又は2重色差(DCD)の
大域最小値に対応するフレームの指標である。式(1
1)が満たされると、セグメント(iO、iN)はディゾ
ルブを表わす。そうでない場合、セグメント(iO、
iN)はディゾルブではなく、該セグメントはズーム、
パン、等の可能性がある。
ントをディゾルブとして識別するための方法の1つの具
体的な実施の形態をより詳細に示している。
テップS1210に続き、現在のラベルづけされたフレ
ームに対する2重色差が決定される。次に、ステップS
1220では、すべてのフレームに対する2重色差が決
定されたか否かが判断される。すべてのフレームに対し
て2重色差が決定されなかった場合、制御はステップS
1210に戻る。そうでない場合、制御はステップS1
230へ移行する。
最小値に対応するフレームの指標が、(j−n1,j+
n2)のエレメントであるか否かが判断される。2重色
差の大域最小値が(j−n1,j+n2)のエレメントで
ある場合、制御はステップS1240に移行する。そう
でない場合、制御はステップS1250にジャンプす
る。
ィゾルブとして識別される。制御はさらにステップS1
260へジャンプする。対照的に、ステップS1250
では、セグメントはズーム、パン、等として識別され
る。制御はさらにステップS1260へ移行して、ステ
ップS1300へと戻る。
以下の結果が判明する。具体的な記録済みニュースプロ
グラムの入力に対して、図13は各フレームごとの平均
明度ヒストグラムの差のプロットを示している。シーケ
ンスは、不連続カット、連続カット、及び大域カメラ動
作を含む。図14は、原画像を4個ずつ消去することに
より得られた低解像画像上で検出された不連続カットを
示している。詳細には、不連続カットはフレーム番号2
00及び340で確認することができる。図15は第1
と第2のそれぞれの検出された不連続カット間の領域に
あるフレームの各フレームごとのエッジカウントを示し
ている。図16は第1と第2のそれぞれの検出された不
連続ユニット間の領域に対する2重色差を示している。
グラフが図11の2重色差と類似しているので、セグメ
ントはディゾルブであると判断される。したがって、図
17は具体的なシーケンスのディゾルブの開始フレー
ム、終了フレーム、及び中間フレームとして検出された
フレームを示している。
と、2重色差の判断に基づいて漸次変化を検出する。こ
の基本概念は、漸次変化がほぼリアルタイムで検出可能
であるようにさらに改良され且つ最適化される。
ィジタルビデオシーケンスの自動注釈とストーリ・ボー
ディングのための第1の工程である。任意のロバストな
ビデオセグメンタもフレーム間の急激且つ漸次的遷移の
双方に対し敏感でなければならない。単純な差メトリッ
ク及び単一の閾値はこれらの変化を同時に検出するのに
十分ではない。図18は、急激な遷移(例えば、フレー
ム103)、ディゾルブ(例えば、フレーム60乃至7
0)、さらに大域動作(例えば、フレーム50までのフ
レーム)のあるビデオシーケンスのフレームの数に対し
てプロットされたフレーム差を示している。この場合、
単一の閾値によって、漸次変化の誤検出が多数生じる。
上記アプローチを変更して、エッジカウント等の局所画
像特徴よりもむしろ、画像における大域特徴、例えば、
すべての画素明度の平均値、あるいは、平均値と画素
(の明度)との差などの偏差、に依存することにより、
解析率が上昇し得る。詳細には、実験結果は、ビデオシ
ーケンスをこの最適化アプローチを用いて毎秒17個の
フレームの割合で処理可能であることを示している。
するために最適化される漸次変化検出器130の第2の
実施の形態を示している。最適化された漸次変化検出器
130は、ヒストグラムコンパレータ132、分散値決
定部134、及びセグメント識別子136から構成され
る。最適化漸次変化検出器130はデータバス90を介
して、不連続カット検出器20によって検出される不連
続カット間に発生するビデオセグメントを受信する。ヒ
ストグラムコンパレータ132は検出された不連続カッ
トによって定義されるビデオセグメント内のすべてのフ
レームのヒストグラムを生成する。分散決定部134は
さらに各フレーム間の分散の増減率を決定する。決定さ
れた分散の増減率と、ヒストグラム値に基づいて、セグ
メント識別子136は該セグメントをフェード又はディ
ゾルブとして識別する。
ィゾルブに対する明度E(x,y,t)は以下のように
モデル化される。
y,t1)=0、フェード・アウトの場合、I(x,
y,t2)=0、t1及びt2は、漸次変化の開始及び終
了の各点、α(t)は漸次変化内のフレームの時間的位
置に基づくビデオ画像データ信号値の明度関数、即ち、
ランプ関数であり、B(x,y)は、背景画像Bの
(x,y)での画素の明度値である。ランプ関数α
(t)に対する単純線形表示は、以下の式として表わさ
れる。 α(t)=(t−t2)/(t1−t2) ...(13) 漸次変化内の任意のフレームの分散、即ち、明度偏差、
に対する二次関数は、以下の通りである。 分散=(At−B)2+C ...(14) ここで、A、B、及びCは各々、t1及びt2と同様、I
(x,y,t1)、I(x,y,t2)、及びB(x,
y)の各関数である。
し、これは、画素の明度分布がほぼ均一である点、即
ち、フェード・インの開始、フェード・アウトの終了、
又はディゾルブの中間、に相当する、時間=B/Aでの
背景に対応する。図21は、フレーム64と83の間に
生じるディゾルブを含む具体的なビデオセグメントの分
散プロットである。
は局所最小値を分散プロットを用いて容易に検出するこ
とができる。しかしながら、図22に示されるように該
分散プロットは大域又は強変化局所動作の場合に同様の
ふるまいを示すこともある。例えば、図22では、フレ
ーム75乃至97の間にディゾルブがあり、フレーム1
00乃至130の間に強変化局所動作がある。
検出を取り除くために、分散の増減率が決定される。分
散曲線の増減率が予め定義された閾値よりも大きいと、
検出された領域の開始及び終了でのフレームのヒストグ
ラムが点検される。ヒストグラム間の差も予め定義され
た閾値よりも大きいと、該領域はディゾルブの効果を受
ける領域としてマークされる。
移の双方を同時に検出する具体的な方法を示している。
制御はステップS2000から開始する。ステップS2
100では、漸次変化内におけるすべてのフレームのヒ
ストグラムが決定される。次に、ステップS2200で
は、分散の増減率がこれらフレームについて決定され
る。さらに、ステップS2300では、分散の増減率が
少なくとも「K」個のフレームに対する所定の閾値より
も大きいか否かについて判断される。例えば、Kは作業
モデルでは、任意に7に設定される。7個のフレームは
偽急激変化を除去するのに十分であると認識されてい
る。しかしながら、精度を最大化するフレームの数は選
択可能であることは認識すべきである。分散の増減率が
閾値よりも小さいと、制御はステップS2700へジャ
ンプする。そうでない場合、制御はステップS2400
へと進む。
の開始及び終了におけるフレームについてヒストグラム
間の差が決定される。次に、ステップS2500では、
これら終了フレームのヒストグラム差が閾値よりも大き
いか否かが判断される。ヒストグラム差が閾値よりも大
きいと、制御はステップS2600に移行し、そうでな
い場合、制御はステップS2700へジャンプする。ス
テップS2600では、セグメントにはディゾルブが行
なわれるものとしてラベル付けされる。制御はさらにス
テップS2700へと進む。ステップS2700では、
制御シーケンスは終了する。
に検出するための方法の第2の具体的な実施の形態を示
している。制御はステップS3000から始まる。ステ
ップS3100では、各フレームの分散が決定される。
次に、ステップS3200では、分散の局所最小値が決
定される。さらに、ステップS3300では、局所最小
値における分散の変化率が決定される。制御はさらにス
テップS3400へと続く。
閾値よりも小さいか否かが判断される。変化率が第1の
閾値よりも小さいと、制御はステップS4000へとジ
ャンプし、そうでない場合、制御はステップS3500
へと進む。
局所最大値と、局所最小値後の局所最大値が決定され
る。次に、ステップS3600では、局所最大値でのヒ
ストグラムが決定される。さらに、ステップS3700
では、局所最大値ごとに決定されたヒストグラム間のヒ
ストグラム差が決定される。制御はさらにステップS3
800へと進む。
閾値よりも大きいか否かが判断される。差が第2の閾値
よりも大きくなければ、制御はステップS4000へジ
ャンプし、制御シーケンスは終了する。そうでない場
合、制御はステップS3900へと進む。ステップS3
900では、領域がディゾルブ/フェードを経験するも
のとして識別される。制御はさらにステップS4000
へと進み、制御シーケンスは終了する。
作、及びディゾルブのある具体的なビデオシーケンスか
ら検出されたディゾルブを示している。図26は、該方
法の動作を説明するための、同一シーケンスから検出さ
れたすべてのカットを示している。
に、特徴に基づくビデオセグメンテーションを実行する
ためのシステムならびに方法は好ましくは、プログラム
される汎用コンピュータにおいて実施される。しかしな
がら、この特徴に基づくビデオセグメンテーションを実
行するためのシステムならびに方法を、専用コンピュー
タ、プログラムされるマイクロプロセッサ又はマイクロ
コントローラ及び周辺集積回路素子、ASIC又はその
他の集積回路、ディジタル信号プロセッサ、離散素子回
路等のハード配線電子又は論理回路、PLD、PLA、
FPGA、PAL等のプログラマブル論理デバイス、等
において実施することもできる。一般に、図6、図1
2、図23、及び図24に示された各フローチャートを
実施可能な有限状態マシンを実行することのできる任意
のデバイスを使用してビデオセグメンテーションのため
のシステムを実施することができる。
で、フェード、及び/又はビデオシーケンスにおけるデ
ィゾルブをロバストに検出することが可能であるという
優れた効果を有する。
態の機能ブロック図である。
ブロック図である。
フである。
の具体例を示すグラフである。
イン又はフェード・アウトとしてセグメントを識別する
ための方法の一つの実施の形態の概要を図示する具体的
なフローチャートである。
示す図である。
る。
フである。
フである。
のグラフである。
ブを検出するための方法の一つの実施の形態の概要を示
す具体的なフローチャートである。
ラム差分の具体例としてのグラフである。
カットを示す具体例を示すグラフである。
の具体的なエッジカウントを示すグラフである。
に対する具体的な2重色差を示すグラフである。
間及び終了を示す図である。
ビデオシーケンスに対する具体的なフレーム差分プロッ
トを示すグラフである。
な実施の形態の機能ブロック図である。
グラフである。
る分散の具体的なプロットを示すグラフである。
ケンスに関する分散の具体的なプロットを示すグラフで
ある。
ブのリアルタイム検出のための方法の一つの実施の形態
の概要を示す第2の具体例としてのフローチャートであ
る。
ブのリアルタイム検出のための方法の一つの実施の形態
の概要を示す第2の具体例としてのフローチャートであ
る。
ディゾルブ及びカットを示す図である。
カットを示す図である。
Claims (1)
- 【請求項1】 不連続カット間の漸次変化を検出するビ
デオセグメンテーションシステムであって、 ビデオセグメントの一対の不連続カット間の少なくとも
2つのフレームのヒストグラムを決定するヒストグラム
コンパレータと、 該少なくとも2つのフレーム間の分散を決定する分散判
定部と、 該少なくとも2つのフレーム間の分散に基づく漸次変化
を識別するセグメント識別子と、 を有するビデオセグメンテーションシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US271869 | 1981-06-09 | ||
US09/271,869 US6493042B1 (en) | 1999-03-18 | 1999-03-18 | Feature based hierarchical video segmentation |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000299816A true JP2000299816A (ja) | 2000-10-24 |
Family
ID=23037432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000069801A Pending JP2000299816A (ja) | 1999-03-18 | 2000-03-14 | ビデオセグメンテーションシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US6493042B1 (ja) |
EP (1) | EP1039757A3 (ja) |
JP (1) | JP2000299816A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010507155A (ja) * | 2006-10-17 | 2010-03-04 | ミツビシ・エレクトリック・アールアンドディー・センター・ヨーロッパ・ビーヴィ | ビデオシーケンス内の漸進的遷移の検出 |
WO2013031325A1 (ja) * | 2011-08-29 | 2013-03-07 | Nttエレクトロニクス株式会社 | フェード種別判定装置 |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6555449B1 (en) | 1996-05-28 | 2003-04-29 | Trustees Of Columbia University In The City Of New York | Methods for producing uniform large-grained and grain boundary location manipulated polycrystalline thin film semiconductors using sequential lateral solidfication |
US6647535B1 (en) * | 1999-03-18 | 2003-11-11 | Xerox Corporation | Methods and systems for real-time storyboarding with a web page and graphical user interface for automatic video parsing and browsing |
US6830993B1 (en) | 2000-03-21 | 2004-12-14 | The Trustees Of Columbia University In The City Of New York | Surface planarization of thin silicon films during and after processing by the sequential lateral solidification method |
US6765599B2 (en) * | 2000-05-30 | 2004-07-20 | Sanyo Electric Co., Ltd. | Image signal transmission apparatus |
US7042525B1 (en) * | 2000-07-06 | 2006-05-09 | Matsushita Electric Industrial Co., Ltd. | Video indexing and image retrieval system |
JP4683253B2 (ja) * | 2000-07-14 | 2011-05-18 | ソニー株式会社 | Av信号処理装置および方法、プログラム、並びに記録媒体 |
US7115503B2 (en) | 2000-10-10 | 2006-10-03 | The Trustees Of Columbia University In The City Of New York | Method and apparatus for processing thin metal layers |
US20020126224A1 (en) * | 2000-12-28 | 2002-09-12 | Rainer Lienhart | System for detection of transition and special effects in video |
US6959044B1 (en) * | 2001-08-21 | 2005-10-25 | Cisco Systems Canada Co. | Dynamic GOP system and method for digital video encoding |
AU2002306116A1 (en) * | 2002-05-20 | 2003-12-02 | Konan Technology Inc. | Scene change detector algorithm in image sequence |
US6985623B2 (en) * | 2002-06-10 | 2006-01-10 | Pts Corporation | Scene change detection by segmentation analysis |
TWI360707B (en) | 2002-08-19 | 2012-03-21 | Univ Columbia | Process and system for laser crystallization proc |
JP2006512749A (ja) | 2002-08-19 | 2006-04-13 | ザ トラスティーズ オブ コロンビア ユニヴァーシティ イン ザ シティ オブ ニューヨーク | 種々の照射パターンを有するシングルショット半導体処理システム及び方法 |
WO2004075263A2 (en) | 2003-02-19 | 2004-09-02 | The Trustees Of Columbia University In The City Of New York | System and process for processing a plurality of semiconductor thin films which are crystallized using sequential lateral solidification techniques |
US7164152B2 (en) | 2003-09-16 | 2007-01-16 | The Trustees Of Columbia University In The City Of New York | Laser-irradiated thin films having variable thickness |
TWI359441B (en) | 2003-09-16 | 2012-03-01 | Univ Columbia | Processes and systems for laser crystallization pr |
WO2005029546A2 (en) | 2003-09-16 | 2005-03-31 | The Trustees Of Columbia University In The City Of New York | Method and system for providing a continuous motion sequential lateral solidification for reducing or eliminating artifacts, and a mask for facilitating such artifact reduction/elimination |
TWI366859B (en) | 2003-09-16 | 2012-06-21 | Univ Columbia | System and method of enhancing the width of polycrystalline grains produced via sequential lateral solidification using a modified mask pattern |
US7318866B2 (en) | 2003-09-16 | 2008-01-15 | The Trustees Of Columbia University In The City Of New York | Systems and methods for inducing crystallization of thin films using multiple optical paths |
TWI351713B (en) | 2003-09-16 | 2011-11-01 | Univ Columbia | Method and system for providing a single-scan, con |
US7364952B2 (en) | 2003-09-16 | 2008-04-29 | The Trustees Of Columbia University In The City Of New York | Systems and methods for processing thin films |
US7311778B2 (en) | 2003-09-19 | 2007-12-25 | The Trustees Of Columbia University In The City Of New York | Single scan irradiation for crystallization of thin films |
US7843512B2 (en) * | 2004-03-31 | 2010-11-30 | Honeywell International Inc. | Identifying key video frames |
US7783106B2 (en) * | 2004-11-12 | 2010-08-24 | Fuji Xerox Co., Ltd. | Video segmentation combining similarity analysis and classification |
US7645337B2 (en) | 2004-11-18 | 2010-01-12 | The Trustees Of Columbia University In The City Of New York | Systems and methods for creating crystallographic-orientation controlled poly-silicon films |
US8221544B2 (en) | 2005-04-06 | 2012-07-17 | The Trustees Of Columbia University In The City Of New York | Line scan sequential lateral solidification of thin films |
KR20060116335A (ko) * | 2005-05-09 | 2006-11-15 | 삼성전자주식회사 | 이벤트를 이용한 동영상 요약 장치 및 방법과 그 장치를제어하는 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수있는 기록 매체 |
US7305128B2 (en) * | 2005-05-27 | 2007-12-04 | Mavs Lab, Inc. | Anchor person detection for television news segmentation based on audiovisual features |
US8316301B2 (en) * | 2005-08-04 | 2012-11-20 | Samsung Electronics Co., Ltd. | Apparatus, medium, and method segmenting video sequences based on topic |
FR2891686B1 (fr) * | 2005-10-03 | 2008-04-18 | Envivio France Entpr Uniperson | Procede et dispositif de detection de transitions dans une sequence video, procede et dispositif de codage, produits programme d'ordinateur et moyens de stockage correspondants. |
TW200733240A (en) | 2005-12-05 | 2007-09-01 | Univ Columbia | Systems and methods for processing a film, and thin films |
JP4377887B2 (ja) * | 2006-03-30 | 2009-12-02 | 株式会社東芝 | 映像分割装置 |
US7431797B2 (en) * | 2006-05-03 | 2008-10-07 | Applied Materials, Inc. | Plasma reactor with a dynamically adjustable plasma source power applicator |
US7720281B2 (en) * | 2006-07-31 | 2010-05-18 | Mavs Lab, Inc. | Visual characteristics-based news anchorperson segment detection method |
EP2147546B1 (en) * | 2007-05-08 | 2010-09-29 | Koninklijke Philips Electronics N.V. | Detecting a transition between video segments |
US8614471B2 (en) | 2007-09-21 | 2013-12-24 | The Trustees Of Columbia University In The City Of New York | Collections of laterally crystallized semiconductor islands for use in thin film transistors |
KR20100074179A (ko) | 2007-09-25 | 2010-07-01 | 더 트러스티이스 오브 콜롬비아 유니버시티 인 더 시티 오브 뉴욕 | 측방향으로 결정화된 박막상에 제조된 박막 트랜지스터 장치에 높은 균일성을 생산하기 위한 방법 |
CN103354204A (zh) | 2007-11-21 | 2013-10-16 | 纽约市哥伦比亚大学理事会 | 用于制备外延纹理厚膜的系统和方法 |
US8012861B2 (en) | 2007-11-21 | 2011-09-06 | The Trustees Of Columbia University In The City Of New York | Systems and methods for preparing epitaxially textured polycrystalline films |
WO2009067688A1 (en) | 2007-11-21 | 2009-05-28 | The Trustees Of Columbia University In The City Of New York | Systems and methods for preparing epitaxially textured polycrystalline films |
US8569155B2 (en) | 2008-02-29 | 2013-10-29 | The Trustees Of Columbia University In The City Of New York | Flash lamp annealing crystallization for large area thin films |
KR20110094022A (ko) | 2008-11-14 | 2011-08-19 | 더 트러스티이스 오브 콜롬비아 유니버시티 인 더 시티 오브 뉴욕 | 박막 결정화를 위한 시스템 및 방법 |
JP4575501B2 (ja) * | 2009-02-26 | 2010-11-04 | 株式会社東芝 | 映像信号処理装置及びその制御方法及びテレビジョン信号受信装置 |
JP2011024017A (ja) * | 2009-07-16 | 2011-02-03 | Sony Corp | 動画抽出装置、プログラム、および動画抽出方法 |
US9672646B2 (en) * | 2009-08-28 | 2017-06-06 | Adobe Systems Incorporated | System and method for image editing using visual rewind operation |
US9646831B2 (en) | 2009-11-03 | 2017-05-09 | The Trustees Of Columbia University In The City Of New York | Advanced excimer laser annealing for thin films |
US9087696B2 (en) | 2009-11-03 | 2015-07-21 | The Trustees Of Columbia University In The City Of New York | Systems and methods for non-periodic pulse partial melt film processing |
US8440581B2 (en) | 2009-11-24 | 2013-05-14 | The Trustees Of Columbia University In The City Of New York | Systems and methods for non-periodic pulse sequential lateral solidification |
US8451384B2 (en) * | 2010-07-08 | 2013-05-28 | Spinella Ip Holdings, Inc. | System and method for shot change detection in a video sequence |
US9161088B2 (en) * | 2011-03-25 | 2015-10-13 | Telefonaktiebolaget L M Ericsson (Publ) | Method in a streaming client for handling video streaming data, streaming client, computer programs and computer program products |
US9253503B2 (en) * | 2012-12-18 | 2016-02-02 | Xerox Corporation | Computationally efficient motion estimation with learning capabilities for video compression in transportation and regularized environments |
KR102376700B1 (ko) * | 2015-08-12 | 2022-03-22 | 삼성전자주식회사 | 비디오 컨텐츠 생성 방법 및 그 장치 |
CN113160273A (zh) * | 2021-03-25 | 2021-07-23 | 常州工学院 | 一种基于多目标跟踪的监控视频智能分段方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2114052A1 (en) * | 1993-07-29 | 1995-01-30 | Monica Medina-Puri | Method of detecting scene cuts |
US5642294A (en) * | 1993-12-17 | 1997-06-24 | Nippon Telegraph And Telephone Corporation | Method and apparatus for video cut detection |
US5635982A (en) * | 1994-06-27 | 1997-06-03 | Zhang; Hong J. | System for automatic video segmentation and key frame extraction for video sequences having both sharp and gradual transitions |
US5835163A (en) * | 1995-12-21 | 1998-11-10 | Siemens Corporate Research, Inc. | Apparatus for detecting a cut in a video |
US5767922A (en) * | 1996-04-05 | 1998-06-16 | Cornell Research Foundation, Inc. | Apparatus and process for detecting scene breaks in a sequence of video frames |
US6061471A (en) * | 1996-06-07 | 2000-05-09 | Electronic Data Systems Corporation | Method and system for detecting uniform images in video signal |
US6195458B1 (en) * | 1997-07-29 | 2001-02-27 | Eastman Kodak Company | Method for content-based temporal segmentation of video |
US6072542A (en) * | 1997-11-25 | 2000-06-06 | Fuji Xerox Co., Ltd. | Automatic video segmentation using hidden markov model |
US5990980A (en) * | 1997-12-23 | 1999-11-23 | Sarnoff Corporation | Detection of transitions in video sequences |
-
1999
- 1999-03-18 US US09/271,869 patent/US6493042B1/en not_active Expired - Lifetime
-
2000
- 2000-03-13 EP EP00302010A patent/EP1039757A3/en not_active Ceased
- 2000-03-14 JP JP2000069801A patent/JP2000299816A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010507155A (ja) * | 2006-10-17 | 2010-03-04 | ミツビシ・エレクトリック・アールアンドディー・センター・ヨーロッパ・ビーヴィ | ビデオシーケンス内の漸進的遷移の検出 |
WO2013031325A1 (ja) * | 2011-08-29 | 2013-03-07 | Nttエレクトロニクス株式会社 | フェード種別判定装置 |
JP2013048377A (ja) * | 2011-08-29 | 2013-03-07 | Ntt Electornics Corp | フェード種別判定装置 |
US9307240B2 (en) | 2011-08-29 | 2016-04-05 | Ntt Electronics Corporation | Fade type determination device |
Also Published As
Publication number | Publication date |
---|---|
US6493042B1 (en) | 2002-12-10 |
EP1039757A3 (en) | 2001-04-11 |
EP1039757A2 (en) | 2000-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000299816A (ja) | ビデオセグメンテーションシステム | |
JP4981128B2 (ja) | 映像からのキーフレーム抽出 | |
Zabih et al. | A feature-based algorithm for detecting and classifying production effects | |
EP1132812B1 (en) | Method of detecting dissolve/fade in mpeg-compressed video environment | |
EP0729117B1 (en) | Method and apparatus for detecting a point of change in moving images | |
EP1974326B1 (en) | Video signal analysis | |
EP1914994A1 (en) | Detection of gradual transitions in video sequences | |
Yu et al. | Feature-based hierarchical video segmentation | |
JPH09130732A (ja) | シーンチェンジ検出方法および動画像編集装置 | |
US8947600B2 (en) | Methods, systems, and computer-readable media for detecting scene changes in a video | |
JPWO2018061976A1 (ja) | 画像処理装置 | |
JP7125843B2 (ja) | 障害検知システム | |
JP5520459B2 (ja) | 双方向映像フレーム検索システム及び方法 | |
KR20190026625A (ko) | 영상 표시 방법 및 컴퓨터 프로그램, 그 기록매체 | |
Fujiyoshi et al. | Layered detection for multiple overlapping objects | |
JPH0837621A (ja) | 場面カットの検出方法 | |
Toller et al. | Video segmentation using combined cues | |
Doulaverakis et al. | Adaptive methods for motion characterization and segmentation of MPEG compressed frame sequences | |
Uehara et al. | Video shooting navigation system by real-time useful shot discrimination based on video grammar | |
KR100468843B1 (ko) | 동영상 데이터에서 장면전환을 자동검출하는 방법 및 그장치 | |
JP3126961B2 (ja) | 動画像のカット画面グループ検出装置 | |
JP2003047004A (ja) | 映像特徴検出方法、映像特徴検出装置およびデータ記録媒体 | |
JP2001326903A (ja) | 録画判定装置および方法ならびにエッジ抽出装置 | |
CN114173064B (zh) | 一种多重曝光方法、装置及电子设备 | |
Koprinska et al. | Video segmentation of MPEG compressed data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080513 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080716 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080716 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080819 |