JP3656036B2

JP3656036B2 - Ｍｐｅｇ圧縮ビデオ環境でのディゾルブ／フェード検出方法

Info

Publication number: JP3656036B2
Application number: JP2001063035A
Authority: JP
Inventors: サン・バイ・ジュン; キョン・ロ・ユーン
Original assignee: エルジー電子株式会社
Priority date: 2000-03-07
Filing date: 2001-03-07
Publication date: 2005-06-02
Anticipated expiration: 2021-03-07
Also published as: JP2001285712A; KR20010087552A; EP1132812B1; EP1132812A1; DE60119012D1; US20010021267A1; US6940910B2; DE60119012T2

Description

【０００１】
【発明の属する技術分野】
本発明は、ＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法に係るもので、詳しくは、圧縮ビデオ環境での空間−時間上のマクロブロックタイプの分布を利用して、ディゾルブ／フェードを効率的に検出し得るＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法に関するものである。
【０００２】
【従来の技術】
一般に、使用者がテレビジョン及びビデオ媒体を通して、所望のビデオ（映画、ドラマ、ニュース、及びトキュメンタリーなどの動映像）を視聴するためには、所定の放映時間に合わせてプログラム全体を視聴しなければならない。
【０００３】
しかし、近来、ディジタル技術及びイメージ／ビデオの認識技術の発展に伴い、使用者は、所望のビデオ映像を所望時に所望内容のみをサーチし、かつブラウジングすることが可能となった。
【０００４】
このような非線形的なビデオブラウジング及びサーチのための核心技術としては、ショットセグメンテーション（Shot Segmentation）技法及びショットクラスタリング（Shot Clustering）技法がある。
【０００５】
その中で、現在、ショットセグメンテーション技法の研究が盛んに行われており、ショットクラスタリング技法の研究は開始されたばかりである。
【０００６】
ショットとは、妨害を起こすことなく、一つのカメラから得られたビデオフレームのシーケンスであって、これは、ビデオを分析、構成する最も基本となる単位である。
【０００７】
一般に、ビデオ映像は、複数のショットが連結されて構成され、ショットの連結方式に従って、多様な編集効果を得ることができる。
【０００８】
そのビデオ編集効果としては、急激なショット切換技法と、漸進的なショット切換技法とに大別される。
【０００９】
急激なショット切換技法は、現在の画面から他の画面に急に切り換える技法であって、ハードカットともいわれ、最も広く利用されている。
【００１０】
漸進的なショット切換技法は、現在の画面から他の画面に漸次切り換える技法であって、例えば、フェード（フェードイン、フェードアウト）、ディゾルブ、ワイプ（Wipe）及びその他の特殊効果などがある。フェード、ディゾルブ効果が最も広く利用されている。
【００１１】
前記漸進的な技法によりショット切換を行うために、多様な映像要素を利用するが、特に、ビデオ動映像のカラーヒストグラム（Color Histogram Method）による大域的なカラー分布（Global color distribution）や利用したショットセグメンテーションが効果的である。
【００１２】
しかし、カラーヒストグラムによる大域的なカラー分布を利用するショットセグメンテーション方法は、急激なショット切換を検出するときは検出性能が優秀であるが、漸進的なショット切換を検出するときには、検出性能が低い。
【００１３】
従って、漸進的なショット切換をより効果的に行うための方法として、次にような技術が案出されている。
【００１４】
先ず、（１）フレーム間のカラーヒストグラムの差に基づいたツイン比較方法があるが、このようなツイン比較方法によると、フレーム間の大域的カラーヒストグラム差のみに基づいてショット切換を検出するため、検出性能が低く、誤検出が多く、実施速度が遅いという問題点がある。
【００１５】
（２）フレームの大域的明るさ分布の分散値を利用したディゾルブ／フェード検出方法があるが、この方法は、フェード／ディゾルブ区間のＩフレームと、Ｐフレームの明るさの変化、明るさの変化の分布のグラフが放物線状として表れ、極大値と極小値との差が非常に大きく、ディゾルブ／フェードの編集効果が数〜数十フレームに亘って表れるという特性を利用している。しかし、このディゾルブ／フェード検出方法においては、ディゾルブ／フェードが検出される区間のみで明るさの変化の分布が現れるべきであるが、ディゾルブ／フェードが発生しない区間でも頻繁に現れ、ディゾルブ／フェードが発生している区間では前記フレームの明るさの分布が現れない場合が多いという問題点があった。
【００１６】
（３）イメージでのエッジ検出アルゴリズムによるエッジの分布、及び検出されたエッジの動映像的特性分析を利用したディゾルブ／フェードの検出方法がある。この方法は、イメージデータからエッジを検出する前処理段階と、動映像的特徴を利用して検出されたエッジを新たに現れるエッジと、消えてゆくエッジとに区分し、これを基本としてエッジ変化率を計算する段階と、前記新たに現れるエッジ、及び消えてゆくエッジの時空間的分布を利用して、各編集効果を区分する後処理段階と、を順次行うことで、ハードカット、ディゾルブ、フェード、ワイプの編集効果を区分して検出する。
【００１７】
【発明が解決しようとする課題】
然るに、このような従来のビデオシーケンスでの漸進的なショット切換検出方法は、殆どのイメージを実際にデコードしなければならないため、エッジ検出演算に長い時間がかかり、実施速度が極めて遅くなるという不都合な点があった。
【００１８】
そこで、本発明は、このような従来の問題点を鑑みてなされたもので、本発明の目的は、両方向フレーム間の予測を利用したビデオ圧縮ドメインにおいて、マクロタイプの時空間ドメイン上での分布変化を利用して、ディゾルブ／フェードが発生された区間を迅速、正確に検出し得るＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法を提供することである。
【００１９】
【課題を解決するための手段】
このような目的を達成するため、本発明に係るＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法においては、ビデオシーケンス内でディゾルブ／フェード編集効果が使用されたと推測される候補区間を検出する段階と、
前記検出されたディゾルブ／フェード候補区間での時空間的マクロブロックタイプの分布を利用して、該当区間でディゾルブ／フェード編集効果が使用されたか否かを判別する段階と、
前記候補区間の長さを特定限界値と比較して、該当区間が特定限界値より大きいと、該区間をディゾルブ／フェード区間と判断する段階と、
順次行うことを特徴とする。
【００２０】
【発明の実施の形態】
以下、本発明の実施の形態について図面を用いて説明する。
図１は、本発明の実施形態に係る非線形的ビデオブラウジングインタフェースのブロック図で、図示されたインタフェースを利用して主要部をサーチすることで、使用者は、ビデオ全体を視聴することなく、所望のビデオ内容のみを容易に視聴することができるため、ディジタルビデオブラウジング方法において有用である。
【００２１】
そして、前記ビデオブラウジングを行うための核心技術として、ショットセグメンテーション技法及びショットクラスタリング技法がある。
【００２２】
このようなショットセグメンテーション技法とショットクラスタリング技法との関係を図２を参照して説明すると次の通りである。
【００２３】
図２は、本発明に係るショットセグメンテーションとショットクラスタリングとの関係を示した構成図で、図示されたように、ビデオストリームは、論理的に構成されたシーンが連結されており、それぞれのシーンは、複数のショットの連結により構成されている。
【００２４】
そして、ショットセグメンテーションとは、ビデオストリームを各個別のショットにそれぞれ分割する技術である。また、ショットクラスタリングとは、各個別ショットを時間的／イメージ的／モーション的／オーディオ的な類似性に基づいて、似ているショット同士を区分する論理的なシーン単位のビデオ構造を構成する技術である。
【００２５】
又、ビデオ編集効果は、ビデオを構成する複数のショットの連結方式により区分され、例えば、急激な切換技法としてのハードカットや漸進的な切換技法などがある。
【００２６】
また、漸進的な切換技法としては、ディゾルブ、フェード、ワイプ及びその他の特殊効果などがある。
【００２７】
ビデオ編集時に漸進的に二つのショット又は各シーンを連結するためには、ディゾルブ及びフェードが最も広く利用されている。ディゾルブは、二つの場面がお互に重なって漸進的に一つの画面から他の画面に移す技法である。
【００２８】
両方向フレーム相互間の予測によるビデオ圧縮方法（ＭＰＥＧ）により圧縮されたビデオの時空間ドメインでのマクロブロックタイプの分布変化を利用したディゾルブ／フェードの検出方法に対し、図３〜図６を参照して説明すると、次のようである。
図３は、本発明に係るビデオシーケンスでのディゾルブによるショット切換の一例を示した構成図で、図示されたように、ビデオシーケンスが進行されるにつれ、二つの場面が相互に漸進的に重なり合って、一つの画面（１０８）から他の画面（１２４）に完全に切り替わる。
【００２９】
このように、ディゾルブ／フェードを利用して検出されるショット切換をビデオシーケンスから分析すると、次のような特性が現れる。
（１）ディゾルブ／フェードの開始画面と終了画面とのカラー分布が極めて異なる。
（２）一般に、ディゾルブ／フェードは、数フレーム以上持続される。
（３）ディゾルブ／フェードの最初の画面は、漸次ぼんやりとなり、次の画面が漸次鮮明になる。
（４）像がぼんやりとするピクセルと、鮮明なピクセルとは、空間的に広く分布されている。
【００３０】
このような特性を利用して、本発明では、圧縮ドメインで同時に両方向予測を行うＢフレーム内の複数のマクロブロックタイプの時空間上での分布及び変化特性を利用して、効率的なディゾルブ／フェード検出のためのアルゴリズムを実現することができる。
【００３１】
以下、前記アルゴリズムの実施過程を説明する。
先ず、ビデオシーケンスにおいて、ショット切換の検出を行ってディゾルブ／フェード技術が使用されたと推測される候補領域を検出する。このとき、その候補領域は、ディゾルブ／フェードが検出される場面の最初のフレームと最終のフレーム間のカラーヒストグラムの差が特定限界値より大きいときディゾルブ／フェードの発生区間と判断される。
【００３２】
以上の過程を数式に表すと、次の通りである。
HistDiff(f_b，f_e)＞τ_color ……………（１）
【００３３】
上記式（１）中、ｆ_bは、ディゾルブ／フェード場面の開始時点、ｆ_eは、ディゾルブ／フェード場面の終了時点、ＨｉｓｔＤｉｆｆ（ｆ_b，ｆ_e）は、ｆ_bとｆ_e間のカラーヒストグラム上での差であり、τ_colorは、カラーヒストグラムの差によるショット切換の発生を判断するための特定限界値である。
【００３４】
この候補領域の検出方法としては、ビデオフレームのカラーヒストグラムによりフレーム間の大域的カラー分布差を利用してショット切換を検出する方法、マクロブロックの時空間上の分布を利用して検出する方法、及びエッジの時空間上での分布及び変化形態の特性を利用する方法がある。
【００３５】
カラー分布差を利用する方法において、カラー分布比較の基準となるフレーム（ｆ_b，ｆ_e）の検出方法は、次のようである。
【００３６】
先ず、ステップを利用する方法として、基準フレームから時間的に一つのステップ間隔のフレームを選定してカラー分布を比較する方法がある。
【００３７】
および、Ｈ.xxx又はＭＰＥＧのようなビデオコーデックにおいて、より効率的なデコードを行うために、イントラコードブロックを使用してＩフレームを候補領域（［ｆ_b，ｆ_e］）として検出する方法がある。
【００３８】
その後、このように検出されたディゾルブ／フェード候補領域（［ｆ_b，ｆ_e］）内にハードカットが存在するか否かを判別するが、ハードカットの存在可否を判別することで、ディゾルブ／フェードの検出アルゴリズムの正確度を向上することができる。
【００３９】
ハードカットの検出方法としては、カラーヒストグラムに基づいた大域的カラー分布差を利用した二つのフレーム間のイメージ差を利用する方法、マクロブロックの時空間上での分布とその変化特性を利用する方法、動きベクトルの時空間上での特性、及びエッジ検出によるエッジの時空間上での分布及びその変化特性を利用する方法などがある。
【００４０】
検出結果、ハードカットが存在しないと判断されると、通常、ディゾルブ／フェード区間で特徴的に示される時空間上でのマクロブロックタイプの分布を基準にして、検出されたディゾルブ／フェード候補区間（［ｆ_b，ｆ_e］）でディゾルブ／フェード編集効果が使用されたか否かを判別する。
【００４１】
マクロブロックタイプの時空間上での分布調査は、フレーム間の両方向を予測するＢフレーム上で行われる。
【００４２】
その選択されたＢフレームは、候補区間（［ｆ_b，ｆ_e］）のアンカーフレームを基準にしてそのアンカーフレームにそれぞれ隣接したＢフレームである。
【００４３】
アンカーフレームは、フレーム間の予測／動き補償の基準となるフレームであって、Ｉフレーム又はＰフレームである。
【００４４】
以下、Ｂフレーム、Ｉフレーム及びＰフレームに対し、図４を参照して説明する。
図４は、本発明に係るＭＰＥＧビデオシーケンスでのＧＯＰ（Group of picture）構造を示した構成図で、特定のＭＰＥＧビデオシーケンスの何れか一つのＧＯＰを示したものである。図中、陰影を施されて表示されたフレームは、アンカーフレームと隣接したＢフレームを示し、それらＢフレームは、最小デコードドメインでディゾルブ／フェードを検出し得るように、隣接したフレームである。
【００４５】
アンカーフレームは、フレーム間の予測／動き補償の基準となるフレームであって、Ｂフレームは常時二つのアンカーフレームを有する。
【００４６】
本発明では、デコードするのを最小にするため、全てのＢフレームを検出してデコードせず、アンカーフレームのみを検出してデコードすることで、ディゾルブ／フェードを正確に検出し得るようになっている。
【００４７】
ディゾルブ／フェード区間のマクロブロックの時空間分布特性を満足する［ｆ_b，ｆ_e］内で変形されたディゾルブ／フェード候補領域（［ｆ_b」，ｆ_e」］）を求めるためには、アンカーフレームに隣接したＢフレームを１にセットし、そうでないＢフレームは、０にセットする。
【００４８】
従って、Ｂフレームは、ピクチャードメインまでデコードされず、マクロブロックタイプに接近できる水準までデコードされる。
【００４９】
且つ、アルゴリズムの実施速度を向上させるために、アンカーフレームに隣接したＢフレームのみを検出してデコードするとき、前記１にセットされたＢフレームの順方向の予測マクロブロックの個数と、逆方向の予測マクロブロックの個数との和は０でなく、順方向の予測比率と、逆方向の予測比率との中で大きい値が特定限界値よりも大きくなる。
【００５０】
以上の説明を数式に表すと、次の通りである。
Max(M_fwd／(M_fwd＋M_bwd)，M_bwd／(M_fwd＋M_bwd)）＞τ_r ……………（２）
（if M_fwd＋M_bwd≠0）
SpatDist(MinType(M_fwd，M_bwd))＞τ_s ……………（３）
（if M_fwd・M_bwd＝0）
MinType(M_x，M_Y)＝X (ifM_x＜M_Y)） ……………（４）
MinType(M_x，M_Y)＝Y (ifM_x＜M_Y)） ……………（５）
【００５１】
上記式中、Ｍ_fwdは、フレーム内での順方向の予測マクロブロックの個数、Ｍ_bwdは、フレーム内での逆方向の予測マクロブロックの個数、τ_rは、順方向／逆方向比率に対する限界値、Ｍ_fwd／（Ｍ_fwd＋Ｍ_bwd）は、順方向の予測比率、Ｍ_bwd／（Ｍ_fwd＋Ｍ_bwd）は、逆方向の予測比率、Ｘ、Ｙは、任意の個数、ＳｐａｔＤｉｓｔ（Ａ）は、Ａタイプのマクロブロックの空間分布度関数、τ_sは、マクロブロックの空間分布度の限界値である。
【００５２】
前記過程を行って得られた［ｆ_b，ｆ_e］において、アンカーフレームに隣接したＢフレーム中で１にセットされたラン（Ｒｕｎ）から最大の長さを有する候補領域（［ｆ_b」，ｆ_e」］）を検出する。
【００５３】
順方向の予測比率と、逆方向の予測比率との中で大きい値が特定の限界値よりも大きい場合（式２）は、前記ディゾルブ／フェード区間内でアンカーフレームに隣接したＢフレーム内で順方向又は逆方向の予測比率が極めて高く、このような現象は、ディゾルブ区間内で持続的に現れる。
【００５４】
また、Ｂフレームでは、通常、より近接したアンカーフレームから一層多いマクロブロックを予測するが、前記式は、ディゾルブ／フェード区間でマクロブロックの予測比率が一層高く、持続的に現れるという特性を利用したものである。
【００５５】
このような特性を図５のグラフに表した。
図５（Ａ）及び図５（Ｂ）は、本発明に係るＭＰＥＧビデオシーケンスでの順方向の予測比率を示したグラフで、ディゾルブ区間と非ディゾルブ区間での順方向の予測比率を示したものである。
【００５６】
前記式（３）は順方向の予測マクロブロックと逆方向の予測マクロブロックが空間ドメイン上で大域的に分散されていることを表している。すなわち、Ｂフレームでの順方向の予測マクロブロックの個数と、又は逆方向の予測マクロブロックの個数との中で何れか一つが０であるか、又は順方向の予測マクロブロックの個数と、逆方向の予測マクロブロックの個数とが全て０でなく、順方向の予測マクロブロックと、逆方向の予測マクロブロックとが空間ドメインで大域的に発生することを表している。
【００５７】
前記空間的分布関数は、イメージ内で特定のタイプのマクロブロックの空間的大域分布度を判断する方法であって、多様な方法がある。
一例として、Ａタイプのマクロブロックの空間分布度を測定する方法を次式のように表すことができる。
SpatDist(A）＝C_A／T_A ……………（６）
【００５８】
上記式中、Ｃ_Aは、タイプＡを基準とする連結要素の総個数、Ｔ_Aは、イメージ上のタイプＡのマクロブロックの総個数である。
【００５９】
上記式（６）に対し、図６を参照して説明すると、次のようである。
図６は、本発明に係るディゾルブ区間のアンカーフレームと隣接したＢフレームのマクロブロックタイプ別の分布を示したブロック図で、時空間軸のディゾルブ区間のアンカーフレームと隣接したＢフレーム内でのマクロブロックのタイプ別分布度を示したものである。
【００６０】
前記順方向の予測マクロブロックと、逆方向の予測マクロブロックとが空間ドメインで大域的に分散するように誘導する関数は、二つのタイプのマクロブロックがイメージ内で大域的に分散してることが分かる空間分布関数であって、前記二つのタイプのマクロブロックが大域的に分散されるほど、高い値を有する。
【００６１】
空間分布関数は、特定タイプのマクロブロックの連結要素の個数を、イメージ内での特定タイプのマクロブロック個数を入力として除算した値で決定する。
【００６２】
このようにディゾルブ／フェードが持続的に検出された区間の長さが最大のディゾルブ／フェード候補区間（［ｆ_b，ｆ_e］）の長さを特定限界値と比較して、限界値より大きい場合、該当区間（［ｆ_b，ｆ_e］又は（［ｆ_b _」，ｆ_e _」］））をディゾルブ／フェード区間と決定して、ディゾルブ／フェードを検出する。
【００６３】
このように、空間分布度を調べるときは、フレームでの順方向の予測マクロブロックの個数と、逆方向の予測マクロブロックの個数との中で小さい数を基準にして、マクロブロックのタイプを選定するが、必要に応じては、大きい数を基準にして空間分布度を調べることもできる。
【００６４】
以上の過程を経た後、マクロブロックタイプの時空間的分布を利用してディゾルブ／フェードを検出するアルゴリズムにおいては、検出された候補区間が実際にディゾルブ／フェードによるシーン変換区間であるかどうかを判断するために、時間的制約条件を適用する。
【００６５】
即ち、ディゾルブ／フェード区間において、マクロブロックタイプの時空間的特性が一定時間以上持続して示されると、該当区間をディゾルブ／フェードによるシーンの転換区間であると判断し、そうでないと、該当区間がディゾルブ／フェードによるシーンの転換区間でないと最終判断する。
このような内容を数式に表すと、次のようである。
［e_」−b_」］＝τ_t ……………（７）
上記式中、τ_tは、モデリング時間である。
【００６６】
前記過程で求められたディゾルブ／フェード候補区間で最初のシーンのカラー変化度が特定限界値より低い場合は、フェードインと判断し、最終のシーンのカラー変化度が特定限界値よりも低い場合は、フェードアウトと判断し、両方とも該当しない場合は、ディゾルブと判断する。
【００６７】
即ち、前記ディゾルブとフェードとを区別する過程を数式に表すと、次のようになる。
if ColorDist(f_start)< τ_d then Fade-In
else if ColorDist(f_end)< τ_d then Fade-Out
else dissolve
【００６８】
ＣｏｌｏｒＤｉｓｔ（ｆ₁）は、フレーム（ｆ₁）のイメージがある程度多様なカラーで構成されているかどうかを判断する尺度であって、特定基準にサンプリングされたピクセルのみに適用することができる。
【００６９】
τ_dは、フェードインと、フェードアウトとを判定するための限界値、ｆ_startは、ディゾルブ／フェードの開始時点、ｆ_endは、ディゾルブ／フェードの終了時点であり、ｆ_startは、ｆ_b又はｆ_b'を、ｆ_endは、ｆ_e又はｆ_e'を利用することができる。
【００７０】
前記数式においては、フェードインでは初期に単純なシーンから開始され、フェードアウトでは画面が漸次単純になる特性を利用した。
【００７１】
このように、本発明は、従来の技術により非圧縮ドメインでピクセル単位のプロセッシングを利用するか、カラーヒストグラムを利用するか、明るさ変化を利用してディゾルブフェードを検出していたアルゴリズムとは異なって、最小デコードドメインで両方向の予測／動きを補償するＢフレームでのマクロブロックタイプに対する時空間上の分布及びその変化の形態を利用するディゾルブ／フェード検出方法である。
【００７２】
【発明の効果】
以上説明したように、本発明に係るＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法においては、最小デコードドメインでプロセスが行われるため、実施速度が既存のアルゴリズムに比べて迅速で、速いカメラモーション又はオブジェクトの大きいモーション情報に対しても安定的である。
【００７３】
且つ、本発明は、ショットセグメンテーション分野で具現し難い漸進的シーン転換方法として広く利用されているフェード／ディゾルブ効果を迅速、正確に検出し得るアルゴリズムを具現したものである。即ち、基本的なショットセグメンテーションアルゴリズム上の基本特性を利用するため、既存のショットセグメンテーション及びショットクラスタリングアルゴリズムを利用する装置でも、基本入力として使用することができ、適用範囲が広いという効果がある。
【図面の簡単な説明】
【図１】本発明の実施形態に係る非線形的ビデオブラウジングインタフェースのブロック図である。
【図２】本発明に係るショットセグメンテーションとショットクラスタリングとの関係を示した構成図である。
【図３】本発明に係るＭＰＥＧビデオシーケンスでのディゾルブによるショット切換の一例を示した構成図である。
【図４】本発明に係るＭＰＥＧビデオシーケンスでのＧＯＰ構造を示した構成図である。
【図５】本発明に係るＭＰＥＧビデオシーケンスのディゾルブ／フェード区間と、そうでない区間とでの順方向の予測比率を示したグラフである。
【図６】本発明に係るディゾルブ区間でのアンカーフレームと隣接したＢフレームのマクロブロックタイプ別分布を示した構成図である。

Claims

ビデオシーケンス内でディゾルブ／フェード編集効果が使用されたと推測される候補区間を検出する段階と、
前記検出されたディゾルブ／フェード候補区間に対し、ディゾルブ／フェード区間で特徴的に発生する時空間上でのマクロブロックタイプの分布に基づいて、該当区間でディゾルブ／フェード編集効果が使用されたか否かを判別する段階と、
前記検出されたディゾルブ／フェード候補区間内での時空間的マクロブロックタイプの分布特性が持続的に現れる場合、該当区間の長さを特定限界値と比較してその限界値よりも大きいと、その区間をフェード／ディゾルブ区間と最終判断する段階と、
を順次行うとともに、前記マクロブロックタイプの時空間上の分布を利用して、該当区間でディゾルブ／フェード編集効果が使用されたか否かを判別する段階では、圧縮ドメインで同時に両方向予測を行うＢフレーム内でのマクロブロックタイプの時空間上の分布及び変化特性を利用することを特徴とするＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法。
前記候補区間を検出する段階で検出された候補区間内にハードカットが存在するか否かを判別して、ハードカットが存在しない場合のみ、その後の段階に進行することを特徴とする請求項１に記載のＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法。
前記候補区間は、前記ディゾルブ／フェードが検出されるシーンの最初のフレームと、最終のフレーム間のカラーヒストグラムの差が特定限界値より大きいと、ディゾルブ／フェードの候補区間であると判断することを特徴とする請求項１に記載のＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法。
前記ディゾルブ／フェードの候補区間を検出する段階では、カラーヒストグラムに基づいた大域的カラー分布の差を利用して、二つのフレーム間のイメージ差を利用する方法、マクロブロックの時空間上の分布を利用する方法、動きベクトルの時空間上の分布を利用する方法、及びエッジの時空間上の分布及び変化特性を利用する方法中の何れか一つを選択して行うことを特徴とする請求項１に記載のＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法。
前記ハードカットが存在するか否かを判別する方法は、カラーヒストグラムに基づいた大域的カラー分布の差を利用して、二つのフレーム間のイメージ差を利用する方法、マクロブロックの時空間上の分布を利用する方法、動きベクトルの時空間上の分布を利用する方法、及びエッジの時空間上の分布及び変化特性を利用する方法中の何れか一つを選択して行うことを特徴とする請求項２に記載のＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法。
前記Ｂフレームは、前記候補領域内のアンカーフレームを基準として、そのアンカーフレームに隣接したＢフレームとして選択されることを特徴とする請求項１に記載のＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法。
前記アンカーフレームは、フレーム間の予測／動き補償の基準となるＩフレーム又はＰフレームであることを特徴とする請求項６に記載のＭＰＥＧ圧縮ビデオ環境でのディゾルブ／フェード検出方法。