JP4173099B2 - シーンカットを検出する方法および装置 - Google Patents

シーンカットを検出する方法および装置 Download PDF

Info

Publication number
JP4173099B2
JP4173099B2 JP2003531629A JP2003531629A JP4173099B2 JP 4173099 B2 JP4173099 B2 JP 4173099B2 JP 2003531629 A JP2003531629 A JP 2003531629A JP 2003531629 A JP2003531629 A JP 2003531629A JP 4173099 B2 JP4173099 B2 JP 4173099B2
Authority
JP
Japan
Prior art keywords
frame
picture
frames
macroblocks
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003531629A
Other languages
English (en)
Other versions
JP2005505165A5 (ja
JP2005505165A (ja
Inventor
マテイーア ピーターソン,リチヤード
シヤーローム,エドモンド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2005505165A publication Critical patent/JP2005505165A/ja
Publication of JP2005505165A5 publication Critical patent/JP2005505165A5/ja
Application granted granted Critical
Publication of JP4173099B2 publication Critical patent/JP4173099B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Description

(関連出願の相互参照)
本出願は、2001年9月26日に出願された米国特許仮出願第60/324,890号の利益を主張する。
本発明は、MPEGタイプ・ビデオ、とりわけビデオ・ビットストリーム内でのシーンカット検出に関する。
MPEGベースのビデオ・シーケンスは、1秒未満から数分以上まで様々な長さのシ―ンに分割することができる。これらの分割、すなわちシーンカットを行うことにより、広範囲の付加価値機能が可能になる。例えば、各シーンからフレームを選択して、ビデオ・レコーディングの内容を要約したストーリーボード(storybord)を作成することができる。更に、ビデオ・エディタを用いれば、シーンを並べ直したり、1つのシーン内の各フレームに画像処理技術を適用したりするなど、シーンごとにビデオ・レコーディングを処理することができる。
MPEGビデオ・シーケンスには、イントラフレーム(Intra‐Frame:I)、インターフレーム(Inter‐Frame:P)、および双方向フレーム(Bi‐Directional Frame:B)という3種類のフレームが含まれている。Iフレームは、JPEGエンコードに似た方法で静止画像をエンコードする。Pフレームは、前のIまたはPフレームから予測される。Bフレームは、前のIまたはPフレームおよび次のIまたはPフレームの両方から予測される。これら3種類のフレームは、フレーム間の空間的な方向における冗長度を体系化する離散コサイン変換(Discrete Cosine Transform:DCT)によりエンコードされる。しかし、Iフレームについては、DCT情報は直接画像サンプルから導き出され、PおよびBフレームについては、DCT情報は予測後に残差から導き出される。
各フレームは、複数のマクロブロックに分割される。各マクロブロックには、Y1、Y2、Y3、Y4などの複数の輝度ブロックおよびYUVシステム内の1つのUおよび1つのVなど複数のクロミナンス・ブロックに関連する情報が含まれる。これらのブロックのそれぞれには、8x8ブロックなど複数のピクセル、すなわち画素が含まれる。
ビデオがMPEGに基づくようなビットストリームにエンコードされていると、ビットストリームを完全にデコードすることなくシーンカット検出を行うことができるため、ビデオ処理の速度が増加する。マクロブロック、エンコード・タイプ、モーション・ベクトル、DCT係数などの追加情報も、ビットストリームを完全にデコードせずにビットストリームから抽出することができる。
シーンカット検出の或る方法は、以下のようにして実行される。
1.Iフレームについては、DCT係数間の平均二乗差が判定される。
2.Pフレームについては、提案方法では、順方向予測マクロブロックの数が判定される。
3.Bフレームについては、順方向符号化マクロブロックの数と逆方向符号化マクロブロックの数のうちの小さい方が計数される。
4.これらの数とフレーム番号のグラフ内で最小値が判定される。
シーンカット検出の別の提案方法では、IフレームについてはDC係数から形成されたカラー・ヒストグラムの差が用いられ、動き補償のないマクロブロックの数と動き補償のあるマクロブロック数との比率についての情報と組み合わされる。この提案方法では、フレーム番号に対するグラフ内でピークが探索される。Bフレームについては、順方向予測と逆方向予測の比率が判定される。何れの場合も、ピークを識別するために、ローカル・アダプティブ・スレッシュホールド技術が利用される。
一方、更に別の方法では、動き補償付き離散コサイン(DC)係数から形成されるすべてのフレーム(I、P、およびB)のヒストグラムが利用される。
しかしながら、サブ・グループ・オブ・ピクチャ(Group of Picture:GOP)内の全予測の全体的な検査に基づくシーンカット検出については、現在は、知られたシステムまたは方法が存在しない。
(発明の概要)
本発明の原理に従って、シーンカットは、サブGOP内の全予測についての全体的な検査に基づいて検出される。最初に、複数の生じる可能性のあるシーンカットのそれぞれについて符号化マクロブロックの数が検出される。次に、複数の生じる可能性のあるシーンカットのそれぞれについて、予測マクロブロックの数が判定される。次に、生じる可能性のあるシーンカットに対応する複数のフレームのそれぞれについて、符号化マクロブロックの数と予測マクロブロックの数の比率が判定される。そして、所定の比率を有するフレームが選択される。この比率は、閾値と比較される。この比率が、閾値を満足すると判別された場合、シーンカットが検出される。
特許請求の範囲と実施例との対応関係を実施例で使われている参照番号を用いて示すと以下の通りである。
(請求項1)
MPEGビデオ・ビットストリーム内のシーンカットを検出する方法であって、
(a)各フレームが複数のフィールドを有する複数のフレームにわたって、各フレーム内の前記複数のフィールドのそれぞれについて符号化マクロブロックの数を判定するステップであって、前記複数のフレームは複数の生じる可能性のあるシーンカットに対応する、該ステップ(309)と、
(b)前記複数のフレームのそれぞれについて、対応するフィールドがフレーム内の1番目のフィールドであることが判定された場合に、順方向予測マクロブロックの数に等しい予測マクロブロックの数を設定するステップ(310)と、
(c)前記複数のフレームのそれぞれについて、対応するフィールドがフレーム内の2番目のフィールドであることが判定された場合に、逆方向予測マクロブロックの数に等しい予測マクロブロックの数を設定するステップであって、前記フレームは1番目と2番目のフィールドを含む、該ステップ(310)と、
(d)前記複数の生じる可能性のあるシーンカットに対応する複数のフレーム内の複数のフィールドのそれぞれについて、前記符号化マクロブロックの数に対する前記予測マクロブロックの数の比率を判定するステップと、
(e)前記複数のフィールドの中で最低の比率を有するフィールドを選択するステップ(312)と、
(f)前記最低の比率を閾値と比較するステップ(313)と、
(g)前記最低の比率が閾値未満であると判定された場合にシーンカットを検出するステップ(314)と、を更に含み、前記シーンカットは前記選択されたフィールドに対応する、前記方法。
(請求項2)
前記複数のフレームはフレームのグループであり、各フレームが2つのフィールドを含んでおり、前記フレームのグループがサブ・グループ・オブ・ピクチャを含んでおり、前記ビデオ・ビットストリームが複数のサブ・グループ・オブ・ピクチャを含んでいる、請求項1に記載の方法。
(請求項3)
ステップ(a)の前に、
サブ・グループ・オブ・ピクチャの1番目のピクチャがIピクチャであるかどうかを判定するステップと、
前のピクチャがIピクチャまたはPピクチャであるかどうかを判定するステップと、
前記1番目のピクチャがIピクチャであり、かつ、前記前のピクチャがIピクチャまたはPピクチャであるという判定に応答して、次のサブ・グループ・オブ・ピクチャに処理を進めるステップと、
を更に含む、請求項2に記載の方法。
(請求項4)
フィ―ルドごとに前記予測マクロブロックの数をゼロに初期化するステップと、
フィールドごとに前記符号化マクロブロックの数をゼロに初期化するステップと、
を更に含む、請求項1に記載の方法。
(請求項5)
フレームのインターレースされたフィールド間に前記複数の生じる可能性のあるシーンカットのうち少なくとも1つが存在する、請求項1に記載の方法。
本発明の好ましい実施例を、添付の図面を参照して、更に詳細に説明する。
本発明の原理に従って、シーンカット検出は、各インターフレーム(P)または双方向(B)フレーム内の順方向および逆方向予測マクロブロックの数に関するデータを収集し、各フレームを個別に考えるのではなく、サブGOPレベル(各アンカー・フレームおよび先行Bフレーム)で分析することにより実行される。本発明は、様々な形態のハードウェア、ソフトウェア、ファームウェア、特定用途プロセッサ、またはこれらの組み合わせで実現されることを理解されたい。ある典型的な実施例において、本発明は、プログラム記憶装置で実際に実行されるアプリケーション・プログラムとしてソフトウェアで実現される。アプリケーション・プログラムは、適切なアーキテクチャで構成される装置にアップロードされ、実行されることもある。当該装置は、1つまたは複数の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)、入出力装置(I/O)インターフェイスなどのハードウェアを有するコンピュータ・プラットフォームで実現されることが望ましい。また、コンピュータ・プラットフォームには、オペレーティング・システムおよびマイクロ・インストラクション・コードが含まれている。ここで説明される様々な処理と機能は、オペレーティング・システムを介して実行されるマイクロ・インストラクション・コードの一部またはアプリケーション・プログラムの一部(またはその組み合わせ)であってもよい。更に、追加データ記憶装置や印刷装置など様々な他の周辺装置がコンピュータ・プラットフォームに接続されてもよい。
更に、添付図に図示される構成要素を成すシステム・コンポーネントおよび方法ステップの中にはソフトウェアで実現されるものもあるため、システム・コンポーネント(またはプロセス・ステップ)間の実際の接続、相互接続、または機能関係は、本発明がどのようにプログラミングされるかによって異なる場合があることを理解されたい。ここで提案される本発明の開示により、その技術分野において通常の技量を有する者は、本発明のこれらおよび類似の実施例または構成例を創案することができるであろう。
PまたはBフレームのそれぞれについて、順方向予測を採用しているマクロブロックの数と逆方向予測を採用しているマクロブロックの数(Bフレームのみ)が記録される。アンカー・フレーム(anchor‐frame)、イントラフレーム(I)またはP、およびBフレームの直前にある全てのものがそれぞれ検査される。
マクロブロックが正しく予測されていない場合、動き補償後の差分は大きくなり、予測を補償するために、大きなDCT係数が必要となる。これらの予測については、予測が偽となる可能性が高い(約50%超)。すなわち、予測の基準となるアンカー・フレーム・マクロブロックは、予測フレーム内のマクロブロックと真の関連性を持たないかも知れないということである。しかし、アンカー・フレームが、十分に類似しており、そこから予測できる場合もある。このため、このようなマクロブロックは、統計を収集する際には無視される。より具体的には、順方向予測または逆方向予測においてマクロブロックの数を計数する場合、DCT係数の全エネルギー(エントロピー)が検査される。DCT係数の全エネルギーは、非DC係数の二乗の合計である。エネルギーが閾値を超えた場合、順方向予測の数(nFwd)および逆方向予測の数(nBwd)、すなわち符号化マクロブロックの数(nCode)は計数されない。MPEG−2については、ある代表的閾値は、約500であることが分っている。
アンカー・フレームについては、サブGOP内の各フレームの予測パターンが分析される。図1について考えてみる。これは、2つのBフレームと1つのPフレームを含むサブGOPを図示したものである。シーンカットの可能性のあるサイト(site:場所)は、フレームB 102の前、フレームB 102とB 103との間、B 103フレームとフレームP 104との間などである。更に、フレームがインターレースしている場合、シーンカットは、105から107までの3つのフレームのうちの任意のフィールド間で発生する。
本発明の実施例によれば、シーンカットが108で発生した場合、フレームB 102、B 103、またはP 104には、順方向予測マクロブロックはほとんど存在しないであろう。何故なら、フレームI/P 101は、これらのフレームの何れとも関係がないからである。同様に、シーンカットが109で発生した場合、フレームB 102には、逆方向予測マクロブロックはほとんど存在しないであろう。何故なら、フレームB 102は、予測の起点となるフレームP 104とは関係がないからである。そして、フレームB 103またはP 104には順方向予測マクロブロックはほとんど期待されない。何故なら、フレームI/P 101は、これらのフレームとは関係がないからである。
このように、108でのシーンカットの尤度の測度は、フレームB 102、B 103、またはP 104の順方向予測マクロブロックの合計である。109でのシーンカットの尤度の測度は、フレームB 102での逆方向予測マクロブロックの合計にフレームB 103およびP 104での順方向予測マクロブロックの数を加えたものである。110でのシーンカットの測度についても同様である。対応する点でシーンカットが存在する測度は、順方向予測マクロブロックおよび逆方向予測マクロブロックの合計数が減少するにつれて増加する。
図2を参照する。現ピクチャ(p)がPまたはBと判定されると(201)、フレームでの符号化マクロブロックの合計数(nCode[p])は、energyThresh未満のAcEnergyを有するマクロブロックの数に設定される(202)。フレームの順方向予測マクロブロックの合計数(nFwd[p])は、energyThresh未満のAcEnergyを有し、方向予測のマクロブロックの数として設定される(203)。フレームの逆方向予測マクロブロックの合計数(nBwd[p])は、energyThresh未満のAcEnergyを有し、逆方向予測のマクロブロックの数として設定される(204)。
図3を参照する。ステップ301に従って、pがIフレームまたはPフレームであるかが判定される。pがIフレームまたはPフレームでない場合、ステップ302に従って、サブGOPの最後までシーンカット検出はない。ステップ303に従って、pがIフレームなのか、そして前のピクチャがIフレームまたはPフレームなのかが判定される。pがIフレームであり、前のピクチャがIフレームまたはPフレームであると判定されると、ステップ304に従って、このサブGOPにおいては、シーンカットは検出されない。pがPタイプまたは前のピクチャがBタイプであると判定されると、ステップ305〜311の現在のサブGOPに関してデータが収集される。ステップ305に従って、サブGOPのフィールドfごとに、フィールドfと先行するフィールドとの間の生じる可能性のあるシーンカットと交差する予測の数(predMBs[f])および予測がこの境界と交差する可能性のあるマクロブロックの数(codedMBs[f])は0に初期化される。
ステップ307に従って、サブGOP内のフィールドfごとに、フィールドfがIピクチャ内にあるかどうかが判定される。フィールドfがIピクチャ内にある場合は、ステップ308に従って、プロセスは次のフィールドについて継続される。フィールドfがIピクチャ内にはないと判定されると、プロセスは、サブGOP内のシーンカットの可能性のあるサイト、すなわち2つのフィールド間の各サイトf’でループする。ステップ309に従って、codedMBs[f’]の値は、サブGOP内の生じる可能性のあるシーンカットf’ごとに、nCode[f]ずつ増分される。更に、ステップ310に従って、predMBs[f’]の値は、fより前またはfに等しい生じる可能性のあるシーンカットf’ごとに、nFwd[f]ずつ増分される。
ステップ311に従って、最後のフィールドに到達したかどうかが判定され、到達していない場合は、ステップ308に従って、プロセスは次のフィールドに進む。最後のフィールドに到達したと判定されると、ステップ312に従って、predMBs[f]とcodedMBs[f]の比率(例えば、predMBs[f]対codedMBs[f])が最小であるフィールドfが判定される。最小比率を有すると判定されたフィールドfについては、ステップ313に従って、predMBs[f]をcodedMBs[f]で割った値がpredRatioThresh未満である場合、ステップ314に従って、プロセスはこのフィールドと先行フィールド間のシーンカットを検出して報告する。それ以外の場合は、ステップ315に従って、サブGOPでシーンカットは検出されない。
予測マクロブロック(predMBs)およびフィールド符号化マクロブロック(codedMBs)の数は、たとえピクチャがフレーム・ピクチャであってもフィールドごとに判定されることに注意されたい。何故なら、シーンカットは、(フレーム・ピクチャがインターレースしている場合)1つのフレーム・ピクチャのフィールド間で発生することがあるからである。フレーム・ピクチャのマクロブロックは、predMBsおよびcodedMBsを計算する際に、そのフレームの各フィールドに適用される。すなわち、f’が、そのフレームの何れかのフィールドを示す場合、nCode[f’]は、そのフレーム内の符号化マクロブロックの合計数である。同様に、nFwd[f’]およびnBwd[f’]は、それぞれフィールドf’内の順方向予測マクロブロックおよび逆方向予測マクロブロックの数を表す。f’がfと同じフレーム・ピクチャ内にある場合、fがそのフレームの1番目のフィールドである場合にのみ、predMBs[f]はnBwd[f]ずつ増分され、codedMBs[f]はnCode[f’]ずつ増分される。2番目のフィールドのアレイ(array)は増分されない。何故なら、順方向予測は1番目のフィールドにのみ適用され、逆方向予測は2番目のフィールドにのみ適用されると予測されるからである。これが行われないと、フレーム・ピクチャのフィールド間のシーンカットは、シーン境界を超えた予測によりマスク(mask:隠す)されるであろう。
実験を通して、予測比率閾値preRatioThreshの適正値は、0.05であることが分っている。しかしながら、更に実験と応用が行われることにより、特定のアプリケーションでは、この値以外のある値または可変閾値がより適切であると判定されることがある。更に、ACエネルギー閾値AcThreshに選択された特定の値も同様に、ここに記載される典型値以外であってもよい。本発明の効率と精度を最大限にするために、これらの値および他の値を評価して変更することは当業者にとって自明なことであり、かかる変更も、ここに記載した本発明の原理に含まれる。
上記に説明した特定の方法は、実施され試験されたものである。これは、ここに記載された開示内容または特許請求の範囲を制限するものではない。本発明の基礎となる原理は、サブGOP内での全予測の全体的な検査により、はっきりしたシーンカットを正確に検出することである。予測により入手できるすべての情報の一貫性を求めることにより、偽陽性(シーンカットの偽報告)が減少することになる。
本発明の原理を、例えばヒストグラムに基づく方法と統合することにより、Iフレームのみの場合およびPピクチャの後にIピクチャが続く場合のように、この方法ではシーンカットを検出できない場合を処理することができるかも知れない。フェード(fade)、ディゾルブ(dissolve)、およびワイプ(wipe)などの段階的シーン遷移を検出するために、ヒストグラムを含む拡張方法を実現することもできる。
サブGOP内の全予測の全体的な検査により、シーンカットを正確に検出する実施例を上記に説明してきたが、当業者であれば、上記の開示に照らして変更したり、変形させたりすることができることに注意されたい。従って、添付の特許請求の範囲により定められる本発明の範囲および趣旨内において、様々な変更および変形が、開示された発明の特定の実施例で行われることを理解されたい。本発明を詳細に、特に特許法によって要求された通りに説明してきたが、特許証によって保護される特許請求の範囲は、添付の特許請求の範囲により定められる。
本発明の原理に従って、サブGOP内の典型的シーンカットを図示したものである。 本発明の原理に従って、シーンカット検出の1番目の方法を図示するフローチャートである。 本発明の原理に従って、シーンカット検出の2番目の方法を図示するフローチャートである。

Claims (5)

  1. MPEGビデオ・ビットストリーム内のシーンカットを検出する方法であって、
    (a)各フレームが複数のフィールドを有する複数のフレームにわたって、各フレーム内の前記複数のフィールドのそれぞれについて符号化マクロブロックの数を判定するステップであって、前記複数のフレームは複数の生じる可能性のあるシーンカットに対応する、該ステップと、
    (b)前記複数のフレームのそれぞれについて、対応するフィールドがフレーム内の1番目のフィールドであることが判定された場合に、順方向予測マクロブロックの数に等しい予測マクロブロックの数を設定するステップと、
    (c)前記複数のフレームのそれぞれについて、対応するフィールドがフレーム内の2番目のフィールドであることが判定された場合に、逆方向予測マクロブロックの数に等しい予測マクロブロックの数を設定するステップであって、前記フレームは1番目と2番目のフィールドを含む、該ステップと、
    (d)前記複数の生じる可能性のあるシーンカットに対応する複数のフレーム内の複数のフィールドのそれぞれについて、前記符号化マクロブロックの数に対する前記予測マクロブロックの数の比率を判定するステップと、
    (e)前記複数のフィールドの中で最低の比率を有するフィールドを選択するステップと、
    (f)前記最低の比率を閾値と比較するステップと、
    (g)前記最低の比率が閾値未満であると判定された場合にシーンカットを検出するステップであって、前記シーンカットが前記選択されたフィールドに対応する、該ステップと、
    を含む前記方法。
  2. 前記複数のフレームはフレームのグループであり、各フレームが2つのフィールドを含んでおり、前記フレームのグループがサブ・グループ・オブ・ピクチャを含んでおり、前記ビデオ・ビットストリームが複数のサブ・グループ・オブ・ピクチャを含んでいる、請求項1に記載の方法。
  3. ステップ(a)の前に、
    サブ・グループ・オブ・ピクチャの1番目のピクチャがIピクチャであるかどうかを判定するステップと、
    前のピクチャがIピクチャまたはPピクチャであるかどうかを判定するステップと、
    前記1番目のピクチャがIピクチャであり、かつ、前記前のピクチャがIピクチャまたはPピクチャであるという判定に応答して、次のサブ・グループ・オブ・ピクチャに処理を進めるステップと、
    を更に含む、請求項2に記載の方法。
  4. フィ―ルドごとに前記予測マクロブロックの数をゼロに初期化するステップと、
    フィールドごとに前記符号化マクロブロックの数をゼロに初期化するステップと、
    を更に含む、請求項1に記載の方法。
  5. フレームのインターレースされたフィールド間に前記複数の生じる可能性のあるシーンカットのうち少なくとも1つが存在する、請求項1に記載の方法。
JP2003531629A 2001-09-26 2002-09-20 シーンカットを検出する方法および装置 Expired - Lifetime JP4173099B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US32489001P 2001-09-26 2001-09-26
US10/014,963 US6996183B2 (en) 2001-09-26 2001-12-11 Scene cut detection in a video bitstream
PCT/US2002/029883 WO2003028236A1 (en) 2001-09-26 2002-09-20 Scene cut detection in a video bitstream

Publications (3)

Publication Number Publication Date
JP2005505165A JP2005505165A (ja) 2005-02-17
JP2005505165A5 JP2005505165A5 (ja) 2006-01-05
JP4173099B2 true JP4173099B2 (ja) 2008-10-29

Family

ID=26686770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003531629A Expired - Lifetime JP4173099B2 (ja) 2001-09-26 2002-09-20 シーンカットを検出する方法および装置

Country Status (10)

Country Link
US (1) US6996183B2 (ja)
EP (1) EP1430613B1 (ja)
JP (1) JP4173099B2 (ja)
KR (1) KR100920096B1 (ja)
CN (1) CN100525129C (ja)
BR (1) BRPI0212828B1 (ja)
ES (1) ES2385324T3 (ja)
MX (1) MXPA04002923A (ja)
MY (1) MY127481A (ja)
WO (1) WO2003028236A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100428801C (zh) * 2005-11-18 2008-10-22 清华大学 一种视频场景切换检测方法
JP4719889B2 (ja) 2006-08-03 2011-07-06 国立大学法人電気通信大学 カット点検出システムおよび該カット点検出システムを用いたショット識別システム、カット点検出方法、並びにカット点検出プログラム
US20090313546A1 (en) * 2008-06-16 2009-12-17 Porto Technology, Llc Auto-editing process for media content shared via a media sharing service
KR101149522B1 (ko) 2008-12-15 2012-05-25 한국전자통신연구원 장면 전환 검출 시스템 및 방법
CN101534442B (zh) * 2009-04-13 2011-01-12 腾讯科技(深圳)有限公司 视频编码系统及方法
KR101043768B1 (ko) * 2009-10-13 2011-06-22 중앙대학교 산학협력단 회화적 렌더링 장치 및 방법
EP2756662A1 (en) 2011-10-11 2014-07-23 Telefonaktiebolaget LM Ericsson (PUBL) Scene change detection for perceptual quality evaluation in video sequences
RU2597493C2 (ru) * 2011-11-25 2016-09-10 Томсон Лайсенсинг Оценивание качества видео с рассмотрением искажений перехода сцен
EP2888870B1 (en) 2012-08-23 2017-08-02 Thomson Licensing Method and apparatus for detecting gradual transition picture in video bitstream
EP2949123A2 (en) * 2013-02-27 2015-12-02 Apple Inc. Adaptive streaming techniques
US9979970B2 (en) * 2014-08-08 2018-05-22 Qualcomm Incorporated System and method for determining buffer fullness for display stream compression
CN109194955B (zh) * 2018-11-16 2021-04-30 深圳市梦网视讯有限公司 一种场景切换检测方法及系统
CN114071143B (zh) * 2020-07-31 2024-09-06 中移(苏州)软件技术有限公司 视频处理方法、装置、设备和存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2294173B (en) 1994-10-11 1998-12-09 Mitsubishi Electric Corp Disk media, and method of and device for recording and playing back information on or from a disk media
US5835149A (en) 1995-06-06 1998-11-10 Intel Corporation Bit allocation in a coded video sequence
US5774593A (en) * 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
US5872598A (en) 1995-12-26 1999-02-16 C-Cube Microsystems Scene change detection using quantization scale factor rate control
US5768537A (en) 1996-02-22 1998-06-16 International Business Machines Corporation Scalable MPEG2 compliant video encoder
US5731835A (en) 1996-02-26 1998-03-24 David Sarnoff Research Center, Inc. Dynamic coding rate control in a block-based video coding system
US5724100A (en) * 1996-02-26 1998-03-03 David Sarnoff Research Center, Inc. Method and apparatus for detecting scene-cuts in a block-based video coding system
JPH09261648A (ja) * 1996-03-21 1997-10-03 Fujitsu Ltd シーンチェンジ検出装置
JP3244629B2 (ja) 1996-08-20 2002-01-07 株式会社日立製作所 シーン変化点検出方法
US5751378A (en) 1996-09-27 1998-05-12 General Instrument Corporation Scene change detector for digital video
US6735253B1 (en) * 1997-05-16 2004-05-11 The Trustees Of Columbia University In The City Of New York Methods and architecture for indexing and editing compressed video over the world wide web
FR2764156B1 (fr) 1997-05-27 1999-11-05 Thomson Broadcast Systems Dispositif de pretraitement pour codage mpeg ii
DE69826823T2 (de) 1997-07-29 2005-10-20 Koninklijke Philips Electronics N.V. Verfahren zur videocodierung mit variabler bitrate und entsprechender videocodierer
US6100940A (en) 1998-01-21 2000-08-08 Sarnoff Corporation Apparatus and method for using side information to improve a coding system
JP3905969B2 (ja) 1998-01-30 2007-04-18 株式会社東芝 動画像符号化装置および動画像符号化方法
US6252905B1 (en) 1998-02-05 2001-06-26 International Business Machines Corporation Real-time evaluation of compressed picture quality within a digital video encoder
US6125147A (en) 1998-05-07 2000-09-26 Motorola, Inc. Method and apparatus for reducing breathing artifacts in compressed video
JP2001266158A (ja) 2000-01-11 2001-09-28 Canon Inc 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体

Also Published As

Publication number Publication date
US6996183B2 (en) 2006-02-07
EP1430613B1 (en) 2012-05-02
KR100920096B1 (ko) 2009-10-01
EP1430613A1 (en) 2004-06-23
US20030058947A1 (en) 2003-03-27
MY127481A (en) 2006-12-29
BR0212828A (pt) 2004-10-13
ES2385324T3 (es) 2012-07-23
MXPA04002923A (es) 2004-07-05
WO2003028236A1 (en) 2003-04-03
KR20040037104A (ko) 2004-05-04
EP1430613A4 (en) 2010-05-26
CN100525129C (zh) 2009-08-05
BRPI0212828B1 (pt) 2016-05-10
JP2005505165A (ja) 2005-02-17
CN1602592A (zh) 2005-03-30

Similar Documents

Publication Publication Date Title
EP1021042B1 (en) Methods of scene change detection and fade detection for indexing of video sequences
US6618507B1 (en) Methods of feature extraction of video sequences
JP3957915B2 (ja) フェード検出装置及び情報符号化装置
JP4173099B2 (ja) シーンカットを検出する方法および装置
AU2005272046B2 (en) Method and apparatus for detecting motion in MPEG video streams
US6327390B1 (en) Methods of scene fade detection for indexing of video sequences
JP4456867B2 (ja) ビデオ中の異常イベントを検出する方法およびシステム
WO2001057802A1 (fr) Procede de description d'activite de mouvement en video
JP4225912B2 (ja) 圧縮ビデオにおけるトーキングヘッドの検出方法
JP5178616B2 (ja) シーンチェンジ検出装置および映像記録装置
JP2869398B2 (ja) カット点検出方法及び装置
JP3812808B2 (ja) スキップ領域検出型動画像符号化装置および記録媒体
JP3711022B2 (ja) 動画像内の特定物体認識方法及び装置
Rayatifard et al. A fast and robust shot detection method in hevc/h. 265 compressed video
Fernando et al. DFD based scene segmentation for H. 263 video sequences
JP3339544B2 (ja) ディゾルブ検出方法および装置
De Queiroz et al. Fast video segmentation using encoding cost data
KR100249829B1 (ko) 엠펙-2 비트열 상에서 계층적 구조를 갖는 장면전환 검출 방법
Fernando et al. scene segmentation for H. 263 video sequences. In Proceedings of ISCAS, Image and Video Processing, Multimedia and Communications.(Vol. 4, pp. 520-523). Institute of Electrical and Electronics Engineers (IEEE).
EP1897374A1 (en) Method and apparatus for encoding video data stream

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050901

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050901

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20080318

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080402

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080409

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080805

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080812

R150 Certificate of patent or registration of utility model

Ref document number: 4173099

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130822

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term