JP2007533196A - 単色フレーム検出方法及びこれに対応する装置 - Google Patents

単色フレーム検出方法及びこれに対応する装置 Download PDF

Info

Publication number
JP2007533196A
JP2007533196A JP2007506898A JP2007506898A JP2007533196A JP 2007533196 A JP2007533196 A JP 2007533196A JP 2007506898 A JP2007506898 A JP 2007506898A JP 2007506898 A JP2007506898 A JP 2007506898A JP 2007533196 A JP2007533196 A JP 2007533196A
Authority
JP
Japan
Prior art keywords
frames
frame
image
monochromatic
intra prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007506898A
Other languages
English (en)
Inventor
マウロ バルビーリ
ヅェヴデット ブラツェロヴィク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007533196A publication Critical patent/JP2007533196A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、隣接するブロックに小分割されるマクロブロックに分割される連続のフレームを有するビデオストリームの形態で利用可能なディジタル符号化ビデオデータに適用される検出方法に関する。これらフレームは、独立して符号化されたIフレームと、前のI又はPフレームから予測されるPフレームと、介在する対象の少なくとも2つのフレームから双方向に予測されたBフレームとを含む。本発明によれば、この処理方法は、所定のイントラ予測モードに準じて、現フレームの各ブロックにつき符号化されているか否かを判定するステップと、現フレームのブロックの全てにつき同様の情報を収集し所定のイントラ予測モードに関連した統計データを伝送するステップと、イントラ予測モードを呈するか又は呈しない現フレームのブロックの数を判定するよう統計データを解析するステップと、フレームの系列において、当該数が所定の閾値より大きいときに単色であるか又は繰り返しパターンを伴う画像又は画像の小領域の発生を検出するステップとを有する。

Description

本発明は、単色フレーム又はフレームの単色部分を自動的に検出することのできる方法に関し、特に例えばH.264/MPEG−4 AVCビデオストリームにおける方法に関する。本方法は、主として、非常に効率的で費用対効果の高い検出を可能とするH.264により導入される新しい符号化パラメータの使用に基づくものである。
近年、国際ビデオ符号化規格は、ディジタルビデオの採用を様々な専門的かつ民生の用途において容易にするのに重要な役割を果たしてきた。多くの影響力のある規格は、ITU−TとISO/IEC MPEGという2つの機構(時として提携される。例えばMPEG−2/H.262)により開発されてきた。最も新しい提携規格は、H.264/AVCであり、2003年にITU−TによりRecommendation H.264/AVCとしてISO/IECによりInternational Standard 14496-10 (MPEG-4 Part 10) Advanced Video Coding (AVC)として正式に承認されることが期待されていた。H.264/AVC規格化の主たる目標は、圧縮性能における大幅な向上を達成することと、「対話型」(電話通信)及び「非対話型」(記憶、放送、ストリーミング)の用途に対応した「ネットワークフレンドリな」ビデオ提示を提供することである。現在、H.264/AVCは、こうした目標を達成するために広く認識されており、幾つかの将来のシステムや用途における使用のために、DVB及びDVDフォーラムなどの技術的規格化団体により検討されている。インターネットでは、H.264/AVCについての情報を提供するサイトの数が増え続けており、そのうちITU−T/MPEG JVT[Joint Video ‘Team]の正式なデータベースが草案の更新情報を含めたH.264/AVCの開発及び状況を反映した資料へのフリーアクセスを提供している。
ここでH.264/AVCシンタックス及び符号化ツールを思い出すことができる。先ず、H.264/AVCは、MPEG−2のような公表されている規格から知られる、ブロックを基礎とする動き補償変換符号化の同じ原理を使っている。したがってH.264シンタックスは、ヘッダ(ピクチャ、スライス及びマクロブロックヘッダなど)とデータ(動きベクトル、ブロック変換係数、量子化スケールなど)との普通の階層により編制されている。データ構造化(例えば、I,P又はBピクチャ、イントラ及びインターマクロブロック)に関する既知の概念の多くが維持される一方で、幾つかの新しい概念も当該ヘッダ及びデータレベルの双方に導入されている。主としてH.264/AVCは、ビデオデータの内容を効率良く表すように規定されるビデオ符号化レイヤ(Video Coding Layer;VCL)と、データをフォーマット化しより高いレベルの(伝送)システムによって伝送に適切な形態でヘッダ情報を提供するネットワーク概要レイヤ(Network Abstraction Layer;NAL)を分離する。
データレベルのH.264/AVCの主な特殊性の1つには、16×16のマクロブロックの区分け及び操作をより綿密にして使用することがある(1マクロブロックMBは、16×16ブロックの輝度及びこれに対応する8×8ブロックのクロミナンス(色)の両方を含むが、例えば動き推定などの多くの動作は、実際には輝度だけをとりクロミナンスに関する結果を予測する)。したがって、動き補償処理は、サンプルグリッドの4分の1までの動きベクトルの正確さを用いて、4×4の小さなサイズにMBの分割をなすことができる。また、サンプルブロックの動き補償された予測のための選択処理は、隣接のものに限定するのではなく、記憶され前に復号された多数のピクチャを含むことができる。イントラ符号化によっても、ここでは隣接ブロックからの前に復号されたサンプルを用いてブロックの予測をなすことができる(この空間を基礎とする予測のためのルールがいわゆるイントラ予測モードにより記述される)。この態様は、ここで規定される本発明について特に関連したものであり、詳細な説明において後に強調する。動き補償された又は空間を基礎とする予測の後に、結果としての予測誤差は、習慣的な8×8のサイズではなく、4×4ブロックサイズに基づいて普通に変換され量子化される。H.264/AVC規格は、他の符号化段階(例えばエントロピー符号化)において他の特定の認識を未だ用いており、これらの多くが固定化され又はピクチャレベルにおいて若しくはピクチャレベルの上でしか変更することができない。
前の規格の場合にあったように、H.264/AVCは、イントラモードで、すなわち隣接画像からの時間的な予測の使用を伴うことなく画像ブロックを符号化することを許容している。H.264/AVCイントラ符号化の新しい点は、同じピクチャにおける前に符号化され復元されたサンプルから形成されるブロックPによりイントラブロックを予測することができる空間予測を用いている点である。この予測ブロックPは、符号化の前に実際の画像ブロックから引かれることになるが、これは実際の画像ブロックが直接符号化される現行の規格(例えばMPEG−2、MPEG−4 ASP)とは異なるものである。輝度サンプルについて、1つの16×16MB又はその各4×4サブブロックにつきPを形成することができる。各4×4ブロックについて全部で9つのオプションの予測モードや、16×16MBに対する4つのオプションモード、ここでは詳述しない各4×4クロマ(彩度)ブロックに常に適用される1つのモードがある。
提示の例において、図1は、その左の部分に1つの16×16輝度マクロブロックを、その右の部分に予測されている4×4サブブロックを示している(左上のサンプルは、前に符号化され復元されたものであり、これにより、予測基準を形成するために当該符号化器及び復号器において利用可能なものである。)。予測ブロックPは、サンプルに基づいて計算され、図2は、その左の部分で予測ブロックPを構成するサンプルのラベル付け(aないしp)と予測に用いられるサンプルの相対位置及びラベル付け(AないしM)を示している(画素EないしHが利用可能でない場合、Dの画素値により置き換えられる)。図2の右の部分における矢印は、各モードにおける予測の方向を示している。モード3ないし8については、予測サンプルaないしpの各々がサンプルAないしMの加重平均として計算される。モード0ないし2については、サンプルaないしpの全てに同じ値が与えられ、かかる値は、サンプルAないしDの平均(モード2)、サンプルIないしLの平均(モード1)又はサンプルAないしD及びIないしL両方の平均(モード0)に一致させることができる。符号化器は、通常その(符号化すべき)ブロックと対応の予測Pとの間の剰余を最小化する各4×4ブロックについて予測モードを選択する。4×4予測の次に、H.264はまた、全体としてMBの16×16ルミナンス部を予測することを可能とする。このため、4つの可能なモードが特定され、これらは図3に連続的に示される。それぞれ、上側サンプルからの外挿、左側サンプルからの外挿、上側及び左側サンプルの平均化、並びに上側及び左側サンプルに対する線形「平面」関数の適用に対応する。なお、イントラモードの選択も復号器に伝達されなければならず、そのために、H.264は、高効率符号化方法を規定している(その中心的思想は、隣接の4×4ブロックのモードが相関性が高いことが多いという考察を活用することにより、4×4モードの個別の符号化を避けることである)。
コンピュータ処理や通信、ディジタルデータ記憶における最近の進歩は、専門家及び消費者双方の環境において非常に大きなディジタルアーカイブの急成長をもたらしており、容量やコンテンツの多様性が絶え間なく増え続けているのが特徴である。したがって、対象の記憶情報を素早く検索する効率的な方法を見つけることは非常に重要である。
テラバイトもの組織化されていない記憶データにおいて相互にサーチをなすことは、冗長性が高く時間が掛かるので、情報サーチ及び検索タスクを自動化システムに転送する必要性が増している。組織化されていないビデオコンテンツの大きなアーカイブにおけるサーチ及び検索は、大抵はコンテンツがコンテンツ解析技術を用いて索引付けされた後に行われる。こうした技術は、当該ビデオコンテンツの記述を考慮して、ビデオマテリアルの注釈を自動的に作成することを目的としたアルゴリズムを有する(このような注釈は、色又はテクスチャなどの低レベル信号関連特性から顔の存在や位置などの高レベル情報に変化する)。
重要なコンテンツ記述子は、いわゆる単色又は「ユニカラー」のフレーム指標である。フレームは、同じ色で全部が満たされている場合には単色であるとみさなれる(実際には、伝送する作品からの信号チェーンにおけるノイズのために、単色フレームは、しばしば単一の色、例えば青、ダークグレイ又は黒の極僅かな相違を示す)。単色フレームを検出することは、コンテンツを基礎とする多くの検索用途において重要なステップである。例えば、米国特許出願公開に係る文献のUS2002/0186768に説明されているように、コマーシャル検出器や番組境界検出器は、2つの連続した番組を分離するため、或いはコマーシャル広告から番組を分離するために、放送事業者により挿入される大抵は黒の単色フレームの存在を識別することに依拠するものである。単色フレーム検出はまた、コンテンツの視覚的テーブルから情報価値のないキーフレームを除去するためにも用いられる。
今度のH.264/MPEG−4 AVC規格の大きな用途範囲のため、H.264/AVCビデオコンテンツ解析のための効率的方策の要求が益々高まると想定される。近年、幾つかの効率的なコンテンツ解析アルゴリズム及び方法はMPEG−2ビデオに対して実証されており、これらはほぼ専ら圧縮領域で動作する。こうした方法の多くは、H.264/AVCに拡張可能である。何故なら、H.264/AVCは或る意味では上で示したようにMPEG−2シンタックスのスーパーセットを規定するからである。しかしながら、MPEG−2の制限のために、これら現行の方法の幾つかは適切又は確実な性能を示さない可能性があり、普通は画素又はオーディオ領域において動作する付加的な多くの場合高コストの方法を含ませることにより対処されるという欠点となっている。
したがって本発明の目的は、DCT係数統計データの分析に基づいたもののような従来の検出方法と比較して低い消費電力で済む、より適切な検出方法を提案することである。
このため、本発明は、隣接するブロックに小分割されるマクロブロックに分割される連続的なフレームを有するビデオストリームの形態で利用可能なディジタル符号化ビデオデータに適用される検出方法であって、前記フレームは、少なくとも、同じフレームにおける前に符号化され復元されたサンプルから形成される少なくとも1つのブロックから直接又は空間予測を用いて他のフレームとは独立して符号化されたIフレームと、前記Iフレーム間に時間的に配され少なくとも前のI又はPフレームから予測されるPフレームと、IフレームとPフレームとの間又は2つのPフレームの間に時間的に配され介在する対象の当該少なくとも2つのフレームから双方向に予測されたBフレームとを含み、
・所定のイントラ予測モードに準じて、現フレームの連続ブロックの各々につき符号化されているか否かを判定するステップと、
・前記現フレームの連続ブロックの全てにつき同様の情報を収集し前記所定のイントラ予測モードに関連した統計データを伝送するステップと、
・前記イントラ予測モードを呈するか又は呈しない前記現フレームのブロックの数を判定するよう前記統計データを解析するステップと、
・フレームの系列において、前記数が所定の閾値より大きいときに単色であるか又は繰り返しパターンを伴う画像又は画像の小領域の発生を検出するステップと、
を有する方法に関する。
本発明の他の目的は、当該検出方法を行うための検出装置を提案することである。
このため、本発明は、隣接するブロックに小分割されるマクロブロックに分割される連続的なフレームを有するビデオストリームの形態で利用可能なディジタル符号化ビデオデータに適用される検出装置であって、前記フレームは、少なくとも、同じフレームにおける前に符号化され復元されたサンプルから形成された少なくとも1つのブロックから直接又は空間予測を用いて他のフレームとは独立して符号化されたIフレームと、前記Iフレーム間に時間的に配され少なくとも前のI又はPフレームから予測されるPフレームと、IフレームとPフレームとの間又は2つのPフレームの間に時間的に配され介在する対象の当該少なくとも2つのフレームから双方向に予測されるBフレームとを含み、
・所定のイントラ予測モードに準じて、現フレームの連続ブロックの各々につき符号化されているか否かを判定する判定手段と、
・前記現フレームの連続的ブロックの全てにつき同様の情報を収集し前記所定のイントラ予測モードに関連した統計データを伝送する収集手段と、
・前記統計データの解析を行い、前記イントラ予測モードを呈するか又は呈しない前記現フレームのブロックの数を判定する解析手段と、
・フレームの系列において、前記数が所定の閾値より大きいときに、単色であるか又は繰り返しパターンを伴う画像又は画像の小領域の発生の検出を行う検出手段と、
を有する装置に関する。
以下、添付図面を参照して例示により本発明を説明する。
本発明の原理は、H.264/AVCの革新的な符号化ツールであるイントラ予測モードを単色フレーム検出のために良好に用いることができるという事実に基づいている。主たる思想は、画像を構成する(マクロ)ブロックのためのイントラ予測モードの分布を観察することである。単色画像は、これらブロックの殆どが同じ又は同様の予測モードを呈するときに検出され、このようなブロックの数は例えば固定の閾値と比較可能である。画像におけるブロックの殆どが或るイントラ予測モードに準じて符号化されている場合、その画像は、非常に低い空間的ばらつきを呈するものであり、単色であるか又は繰り返しパターンを含むものである。このアルゴリズムのコンテンツのテーブルの発生への先述した適用のため、又はキーフレーム抽出のため、低い空間ばらつき又は極めて低い空間ばらつき(単色及び繰り返しパターン)の画像のこうしたタイプの双方を破棄しなければならない。
本発明による処理方法の実現形態は、図4のブロック図に示されており、この図は提案の単色フレーム検出方法の可能な実現形態を示しているが、この例は本発明の範囲を限定するものではない。図示の復号装置では、デマルチプレクサ41が伝送(トランスポート)ストリームTSを受信し、多重分離されたオーディオ及びビデオストリームAS及びVSを発生する。ビデオストリームは、復号されたビデオストリームDVSを伝送するためにH.264/AVCデコーダ42により受信される。このデコーダ42は、主として、逆量子化回路421(Q−1)と、本例では逆DCT回路である逆変換回路422(T−1)と、動き補償回路423とを有する。また、受信した符号化パラメータを収集するために設けられた、いわゆるネットワーク概要レイヤユニット(NALU;Network Abstraction Layer Unit)424も有する。このユニット424の出力信号は、解析回路43により適切な処理のために受信されるイントラ予測モードパラメータ統計情報IPMPS(intra prediction mode parameter statistics)である。この解析回路43において実行される処理動作は、その後始めに受信したストリームにおける単色フレームの位置及び持続期間についての情報を生成するものであり、この情報はその後、ファイル44に、例えば共通に用いられるCPI(Characteristic Point Information)テーブルの形態で記憶される。ここで、この出力情報は、上述したようなコンテンツを基礎とする多くの用途(2つの連続した番組又は番組とコマーシャル広告の分離や、コンテンツのテーブルからの情報価値のないキーフレームの抽出など)に利用可能となる。
この方法の主要な利点は、DCT係数統計データの解析に基づく慣例的な検出方法に比べて消費電力が少なくて済むことである。これは、提案の方法は、マクロブロック符号化タイプのレベルまでの空間復号しか必要としないからである。この方法の他の利点は、少ない情報で若しくは皆無の情報で又は繰り返しパターンを含んでフレームの容易な検出を可能とする点である(反復パターンを伴うフレームの検出は、画素/DCT領域において軽微な動作ではない)。本方法はまた、フレームにおける単色の小領域を検出するために用いることができる。一例として、画像がその境界において単色(例えば黒)を呈する、いわゆる「レターボックス」フォーマットの検出がある。
なお、本発明は、前述した実施例に限定されるものではなく、添付の請求項に規定されるような本発明の主旨及び範囲から逸脱することなく変形例や変更例を形成することができる。
例えば、本明細書や請求項で用いられている「マクロブロック」や「ブロック」なる文言は、例えばMPEG−2又はMPEG−4などの規格に用いられているようなフレームの矩形の小領域の階層を表すことだけを意図したものではなく、変則的な形のブロックに基づいた符号化又は復号手法において直面するようなフレームの任意の形のあらゆる種類の小領域をも指向するものである。
また、ハードウェア若しくはソフトウェア又はその両方のアイテムにより機能を実現する沢山の方法もある。この点で、図面は非常に模式的なものであり、本発明の1つの可能性のある実施例を表しているに過ぎない。したがって、図面は、種々のブロックとしての種々の機能を示しており、ハードウェア又はソフトウェアの単一のアイテムが複数の機能を果たすことを排除するものではない。また、ハードウェア若しくはソフトウェアのアイテム又はその両方のアイテムのアセンブリが機能を果たすことを排除するものでもない。
請求項におけるいずれの参照符号も、当該請求項を限定するものと解釈するべきではない。「有する」なる文言は、請求項に挙げられたもの以外の要素又はステップの存在を排除しない。要素又はステップの単数表現は、かかる要素又はステップの複数の存在を排除するものではない。
元の16×16輝度マクロブロック(左)と予測対象の4×4ブロック(右)を示す図。 4×4輝度ブロックの指向性イントラ予測を示す図。 H.264における可能性のある4つの16×16イントラ予測モードを示す図。 本発明による処理方法の実現形態のブロック図。

Claims (7)

  1. 隣接するブロックに小分割されるマクロブロックに分割される連続的なフレームを有するビデオストリームの形態で利用可能なディジタル符号化ビデオデータに適用される検出方法であって、前記フレームは、少なくとも、同じフレームにおける前に符号化され復元されたサンプルから形成される少なくとも1つのブロックから直接又は空間予測を用いて他のフレームとは独立して符号化されたIフレームと、前記Iフレーム間に時間的に配され少なくとも前のI又はPフレームから予測されるPフレームと、IフレームとPフレームとの間又は2つのPフレームの間に時間的に配され介在する対象の当該少なくとも2つのフレームから双方向に予測されたBフレームとを含み、
    ・所定のイントラ予測モードに準じて、現フレームの連続ブロックの各々につき符号化されているか否かを判定するステップと、
    ・前記現フレームの連続ブロックの全てにつき同様の情報を収集し前記所定のイントラ予測モードに関連した統計データを伝送するステップと、
    ・前記イントラ予測モードを呈するか又は呈しない前記現フレームのブロックの数を判定するよう前記統計データを解析するステップと、
    ・フレームの系列において、前記数が所定の閾値より大きいときに単色であるか又は繰り返しパターンを伴う画像又は画像の小領域の発生を検出するステップと、
    を有する方法。
  2. 請求項1に記載の検出方法であって、前記解析ステップは、前記イントラモードの統計データ及び可能な追加的符号化パラメータを処理するように設けられ、前期検出ステップは、単色であるか又は繰り返しパターンを伴う画像又は画像の小領域に関する情報を伝送するように設けられる、方法。
  3. 請求項2に記載の検出方法であって、前記単色であるか又は繰り返しパターンを伴う画像又は小領域画像の位置及び持続期間に関する情報が生成されファイルに記憶される、方法。
  4. 請求項1,2又は3に記載の検出方法であって、当該処理されるビデオストリームのシンタックス及びセマンティクスは、H.264/AVC規格のものである、方法。
  5. 連続的なフレームからなる圧縮ビデオストリームにおいて単色であるか又は繰り返しパターンを伴う画像又は画像の小領域を検出する方法であって、
    ・入力ディジタルビデオデータを符号化するステップと、
    ・単色であるか又は繰り返しパターンを伴う画像又は小領域画像を識別するために、請求項1ないし4のうちいずれか1つに記載の処理方法により前記ディジタル符号化ビデオデータを処理するステップと、
    を有する検出方法。
  6. 隣接するブロックに小分割されるマクロブロックに分割される連続的なフレームを有するビデオストリームの形態で利用可能なディジタル符号化ビデオデータに適用される検出装置であって、前記フレームは、少なくとも、同じフレームにおける前に符号化され復元されたサンプルから形成された少なくとも1つのブロックから直接又は空間予測を用いて他のフレームとは独立して符号化されたIフレームと、前記Iフレーム間に時間的に配され少なくとも前のI又はPフレームから予測されるPフレームと、IフレームとPフレームとの間又は2つのPフレームの間に時間的に配され介在する対象の当該少なくとも2つのフレームから双方向に予測されるBフレームとを含み、
    ・所定のイントラ予測モードに準じて、現フレームの連続ブロックの各々につき符号化されているか否かを判定する判定手段と、
    ・前記現フレームの連続的ブロックの全てにつき同様の情報を収集し前記所定のイントラ予測モードに関連した統計データを伝送する収集手段と、
    ・前記統計データの解析を行い、前記イントラ予測モードを呈するか又は呈しない前記現フレームのブロックの数を判定する解析手段と、
    ・フレームの系列において、前記数が所定の閾値より大きいときに、単色であるか又は繰り返しパターンを伴う画像又は画像の小領域の発生の検出を行う検出手段と、
    を有する装置。
  7. 検出装置のためのコンピュータプログラム製品であって、命令のセットを有し、前記検出装置にロードされたときに当該装置に請求項1に記載の検出方法のステップを実行させるように導く製品。
JP2007506898A 2004-04-08 2005-04-04 単色フレーム検出方法及びこれに対応する装置 Pending JP2007533196A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04300189 2004-04-08
PCT/IB2005/051102 WO2005099273A1 (en) 2004-04-08 2005-04-04 Monochrome frame detection method and corresponding device

Publications (1)

Publication Number Publication Date
JP2007533196A true JP2007533196A (ja) 2007-11-15

Family

ID=34962197

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007506898A Pending JP2007533196A (ja) 2004-04-08 2005-04-04 単色フレーム検出方法及びこれに対応する装置

Country Status (6)

Country Link
US (1) US20070206931A1 (ja)
EP (1) EP1743488A1 (ja)
JP (1) JP2007533196A (ja)
KR (1) KR20070007330A (ja)
CN (1) CN1947427A (ja)
WO (1) WO2005099273A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2187647A1 (en) 2008-11-12 2010-05-19 Sony Corporation Method and device for approximating a DC coefficient of a block of pixels of a frame
CN102474620A (zh) * 2009-07-10 2012-05-23 三星电子株式会社 在分层视频编码中的空间预测方法和设备
US9531990B1 (en) * 2012-01-21 2016-12-27 Google Inc. Compound prediction using multiple sources or prediction modes
US8737824B1 (en) 2012-03-09 2014-05-27 Google Inc. Adaptively encoding a media stream with compound prediction
US9185414B1 (en) 2012-06-29 2015-11-10 Google Inc. Video encoding using variance
US9628790B1 (en) 2013-01-03 2017-04-18 Google Inc. Adaptive composite intra prediction for image and video compression
US9374578B1 (en) 2013-05-23 2016-06-21 Google Inc. Video coding using combined inter and intra predictors
US9609343B1 (en) 2013-12-20 2017-03-28 Google Inc. Video coding using compound prediction
CN105306961B (zh) * 2015-10-23 2018-11-20 无锡天脉聚源传媒科技有限公司 一种抽帧的方法及装置
CN110400355B (zh) * 2019-07-29 2021-08-27 北京华雨天成文化传播有限公司 一种单色视频的确定方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261648A (ja) * 1996-03-21 1997-10-03 Fujitsu Ltd シーンチェンジ検出装置
WO2002093929A1 (en) * 2001-05-14 2002-11-21 Koninklijke Philips Electronics N.V. Video content analysis method and system leveraging data-compression parameters
WO2003061280A2 (en) * 2001-12-27 2003-07-24 Koninklijke Philips Electronics N.V. Commercial detection in audio-visual content based on scene change distances

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2518503B2 (ja) * 1993-03-08 1996-07-24 日本電気株式会社 画面切り替え検出方法
US6137544A (en) * 1997-06-02 2000-10-24 Philips Electronics North America Corporation Significant scene detection and frame filtering for a visual indexing system
US20050111835A1 (en) * 2003-11-26 2005-05-26 Friel Joseph T. Digital video recorder with background transcoder

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261648A (ja) * 1996-03-21 1997-10-03 Fujitsu Ltd シーンチェンジ検出装置
WO2002093929A1 (en) * 2001-05-14 2002-11-21 Koninklijke Philips Electronics N.V. Video content analysis method and system leveraging data-compression parameters
WO2003061280A2 (en) * 2001-12-27 2003-07-24 Koninklijke Philips Electronics N.V. Commercial detection in audio-visual content based on scene change distances

Also Published As

Publication number Publication date
EP1743488A1 (en) 2007-01-17
CN1947427A (zh) 2007-04-11
US20070206931A1 (en) 2007-09-06
KR20070007330A (ko) 2007-01-15
WO2005099273A1 (en) 2005-10-20

Similar Documents

Publication Publication Date Title
JP2007533196A (ja) 単色フレーム検出方法及びこれに対応する装置
US20080267290A1 (en) Coding Method Applied to Multimedia Data
US6959044B1 (en) Dynamic GOP system and method for digital video encoding
CN101222644B (zh) 运动图像编码、解码装置以及运动图像编码、解码方法
US20060204115A1 (en) Video encoding
US20110075735A1 (en) Advanced Video Coding Intra Prediction Scheme
JP2006519565A (ja) ビデオ符号化
KR20070085745A (ko) 코딩된 비디오 데이터를 처리하기 위한 방법 및 장치
WO2012076646A1 (en) High-dynamic range video tone mapping
JP2009303264A (ja) 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法
JP2000224590A (ja) ビデオシ―ケンスの特徴抽出方法
KR20070007295A (ko) 비디오 인코딩 방법 및 장치
WO2003061295A2 (en) Sharpness enhancement in post-processing of digital video signals using coding information and local spatial features
TW200939784A (en) Detecting scene transitions in digital video sequences
JP5475409B2 (ja) 動画像符号化装置および動画像符号化方法
WO2008100000A1 (en) Method of compressing and restoring moving picture using i frame tag
WO2005094083A1 (en) A video encoder and method of video encoding
JP2002064823A (ja) 圧縮動画像のシーンチェンジ検出装置、圧縮動画像のシーンチェンジ検出方法及びそのプログラムを記録した記録媒体
CN101742307B (zh) 用于从视频帧序列中提取出平均亮度方差的方法和设备
JP2008005197A (ja) デコード装置およびデコード方法
KR20060127024A (ko) 장면 변화 검출을 사용하는 처리 방법 및 장치
JPWO2006011197A1 (ja) 符号化データ再符号化装置及びその復号装置並びにプログラム
JP2007522698A (ja) 符号化方法及び対応する符号化信号
Keimel et al. Designing Video Quality Metrics
US20100150470A1 (en) Systems and methods for deblocking sequential images by determining pixel intensities based on local statistical measures

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110426