JP2007533197A

JP2007533197A - マルチメディアデータに適用される符号化方法

Info

Publication number: JP2007533197A
Application number: JP2007506900A
Authority: JP
Inventors: マウロバルビエリ; ゼフデットブラゼロフィク
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2004-04-08
Filing date: 2005-04-04
Publication date: 2007-11-15
Also published as: WO2005099274A1; CN1943247A; KR20070032633A; EP1751986A1; US20080267290A1

Abstract

本発明は、連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化方法に関する。これらのフレームは少なくとも、独立に符号化されるＩフレームと、少なくとも以前のＩ又はＰフレームから予測されるＰフレームと、Ｂフレームであって該Ｂフレームがその間に配置された少なくとも２つのフレームから双方向的に予測されるＢフレームとの形で符号化される。本発明によれば、前記符号化方法は、現在のフレームのマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、前記パラメータに関連する統計を配信するための計算ステップと、前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、前記記述データ及び元のデータの両方を符号化するための符号化ステップと、を有する。

Description

本発明は、マクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化方法であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるＩフレームと、時間的に前記Ｉフレーム間に配置され、少なくとも以前のＩ又はＰフレームから予測されるＰフレームと、時間的にＩフレームとＰフレームとの間、又は２つのＰフレーム間に配置されるＢフレームであって、該Ｂフレームが間に配置された少なくとも２つのフレームから双方向的に予測されるＢブレームとの形で符号化される符号化方法に関する。

本発明はまた、コンピュータ読み取り可能な記憶媒体に保存されるために提供された、前記符号化方法において定義されたステップを有する、対応するコンピュータ実行可能な処理ステップ、及び斯かる符号化方法によりディジタルビデオデータを符号化することにより生成された送信可能な符号化信号に関する。

今日、ますます多くのディジタル放送サービスが利用可能であり、それ故一般に情報技術の専門家ではないユーザによっても、マルチメディア情報リソースの適切な利用を可能とすることは有用であると考えられる。前記マルチメディア情報は一般に、ストリーミング、圧縮及びユーザインタラクティブ性のような動作を考慮して操作されることを意図された、自然の及び合成のオーディオ、ビジュアル及びオブジェクトデータから成る。ＭＰＥＧ−４規格は、前記動作を実行することを可能とする多くの機能を提供する、最も合意のとれた方法の１つである。ＭＰＥＧ−４の最も重要な側面は、オブジェクトの概念によるインタラクティブ性のサポートである。場面のオブジェクトは独立に符号化され、幾つかのビットストリーム、即ち所謂基本ストリームとしての圧縮された形態で、同時に保存され送信される。

ＭＰＥＧ−４の規定は、これら基本ストリーム（オーディオ、ビデオ、・・・等）を識別及び記述し、適切な方法でこれら基本ストリームを関連付け、これにより場面の記述を取得し、エンドユーザに対して有意なマルチメディア場面を構築し提示することを意図された、オブジェクト記述フレームワークを含む。ＭＰＥＧ−４は、オブジェクトの構成要素としてマルチメディアデータをモデル化し、オブジェクトはオーディオ−ビジュアルの場面のいずれの要素をも指定する。しかしながら、該規格の大きな成功は、今日ますます多くの情報がディジタルの形態で利用可能であるという事実をもたらしている。それ故、正しい情報を見つけ出し選択することは、人間のユーザにとって困難となっており、いずれかの特定の目的のためのオーディオ−ビジュアルデータに対して動作する自動化されたシステムにとっても同様に困難となっている。人間のユーザ及び自動化されたシステムは共に、前記情報の内容についての情報を、例えば前記内容に関する決定を為すために必要とする。

ＭＰＥＧ−７規格の目的は、未だ固まっていないが、前記コンテンツを記述すること、即ち、音声、オーディオ、ビデオ、静止画、３Ｄモデル等のような種々のマルチメディアマテリアルを記述する標準化された方法、更にはこれらの要素がマルチメディア文書にどのように組み合わせられるかを記述する方法を見出すことである。それ故ＭＰＥＧ−７は、記述子Ｄ（各記述子は、例えば画像の色、オブジェクトの動き、映画のタイトル等のようなコンテンツの特有の特徴を特徴付けることが可能である）、記述スキームＤＳ（記述スキームは前記記述子の構造及び関係を定義する）、記述定義言語ＤＤＬ（前記記述子及び記述スキームを特定することを意図されている）と呼ばれる幾つかの規範的な要素、及びこれらの記述のための符号化方式を定義することを意図されている。図１は、これらのＭＰＥＧ−７の規範的要素及びこれらの関係の概要図を示す。記述子及び記述スキームを標準化することが必要か否かは、依然としてＭＰＥＧにおいて議論されている。しかしながら、少なくとも最も広く利用されるセットは標準化されるであろう見込みが高いと思われる。

それ故本発明の目的は、ＭＰＥＧ−７規格に関連して非常に有用であると考えられる新たな記述子を提案することにある。

この目的のため、本発明は、本明細書の導入部に定義されたような符号化方法であって、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップとを有することを特徴とする符号化方法に関する。

本発明の他の目的は、前記方法を実行することを可能とするコンピュータ実行可能な処理ステップのセットを提案することにある。

この目的のため、本発明は、連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化装置における使用であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるＩフレームと、時間的に前記Ｉフレーム間に配置され、少なくとも以前のＩ又はＰフレームから予測されるＰフレームと、時間的にＩフレームとＰフレームとの間、又は２つのＰフレーム間に配置されるＢフレームであって、該Ｂフレームが間に配置された少なくとも２つのフレームから双方向的に予測されるＢブレームとの形で符号化される使用のための、コンピュータ読み取り可能な記憶媒体に保存されるように備えられたコンピュータ実行可能な処理ステップであって、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップと、を有する処理ステップに関する。

本発明は、添付図面を参照しながら、例として以下に説明される。

図２に示される、本発明による複数のマルチメディアデータを符号化する方法は、利用可能なマルチメディアデータを１つ又は幾つかのビットストリームに変換する取得ステップ（ＣＯＮＶ）と、分析及びセグメント化により前記ビットストリーム中の種々のレベルの情報をキャプチャリングする構造化ステップ（ＳＥＧＭ）と、得られたレベルの情報の記述データを生成する記述ステップと、かくして得られた記述データを符号化することを可能とする符号化ステップ（ＣＯＤ）を有する。より詳しくは、前記記述ステップは、前記複数のマルチメディアデータに関連する記述子のセットを保存するための定義サブステップ（ＤＥＦ）と、元のマルチメディアデータに基づいて、前記構造化ステップにおいて得られた全レベルの情報によって、符号化されるべき記述データを選択する記述サブステップ（ＤＥＳＣ）と、を有する。前記符号化されたデータは次いで送信及び／又は保存される。図３に示される対応する復号化方法は、上述した符号化方法により符号化された信号を復号化するステップ（ＤＥＣＯＤ）と、かくして得られた前記復号化された信号を保存するステップ（ＳＴＯＲ）と、ユーザ（ＵＳＥＲ）によって送信されたコマンドに基づき、前記復号化された信号により構成されるデータから検索するステップ（ＳＥＡＲＣＨ）と、前記保存されたデータ中の前記検索の結果を前記ユーザに返送するステップと、を有する。

全てのとり得るマルチメディアコンテンツに関連して保存された記述子のなかで、本発明により提案されるものは、２００３年にＩＴＵ−ＴによりRecommendation H.264/AVCとして、及びＩＳＯ／ＩＥＣによりInternational Standard 14496-10 (MPEG-4 Part 10) Advanced Video Coding (AVC)として公式に承認されることが予期される、将来の規格Ｈ．２６４／ＡＶＣに基づく。該新たな規格は、ＭＰＥＧ−２のような確立された規格から知られたブロックベース動き補償変換符号化と同じ原理を利用している。それ故Ｈ．２６４のシンタックスは、ヘッダ（ピクチャヘッダ、スライスヘッダ、マクロブロックヘッダのような）及びデータ（動きベクトル、ブロック変換係数、量子化スケール等のような）の通常の階層で構成される。データ構造に関連する知られた概念（例えばＩ、Ｐ又はＢピクチャ、画面内（intra）及び画面間（inter）マクロブロック）の殆どは維持されるが、幾つかの新たな概念も、ヘッダ及びデータの両方のレベルにおいて導入される。主にＨ．２６４／ＡＶＣは、ビデオデータの内容を効率的に表すために定義されたビデオ符号化レイヤ（ＶＣＬ）と、より高レベルの（トランスポート）システムによる伝送に適した態様でデータを形式化しヘッダ情報を提供するネットワーク抽象レイヤ（ＮＡＬ）とを分離する。

データレベルにおけるＨ．２６４／ＡＶＣの主な特殊性の１つは、１６ｘ１６のマクロブロックのより精巧な分割と操作の利用である（マクロブロックＭＢは、１６ｘ１６ブロックの輝度と、対応する８ｘ８ブロックの色差とを共に含むが、例えば動き補償のような多くの動作において、実際には輝度のみを考慮し、結果を色差に投影する）。従って、動き補償処理は、サンプルグリッドの４分の１に及ぶ動きベクトル精度を利用して、４ｘ４のサイズのような小さなＭＢのセグメント化を形成する。また、サンプルブロックの動き補償予測のための選択処理は、隣接する１つのみではなく、以前に復号化された幾つかの保存されたピクチャを含むことができる。画面内符号化を用いる場合であっても、近隣のブロックから、以前に復号化されたサンプルを利用して、ブロックの予測を形成することが可能である（該空間ベースの予測のための規則は、所謂画面内予測モードによって記述される）。該態様は特に、ここで定義される本発明に関連するものであり、以下の説明で記載される。動き補償予測又は空間ベース予測のいずれかの後、結果の予測誤差は通常、従来の８ｘ８サイズの代わりに、４ｘ４ブロックサイズに基づいて変換され量子化される。Ｈ．２６４／ＡＶＣ規格はまた、他の符号化段において他の特定の方法（例えばエントロピー符号化）を利用し、その殆どは固定されピクチャレベルにおいて又はピクチャレベルより高いレベルにおいてのみ変更され得る。

以前の規格においてそうであったように、Ｈ．２６４／ＡＶＣは画像ブロックが画面内モード、即ち隣接する画像からの時間的予測の利用なく、符号化されることを可能とする。Ｈ．２６４／ＡＶＣ画面内符号化の新規な点は、空間予測を利用して、同一のピクチャ中の以前に符号化され再構築されたサンプルから形成されるブロックＰにより画面内ブロックを予測することを可能とする点である。該予測ブロックＰは符号化に先立って実際の画像ブロックから減算され、この点が実際に画像ブロックが直接符号化される既存の規格（例えばＭＰＥＧ−２、ＭＰＥＧ−４ＡＳＰ）とは異なる点である。画面内モードの選択は復号化器に通知される必要があり、この目的のためＨ．２６４は効率的な符号化手順を定義している（中心となる発想は、近隣の４ｘ４ブロックのモードがしばしば強く相関していることを利用することにより、４ｘ４モードの別々の符号化を避けることである）。

コンピューティング、通信及びディジタルデータ記憶の近年の進歩は、プロフェッショナル環境及び消費者環境の両方において、着実に増えつづける容量及びコンテンツの種類により特徴付けられる、大きなディジタルアーカイブの巨大な成長をもたらした。それ故、保存された関心のある情報を素早く取り出すための効率的な方法を見出すことが、極めて重要である。保存されているテラバイトの整理されていないデータから手動で検索することは冗長で時間を浪費するものであるため、情報検索及び取得のタスクを自動化されたシステムに移管するニーズが高まっている。構造化されていないビデオコンテンツの大きなアーカイブにおける検索及び取得は通常、コンテンツ分析手法を用いてコンテンツがインデクシングされた後に実行される。これらの手法は、ビデオコンテンツの記述を考慮して、ビデオマテリアルのアノテーション（annotation）を自動的に生成することを目的とするアルゴリズムを有する（斯かるアノテーションは、色及びテクスチャのような低レベルの信号関連特性から、顔の存在及び位置のような高レベルの情報にまで亘る）。

重要なコンテンツ記述子は、所謂モノクロ（monochrome）即ち「単色」のフレームインジケータである。フレームは、同じ色で完全に満たされている場合には、モノクロとして考慮される（実際には、信号の生成から配布までにおけるノイズのため、モノクロのフレームはしばしば１つの単一の色（例えば青、濃い灰色又は黒）の知覚できない程度の変化を呈する）。モノクロのフレームを検出することは、多くのコンテンツベースの検索アプリケーションにおいて重要なステップである。例えば、米国特許出願公開ＵＳ２００２／０１８６７６８において記載されているように、コマーシャル検出器及び番組境界検出器は、２つの連続する番組を分離するために又はコマーシャルから番組を分離するために放送者によって挿入された、通常黒であるモノクロのフレームの存在の識別に依存している。モノクロのフレームの検出はまた、可視のテーブル・オブ・コンテンツ（table of content）から情報価値のないキーフレームをフィルタリングして除去するために利用される。

登場しつつあるＨ．２６４／ＭＰＥＧ−４ＡＶＣ規格のための広い応用分野のため、２６４／ＡＶＣビデオコンテンツ解析の効率的な方法の要求が拡大するであろう。ここ数年の間で、圧縮されたドメインにおいて殆ど専ら動作する、幾つかの効率的なコンテンツ解析アルゴリズム及び方法がＭＰＥＧ−２ビデオについて実証されている。上述したように、Ｈ．２６４／ＡＶＣはある意味でＭＰＥＧ−２のシンタックスの上位集合を規定しているため、これらの方法の殆どはＨ．２６４／ＡＶＣに拡張され得る。しかしながら、ＭＰＥＧ−２の制限のため、これら既存の方法の幾つかは適切な又は信頼性高い性能をもたらさず、このことが、典型的に画素又はオーディオドメインにおいて動作する付加的な及びしばしば高価な方法を含めることにより対処される欠点である。

２００４年８月に出願された欧州特許出願０４３００１８９．０（ＰＨＦＲ０４００４０）は、前記欠点を回避することを可能とする方法を提案している。具体的には、前記欧州特許出願は、連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能な、ディジタル符号化されたビデオデータに適用される検出方法であって、前記フレームは少なくとも、直接に又は同一のフレーム中の以前に符号化され再構築されたサンプルから形成された少なくとも１つのブロックからの空間予測により、他のいずれのフレームからも独立に符号化されるＩフレームと、時間的に前記Ｉフレーム間に配置され、少なくとも以前のＩ又はＰフレームから予測されるＰフレームと、時間的にＩフレームとＰフレームとの間、又は２つのＰフレーム間に配置されるＢフレームであって、該Ｂフレームがその間に配置された少なくとも２つのフレームから双方向的に予測されるＢフレームとを含み、前記検出方法は更に、
現在のフレームの各連続するブロックについて、所定の画面内予測モードにより、当該ブロックが符号化されているか否かを決定するステップと、
前記現在のフレームの全ての連続するブロックについて類似の情報を収集し、前記所定の画面内予測モードに関連する統計を配信するステップと、
前記画面内予想モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために前記統計を解析するステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
を含む検出方法（及び対応する検出装置）に関する。

前記欧州特許出願に記載された技術的な方法の原理は、Ｈ．２６４／ＡＶＣの革新的な符号化ツールである画面内予測モードが、モノクロフレームの検出の目的に有利に利用され得るという事実に基づく。主な発想は、画像を構成するマクロブロックについて画面内予測モードの分布を観測することである。モノクロの画像又はサブ画像は、ブロックの殆どが同一又は類似の予測モードを呈する場合に検出される。斯かるブロックの数が例えば、一定の閾値と比較されても良い。画像（又はサブ画像）中のブロックの殆どが特定の画面内予測モードにより符号化される場合、該画像（又はサブ画像）は非常に低い空間変化を呈し、モノクロであるか又は繰り返しのパターンを含むかのいずれかである（上述した該アルゴリズムのテーブル・オブ・コンテンツの生成への適用については、又はキーフレーム抽出のため、モノクロである及び繰り返しのパターンを含むタイプの画像又はサブ画像は共に破棄される必要がある）。

ＭＰＥＧ−７規格の草案ISO/IEC 1/SC 29 N 4242（２００１年１０月２３日）によれば、マルチメディアコンテンツの特徴を記述するためのツール、特に記述子Ｄ及び記述スキームＤＳが規定されている。

本発明による符号化方法の定義は以下である。符号化されるべきディジタルビデオデータは、連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるＩフレームと、時間的に前記Ｉフレーム間に配置され、少なくとも以前のＩ又はＰフレームから予測されるＰフレームと、時間的にＩフレームとＰフレームとの間、又は２つのＰフレーム間に配置されるＢフレームであって、該Ｂフレームが間に配置された少なくとも２つのフレームから双方向的に予測されるＢブレームとの形で符号化される。本符号化方法は更に、
現在のフレームの連続するブロックの全てについて、前記ブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップと、を有する。

これらのステップは、本発明により、
連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化装置であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるＩフレームと、時間的に前記Ｉフレーム間に配置され、少なくとも以前のＩ又はＰフレームから予測されるＰフレームと、時間的にＩフレームとＰフレームとの間、又は２つのＰフレーム間に配置されるＢフレームであって、該Ｂフレームが間に配置された少なくとも２つのフレームから双方向的に予測されるＢブレームとの形で符号化され、前記符号化装置は、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化手段と、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算手段と、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析手段と、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出手段と、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述手段と、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化手段と、
を有する符号化装置によって実装される。

本発明による符号化方法のステップはまた、コンピュータ読み取り可能な媒体に保存されたコンピュータ実行可能な処理ステップであって、同様に、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するステップと、
を有する処理ステップによっても実装され得る。

本発明は更に、前記符号化装置の出力部において利用可能なもののような、上述した符号化方法によりディジタルビデオデータを符号化することにより生成された、送信可能な符号化信号に関する。

本発明は上述した実施例に限定されるものではなく、添付される請求項において定義されるような本発明の精神及び範囲から逸脱することなく、変形及び変更が為され得ることはここで示唆しておく必要がある。

例えば、本明細書又は請求項において利用される「マクロブロック（macroblock）」及び「ブロック（block）」なる語は、例えばＭＰＥＧ−２又はＭＰＥＧ−４のような規格において利用されるような、フレームの長方形のサブ領域の階層のみを記述することを意図されたものではなく、不規則な形状のブロックに基づく符号化又は復号化方式において生じ得るような、いずれの種類の任意形状のサブ領域をも意図していることに留意されたい。

また、ハードウェア又はソフトウェアのアイテムにより機能を実装する種々の方法があることは留意されるべきである。この点に関して、図面は非常に模式的なものであり、図が異なる機能を異なるブロックとして示す場合には、このことは決してハードウェア又はソフトウェアの単一のアイテムが幾つかの機能を実行することを除外するものではない。また、ハードウェア若しくはソフトウェア又はこれらの両方のアイテムの組み合わせが機能を実行することを除外するものでもない。

また、「有する（comprising）」なる語は、請求項において列記されたもの以外の要素又はステップの存在を除外するものではない。要素又はステップに先行する「１つの（a又はan）」なる語は、複数の斯かる要素又はステップの存在を除外するものではない。

ユーザが他の記述子（規格内又はことによると規格外の）を展開し得るＭＰＥＧ−７環境を定義するための、ＭＰＥＧ−７の規範的要素及びこれらの関係の概要図を示す。マルチメディアデータを符号化することを可能とする符号化方法を示す。マルチメディアデータを復号化することを可能とする復号化方法を示す。

Claims

連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化方法であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるＩフレームと、時間的に前記Ｉフレーム間に配置され、少なくとも以前のＩ又はＰフレームから予測されるＰフレームと、時間的にＩフレームとＰフレームとの間、又は２つのＰフレーム間に配置されるＢフレームであって、該Ｂフレームが間に配置された少なくとも２つのフレームから双方向的に予測されるＢブレームとの形で符号化され、前記符号化方法は、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップと、
を有する符号化方法。
連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化装置であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるＩフレームと、時間的に前記Ｉフレーム間に配置され、少なくとも以前のＩ又はＰフレームから予測されるＰフレームと、時間的にＩフレームとＰフレームとの間、又は２つのＰフレーム間に配置されるＢフレームであって、該Ｂフレームが間に配置された少なくとも２つのフレームから双方向的に予測されるＢブレームとの形で符号化され、前記符号化装置は、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化手段と、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算手段と、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析手段と、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出手段と、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述手段と、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化手段と、
を有する符号化装置。
連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化装置における使用であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるＩフレームと、時間的に前記Ｉフレーム間に配置され、少なくとも以前のＩ又はＰフレームから予測されるＰフレームと、時間的にＩフレームとＰフレームとの間、又は２つのＰフレーム間に配置されるＢフレームであって、該Ｂフレームが間に配置された少なくとも２つのフレームから双方向的に予測されるＢブレームとの形で符号化され、前記符号化装置は、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化手段と、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算手段と、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析手段と、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出手段と、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述手段と、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化手段と、
を有する使用。
ディジタルビデオデータ符号化装置のためのコンピュータプログラムであって、前記符号化装置にロードされたときに前記符号化装置が請求項３に記載のステップを実行するようにする命令のセットを有するコンピュータプログラム。
請求項１に記載の符号化方法によりディジタルビデオデータを符号化することにより生成される、伝送可能な符号化信号。