JP2007533197A - マルチメディアデータに適用される符号化方法 - Google Patents
マルチメディアデータに適用される符号化方法 Download PDFInfo
- Publication number
- JP2007533197A JP2007533197A JP2007506900A JP2007506900A JP2007533197A JP 2007533197 A JP2007533197 A JP 2007533197A JP 2007506900 A JP2007506900 A JP 2007506900A JP 2007506900 A JP2007506900 A JP 2007506900A JP 2007533197 A JP2007533197 A JP 2007533197A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- encoding
- frames
- image
- macroblocks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本発明は、連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化方法に関する。これらのフレームは少なくとも、独立に符号化されるIフレームと、少なくとも以前のI又はPフレームから予測されるPフレームと、Bフレームであって該Bフレームがその間に配置された少なくとも2つのフレームから双方向的に予測されるBフレームとの形で符号化される。本発明によれば、前記符号化方法は、現在のフレームのマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、前記パラメータに関連する統計を配信するための計算ステップと、前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、前記記述データ及び元のデータの両方を符号化するための符号化ステップと、を有する。
Description
本発明は、マクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化方法であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるIフレームと、時間的に前記Iフレーム間に配置され、少なくとも以前のI又はPフレームから予測されるPフレームと、時間的にIフレームとPフレームとの間、又は2つのPフレーム間に配置されるBフレームであって、該Bフレームが間に配置された少なくとも2つのフレームから双方向的に予測されるBブレームとの形で符号化される符号化方法に関する。
本発明はまた、コンピュータ読み取り可能な記憶媒体に保存されるために提供された、前記符号化方法において定義されたステップを有する、対応するコンピュータ実行可能な処理ステップ、及び斯かる符号化方法によりディジタルビデオデータを符号化することにより生成された送信可能な符号化信号に関する。
今日、ますます多くのディジタル放送サービスが利用可能であり、それ故一般に情報技術の専門家ではないユーザによっても、マルチメディア情報リソースの適切な利用を可能とすることは有用であると考えられる。前記マルチメディア情報は一般に、ストリーミング、圧縮及びユーザインタラクティブ性のような動作を考慮して操作されることを意図された、自然の及び合成のオーディオ、ビジュアル及びオブジェクトデータから成る。MPEG−4規格は、前記動作を実行することを可能とする多くの機能を提供する、最も合意のとれた方法の1つである。MPEG−4の最も重要な側面は、オブジェクトの概念によるインタラクティブ性のサポートである。場面のオブジェクトは独立に符号化され、幾つかのビットストリーム、即ち所謂基本ストリームとしての圧縮された形態で、同時に保存され送信される。
MPEG−4の規定は、これら基本ストリーム(オーディオ、ビデオ、・・・等)を識別及び記述し、適切な方法でこれら基本ストリームを関連付け、これにより場面の記述を取得し、エンドユーザに対して有意なマルチメディア場面を構築し提示することを意図された、オブジェクト記述フレームワークを含む。MPEG−4は、オブジェクトの構成要素としてマルチメディアデータをモデル化し、オブジェクトはオーディオ−ビジュアルの場面のいずれの要素をも指定する。しかしながら、該規格の大きな成功は、今日ますます多くの情報がディジタルの形態で利用可能であるという事実をもたらしている。それ故、正しい情報を見つけ出し選択することは、人間のユーザにとって困難となっており、いずれかの特定の目的のためのオーディオ−ビジュアルデータに対して動作する自動化されたシステムにとっても同様に困難となっている。人間のユーザ及び自動化されたシステムは共に、前記情報の内容についての情報を、例えば前記内容に関する決定を為すために必要とする。
MPEG−7規格の目的は、未だ固まっていないが、前記コンテンツを記述すること、即ち、音声、オーディオ、ビデオ、静止画、3Dモデル等のような種々のマルチメディアマテリアルを記述する標準化された方法、更にはこれらの要素がマルチメディア文書にどのように組み合わせられるかを記述する方法を見出すことである。それ故MPEG−7は、記述子D(各記述子は、例えば画像の色、オブジェクトの動き、映画のタイトル等のようなコンテンツの特有の特徴を特徴付けることが可能である)、記述スキームDS(記述スキームは前記記述子の構造及び関係を定義する)、記述定義言語DDL(前記記述子及び記述スキームを特定することを意図されている)と呼ばれる幾つかの規範的な要素、及びこれらの記述のための符号化方式を定義することを意図されている。図1は、これらのMPEG−7の規範的要素及びこれらの関係の概要図を示す。記述子及び記述スキームを標準化することが必要か否かは、依然としてMPEGにおいて議論されている。しかしながら、少なくとも最も広く利用されるセットは標準化されるであろう見込みが高いと思われる。
それ故本発明の目的は、MPEG−7規格に関連して非常に有用であると考えられる新たな記述子を提案することにある。
この目的のため、本発明は、本明細書の導入部に定義されたような符号化方法であって、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップとを有することを特徴とする符号化方法に関する。
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップとを有することを特徴とする符号化方法に関する。
本発明の他の目的は、前記方法を実行することを可能とするコンピュータ実行可能な処理ステップのセットを提案することにある。
この目的のため、本発明は、連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化装置における使用であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるIフレームと、時間的に前記Iフレーム間に配置され、少なくとも以前のI又はPフレームから予測されるPフレームと、時間的にIフレームとPフレームとの間、又は2つのPフレーム間に配置されるBフレームであって、該Bフレームが間に配置された少なくとも2つのフレームから双方向的に予測されるBブレームとの形で符号化される使用のための、コンピュータ読み取り可能な記憶媒体に保存されるように備えられたコンピュータ実行可能な処理ステップであって、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップと、を有する処理ステップに関する。
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップと、を有する処理ステップに関する。
本発明は、添付図面を参照しながら、例として以下に説明される。
図2に示される、本発明による複数のマルチメディアデータを符号化する方法は、利用可能なマルチメディアデータを1つ又は幾つかのビットストリームに変換する取得ステップ(CONV)と、分析及びセグメント化により前記ビットストリーム中の種々のレベルの情報をキャプチャリングする構造化ステップ(SEGM)と、得られたレベルの情報の記述データを生成する記述ステップと、かくして得られた記述データを符号化することを可能とする符号化ステップ(COD)を有する。より詳しくは、前記記述ステップは、前記複数のマルチメディアデータに関連する記述子のセットを保存するための定義サブステップ(DEF)と、元のマルチメディアデータに基づいて、前記構造化ステップにおいて得られた全レベルの情報によって、符号化されるべき記述データを選択する記述サブステップ(DESC)と、を有する。前記符号化されたデータは次いで送信及び/又は保存される。図3に示される対応する復号化方法は、上述した符号化方法により符号化された信号を復号化するステップ(DECOD)と、かくして得られた前記復号化された信号を保存するステップ(STOR)と、ユーザ(USER)によって送信されたコマンドに基づき、前記復号化された信号により構成されるデータから検索するステップ(SEARCH)と、前記保存されたデータ中の前記検索の結果を前記ユーザに返送するステップと、を有する。
全てのとり得るマルチメディアコンテンツに関連して保存された記述子のなかで、本発明により提案されるものは、2003年にITU−TによりRecommendation H.264/AVCとして、及びISO/IECによりInternational Standard 14496-10 (MPEG-4 Part 10) Advanced Video Coding (AVC)として公式に承認されることが予期される、将来の規格H.264/AVCに基づく。該新たな規格は、MPEG−2のような確立された規格から知られたブロックベース動き補償変換符号化と同じ原理を利用している。それ故H.264のシンタックスは、ヘッダ(ピクチャヘッダ、スライスヘッダ、マクロブロックヘッダのような)及びデータ(動きベクトル、ブロック変換係数、量子化スケール等のような)の通常の階層で構成される。データ構造に関連する知られた概念(例えばI、P又はBピクチャ、画面内(intra)及び画面間(inter)マクロブロック)の殆どは維持されるが、幾つかの新たな概念も、ヘッダ及びデータの両方のレベルにおいて導入される。主にH.264/AVCは、ビデオデータの内容を効率的に表すために定義されたビデオ符号化レイヤ(VCL)と、より高レベルの(トランスポート)システムによる伝送に適した態様でデータを形式化しヘッダ情報を提供するネットワーク抽象レイヤ(NAL)とを分離する。
データレベルにおけるH.264/AVCの主な特殊性の1つは、16x16のマクロブロックのより精巧な分割と操作の利用である(マクロブロックMBは、16x16ブロックの輝度と、対応する8x8ブロックの色差とを共に含むが、例えば動き補償のような多くの動作において、実際には輝度のみを考慮し、結果を色差に投影する)。従って、動き補償処理は、サンプルグリッドの4分の1に及ぶ動きベクトル精度を利用して、4x4のサイズのような小さなMBのセグメント化を形成する。また、サンプルブロックの動き補償予測のための選択処理は、隣接する1つのみではなく、以前に復号化された幾つかの保存されたピクチャを含むことができる。画面内符号化を用いる場合であっても、近隣のブロックから、以前に復号化されたサンプルを利用して、ブロックの予測を形成することが可能である(該空間ベースの予測のための規則は、所謂画面内予測モードによって記述される)。該態様は特に、ここで定義される本発明に関連するものであり、以下の説明で記載される。動き補償予測又は空間ベース予測のいずれかの後、結果の予測誤差は通常、従来の8x8サイズの代わりに、4x4ブロックサイズに基づいて変換され量子化される。H.264/AVC規格はまた、他の符号化段において他の特定の方法(例えばエントロピー符号化)を利用し、その殆どは固定されピクチャレベルにおいて又はピクチャレベルより高いレベルにおいてのみ変更され得る。
以前の規格においてそうであったように、H.264/AVCは画像ブロックが画面内モード、即ち隣接する画像からの時間的予測の利用なく、符号化されることを可能とする。H.264/AVC画面内符号化の新規な点は、空間予測を利用して、同一のピクチャ中の以前に符号化され再構築されたサンプルから形成されるブロックPにより画面内ブロックを予測することを可能とする点である。該予測ブロックPは符号化に先立って実際の画像ブロックから減算され、この点が実際に画像ブロックが直接符号化される既存の規格(例えばMPEG−2、MPEG−4ASP)とは異なる点である。画面内モードの選択は復号化器に通知される必要があり、この目的のためH.264は効率的な符号化手順を定義している(中心となる発想は、近隣の4x4ブロックのモードがしばしば強く相関していることを利用することにより、4x4モードの別々の符号化を避けることである)。
コンピューティング、通信及びディジタルデータ記憶の近年の進歩は、プロフェッショナル環境及び消費者環境の両方において、着実に増えつづける容量及びコンテンツの種類により特徴付けられる、大きなディジタルアーカイブの巨大な成長をもたらした。それ故、保存された関心のある情報を素早く取り出すための効率的な方法を見出すことが、極めて重要である。保存されているテラバイトの整理されていないデータから手動で検索することは冗長で時間を浪費するものであるため、情報検索及び取得のタスクを自動化されたシステムに移管するニーズが高まっている。構造化されていないビデオコンテンツの大きなアーカイブにおける検索及び取得は通常、コンテンツ分析手法を用いてコンテンツがインデクシングされた後に実行される。これらの手法は、ビデオコンテンツの記述を考慮して、ビデオマテリアルのアノテーション(annotation)を自動的に生成することを目的とするアルゴリズムを有する(斯かるアノテーションは、色及びテクスチャのような低レベルの信号関連特性から、顔の存在及び位置のような高レベルの情報にまで亘る)。
重要なコンテンツ記述子は、所謂モノクロ(monochrome)即ち「単色」のフレームインジケータである。フレームは、同じ色で完全に満たされている場合には、モノクロとして考慮される(実際には、信号の生成から配布までにおけるノイズのため、モノクロのフレームはしばしば1つの単一の色(例えば青、濃い灰色又は黒)の知覚できない程度の変化を呈する)。モノクロのフレームを検出することは、多くのコンテンツベースの検索アプリケーションにおいて重要なステップである。例えば、米国特許出願公開US2002/0186768において記載されているように、コマーシャル検出器及び番組境界検出器は、2つの連続する番組を分離するために又はコマーシャルから番組を分離するために放送者によって挿入された、通常黒であるモノクロのフレームの存在の識別に依存している。モノクロのフレームの検出はまた、可視のテーブル・オブ・コンテンツ(table of content)から情報価値のないキーフレームをフィルタリングして除去するために利用される。
登場しつつあるH.264/MPEG−4AVC規格のための広い応用分野のため、264/AVCビデオコンテンツ解析の効率的な方法の要求が拡大するであろう。ここ数年の間で、圧縮されたドメインにおいて殆ど専ら動作する、幾つかの効率的なコンテンツ解析アルゴリズム及び方法がMPEG−2ビデオについて実証されている。上述したように、H.264/AVCはある意味でMPEG−2のシンタックスの上位集合を規定しているため、これらの方法の殆どはH.264/AVCに拡張され得る。しかしながら、MPEG−2の制限のため、これら既存の方法の幾つかは適切な又は信頼性高い性能をもたらさず、このことが、典型的に画素又はオーディオドメインにおいて動作する付加的な及びしばしば高価な方法を含めることにより対処される欠点である。
2004年8月に出願された欧州特許出願04300189.0(PHFR040040)は、前記欠点を回避することを可能とする方法を提案している。具体的には、前記欧州特許出願は、連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能な、ディジタル符号化されたビデオデータに適用される検出方法であって、前記フレームは少なくとも、直接に又は同一のフレーム中の以前に符号化され再構築されたサンプルから形成された少なくとも1つのブロックからの空間予測により、他のいずれのフレームからも独立に符号化されるIフレームと、時間的に前記Iフレーム間に配置され、少なくとも以前のI又はPフレームから予測されるPフレームと、時間的にIフレームとPフレームとの間、又は2つのPフレーム間に配置されるBフレームであって、該Bフレームがその間に配置された少なくとも2つのフレームから双方向的に予測されるBフレームとを含み、前記検出方法は更に、
現在のフレームの各連続するブロックについて、所定の画面内予測モードにより、当該ブロックが符号化されているか否かを決定するステップと、
前記現在のフレームの全ての連続するブロックについて類似の情報を収集し、前記所定の画面内予測モードに関連する統計を配信するステップと、
前記画面内予想モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために前記統計を解析するステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
を含む検出方法(及び対応する検出装置)に関する。
現在のフレームの各連続するブロックについて、所定の画面内予測モードにより、当該ブロックが符号化されているか否かを決定するステップと、
前記現在のフレームの全ての連続するブロックについて類似の情報を収集し、前記所定の画面内予測モードに関連する統計を配信するステップと、
前記画面内予想モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために前記統計を解析するステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
を含む検出方法(及び対応する検出装置)に関する。
前記欧州特許出願に記載された技術的な方法の原理は、H.264/AVCの革新的な符号化ツールである画面内予測モードが、モノクロフレームの検出の目的に有利に利用され得るという事実に基づく。主な発想は、画像を構成するマクロブロックについて画面内予測モードの分布を観測することである。モノクロの画像又はサブ画像は、ブロックの殆どが同一又は類似の予測モードを呈する場合に検出される。斯かるブロックの数が例えば、一定の閾値と比較されても良い。画像(又はサブ画像)中のブロックの殆どが特定の画面内予測モードにより符号化される場合、該画像(又はサブ画像)は非常に低い空間変化を呈し、モノクロであるか又は繰り返しのパターンを含むかのいずれかである(上述した該アルゴリズムのテーブル・オブ・コンテンツの生成への適用については、又はキーフレーム抽出のため、モノクロである及び繰り返しのパターンを含むタイプの画像又はサブ画像は共に破棄される必要がある)。
MPEG−7規格の草案ISO/IEC 1/SC 29 N 4242(2001年10月23日)によれば、マルチメディアコンテンツの特徴を記述するためのツール、特に記述子D及び記述スキームDSが規定されている。
本発明による符号化方法の定義は以下である。符号化されるべきディジタルビデオデータは、連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるIフレームと、時間的に前記Iフレーム間に配置され、少なくとも以前のI又はPフレームから予測されるPフレームと、時間的にIフレームとPフレームとの間、又は2つのPフレーム間に配置されるBフレームであって、該Bフレームが間に配置された少なくとも2つのフレームから双方向的に予測されるBブレームとの形で符号化される。本符号化方法は更に、
現在のフレームの連続するブロックの全てについて、前記ブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップと、を有する。
現在のフレームの連続するブロックの全てについて、前記ブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップと、を有する。
これらのステップは、本発明により、
連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化装置であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるIフレームと、時間的に前記Iフレーム間に配置され、少なくとも以前のI又はPフレームから予測されるPフレームと、時間的にIフレームとPフレームとの間、又は2つのPフレーム間に配置されるBフレームであって、該Bフレームが間に配置された少なくとも2つのフレームから双方向的に予測されるBブレームとの形で符号化され、前記符号化装置は、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化手段と、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算手段と、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析手段と、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出手段と、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述手段と、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化手段と、
を有する符号化装置によって実装される。
連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化装置であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるIフレームと、時間的に前記Iフレーム間に配置され、少なくとも以前のI又はPフレームから予測されるPフレームと、時間的にIフレームとPフレームとの間、又は2つのPフレーム間に配置されるBフレームであって、該Bフレームが間に配置された少なくとも2つのフレームから双方向的に予測されるBブレームとの形で符号化され、前記符号化装置は、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化手段と、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算手段と、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析手段と、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出手段と、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述手段と、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化手段と、
を有する符号化装置によって実装される。
本発明による符号化方法のステップはまた、コンピュータ読み取り可能な媒体に保存されたコンピュータ実行可能な処理ステップであって、同様に、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するステップと、
を有する処理ステップによっても実装され得る。
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するステップと、
を有する処理ステップによっても実装され得る。
本発明は更に、前記符号化装置の出力部において利用可能なもののような、上述した符号化方法によりディジタルビデオデータを符号化することにより生成された、送信可能な符号化信号に関する。
本発明は上述した実施例に限定されるものではなく、添付される請求項において定義されるような本発明の精神及び範囲から逸脱することなく、変形及び変更が為され得ることはここで示唆しておく必要がある。
例えば、本明細書又は請求項において利用される「マクロブロック(macroblock)」及び「ブロック(block)」なる語は、例えばMPEG−2又はMPEG−4のような規格において利用されるような、フレームの長方形のサブ領域の階層のみを記述することを意図されたものではなく、不規則な形状のブロックに基づく符号化又は復号化方式において生じ得るような、いずれの種類の任意形状のサブ領域をも意図していることに留意されたい。
また、ハードウェア又はソフトウェアのアイテムにより機能を実装する種々の方法があることは留意されるべきである。この点に関して、図面は非常に模式的なものであり、図が異なる機能を異なるブロックとして示す場合には、このことは決してハードウェア又はソフトウェアの単一のアイテムが幾つかの機能を実行することを除外するものではない。また、ハードウェア若しくはソフトウェア又はこれらの両方のアイテムの組み合わせが機能を実行することを除外するものでもない。
また、「有する(comprising)」なる語は、請求項において列記されたもの以外の要素又はステップの存在を除外するものではない。要素又はステップに先行する「1つの(a又はan)」なる語は、複数の斯かる要素又はステップの存在を除外するものではない。
Claims (5)
- 連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化方法であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるIフレームと、時間的に前記Iフレーム間に配置され、少なくとも以前のI又はPフレームから予測されるPフレームと、時間的にIフレームとPフレームとの間、又は2つのPフレーム間に配置されるBフレームであって、該Bフレームが間に配置された少なくとも2つのフレームから双方向的に予測されるBブレームとの形で符号化され、前記符号化方法は、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化ステップと、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算ステップと、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析ステップと、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出ステップと、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述ステップと、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化ステップと、
を有する符号化方法。 - 連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化装置であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるIフレームと、時間的に前記Iフレーム間に配置され、少なくとも以前のI又はPフレームから予測されるPフレームと、時間的にIフレームとPフレームとの間、又は2つのPフレーム間に配置されるBフレームであって、該Bフレームが間に配置された少なくとも2つのフレームから双方向的に予測されるBブレームとの形で符号化され、前記符号化装置は、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化手段と、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算手段と、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析手段と、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出手段と、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述手段と、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化手段と、
を有する符号化装置。 - 連続したブロックに更に分割されるマクロブロックに分割された連続するフレームを有するビデオストリームの形態で利用可能なディジタルビデオデータを符号化するための符号化装置における使用であって、前記フレームは少なくとも、画面内符号化モードにより独立に符号化されるIフレームと、時間的に前記Iフレーム間に配置され、少なくとも以前のI又はPフレームから予測されるPフレームと、時間的にIフレームとPフレームとの間、又は2つのPフレーム間に配置されるBフレームであって、該Bフレームが間に配置された少なくとも2つのフレームから双方向的に予測されるBブレームとの形で符号化され、前記符号化装置は、
現在のフレームの連続するマクロブロックの全てについて、前記マクロブロックが所定の画面内予測モードにより符号化されているか否かという事実を特徴付ける関連する符号化パラメータを捕捉するために備えられた構造化手段と、
前記現在のフレームについて、前記パラメータに関連する統計を配信するための計算手段と、
前記統計を解析し、前記画面内予測モードを呈する又は呈さない前記現在のフレームのブロックの数を決定するために備えられた解析手段と、
前記数が所定の閾値を超える度に、モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現を検出するために備えられた検出手段と、
前記モノクロであるか又は繰り返しパターンを持つ画像又は画像のサブ領域の出現の記述データを生成するために備えられた記述手段と、
かくして得られた前記記述データ及び元の前記ディジタルビデオデータを符号化するために備えられた符号化手段と、
を有する使用。 - ディジタルビデオデータ符号化装置のためのコンピュータプログラムであって、前記符号化装置にロードされたときに前記符号化装置が請求項3に記載のステップを実行するようにする命令のセットを有するコンピュータプログラム。
- 請求項1に記載の符号化方法によりディジタルビデオデータを符号化することにより生成される、伝送可能な符号化信号。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04300194 | 2004-04-08 | ||
PCT/IB2005/051108 WO2005099274A1 (en) | 2004-04-08 | 2005-04-04 | Coding method applied to multimedia data |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007533197A true JP2007533197A (ja) | 2007-11-15 |
Family
ID=34962632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007506900A Pending JP2007533197A (ja) | 2004-04-08 | 2005-04-04 | マルチメディアデータに適用される符号化方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20080267290A1 (ja) |
EP (1) | EP1751986A1 (ja) |
JP (1) | JP2007533197A (ja) |
KR (1) | KR20070032633A (ja) |
CN (1) | CN1943247A (ja) |
WO (1) | WO2005099274A1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8073049B2 (en) | 2007-02-01 | 2011-12-06 | Google Inc. | Method of coding a video signal |
KR100803622B1 (ko) * | 2007-06-19 | 2008-02-19 | 김용근 | 컨텐츠 제공 시스템 |
EP2086237B1 (en) * | 2008-02-04 | 2012-06-27 | Alcatel Lucent | Method and device for reordering and multiplexing multimedia packets from multimedia streams pertaining to interrelated sessions |
EP2109047A1 (en) * | 2008-04-07 | 2009-10-14 | Global Digital Technologies SA | Video characterization, identification and search system |
FR2930668B1 (fr) * | 2008-04-25 | 2010-06-18 | Citilog | Systeme d'aide a l'exploitation d'un reseau routier a qualite de service |
US8264524B1 (en) * | 2008-09-17 | 2012-09-11 | Grandeye Limited | System for streaming multiple regions deriving from a wide-angle camera |
JP2011139262A (ja) * | 2009-12-28 | 2011-07-14 | Sony Corp | 画像処理装置、画像処理方法、およびプログラム |
KR20110095800A (ko) * | 2010-02-19 | 2011-08-25 | 삼성전자주식회사 | 코덱에 의해 압축된 동영상 컨텐트 전송 방법 및 그 장치 |
KR20110121866A (ko) * | 2010-05-03 | 2011-11-09 | 삼성전자주식회사 | 휴대용 장치 및 그의 측정 데이터 처리 방법 |
KR101379188B1 (ko) * | 2010-05-17 | 2014-04-18 | 에스케이 텔레콤주식회사 | 인트라 블록 및 인터 블록이 혼합된 코딩블록을 이용하는 영상 부호화/복호화 장치 및 그 방법 |
CN102907099A (zh) * | 2010-05-20 | 2013-01-30 | 星河通信株式会社 | 适用利用选择性运动检索区域的运动补偿方法的视频压缩编码装置及解码装置和用于运动补偿的选择性运动检索区域的决定方法 |
US20130064302A1 (en) * | 2010-05-20 | 2013-03-14 | Galaxia Communications Co., Ltd. | Video compression coding device and decoding device applied with motion compensation technique using selective reference frame, and method for determining selective reference frame for motion compensation |
US20120002718A1 (en) * | 2010-07-01 | 2012-01-05 | Samsung Electronics Co., Ltd. | Method and apparatus for selecting video codec to be used between stations |
JP5400009B2 (ja) * | 2010-09-27 | 2014-01-29 | ルネサスエレクトロニクス株式会社 | トランスコード装置及びトランコード方法並びにプログラム |
WO2012074331A2 (ko) * | 2010-12-02 | 2012-06-07 | 한국전자통신연구원 | 스테레오스코픽 영상 정보의 전송 방법 및 장치 |
US20120162394A1 (en) * | 2010-12-23 | 2012-06-28 | Tektronix, Inc. | Displays for easy visualizing of 3d disparity data |
US20120290363A1 (en) * | 2011-05-09 | 2012-11-15 | Abengoa Bioenergia Nuevas Tecnologias, S.A. | Method of monitoring sustainability of bioproducts |
US20130002812A1 (en) * | 2011-06-29 | 2013-01-03 | General Instrument Corporation | Encoding and/or decoding 3d information |
CN102857762B (zh) * | 2011-07-01 | 2016-03-30 | 华为技术有限公司 | 一种解码过程中块索引信息的获取方法及装置 |
US9082214B2 (en) * | 2011-07-01 | 2015-07-14 | Disney Enterprises, Inc. | 3D drawing system for providing a real time, personalized, and immersive artistic experience |
JP5893346B2 (ja) * | 2011-11-07 | 2016-03-23 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
US9392235B2 (en) | 2011-11-18 | 2016-07-12 | Google Technology Holdings LLC | Explicit way for signaling a collocated reference picture for video coding |
CN103959791B (zh) | 2011-11-18 | 2017-07-04 | 谷歌技术控股有限责任公司 | 针对高效率视频代码化(hevc)用信号发送并置图片的显式方式 |
US9185408B2 (en) | 2011-11-18 | 2015-11-10 | Google Technology Holdings LLC | Efficient storage of motion information for high efficiency video coding |
BR112014012187A2 (pt) | 2011-11-21 | 2017-05-30 | Motorola Mobility Llc | determinação implícita e determinação implícita e explícita combinadas de imagem colocalizada para predição temporal |
US9549177B2 (en) | 2012-04-11 | 2017-01-17 | Google Technology Holdings LLC | Evaluation of signaling of collocated reference picture for temporal prediction |
WO2013154673A1 (en) | 2012-04-11 | 2013-10-17 | Motorola Mobility Llc | Signaling of temporal motion vector predictor (mvp) flag for temporal prediction |
US20130279882A1 (en) * | 2012-04-23 | 2013-10-24 | Apple Inc. | Coding of Video and Audio with Initialization Fragments |
US20130342694A1 (en) * | 2012-06-25 | 2013-12-26 | Tandent Vision Science, Inc. | Method and system for use of intrinsic images in an automotive driver-vehicle-assistance device |
US9319681B2 (en) | 2012-07-18 | 2016-04-19 | Google Technology Holdings LLC | Signaling of temporal motion vector predictor (MVP) enable flag |
JP2014127744A (ja) * | 2012-12-25 | 2014-07-07 | Casio Comput Co Ltd | 撮像装置、撮像制御方法、及びプログラム |
US9500526B2 (en) * | 2013-02-01 | 2016-11-22 | Dicon Fiberoptics Inc. | High-throughput and high resolution method for measuring the color uniformity of a light spot |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09261648A (ja) * | 1996-03-21 | 1997-10-03 | Fujitsu Ltd | シーンチェンジ検出装置 |
WO2003061280A2 (en) * | 2001-12-27 | 2003-07-24 | Koninklijke Philips Electronics N.V. | Commercial detection in audio-visual content based on scene change distances |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2518503B2 (ja) * | 1993-03-08 | 1996-07-24 | 日本電気株式会社 | 画面切り替え検出方法 |
US6714594B2 (en) * | 2001-05-14 | 2004-03-30 | Koninklijke Philips Electronics N.V. | Video content detection method and system leveraging data-compression constructs |
-
2005
- 2005-04-04 US US10/599,611 patent/US20080267290A1/en not_active Abandoned
- 2005-04-04 JP JP2007506900A patent/JP2007533197A/ja active Pending
- 2005-04-04 EP EP05718630A patent/EP1751986A1/en not_active Withdrawn
- 2005-04-04 WO PCT/IB2005/051108 patent/WO2005099274A1/en not_active Application Discontinuation
- 2005-04-04 KR KR1020067020875A patent/KR20070032633A/ko not_active Application Discontinuation
- 2005-04-04 CN CNA2005800108674A patent/CN1943247A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09261648A (ja) * | 1996-03-21 | 1997-10-03 | Fujitsu Ltd | シーンチェンジ検出装置 |
WO2003061280A2 (en) * | 2001-12-27 | 2003-07-24 | Koninklijke Philips Electronics N.V. | Commercial detection in audio-visual content based on scene change distances |
Also Published As
Publication number | Publication date |
---|---|
WO2005099274A1 (en) | 2005-10-20 |
CN1943247A (zh) | 2007-04-04 |
KR20070032633A (ko) | 2007-03-22 |
EP1751986A1 (en) | 2007-02-14 |
US20080267290A1 (en) | 2008-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007533197A (ja) | マルチメディアデータに適用される符号化方法 | |
US11438610B2 (en) | Block-level super-resolution based video coding | |
JP4373606B2 (ja) | 符号化システムを改善するために付随情報を使用する装置及び方法 | |
Meng et al. | Scene change detection in an MPEG-compressed video sequence | |
KR100776529B1 (ko) | 간결한 트랜스코딩 힌트 메타데이터를 생성하는 방법 및 장치 | |
Metkar et al. | Motion estimation techniques for digital video coding | |
US20090052537A1 (en) | Method and device for processing coded video data | |
US20150312575A1 (en) | Advanced video coding method, system, apparatus, and storage medium | |
JP2000224590A (ja) | ビデオシ―ケンスの特徴抽出方法 | |
JP2010525658A (ja) | イントラ予測のための適応参照画像データ生成 | |
KR20070007295A (ko) | 비디오 인코딩 방법 및 장치 | |
US20070206931A1 (en) | Monochrome frame detection method and corresponding device | |
JP2001526859A (ja) | ワールドワイドウェブ上の圧縮映像の指示及び編集方法及びアーキテクチュア | |
US8139877B2 (en) | Image processing apparatus, image processing method, and computer-readable recording medium including shot generation | |
JP2006524460A (ja) | 符号化されたビデオデータのコンテンツ分析 | |
Dawood et al. | Scene content classification from MPEG coded bit streams | |
KR20060127024A (ko) | 장면 변화 검출을 사용하는 처리 방법 및 장치 | |
US20090016441A1 (en) | Coding method and corresponding coded signal | |
Şimşek | An approach to summarize video data in compressed domain | |
Tiwari et al. | A comparative study on image and video compression techniques | |
Stütz et al. | Inter-frame H. 264/CAVLC structure-preserving substitution watermarking | |
Perra | Comparing gamma and weibull as frame size distributions for high efficient video coding | |
KR100931269B1 (ko) | H.264/avc 압축영역에서의 실시간 에지 검출 방법 | |
Jiang et al. | Adaptive scheme for classification of MPEG video frames | |
Howard | An Experimental analysis of the MPEG compression standard with respect to processing requirements, compression ratio, and image quality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080403 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110426 |