JP2005503736A - ビデオ符号化及び復号化方法並びに対応する信号 - Google Patents
ビデオ符号化及び復号化方法並びに対応する信号 Download PDFInfo
- Publication number
- JP2005503736A JP2005503736A JP2003529777A JP2003529777A JP2005503736A JP 2005503736 A JP2005503736 A JP 2005503736A JP 2003529777 A JP2003529777 A JP 2003529777A JP 2003529777 A JP2003529777 A JP 2003529777A JP 2005503736 A JP2005503736 A JP 2005503736A
- Authority
- JP
- Japan
- Prior art keywords
- encoded
- video
- bitstream
- signal
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本発明は、ビデオフレームのシーケンスに適用され、いかなる復号器も符号化されたビットストリームの内容のすべてのセグメントを認識し復号化することを可能にするビットストリーム構文によってそれぞれのデータ項目が記述される前記符号化されたビットストリームを生成するビデオ符号化方法に関する。例えばMPEG及びITU−H.26Xファミリーのビデオ圧縮規格内に適用例を見つける本発明によれば、構文は、前記符号化されたビットストリームにおいて記述されるそれぞれのチャネルごとに符号化された残差信号の存在又は不在を高い記述レベルで示すために与えられるフラグを有し、前記残差は、直前の復号化されたフレームに適用され、のちに前記残差信号の構築が行われる予測技法によって規定される。
Description
【技術分野】
【0001】
本発明は、概してビデオ圧縮の分野に関し、より具体的には例えばMPEGファミリー(MPEG−1、MPEG−2、MPEG−4)及びITU−H.26Xファミリー(H.261、H.263及びエクステンション、H.26L)のビデオ規格に関する。本発明は、ビデオフレームのシーケンスに適用され、符号化されたビットストリームの内容のすべてのセグメントをいかなる復号器も認識し復号化することを可能にするビットストリーム構文によってそれぞれのデータ項目が記述される該符号化されたビットストリームを生成するビデオ符号化方法に関する。
【0002】
本発明は更に、前記符号化方法を実行するための装置と、このような符号化装置によって送り出される伝送可能なビデオ信号と、前記伝送可能な信号を復号化するためのビデオ復号化方法と、対応する復号化装置とに関する。
【背景技術】
【0003】
最初のビデオ規格(MPEG−4及びH.26Lについて)において、ビデオは、異なる別々のチャネル(たとえば輝度、クロミナンス、形状、...)に沿ってマクロブロックごとに予測的に符号化される。この予測は、例えば文書「MPEG video coding : a basictutorial introduction」(S.R. Ely, BBC Research and Development Report, 1996年)に記載されているような動き補償技法を使用して実施される。動きベクトルフィールドは、符号化されるべき現在フレームの予測を形成するために直前に復号化されたフレームに適用される。残差信号又は単に残差と呼ばれる差の画像は、符号化されるべき現在フレームとこの予測フレームとの減算によって得られる。
【0004】
入力信号(輝度、クロミナンス、形状、...)に存在するすべてのチャネルに沿って存在するこの残差は、2進符号化される。しかしながら、残差がごくわずかな情報しか含まない状況がある。例として、この残差のエネルギーが2つの連続するフレームの間の冗長性のために非常に低いとき、又はビットバジェットが、テクスチャについて多くの情報を符号化することを許さないとき等である。上記で言及した規格の場合、伝送されるべき信号を記述する構文は常に、いかなる情報も符号化されないことの記述を含み、必要でないこれらの記述的な要素の伝送を強いる。この柔軟性の欠如は、結果として、例えば規格MPEG−4及びH.26Lの場合(及び例えば所与のピクチャの輝度及びクロミナンスチャネルについて残差信号を送り出すことが望ましくないとされる場合)に説明されるように、ビットの浪費をもたらし、よって符号化効率の低下をもたらす。
【0005】
a)規格MPEG−4:
「Information Technology - Coding of audio-visual objects - Part 2 : Visual」(ISO/IEC JTC1/SC29/WG11,Maui,USA,1999年12月)とも呼ばれるMPEG−4ドキュメント番号w3056の50乃至53ページに規定されるように、「cbpy」と呼ばれるフィールドは、どの8×8輝度ブロックが実際に16×16画素(ピクセル)の特定のマクロブロック(MB)についてビットストリームに符号化されたかを示す記述的な要素として使用される。前述の記述的な要素は、同ドキュメントの340ページ、表B−8に見られる可変長コード(VLC)によってエントロピー符号化される(残差信号がマクロブロックの4つのブロックについて符号化されないとき、この要素は、2ビットに関して符号化される「0 0 0 0」である)。同様に、「mcbpc」と呼ばれるフィールド(同じく50乃至53ページ参照)は、どの8×8クロミナンスブロック(U及びV)がマクロブロックについて符号化されたかを示す記述的な要素として使用される(いかなる残差信号も存在しないとき、「mcbpc」は値「0 0」をとる)。いくつかのVLCテーブルが、マクロブロックタイプに依存して使用され、従って値「0 0」は、ビットストリームの中の1乃至6ビットによって表わされる(339ページ、表B−6及びB−7参照)。その結果、「いかなる残差信号も符号化されない」という情報は、マクロブロックごとに3ビット乃至8ビットを必要とする。従って、例えばビットの浪費は、396マクロブロックを含む(サイズ352×288ピクセルの)CIF(共通中間フォーマット)中間ピクチャ(inter picture)について、396x3ビット/マクロブロック(=1188ビット)から396x8ビット/マクロブロック(=3168ビット)の範囲である。
【0006】
b)規格H.26L:
H.26LドキュメントQ15−K−59「H.26L Test Model Long Term Number 5 (TML-5)-Draft 0」(ITU-Telecommunications Standardization Sector, 11th Meeting, Portland, Oregon, USA, 8月22日-25日, 2000年)の16ページに規定されるように、いかなる残差信号も存在しないことを示すために、いわゆる符号化されたブロックパターン(CBP)の構文要素がマクロブロックレベルで使用される。前述の情報が符号化されるこの要素は、より具体的には、所与の16x16マクロブロックについて2種類の情報を含む。これらは、どの8×8輝度ブロックがビットストリームに符号化されたか(4ビットに関する)、及びクロミナンス係数が符号化されたか否か(2ビットに関して符号化される3つの可能性)である。「残差信号なし」の場合のCBP要素は、(同ドキュメント、7ページ、表1に従って)1ビットに関して符号化される10進値「0」をとり、従って、ビットの浪費は、CIF中間ピクチャについては(ちょうど)396ビットである。
【発明の開示】
【発明が解決しようとする課題】
【0007】
従って、本発明の目的は、このようなビットの浪費を低減し、よって符号化効率を改善することを可能にするビデオ符号化方法を提案することである。
【課題を解決するための手段】
【0008】
このため、本発明は、説明の冒頭部分に規定されるような方法であって、前記構文が、符号化されたビットストリームにおいて記述されるそれぞれのチャネルごとに符号化された残差信号の存在又は不在を高い記述レベルで示すフラグを有することを特徴とする方法と、対応する符号化装置とに関する。
【0009】
本発明は更に、このようなビデオ符号化方法によって生成され、いかなる復号器でも前記ビットストリームの内容のすべてのセグメントを認識し復号化することを可能にするビットストリーム構文によってそれぞれのデータ項目が記述される符号化されたビットストリームからなる伝送可能なビデオ信号であって、前記ビデオフレームが、現在フレームの予測を生成し、符号化されるべき現在フレームとこの予測フレームとの減算がのちに行われる予測技法によってマクロブロックごとに符号化され、前記減算は、残差と呼ばれ符号化されるべき信号を構成する差の画像をもたらし、前記信号が、符号化されたビットストリームにおいて記述されるそれぞれのチャネルについて、符号化された残差信号の存在又は不在を高い記述レベルで示すために与えられる構文的要素を含むことを特徴とする信号に関する。
【0010】
本発明は更に、前記伝送可能なビデオ信号を復号化するためのビデオ復号化方法及び対応する復号化装置に関する。
【発明を実施するための最良の形態】
【0011】
本発明は、添付の図面を参照してより詳しく説明される。
【0012】
上記で説明したビットの浪費の問題を解決するため、考慮される規格のタイプを問わず、これらの規格に一層多くの柔軟性を与えることを可能にする他の構文的要素を導入することが提案される。この導入は、例えばビデオオブジェクト層(VOL)MPEG−4レベルと同等の高い記述レベルにおいてビットストリームに特定のフラグを付加することによって実現され、このフラグは、本発明に従って、残差信号が符号化されるか否かについての表示をビットストリームに与えることが意図される。前述の表示はさまざまなチャネルの間で異なることがありえるので、これらのチャネル(輝度、クロミナンス、形状、...)のそれぞれについて、マクロブロックレベルより高いレベルで上述したような情報を規定することが実際に提案され、これは更に、将来の規格に関して大きな柔軟性を提供する。
【0013】
以下の記述において、チャネルの存在は、シーケンスレベル(MPEG−4用語のVOL)においていくつかの構文要素によって記述されるものとする。これらの要素の例として以下を挙げる。
Video_object_layer_lum 1ビット
Video_object_layer_chrom 1ビット(白黒の場合、0)
Video_object_layer_additional_channels_enable 1ビット
(輝度及びクロミナンスチャネルのみの場合、0)
Number_of_additional_channels 4ビット
Video_object_additional_channels[i] 1ビット(存在しない場合、0)
付加のチャネルの例として以下が挙げられる。
Video_object_layer_shape 1ビット(長方形の場合、0)
Video_object_layer_depth 1ビット(平坦な深さの場合、0)
これらの構文要素は、以下のように読み取られるべきである。
−「Video_object_layer_lum」が1である場合、ビットストリームが輝度チャネルについて構文要素を含むことを意味する。
−「Video_object_layer_chrom」が1である場合、ビットストリームはクロミナンスチャネルについて構文要素を含み、その他の場合、シーケンスは白黒であるものとする。
−「Video_object_layer_additional_channels_enable」が1である場合、ビットストリームは付加のチャネルを記述する構文要素を含む。
【0014】
このような場合、変数「Number_additional_channels」は、付加のチャネルの数をもつ。輝度及びクロミナンスチャネルに加えて付加のチャネルが存在する場合、以下の構文がありうる。
−「Video_object_layer_shape」が1である場合、ビットストリームは、ピクチャについて非長方形の形状を記述することが意図される構文要素を含む。その他の場合、長方形であるとされる。
−「Video_object_layer_depth」が1である場合、ビットストリームは、ピクチャについて深さテクスチャを記述することが意図される構文要素を含む。その他の場合、平坦なピクチャであるとされる。
−付加のチャネルの数(Number_of_additional_channels)に依存して、他のチャネル記述がありうる。
【0015】
関連するチャネルについて残差信号の存在を示すために、以下のフラグが提案される(iはi番目の付加のチャネルを示す)。
【0016】
この構文要素は、対応するチャネルの存在がより高いレベルで示される場合のみ、中間ピクチャごとの復号化の前にビットストリームから取り出されるべきである。これは、例えば疑似Cコードでここに記述する以下のアルゴリズムに対応する。ここで、関数read_bit(1)は、ビットストリームから次の読み取られていないビットを返す。
【0017】
【表1】
【0018】
これらの要素の意味論上の意味に関し、提案される1ビット構文は、以下のように理解されるべきである。
【0019】
Vop_lum_channel_coded:1にセットされる場合、これは、ある残差信号が現在ピクチャの輝度チャネルについて符号化されたことを示す。0にセットされる場合、これは、輝度残差信号がこのピクチャについて符号化されなかったことを示す。
【0020】
Vop_chrom_channel_coded:1にセットされる場合、これは、ある残差信号が現在ピクチャのクロミナンスチャネルについて符号化されたことを示す。0にセットされる場合、これは、クロミナンス残差信号がこのピクチャについて符号化されなかったことを示す。
【0021】
Vop_additional_channel_coded[i]:1にセットされる場合、これは、ある残差信号がi番目の付加のチャネルについて符号化されたことを示す。0にセットされる場合、これは、残差信号が前述のi番目の付加のチャネルについて符号化されなかったことを示す。
【0022】
上述のビデオ符号化方法は、例えば、動き補償されるフレーム間予測を用いるMPEGコーダの例を示す図1に図示されるような符号化装置において実現されることができる。このコーダは、符号化及び予測ステージを有する。符号化ステージそれ自体は、(MPEGに規定されるような符号化モードI、P又はBの選択を決定するための)モード決定回路11、DCT回路12、量子化回路13、可変長符号化回路14、バッファ15及びレート制御回路16を有する。予測ステージは、動き推定回路21、動き補償回路22、逆量子化回路23、逆DCT回路24、加算器25及び符号化装置の入力信号ISと予測ステージの出力部で(すなわち動き補償回路22の出力部で)得られる予測された信号と間の差を符号化ステージへ送るための減算器26を有する。この差又は残差は、符号化されるべきビットストリームであり、バッファ15の出力信号CBは、本発明によれば、符号化されたビットストリームにおいて記述されるそれぞれのチャネルごとに符号化された残差信号の存在又は不在を高い記述レベルで示す構文的要素を有する符号化されたビットストリームである。
【0023】
符号化装置の別の例は、MPEG−4規格の仕様に基づくことができる。MPEG−4ビデオフレームワークにおいて、1又はいくつかのビデオオブジェクト(及び可能性としてそれらの拡張層)からなりうる各シーンは、ビデオオブジェクト(VO)と呼ばれ別々の基本のビットストリームを使用して符号化されるこれらのオブジェクトの合成として組み立てられる。従って、入力されたビデオ情報は、まずセグメンテーション回路によってビデオオブジェクトVOに分割され、これらのビデオオブジェクトVOは、形状符号化、動き符号化及びテクスチャ符号化を含む基本の符号化構造に送られる。それぞれのビデオオブジェクトVOは、これらの符号化ステップを考慮してマクロブロックに分けられる。これらのマクロブロックは、例えば4:2:0のフォーマットの場合、4つの輝度ブロック及び2つのクロミナンスブロックにあり、1つずつ符号化される。本発明によれば、前記符号化ステップから得られる符号化された信号を含む多重化されたビットストリームは、符号化された残差信号の存在又は不在を、符号化されたビットストリームにおいて記述されるそれぞれのチャネルごとに高い記述レベルで示す構文的要素を含む。
【0024】
互恵的に、対応する復号化方法に従って、復号化側に送られるこの構文的要素は、前記要素を含む符号化されたビットストリームを受け取り前記復号化方法を実行するビデオ復号器において適当な手段によって読み取られる。符号化されたビットストリームの内容のすべてのセグメントを認識し復号化することができる復号器は、前記付加の構文的要素を読み取り、符号化された残差信号が存在しないことを知る。このような復号器は、符号化装置と同様にいかなるMPEGタイプのものでもよく、その基本的な要素は、例えば直列に並べられた、符号化されたビットストリームを受け取る入力バッファ、VLC復号器、逆量子化回路及び逆DCT回路である。符号化及び復号化装置の双方において、符号化又は復号化演算のステップを管理するための制御器が設けられてもよい。
【0025】
本発明の好ましい実施例の上記の記述は説明及び解説の目的で表されている。網羅的であること及び本発明を開示されたまさにそれらの形態に限定することは意図されず、当業者に明らかであり本発明の範囲に含まれることが意図される変形例及び変更例が上述の教示を考慮して可能であることは明らかである。
【0026】
例えば、ここに記述した符号化及び復号化装置は、ハードウェア又はソフトウェアの1つのアイテムがいくつかの機能を実行することができ、又はハードウェア及びソフトウェアのアイテムの集まり若しくは双方が1つの機能を実行することを除外することなく、ハードウェア、ソフトウェア又はハードウェアとソフトウェアとの組合せにおいて実現されうることが理解されることができる。記述した方法及び装置は、如何なるタイプのコンピュータシステム又は他の適応化された装置によっても実現されることができる。ハードウェア及びソフトウェアの一般的な組み合わせは、ロードされ実行されるときにここに記述した方法を実行するようにコンピュータシステムを制御するコンピュータプログラムを用いた汎用コンピュータシステムでありえる。代替例として、本発明の1つ又は複数の機能的なタスクを実行するための特化したハードウェアを有する特定用途向けコンピュータが利用されうる。
【0027】
本発明は更に、ここに記述した方法及び機能の実現を可能にするすべての特徴を有し、コンピュータシステムにロードされるときこれらの方法及び機能を実行することが可能なコンピュータプログラム製品に埋め込まれることができる。コンピュータプログラム、ソフトウェアプログラム、プログラム、プログラム製品又はソフトウェアは、このコンテキストにおいて、情報処理能力を具えるシステムに直接に又は(a)別の言語、コード又は表記への変換、及び/又は(b)異なる材料形態での再生、のいずれか若しくは両方のあとに特定の機能を実施させることが意図される命令の組のあらゆる言語、コード又は表記でのあらゆる表現を意味する。
【図面の簡単な説明】
【0028】
【図1】動き補償されるフレーム間予測を用いるMPEGコーダの例を示す図。
【0001】
本発明は、概してビデオ圧縮の分野に関し、より具体的には例えばMPEGファミリー(MPEG−1、MPEG−2、MPEG−4)及びITU−H.26Xファミリー(H.261、H.263及びエクステンション、H.26L)のビデオ規格に関する。本発明は、ビデオフレームのシーケンスに適用され、符号化されたビットストリームの内容のすべてのセグメントをいかなる復号器も認識し復号化することを可能にするビットストリーム構文によってそれぞれのデータ項目が記述される該符号化されたビットストリームを生成するビデオ符号化方法に関する。
【0002】
本発明は更に、前記符号化方法を実行するための装置と、このような符号化装置によって送り出される伝送可能なビデオ信号と、前記伝送可能な信号を復号化するためのビデオ復号化方法と、対応する復号化装置とに関する。
【背景技術】
【0003】
最初のビデオ規格(MPEG−4及びH.26Lについて)において、ビデオは、異なる別々のチャネル(たとえば輝度、クロミナンス、形状、...)に沿ってマクロブロックごとに予測的に符号化される。この予測は、例えば文書「MPEG video coding : a basictutorial introduction」(S.R. Ely, BBC Research and Development Report, 1996年)に記載されているような動き補償技法を使用して実施される。動きベクトルフィールドは、符号化されるべき現在フレームの予測を形成するために直前に復号化されたフレームに適用される。残差信号又は単に残差と呼ばれる差の画像は、符号化されるべき現在フレームとこの予測フレームとの減算によって得られる。
【0004】
入力信号(輝度、クロミナンス、形状、...)に存在するすべてのチャネルに沿って存在するこの残差は、2進符号化される。しかしながら、残差がごくわずかな情報しか含まない状況がある。例として、この残差のエネルギーが2つの連続するフレームの間の冗長性のために非常に低いとき、又はビットバジェットが、テクスチャについて多くの情報を符号化することを許さないとき等である。上記で言及した規格の場合、伝送されるべき信号を記述する構文は常に、いかなる情報も符号化されないことの記述を含み、必要でないこれらの記述的な要素の伝送を強いる。この柔軟性の欠如は、結果として、例えば規格MPEG−4及びH.26Lの場合(及び例えば所与のピクチャの輝度及びクロミナンスチャネルについて残差信号を送り出すことが望ましくないとされる場合)に説明されるように、ビットの浪費をもたらし、よって符号化効率の低下をもたらす。
【0005】
a)規格MPEG−4:
「Information Technology - Coding of audio-visual objects - Part 2 : Visual」(ISO/IEC JTC1/SC29/WG11,Maui,USA,1999年12月)とも呼ばれるMPEG−4ドキュメント番号w3056の50乃至53ページに規定されるように、「cbpy」と呼ばれるフィールドは、どの8×8輝度ブロックが実際に16×16画素(ピクセル)の特定のマクロブロック(MB)についてビットストリームに符号化されたかを示す記述的な要素として使用される。前述の記述的な要素は、同ドキュメントの340ページ、表B−8に見られる可変長コード(VLC)によってエントロピー符号化される(残差信号がマクロブロックの4つのブロックについて符号化されないとき、この要素は、2ビットに関して符号化される「0 0 0 0」である)。同様に、「mcbpc」と呼ばれるフィールド(同じく50乃至53ページ参照)は、どの8×8クロミナンスブロック(U及びV)がマクロブロックについて符号化されたかを示す記述的な要素として使用される(いかなる残差信号も存在しないとき、「mcbpc」は値「0 0」をとる)。いくつかのVLCテーブルが、マクロブロックタイプに依存して使用され、従って値「0 0」は、ビットストリームの中の1乃至6ビットによって表わされる(339ページ、表B−6及びB−7参照)。その結果、「いかなる残差信号も符号化されない」という情報は、マクロブロックごとに3ビット乃至8ビットを必要とする。従って、例えばビットの浪費は、396マクロブロックを含む(サイズ352×288ピクセルの)CIF(共通中間フォーマット)中間ピクチャ(inter picture)について、396x3ビット/マクロブロック(=1188ビット)から396x8ビット/マクロブロック(=3168ビット)の範囲である。
【0006】
b)規格H.26L:
H.26LドキュメントQ15−K−59「H.26L Test Model Long Term Number 5 (TML-5)-Draft 0」(ITU-Telecommunications Standardization Sector, 11th Meeting, Portland, Oregon, USA, 8月22日-25日, 2000年)の16ページに規定されるように、いかなる残差信号も存在しないことを示すために、いわゆる符号化されたブロックパターン(CBP)の構文要素がマクロブロックレベルで使用される。前述の情報が符号化されるこの要素は、より具体的には、所与の16x16マクロブロックについて2種類の情報を含む。これらは、どの8×8輝度ブロックがビットストリームに符号化されたか(4ビットに関する)、及びクロミナンス係数が符号化されたか否か(2ビットに関して符号化される3つの可能性)である。「残差信号なし」の場合のCBP要素は、(同ドキュメント、7ページ、表1に従って)1ビットに関して符号化される10進値「0」をとり、従って、ビットの浪費は、CIF中間ピクチャについては(ちょうど)396ビットである。
【発明の開示】
【発明が解決しようとする課題】
【0007】
従って、本発明の目的は、このようなビットの浪費を低減し、よって符号化効率を改善することを可能にするビデオ符号化方法を提案することである。
【課題を解決するための手段】
【0008】
このため、本発明は、説明の冒頭部分に規定されるような方法であって、前記構文が、符号化されたビットストリームにおいて記述されるそれぞれのチャネルごとに符号化された残差信号の存在又は不在を高い記述レベルで示すフラグを有することを特徴とする方法と、対応する符号化装置とに関する。
【0009】
本発明は更に、このようなビデオ符号化方法によって生成され、いかなる復号器でも前記ビットストリームの内容のすべてのセグメントを認識し復号化することを可能にするビットストリーム構文によってそれぞれのデータ項目が記述される符号化されたビットストリームからなる伝送可能なビデオ信号であって、前記ビデオフレームが、現在フレームの予測を生成し、符号化されるべき現在フレームとこの予測フレームとの減算がのちに行われる予測技法によってマクロブロックごとに符号化され、前記減算は、残差と呼ばれ符号化されるべき信号を構成する差の画像をもたらし、前記信号が、符号化されたビットストリームにおいて記述されるそれぞれのチャネルについて、符号化された残差信号の存在又は不在を高い記述レベルで示すために与えられる構文的要素を含むことを特徴とする信号に関する。
【0010】
本発明は更に、前記伝送可能なビデオ信号を復号化するためのビデオ復号化方法及び対応する復号化装置に関する。
【発明を実施するための最良の形態】
【0011】
本発明は、添付の図面を参照してより詳しく説明される。
【0012】
上記で説明したビットの浪費の問題を解決するため、考慮される規格のタイプを問わず、これらの規格に一層多くの柔軟性を与えることを可能にする他の構文的要素を導入することが提案される。この導入は、例えばビデオオブジェクト層(VOL)MPEG−4レベルと同等の高い記述レベルにおいてビットストリームに特定のフラグを付加することによって実現され、このフラグは、本発明に従って、残差信号が符号化されるか否かについての表示をビットストリームに与えることが意図される。前述の表示はさまざまなチャネルの間で異なることがありえるので、これらのチャネル(輝度、クロミナンス、形状、...)のそれぞれについて、マクロブロックレベルより高いレベルで上述したような情報を規定することが実際に提案され、これは更に、将来の規格に関して大きな柔軟性を提供する。
【0013】
以下の記述において、チャネルの存在は、シーケンスレベル(MPEG−4用語のVOL)においていくつかの構文要素によって記述されるものとする。これらの要素の例として以下を挙げる。
Video_object_layer_lum 1ビット
Video_object_layer_chrom 1ビット(白黒の場合、0)
Video_object_layer_additional_channels_enable 1ビット
(輝度及びクロミナンスチャネルのみの場合、0)
Number_of_additional_channels 4ビット
Video_object_additional_channels[i] 1ビット(存在しない場合、0)
付加のチャネルの例として以下が挙げられる。
Video_object_layer_shape 1ビット(長方形の場合、0)
Video_object_layer_depth 1ビット(平坦な深さの場合、0)
これらの構文要素は、以下のように読み取られるべきである。
−「Video_object_layer_lum」が1である場合、ビットストリームが輝度チャネルについて構文要素を含むことを意味する。
−「Video_object_layer_chrom」が1である場合、ビットストリームはクロミナンスチャネルについて構文要素を含み、その他の場合、シーケンスは白黒であるものとする。
−「Video_object_layer_additional_channels_enable」が1である場合、ビットストリームは付加のチャネルを記述する構文要素を含む。
【0014】
このような場合、変数「Number_additional_channels」は、付加のチャネルの数をもつ。輝度及びクロミナンスチャネルに加えて付加のチャネルが存在する場合、以下の構文がありうる。
−「Video_object_layer_shape」が1である場合、ビットストリームは、ピクチャについて非長方形の形状を記述することが意図される構文要素を含む。その他の場合、長方形であるとされる。
−「Video_object_layer_depth」が1である場合、ビットストリームは、ピクチャについて深さテクスチャを記述することが意図される構文要素を含む。その他の場合、平坦なピクチャであるとされる。
−付加のチャネルの数(Number_of_additional_channels)に依存して、他のチャネル記述がありうる。
【0015】
関連するチャネルについて残差信号の存在を示すために、以下のフラグが提案される(iはi番目の付加のチャネルを示す)。
【0016】
この構文要素は、対応するチャネルの存在がより高いレベルで示される場合のみ、中間ピクチャごとの復号化の前にビットストリームから取り出されるべきである。これは、例えば疑似Cコードでここに記述する以下のアルゴリズムに対応する。ここで、関数read_bit(1)は、ビットストリームから次の読み取られていないビットを返す。
【0017】
【表1】
【0018】
これらの要素の意味論上の意味に関し、提案される1ビット構文は、以下のように理解されるべきである。
【0019】
Vop_lum_channel_coded:1にセットされる場合、これは、ある残差信号が現在ピクチャの輝度チャネルについて符号化されたことを示す。0にセットされる場合、これは、輝度残差信号がこのピクチャについて符号化されなかったことを示す。
【0020】
Vop_chrom_channel_coded:1にセットされる場合、これは、ある残差信号が現在ピクチャのクロミナンスチャネルについて符号化されたことを示す。0にセットされる場合、これは、クロミナンス残差信号がこのピクチャについて符号化されなかったことを示す。
【0021】
Vop_additional_channel_coded[i]:1にセットされる場合、これは、ある残差信号がi番目の付加のチャネルについて符号化されたことを示す。0にセットされる場合、これは、残差信号が前述のi番目の付加のチャネルについて符号化されなかったことを示す。
【0022】
上述のビデオ符号化方法は、例えば、動き補償されるフレーム間予測を用いるMPEGコーダの例を示す図1に図示されるような符号化装置において実現されることができる。このコーダは、符号化及び予測ステージを有する。符号化ステージそれ自体は、(MPEGに規定されるような符号化モードI、P又はBの選択を決定するための)モード決定回路11、DCT回路12、量子化回路13、可変長符号化回路14、バッファ15及びレート制御回路16を有する。予測ステージは、動き推定回路21、動き補償回路22、逆量子化回路23、逆DCT回路24、加算器25及び符号化装置の入力信号ISと予測ステージの出力部で(すなわち動き補償回路22の出力部で)得られる予測された信号と間の差を符号化ステージへ送るための減算器26を有する。この差又は残差は、符号化されるべきビットストリームであり、バッファ15の出力信号CBは、本発明によれば、符号化されたビットストリームにおいて記述されるそれぞれのチャネルごとに符号化された残差信号の存在又は不在を高い記述レベルで示す構文的要素を有する符号化されたビットストリームである。
【0023】
符号化装置の別の例は、MPEG−4規格の仕様に基づくことができる。MPEG−4ビデオフレームワークにおいて、1又はいくつかのビデオオブジェクト(及び可能性としてそれらの拡張層)からなりうる各シーンは、ビデオオブジェクト(VO)と呼ばれ別々の基本のビットストリームを使用して符号化されるこれらのオブジェクトの合成として組み立てられる。従って、入力されたビデオ情報は、まずセグメンテーション回路によってビデオオブジェクトVOに分割され、これらのビデオオブジェクトVOは、形状符号化、動き符号化及びテクスチャ符号化を含む基本の符号化構造に送られる。それぞれのビデオオブジェクトVOは、これらの符号化ステップを考慮してマクロブロックに分けられる。これらのマクロブロックは、例えば4:2:0のフォーマットの場合、4つの輝度ブロック及び2つのクロミナンスブロックにあり、1つずつ符号化される。本発明によれば、前記符号化ステップから得られる符号化された信号を含む多重化されたビットストリームは、符号化された残差信号の存在又は不在を、符号化されたビットストリームにおいて記述されるそれぞれのチャネルごとに高い記述レベルで示す構文的要素を含む。
【0024】
互恵的に、対応する復号化方法に従って、復号化側に送られるこの構文的要素は、前記要素を含む符号化されたビットストリームを受け取り前記復号化方法を実行するビデオ復号器において適当な手段によって読み取られる。符号化されたビットストリームの内容のすべてのセグメントを認識し復号化することができる復号器は、前記付加の構文的要素を読み取り、符号化された残差信号が存在しないことを知る。このような復号器は、符号化装置と同様にいかなるMPEGタイプのものでもよく、その基本的な要素は、例えば直列に並べられた、符号化されたビットストリームを受け取る入力バッファ、VLC復号器、逆量子化回路及び逆DCT回路である。符号化及び復号化装置の双方において、符号化又は復号化演算のステップを管理するための制御器が設けられてもよい。
【0025】
本発明の好ましい実施例の上記の記述は説明及び解説の目的で表されている。網羅的であること及び本発明を開示されたまさにそれらの形態に限定することは意図されず、当業者に明らかであり本発明の範囲に含まれることが意図される変形例及び変更例が上述の教示を考慮して可能であることは明らかである。
【0026】
例えば、ここに記述した符号化及び復号化装置は、ハードウェア又はソフトウェアの1つのアイテムがいくつかの機能を実行することができ、又はハードウェア及びソフトウェアのアイテムの集まり若しくは双方が1つの機能を実行することを除外することなく、ハードウェア、ソフトウェア又はハードウェアとソフトウェアとの組合せにおいて実現されうることが理解されることができる。記述した方法及び装置は、如何なるタイプのコンピュータシステム又は他の適応化された装置によっても実現されることができる。ハードウェア及びソフトウェアの一般的な組み合わせは、ロードされ実行されるときにここに記述した方法を実行するようにコンピュータシステムを制御するコンピュータプログラムを用いた汎用コンピュータシステムでありえる。代替例として、本発明の1つ又は複数の機能的なタスクを実行するための特化したハードウェアを有する特定用途向けコンピュータが利用されうる。
【0027】
本発明は更に、ここに記述した方法及び機能の実現を可能にするすべての特徴を有し、コンピュータシステムにロードされるときこれらの方法及び機能を実行することが可能なコンピュータプログラム製品に埋め込まれることができる。コンピュータプログラム、ソフトウェアプログラム、プログラム、プログラム製品又はソフトウェアは、このコンテキストにおいて、情報処理能力を具えるシステムに直接に又は(a)別の言語、コード又は表記への変換、及び/又は(b)異なる材料形態での再生、のいずれか若しくは両方のあとに特定の機能を実施させることが意図される命令の組のあらゆる言語、コード又は表記でのあらゆる表現を意味する。
【図面の簡単な説明】
【0028】
【図1】動き補償されるフレーム間予測を用いるMPEGコーダの例を示す図。
Claims (6)
- ビデオフレームのシーケンスに適用され、符号化されたビットストリームの内容のすべてのセグメントをいかなる復号器も認識し復号化することを可能にするビットストリーム構文によってそれぞれのデータ項目が記述される該符号化されたビットストリームを生成する、ビデオ符号化方法であって、前記ビデオフレームは、現在フレームの予測を生成し、符号化されるべき前記現在フレームとこの予測フレームとの減算がのちに行われる予測技法によってマクロブロックごとに符号化され、前記減算は、残差と呼ばれ符号化されるべき信号を構成する差の画像をもたらし、更に前記構文が、前記符号化されたビットストリームにおいて記述されるそれぞれのチャネルについて、符号化された残差信号の存在又は不在を高い記述レベルで示すフラグを有することを特徴とするビデオ符号化方法。
- 前記ビデオフレームは、動き補償技法によって予測的に符号化される、請求項1に記載のビデオ符号化方法。
- 前記ビデオフレームは、低い解像度に基づく信号のアップサンプリング処理によって予測的に符号化される、請求項1に記載のビデオ符号化方法。
- 請求項1乃至請求項3のいずれか1項に記載のビデオ符号化方法によって生成され、符号化されたビットストリームの内容のすべてのセグメントをいかなる復号器も認識し復号化することを可能にするビットストリーム構文によってそれぞれのデータ項目が記述される該符号化されたビットストリームからなる、伝送可能なビデオ信号であって、前記ビデオフレームは、現在フレームの予測を生成し、符号化されるべき前記現在フレームとこの予測フレームとの減算がのちに行われる予測技法によってマクロブロックごとに符号化され、前記減算は、残差と呼ばれ符号化されるべき信号を構成する差の画像をもたらし、前記信号は、前記符号化されたビットストリームにおいて記述されるそれぞれのチャネルについて、符号化された残差信号の存在又は不在を高い記述レベルで示すために与えられる構文的要素を有することを特徴とする信号。
- ビデオフレームのシーケンスに適用され、符号化されたビットストリームの内容のすべてのセグメントをいかなる復号器も認識し復号化することを可能にするビットストリーム構文によってそれぞれのデータ項目が記述される該符号化されたビットストリームを生成するビデオ符号化方法の実現によって生成された符号化されたビットストリームからなる伝送可能なビデオ信号を復号化するためのビデオ復号化方法であって、前記ビデオフレームは、現在フレームの予測を生成し、符号化されるべき前記現在フレームとこの予測フレームとの減算がのちに行われる予測技法によってマクロブロックごとに符号化され、前記減算は、残差と呼ばれ符号化されるべき信号を構成する差の画像をもたらし、前記信号が、前記符号化されたビットストリームにおいて記述されるそれぞれのチャネルについて、符号化された残差信号の存在又は不在を高い記述レベルで示すために与えられる構文的要素を有することを特徴とするビデオ復号化方法。
- ビデオフレームのシーケンスに適用され、符号化されたビットストリームの内容のすべてのセグメントをいかなる復号器も認識し復号化することを可能にするビットストリーム構文によってそれぞれのデータ項目が記述される該符号化されたビットストリームを生成するビデオ符号化方法の実現によって生成された符号化されたビットストリームからなる伝送可能なビデオ信号を復号化するためのビデオ復号化装置であって、前記ビデオフレームは、現在フレームの予測を生成し、符号化されるべき前記現在フレームとこの予測フレームとの減算がのちに行われる予測技法によってマクロブロックごとに符号化され、前記減算は、残差と呼ばれ符号化されるべき信号を構成する差の画像をもたらし、前記信号は、前記符号化されたビットストリームにおいて記述されるそれぞれのチャネルについて、符号化された残差信号の存在又は不在を高い記述レベルで示すために与えられる構文的要素を有するビデオ符号化装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01402391 | 2001-09-18 | ||
PCT/IB2002/003675 WO2003026312A2 (en) | 2001-09-18 | 2002-09-04 | Video coding and decoding method, and corresponding signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005503736A true JP2005503736A (ja) | 2005-02-03 |
JP2005503736A5 JP2005503736A5 (ja) | 2006-01-05 |
Family
ID=8182880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003529777A Pending JP2005503736A (ja) | 2001-09-18 | 2002-09-04 | ビデオ符号化及び復号化方法並びに対応する信号 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20030138052A1 (ja) |
EP (1) | EP1430726A2 (ja) |
JP (1) | JP2005503736A (ja) |
KR (1) | KR20040036948A (ja) |
CN (1) | CN1310519C (ja) |
WO (1) | WO2003026312A2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100612015B1 (ko) * | 2004-07-22 | 2006-08-11 | 삼성전자주식회사 | 컨텍스트 적응형 이진 산술 부호화 방법 및 그 장치 |
KR100750138B1 (ko) * | 2005-11-16 | 2007-08-21 | 삼성전자주식회사 | 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치 |
KR100736096B1 (ko) * | 2005-12-12 | 2007-07-06 | 삼성전자주식회사 | 비디오 신호를 그룹별로 인코딩 및 디코딩하는 방법 및장치 |
WO2007073370A1 (en) * | 2005-12-20 | 2007-06-28 | Tte Technology, Inc. | Decryption system and method for video data |
CN101014129B (zh) * | 2007-03-06 | 2010-12-15 | 孟智平 | 一种视频数据压缩方法 |
BRPI0810517A2 (pt) * | 2007-06-12 | 2014-10-21 | Thomson Licensing | Métodos e aparelho suportando estrutura de sintaxe de vídeo de multipasso para dados de seção |
US8532437B2 (en) * | 2009-05-18 | 2013-09-10 | Citrix Systems, Inc. | Systems and methods for block recomposition for compound image compression |
CN105847831B (zh) | 2010-11-23 | 2019-08-09 | Lg电子株式会社 | 视频编码装置和视频解码装置 |
AR088777A1 (es) * | 2011-03-18 | 2014-07-10 | Fraunhofer Ges Forschung | Transmision de longitud de elemento de cuadro en la codificacion de audio |
US10129550B2 (en) | 2013-02-01 | 2018-11-13 | Qualcomm Incorporated | Inter-layer syntax prediction control |
EP3707904A1 (en) * | 2018-10-02 | 2020-09-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding and decoding pictures based on tile group id |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999009749A1 (de) * | 1997-08-15 | 1999-02-25 | Robert Bosch Gmbh | Verfahren zur aufbereitung eines datenstromes für die objektbasierte codierung von bewegtbildfolgen |
WO2001067774A1 (en) * | 2000-03-07 | 2001-09-13 | Koninklijke Philips Electronics N.V. | Method of encoding video signals |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3860323B2 (ja) * | 1997-10-27 | 2006-12-20 | 三菱電機株式会社 | 画像復号化装置、画像復号化方法 |
SG75189A1 (en) * | 1998-12-04 | 2000-09-19 | Canon Kk | Image processing apparatus method therefor and recording medium storing image processing program |
-
2002
- 2002-09-04 CN CNB028182200A patent/CN1310519C/zh not_active Expired - Fee Related
- 2002-09-04 WO PCT/IB2002/003675 patent/WO2003026312A2/en not_active Application Discontinuation
- 2002-09-04 KR KR10-2004-7003917A patent/KR20040036948A/ko not_active Application Discontinuation
- 2002-09-04 JP JP2003529777A patent/JP2005503736A/ja active Pending
- 2002-09-04 EP EP02762706A patent/EP1430726A2/en not_active Ceased
- 2002-09-13 US US10/242,929 patent/US20030138052A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999009749A1 (de) * | 1997-08-15 | 1999-02-25 | Robert Bosch Gmbh | Verfahren zur aufbereitung eines datenstromes für die objektbasierte codierung von bewegtbildfolgen |
WO2001067774A1 (en) * | 2000-03-07 | 2001-09-13 | Koninklijke Philips Electronics N.V. | Method of encoding video signals |
Also Published As
Publication number | Publication date |
---|---|
EP1430726A2 (en) | 2004-06-23 |
CN1310519C (zh) | 2007-04-11 |
WO2003026312A3 (en) | 2003-11-06 |
KR20040036948A (ko) | 2004-05-03 |
US20030138052A1 (en) | 2003-07-24 |
WO2003026312A2 (en) | 2003-03-27 |
CN1555654A (zh) | 2004-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3778798B2 (ja) | ビデオ圧縮のための効率的マクロブロックヘッダ符号化 | |
KR102474461B1 (ko) | 코딩된 영역들의 완료를 나타내는 신택스 구조들 | |
EP1528813B1 (en) | Improved video coding using adaptive coding of block parameters for coded/uncoded blocks | |
JP2005526457A (ja) | ビデオ・トランスコーダ | |
JP2005503736A (ja) | ビデオ符号化及び復号化方法並びに対応する信号 | |
US7412001B2 (en) | Video coding method and corresponding transmittable video signal | |
Brady et al. | Shape compression of moving objects using context-based arithmetic encoding | |
US20060153298A1 (en) | Predictive encoding of motion vectors including a flag notifying the presence of coded residual motion vector data | |
US8548050B2 (en) | Video coding method with selectable black and white mode | |
KR100944544B1 (ko) | 비디오 부호화 및 복호화 방법 | |
JP2004312689A (ja) | Mpegビデオ復号化方法及びmpegビデオ復号化器 | |
KR100483672B1 (ko) | 영상신호처리의모양정보부호화방법 | |
JP2003087797A (ja) | 画像情報変換装置及び方法、画像情報変換プログラム、並びに記録媒体 | |
US20050141768A1 (en) | Video encoding method and corresponding device and signal | |
KR980013412A (ko) | 양 방향 예측-비오피(b-vop)간의 동기화 방법 | |
KR20040097492A (ko) | 단말기에 있어서 시각 특수 효과를 이용한 개인 정보 보호방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050902 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050902 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080624 |