JP5001853B2 - 映像符号化及び復号化装置とその方法 - Google Patents

映像符号化及び復号化装置とその方法 Download PDF

Info

Publication number
JP5001853B2
JP5001853B2 JP2007545388A JP2007545388A JP5001853B2 JP 5001853 B2 JP5001853 B2 JP 5001853B2 JP 2007545388 A JP2007545388 A JP 2007545388A JP 2007545388 A JP2007545388 A JP 2007545388A JP 5001853 B2 JP5001853 B2 JP 5001853B2
Authority
JP
Japan
Prior art keywords
allowable noise
unit
quantization
bit
quantization parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007545388A
Other languages
English (en)
Other versions
JP2008523706A (ja
Inventor
リー,シ−ファ
キム,ド−ヒョン
キム,ヘ−ヨン
クォン,イン−ソ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2008523706A publication Critical patent/JP2008523706A/ja
Application granted granted Critical
Publication of JP5001853B2 publication Critical patent/JP5001853B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]

Description

本発明は、映像符号化及び復号化に係り、特に、主観的損失のない許容ノイズを利用して決定された量子化パラメータで映像を符号化し、符号化されたビット列を復号化するための映像符号化及び復号化装置とその方法に関する。
これまで人間の視感特性を映像符号化に適用する多くの試みがあった。このような努力は、復元された映像の画質を評価する人間の視覚的能力が単純な信号処理観点と一致しないということに基づいている。しかし、映像符号化において、多くの接近方法が依然として人間が感じるノイズと信号ノイズとが同一であるという仮定から始まっている。特に、MSE(Mean Square Error)は、最も広く使用している信号ノイズであると言え、これにより復元された映像の画質の程度をPSNR(Peak Signal to Noise Ratio)により数値的に評価している。
一般的に多く使用する視感特性指標としては、JND(Just Noticeable Distortion)値を挙げることができる。JND値は一つの画素値に対して周辺画素値の相対的な変化度を考慮して計算されたものであり、人間が複雑な背景では大きいノイズに対して認識できない特性をモデリングする。映像符号化では、各画素に対して得られたJND値を利用して、量子化過程で量子化パラメータを追加的に調整する。このような過程を通じて人間の視感特性に敏感な領域に対してはノイズをさらに少なく発生させ、鈍感な領域についてはノイズをさらに多く発生させて圧縮率を高める。
一方、JND値以外に周波数領域での人間の視感特性を考慮できる。このために、多様なテスト映像から人間の視感特性のMTF(Modulation Transfer Function)を経験的に求め、これを利用して、DCT(Discrete Cosine Transform)係数に対して各周波数領域に対する量子化加重値を抽出した。
このようなJND値を利用するか、量子化値を利用して人間の視感特性を映像符号化に適用する方式は多くの限界点を持つ。量子化値を利用する場合、単に周波数成分に対する値を一括的に適用する問題点を持ち、人間の視感特性が単に周辺の画素値との相対的な値にのみ依存するものではないので、JND値の適用に問題点がある。また、各画素値に対してJND値を計算するために、ビット量制御で基本的に提供される量子化パラメータを各画素単位で修正せねばならない。したがって、修正される前の別途の情報が復号化器に伝えられるか、復号化器でJND値が符号化器でと同じ値に計算されねばならない。この時、復号化器では再生された値のみ持っているので、符号化器でも復号化器でと同様に、再生された値を以ってJND値を計算せねばならないという根本的な問題点を持つ。
人間の視感特性を反映して映像符号化を行う関連文献としては、Bowonkoon Chitprasrt及びK.R.Raoの論文“Human Visual Weighted Prograssive Image Transmission”(IEEE Trans.Communications,vol.38,pp.1040−1044,July,1990),ISO/IEC 11172−2,Information Technology−Coding of Moving Pictures and Associated Audio for Digital Storage Media at Up to About 1.5Mbit/s Part 2:Video,1993,King N.Ngan,Kin S.Leong及びH.Singhの論文、“Adaptive Cosine Transform Coding of Image in Perceptual Domain”(IEEE Trans.Acoustics,Speech and Signal Processing,vol.37,pp.1743−1750,Nov.1989)などを挙げることができる。
本発明が解決しようとする技術的課題は、主観的損失のない許容ノイズを利用して決定された量子化パラメータで映像を符号化するための映像符号化装置及び方法と、その映像復号化装置及び方法を提供するところにある。
本発明が解決しようとする他の技術的課題は、主観的損失のない許容ノイズを利用して決定された量子化パラメータで映像を量子化し、各コーディングブロックを品質レイヤーに区分し、量子化された映像を品質レイヤー別スキャン順序によって符号化するための映像復号化装置及び方法と、その映像復号化装置及び方法を提供するところにある。
前記技術的課題を達成するために、本発明による映像符号化装置は、入力される原映像を変換して空間的重畳を除去する変換部と、前記原映像から許容ノイズを獲得する許容ノイズ獲得部と、前記許容ノイズを利用して量子化パラメータを決定する量子化パラメータ決定部と、前記量子化パラメータを利用して、前記変換部から提供される変換係数を量子化して、量子化された係数を生成する量子化部と、前記量子化された係数をエントロピー符号化して統計的重畳を除去するエントロピー符号化部と、を備えることを特徴とする。
前記技術的課題を達成するために、本発明による映像符号化装置は、入力される原映像を変換して空間的重畳を除去する変換部と、前記原映像から許容ノイズを獲得する許容ノイズ獲得部と、前記許容ノイズを利用して量子化パラメータを決定する量子化パラメータ決定部と、前記量子化パラメータを利用して、前記変換部から提供される変換係数を量子化して、量子化された係数を生成する量子化部と、前記許容ノイズを利用して決定される品質レイヤーによってスキャン順序を決定するスキャン順序決定部と、前記量子化された係数を前記品質レイヤーによるスキャン順序にエントロピー符号化して、統計的重畳を除去するエントロピー符号化部とを備えることを特徴とする。
前記技術的課題を達成するために、本発明による映像符号化方法は、入力される原映像を変換して空間的重畳を除去する工程と、前記原映像から許容ノイズを獲得する工程と、前記許容ノイズを利用して量子化パラメータを決定する工程と、前記量子化パラメータを利用して、前記変換部から提供される変換係数を量子化して、量子化された係数を生成する工程と、前記量子化された係数をエントロピー符号化して統計的重畳を除去する工程とを含むことを特徴とする。
前記技術的課題を達成するために、本発明による映像符号化方法は、入力される原映像を変換して空間的重畳を除去する工程と、前記原映像から許容ノイズを獲得する工程と、前記許容ノイズを利用して量子化パラメータを決定する工程と、前記量子化パラメータを利用して、前記変換部から提供される変換係数を量子化して、量子化された係数を生成する工程と、前記許容ノイズを利用して決定される品質レイヤーによってスキャン順序を決定する工程と、前記量子化された係数を、前記品質レイヤーによるスキャン順序にエントロピー符号化して、統計的重畳を除去する工程とを含むことを特徴とする。
前記さらに他の技術的課題を達成するために、本発明による映像復号化装置は、入力されるビット列をエントロピー復号化して、量子化された係数を生成するエントロピー復号化部と、前記量子化された係数を逆量子化して変換係数を生成する逆量子化部と、前記変換係数を逆変換して復元された映像を生成する逆変換部とを備えることを特徴とする。
前記さらに他の技術的課題を達成するために、本発明による映像復号化方法は、入力されるビット列をエントロピー復号化して、量子化された係数を生成する工程と、前記量子化された係数を逆量子化して変換係数を生成する工程と、前記変換係数を逆変換して復元された映像を生成する工程とを含むことを特徴とする。
前記映像符号化方法または映像復号化方法は、望ましくは、コンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体に具現できる。
本発明によれば、主観的損失のない許容ノイズを利用して決定された量子化パラメータで映像を符号化及び復号化することによって、符号化効率及び復元された映像の主観的画質を大幅向上させることができる。
また、主観的損失のない許容ノイズを利用して決定された量子化パラメータで映像を量子化し、各コーディングブロックを品質レイヤーに区分し、量子化された映像を品質レイヤー別スキャン順序によって符号化及び復号化することによって、スケーラブル機能を持ちつつ符号化効率及び復元された映像の主観的画質を大幅向上させることができる。
以下、添付された図面を参照して本発明による映像符号化装置及び方法と、その復号化装置及び方法について詳細に説明する。
図1は、本発明の一実施形態による映像符号化装置の構成を示すブロック図であり、変換部110、許容ノイズ獲得部130、量子化パラメータ決定部150、量子化部170及びエントロピー符号化部190を備えてなる。一方、スキャン順序決定部180は、オプションで備わりうる。
図1を参照するに、変換部110は、入力されるフレーム映像で視空間的な重畳を除去するためのものであり、商用化されるか、制定された映像あるいはビデオ圧縮標準で使用するDCT、ウェーブレット変換、予測、あるいは整数変換などを使用でき、必ずしもこれに限定されるものではない。望ましくは、ウェーブレット変換を使用できる。
許容ノイズ獲得部130は、入力される原映像から許容ノイズを求め、求められた許容ノイズを量子化パラメータ決定部150に提供する。ここで、許容ノイズは、認識基盤オーディオ符号化で使われるマスキング臨界値と類似した機能を行うものであり、一実施形態では、カラー量子化アルゴリズムを利用して許容ノイズを求める。
量子化パラメータ決定部150は、許容ノイズ獲得部130で求められた許容ノイズを利用して、コーディングブロック単位で一つの量子化パラメータを決定して量子化部170に提供する。すなわち、量子化部170で、各コーディングブロックに対する量子化結果として、発生する量子化ノイズが許容ノイズ以下になるように、各コーディングブロックの量子化パラメータを決定する。
量子化部170は、変換部110から提供される各コーディングブロックの変換係数に対して、量子化パラメータ決定部150で決定された各コーディングブロックの量子化パラメータを利用して、各コーディングブロックの量子化を行い、量子化された各コーディングブロックの変換係数をエントロピー符号化部190に提供する。
スキャン順序決定部180は、任意数の品質レイヤーによって各レイヤーに対して許容ノイズを利用して、決定されたほどのビットプレインで構成される各品質レイヤーを利用してスキャン順序を決定する。ここで、品質レイヤーは、エンベデッド符号化されたビット列の伝送時に、損失が発生する場合、復元された映像の画質、すなわち、品質に一定の影響を及ぼしうる境界を表す。まず、最上位ビットレートである場合、該当する第1許容ノイズ
(外1)
Figure 0005001853

は、第1品質を保証する第1コスト関数を満足できるカラー数kにより決定される。最初の品質レイヤーは、第1品質より低い第2品質を保証する第2コスト関数を満足できるように、第1許容ノイズ
(外2)
Figure 0005001853

を決定するカラー数kより小さなカラー数mで得られる第2許容ノイズ
(外3)
Figure 0005001853

を利用して決定する。同様に、第2品質レイヤーは、第2品質より低い第3品質を保証する第3コスト関数を満足できるように、第2許容ノイズ
(外4)
Figure 0005001853

を決定するカラー数mより小さなカラー数nで得られる第3許容ノイズ
(外5)
Figure 0005001853

を利用して決定する。この時、品質レイヤーの数及び各品質レイヤーに対応するコスト関数は、符号化初期にスキャン順序決定部180に予め入力しておくことができる。すなわち、スキャン順序は、上位品質レイヤーから下位品質レイヤーに進行する。
エントロピー符号化部190は、量子化部170から提供される量子化された各コーディングブロックの変換係数に対して、統計的な重畳を除去してビット列を生成する。この時、最上位ビットレートでは、各コーディングブロック単位でスキャンを行いつつエントロピー符号化を行う。一方、サブビットレートでは、スキャン順序決定部180で決定されたスキャン順序によって品質レイヤー単位でスキャンを行いつつエントロピー符号化を行う。エントロピー符号化部190は、スケーラブル機能を提供するためにエンベデッド符号化を行えるが、この時、FGS(Fine Granular Scalability)機能を提供するMPEG−4オーディオコーデックで使用するBSAC(Bit Sliced Arithmetic Coding)アルゴリズムを適用する。また、BSACアルゴリズムの圧縮効率を向上させるために、基本文脈(context)を適応的に更新させる適応的算術符号化を適用できる。このように本発明に適用されたエントロピー符号化アルゴリズムを、文脈基盤適応的算術符号化アルゴリズムと称する。
図2は、木の葉に対してカラー量子化した結果を説明するためのものであり、(a)は、原映像、(b)は、10個のカラー数でカラー量子化した結果、(c)は、30個のカラー数でカラー量子化した結果、(d)は、41個のカラー数でカラー量子化した結果をそれぞれ表す。図3は、図2に図示された原映像と各カラー量子化した結果間のエラー映像とを説明するためのものであり、(a)は、原映像、(b)は、原映像と10個のカラー数でカラー量子化した映像間のエラー映像、(c)は、原映像と30個のカラー数でカラー量子化した映像間のエラー映像、(d)は、原映像と41個のカラー数でカラー量子化した映像間のエラー映像をそれぞれ表す。ここで、各エラー映像は、R、G、B各カラーに128のオフセットが加わった映像である。
許容ノイズ獲得部130の細部的な動作を説明するに先立って、カラー量子化アルゴリズムについて簡単に説明する。
一般的に多く使われる映像は、一つの画素がR、G、Bの3つの成分で構成され、それぞれ8ビットで表現される。この場合、映像を表現するカラーの総数は224個であり、非常に多くの表現可能なカラー数を持つ。しかし、人間の認知能力はこれらすべてのカラーの数をそれぞれ区別できず、このような認知能力は、カラーの値自体だけでなく周囲画素のカラー分布によって多様に変わる。カラー量子化アルゴリズムの一例では、色に対してLab空間で色に対する人間の視感的な距離と数値的距離とが比較的一致するという特性とフィボナッチ格子(Fibonacci Lattice)とを利用したものがある(Aleksandra Mojsilovic及びEmina Soljaninの論文、“Color Quantization and Processing by Fibonacci Lattices”、IEEE Trans.Image Processing,vol.10,pp.1712−1725,Nov.2001参照)。これによれば、512個または1024個内外の小さなカラー数を持って、原映像と区別し難い復元された映像を作ることができる。カラー量子化アルゴリズムの他の例では、画素の相関性、輝度でのノイズ及び明暗対応のノイズを利用して、新たな映像ノイズを定義している(Zhou Wang及びAlan C.Bovik、“Universal Image Quality Index”,IEEE Signal Processing Letters,vol.9,pp.81−84,March 2002参照)。カラー量子化アルゴリズムのさらに他の例では、人の認知能力を平坦性と分別性とでモデリングして、各映像での認知能力に対する敏感度を加重値で表現し、この加重値によって小さなカラー数でのみイメージを表現する努力があった(Kuk−Jin Yoon及びIn−So Kweonの論文、“Human Perception Based Color Image Quantization”,17th International Conference on Pattern Recognition,August,2004)。このアルゴリズムの特徴は、視感的な特性を利用して抽出したイメージ値を利用してカラー量子化を行う過程で、漸進的なカラー量子化と定義したコスト関数とによって最適のカラー数nを決定する。したがって、この過程を通じて2個のカラーで構成された量子化映像から、n個のカラーで構成された量子化映像を得ることができる。一方、映像符号化でのカラー量子化アルゴリズムは、カラーベクトル量子化の概念として使われる。すなわち、カラー量子化を行った後に、実際の画素値と量子化された値とをマッピングするマッピングテーブルと、量子化された画素からなるインデックス映像とを、エントロピーコーディングを通じて圧縮を行う(Zhu Li and Aggelos K.Katsaggelos,“Color Vector Quantization based Video Coder”,IEEE International Conference on Image Processing,vol.3,pp.673−676,Oct.2002参照)。
許容ノイズ獲得部130では、原映像に対してフレーム単位あるいは一定のブロック単位でカラー量子化を行った結果を利用して許容ノイズを獲得する。これをさらに細部的に説明すれば、原映像を
(外6)
Figure 0005001853

と略す)と、k個のカラー数でカラー量子化された映像を
(外7)
Figure 0005001853

と略す)と表し、この時、
(外8)
Figure 0005001853

とは、視覚的に同一であると仮定する。ここで、
(外9)
Figure 0005001853

と任意の整数kに対するに
(外10)
Figure 0005001853

とに対して、次の式(1)で表現できる。
Figure 0005001853

ここで、
(外11)
Figure 0005001853

は、原映像
(外12)
Figure 0005001853

とk個のカラー数でカラー量子化された映像
(外13)
Figure 0005001853

とに対するエラー映像である。
この時、次の式(2)を満足する整数hを探すことができる。
Figure 0005001853

前記式(2)で整数hを探す方法はいろいろありえる。一例として、前記式(2)を満足できる適宜なコスト関数を定義し、カラー数を2からnまで漸進的に増加させていきつつ、カラー量子化を行った映像と原映像とのエラー映像がコスト関数を満足させうる最小のカラー数を決定する。
一方、任意の整数k(≧h)に対しては、エラー映像
(外14)
Figure 0005001853

を、次の式(3)を満足する任意のノイズeに入れ替えて映像γを作っても、依然として
(外15)
Figure 0005001853

の関係が成立する。
Figure 0005001853

ここで、エラー映像
(外16)
Figure 0005001853

を許容ノイズと定義し、許容ノイズ以下のノイズが入る場合には、原映像と量子化された映像とが同一である。すなわち、二つの映像間に主観的な損失がないということを意味する。許容ノイズは、決定されたエラー映像
(外17)
Figure 0005001853

に存在する各画素値あるいは各画素値の絶対値を一定のブロック、例えば、コーディングブロック単位に区分して求める。
図4は、図1の許容ノイズ獲得部130において、原映像に対して各画素単位で得られた許容ノイズを説明するものであり、ここでは、エラー映像
(外18)
Figure 0005001853

で画素値の絶対値を取って各コーディングブロック単位でグラフで示したものである。
図5は、図1において、量子化パラメータ決定部150の動作を説明するものであり、各コーディングブロック単位で一つの量子化パラメータが決定される。例えば、コーディングブロックBは量子化パラメータQpを、コーディングブロックBは量子化パラメータQpを、コーディングブロックB16は量子化パラメータQp16を持つ。図5を参照して、許容ノイズを利用して許容ノイズ以下に量子化ノイズ、すなわち、符号化エラーが発生できるように最大量子化パラメータを決定する方法を説明する。
原映像
(外19)
Figure 0005001853

に対して量子化パラメータQpを利用して量子化した後、同じ量子化パラメータQpを利用して逆量子化して、復元した映像
(外20)
Figure 0005001853

は、次の式(4)のように表現できる。
Figure 0005001853

ここで、
(外21)
Figure 0005001853

は、原映像
(外22)
Figure 0005001853

に対して量子化パラメータQpを利用して量子化した後、同じ量子化パラメータQpを利用して逆量子化する過程を表す関数である。ここで、量子化及び逆量子化は、多様なアルゴリズムを適用して行うことができ、一例としては、デッドゾーンを持つ均一量子化アルゴリズムを適用でき、この時、量子化過程及び逆量子化過程は、次の式(5)及び(6)のように表すことができる。次の式(5)及び(6)は、量子化パラメータを2倍した値を6等分して量子化を行うように設計されたものである。
Figure 0005001853

一方、量子化ノイズは、次の式(7)のように表すことができる。
Figure 0005001853

量子化パラメータQpは、符号化される情報であるので、あらゆる画素に対してそれぞれの量子化パラメータQpを符号化することは非常に非効率的である。したがって、原映像
(外23)
Figure 0005001853
に対して一定のサイズのブロック単位、例えば、コーディングブロック単位に分けて各コーディングブロック単位で量子化パラメータを決定する。任意のコーディングブロックを
(外24)
Figure 0005001853

とし、コーディングブロック
(外25)
Figure 0005001853

の量子化パラメータを
(外26)
Figure 0005001853

とする場合、式(4)及び式(5)は、次の式(8)及び(9)のように整理されうる。
Figure 0005001853

前記式(9)を許容ノイズと結びつけて表せば、コーディングブロックの量子化パラメータは、次の式(10)で表現できる。
Figure 0005001853

ここで、
(外27)
Figure 0005001853

は、それぞれ全体エラー映像に存在するコーディングブロックの許容ノイズ及びコーディングブロック
(外28)
Figure 0005001853

の量子化ノイズをそれぞれ表し、これは、許容ノイズを獲得した後に分かる値であるため、定数
(外29)
Figure 0005001853

と設定する。
各コーディングブロックの量子化パラメータ
(外30)
Figure 0005001853

を決定するために、一定の変化幅で漸進的に小さな値から大きい値に増加させる方法を採択するが、必ずしもこれに限定されるものではない。コーディングブロックの量子化パラメータ
(外31)
Figure 0005001853

の初期値と変化幅とは、演算量と正確度のトレードオフ関係を持つ。図5に図示された許容ノイズグラフで、各コーディングブロックB〜B17に対して表示された太いラインは、各コーディングブロックに対して設定した許容ノイズの限界値を表す。すなわち、各コーディングブロックに設定された許容ノイズ限界値を超える量子化ノイズが発生しないように、各コーディングブロックの量子化パラメータを決定するのである。
一方、許容ノイズを利用した映像符号化は、多様な形態の符号化器に適用できる。例えば、空間的重畳を除去するために、符号化に使われる変換及び逆変換過程をそれぞれ次の式(11)及び(12)のように定義する。
Figure 0005001853

この時、式(1)を、変換概念を使用して次の式(13)のように表現できる。
Figure 0005001853

変換概念の線形性を利用すれば、式(13)は、次の式(14)のように表すことができる。
Figure 0005001853

式(14)は、ブロック概念を導入する場合、次の式(15)のように表すことができる。
Figure 0005001853

前記式(14)及び(15)から、全体映像単位の変換またはブロック単位の変換に許容ノイズの概念をいずれも使用できることが分かる。
再び図1に戻って、エントロピー符号化部190では、圧縮効率、スケーラブル機能、及び複雑度を考慮して、文脈基盤適応的算術符号化を利用したエンベデッド符号化によりエントロピー符号化を行う。この時、文脈基盤適応的算術符号化のために文脈を設定する。処理されたデータの文脈から現在シンボルの確率値を予測し、これを算術符号化に反映する。したがって、確率値がよく予測されるように文脈を説明する必要がある。文脈の選定のためには、現在のシンボルに対して相関度の高い文脈を選定する。一方、エンベデッド符号化のために原映像に対して複数個のレイヤー構造を形成するためには、変換部110で多重レイヤーウェーブレットフィルタリングを行うことが望ましい。各レイヤーは、上位レイヤーと共に他の解像度についての情報を提供するために、多重レイヤーウェーブレットフィルタリングは空間的スケーラビリティを提供できる。最上位レイヤーは、LL(Low−Low)バンドだけで構成され、残りの下位レイヤーは、それぞれLH(Low−High)、HL(High−Low)、HH(High−High)バンドで構成される。各レイヤーを再生するために、上位レイヤーについての情報をいずれも提供する。したがって、エントロピー符号化のためのレイヤー順序は、最上位レイヤーから始まって下位レイヤーにつながる。
一方、各レイヤーを構成しているバンドに対するエントロピー符号化のためにコーディングブロックを定義する。コーディングブロックは、レイヤーによってブロックのサイズが変わり、符号化時に符号化パラメータで定義できる。コーディングブロックは、量子化パラメータ決定単位、量子化された係数値についてのMSB(Most Significant Bit)情報提供単位、レイジービット情報提供単位、ブロックスキャン単位として使われうる。エントロピー符号化部190では、ブロックスキャン単位、すなわち、コーディングブロック単位でビットプレイン符号化を行う。すなわち、MSBからLSB(Least Significant Bit)まで走査線順序に基づいて、画素のビットがスキャンされて符号化が行われる。
以下、エントロピー符号化部190に適用された文脈基盤適応的算術符号化をさらに具体的に説明する。
量子化された係数に対する最も小さなエントロピー符号化入力単位をシンボルという場合、BSACアルゴリズムは、量子化された係数に対するビットプレイン符号化であるために、シンボルは0または1のうちいずれか一つの値を持つ。したがって、本発明に適用されるBSACアルゴリズムは、基本的に二進算術符号化である。各シンボルに対する文脈を選定するために考慮されねばならない要素としては、各シンボルに対する各文脈の相関度を挙げることができる。すなわち、各シンボルに対する文脈の相関度が高ければ、各シンボルに対する確率値をさらに正確に予測でき、正確な確率値によって算術符号化時に圧縮効率を高めることができる。文脈を選定するために相関度と共に考慮されねばならない要素としては、文脈の因果率(causability)を挙げることができる。すなわち、符号化器で使われる文脈は、復号化器で使われる文脈と同じ値で構成されねばならないので、文脈は既に処理されて符号化されたシンボルまたは付加情報で構成される。一方、文脈を選定するために相関度と共に考慮されねばならない他の要素としては、複雑度を挙げることができる。BSACアルゴリズムは、あらゆる量子化された係数のMSBからLSBまであらゆるビットをシンボルとするために、処理されねばならないシンボルの数が非常に多い。各シンボルに対する文脈の種類が過度に多ければ、圧縮効率は上昇させることができる一方、符号化器及び復号化器でメモリの容量及び処理速度面で負担になりうる。特に、適応的算術符号化の場合、過度に多様な文脈は、新たなビットパターンに対する適応速度を低下させて圧縮効率をかえって落とす恐れがある。
エントロピー符号化部190では、各シンボルに対する文脈を設定するために、隣接画素間の相関度が最も高いという映像の特性と複雑度を考慮して、一つのコーディングブロックで各シンボルの画素を中心とする、例えば、3×3ウィンドウを設定する。これによれば、一つのウィンドウ内に含まれる画素らに対して文脈を構成できる。図6は、図1のエントロピー符号化部190で文脈を設定するために、任意のコーディングブロックに対して適用した3×3ウィンドウを示す図である。
次いで、ビットプレイン符号化のために、次の式(16)のように任意のビットプレインjの確率値を予測して二進算術符号化を行う。
Figure 0005001853

前記式(16)において、jは、シンボルのビットプレイン番号、lは、レイヤー番号、bは、バンド番号をそれぞれ表す。Lは、レイジービット、vは、j+1番目ビットプレインで1が出た数、wは、j番目ビットプレインで既に処理されたビットパターンを表す。
一方、レイジービットLは、次の式(17)のように決定される。
Figure 0005001853

ここで、mは、コーディングブロックに含まれた画素の平均を表し、MSB(x)は、xを表現するビットプレインで1値を持つ最も上位ビット位置を表す。
図7は、図1のエントロピー符号化部190でビットプレイン符号化時に使われる文脈を説明する図である。図7を参照するに、例えば、j番目ビットプレインに含まれたシンボル710の文脈計算は、直上位のj+1番目ビットプレインのビット720と、j番目ビットプレインで既に処理された4個のビットパターン710とを利用して決定する。一方、式(16)のようにレイジービットLより小さなビットプレイン、すなわち、レイジープレーンプレインでは確率値を1/2に固定する。レイジービットより小さなビットプレインにあるシンボルは、別途の文脈計算をしないために、これによる演算量の低減を図ることができる。相異なる量子化パラメータ値により多様な量子化された係数を持つ場合、レイジービットを使用すれば、相対的なビットプレイン値j−Lを提供するので、符号化効率を大幅向上させることができる。
図8は、図1のスキャン順序決定部180の動作を説明するための図である。
エントロピー符号化部190では、上位ビットレートで主観的にノイズが最小化された復原映像を得ることができる。また、文脈基盤適応算術符号化を通じて空間及びSNRスケーラビリティを提供するために、一度生成されたビット列は目的によって必要に応じて再生に使用できる。このように、ビット列の一部を使用する場合に発生する画質についての最適化問題を説明すれば、次の通りである。
一部ビット列から再生された映像に対する画質最適化のために、ビット列構成において重要な情報を前方に位置させることと、任意のサイズを持つビット列に対して主観的画質観点で最適化させることとを考慮することができる。すなわち、一部ビット列を切る時、全体ビット列の後側からから切るので、画質に影響を多く及ぼす重要な情報であるほど前方に配置させるのである。これは、いずれもエントロピーコーディングのためのスキャン順序と非常に密接に関連している。
エントロピー符号化部190で、最上位ビットレートでは、文脈基盤適応的算術符号化に基づいてコーディングブロック単位でスキャンされ、各コーディングブロックは、各ビットプレインに対して走査線方向にスキャンされる。サブビットレートでの最適化のために、コーディングブロックのスキャン順序、コーディングブロック内で画素のスキャン順序、及びビットプレインでのスキャン順序を考慮することができる。コーディングブロックのスキャン順序及びコーディングブロック内で画素のスキャン順序は、メモリ使用量や複雑度の側面と共に考慮されねばならない。また必要な場合、重要なコーディングブロックと重要な画素とを先ずスキャンできるように、スキャン順序を定めたテーブルを使用するか、適応的にスキャン順序を変えることができる。
文脈基盤適応的算術符号化では、一つのコーディングブロックであらゆるビットプレインがMSBからLSBまでスキャンされた後に、他のコーディングブロックをスキャンする。このようなスキャン方式は、MSE(Mean Square Error)の概念であり、各画素のビットプレインに対する重要度は、MSBに近いほど高いという仮定を基盤とする。したがって、最上位ビットレートでは、このような仮定を適用できるが、サブビットレートではその適用に限界がある。
これを解決するために、スキャン順序決定部180では、量子化された係数に対して品質レイヤーを決定する。品質レイヤーは、JPEG2000に使われたEBCOT(Embedded Block Coding with Optimized Truncation)アルゴリズムで採用している方法である(David Taubmanの論文、“High Performance Scalable Image Compression with EBCOT”、IEEE Trans.Image Processing,vol.9,pp.1158−1170,July 2000参照)。スキャン順序決定部180では、ビットプレイン符号化に対して任意数の品質レイヤーによって、各レイヤーに対して許容ノイズを利用して決定されたほどのビットプレインで一つの品質レイヤーを構成する。構成された品質レイヤーは、上位品質レイヤーからスキャンする。
以下、許容ノイズを利用して視感的ノイズ側面で、サブビットレートでの最適化がどのように行われるかについて説明する。
品質レイヤー数をnとすれば、n個の品質レイヤー(図9のL0、L1など)で構成されるビット列
(外32)
Figure 0005001853

で表すことができる。ここで、ビット列
(外33)
Figure 0005001853

を復号化する過程を
(外34)
Figure 0005001853

とすれば、スケーラブル機能によってn個の再生映像、すなわち、
(外35)
Figure 0005001853

を得ることができる。この時、各再生映像に対するエラー映像は、
(外36)
Figure 0005001853

で表すことができる。各工程で使用する許容ノイズ(図8で830、850)を求めるためには、先ず、原映像に対してカラー量子化された映像を求め、このカラー量子化された映像β,β,…,βn−1は、次の式(18)のような性質を持つ。
Figure 0005001853

ここで、
(外37)
Figure 0005001853

は、映像βにあるカラー数を表す。
それぞれのカラー量子化された映像に対して、許容ノイズτを次の式(19)のように求める。
Figure 0005001853

式(13)で、各工程のカラー量子化された映像βが、与えられたカラー数iに対して視感的に最適の映像を再現していると仮定して、式(19)を満足すれば、各品質レイヤーに対して人間の視感特性を基盤とするR−D曲線上に、それぞれのサブビットレートで最適化されたと言える。すなわち、次の式(20)が成立する。
Figure 0005001853

図10は、本発明の一実施形態による映像復号化装置の構成を示すブロック図であり、エントロピー復号化部1010、逆量子化部1030及び逆変換部1050を備えてなる。
図10を参照するに、エントロピー復号化部1010は、入力されるビット列をエントロピー復号化して量子化された係数を生成する。エントロピー復号化過程は、図1に図示された映像符号化装置において、エントロピー符号化過程の逆過程に該当する。
逆量子化部1030では、エントロピー復号化部1010で提供される量子化された係数を逆量子化して変換係数を生成する。逆量子化過程は、図1に図示された映像符号化装置において量子化過程の逆過程に該当する。
逆変換部1050では、逆量子化部1030で提供された変換係数を逆変換して復元された映像を生成する。逆変換過程は、図1に図示された映像符号化装置において変換過程の逆過程に該当する。
次いで、本発明による映像符号化及び復号化アルゴリズムの性能を評価するための比較実験を実施した。テスト映像は、512×512サイズであり、カラーは、YUV444フォーマットを使用した。ウェーブレット分解及び合成のために、Y成分は9/7フィルターを、U及びV成分は5/3フィルターを使用し、使われたフィルター係数値はJPEG2000と同一である。一方、ウェーブレットフィルターは、いずれもリフティング構造で具現された。ウェーブレット分解は5ステップまで行って総6ステップの空間スケーラブル映像を復元でき、この時、コーディングブロックは次の表1のように設定した。
Figure 0005001853

比較実験のために使われたJPEG2000ソフトウェアは、JPEG2000ホームページで公開された参照用ソフトウェア(http://www.jpeg.org/jpeg2000/index.html)であり、Jasperバージョン1.701.0である。この時、符号化器オプションは、デフォルトに設定して実験を実施した。
図11の(a)ないし(d)は、テスト映像の例であり、それぞれヒヒ、クリップ、オウム及び木の葉を表し、R、G、Bそれぞれ8ビットで構成される512×512サイズの映像である。
ところが、本発明による符号化及び復号化アルゴリズムを具現するに当っては、MSE概念でのR−D最適化過程を行わない一方、JPEG2000では、MSE概念でのR−D最適化過程を行っている。このような状況で測定されたPSNRを説明すれば、テスト映像の種類と圧縮率によって、輝度成分の場合にJPEG2000により復号化された映像が約0.8dB高い値を示した。
次の表2は、本発明とJPEG2000によりそれぞれ復号化された映像に対するPSNR値を比較したものであり、データ上ではPSNRにおいて差があることが分かる。
Figure 0005001853

一方、図12の(a)及び(c)は、本発明を‘ヒヒ’に適用した場合、それぞれ20:1及び50:1の圧縮率で符号化及び復号化により得られた映像、(b)及び(d)は、JPEG2000を‘ヒヒ’に適用した場合、それぞれ20:1及び50:1の圧縮率で符号化及び復号化により得られた映像を表す。図13の(a)及び(c)は、本発明を‘クリップ’に適用した場合、それぞれ20:1及び50:1の圧縮率で符号化及び復号化により得られた映像、(b)及び(d)は、JPEG2000を‘クリップ’に適用した場合、それぞれ20:1及び50:1の圧縮率で符号化及び復号化により得られた映像を表す。図14の(a)及び(c)は、本発明を‘オウム’に適用した場合、それぞれ100:1及び200:1の圧縮率で符号化及び復号化により得られた映像、(b)及び(d)は、JPEG2000を‘オウム’に適用した場合、それぞれ20:1及び50:1の圧縮率で符号化及び復号化により得られた映像を表す。図15の(a)及び(c)は、本発明を‘木の葉’に適用した場合、それぞれ20:1及び50:1の圧縮率で符号化及び復号化により得られた映像、(b)及び(d)は、JPEG2000を‘木の葉’に適用した場合、それぞれ20:1及び50:1の圧縮率で符号化及び復号化により得られた映像を表す。
このように図12の(a)ないし(d)、図13の(a)ないし(d)、図14の(a)ないし(d)、図15の(a)ないし(d)を説明すれば、本発明及びJPEG2000により復号化された映像は、主観的には互いに同一あるいは類似した映像であることが確認できる。
本発明はまた、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られるデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ記録装置などがあり、また、キャリアウェーブ(例えば、インターネットを通じた伝送)の形態で具現されるものも含む。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードが保存されて実行されうる。そして、本発明を具現するための機能的なプログラム、コード及びコードセグメントは、本発明が属する技術分野のプログラマーにより容易に推論できる。
本発明は、図面に図示された一実施形態を参考として説明したが、これは例示的なものに過ぎず、当業者ならばこれより多様な変形及び実施形態の変形が可能であるという点を理解できるであろう。したがって、本発明の真の技術的保護範囲は、特許請求の範囲の技術的思想によって定められねばならない。
本発明の一実施形態による映像符号化装置の構成を示すブロック図である。 木の葉に対してカラー量子化した結果を説明するための図である。 図2に図示された原映像と各カラー量子化した映像間のエラー映像を説明するための図である。 図1の許容ノイズ獲得部において、原映像に対してコーディングブロック単位で得られた許容ノイズを説明する図である。 図1において量子化パラメータ決定部の動作を説明する図である。 図1のエントロピー符号化部で、文脈を設定するために使われる3×3ウィンドウを示す図である。 図1のエントロピー符号化部で、ビットプレイン符号化時に使われるレイジービットを説明する図である。 図1において、スキャン順序決定部の動作を説明する図である。 図8において、決定された品質レイヤーによるスキャン順序を説明する図である。 本発明の一実施形態による映像復号化装置の構成を示すブロック図である。 (a)ないし(d)は、本発明による映像符号化及び復号化アルゴリズムの性能を評価するために使われたテスト映像の例を示す図である。 (a)ないし(d)は、図10の(a)のテスト映像に対して、本発明による映像符号化及び復号化アルゴリズムとJPEG2000とを比較した図である。 (a)ないし(d)は、図10の(b)のテスト映像に対して、本発明による映像符号化及び復号化アルゴリズムとJPEG2000とを比較した図である。 (a)ないし(d)は、図10の(c)のテスト映像に対して、本発明による映像符号化及び復号化アルゴリズムとJPEG2000とを比較した図である。 (a)ないし(d)は、図10の(d)のテスト映像に対して、本発明による映像符号化及び復号化アルゴリズムとJPEG2000とを比較した図である。

Claims (14)

  1. 入力される原映像を変換して空間的重畳を除去する変換部と、
    前記原映像から許容ノイズを獲得する許容ノイズ獲得部と、
    前記許容ノイズを利用して量子化パラメータを決定する量子化パラメータ決定部と、
    前記量子化パラメータを利用して、前記変換部から提供される変換係数を量子化して、量子化された係数を生成する量子化部と、
    前記量子化された係数をエントロピー符号化して統計的重畳を除去するエントロピー符号化部とを備え
    前記許容ノイズ獲得部は、前記原映像と該原映像をカラー量子化した映像間のエラー映像が予め定まったコスト関数を満足できる最小カラー数を決定し、前記最小カラー数で得られるエラー映像に存在する各画素値あるいは各画素値の絶対値から前記許容ノイズを獲得することを特徴とする映像符号化装置。
  2. 入力される原映像を変換して空間的重畳を除去する変換部と、
    前記原映像から許容ノイズを獲得する許容ノイズ獲得部と、
    前記許容ノイズを利用して量子化パラメータを決定する量子化パラメータ決定部と、
    前記量子化パラメータを利用して、前記変換部から提供される変換係数を量子化して、量子化された係数を生成する量子化部と、
    前記許容ノイズを利用して決定される品質レイヤーによってスキャン順序を決定するスキャン順序決定部と、
    前記量子化された係数を前記品質レイヤーによるスキャン順序にエントロピー符号化して、統計的重畳を除去するエントロピー符号化部とを備え
    前記許容ノイズ獲得部は、前記原映像と該原映像をカラー量子化した映像間のエラー映像が予め定まったコスト関数を満足できる最小カラー数を決定し、前記最小カラー数で得られるエラー映像に存在する各画素値あるいは各画素値の絶対値から前記許容ノイズを獲得することを特徴とする映像符号化装置。
  3. 入力される原映像を変換して空間的重畳を除去する工程と、
    前記原映像から許容ノイズを獲得する工程と、
    前記許容ノイズを利用して量子化パラメータを決定する工程と、
    前記量子化パラメータを利用して、前記変換部から提供される変換係数を量子化して、量子化された係数を生成する工程と、
    前記量子化された係数をエントロピー符号化して統計的重畳を除去する工程とを含み、
    前記許容ノイズ獲得工程は、前記原映像と該原映像をカラー量子化した映像間のエラー映像が予め定まったコスト関数を満足できる最小カラー数を決定し、前記最小カラー数で得られるエラー映像に存在する各画素値あるいは各画素値の絶対値から前記許容ノイズを獲得することを特徴とする映像符号化方法。
  4. 入力される原映像を変換して空間的重畳を除去する工程と、
    前記原映像から許容ノイズを獲得する工程と、
    前記許容ノイズを利用して量子化パラメータを決定する工程と、
    前記量子化パラメータを利用して、前記変換部から提供される変換係数を量子化して、量子化された係数を生成する工程と、
    前記許容ノイズを利用して決定される品質レイヤーによってスキャン順序を決定する工程と、
    前記量子化された係数を、前記品質レイヤーによるスキャン順序にエントロピー符号化して、統計的重畳を除去する工程とを含み、
    前記許容ノイズ獲得工程は、前記原映像と該原映像をカラー量子化した映像間のエラー映像が予め定まったコスト関数を満足できる最小カラー数を決定し、前記最小カラー数で得られるエラー映像に存在する各画素値あるいは各画素値の絶対値から前記許容ノイズを獲得することを特徴とする映像符号化方法。
  5. 請求項1あるいは2に記載の装置により生成されたビット列をエントロピー復号化して、量子化された係数を生成するエントロピー復号化部と、
    前記量子化された係数を逆量子化して変換係数を生成する逆量子化部と、
    前記変換係数を逆変換して復元された映像を生成する逆変換部とを備えることを特徴とする映像復号化装置。
  6. 請求項3あるいは4に記載の方法により生成されたビット列をエントロピー復号化して、量子化された係数を生成する工程と、
    前記量子化された係数を逆量子化して変換係数を生成する工程と、
    前記変換係数を逆変換して復元された映像を生成する工程とを含むことを特徴とする映像復号化方法。
  7. 前記量子化パラメータ決定部は、各コーディングブロックの量子化結果生成される量子化ノイズが前記許容ノイズ以下になるよう前記各コーディングブロックの量子化パラメータを決定することを特徴とする請求項1または2に記載の映像符号化装置。
  8. 前記エントロピー符号化部は、スキャン順序で最上位ビットから最下位ビットに画素のビットをスキャンしてビットプレーン符号化を行うことを特徴とする請求項1または2に記載の映像符号化装置。
  9. 前記エントロピー符号化部は、レイジービットを利用して前記ビットプレーン符号化を行うことを特徴とする請求項8に記載の映像符号化装置。
  10. 前記各品質レイヤーは、前記許容ノイズを利用して決定されるビットプレーンからなることを特徴とする請求項2に記載の映像符号化装置。
  11. 前記量子化パラメータ決定工程は、各コーディングブロックの量子化結果生成される量子化ノイズが前記許容ノイズ以下になるよう前記各コーディングブロックの量子化パラメータを決定することを特徴とする請求項3または4に記載の映像符号化方法。
  12. 前記エントロピー符号化工程は、スキャン順序で最上位ビットから最下位ビットに画素のビットをスキャンしてビットプレーン符号化を行うことを特徴とする請求項3または4に記載の映像符号化方法。
  13. 前記エントロピー符号化工程は、レイジービットを利用して前記ビットプレーン符号化を行うことを特徴とする請求項12に記載の映像符号化方法。
  14. 前記各品質レイヤーは、前記許容ノイズを利用して決定されるビットプレーンからなることを特徴とする請求項4に記載の映像符号化方法。
JP2007545388A 2004-12-14 2005-12-14 映像符号化及び復号化装置とその方法 Active JP5001853B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20040105383 2004-12-14
KR10-2004-0105383 2004-12-14
PCT/KR2005/004310 WO2006065078A1 (en) 2004-12-14 2005-12-14 Apparatus for encoding and decoding image and method thereof

Publications (2)

Publication Number Publication Date
JP2008523706A JP2008523706A (ja) 2008-07-03
JP5001853B2 true JP5001853B2 (ja) 2012-08-15

Family

ID=36588098

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007545388A Active JP5001853B2 (ja) 2004-12-14 2005-12-14 映像符号化及び復号化装置とその方法

Country Status (6)

Country Link
US (1) US9008451B2 (ja)
EP (1) EP1825687B1 (ja)
JP (1) JP5001853B2 (ja)
KR (1) KR100928968B1 (ja)
CN (1) CN101080931B (ja)
WO (1) WO2006065078A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100584023C (zh) * 2004-07-14 2010-01-20 新加坡科技研究局 用于基于上下文的信号编码和解码的方法和设备
US7684632B2 (en) * 2005-05-16 2010-03-23 Hewlett-Packard Development Company, L.P. Estimating image compression quantization parameter values
US8126054B2 (en) * 2008-01-09 2012-02-28 Motorola Mobility, Inc. Method and apparatus for highly scalable intraframe video coding
KR101359500B1 (ko) * 2008-07-28 2014-02-11 에스케이 텔레콤주식회사 양자화/역 양자화 장치 및 방법과 그를 이용한 영상부호화/복호화 장치
CN101686383B (zh) * 2008-09-23 2013-05-01 Utc消防和保安美国有限公司 通过网络传输媒体的方法及系统
KR101624649B1 (ko) * 2009-08-14 2016-05-26 삼성전자주식회사 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101487687B1 (ko) * 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
WO2012079237A1 (zh) * 2010-12-16 2012-06-21 北京航空航天大学 一种图像压缩中利用人眼视觉模型的小波系数量化方法
JP2014523186A (ja) * 2011-06-28 2014-09-08 サムスン エレクトロニクス カンパニー リミテッド エントロピー符号化/復号化方法及びその装置
US9728159B2 (en) * 2012-03-21 2017-08-08 Dolby Laboratories Licensing Corporation Systems and methods for ISO-perceptible power reduction for displays
US9819964B2 (en) * 2012-05-04 2017-11-14 Environmental Systems Research Institute, Inc. Limited error raster compression
US9002126B2 (en) * 2012-05-04 2015-04-07 Environmental Systems Research Institute (ESRI) Limited error raster compression
US10085017B2 (en) * 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
CN104782121A (zh) * 2012-12-18 2015-07-15 英特尔公司 多区域视频会议编码
CN105872539B (zh) * 2015-02-08 2020-01-14 同济大学 图像编码方法和装置及图像解码方法和装置
US10163029B2 (en) * 2016-05-20 2018-12-25 Gopro, Inc. On-camera image processing based on image luminance data
DE102019204527B4 (de) * 2019-03-29 2020-11-19 Technische Universität München Kodierungs-/dekodierungsvorrichtungen und verfahren zur kodierung/dekodierung von vibrotaktilen signalen

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2014935C (en) * 1989-05-04 1996-02-06 James D. Johnston Perceptually-adapted image coding system
JPH04372074A (ja) 1991-06-21 1992-12-25 Nippon Telegr & Teleph Corp <Ntt> ポストフィルタ
JPH0775102A (ja) 1993-07-19 1995-03-17 Sharp Corp 画像符号化装置
JPH0774954A (ja) 1993-09-01 1995-03-17 Nippon Telegr & Teleph Corp <Ntt> 画像情報符号・復号化法
US5426512A (en) * 1994-01-25 1995-06-20 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error
US5629780A (en) * 1994-12-19 1997-05-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error
US6529631B1 (en) * 1996-03-29 2003-03-04 Sarnoff Corporation Apparatus and method for optimizing encoding and performing automated steerable image compression in an image coding system using a perceptual metric
WO2002056297A1 (en) * 2001-01-11 2002-07-18 Sasken Communication Technologies Limited Adaptive-block-length audio coder
EP1331824A3 (en) 2001-11-27 2005-09-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding key value data of coordinate interpolator
DE10300048B4 (de) 2002-01-05 2005-05-12 Samsung Electronics Co., Ltd., Suwon Verfahren und Vorrichtung zur Bildcodierung und -decodierung
JP2003230023A (ja) 2002-02-01 2003-08-15 Mitsubishi Electric Corp ネットワークカメラのアパーチャ補正方法及びネットワークカメラ
US20030215013A1 (en) * 2002-04-10 2003-11-20 Budnikov Dmitry N. Audio encoder with adaptive short window grouping
US6961736B1 (en) * 2002-05-31 2005-11-01 Adobe Systems Incorporated Compact color feature vector representation
US7302105B2 (en) * 2002-07-22 2007-11-27 Canon Kabushiki Kaisha Moving image coding apparatus, moving image decoding apparatus, and methods therefor
GB0228556D0 (en) * 2002-12-06 2003-01-15 British Telecomm Video quality measurement
AU2003900531A0 (en) * 2003-01-30 2003-02-20 Canon Kabushiki Kaisha Compression into a fixed buffer
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
CN1461112A (zh) * 2003-07-04 2003-12-10 北京阜国数字技术有限公司 一种基于极小化全局噪声掩蔽比准则和熵编码的量化的音频编码方法
EP1939863A3 (en) * 2003-10-10 2008-07-16 Agency for Science, Technology and Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
CN100584023C (zh) * 2004-07-14 2010-01-20 新加坡科技研究局 用于基于上下文的信号编码和解码的方法和设备

Also Published As

Publication number Publication date
EP1825687A1 (en) 2007-08-29
US9008451B2 (en) 2015-04-14
CN101080931B (zh) 2010-06-16
US20080131014A1 (en) 2008-06-05
JP2008523706A (ja) 2008-07-03
WO2006065078A1 (en) 2006-06-22
EP1825687B1 (en) 2015-10-28
EP1825687A4 (en) 2011-03-16
KR20070090191A (ko) 2007-09-05
KR100928968B1 (ko) 2009-11-26
CN101080931A (zh) 2007-11-28

Similar Documents

Publication Publication Date Title
JP5001853B2 (ja) 映像符号化及び復号化装置とその方法
KR100750138B1 (ko) 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치
JP4273996B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
KR101141247B1 (ko) 디지털 신호를 확장성 비트스트림으로 인코딩하는 방법;확장성 비트스트림을 디코딩하는 방법
JP4102841B2 (ja) ビデオ画像を処理するコンピュータ実行方法
JP3743384B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
JP4444790B2 (ja) 画像圧縮方法、画像圧縮装置、画像圧縮システム、プログラム
US20150043630A1 (en) Image encoding device, image decoding device, image encoding method, and image decoding method
AU6708496A (en) Hybrid waveform and model-based encoding and decoding of image signals
JP2008507161A (ja) ビデオ処理用雑音フィルタ
JP2004032718A (ja) フェーディング推定/補償によりビデオフレームを処理するシステムおよび方法
US9264736B2 (en) Encoding method, decoding method, encoding device, and decoding device
JPWO2003079692A1 (ja) 階層符号化装置および復号装置
JP2004528791A (ja) インターフレーム符号化方法および装置
US7551788B2 (en) Digital image coding device and method for noise removal using wavelet transforms
JP3853710B2 (ja) ディジタル画像符号化装置およびディジタル画像符号化方法
KR100989686B1 (ko) 데이터 소스에 의해 생성된 비트 심볼들을 처리하기 위한 방법 및 장치, 컴퓨터 판독가능 매체, 컴퓨터 프로그램 요소
JP3853708B2 (ja) デジタル画像符号化装置および符号化方法ならびにプログラム
JP2004266794A (ja) マルチ・リゾルーション・ビデオ符号化および復号化
JP2005223852A (ja) 画像符号化装置および方法、ならびに画像復号装置および方法
JP3833585B2 (ja) 画像符号化装置および画像符号化方法、コンピュータプログラム
JP4040404B2 (ja) 符号列変換装置及び方法、画像処理装置並びに画像記録装置
JPH05276499A (ja) 符号化装置及び符号化方法
PL A Study on Image Compression Technology
Swaminathan A new hybrid adaptive predictive technique for data compression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110920

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111220

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120424

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120518

R150 Certificate of patent or registration of utility model

Ref document number: 5001853

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250