JP4254147B2 - Image information encoding method and apparatus, program, and recording medium - Google Patents
Image information encoding method and apparatus, program, and recording medium Download PDFInfo
- Publication number
- JP4254147B2 JP4254147B2 JP2002207487A JP2002207487A JP4254147B2 JP 4254147 B2 JP4254147 B2 JP 4254147B2 JP 2002207487 A JP2002207487 A JP 2002207487A JP 2002207487 A JP2002207487 A JP 2002207487A JP 4254147 B2 JP4254147 B2 JP 4254147B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- qqp
- component
- dead zone
- orthogonal transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、MPEG(Moving Picture Experts Group)、H.26xなどの様に、離散コサイン変換又はカルーネン・レーベ変換等の直交変換と動き補償とによって圧縮された画像情報(ビットストリーム)を、衛星放送、ケーブルTV若しくはインターネット等のネットワークメディアを介して受信する際に、又は光ディスク、磁気ディスク若しくはフラッシュメモリ等の記憶メディア上で処理する際に用いられる画像情報符号化方法及びその装置、並びにプログラム及び記録媒体に関するものである。
【0002】
【従来の技術】
近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償とにより圧縮するMPEGなどの方式に準拠した装置が、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG2(ISO/IEC 13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4〜8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18〜22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。
【0004】
MPEG2は、主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量(ビットレート)、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。
【0005】
さらに、近年、テレビ会議用の画像符号化を当初の目的として、JVT(ITU-T Q6/16 VCEG)という標準の規格化が進んでいる。このJVTは、MPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このJVTをベースに、JVTではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われている。
【0006】
ここで、離散コサイン変換又はカルーネン・レーベ変換等の直交変換と動き補償とにより画像圧縮を実現する画像情報符号化装置の概略構成を図11に示す。図11に示すように、画像情報符号化装置100は、A/D変換部101と、画面並べ替えバッファ102と、加算器103と、直交変換部104と、量子化部105と、可逆符号化部106と、蓄積バッファ107と、逆量子化部108と、逆直交変換部109と、フレームメモリ110と、動き予測・補償部111と、レート制御部112とにより構成されている。
【0007】
図11において、A/D変換部101は、入力された画像信号をデジタル信号に変換する。そして、画面並べ替えバッファ102は、当該画像情報符号化装置100から出力される画像圧縮情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行う。ここで、画面並び替えバッファ102は、イントラ(画像内)符号化が行われる画像に関しては、フレーム全体の画像情報を直交変換部104に供給する。直交変換部104は、画像情報に対して離散コサイン変換又はカルーネン・レーベ変換等の直交変換を施し、得られた直交変換係数を量子化部105に供給する。量子化部105は、直交変換部104から供給された直交変換係数に対して量子化処理を施す。
【0008】
可逆符号化部106は、量子化された直交変換係数に対して可変長符号化、算術符号化等の可逆符号化を施し、符号化された直交変換係数を蓄積バッファ107に供給して蓄積させる。この符号化された直交変換係数は、画像圧縮情報として出力される。
【0009】
量子化部105の挙動は、レート制御部112によって制御される。また、量子化部105は、量子化後の直交変換係数を逆量子化部108に供給し、逆量子化部108は、その直交変換係数を逆量子化する。逆直交変換部109は、逆量子化された直交変換係数に対して逆直交変換処理を施して復号画像情報を生成し、その情報をフレームメモリ110に供給して蓄積させる。
【0010】
一方、画面並び替えバッファ102は、インター(画像間)符号化が行われる画像に関しては、画像情報を動き予測・補償部111に供給する。動き予測・補償部111は、同時に参照される画像情報をフレームメモリ110より取り出し、動き予測・補償処理を施して参照画像情報を生成する。動き予測・補償部111は、この参照画像情報を加算器103に供給し、加算器103は、参照画像情報を当該画像情報との差分信号に変換する。また、動き補償・予測部111は、同時に動きベクトル情報を可逆符号化部106に供給する。
【0011】
可逆符号化部106は、その動きベクトル情報に対して可変長符号化又は算術符号化等の可逆符号化処理を施し、画像圧縮情報のヘッダ部に挿入される情報を形成する。なお、その他の処理については、イントラ符号化を施される画像圧縮情報と同様であるため、説明を省略する。
【0012】
続いて、上述した画像情報符号化装置100に対応する画像情報復号装置の概略構成を図12に示す。図12に示すように、画像情報復号装置120は、蓄積バッファ121と、可逆復号部122と、逆量子化部123と、逆直交変換部124と、加算器125と、画面並べ替えバッファ126と、D/A変換部127と、動き予測・補償部128と、フレームメモリ129とにより構成されている。
【0013】
図12において、蓄積バッファ121は、入力された画像圧縮情報を一時的に格納した後、可逆復号部14に転送する。可逆復号部122は、定められた画像圧縮情報のフォーマットに基づき、画像圧縮情報に対して可変長復号又は算術復号等の処理を施し、量子化された直交変換係数を逆量子化部123に供給する。また、可逆復号部122は、当該フレームがインター符号化されたものである場合には、画像圧縮情報のヘッダ部に格納された動きベクトル情報についても復号し、その情報を動き予測・補償部128に供給する。
【0014】
逆量子化部123は、可逆復号部122から供給された量子化後の直交変換係数を逆量子化し、得られた直交変換係数を逆直交変換部124に供給する。逆直交変換部124は、定められた画像圧縮情報のフォーマットに基づき、直交変換係数に対して逆離散コサイン変換又は逆カルーネン・レーベ変換等の逆直交変換を施す。
【0015】
ここで、当該フレームがイントラ符号化されたものである場合には、逆直交変換処理が施された画像情報は、画面並べ替えバッファ126に格納され、D/A変換部127におけるD/A変換処理の後に出力される。
【0016】
一方、当該フレームがインター符号化されたものである場合には、動き予測・補償部128は、可逆復号処理が施された動きベクトル情報とフレームメモリ129に格納された画像情報とに基づいて参照画像を生成し、加算器125に供給する。加算器125は、この参照画像と逆直交変換部124の出力とを合成する。なお、その他の処理については、イントラ符号化されたフレームと同様であるため、説明を省略する。
【0017】
ところで、MPEG2ビデオ規格においては、量子化についての直接的な規定はされておらず、逆量子化についてのみ、その詳細な規定がなされている。したがって、実際に量子化を行う際には、量子化の規定に含まれるいくつかの媒介変数を変化させ、その自由度内の範囲内で量子化特性を変化させることにより、高画質化や視覚特性を反映した符号化を行うことになる。以下、MPEG2における逆量子化処理について説明する。
【0018】
MPEG2ビデオ規格において、イントラマクロブロックのDC係数量子化では、ピクチャ単位にその量子化精度を指定することが可能であり、その他の係数の量子化では、ピクチャ単位で指定可能な量子化行列の各要素にマクロブロック単位で指定可能な量子化スケールを乗じた値により、各係数の量子化精度を制御することができる。
【0019】
イントラマクロブロックのDC係数は、以下の式(1)に従って逆量子化される。
【0020】
【数6】
【0021】
ここで、式(1)において、F"[0][0]はDC係数値の量子化代表値を示し、QF[0][0]はDC係数値の量子化代表値レベル番号を示す。また、intra_dc_multは、DC係数量子化精度を指定するためにピクチャ単位で設定可能な媒介変数であるintra_dc_precisionに従い、図13に示す関係で決まる値である。
【0022】
ここで、MPEG1においては、intra_dc_precisionが0に対応する精度(8ビット精度相当)のみであったが、輝度レベルが緩やかに変化する画像を高画質で符号化するためには、この精度では不十分であった。そこで、MPEG2においては、図13に示すように、本媒介変数を用いて8〜11ビット精度相当のDC係数量子化精度を指定することが可能となっている。但し、4:2:2フォーマットでの使用が可能であり画質への要求レベルが高いHighプロファイル以外では、最高10ビット精度で十分とし、8〜10ビット精度に制限されている。
【0023】
また、イントラマクロブロックのその他の係数は、以下の式(2)に従って逆量子化される。
【0024】
【数7】
【0025】
ここで、式(2)において、F"[u][v]は第(u,v)係数値の量子化代表値を示し、QF[u][v]は第(u,v)係数値の量子化代表値レベル番号を示す。また、kの値は、以下の式(3)により定義される。
【0026】
【数8】
【0027】
また、上述した式(2)において、W[w][u][v]及びquantiser_scaleは、それぞれ量子化行列及び量子化スケールを示し、これらの媒介変数によって量子化特性が制御される。
【0028】
また、媒介変数kは、非イントラマクロブロックにおいて、その値がQF[u][v]の符号に応じて1、0、−1となる。例えば、QF[u][v]が−2、−1、0、1、2である場合のF"[u][v]は、それぞれ−5m、−3m、0、3m、5m(mは定数)となり、零近傍にデッドゾーンが設けられている。
【0029】
ところで、量子化行列は、ブロック内での離散コサイン変換係数値間での相対的な量子化精度を設定するために設けられた行列である。この量子化行列を用いることにより、例えば視覚的に劣化の目立ちにくい高域離散コサイン係数値を、視覚的に劣化の目立ちやすい低域離散コサイン係数と比較して粗く量子化するといった処理が可能となり、量子化特性を視覚特性に合致させることができる。なお、量子化行列は、ピクチャ単位で設定することが可能である。
【0030】
MPEG1及びMPEG2の4:2:0フォーマットの場合、イントラマクロブロック用と非イントラマクロブロック用の2種類の量子化行列を設定することができ、4:2:2フォーマット及び4:4:4フォーマットの場合には、さらに輝度信号と色差信号とで独立に合計4種類の量子化行列を設定することができる。なお、W[w][u][v]におけるw(0,1,2,3)は、4種類の行列のうちの1つを意味する。
【0031】
ここで、MPEG2において定められているイントラマクロブロック及び非イントラマクロブロックの量子化行列のデフォルト値をそれぞれ図14(A)、(B)に示す。上述したように、量子化行列は、ユーザがピクチャ単位で設定可能であるが、設定されていない場合にはこのデフォルト値が用いられる。図14に示すように、デフォルト値ではイントラマクロブロックに対してのみ重みを有している。
【0032】
なお、MPEG2 Test Model 5(ISO/IEC JTC/SC29/WG11/N0400)においては、非イントラマクロブロックに対して図15に示すような量子化行列が定義されている。これは、図14(B)に示したデフォルト値とは異なり、重みを有した特性となっている。
【0033】
量子化スケール(quantiser_scale)は、量子化特性のスケーリングを行うことにより発生符号量を制御するための媒介変数であり、ピクチャ単位で設定される媒介変数q_scale_typeと、マクロブロック単位で設定される量子化スケールコードquantiser_scale_codeにより設定される。図16にこれらの関係を示す。
【0034】
ここで、q_scale_typeが0の場合には線形量子化となり、MPEG1と同様、quantiser_scale_code(1〜31)の2倍の値がquantiser_scale(2〜62)に設定される。
【0035】
また、q_scale_typeが1の場合には非線形量子化となり、quantiser_scale_code(1〜31)は、小さい量子化スケールコードではより細かく、大きな量子化スケールコードではより粗くスケーリングすることにより、線形量子化の場合に比べ、広い範囲のquantiser_scale(1〜112)に変換される。このモードは、MPEG2において新たに導入されたもので、特に高いレートで符号化する場合に、小さな量子化スケール領域でより細かな量子化スケール制御を行うことや、極めて複雑な画像を符号化する場合に、より粗い量子化スケールを用いることが可能となり、MPEG1と比較して、より安定した符号量制御を実現することができる。
【0036】
一方、JVTにおいては、量子化/逆量子化を行うための媒介変数QPには0〜51の52の異なる値が使われる。ここで、QPは、値が6増える毎に量子化スケールが2倍になるように設定されている。すなわち、QPが1増す毎に量子化スケールが約12%増加する。
【0037】
なお、色差成分に使用されるQPCは、輝度成分に使用されるQPYから、以下の表1に示す対照表に従って算出される。以下では、特に断りのない限り、QPYのことをQPと呼ぶことにする。
【0038】
【表1】
【0039】
ここで、JVTにおいては、4×4離散コサイン変換に基づく符号化が行われるが、輝度信号と色差信号とについて、実際には、以下の演算が行われる。すなわち、X=(x00,….x33)を画素値又は差分値とし、Yを直交変換係数とした場合に、以下の式(4)に示すような離散コサイン変換に相当する処理が実行される。
【0040】
【数9】
【0041】
次に量子化処理として、以下の式(5)に示すような処理が実行される。
【0042】
【数10】
【0043】
ここで、式(5)において、YQは量子化された直交変換係数を示し、Qは量子化ステップサイズに対応する量子化係数を示す。また、fはイントラマクロブロックでは215+QP/6/3、インターマクロブロックでは215+QP/6/6とし、量子化される直交変換係数Yと同じ正負の符号を持つとする。なお、Qは以下に示すように定義されている。
Q[QP%6][i][j]=quantMat[QP%6][0] for (i,j)={(0,0),(0,2),(2,0),(2,2)},
Q[QP%6][i][j]=quantMat[QP%6][1] for (i,j)={(1,1),(1,3),(3,1),(3,3)},
Q[QP%6][i][j]=quantMat[QP%6][2] otherwise.
quantMat[6][3]={{13107, 5243, 8224}, {11651, 4660, 7358}, {10486, 4143, 6554}, {9198, 3687, 5825}, {8322, 3290, 5243}, {7384, 2943, 4660}}
【0044】
また、量子化後の逆量子化処理として、以下の式(6)に示すような処理が実行される。
【0045】
【数11】
【0046】
ここで、式(6)において、Rは逆量子化係数を示し、以下に示すように定義されている。
R[QP%6][i][j]=dequantMat[QP%6][0] for (i,j)={(0,0),(0,2),(2,0),(2,2)},
R[QP%6][i][j]=dequantMat[QP%6][1] for (i,j)={(1,1),(1,3),(3,1),(3,3)},
R[QP%6][i][j]=dequantMat[QP%6][2] otherwise.
dequantMat[6][3]={{10, 16, 13}, {11, 18, 14}, {13, 20, 16}, {14, 23, 18}, {16, 25, 20}, {18, 29, 23}}
【0047】
次に逆離散コサイン変換処理として、以下の式(7)に示すような処理が実行され、正規化処理として、以下の式(8)に示すような処理が実行される。
【0048】
【数12】
【0049】
最後に、復号された予測残差値X"(i,j)は、以下の式(9)に示すように、動き補償予測値又は空間予測値P(i,j)と足し合わされ、0から255の範囲にクリッピングされて最終復号画素値が算出される。
【0050】
【数13】
【0051】
ところで、JVTでは、イントラ16×16モードにおいて、輝度信号のDC成分をさらに4×4単位のブロックに集め、アダマール変換を施して圧縮率を向上させている。輝度信号の4×4DC成分の直交変換及び量子化は、以下の手法に基づいて実行される。
【0052】
先ず、4×4変換によって算出された直交変換係数の16個の輝度信号DC成分が集められて4×4単位の入力マトリックスXDとされ、アダマール変換に相当する処理として、以下の式(10)に示すような処理が実行される。
【0053】
【数14】
【0054】
次に、量子化処理として、以下の式(11)に示すような処理が実行される。
【0055】
【数15】
【0056】
また、逆アダマール変換に相当する処理として、以下の式(12)に示すような処理が実行される。
【0057】
【数16】
【0058】
次に、QPが12以上である場合には、逆量子化処理として、以下の式(13)に示すような処理が実行され、QPが12未満である場合には、逆量子化処理として、以下の式(14)に示すような処理が実行される。
【0059】
【数17】
【0060】
また、JVTでは、色差信号のDC成分についても、さらに2×2画素のブロックに集め、アダマール変換を施して圧縮率を向上させている。色差信号の2×2DC成分の直交変換及び量子化は、以下の手法に基づいて実行される。
【0061】
先ず、4個の色差DC成分が集められて2×2画素の入力マトリックスXDとされ、アダマール変換に相当する処理として、以下の式(15)に示すような処理が実行される。
【0062】
【数18】
【0063】
次に、量子化処理として、以下の式(16)に示すような処理が実行される。
【0064】
【数19】
【0065】
また、逆アダマール変換に相当する処理として、以下の式(17)に示すような処理が実行される。
【0066】
【数20】
【0067】
次に、QPが6以上である場合には、逆量子化処理として、以下の式(18)に示すような処理が実行され、QPが6未満である場合には、逆量子化処理として、以下の式(19)に示すような処理が実行される。
【0068】
【数21】
【0069】
なお、直交変換及び量子化の一連の処理は、16ビット演算でオーバーフローが起こらないよう規格化されている。
【0070】
【発明が解決しようとする課題】
ところで、上述のJVTで規定されている量子化/逆量子化においては、MPEG2で規定されているような、量子化行列を用いた直交変換係数の重み付けや、量子化処理におけるデッドゾーンに関する機能が含まれていないため、視覚特性に基づいた効率的な量子化を行うことができない。
【0071】
本発明は、このような従来の実情に鑑みて提案されたものであり、視覚特性を考慮したデッドゾーンを設けて量子化することにより、低ビットレートでの高効率な圧縮を実現する画像情報符号化方法及びその装置、並びにそのような画像情報符号化処理をコンピュータに実行させるプログラム及びそのプログラムが記録されたコンピュータ読み取り可能な記録媒体を提供することを目的とする。
【0072】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係る画像情報符号化方法は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するものであって、上記直交変換の単位となるブロックは、4×4画素からなり、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)が算出され、上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力が0とされるものである。
また、本発明に係る画像情報符号化方法は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更が加えたデッドゾーンを設定するものであって、上記デッドゾーンは、上記量子化後の輝度信号のDC成分を集めて構成された4×4画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分Y D (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T D (i,j)=(2 16+QQP/6 −2・f)/Q ( i,j=0,1,2,3 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y D (i,j)と同じ正負の符号を持つ
のように閾値T D (i,j)が算出され、上記Y D (i,j)の絶対値が上記T D (i,j)の絶対値よりも小さい場合に、当該Y D (i,j)の量子化出力が0とされるものである。
また、本発明に係る画像情報符号化方法は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更が加えたデッドゾーンを設定するものであって、上記デッドゾーンは、上記量子化後の色差信号のDC成分を集めて構成された2×2画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分Y D (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T D (i,j)=(2 16+QQP/6 −2・f)/Q ( i,j=0,1 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y D (i,j)と同じ正負の符号を持つ
のように閾値T D (i,j)が算出され、上記Y D (i,j)の絶対値が上記T D (i,j)の絶対値よりも小さい場合に、当該Y D (i,j)の量子化出力が0とされるものである。
【0073】
このような画像情報符号化方法では、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、例えば高域直交変換係数ほど量子化の出力が0となる入力の範囲であるデッドゾーンが広くなるように、直交変換係数の成分毎にデッドゾーンに対して所定の変更が加えられる。
【0074】
また、上述した目的を達成するために、本発明に係る画像情報符号化装置は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するデッドゾーン設定手段を備え、上記直交変換の単位となるブロックは、4×4画素からなり、上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)を算出し、上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力を0とする。
また、本発明に係る画像情報符号化装置は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備え、上記デッドゾーンは、上記量子化後の輝度信号のDC成分を集めて構成された4×4画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分Y D (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T D (i,j)=(2 16+QQP/6 −2・f)/Q ( i,j=0,1,2,3 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y D (i,j)と同じ正負の符号を持つ
のように閾値T D (i,j)を算出し、上記Y D (i,j)の絶対値が上記T D (i,j)の絶対値よりも小さい場合に、当該Y D (i,j)の量子化出力を0とする。
また、本発明に係る画像情報符号化装置は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備え、上記デッドゾーンは、上記量子化後の色差信号のDC成分を集めて構成された2×2画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分Y D (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T D (i,j)=(2 16+QQP/6 −2・f)/Q ( i,j=0,1 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y D (i,j)と同じ正負の符号を持つ
のように閾値T D (i,j)を算出し、上記Y D (i,j)の絶対値が上記T D (i,j)の絶対値よりも小さい場合に、当該Y D (i,j)の量子化出力を0とする。
【0075】
このような画像情報符号化装置は、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、例えば高域直交変換係数ほど量子化の出力が0となる入力の範囲であるデッドゾーンが広くなるように、直交変換係数の成分毎にデッドゾーンに対して所定の変更を加える。
【0076】
また、本発明に係るプログラムは、上述した画像情報符号化処理をコンピュータに実行させるものであり、本発明に係る記録媒体は、そのようなプログラムが記録されたコンピュータ読み取り可能なものである。
【0077】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、視覚特性を考慮したデッドゾーンを設けて量子化することにより、低ビットレートでの高効率な圧縮を実現する画像情報符号化方法及びその装置に適用したものである。具体的には、本実施の形態における画像情報符号化方法及びその装置では、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、直交変換係数の成分毎にデッドゾーンが算出される。
【0078】
そこで、以下では、本実施の形態における画像情報符号化方法及びその方法の説明の前に、量子化ステップサイズに対する重み付けを実際に行って量子化及び逆量子化する画像情報符号化装置及び画像情報復号装置について説明する。
【0079】
先ず、本実施の形態の説明に供する画像情報符号化装置の概略構成を図1に示す。図1に示すように、画像情報符号化装置10は、A/D変換部11と、画面並べ替えバッファ12と、加算器13と、直交変換部14と、量子化部15と、重み付け部16と、可逆符号化部17と、蓄積バッファ18と、逆量子化部19と、重み付け部20と、逆直交変換部21と、フレームメモリ22と、動き予測・補償部23と、レート制御部24とにより構成されている。
【0080】
図1において、A/D変換部11は、入力された画像信号をデジタル信号に変換する。そして、画面並べ替えバッファ12は、当該画像情報符号化装置10から出力される画像圧縮情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行う。ここで、画面並び替えバッファ12は、イントラ(画像内)符号化が行われる画像に関しては、フレーム全体の画像情報を直交変換部14に供給する。直交変換部14は、画像情報に対して離散コサイン変換又はカルーネン・レーベ変換等の直交変換を施し、得られた直交変換係数を量子化部15に供給する。
【0081】
量子化部15は、直交変換部14から供給された直交変換係数に対して量子化処理を施す。その際、量子化部15の構成要素である重み付け部16は、後述するようにして、直交変換係数の成分毎に、量子化ステップサイズを指定するための媒介変数QPの重み付けを行う。
【0082】
可逆符号化部17は、量子化された直交変換係数に対して可変長符号化又は算術符号化等の可逆符号化を施し、符号化された直交変換係数を蓄積バッファ18に供給して蓄積させる。この符号化された直交変換係数は、画像圧縮情報として出力される。
【0083】
量子化部15の挙動は、レート制御部24によって制御される。また、量子化部15は、量子化後の直交変換係数を逆量子化部19に供給し、逆量子化部19は、その直交変換係数を逆量子化する。その際、逆量子化部19の構成要素である重み付け部20は、後述するようにして、量子化された直交変換係数の成分毎に、量子化ステップサイズを指定するための媒介変数QPの重み付けを行う。
【0084】
逆直交変換部21は、逆量子化された直交変換係数に対して逆直交変換処理を施して復号画像情報を生成し、その情報をフレームメモリ22に供給して蓄積させる。
【0085】
一方、画面並び替えバッファ12は、インター(画像間)符号化が行われる画像に関しては、画像情報を動き予測・補償部23に供給する。動き予測・補償部23は、同時に、参照される画像情報をフレームメモリ22より取り出し、動き予測・補償処理を施して参照画像情報を生成する。
【0086】
動き予測・補償部23は、この参照画像情報を加算器13に供給し、加算器13は、参照画像情報を当該画像情報との差分信号に変換する。また、動き補償・予測部23は、同時に動きベクトル情報を可逆符号化部17に供給する。
【0087】
可逆符号化部17は、その動きベクトル情報に対して可変長符号化又は算術符号化等の可逆符号化処理を施し、画像圧縮情報のヘッダ部に挿入される情報を形成する。なお、その他の処理については、イントラ符号化を施される画像圧縮情報と同様であるため、説明を省略する。
【0088】
次に、上述した画像情報符号化装置10から出力された画像圧縮情報を復号する画像情報復号装置の概略構成を図2に示す。図2に示すように、画像情報復号装置30は、蓄積バッファ31と、可逆復号部32と、逆量子化部33と、重み付け部34と、逆直交変換部35と、加算器36と、画面並べ替えバッファ37と、D/A変換部38と、動き予測・補償部39と、フレームメモリ40とにより構成されている。
【0089】
図2において、蓄積バッファ31は、入力された画像圧縮情報を一時的に格納した後、可逆復号部32に転送する。可逆復号部32は、定められた画像圧縮情報のフォーマットに基づき、画像圧縮情報に対して可変長復号又は算術復号等の処理を施し、量子化された直交変換係数を逆量子化部33に供給する。また、可逆復号部32は、当該フレームがインター符号化されたものである場合には、画像圧縮情報のヘッダ部に格納された動きベクトル情報についても復号し、その情報を動き予測・補償部39に供給する。
【0090】
逆量子化部33は、可逆復号部32から供給された量子化後の直交変換係数を逆量子化し、逆量子化後の直交変換係数を逆直交変換部35に供給する。その際、逆量子化部33の構成要素である重み付け部34は、後述するようにして、量子化された直交変換係数の成分毎に、量子化ステップサイズを指定するための媒介変数QPの重み付けを行う。逆直交変換部35は、定められた画像圧縮情報のフォーマットに基づき、直交変換係数に対して逆離散コサイン変換又は逆カルーネン・レーベ変換等の逆直交変換を施す。
【0091】
ここで、当該フレームがイントラ符号化されたものである場合には、逆直交変換部35は、逆直交変換処理後の画像情報を画面並べ替えバッファ37に供給する。画面並び替えバッファ37は、この画像情報を一時的に格納した後、D/A変換部38に供給する。D/A変換部38は、この画像情報に対してD/A変換処理を施して出力する。
【0092】
一方、当該フレームがインター符号化されたものである場合には、動き予測・補償部39は、可逆復号処理が施された動きベクトル情報とフレームメモリ40に格納された画像情報とに基づいて参照画像を生成する。加算器36は、この参照画像と逆直交変換部35の出力とを合成する。なお、その他の処理については、イントラ符号化されたフレームと同様であるため、説明を省略する。
【0093】
ところで、上述したように、画像情報符号化装置10及び画像情報復号装置30では、重み付け部16,20,34において、量子化ステップサイズを指定するための媒介変数QPの重み付け処理を行って、量子化及び逆量子化が行われている。そして、この重み付け処理によって、視覚的に劣化の目立ちにくい高域直交変換係数を、視覚的に劣化の目立ちやすい低域直交変換係数に比べて粗く量子化することが可能とされる。
【0094】
そこで、以下では、この重み付け処理について説明する。なお、重み付け部16,20,34の動作原理は同様であるため、以下では重み付け部16の動作原理についてのみ説明する。
【0095】
重み付け部16においては、イントラマクロブロックとインターマクロブロックのそれぞれに対して、デフォルトで、それぞれ図3(A)、(B)に示すようなWintra(i,j)及びWinter(i,j)(i,j=0,1,2,3)に関する情報が含まれている。
【0096】
また、輝度信号と色差信号のそれぞれに対して、デフォルトで、それぞれ図3(A),(B)に示すような、Wluma(i,j)及びWchroma(i,j)(i,j=0,1,2,3)に関する情報を含むようにすることもできる。
【0097】
以下では、Wintra(i,j)及びWinter(i,j)、或いはWluma(i,j)及びWchroma(i,j)に関する処理が同等であるため、特に断りのない限り、これらをW(i,j)と表記する。
【0098】
なお、Wintra(i,j)及びWinter(i,j)、或いはWluma(i,j)及びWchroma(i,j)は、図3に示したデフォルト値に限定されるものではなく、ユーザがピクチャ単位で設定することが可能である。その際、W(i,j)の値そのものを出力となる画像圧縮情報に埋め込むことも可能であるが、その差分値を生成し、又は可変長符号化、算術符号化等の可逆符号化方式を用いてその情報量を削減し、出力される画像圧縮情報に埋め込んでもよい。
【0099】
ここで、重み付け部16においては、画像圧縮情報中に格納される、マクロブロックごとの量子化のための媒介変数QPを元に、4×4離散コサイン変換係数のそれぞれの成分に対して、以下の式(20)に示すような変数QQP(i,j)が定義される。
【0100】
【数22】
【0101】
量子化/逆量子化処理に関しては、上述したJVTにおけるQ(QP%6,i,j)及びR(QP%6,i,j)に代え、各成分毎に、Q(QQP%6,i,j)及びR(QQP%6,i,j)を用いて、JVTと同様の処理を行う。
【0102】
なお、QPのダイナミックレンジは0〜51であるが、上述した式(20)においては、QQP(i,j)の値がこのダイナミックレンジから外れる可能性がある。そこで、QQP(i,j)の値が51を超えた場合にはQQP(i,j)=51とし、0を下回った場合にはQQP(i,j)=0とする。
【0103】
ここで、上述したように、画像情報符号化装置10及び画像情報復号装置30においては、デフォルトで使用される重み行列が、輝度信号及び色差信号の双方に対して、以下の式(21)、(22)のように定義されている。
【0104】
【数23】
【0105】
なお、実際に画像情報符号化装置10及び画像情報復号装置30で量子化/逆量子化に用いられる重み行列は必ずしもこの通りではなく、ピクチャ単位でユーザが設定することが可能である。
【0106】
この重み行列に関する情報を、画像圧縮情報中に埋め込むための構文の例を図4に示す。図4において、load_intra_quantiser_matrix、load_non_intra_quantiser_matrix、load_chroma_intra_quantiser_matrix、及びload_chroma_non_intra_quantiser_matrixは、それぞれ当該ピクチャで、輝度信号及び色差信号に対するイントラマクロブロック及びインターマクロブロックにおいて、デフォルトで定められた以外の重み行列が用いられるか否かを示す1ビットのフラグであり、その値が1を取るとき、当該ピクチャにおいてはデフォルト以外の重み行列が用いられる。
【0107】
例えばload_intra_quantiser_matrixの値が1であった場合、後続のintra_quantiser_matrix[16]において、それぞれの成分が4ビットで表された4×4の重み行列に関する情報が埋め込まれる。
【0108】
なお、上述のように、それぞれの成分が必ずしも4ビットである必要はなく、8ビット又は12ビット等で表されてもよい。
【0109】
また、差分を取り、又は可変長符号化若しくは算術符号化等の可逆符号化を施すことにより、intra_quantiser_matrix[16]に関する情報を圧縮してもよい。
【0110】
また、上述の説明では、入力としてそれぞれの画素値が8ビットで表される画像情報を対象にしているが、例えばそれぞれの画素値が10ビットで表される画像情報に対しても拡張可能である。
【0111】
以上説明したように、画像情報符号化装置10及び画像情報復号装置30によれば、量子化ステップサイズを指定するための媒介変数QPの重み付け処理を行って量子化処理及び逆量子化処理を行うことにより、視覚的に劣化の目立ちにくい高域直交変換係数を、視覚的に劣化の目立ちやすい低域直交変換係数に比べて粗く量子化することが可能とされる。
【0112】
ここで、上述の説明では、マクロブロックごとの量子化のための媒介変数QPに対して、4×4離散コサイン変換係数のそれぞれの成分について重み行列W(i,j)を加算し、得られた変数QQP(i,j)を用いて量子化処理及び逆量子化処理を行った。しかしながら、このように4×4直交変換係数の全ての成分について重み行列W(i,j)を定義する例に限定されるものではなく、視覚的に劣化の目立ちやすい低域直交変換係数についてのみ媒介変数QPに対してオフセット値を与え、量子化精度を向上させる処理を行うようにしても構わない。
【0113】
このような処理を行う画像情報符号化装置及びこの画像符号化装置から出力された画像圧縮情報を復号する画像情報復号装置の概略構成をそれぞれ図5、図6に示す。
【0114】
図5に示すように、画像情報符号化装置50の基本構成は、先に図1に示した画像情報符号化装置10と同様とするが、重み付け部16,20の代わりに、低域精度変更部51,52を備えており、低域直交変換係数の量子化精度を変更する点に特徴を有している。また、図6に示すように、画像情報復号装置60の基本構成は、先に図2に示した画像情報復号装置30と同様とするが、重み付け部34の代わりに、低域精度変更部61を備えており、低域直交変換係数の逆量子化精度を変更する点に特徴を有している。
【0115】
したがって、先に図1、2に示した画像情報符号化装置10及び画像情報復号装置30と同様の構成については同一符号を付して詳細な説明を省略し、以下では、低域精度変更部51,52,61における処理について説明する。なお、低域精度変更部51,52,61の動作原理は同様であるため、以下では低域精度変更部51の動作原理についてのみ説明する。
【0116】
低域精度変更部51においては、画像圧縮情報中に格納される、マクロブロックごとの量子化のための媒介変数QPを元に、4×4離散コサイン変換係数の指定された成分に対して、以下の式(23)に示すような変数QQP(i,j)が定義される。
【0117】
【数24】
【0118】
量子化/逆量子化処理に関しては、上述したJVTにおけるQ(QP%6,i,j)及びR(QP%6,i,j)に代え、指定された成分毎に、Q(QQP%6,i,j)及びR(QQP%6,i,j)を用いて、JVTと同様の処理を行う。
【0119】
なお、QPのダイナミックレンジは0〜51であるが、上述した式(23)においては、QQP(i,j)の値がこのダイナミックレンジから外れる可能性がある。そこで、QQP(i,j)の値が51を超えた場合にはQQP(i,j)=51とし、0を下回った場合にはQQP(i,j)=0とする。
【0120】
ここで、低域精度変更部51では、予測モード、量子化ステップサイズを変更する直交変換係数、及び量子化ステップサイズの各々の項目の組み合わせに準拠する構文を定義することができる。
【0121】
すなわち、例えば予測モードについては、16×16予測モード及び/又は4×4予測モード、或いはユーザが指定した上記予測モードの任意の組み合わせについての構文を定義することができる。
【0122】
また、量子化ステップサイズを変更する直交変換係数については、例えば図7左の斜線で示すようにDC係数のみを変更するモード1、図7中央の斜線で示すようにDC係数及び低域のAC係数2個を変更するモード2、図7右の斜線で示すようにDC係数及び低域のAC係数5個を変更するモード3、或いはユーザが指定した直交変換係数についての構文を定義することができる。
【0123】
また、量子化ステップサイズとしては、デフォルト値(例えば−6)や、ユーザが設定したオフセット値(offset_QP)についての構文を定義することができる。また、ユーザが指定した変数QQPの絶対値についての構文を定義するようにしても構わない。
【0124】
上述した予測モード、量子化ステップサイズを変更する直交変換係数、及び量子化ステップサイズについての情報を画像圧縮情報中に埋め込むための構文の例を図8に示す。なお、構文がこの例に限定されないのは勿論であり、上述した項目の任意の組み合わせに準拠する構文を定義することができる。
【0125】
図8において、load_16x16, load_4x4は、それぞれ当該ピクチャで、輝度信号及び色差信号に対するイントラマクロブロック及びインターマクロブロックにおいて、デフォルトで定められた以外の媒介変数QPが用いられるか否かを示す1ビットのフラグであり、その値が1を取るとき、当該ピクチャにおいてはデフォルト以外のQPが用いられる。
【0126】
例えばload_16x16の値が1であった場合、後続のoffset_QPにおいて、4ビットで表された媒介変数QPのオフセット値に関する情報が埋め込まれる。さらに、後続のcoef_numにおいて、2ビットで表された量子化ステップサイズを変更する直交変換係数に関する情報、例えば上述の図7におけるモード1乃至モード3の何れかに関する情報が埋め込まれる。
【0127】
なお、上述のように、それぞれの成分が必ずしも4ビットである必要はなく、8ビット又は12ビット等で表されてもよい。
【0128】
また、絶対値を取り、又は可変長符号化若しくは算術符号化等の可逆符号化を施すことにより、offset_QPに関する情報を圧縮してもよい。
【0129】
また、上述の説明では、入力としてそれぞれの画素値が8ビットで表される画像情報を対象にしているが、例えばそれぞれの画素値が10ビットで表される画像情報に対しても拡張可能である。
【0130】
以上説明したように、画像情報符号化装置50及び画像情報復号装置60によれば、低域直交変換係数についてのみ、量子化ステップサイズを指定するための媒介変数QPに対してオフセット値(offset_QP)を与えることにより、視覚的に劣化の目立ちやすい低域直交変換係数の量子化精度を上げ、復号画像の画質を向上させることが可能となる。
【0131】
ところで、上述の説明では、マクロブロックごとの量子化のための媒介変数QPに対して、4×4離散コサイン変換係数のそれぞれの成分、或いは指定された成分について重み付け処理を行うことで、視覚特性を考慮した量子化を実現しており、重み付け処理機能を有していることを前提としていた。
【0132】
しかしながら、JVTにおいて重み付け処理機能がない場合であっても、以下に説明するように、入力値の零近傍の直交変換係数について視覚特性を考慮したデッドゾーンを算出することによっても、上述と同様の効果を奏することができる。
【0133】
このようなデッドゾーン算出処理を行う本発明の実施の形態における画像情報符号化装置の概略構成を図9に示す。図9に示すように、画像情報符号化装置70の基本構成は、先に図1に示した画像情報符号化装置10と同様とするが、重み付け部16,20の代わりにデッドゾーン算出部71を備えており、視覚特性を考慮したデッドゾーンを算出する点に特徴を有している。
【0134】
したがって、先に図1に示した画像情報符号化装置10と同様の構成については同一符号を付して詳細な説明を省略し、以下では、このデッドゾーン算出部71におけるデッドゾーン算出処理についてのみ説明する。
【0135】
デッドゾーン算出部70においては、直交変換係数毎に以下の式(24)に従ってデッドゾーンの閾値T(i,j)を求める。
【0136】
【数25】
【0137】
ここで、式(24)において、fはイントラマクロブロックでは215+QQP/6/3、インターマクロブロックでは215+QQP/6/6とし、量子化される直交変換係数Yと同じ正負の符号を持つとする。また、QQPは、前述した重み付け処理で用いたWintra(i,j)及びWinter(i,j)(i,j=0,1,2,3)等を用いて、算出したものとする。
【0138】
このように算出されたデッドゾーンの閾値T(i,j)を用いて、入力値Y(i,j)の絶対値がT(i,j)の絶対値よりも小さい場合、量子化値YQ(i,j)を0とする。
【0139】
同様に、輝度のDC成分をさらに4×4単位のブロックに集めてアダマール変換を施した直交変換係数YD(i,j)については、以下の式(25)に従ってデッドゾーンの閾値TD(i,j)を算出する。また、色差のDC成分をさらに2×2単位のブロックに集めてアダマール変換を施した直交変換係数YD(i,j)については、以下の式(26)に従ってデッドゾーンの閾値TD(i,j)を算出する。
【0140】
【数26】
【0141】
そして、入力値YD(i,j)の絶対値がTD(i,j)の絶対値よりも小さい場合、量子化値YDQ(i,j)を0とする。
【0142】
入力値Y(i,j)と量子化値YQ(i,j)との対応グラフを図10に示す。図10に示すように、本実施の形態の対応グラフ(a)におけるデッドゾーンの閾値T(i,j)は、重み行列W(i,j)で重み付け処理を行った場合の対応グラフ(b)における量子化値がゼロとなる入力値の範囲において、同様に量子化値がゼロとなるように算出されている。
【0143】
以上説明したように、本実施の形態における画像情報符号化装置70によれば、視覚特性を考慮した重み付け処理のデッドゾーンと同等のデッドゾーンを算出することができ、視覚特性を考慮した量子化処理を行うことが可能となる。
【0144】
また、このような視覚特性を考慮したデッドゾーンを算出する手法では、従来通りのJVT復号器で復号処理を行えるため、処理量の増加を伴わないという利点がある。
【0145】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0146】
例えば、本発明による手法は、任意の変換方式に適用可能である。すなわち、演算精度や、整数変換の変換マトリクスに依存せず、同様に適用可能である。
【0147】
また、本発明は、変換ブロックのサイズに依存せず、任意のサイズの変換に対して同様に適用可能である。また、4×4,4×8、8×4、8×8,16×16の任意のブロックサイズで適応的に周波数変換を行う適応可変ブロックサイズ変換方式にも同様に適用可能である。
【0148】
また、本発明、任意の処理をCPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
【0149】
【発明の効果】
以上詳細に説明したように本発明に係る画像情報符号化方法は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するものである。
【0150】
このような画像情報符号化方法では、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、例えば高域直交変換係数ほど量子化の出力が0となる入力の範囲であるデッドゾーンが広くなるように、直交変換係数の成分毎にデッドゾーンに対して所定の変更が加えられる。
【0151】
これにより、視覚特性を考慮した重み付け処理のデッドゾーンと同等のデッドゾーンを算出することができ、視覚特性を考慮した量子化処理を行うことが可能となる。
【0152】
また、本発明に係る画像情報符号化装置は、力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備える。
【0153】
このような画像情報符号化装置は、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、例えば高域直交変換係数ほど量子化の出力が0となる入力の範囲であるデッドゾーンが広くなるように、直交変換係数の成分毎にデッドゾーンに対して所定の変更を加える。
【0154】
これにより、視覚特性を考慮した重み付け処理のデッドゾーンと同等のデッドゾーンを算出することができ、視覚特性を考慮した量子化処理を行うことが可能となる。
【0155】
また、本発明に係るプログラムは、上述した画像情報符号化処理をコンピュータに実行させるものであり、本発明に係る記録媒体は、そのようなプログラムプログラムが記録されたコンピュータ読み取り可能なものである。
【0156】
このようなプログラム及び記録媒体によれば、上述した画像情報符号化処理をソフトウェアにより実現することができる。
【図面の簡単な説明】
【図1】本実施の形態の説明に供する画像情報符号化装置の概略構成を説明する図である。
【図2】本実施の形態の説明に供する画像情報復号装置の概略構成を説明する図である。
【図3】同画像情報符号化装置の重み付け部に格納されている重み行列のデフォルト値を説明する図であり、同図(A)は、イントラマクロブロック用又は輝度信号用の重み行列を示し、同図(B)は、非イントラマクロブロック用又は色差信号用の重み行列を示す。
【図4】重み行列に関する情報を画像圧縮情報中に埋め込むための構文の例を説明する図である。
【図5】本実施の形態の説明に供する画像情報符号化装置の概略構成の他の例を説明する図である。
【図6】本実施の形態の説明に供する画像情報復号装置の概略構成の他の例を説明する図である。
【図7】量子化ステップサイズを変更する直交変換係数の例を示す図である。
【図8】予測モード、量子化ステップサイズを変更する直交変換係数、及び量子化ステップサイズについての情報を画像圧縮情報中に埋め込むための構文の例を説明する図である。
【図9】本実施の形態における画像情報符号化装置の概略構成を説明する図である。
【図10】同画像情報符号化装置の量子化部における入力値と量子化値との対応グラフを示す図である。
【図11】直交変換と動き補償とにより画像圧縮を実現する従来の画像情報符号化装置の概略構成を説明する図である。
【図12】直交変換と動き補償により圧縮された画像圧縮情報を復号する従来の画像情報復号装置の概略構成を説明する図である。
【図13】MPEG2において定められた、intra_dc_precisionと、ビット精度、逆量子化係数及びDC予測リセット値との関係を説明する図である。
【図14】MPEG2で定められているイントラマクロブロックとインターマクロブロックとに対する量子化行列のデフォルト値を説明する図である。
【図15】 MPEG2 Test Model 5において定められている非イントラマクロブロックに対する量子化行列を説明する図である。
【図16】MPEG2における、量子化スケール(quantiser_scale)、ピクチャ単位で設定される媒介変数q_scale_type、及びマクロブロック単位で設定される量子化スケールコードquantiser_scale_codeの関係を説明する図である。
【符号の説明】
10,50,70 画像情報符号化部、11 A/D変換部、12 画面並べ替えバッファ、13 加算器、14 直交変換部、15 量子化部、16 重み付け部、17 可逆符号化部、18 蓄積バッファ、19 逆量子化部、20 重み付け部、21 逆直交変換部、22 フレームメモリ、23 動き予測・補償部、24 レート制御部、30,60 画像情報復号装置、31 蓄積バッファ、32 可逆復号部、33 逆量子化部、34 重み付け部、35 逆直交変換部、36 加算器、37 画面並べ替えバッファ、38 D/A変換部、39動き予測・補償部、40 フレームメモリ、51,52,61 低域精度変更部、71 デッドゾーン算出部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to MPEG (Moving Picture Experts Group), H.264. Receives image information (bitstream) compressed by orthogonal transformation such as discrete cosine transformation or Karhunen-Labe transformation and motion compensation, such as 26x, via network media such as satellite broadcasting, cable TV, or the Internet. Image information encoding method and apparatus used when processing on a storage medium such as an optical disk, a magnetic disk or a flash memory, andProgram andThe present invention relates to a recording medium.
[0002]
[Prior art]
In recent years, MPEG treats image information as digital and compresses it by orthogonal transform such as discrete cosine transform and motion compensation using the unique redundancy of image information for the purpose of efficient transmission and storage of information. And the like are being used for both information distribution at broadcast stations and information reception in general households.
[0003]
In particular, MPEG2 (ISO / IEC 13818-2) is defined as a general-purpose image coding system, and is a standard that covers both interlaced and progressively scanned images, standard resolution images, and high-definition images. And widely used in a wide range of applications for consumer use. By using the MPEG2 compression method, for example, a standard resolution interlaced scanning image having 720 × 480 pixels is 4 to 8 Mbps, and a high resolution interlaced scanning image having 1920 × 1088 pixels is 18 to 22 Mbps. (Bit rate) can be assigned to achieve a high compression rate and good image quality.
[0004]
MPEG2 was mainly intended for high-quality encoding suitable for broadcasting, but did not support encoding methods with a lower code amount (bit rate) than MPEG1, that is, a higher compression rate. With the widespread use of mobile terminals, the need for such an encoding system is expected to increase in the future, and the MPEG4 encoding system has been standardized in response to this need. Regarding the image coding system, the standard was approved as an international standard as ISO / IEC 14496-2 in December 1998.
[0005]
Furthermore, in recent years, standardization of a standard called JVT (ITU-T Q6 / 16 VCEG) has been progressing with the initial purpose of image coding for video conferencing. This JVT is known to achieve higher encoding efficiency than the conventional encoding schemes such as MPEG2 and MPEG4, although a large amount of calculation is required for encoding and decoding. Also, as part of the MPEG4 activity, standardization that realizes higher coding efficiency by incorporating functions that are not supported by JVT based on this JVT is now being performed as Joint Model of Enhanced-Compression Video Coding.
[0006]
Here, FIG. 11 shows a schematic configuration of an image information encoding apparatus that realizes image compression by orthogonal transformation such as discrete cosine transformation or Karhunen-Labe transformation and motion compensation. As illustrated in FIG. 11, the image
[0007]
In FIG. 11, an A /
[0008]
The
[0009]
The behavior of the
[0010]
On the other hand, the
[0011]
The
[0012]
Next, a schematic configuration of an image information decoding apparatus corresponding to the above-described image
[0013]
In FIG. 12, the
[0014]
The
[0015]
Here, if the frame is intra-coded, the image information subjected to the inverse orthogonal transform processing is stored in the
[0016]
On the other hand, when the frame is inter-coded, the motion prediction /
[0017]
By the way, in the MPEG2 video standard, the direct definition for quantization is not made, but the detailed definition is made only for inverse quantization. Therefore, when actual quantization is performed, several parameters included in the quantization rule are changed, and the quantization characteristics are changed within the range of the degree of freedom, thereby improving the image quality and visualizing. Encoding that reflects the characteristics is performed. Hereinafter, the inverse quantization process in MPEG2 will be described.
[0018]
In the MPEG2 video standard, in the DC coefficient quantization of an intra macroblock, it is possible to specify the quantization accuracy in units of pictures, and in the quantization of other coefficients, each quantization matrix that can be specified in units of pictures. The quantization accuracy of each coefficient can be controlled by a value obtained by multiplying an element by a quantization scale that can be specified in units of macroblocks.
[0019]
The DC coefficient of the intra macroblock is inversely quantized according to the following equation (1).
[0020]
[Formula 6]
[0021]
Here, in Expression (1), F ″ [0] [0] indicates the quantized representative value of the DC coefficient value, and QF [0] [0] indicates the quantized representative value level number of the DC coefficient value. Also, intra_dc_mult is a value determined by the relationship shown in FIG. 13 according to intra_dc_precision, which is a parameter that can be set in units of pictures in order to specify DC coefficient quantization accuracy.
[0022]
In MPEG1, the intra_dc_precision is only an accuracy corresponding to 0 (equivalent to 8-bit accuracy). However, this accuracy is insufficient to encode an image whose luminance level changes slowly with high image quality. Met. Therefore, in MPEG2, as shown in FIG. 13, it is possible to specify DC coefficient quantization accuracy equivalent to 8 to 11 bit accuracy using this parameter. However, except for the High profile that can be used in the 4: 2: 2 format and has a high level of required image quality, the maximum 10-bit accuracy is sufficient and is limited to the 8-10-bit accuracy.
[0023]
Further, the other coefficients of the intra macroblock are inversely quantized according to the following equation (2).
[0024]
[Expression 7]
[0025]
Here, in Expression (2), F ″ [u] [v] represents the quantized representative value of the (u, v) coefficient value, and QF [u] [v] represents the (u, v) coefficient value. The k representative value level number is defined by the following equation (3).
[0026]
[Equation 8]
[0027]
In the above-described equation (2), W [w] [u] [v] and quantizer_scale indicate a quantization matrix and a quantization scale, respectively, and the quantization characteristics are controlled by these parameters.
[0028]
The parameter k is 1, 0, −1 in the non-intra macroblock depending on the sign of QF [u] [v]. For example, when QF [u] [v] is −2, −1, 0, 1, 2, F ″ [u] [v] is −5 m, −3 m, 0, 3 m, 5 m (m is Constant), and a dead zone is provided near zero.
[0029]
Incidentally, the quantization matrix is a matrix provided for setting the relative quantization accuracy between discrete cosine transform coefficient values in the block. By using this quantization matrix, for example, it is possible to coarsely quantize high-frequency discrete cosine coefficient values that are visually inconspicuous compared with low-frequency discrete cosine coefficients that are visually inconspicuous. The quantization characteristic can be matched with the visual characteristic. Note that the quantization matrix can be set in units of pictures.
[0030]
In the case of the MPEG2 and MPEG2 4: 2: 0 formats, two types of quantization matrices for intra macroblocks and non-intra macroblocks can be set, 4: 2: 2 format and 4: 4: 4 format. In this case, a total of four types of quantization matrices can be set independently for the luminance signal and the color difference signal. Note that w (0, 1, 2, 3) in W [w] [u] [v] means one of four types of matrices.
[0031]
Here, the default values of the quantization matrix of the intra macroblock and the non-intra macroblock defined in MPEG2 are shown in FIGS. 14A and 14B, respectively. As described above, the quantization matrix can be set by the user in units of pictures, but this default value is used when it is not set. As shown in FIG. 14, the default value has a weight only for the intra macroblock.
[0032]
In MPEG2 Test Model 5 (ISO / IEC JTC / SC29 / WG11 / N0400), a quantization matrix as shown in FIG. 15 is defined for a non-intra macroblock. Unlike the default value shown in FIG. 14B, this is a characteristic having a weight.
[0033]
The quantization scale (quantiser_scale) is a parameter for controlling the amount of generated code by scaling the quantization characteristics. The parameter q_scale_type is set for each picture, and the quantization is set for each macroblock. Set by scale code quantiser_scale_code. FIG. 16 shows these relationships.
[0034]
Here, when q_scale_type is 0, linear quantization is performed, and a value twice the quantizer_scale_code (1 to 31) is set to quantizer_scale (2 to 62) as in MPEG1.
[0035]
In addition, when q_scale_type is 1, nonlinear quantization is performed, and quantiser_scale_code (1 to 31) is finer for small quantization scale codes and coarser for large quantization scale codes. In comparison, it is converted into a wide range of quantizer_scale (1-112). This mode is newly introduced in MPEG2, and in particular, when encoding at a high rate, finer quantization scale control is performed in a small quantization scale region, or extremely complicated images are encoded. In this case, a coarser quantization scale can be used, and more stable code amount control can be realized as compared with MPEG1.
[0036]
On the other hand, in JVT, 52 different values of 0 to 51 are used for the parameter QP for performing quantization / inverse quantization. Here, QP is set so that the quantization scale is doubled every time the value increases by six. That is, every time QP increases by 1, the quantization scale increases by about 12%.
[0037]
QP used for color difference componentsCIs the QP used for the luminance componentYIs calculated according to the control table shown in Table 1 below. In the following, unless otherwise noted, QPYWill be referred to as QP.
[0038]
[Table 1]
[0039]
Here, in JVT, encoding based on 4 × 4 discrete cosine transform is performed, but the following calculation is actually performed on the luminance signal and the color difference signal. That is, X = (x00, ... x33) Is a pixel value or difference value, and Y is an orthogonal transform coefficient, a process corresponding to discrete cosine transform as shown in the following equation (4) is executed.
[0040]
[Equation 9]
[0041]
Next, as a quantization process, a process as shown in the following equation (5) is executed.
[0042]
[Expression 10]
[0043]
Here, in equation (5), YQIndicates a quantized orthogonal transform coefficient, and Q indicates a quantization coefficient corresponding to the quantization step size. F is 2 for an intra macroblock.15 + QP / 6/ 3, 2 for inter macroblock15 + QP / 6/ 6 and have the same positive / negative sign as the orthogonal transform coefficient Y to be quantized. Q is defined as shown below.
Q [QP% 6] [i] [j] = quantMat [QP% 6] [0] for (i, j) = {(0,0), (0,2), (2,0), (2 , 2)},
Q [QP% 6] [i] [j] = quantMat [QP% 6] [1] for (i, j) = {(1,1), (1,3), (3,1), (3 , 3)},
Q [QP% 6] [i] [j] = quantMat [QP% 6] [2] otherwise.
quantMat [6] [3] = {{13107, 5243, 8224}, {11651, 4660, 7358}, {10486, 4143, 6554}, {9198, 3687, 5825}, {8322, 3290, 5243}, { 7384, 2943, 4660}}
[0044]
Further, as an inverse quantization process after quantization, a process as shown in the following formula (6) is executed.
[0045]
## EQU11 ##
[0046]
Here, in Expression (6), R represents an inverse quantization coefficient and is defined as follows.
R [QP% 6] [i] [j] = dequantMat [QP% 6] [0] for (i, j) = {(0,0), (0,2), (2,0), (2 , 2)},
R [QP% 6] [i] [j] = dequantMat [QP% 6] [1] for (i, j) = {(1,1), (1,3), (3,1), (3 , 3)},
R [QP% 6] [i] [j] = dequantMat [QP% 6] [2] otherwise.
dequantMat [6] [3] = {{10, 16, 13}, {11, 18, 14}, {13, 20, 16}, {14, 23, 18}, {16, 25, 20}, { 18, 29, 23}}
[0047]
Next, processing as shown in the following equation (7) is executed as the inverse discrete cosine transform processing, and processing as shown in the following equation (8) is executed as the normalization processing.
[0048]
[Expression 12]
[0049]
Finally, the decoded prediction residual value X ″ (i, j) is added to the motion compensated prediction value or the spatial prediction value P (i, j) as shown in the following equation (9), The final decoded pixel value is calculated by clipping in the range of 255.
[0050]
[Formula 13]
[0051]
By the way, in the JVT, in the intra 16 × 16 mode, the DC component of the luminance signal is further collected into 4 × 4 unit blocks and subjected to Hadamard transform to improve the compression rate. Orthogonal transformation and quantization of the 4 × 4 DC component of the luminance signal are performed based on the following method.
[0052]
First, 16 luminance signal DC components of orthogonal transform coefficients calculated by 4 × 4 transform are collected to obtain an input matrix X of 4 × 4 units.DAs a process corresponding to the Hadamard transform, a process as shown in the following formula (10) is executed.
[0053]
[Expression 14]
[0054]
Next, as a quantization process, a process as shown in the following formula (11) is executed.
[0055]
[Expression 15]
[0056]
Further, as a process corresponding to the inverse Hadamard transform, a process as shown in the following formula (12) is executed.
[0057]
[Expression 16]
[0058]
Next, when QP is 12 or more, processing as shown in the following equation (13) is performed as inverse quantization processing. When QP is less than 12, as inverse quantization processing, Processing as shown in the following formula (14) is executed.
[0059]
[Expression 17]
[0060]
In JVT, the DC component of the color difference signal is further collected in a 2 × 2 pixel block and subjected to Hadamard transform to improve the compression rate. The orthogonal transformation and quantization of the 2 × 2 DC component of the color difference signal are performed based on the following method.
[0061]
First, four color difference DC components are collected to obtain an input matrix X of 2 × 2 pixels.DAs a process corresponding to the Hadamard transform, a process as shown in the following equation (15) is executed.
[0062]
[Formula 18]
[0063]
Next, as a quantization process, a process as shown in the following equation (16) is executed.
[0064]
[Equation 19]
[0065]
Further, as a process corresponding to the inverse Hadamard transform, a process as shown in the following equation (17) is executed.
[0066]
[Expression 20]
[0067]
Next, when QP is 6 or more, processing as shown in the following equation (18) is executed as inverse quantization processing. When QP is less than 6, as inverse quantization processing, Processing as shown in the following equation (19) is executed.
[0068]
[Expression 21]
[0069]
Note that a series of processes of orthogonal transform and quantization is standardized so that overflow does not occur in 16-bit operations.
[0070]
[Problems to be solved by the invention]
By the way, in the quantization / inverse quantization defined by the above-mentioned JVT, functions related to the weighting of orthogonal transform coefficients using a quantization matrix and the dead zone in the quantization process, as defined in MPEG2. Since it is not included, efficient quantization based on visual characteristics cannot be performed.
[0071]
The present invention has been proposed in view of such conventional situations, and image information that realizes high-efficiency compression at a low bit rate by providing a dead zone in consideration of visual characteristics and performing quantization. Encoding method and apparatus, and computer to execute such image information encoding processProgram and itsAn object of the present invention is to provide a computer-readable recording medium on which a program is recorded.
[0072]
[Means for Solving the Problems]
In order to achieve the above-described object, an image information encoding method according to the present invention is an image information encoding method in which an input image signal is blocked and subjected to orthogonal transformation in units of the block to perform quantization. For the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the blockIn consideration of the virtual weighting process for the quantization step size at the time of the quantization, a change was made for each component of the orthogonal transform coefficient.Set dead zoneThe block that is a unit of the orthogonal transformation is composed of 4 × 4 pixels, and the orthogonal transformation coefficient component Y (i) is used for the parameter QP for designating the quantization step size Q. , J) using a variable QQP (i, j) obtained by adding the weighting array W (i, j) for each
T (i, j) = (2 15 + QQP / 6 -F) / Q ( i, j = 0,1,2,3 )
Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and has the same positive / negative sign as Y (i, j) above
When the threshold value T (i, j) is calculated and the absolute value of the Y (i, j) is smaller than the absolute value of the T (i, j), the quantum of the Y (i, j) Output is set to 0Is.
The image information encoding method according to the present invention is an image information encoding method in which an input image signal is blocked and subjected to orthogonal transform in units of blocks to perform quantization. A dead zone in which a predetermined change is added to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient is set, and the dead zone is a DC of the luminance signal after the quantization Considering a virtual weighting process for the quantization step size when quantizing each DC component of a block of 4 × 4 pixels configured by collecting components, a change is made for each DC component, For the parameter QP for specifying the quantization step size Q, the DC component Y D Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
T D (I, j) = (2 16 + QQP / 6 -2 · f) / Q ( i, j = 0,1,2,3 )
Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and above Y D Has the same sign as (i, j)
Threshold T D (I, j) is calculated and Y D The absolute value of (i, j) is T D Y is smaller than the absolute value of (i, j) D The quantized output of (i, j) is 0.
The image information encoding method according to the present invention is an image information encoding method in which an input image signal is blocked and subjected to orthogonal transform in units of blocks to perform quantization. A dead zone in which a predetermined change is added to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient is set, and the dead zone is a DC of the color difference signal after the quantization Considering a virtual weighting process for the quantization step size when quantizing each DC component of a block of 2 × 2 pixels configured by collecting components, a change is made for each DC component, For the parameter QP for specifying the quantization step size Q, the DC component Y D Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
T D (I, j) = (2 16 + QQP / 6 -2 · f) / Q ( i, j = 0,1 )
Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and above Y D Has the same sign as (i, j)
Threshold T D (I, j) is calculated and Y D The absolute value of (i, j) is T D Y is smaller than the absolute value of (i, j) D The quantized output of (i, j) is 0.
[0073]
In such an image information encoding method, in consideration of a virtual weighting process for the quantization step size at the time of quantization, for example, a higher-frequency orthogonal transform coefficient is an input range in which the quantization output is 0. A predetermined change is applied to the dead zone for each component of the orthogonal transform coefficient so that the dead zone becomes wider.
[0074]
In order to achieve the above-described object, an image information encoding device according to the present invention is an image information encoding device that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization. During quantization, the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the blockIn consideration of the virtual weighting process for the quantization step size at the time of the quantization, a change was made for each component of the orthogonal transform coefficient.Provided with dead zone setting means to set dead zoneThe block which is a unit of the orthogonal transform is composed of 4 × 4 pixels, and the dead zone setting means is configured to generate a component Y of the orthogonal transform coefficient with respect to the parameter QP for designating the quantization step size Q. Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
T (i, j) = (2 15 + QQP / 6 -F) / Q ( i, j = 0,1,2,3 )
Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and has the same positive / negative sign as Y (i, j) above
When the threshold value T (i, j) is calculated and the absolute value of the Y (i, j) is smaller than the absolute value of the T (i, j), the quantum of the Y (i, j) Set the output to 0.
The image information encoding apparatus according to the present invention is an image information encoding apparatus that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization. A dead zone setting means for setting a dead zone in which a predetermined change is made to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient, wherein the dead zone is a luminance signal after the quantization Considering a virtual weighting process for the quantization step size when quantizing each DC component of a block of 4 × 4 pixels configured by collecting the DC components, changes are made for each DC component. The dead zone setting means outputs the DC component Y to the parameter QP for designating the quantization step size Q. D Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
T D (I, j) = (2 16 + QQP / 6 -2 · f) / Q ( i, j = 0,1,2,3 )
Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and above Y D Has the same sign as (i, j)
Threshold T D (I, j) is calculated and Y D The absolute value of (i, j) is T D Y is smaller than the absolute value of (i, j) D The quantized output of (i, j) is set to 0.
The image information encoding apparatus according to the present invention is an image information encoding apparatus that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization. A dead zone setting unit that sets a dead zone obtained by adding a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient, and the dead zone includes the color difference signal after the quantization Considering a virtual weighting process for the quantization step size when quantizing each DC component of a block of 2 × 2 pixels configured by collecting the DC components, changes are made for each DC component. The dead zone setting means outputs the DC component Y to the parameter QP for designating the quantization step size Q. D Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
T D (I, j) = (2 16 + QQP / 6 -2 · f) / Q ( i, j = 0,1 )
Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and above Y D Has the same sign as (i, j)
Threshold T D (I, j) is calculated and Y D The absolute value of (i, j) is T D Y is smaller than the absolute value of (i, j) D The quantized output of (i, j) is set to 0.
[0075]
Such an image information encoding device has a range of inputs in which the quantization output becomes 0 as the high-frequency orthogonal transform coefficient in consideration of virtual weighting processing for the quantization step size at the time of quantization, for example. A predetermined change is added to the dead zone for each component of the orthogonal transform coefficient so that the dead zone becomes wider.
[0076]
Also,A program according to the present invention causes a computer to execute the above-described image information encoding process,The recording medium according to the present invention islike thatA computer-readable program on which the program is recorded.
[0077]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings. In this embodiment, the present invention is applied to an image information encoding method and apparatus for realizing high-efficiency compression at a low bit rate by providing a dead zone in consideration of visual characteristics and performing quantization. It is. Specifically, in the image information coding method and apparatus according to the present embodiment, a dead zone is generated for each orthogonal transform coefficient component in consideration of a virtual weighting process for the quantization step size at the time of quantization. Calculated.
[0078]
Therefore, in the following, before describing the image information encoding method and the method according to the present embodiment, an image information encoding apparatus and image information for performing quantization and inverse quantization by actually weighting the quantization step size. A decoding apparatus will be described.
[0079]
First, FIG. 1 shows a schematic configuration of an image information encoding apparatus used for explaining the present embodiment. As illustrated in FIG. 1, the image
[0080]
In FIG. 1, an A /
[0081]
The
[0082]
The
[0083]
The behavior of the
[0084]
The inverse
[0085]
On the other hand, the
[0086]
The motion prediction /
[0087]
The
[0088]
Next, FIG. 2 shows a schematic configuration of an image information decoding apparatus that decodes the compressed image information output from the image
[0089]
In FIG. 2, the
[0090]
The
[0091]
Here, if the frame is intra-coded, the inverse
[0092]
On the other hand, when the frame is inter-coded, the motion prediction /
[0093]
By the way, as described above, in the image
[0094]
Therefore, the weighting process will be described below. Since the operation principle of the
[0095]
In the
[0096]
In addition, for each of the luminance signal and the color difference signal, W, as shown in FIGS. 3A and 3B, respectively, by default.luma(I, j) and WchromaInformation on (i, j) (i, j = 0,1,2,3) can also be included.
[0097]
In the following, Wintra(I, j) and Winter(I, j) or Wluma(I, j) and WchromaSince the processes related to (i, j) are equivalent, these are expressed as W (i, j) unless otherwise specified.
[0098]
Wintra(I, j) and Winter(I, j) or Wluma(I, j) and Wchroma(I, j) is not limited to the default value shown in FIG. 3, but can be set by the user in units of pictures. At that time, it is possible to embed the value of W (i, j) itself in the compressed image information to be output. However, a difference value is generated, or a lossless encoding method such as variable-length encoding or arithmetic encoding. May be used to reduce the amount of information and be embedded in the output compressed image information.
[0099]
Here, the
[0100]
[Expression 22]
[0101]
Regarding the quantization / inverse quantization process, instead of Q (
[0102]
Note that the dynamic range of QP is 0 to 51. However, in the above equation (20), the value of QQP (i, j) may be out of this dynamic range. Therefore, QQP (i, j) = 51 when the value of QQP (i, j) exceeds 51, and QQP (i, j) = 0 when the value is less than 0.
[0103]
Here, as described above, in the image
[0104]
[Expression 23]
[0105]
Note that the weight matrix actually used for quantization / inverse quantization in the image
[0106]
FIG. 4 shows an example of syntax for embedding information on the weight matrix in the image compression information. In FIG. 4, load_intra_quantiser_matrix, load_non_intra_quantiser_matrix, load_chroma_intra_quantiser_matrix, and load_chroma_non_intra_quantiser_matrix indicate whether or not a weight matrix other than that determined by default is used in the intra macroblock and intermacroblock for the luminance signal and the color difference signal, respectively. When the value is 1, a weight matrix other than the default is used in the picture.
[0107]
For example, when the value of load_intra_quantiser_matrix is 1, information regarding a 4 × 4 weight matrix in which each component is represented by 4 bits is embedded in subsequent intra_quantiser_matrix [16].
[0108]
As described above, each component is not necessarily 4 bits, and may be represented by 8 bits or 12 bits.
[0109]
Further, the information about intra_quantiser_matrix [16] may be compressed by taking the difference or performing lossless encoding such as variable length encoding or arithmetic encoding.
[0110]
In the above description, image information in which each pixel value is represented by 8 bits is targeted as input. However, the present invention can be extended to image information in which each pixel value is represented by 10 bits. is there.
[0111]
As described above, according to the image
[0112]
Here, in the above description, the weighting matrix W (i, j) is added to each component of the 4 × 4 discrete cosine transform coefficient to the parameter QP for quantization for each macroblock. Quantization processing and inverse quantization processing were performed using the variable QQP (i, j). However, the present invention is not limited to the example in which the weight matrix W (i, j) is defined for all the components of the 4 × 4 orthogonal transform coefficients as described above, but only for the low-frequency orthogonal transform coefficients that are visually noticeable. An offset value may be given to the parameter QP to perform processing for improving quantization accuracy.
[0113]
Schematic configurations of an image information encoding apparatus that performs such processing and an image information decoding apparatus that decodes compressed image information output from the image encoding apparatus are shown in FIGS. 5 and 6, respectively.
[0114]
As shown in FIG. 5, the basic configuration of the image
[0115]
Therefore, the same components as those of the image
[0116]
In the low frequency
[0117]
[Expression 24]
[0118]
As for the quantization / inverse quantization process, instead of Q (
[0119]
Note that the dynamic range of QP is 0 to 51, but in the above-described equation (23), the value of QQP (i, j) may deviate from this dynamic range. Therefore, QQP (i, j) = 51 when the value of QQP (i, j) exceeds 51, and QQP (i, j) = 0 when the value is less than 0.
[0120]
Here, the low frequency
[0121]
That is, for example, for the prediction mode, the syntax for the 16 × 16 prediction mode and / or the 4 × 4 prediction mode, or any combination of the prediction modes specified by the user can be defined.
[0122]
As for the orthogonal transform coefficient for changing the quantization step size, for example,
[0123]
Further, as the quantization step size, a syntax for a default value (for example, −6) or an offset value (offset_QP) set by the user can be defined. Moreover, you may make it define the syntax about the absolute value of the variable QQP designated by the user.
[0124]
FIG. 8 shows an example of syntax for embedding information about the prediction mode, the orthogonal transform coefficient for changing the quantization step size, and the quantization step size in the image compression information. Of course, the syntax is not limited to this example, and a syntax conforming to any combination of the above-described items can be defined.
[0125]
In FIG. 8, load_16x16 and load_4x4 are 1-bit bits indicating whether or not a parameter QP other than the default is used in the intra macro block and the inter macro block for the luminance signal and the color difference signal, respectively, in the picture. When the flag has a value of 1, a QP other than the default is used in the picture.
[0126]
For example, when the value of load_16x16 is 1, information regarding the offset value of the parameter QP represented by 4 bits is embedded in the subsequent offset_QP. Further, in the subsequent coef_num, information on the orthogonal transform coefficient for changing the quantization step size represented by 2 bits, for example, information on any of
[0127]
As described above, each component is not necessarily 4 bits, and may be represented by 8 bits or 12 bits.
[0128]
In addition, information regarding offset_QP may be compressed by taking an absolute value or performing lossless encoding such as variable length encoding or arithmetic encoding.
[0129]
In the above description, image information in which each pixel value is represented by 8 bits is targeted as input. However, the present invention can be extended to image information in which each pixel value is represented by 10 bits. is there.
[0130]
As described above, according to the image
[0131]
By the way, in the above description, the visual characteristic is obtained by performing the weighting process on each component of the 4 × 4 discrete cosine transform coefficient or the designated component with respect to the parameter QP for quantization for each macroblock. It is assumed that quantization considering the above is realized and has a weighting processing function.
[0132]
However, even if there is no weighting processing function in JVT, as described below, it is also possible to calculate a dead zone in consideration of visual characteristics for orthogonal transform coefficients near zero of the input value as described above. There is an effect.
[0133]
FIG. 9 shows a schematic configuration of an image information encoding apparatus according to an embodiment of the present invention that performs such dead zone calculation processing. As shown in FIG. 9, the basic configuration of the image
[0134]
Therefore, the same components as those of the image
[0135]
The dead
[0136]
[Expression 25]
[0137]
Here, in Expression (24), f is 2 in the intra macroblock.15 + QQP / 6/ 3, 2 for inter macroblock15 + QQP / 6/ 6 and have the same positive / negative sign as the orthogonal transform coefficient Y to be quantized. QQP is the W used in the weighting process described above.intra(I, j) and WinterIt is assumed that (i, j) (i, j = 0,1,2,3) is used for calculation.
[0138]
If the absolute value of the input value Y (i, j) is smaller than the absolute value of T (i, j) using the dead zone threshold T (i, j) calculated in this way, the quantized value YQLet (i, j) be 0.
[0139]
Similarly, the orthogonal transform coefficient Y obtained by further collecting the DC component of luminance into blocks of 4 × 4 units and performing Hadamard transformDFor (i, j), dead zone threshold T according to equation (25) belowD(I, j) is calculated. Further, the orthogonal transform coefficient Y obtained by further collecting the DC components of the color difference into blocks of 2 × 2 units and performing Hadamard transformDFor (i, j), the dead zone threshold T according to the following equation (26):D(I, j) is calculated.
[0140]
[Equation 26]
[0141]
And the input value YDThe absolute value of (i, j) is TDIf smaller than the absolute value of (i, j), the quantized value YDQLet (i, j) be 0.
[0142]
Input value Y (i, j) and quantized value YQA correspondence graph with (i, j) is shown in FIG. As shown in FIG. 10, the dead zone threshold T (i, j) in the correspondence graph (a) of the present embodiment is the correspondence graph (b) when the weighting process is performed with the weighting matrix W (i, j). In the range of the input value where the quantized value becomes zero, the quantized value is similarly calculated to be zero.
[0143]
As described above, according to the image
[0144]
In addition, such a method for calculating a dead zone in consideration of visual characteristics has an advantage that the processing amount is not increased because the conventional JVT decoder can perform the decoding process.
[0145]
It should be noted that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the present invention.
[0146]
For example, the technique according to the present invention can be applied to any conversion method. That is, the present invention can be similarly applied without depending on the calculation accuracy and the conversion matrix of integer conversion.
[0147]
Further, the present invention can be similarly applied to conversion of any size without depending on the size of the conversion block. The present invention is also applicable to an adaptive variable block size conversion method that adaptively performs frequency conversion with any block size of 4 × 4, 4 × 8, 8 × 4, 8 × 8, and 16 × 16.
[0148]
Further, the present invention can realize any processing by causing a CPU (Central Processing Unit) to execute a computer program. In this case, the computer program can be provided by being recorded on a recording medium, or can be provided by being transmitted via the Internet or another transmission medium.
[0149]
【The invention's effect】
As described above in detail, the image information encoding method according to the present invention is an image information encoding method in which an input image signal is blocked and subjected to orthogonal transform in units of the block to perform quantization. In addition, a dead zone is set by adding a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block.
[0150]
In such an image information encoding method, in consideration of a virtual weighting process for the quantization step size at the time of quantization, for example, a higher-frequency orthogonal transform coefficient is an input range in which the quantization output is 0. A predetermined change is applied to the dead zone for each component of the orthogonal transform coefficient so that the dead zone becomes wider.
[0151]
Thereby, a dead zone equivalent to the dead zone of the weighting process considering the visual characteristics can be calculated, and the quantization process considering the visual characteristics can be performed.
[0152]
Also, the image information encoding apparatus according to the present invention blocks an image of a force image, performs orthogonal transform in units of the block, and performs quantization. There is provided a dead zone setting means for setting a dead zone obtained by adding a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient.
[0153]
Such an image information encoding device has a range of inputs in which the quantization output becomes 0 as the high-frequency orthogonal transform coefficient in consideration of virtual weighting processing for the quantization step size at the time of quantization, for example. A predetermined change is added to the dead zone for each component of the orthogonal transform coefficient so that the dead zone becomes wider.
[0154]
Thereby, a dead zone equivalent to the dead zone of the weighting process considering the visual characteristics can be calculated, and the quantization process considering the visual characteristics can be performed.
[0155]
Also,A program according to the present invention causes a computer to execute the above-described image information encoding process,The recording medium according to the present invention islike thatA computer-readable program having a program recorded thereon.
[0156]
like thisProgram andAccording to the recording medium, the above-described image information encoding process can be realized by software.
[Brief description of the drawings]
BRIEF DESCRIPTION OF DRAWINGS FIG. 1 is a diagram illustrating a schematic configuration of an image information encoding device provided for explanation of the present embodiment.
[Fig. 2] Fig. 2 is a diagram illustrating a schematic configuration of an image information decoding device provided for explanation of the present embodiment.
FIG. 3 is a diagram for explaining a default value of a weighting matrix stored in a weighting unit of the image information encoding device, and FIG. 3A shows a weighting matrix for an intra macroblock or a luminance signal; FIG. 5B shows a weight matrix for a non-intra macroblock or a color difference signal.
FIG. 4 is a diagram for explaining an example of syntax for embedding information relating to a weight matrix in compressed image information.
FIG. 5 is a diagram for explaining another example of a schematic configuration of an image information encoding device for explaining the present embodiment;
FIG. 6 is a diagram for explaining another example of a schematic configuration of an image information decoding apparatus provided for explanation of the present embodiment;
FIG. 7 is a diagram illustrating an example of orthogonal transform coefficients for changing the quantization step size.
FIG. 8 is a diagram for explaining an example of a syntax for embedding information about a prediction mode, an orthogonal transform coefficient for changing a quantization step size, and a quantization step size in image compression information.
FIG. 9 is a diagram illustrating a schematic configuration of an image information encoding device according to the present embodiment.
FIG. 10 is a diagram illustrating a correspondence graph between an input value and a quantization value in a quantization unit of the image information encoding device.
FIG. 11 is a diagram illustrating a schematic configuration of a conventional image information encoding device that realizes image compression by orthogonal transform and motion compensation.
FIG. 12 is a diagram illustrating a schematic configuration of a conventional image information decoding apparatus that decodes compressed image information compressed by orthogonal transform and motion compensation.
FIG. 13 is a diagram for explaining the relationship between intra_dc_precision, bit precision, inverse quantization coefficient, and DC prediction reset value defined in MPEG2.
FIG. 14 is a diagram illustrating default values of quantization matrices for intra macroblocks and inter macroblocks defined in MPEG2.
FIG. 15 is a diagram for explaining a quantization matrix for a non-intra macroblock defined in
FIG. 16 is a diagram for explaining a relationship among a quantization scale (quantiser_scale), a parameter q_scale_type set in units of pictures, and a quantization scale code quantiser_scale_code set in units of macroblocks in MPEG2.
[Explanation of symbols]
10, 50, 70 Image information encoding unit, 11 A / D conversion unit, 12 screen rearrangement buffer, 13 adder, 14 orthogonal transformation unit, 15 quantization unit, 16 weighting unit, 17 lossless encoding unit, 18 accumulation Buffer, 19 inverse quantization unit, 20 weighting unit, 21 inverse orthogonal transform unit, 22 frame memory, 23 motion prediction / compensation unit, 24 rate control unit, 30, 60 image information decoding device, 31 storage buffer, 32 lossless decoding unit , 33 Inverse quantization unit, 34 Weighting unit, 35 Inverse orthogonal transform unit, 36 Adder, 37 Screen rearrangement buffer, 38 D / A conversion unit, 39 Motion prediction / compensation unit, 40 Frame memory, 51, 52, 61 Low frequency accuracy change unit, 71 dead zone calculation unit
Claims (11)
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するものであって、
上記直交変換の単位となるブロックは、4×4画素からなり、
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)が算出され、
上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力が0とされること
を特徴とする画像情報符号化方法。In an image information encoding method in which an input image signal is blocked and subjected to orthogonal transformation in units of the block to perform quantization,
In the quantization, a virtual weighting process for the quantization step size in the quantization is considered for the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block. Then, a dead zone in which a change is made for each component of the orthogonal transform coefficient is set ,
The block that is the unit of the orthogonal transformation is composed of 4 × 4 pixels,
Obtained by adding an array W (i, j) for weighting for each component Y (i, j) of the orthogonal transform coefficient to the parameter QP for designating the quantization step size Q Using the variable QQP (i, j)
T (i, j) = (2 15 + QQP / 6− f) / Q ( i, j = 0,1,2,3 )
However, f is an intra macroblock is 2 15 + QQP / 6/3 , the inter macroblock and 2 15 + QQP / 6/6 , with the Y (i, j) and of the same sign
The threshold value T (i, j) is calculated as
When the absolute value of Y (i, j) is smaller than the absolute value of T (i, j), the quantized output of Y (i, j) is set to 0. Encoding method.
Y(i,j)Y (i, j) == {(0,0),(0,2),(2,0),(2,2)}{(0,0), (0,2), (2,0), (2,2)} の場合、in the case of, Q[QQP%6][i][j]Q [QQP% 6] [i] [j] == quantMat[QQP%6][0] quantMat [QQP% 6] [0] 、,
Y(i,j)Y (i, j) == {(1,1),(1,3),(3,1),(3,3)}{(1,1), (1,3), (3,1), (3,3)} の場合、in the case of, Q[QQP%6][i][j]Q [QQP% 6] [i] [j] == quantMat[QQP%6][1] quantMat [QQP% 6] [1] 、,
Y(i,j)Y (i, j) が上記以外の場合、If is other than the above, Q[QQP%6][i][j]Q [QQP% 6] [i] [j] == quantMat[QQP%6][2]quantMat [QQP% 6] [2] であり、And
上記the above quantMatquantMat は、Is
quantMat[6][3]quantMat [6] [3] == {{13107, 5243, 8224}, {11651, 4660, 7358}, {10486, 4143, 6554}, {9198, 3687, 5825}, {8322, 3290, 5243}, {7384, 2943, 4660}}{{13107, 5243, 8224}, {11651, 4660, 7358}, {10486, 4143, 6554}, {9198, 3687, 5825}, {8322, 3290, 5243}, {7384, 2943, 4660}} であることBe
を特徴とする請求項1記載の画像情報符号化方法。The image information encoding method according to claim 1.
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更が加えたデッドゾーンを設定するものであって、When the quantization is performed, a dead zone in which a predetermined change is made with respect to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block is set.
上記デッドゾーンは、上記量子化後の輝度信号のDC成分を集めて構成された4×4画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、The dead zone is a virtual weighting process for the quantization step size when quantizing each DC component of a block of 4 × 4 pixel units configured by collecting DC components of the luminance signal after quantization. In consideration, a change is made for each DC component,
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分YFor the parameter QP for specifying the quantization step size Q, the DC component Y DD (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
TT DD (i,j)=(2(I, j) = (2 16+QQP/616 + QQP / 6 −2・f)/Q (-2 · f) / Q ( i,j=0,1,2,3i, j = 0,1,2,3 ))
ただし、fはイントラマクロブロックでは2Where f is 2 for intra macroblocks. 15+QQP/615 + QQP / 6 /3、インターマクロブロックでは2/ 3, 2 for inter macroblock 15+QQP/615 + QQP / 6 /6とし、上記Y/ 6 and above Y DD (i,j)と同じ正負の符号を持つHas the same sign as (i, j)
のように閾値TThreshold T DD (i,j)が算出され、(I, j) is calculated,
上記YY above DD (i,j)の絶対値が上記TThe absolute value of (i, j) is T DD (i,j)の絶対値よりも小さい場合に、当該YY is smaller than the absolute value of (i, j) DD (i,j)の量子化出力が0とされることThe quantized output of (i, j) is set to 0
を特徴とする画像情報符号化方法。An image information encoding method characterized by the above.
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更が加えたデッドゾーンを設定するものであって、When the quantization is performed, a dead zone in which a predetermined change is made with respect to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block is set.
上記デッドゾーンは、上記量子化後の色差信号のDC成分を集めて構成された2×2画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、The dead zone is a virtual weighting process for the quantization step size when quantizing each DC component of a block of 2 × 2 pixel units configured by collecting DC components of the color difference signals after quantization. In consideration, a change is made for each DC component,
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分YFor the parameter QP for specifying the quantization step size Q, the DC component Y DD (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
TT DD (i,j)=(2(I, j) = (2 16+QQP/616 + QQP / 6 −2・f)/Q (-2 · f) / Q ( i,j=0,1i, j = 0,1 ))
ただし、fはイントラマクロブロックでは2Where f is 2 for intra macroblocks. 15+QQP/615 + QQP / 6 /3、インターマクロブロックでは2/ 3, 2 for inter macroblock 15+QQP/615 + QQP / 6 /6とし、上記Y/ 6 and above Y DD (i,j)と同じ正負の符号を持つHas the same sign as (i, j)
のように閾値TThreshold T DD (i,j)が算出され、(I, j) is calculated,
上記YY above DD (i,j)の絶対値が上記TThe absolute value of (i, j) is T DD (i,j)の絶対値よりも小さい場合に、当該YY is smaller than the absolute value of (i, j) DD (i,j)の量子化出力が0とされることThe quantized output of (i, j) is set to 0
を特徴とする画像情報符号化方法。An image information encoding method characterized by the above.
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するデッドゾーン設定手段を備え、
上記直交変換の単位となるブロックは、4×4画素からなり、
上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)を算出し、
上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力を0とすること
を特徴とする画像情報符号化装置。In an image information encoding apparatus that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization,
In the quantization, a virtual weighting process for the quantization step size in the quantization is considered for the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block. And a dead zone setting means for setting a dead zone that has been changed for each component of the orthogonal transform coefficient ,
The block that is the unit of the orthogonal transformation is composed of 4 × 4 pixels,
The dead zone setting means weights the array W (i, j) for each component Y (i, j) of the orthogonal transform coefficient with respect to the parameter QP for designating the quantization step size Q. Using the variable QQP (i, j) obtained by adding
T (i, j) = (2 15 + QQP / 6− f) / Q ( i, j = 0,1,2,3 )
However, f is an intra macroblock is 2 15 + QQP / 6/3 , the inter macroblock and 2 15 + QQP / 6/6 , with the Y (i, j) and of the same sign
The threshold value T (i, j) is calculated as
When the absolute value of Y (i, j) is smaller than the absolute value of T (i, j), the quantized output of Y (i, j) is set to 0. Device.
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備え、A dead zone setting means for setting a dead zone obtained by making a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block at the time of the quantization;
上記デッドゾーンは、上記量子化後の輝度信号のDC成分を集めて構成された4×4画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、The dead zone is a virtual weighting process for the quantization step size when quantizing each DC component of a block of 4 × 4 pixel units configured by collecting DC components of the luminance signal after quantization. In consideration, a change is made for each DC component,
上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分YThe dead zone setting means applies the DC component Y to the parameter QP for specifying the quantization step size Q. DD (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
TT DD (i,j)=(2(I, j) = (2 16+QQP/616 + QQP / 6 −2・f)/Q (-2 · f) / Q ( i,j=0,1,2,3i, j = 0,1,2,3 ))
ただし、fはイントラマクロブロックでは2Where f is 2 for intra macroblocks. 15+QQP/615 + QQP / 6 /3、インターマクロブロックでは2/ 3, 2 for inter macroblock 15+QQP/615 + QQP / 6 /6とし、上記Y/ 6 and above Y DD (i,j)と同じ正負の符号を持つHas the same sign as (i, j)
のように閾値TThreshold T DD (i,j)を算出し、(I, j) is calculated,
上記YY above DD (i,j)の絶対値が上記TThe absolute value of (i, j) is T DD (i,j)の絶対値よりも小さい場合に、当該YY is smaller than the absolute value of (i, j) DD (i,j)の量子化出力を0とすることThe quantization output of (i, j) is set to 0
を特徴とする画像情報符号化装置。An image information encoding device characterized by the above.
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備え、A dead zone setting means for setting a dead zone obtained by making a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block at the time of the quantization;
上記デッドゾーンは、上記量子化後の色差信号のDC成分を集めて構成された2×2画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、The dead zone is a virtual weighting process for the quantization step size when quantizing each DC component of a block of 2 × 2 pixel units configured by collecting DC components of the color difference signals after quantization. In consideration, a change is made for each DC component,
上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分YThe dead zone setting means applies the DC component Y to the parameter QP for specifying the quantization step size Q. DD (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
TT DD (i,j)=(2(I, j) = (2 16+QQP/616 + QQP / 6 −2・f)/Q (-2 · f) / Q ( i,j=0,1i, j = 0,1 ))
ただし、fはイントラマクロブロックでは2Where f is 2 for intra macroblocks. 15+QQP/615 + QQP / 6 /3、インターマクロブロックでは2/ 3, 2 for inter macroblock 15+QQP/615 + QQP / 6 /6とし、上記Y/ 6 and above Y DD (i,j)と同じ正負の符号を持つHas the same sign as (i, j)
のように閾値TThreshold T DD (i,j)を算出し、(I, j) is calculated,
上記YY above DD (i,j)の絶対値が上記TThe absolute value of (i, j) is T DD (i,j)の絶対値よりも小さい場合に、当該YY is smaller than the absolute value of (i, j) DD (i,j)の量子化出力を0とすることThe quantization output of (i, j) is set to 0
を特徴とする画像情報符号化装置。An image information encoding device characterized by the above.
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するものであって、
上記直交変換の単位となるブロックは、4×4画素からなり、
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)が算出され、
上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力が0とされること
を特徴とするプログラム。 In a program that causes a computer to execute an image information encoding process that blocks an input image signal, performs orthogonal transformation in units of the block, and performs quantization.
In the quantization, a virtual weighting process for the quantization step size in the quantization is considered for the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block. Then, a dead zone in which a change is made for each component of the orthogonal transform coefficient is set ,
The block that is the unit of the orthogonal transformation is composed of 4 × 4 pixels,
Obtained by adding an array W (i, j) for weighting for each component Y (i, j) of the orthogonal transform coefficient to the parameter QP for designating the quantization step size Q Using the variable QQP (i, j)
T (i, j) = (2 15 + QQP / 6− f) / Q ( i, j = 0,1,2,3 )
However, f is an intra macroblock is 2 15 + QQP / 6/3 , the inter macroblock and 2 15 + QQP / 6/6 , with the Y (i, j) and of the same sign
The threshold value T (i, j) is calculated as
When the absolute value of Y (i, j) is smaller than the absolute value of T (i, j), the quantized output of Y (i, j) is set to 0
A program characterized by
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するものであって、
上記直交変換の単位となるブロックは、4×4画素からなり、
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3 )
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)が算出され、
上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力が0とされること
を特徴とするプログラムが記録された記録媒体。In a computer-readable recording medium on which a program for causing a computer to execute an image information encoding process that blocks an input image signal, performs orthogonal transformation in units of the block and performs quantization,
In the quantization, a virtual weighting process for the quantization step size in the quantization is considered for the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block. Then, a dead zone in which a change is made for each component of the orthogonal transform coefficient is set ,
The block that is the unit of the orthogonal transformation is composed of 4 × 4 pixels,
Obtained by adding an array W (i, j) for weighting for each component Y (i, j) of the orthogonal transform coefficient to the parameter QP for designating the quantization step size Q Using the variable QQP (i, j)
T (i, j) = (2 15 + QQP / 6− f) / Q ( i, j = 0,1,2,3 )
However, f is an intra macroblock is 2 15 + QQP / 6/3 , the inter macroblock and 2 15 + QQP / 6/6 , with the Y (i, j) and of the same sign
The threshold value T (i, j) is calculated as
When the absolute value of the Y (i, j) is smaller than the absolute value of the T (i, j), the quantized output of the Y (i, j) is set to 0. Recorded recording medium.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002207487A JP4254147B2 (en) | 2001-11-30 | 2002-07-16 | Image information encoding method and apparatus, program, and recording medium |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001367868 | 2001-11-30 | ||
JP2001-367868 | 2001-11-30 | ||
JP2002207487A JP4254147B2 (en) | 2001-11-30 | 2002-07-16 | Image information encoding method and apparatus, program, and recording medium |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003230142A JP2003230142A (en) | 2003-08-15 |
JP2003230142A5 JP2003230142A5 (en) | 2005-10-27 |
JP4254147B2 true JP4254147B2 (en) | 2009-04-15 |
Family
ID=27759605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002207487A Expired - Fee Related JP4254147B2 (en) | 2001-11-30 | 2002-07-16 | Image information encoding method and apparatus, program, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4254147B2 (en) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NO319007B1 (en) * | 2003-05-22 | 2005-06-06 | Tandberg Telecom As | Video compression method and apparatus |
EP1564997A1 (en) * | 2004-02-12 | 2005-08-17 | Matsushita Electric Industrial Co., Ltd. | Encoding and decoding of video images based on a quantization with an adaptive dead-zone size |
EP2611157A1 (en) | 2004-02-20 | 2013-07-03 | Nec Corporation | Image encoding method, device thereof, and control program thereof |
EP1766988A2 (en) | 2004-06-18 | 2007-03-28 | THOMSON Licensing | Method and apparatus for video codec quantization |
US7995649B2 (en) | 2006-04-07 | 2011-08-09 | Microsoft Corporation | Quantization adjustment based on texture level |
US8503536B2 (en) | 2006-04-07 | 2013-08-06 | Microsoft Corporation | Quantization adjustments for DC shift artifacts |
US8711925B2 (en) * | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
US8498335B2 (en) | 2007-03-26 | 2013-07-30 | Microsoft Corporation | Adaptive deadzone size adjustment in quantization |
US8243797B2 (en) | 2007-03-30 | 2012-08-14 | Microsoft Corporation | Regions of interest for quality adjustments |
JPWO2008132890A1 (en) * | 2007-04-16 | 2010-07-22 | 株式会社東芝 | Method and apparatus for image encoding and image decoding |
US8442337B2 (en) | 2007-04-18 | 2013-05-14 | Microsoft Corporation | Encoding adjustments for animation content |
US8897359B2 (en) | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
US20130272390A1 (en) * | 2012-04-16 | 2013-10-17 | Qualcomm Incorporated | Uniform granularity for quantization matrix in video coding |
GB2501535A (en) * | 2012-04-26 | 2013-10-30 | Sony Corp | Chrominance Processing in High Efficiency Video Codecs |
GB2512826B (en) * | 2013-04-05 | 2017-05-10 | Canon Kk | Method and device for determining the value of a quantization parameter |
-
2002
- 2002-07-16 JP JP2002207487A patent/JP4254147B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003230142A (en) | 2003-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4617644B2 (en) | Encoding apparatus and method | |
US7620103B2 (en) | Programmable quantization dead zone and threshold for standard-based H.264 and/or VC1 video encoding | |
KR100785589B1 (en) | Image encoding apparatus and image decoding apparatus | |
KR101156996B1 (en) | Decoding apparatus and decoding method | |
JP4254147B2 (en) | Image information encoding method and apparatus, program, and recording medium | |
WO2005062622A1 (en) | Image decoding device, image decoding method, and image decoding program | |
JP2001054119A (en) | Image prediction coding method | |
KR100949475B1 (en) | Apparatus and method for determining scan pattern, and Apparatus and method for encoding image data using the same, and method for decoding image data using the same | |
JP4560694B2 (en) | Encoding apparatus and method thereof | |
JP2008219205A (en) | Picture information encoder and picture information encoding method | |
JP5375938B2 (en) | Decoding apparatus and method | |
JP4214771B2 (en) | Image processing apparatus and method and encoding apparatus | |
JP2008004984A (en) | Image processor and method, program, and recording medium | |
JP4277530B2 (en) | Image processing apparatus and encoding apparatus and methods thereof | |
KR100366382B1 (en) | Apparatus and method for coding moving picture | |
JP4924708B2 (en) | Decoding apparatus and method | |
JP4348899B2 (en) | Image information decoding method | |
JP2001148852A (en) | Image information converter and image information conversion method | |
JP5375935B2 (en) | Encoding apparatus and method | |
JP4983908B2 (en) | Decoding apparatus and method | |
US20060222065A1 (en) | System and method for improving video data compression by varying quantization bits based on region within picture | |
JP2002354484A (en) | Rate transforming method for encoded image and rate transforming apparatus for encoded image | |
JP4924744B2 (en) | Decoding device and method | |
JP5375936B2 (en) | Decoding apparatus and method | |
JP4983907B2 (en) | Encoding apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050712 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050712 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4254147 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140206 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |