JP4254147B2 - Image information encoding method and apparatus, program, and recording medium - Google Patents

Image information encoding method and apparatus, program, and recording medium Download PDF

Info

Publication number
JP4254147B2
JP4254147B2 JP2002207487A JP2002207487A JP4254147B2 JP 4254147 B2 JP4254147 B2 JP 4254147B2 JP 2002207487 A JP2002207487 A JP 2002207487A JP 2002207487 A JP2002207487 A JP 2002207487A JP 4254147 B2 JP4254147 B2 JP 4254147B2
Authority
JP
Japan
Prior art keywords
quantization
qqp
component
dead zone
orthogonal transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002207487A
Other languages
Japanese (ja)
Other versions
JP2003230142A (en
JP2003230142A5 (en
Inventor
邦明 高橋
輝彦 鈴木
陽一 矢ヶ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002207487A priority Critical patent/JP4254147B2/en
Publication of JP2003230142A publication Critical patent/JP2003230142A/en
Publication of JP2003230142A5 publication Critical patent/JP2003230142A5/ja
Application granted granted Critical
Publication of JP4254147B2 publication Critical patent/JP4254147B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、MPEG(Moving Picture Experts Group)、H.26xなどの様に、離散コサイン変換又はカルーネン・レーベ変換等の直交変換と動き補償とによって圧縮された画像情報(ビットストリーム)を、衛星放送、ケーブルTV若しくはインターネット等のネットワークメディアを介して受信する際に、又は光ディスク、磁気ディスク若しくはフラッシュメモリ等の記憶メディア上で処理する際に用いられる画像情報符号化方法及びその装置、並びにプログラム及び記録媒体に関するものである。
【0002】
【従来の技術】
近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償とにより圧縮するMPEGなどの方式に準拠した装置が、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG2(ISO/IEC 13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4〜8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18〜22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。
【0004】
MPEG2は、主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量(ビットレート)、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。
【0005】
さらに、近年、テレビ会議用の画像符号化を当初の目的として、JVT(ITU-T Q6/16 VCEG)という標準の規格化が進んでいる。このJVTは、MPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このJVTをベースに、JVTではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われている。
【0006】
ここで、離散コサイン変換又はカルーネン・レーベ変換等の直交変換と動き補償とにより画像圧縮を実現する画像情報符号化装置の概略構成を図11に示す。図11に示すように、画像情報符号化装置100は、A/D変換部101と、画面並べ替えバッファ102と、加算器103と、直交変換部104と、量子化部105と、可逆符号化部106と、蓄積バッファ107と、逆量子化部108と、逆直交変換部109と、フレームメモリ110と、動き予測・補償部111と、レート制御部112とにより構成されている。
【0007】
図11において、A/D変換部101は、入力された画像信号をデジタル信号に変換する。そして、画面並べ替えバッファ102は、当該画像情報符号化装置100から出力される画像圧縮情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行う。ここで、画面並び替えバッファ102は、イントラ(画像内)符号化が行われる画像に関しては、フレーム全体の画像情報を直交変換部104に供給する。直交変換部104は、画像情報に対して離散コサイン変換又はカルーネン・レーベ変換等の直交変換を施し、得られた直交変換係数を量子化部105に供給する。量子化部105は、直交変換部104から供給された直交変換係数に対して量子化処理を施す。
【0008】
可逆符号化部106は、量子化された直交変換係数に対して可変長符号化、算術符号化等の可逆符号化を施し、符号化された直交変換係数を蓄積バッファ107に供給して蓄積させる。この符号化された直交変換係数は、画像圧縮情報として出力される。
【0009】
量子化部105の挙動は、レート制御部112によって制御される。また、量子化部105は、量子化後の直交変換係数を逆量子化部108に供給し、逆量子化部108は、その直交変換係数を逆量子化する。逆直交変換部109は、逆量子化された直交変換係数に対して逆直交変換処理を施して復号画像情報を生成し、その情報をフレームメモリ110に供給して蓄積させる。
【0010】
一方、画面並び替えバッファ102は、インター(画像間)符号化が行われる画像に関しては、画像情報を動き予測・補償部111に供給する。動き予測・補償部111は、同時に参照される画像情報をフレームメモリ110より取り出し、動き予測・補償処理を施して参照画像情報を生成する。動き予測・補償部111は、この参照画像情報を加算器103に供給し、加算器103は、参照画像情報を当該画像情報との差分信号に変換する。また、動き補償・予測部111は、同時に動きベクトル情報を可逆符号化部106に供給する。
【0011】
可逆符号化部106は、その動きベクトル情報に対して可変長符号化又は算術符号化等の可逆符号化処理を施し、画像圧縮情報のヘッダ部に挿入される情報を形成する。なお、その他の処理については、イントラ符号化を施される画像圧縮情報と同様であるため、説明を省略する。
【0012】
続いて、上述した画像情報符号化装置100に対応する画像情報復号装置の概略構成を図12に示す。図12に示すように、画像情報復号装置120は、蓄積バッファ121と、可逆復号部122と、逆量子化部123と、逆直交変換部124と、加算器125と、画面並べ替えバッファ126と、D/A変換部127と、動き予測・補償部128と、フレームメモリ129とにより構成されている。
【0013】
図12において、蓄積バッファ121は、入力された画像圧縮情報を一時的に格納した後、可逆復号部14に転送する。可逆復号部122は、定められた画像圧縮情報のフォーマットに基づき、画像圧縮情報に対して可変長復号又は算術復号等の処理を施し、量子化された直交変換係数を逆量子化部123に供給する。また、可逆復号部122は、当該フレームがインター符号化されたものである場合には、画像圧縮情報のヘッダ部に格納された動きベクトル情報についても復号し、その情報を動き予測・補償部128に供給する。
【0014】
逆量子化部123は、可逆復号部122から供給された量子化後の直交変換係数を逆量子化し、得られた直交変換係数を逆直交変換部124に供給する。逆直交変換部124は、定められた画像圧縮情報のフォーマットに基づき、直交変換係数に対して逆離散コサイン変換又は逆カルーネン・レーベ変換等の逆直交変換を施す。
【0015】
ここで、当該フレームがイントラ符号化されたものである場合には、逆直交変換処理が施された画像情報は、画面並べ替えバッファ126に格納され、D/A変換部127におけるD/A変換処理の後に出力される。
【0016】
一方、当該フレームがインター符号化されたものである場合には、動き予測・補償部128は、可逆復号処理が施された動きベクトル情報とフレームメモリ129に格納された画像情報とに基づいて参照画像を生成し、加算器125に供給する。加算器125は、この参照画像と逆直交変換部124の出力とを合成する。なお、その他の処理については、イントラ符号化されたフレームと同様であるため、説明を省略する。
【0017】
ところで、MPEG2ビデオ規格においては、量子化についての直接的な規定はされておらず、逆量子化についてのみ、その詳細な規定がなされている。したがって、実際に量子化を行う際には、量子化の規定に含まれるいくつかの媒介変数を変化させ、その自由度内の範囲内で量子化特性を変化させることにより、高画質化や視覚特性を反映した符号化を行うことになる。以下、MPEG2における逆量子化処理について説明する。
【0018】
MPEG2ビデオ規格において、イントラマクロブロックのDC係数量子化では、ピクチャ単位にその量子化精度を指定することが可能であり、その他の係数の量子化では、ピクチャ単位で指定可能な量子化行列の各要素にマクロブロック単位で指定可能な量子化スケールを乗じた値により、各係数の量子化精度を制御することができる。
【0019】
イントラマクロブロックのDC係数は、以下の式(1)に従って逆量子化される。
【0020】
【数6】

Figure 0004254147
【0021】
ここで、式(1)において、F"[0][0]はDC係数値の量子化代表値を示し、QF[0][0]はDC係数値の量子化代表値レベル番号を示す。また、intra_dc_multは、DC係数量子化精度を指定するためにピクチャ単位で設定可能な媒介変数であるintra_dc_precisionに従い、図13に示す関係で決まる値である。
【0022】
ここで、MPEG1においては、intra_dc_precisionが0に対応する精度(8ビット精度相当)のみであったが、輝度レベルが緩やかに変化する画像を高画質で符号化するためには、この精度では不十分であった。そこで、MPEG2においては、図13に示すように、本媒介変数を用いて8〜11ビット精度相当のDC係数量子化精度を指定することが可能となっている。但し、4:2:2フォーマットでの使用が可能であり画質への要求レベルが高いHighプロファイル以外では、最高10ビット精度で十分とし、8〜10ビット精度に制限されている。
【0023】
また、イントラマクロブロックのその他の係数は、以下の式(2)に従って逆量子化される。
【0024】
【数7】
Figure 0004254147
【0025】
ここで、式(2)において、F"[u][v]は第(u,v)係数値の量子化代表値を示し、QF[u][v]は第(u,v)係数値の量子化代表値レベル番号を示す。また、kの値は、以下の式(3)により定義される。
【0026】
【数8】
Figure 0004254147
【0027】
また、上述した式(2)において、W[w][u][v]及びquantiser_scaleは、それぞれ量子化行列及び量子化スケールを示し、これらの媒介変数によって量子化特性が制御される。
【0028】
また、媒介変数kは、非イントラマクロブロックにおいて、その値がQF[u][v]の符号に応じて1、0、−1となる。例えば、QF[u][v]が−2、−1、0、1、2である場合のF"[u][v]は、それぞれ−5m、−3m、0、3m、5m(mは定数)となり、零近傍にデッドゾーンが設けられている。
【0029】
ところで、量子化行列は、ブロック内での離散コサイン変換係数値間での相対的な量子化精度を設定するために設けられた行列である。この量子化行列を用いることにより、例えば視覚的に劣化の目立ちにくい高域離散コサイン係数値を、視覚的に劣化の目立ちやすい低域離散コサイン係数と比較して粗く量子化するといった処理が可能となり、量子化特性を視覚特性に合致させることができる。なお、量子化行列は、ピクチャ単位で設定することが可能である。
【0030】
MPEG1及びMPEG2の4:2:0フォーマットの場合、イントラマクロブロック用と非イントラマクロブロック用の2種類の量子化行列を設定することができ、4:2:2フォーマット及び4:4:4フォーマットの場合には、さらに輝度信号と色差信号とで独立に合計4種類の量子化行列を設定することができる。なお、W[w][u][v]におけるw(0,1,2,3)は、4種類の行列のうちの1つを意味する。
【0031】
ここで、MPEG2において定められているイントラマクロブロック及び非イントラマクロブロックの量子化行列のデフォルト値をそれぞれ図14(A)、(B)に示す。上述したように、量子化行列は、ユーザがピクチャ単位で設定可能であるが、設定されていない場合にはこのデフォルト値が用いられる。図14に示すように、デフォルト値ではイントラマクロブロックに対してのみ重みを有している。
【0032】
なお、MPEG2 Test Model 5(ISO/IEC JTC/SC29/WG11/N0400)においては、非イントラマクロブロックに対して図15に示すような量子化行列が定義されている。これは、図14(B)に示したデフォルト値とは異なり、重みを有した特性となっている。
【0033】
量子化スケール(quantiser_scale)は、量子化特性のスケーリングを行うことにより発生符号量を制御するための媒介変数であり、ピクチャ単位で設定される媒介変数q_scale_typeと、マクロブロック単位で設定される量子化スケールコードquantiser_scale_codeにより設定される。図16にこれらの関係を示す。
【0034】
ここで、q_scale_typeが0の場合には線形量子化となり、MPEG1と同様、quantiser_scale_code(1〜31)の2倍の値がquantiser_scale(2〜62)に設定される。
【0035】
また、q_scale_typeが1の場合には非線形量子化となり、quantiser_scale_code(1〜31)は、小さい量子化スケールコードではより細かく、大きな量子化スケールコードではより粗くスケーリングすることにより、線形量子化の場合に比べ、広い範囲のquantiser_scale(1〜112)に変換される。このモードは、MPEG2において新たに導入されたもので、特に高いレートで符号化する場合に、小さな量子化スケール領域でより細かな量子化スケール制御を行うことや、極めて複雑な画像を符号化する場合に、より粗い量子化スケールを用いることが可能となり、MPEG1と比較して、より安定した符号量制御を実現することができる。
【0036】
一方、JVTにおいては、量子化/逆量子化を行うための媒介変数QPには0〜51の52の異なる値が使われる。ここで、QPは、値が6増える毎に量子化スケールが2倍になるように設定されている。すなわち、QPが1増す毎に量子化スケールが約12%増加する。
【0037】
なお、色差成分に使用されるQPは、輝度成分に使用されるQPから、以下の表1に示す対照表に従って算出される。以下では、特に断りのない限り、QPのことをQPと呼ぶことにする。
【0038】
【表1】
Figure 0004254147
【0039】
ここで、JVTにおいては、4×4離散コサイン変換に基づく符号化が行われるが、輝度信号と色差信号とについて、実際には、以下の演算が行われる。すなわち、X=(x00,….x33)を画素値又は差分値とし、Yを直交変換係数とした場合に、以下の式(4)に示すような離散コサイン変換に相当する処理が実行される。
【0040】
【数9】
Figure 0004254147
【0041】
次に量子化処理として、以下の式(5)に示すような処理が実行される。
【0042】
【数10】
Figure 0004254147
【0043】
ここで、式(5)において、Yは量子化された直交変換係数を示し、Qは量子化ステップサイズに対応する量子化係数を示す。また、fはイントラマクロブロックでは215+QP/6/3、インターマクロブロックでは215+QP/6/6とし、量子化される直交変換係数Yと同じ正負の符号を持つとする。なお、Qは以下に示すように定義されている。
Q[QP%6][i][j]=quantMat[QP%6][0] for (i,j)={(0,0),(0,2),(2,0),(2,2)},
Q[QP%6][i][j]=quantMat[QP%6][1] for (i,j)={(1,1),(1,3),(3,1),(3,3)},
Q[QP%6][i][j]=quantMat[QP%6][2] otherwise.
quantMat[6][3]={{13107, 5243, 8224}, {11651, 4660, 7358}, {10486, 4143, 6554}, {9198, 3687, 5825}, {8322, 3290, 5243}, {7384, 2943, 4660}}
【0044】
また、量子化後の逆量子化処理として、以下の式(6)に示すような処理が実行される。
【0045】
【数11】
Figure 0004254147
【0046】
ここで、式(6)において、Rは逆量子化係数を示し、以下に示すように定義されている。
R[QP%6][i][j]=dequantMat[QP%6][0] for (i,j)={(0,0),(0,2),(2,0),(2,2)},
R[QP%6][i][j]=dequantMat[QP%6][1] for (i,j)={(1,1),(1,3),(3,1),(3,3)},
R[QP%6][i][j]=dequantMat[QP%6][2] otherwise.
dequantMat[6][3]={{10, 16, 13}, {11, 18, 14}, {13, 20, 16}, {14, 23, 18}, {16, 25, 20}, {18, 29, 23}}
【0047】
次に逆離散コサイン変換処理として、以下の式(7)に示すような処理が実行され、正規化処理として、以下の式(8)に示すような処理が実行される。
【0048】
【数12】
Figure 0004254147
【0049】
最後に、復号された予測残差値X"(i,j)は、以下の式(9)に示すように、動き補償予測値又は空間予測値P(i,j)と足し合わされ、0から255の範囲にクリッピングされて最終復号画素値が算出される。
【0050】
【数13】
Figure 0004254147
【0051】
ところで、JVTでは、イントラ16×16モードにおいて、輝度信号のDC成分をさらに4×4単位のブロックに集め、アダマール変換を施して圧縮率を向上させている。輝度信号の4×4DC成分の直交変換及び量子化は、以下の手法に基づいて実行される。
【0052】
先ず、4×4変換によって算出された直交変換係数の16個の輝度信号DC成分が集められて4×4単位の入力マトリックスXとされ、アダマール変換に相当する処理として、以下の式(10)に示すような処理が実行される。
【0053】
【数14】
Figure 0004254147
【0054】
次に、量子化処理として、以下の式(11)に示すような処理が実行される。
【0055】
【数15】
Figure 0004254147
【0056】
また、逆アダマール変換に相当する処理として、以下の式(12)に示すような処理が実行される。
【0057】
【数16】
Figure 0004254147
【0058】
次に、QPが12以上である場合には、逆量子化処理として、以下の式(13)に示すような処理が実行され、QPが12未満である場合には、逆量子化処理として、以下の式(14)に示すような処理が実行される。
【0059】
【数17】
Figure 0004254147
【0060】
また、JVTでは、色差信号のDC成分についても、さらに2×2画素のブロックに集め、アダマール変換を施して圧縮率を向上させている。色差信号の2×2DC成分の直交変換及び量子化は、以下の手法に基づいて実行される。
【0061】
先ず、4個の色差DC成分が集められて2×2画素の入力マトリックスXとされ、アダマール変換に相当する処理として、以下の式(15)に示すような処理が実行される。
【0062】
【数18】
Figure 0004254147
【0063】
次に、量子化処理として、以下の式(16)に示すような処理が実行される。
【0064】
【数19】
Figure 0004254147
【0065】
また、逆アダマール変換に相当する処理として、以下の式(17)に示すような処理が実行される。
【0066】
【数20】
Figure 0004254147
【0067】
次に、QPが6以上である場合には、逆量子化処理として、以下の式(18)に示すような処理が実行され、QPが6未満である場合には、逆量子化処理として、以下の式(19)に示すような処理が実行される。
【0068】
【数21】
Figure 0004254147
【0069】
なお、直交変換及び量子化の一連の処理は、16ビット演算でオーバーフローが起こらないよう規格化されている。
【0070】
【発明が解決しようとする課題】
ところで、上述のJVTで規定されている量子化/逆量子化においては、MPEG2で規定されているような、量子化行列を用いた直交変換係数の重み付けや、量子化処理におけるデッドゾーンに関する機能が含まれていないため、視覚特性に基づいた効率的な量子化を行うことができない。
【0071】
本発明は、このような従来の実情に鑑みて提案されたものであり、視覚特性を考慮したデッドゾーンを設けて量子化することにより、低ビットレートでの高効率な圧縮を実現する画像情報符号化方法及びその装置、並びにそのような画像情報符号化処理をコンピュータに実行させるプログラム及びそのプログラムが記録されたコンピュータ読み取り可能な記録媒体を提供することを目的とする。
【0072】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係る画像情報符号化方法は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するものであって、上記直交変換の単位となるブロックは、4×4画素からなり、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)が算出され、上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力が0とされるものである。
また、本発明に係る画像情報符号化方法は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更が加えたデッドゾーンを設定するものであって、上記デッドゾーンは、上記量子化後の輝度信号のDC成分を集めて構成された4×4画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分Y (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
(i,j)=(2 16+QQP/6 −2・f)/Q ( i,j=0,1,2,3
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y (i,j)と同じ正負の符号を持つ
のように閾値T (i,j)が算出され、上記Y (i,j)の絶対値が上記T (i,j)の絶対値よりも小さい場合に、当該Y (i,j)の量子化出力が0とされるものである。
また、本発明に係る画像情報符号化方法は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更が加えたデッドゾーンを設定するものであって、上記デッドゾーンは、上記量子化後の色差信号のDC成分を集めて構成された2×2画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分Y (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
(i,j)=(2 16+QQP/6 −2・f)/Q ( i,j=0,1
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y (i,j)と同じ正負の符号を持つ
のように閾値T (i,j)が算出され、上記Y (i,j)の絶対値が上記T (i,j)の絶対値よりも小さい場合に、当該Y (i,j)の量子化出力が0とされるものである。
【0073】
このような画像情報符号化方法では、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、例えば高域直交変換係数ほど量子化の出力が0となる入力の範囲であるデッドゾーンが広くなるように、直交変換係数の成分毎にデッドゾーンに対して所定の変更が加えられる。
【0074】
また、上述した目的を達成するために、本発明に係る画像情報符号化装置は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するデッドゾーン設定手段を備え、上記直交変換の単位となるブロックは、4×4画素からなり、上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)を算出し、上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力を0とする
また、本発明に係る画像情報符号化装置は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備え、上記デッドゾーンは、上記量子化後の輝度信号のDC成分を集めて構成された4×4画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分Y (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
(i,j)=(2 16+QQP/6 −2・f)/Q ( i,j=0,1,2,3
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y (i,j)と同じ正負の符号を持つ
のように閾値T (i,j)を算出し、上記Y (i,j)の絶対値が上記T (i,j)の絶対値よりも小さい場合に、当該Y (i,j)の量子化出力を0とする。
また、本発明に係る画像情報符号化装置は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備え、上記デッドゾーンは、上記量子化後の色差信号のDC成分を集めて構成された2×2画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分Y (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
(i,j)=(2 16+QQP/6 −2・f)/Q ( i,j=0,1
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y (i,j)と同じ正負の符号を持つ
のように閾値T (i,j)を算出し、上記Y (i,j)の絶対値が上記T (i,j)の絶対値よりも小さい場合に、当該Y (i,j)の量子化出力を0とする。
【0075】
このような画像情報符号化装置は、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、例えば高域直交変換係数ほど量子化の出力が0となる入力の範囲であるデッドゾーンが広くなるように、直交変換係数の成分毎にデッドゾーンに対して所定の変更を加える。
【0076】
また、本発明に係るプログラムは、上述した画像情報符号化処理をコンピュータに実行させるものであり、本発明に係る記録媒体は、そのようなプログラムが記録されたコンピュータ読み取り可能なものである。
【0077】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、視覚特性を考慮したデッドゾーンを設けて量子化することにより、低ビットレートでの高効率な圧縮を実現する画像情報符号化方法及びその装置に適用したものである。具体的には、本実施の形態における画像情報符号化方法及びその装置では、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、直交変換係数の成分毎にデッドゾーンが算出される。
【0078】
そこで、以下では、本実施の形態における画像情報符号化方法及びその方法の説明の前に、量子化ステップサイズに対する重み付けを実際に行って量子化及び逆量子化する画像情報符号化装置及び画像情報復号装置について説明する。
【0079】
先ず、本実施の形態の説明に供する画像情報符号化装置の概略構成を図1に示す。図1に示すように、画像情報符号化装置10は、A/D変換部11と、画面並べ替えバッファ12と、加算器13と、直交変換部14と、量子化部15と、重み付け部16と、可逆符号化部17と、蓄積バッファ18と、逆量子化部19と、重み付け部20と、逆直交変換部21と、フレームメモリ22と、動き予測・補償部23と、レート制御部24とにより構成されている。
【0080】
図1において、A/D変換部11は、入力された画像信号をデジタル信号に変換する。そして、画面並べ替えバッファ12は、当該画像情報符号化装置10から出力される画像圧縮情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行う。ここで、画面並び替えバッファ12は、イントラ(画像内)符号化が行われる画像に関しては、フレーム全体の画像情報を直交変換部14に供給する。直交変換部14は、画像情報に対して離散コサイン変換又はカルーネン・レーベ変換等の直交変換を施し、得られた直交変換係数を量子化部15に供給する。
【0081】
量子化部15は、直交変換部14から供給された直交変換係数に対して量子化処理を施す。その際、量子化部15の構成要素である重み付け部16は、後述するようにして、直交変換係数の成分毎に、量子化ステップサイズを指定するための媒介変数QPの重み付けを行う。
【0082】
可逆符号化部17は、量子化された直交変換係数に対して可変長符号化又は算術符号化等の可逆符号化を施し、符号化された直交変換係数を蓄積バッファ18に供給して蓄積させる。この符号化された直交変換係数は、画像圧縮情報として出力される。
【0083】
量子化部15の挙動は、レート制御部24によって制御される。また、量子化部15は、量子化後の直交変換係数を逆量子化部19に供給し、逆量子化部19は、その直交変換係数を逆量子化する。その際、逆量子化部19の構成要素である重み付け部20は、後述するようにして、量子化された直交変換係数の成分毎に、量子化ステップサイズを指定するための媒介変数QPの重み付けを行う。
【0084】
逆直交変換部21は、逆量子化された直交変換係数に対して逆直交変換処理を施して復号画像情報を生成し、その情報をフレームメモリ22に供給して蓄積させる。
【0085】
一方、画面並び替えバッファ12は、インター(画像間)符号化が行われる画像に関しては、画像情報を動き予測・補償部23に供給する。動き予測・補償部23は、同時に、参照される画像情報をフレームメモリ22より取り出し、動き予測・補償処理を施して参照画像情報を生成する。
【0086】
動き予測・補償部23は、この参照画像情報を加算器13に供給し、加算器13は、参照画像情報を当該画像情報との差分信号に変換する。また、動き補償・予測部23は、同時に動きベクトル情報を可逆符号化部17に供給する。
【0087】
可逆符号化部17は、その動きベクトル情報に対して可変長符号化又は算術符号化等の可逆符号化処理を施し、画像圧縮情報のヘッダ部に挿入される情報を形成する。なお、その他の処理については、イントラ符号化を施される画像圧縮情報と同様であるため、説明を省略する。
【0088】
次に、上述した画像情報符号化装置10から出力された画像圧縮情報を復号する画像情報復号装置の概略構成を図2に示す。図2に示すように、画像情報復号装置30は、蓄積バッファ31と、可逆復号部32と、逆量子化部33と、重み付け部34と、逆直交変換部35と、加算器36と、画面並べ替えバッファ37と、D/A変換部38と、動き予測・補償部39と、フレームメモリ40とにより構成されている。
【0089】
図2において、蓄積バッファ31は、入力された画像圧縮情報を一時的に格納した後、可逆復号部32に転送する。可逆復号部32は、定められた画像圧縮情報のフォーマットに基づき、画像圧縮情報に対して可変長復号又は算術復号等の処理を施し、量子化された直交変換係数を逆量子化部33に供給する。また、可逆復号部32は、当該フレームがインター符号化されたものである場合には、画像圧縮情報のヘッダ部に格納された動きベクトル情報についても復号し、その情報を動き予測・補償部39に供給する。
【0090】
逆量子化部33は、可逆復号部32から供給された量子化後の直交変換係数を逆量子化し、逆量子化後の直交変換係数を逆直交変換部35に供給する。その際、逆量子化部33の構成要素である重み付け部34は、後述するようにして、量子化された直交変換係数の成分毎に、量子化ステップサイズを指定するための媒介変数QPの重み付けを行う。逆直交変換部35は、定められた画像圧縮情報のフォーマットに基づき、直交変換係数に対して逆離散コサイン変換又は逆カルーネン・レーベ変換等の逆直交変換を施す。
【0091】
ここで、当該フレームがイントラ符号化されたものである場合には、逆直交変換部35は、逆直交変換処理後の画像情報を画面並べ替えバッファ37に供給する。画面並び替えバッファ37は、この画像情報を一時的に格納した後、D/A変換部38に供給する。D/A変換部38は、この画像情報に対してD/A変換処理を施して出力する。
【0092】
一方、当該フレームがインター符号化されたものである場合には、動き予測・補償部39は、可逆復号処理が施された動きベクトル情報とフレームメモリ40に格納された画像情報とに基づいて参照画像を生成する。加算器36は、この参照画像と逆直交変換部35の出力とを合成する。なお、その他の処理については、イントラ符号化されたフレームと同様であるため、説明を省略する。
【0093】
ところで、上述したように、画像情報符号化装置10及び画像情報復号装置30では、重み付け部16,20,34において、量子化ステップサイズを指定するための媒介変数QPの重み付け処理を行って、量子化及び逆量子化が行われている。そして、この重み付け処理によって、視覚的に劣化の目立ちにくい高域直交変換係数を、視覚的に劣化の目立ちやすい低域直交変換係数に比べて粗く量子化することが可能とされる。
【0094】
そこで、以下では、この重み付け処理について説明する。なお、重み付け部16,20,34の動作原理は同様であるため、以下では重み付け部16の動作原理についてのみ説明する。
【0095】
重み付け部16においては、イントラマクロブロックとインターマクロブロックのそれぞれに対して、デフォルトで、それぞれ図3(A)、(B)に示すようなWintra(i,j)及びWinter(i,j)(i,j=0,1,2,3)に関する情報が含まれている。
【0096】
また、輝度信号と色差信号のそれぞれに対して、デフォルトで、それぞれ図3(A),(B)に示すような、Wluma(i,j)及びWchroma(i,j)(i,j=0,1,2,3)に関する情報を含むようにすることもできる。
【0097】
以下では、Wintra(i,j)及びWinter(i,j)、或いはWluma(i,j)及びWchroma(i,j)に関する処理が同等であるため、特に断りのない限り、これらをW(i,j)と表記する。
【0098】
なお、Wintra(i,j)及びWinter(i,j)、或いはWluma(i,j)及びWchroma(i,j)は、図3に示したデフォルト値に限定されるものではなく、ユーザがピクチャ単位で設定することが可能である。その際、W(i,j)の値そのものを出力となる画像圧縮情報に埋め込むことも可能であるが、その差分値を生成し、又は可変長符号化、算術符号化等の可逆符号化方式を用いてその情報量を削減し、出力される画像圧縮情報に埋め込んでもよい。
【0099】
ここで、重み付け部16においては、画像圧縮情報中に格納される、マクロブロックごとの量子化のための媒介変数QPを元に、4×4離散コサイン変換係数のそれぞれの成分に対して、以下の式(20)に示すような変数QQP(i,j)が定義される。
【0100】
【数22】
Figure 0004254147
【0101】
量子化/逆量子化処理に関しては、上述したJVTにおけるQ(QP%6,i,j)及びR(QP%6,i,j)に代え、各成分毎に、Q(QQP%6,i,j)及びR(QQP%6,i,j)を用いて、JVTと同様の処理を行う。
【0102】
なお、QPのダイナミックレンジは0〜51であるが、上述した式(20)においては、QQP(i,j)の値がこのダイナミックレンジから外れる可能性がある。そこで、QQP(i,j)の値が51を超えた場合にはQQP(i,j)=51とし、0を下回った場合にはQQP(i,j)=0とする。
【0103】
ここで、上述したように、画像情報符号化装置10及び画像情報復号装置30においては、デフォルトで使用される重み行列が、輝度信号及び色差信号の双方に対して、以下の式(21)、(22)のように定義されている。
【0104】
【数23】
Figure 0004254147
【0105】
なお、実際に画像情報符号化装置10及び画像情報復号装置30で量子化/逆量子化に用いられる重み行列は必ずしもこの通りではなく、ピクチャ単位でユーザが設定することが可能である。
【0106】
この重み行列に関する情報を、画像圧縮情報中に埋め込むための構文の例を図4に示す。図4において、load_intra_quantiser_matrix、load_non_intra_quantiser_matrix、load_chroma_intra_quantiser_matrix、及びload_chroma_non_intra_quantiser_matrixは、それぞれ当該ピクチャで、輝度信号及び色差信号に対するイントラマクロブロック及びインターマクロブロックにおいて、デフォルトで定められた以外の重み行列が用いられるか否かを示す1ビットのフラグであり、その値が1を取るとき、当該ピクチャにおいてはデフォルト以外の重み行列が用いられる。
【0107】
例えばload_intra_quantiser_matrixの値が1であった場合、後続のintra_quantiser_matrix[16]において、それぞれの成分が4ビットで表された4×4の重み行列に関する情報が埋め込まれる。
【0108】
なお、上述のように、それぞれの成分が必ずしも4ビットである必要はなく、8ビット又は12ビット等で表されてもよい。
【0109】
また、差分を取り、又は可変長符号化若しくは算術符号化等の可逆符号化を施すことにより、intra_quantiser_matrix[16]に関する情報を圧縮してもよい。
【0110】
また、上述の説明では、入力としてそれぞれの画素値が8ビットで表される画像情報を対象にしているが、例えばそれぞれの画素値が10ビットで表される画像情報に対しても拡張可能である。
【0111】
以上説明したように、画像情報符号化装置10及び画像情報復号装置30によれば、量子化ステップサイズを指定するための媒介変数QPの重み付け処理を行って量子化処理及び逆量子化処理を行うことにより、視覚的に劣化の目立ちにくい高域直交変換係数を、視覚的に劣化の目立ちやすい低域直交変換係数に比べて粗く量子化することが可能とされる。
【0112】
ここで、上述の説明では、マクロブロックごとの量子化のための媒介変数QPに対して、4×4離散コサイン変換係数のそれぞれの成分について重み行列W(i,j)を加算し、得られた変数QQP(i,j)を用いて量子化処理及び逆量子化処理を行った。しかしながら、このように4×4直交変換係数の全ての成分について重み行列W(i,j)を定義する例に限定されるものではなく、視覚的に劣化の目立ちやすい低域直交変換係数についてのみ媒介変数QPに対してオフセット値を与え、量子化精度を向上させる処理を行うようにしても構わない。
【0113】
このような処理を行う画像情報符号化装置及びこの画像符号化装置から出力された画像圧縮情報を復号する画像情報復号装置の概略構成をそれぞれ図5、図6に示す。
【0114】
図5に示すように、画像情報符号化装置50の基本構成は、先に図1に示した画像情報符号化装置10と同様とするが、重み付け部16,20の代わりに、低域精度変更部51,52を備えており、低域直交変換係数の量子化精度を変更する点に特徴を有している。また、図6に示すように、画像情報復号装置60の基本構成は、先に図2に示した画像情報復号装置30と同様とするが、重み付け部34の代わりに、低域精度変更部61を備えており、低域直交変換係数の逆量子化精度を変更する点に特徴を有している。
【0115】
したがって、先に図1、2に示した画像情報符号化装置10及び画像情報復号装置30と同様の構成については同一符号を付して詳細な説明を省略し、以下では、低域精度変更部51,52,61における処理について説明する。なお、低域精度変更部51,52,61の動作原理は同様であるため、以下では低域精度変更部51の動作原理についてのみ説明する。
【0116】
低域精度変更部51においては、画像圧縮情報中に格納される、マクロブロックごとの量子化のための媒介変数QPを元に、4×4離散コサイン変換係数の指定された成分に対して、以下の式(23)に示すような変数QQP(i,j)が定義される。
【0117】
【数24】
Figure 0004254147
【0118】
量子化/逆量子化処理に関しては、上述したJVTにおけるQ(QP%6,i,j)及びR(QP%6,i,j)に代え、指定された成分毎に、Q(QQP%6,i,j)及びR(QQP%6,i,j)を用いて、JVTと同様の処理を行う。
【0119】
なお、QPのダイナミックレンジは0〜51であるが、上述した式(23)においては、QQP(i,j)の値がこのダイナミックレンジから外れる可能性がある。そこで、QQP(i,j)の値が51を超えた場合にはQQP(i,j)=51とし、0を下回った場合にはQQP(i,j)=0とする。
【0120】
ここで、低域精度変更部51では、予測モード、量子化ステップサイズを変更する直交変換係数、及び量子化ステップサイズの各々の項目の組み合わせに準拠する構文を定義することができる。
【0121】
すなわち、例えば予測モードについては、16×16予測モード及び/又は4×4予測モード、或いはユーザが指定した上記予測モードの任意の組み合わせについての構文を定義することができる。
【0122】
また、量子化ステップサイズを変更する直交変換係数については、例えば図7左の斜線で示すようにDC係数のみを変更するモード1、図7中央の斜線で示すようにDC係数及び低域のAC係数2個を変更するモード2、図7右の斜線で示すようにDC係数及び低域のAC係数5個を変更するモード3、或いはユーザが指定した直交変換係数についての構文を定義することができる。
【0123】
また、量子化ステップサイズとしては、デフォルト値(例えば−6)や、ユーザが設定したオフセット値(offset_QP)についての構文を定義することができる。また、ユーザが指定した変数QQPの絶対値についての構文を定義するようにしても構わない。
【0124】
上述した予測モード、量子化ステップサイズを変更する直交変換係数、及び量子化ステップサイズについての情報を画像圧縮情報中に埋め込むための構文の例を図8に示す。なお、構文がこの例に限定されないのは勿論であり、上述した項目の任意の組み合わせに準拠する構文を定義することができる。
【0125】
図8において、load_16x16, load_4x4は、それぞれ当該ピクチャで、輝度信号及び色差信号に対するイントラマクロブロック及びインターマクロブロックにおいて、デフォルトで定められた以外の媒介変数QPが用いられるか否かを示す1ビットのフラグであり、その値が1を取るとき、当該ピクチャにおいてはデフォルト以外のQPが用いられる。
【0126】
例えばload_16x16の値が1であった場合、後続のoffset_QPにおいて、4ビットで表された媒介変数QPのオフセット値に関する情報が埋め込まれる。さらに、後続のcoef_numにおいて、2ビットで表された量子化ステップサイズを変更する直交変換係数に関する情報、例えば上述の図7におけるモード1乃至モード3の何れかに関する情報が埋め込まれる。
【0127】
なお、上述のように、それぞれの成分が必ずしも4ビットである必要はなく、8ビット又は12ビット等で表されてもよい。
【0128】
また、絶対値を取り、又は可変長符号化若しくは算術符号化等の可逆符号化を施すことにより、offset_QPに関する情報を圧縮してもよい。
【0129】
また、上述の説明では、入力としてそれぞれの画素値が8ビットで表される画像情報を対象にしているが、例えばそれぞれの画素値が10ビットで表される画像情報に対しても拡張可能である。
【0130】
以上説明したように、画像情報符号化装置50及び画像情報復号装置60によれば、低域直交変換係数についてのみ、量子化ステップサイズを指定するための媒介変数QPに対してオフセット値(offset_QP)を与えることにより、視覚的に劣化の目立ちやすい低域直交変換係数の量子化精度を上げ、復号画像の画質を向上させることが可能となる。
【0131】
ところで、上述の説明では、マクロブロックごとの量子化のための媒介変数QPに対して、4×4離散コサイン変換係数のそれぞれの成分、或いは指定された成分について重み付け処理を行うことで、視覚特性を考慮した量子化を実現しており、重み付け処理機能を有していることを前提としていた。
【0132】
しかしながら、JVTにおいて重み付け処理機能がない場合であっても、以下に説明するように、入力値の零近傍の直交変換係数について視覚特性を考慮したデッドゾーンを算出することによっても、上述と同様の効果を奏することができる。
【0133】
このようなデッドゾーン算出処理を行う本発明の実施の形態における画像情報符号化装置の概略構成を図9に示す。図9に示すように、画像情報符号化装置70の基本構成は、先に図1に示した画像情報符号化装置10と同様とするが、重み付け部16,20の代わりにデッドゾーン算出部71を備えており、視覚特性を考慮したデッドゾーンを算出する点に特徴を有している。
【0134】
したがって、先に図1に示した画像情報符号化装置10と同様の構成については同一符号を付して詳細な説明を省略し、以下では、このデッドゾーン算出部71におけるデッドゾーン算出処理についてのみ説明する。
【0135】
デッドゾーン算出部70においては、直交変換係数毎に以下の式(24)に従ってデッドゾーンの閾値T(i,j)を求める。
【0136】
【数25】
Figure 0004254147
【0137】
ここで、式(24)において、fはイントラマクロブロックでは215+QQP/6/3、インターマクロブロックでは215+QQP/6/6とし、量子化される直交変換係数Yと同じ正負の符号を持つとする。また、QQPは、前述した重み付け処理で用いたWintra(i,j)及びWinter(i,j)(i,j=0,1,2,3)等を用いて、算出したものとする。
【0138】
このように算出されたデッドゾーンの閾値T(i,j)を用いて、入力値Y(i,j)の絶対値がT(i,j)の絶対値よりも小さい場合、量子化値Y(i,j)を0とする。
【0139】
同様に、輝度のDC成分をさらに4×4単位のブロックに集めてアダマール変換を施した直交変換係数Y(i,j)については、以下の式(25)に従ってデッドゾーンの閾値T(i,j)を算出する。また、色差のDC成分をさらに2×2単位のブロックに集めてアダマール変換を施した直交変換係数Y(i,j)については、以下の式(26)に従ってデッドゾーンの閾値T(i,j)を算出する。
【0140】
【数26】
Figure 0004254147
【0141】
そして、入力値Y(i,j)の絶対値がT(i,j)の絶対値よりも小さい場合、量子化値YDQ(i,j)を0とする。
【0142】
入力値Y(i,j)と量子化値Y(i,j)との対応グラフを図10に示す。図10に示すように、本実施の形態の対応グラフ(a)におけるデッドゾーンの閾値T(i,j)は、重み行列W(i,j)で重み付け処理を行った場合の対応グラフ(b)における量子化値がゼロとなる入力値の範囲において、同様に量子化値がゼロとなるように算出されている。
【0143】
以上説明したように、本実施の形態における画像情報符号化装置70によれば、視覚特性を考慮した重み付け処理のデッドゾーンと同等のデッドゾーンを算出することができ、視覚特性を考慮した量子化処理を行うことが可能となる。
【0144】
また、このような視覚特性を考慮したデッドゾーンを算出する手法では、従来通りのJVT復号器で復号処理を行えるため、処理量の増加を伴わないという利点がある。
【0145】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0146】
例えば、本発明による手法は、任意の変換方式に適用可能である。すなわち、演算精度や、整数変換の変換マトリクスに依存せず、同様に適用可能である。
【0147】
また、本発明は、変換ブロックのサイズに依存せず、任意のサイズの変換に対して同様に適用可能である。また、4×4,4×8、8×4、8×8,16×16の任意のブロックサイズで適応的に周波数変換を行う適応可変ブロックサイズ変換方式にも同様に適用可能である。
【0148】
また、本発明、任意の処理をCPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
【0149】
【発明の効果】
以上詳細に説明したように本発明に係る画像情報符号化方法は、入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するものである。
【0150】
このような画像情報符号化方法では、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、例えば高域直交変換係数ほど量子化の出力が0となる入力の範囲であるデッドゾーンが広くなるように、直交変換係数の成分毎にデッドゾーンに対して所定の変更が加えられる。
【0151】
これにより、視覚特性を考慮した重み付け処理のデッドゾーンと同等のデッドゾーンを算出することができ、視覚特性を考慮した量子化処理を行うことが可能となる。
【0152】
また、本発明に係る画像情報符号化装置は、力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備える。
【0153】
このような画像情報符号化装置は、量子化の際の量子化ステップサイズに対する仮想的な重み付け処理を考慮して、例えば高域直交変換係数ほど量子化の出力が0となる入力の範囲であるデッドゾーンが広くなるように、直交変換係数の成分毎にデッドゾーンに対して所定の変更を加える。
【0154】
これにより、視覚特性を考慮した重み付け処理のデッドゾーンと同等のデッドゾーンを算出することができ、視覚特性を考慮した量子化処理を行うことが可能となる。
【0155】
また、本発明に係るプログラムは、上述した画像情報符号化処理をコンピュータに実行させるものであり、本発明に係る記録媒体は、そのようなプログラムプログラムが記録されたコンピュータ読み取り可能なものである。
【0156】
このようなプログラム及び記録媒体によれば、上述した画像情報符号化処理をソフトウェアにより実現することができる。
【図面の簡単な説明】
【図1】本実施の形態の説明に供する画像情報符号化装置の概略構成を説明する図である。
【図2】本実施の形態の説明に供する画像情報復号装置の概略構成を説明する図である。
【図3】同画像情報符号化装置の重み付け部に格納されている重み行列のデフォルト値を説明する図であり、同図(A)は、イントラマクロブロック用又は輝度信号用の重み行列を示し、同図(B)は、非イントラマクロブロック用又は色差信号用の重み行列を示す。
【図4】重み行列に関する情報を画像圧縮情報中に埋め込むための構文の例を説明する図である。
【図5】本実施の形態の説明に供する画像情報符号化装置の概略構成の他の例を説明する図である。
【図6】本実施の形態の説明に供する画像情報復号装置の概略構成の他の例を説明する図である。
【図7】量子化ステップサイズを変更する直交変換係数の例を示す図である。
【図8】予測モード、量子化ステップサイズを変更する直交変換係数、及び量子化ステップサイズについての情報を画像圧縮情報中に埋め込むための構文の例を説明する図である。
【図9】本実施の形態における画像情報符号化装置の概略構成を説明する図である。
【図10】同画像情報符号化装置の量子化部における入力値と量子化値との対応グラフを示す図である。
【図11】直交変換と動き補償とにより画像圧縮を実現する従来の画像情報符号化装置の概略構成を説明する図である。
【図12】直交変換と動き補償により圧縮された画像圧縮情報を復号する従来の画像情報復号装置の概略構成を説明する図である。
【図13】MPEG2において定められた、intra_dc_precisionと、ビット精度、逆量子化係数及びDC予測リセット値との関係を説明する図である。
【図14】MPEG2で定められているイントラマクロブロックとインターマクロブロックとに対する量子化行列のデフォルト値を説明する図である。
【図15】 MPEG2 Test Model 5において定められている非イントラマクロブロックに対する量子化行列を説明する図である。
【図16】MPEG2における、量子化スケール(quantiser_scale)、ピクチャ単位で設定される媒介変数q_scale_type、及びマクロブロック単位で設定される量子化スケールコードquantiser_scale_codeの関係を説明する図である。
【符号の説明】
10,50,70 画像情報符号化部、11 A/D変換部、12 画面並べ替えバッファ、13 加算器、14 直交変換部、15 量子化部、16 重み付け部、17 可逆符号化部、18 蓄積バッファ、19 逆量子化部、20 重み付け部、21 逆直交変換部、22 フレームメモリ、23 動き予測・補償部、24 レート制御部、30,60 画像情報復号装置、31 蓄積バッファ、32 可逆復号部、33 逆量子化部、34 重み付け部、35 逆直交変換部、36 加算器、37 画面並べ替えバッファ、38 D/A変換部、39動き予測・補償部、40 フレームメモリ、51,52,61 低域精度変更部、71 デッドゾーン算出部[0001]
BACKGROUND OF THE INVENTION
  The present invention relates to MPEG (Moving Picture Experts Group), H.264. Receives image information (bitstream) compressed by orthogonal transformation such as discrete cosine transformation or Karhunen-Labe transformation and motion compensation, such as 26x, via network media such as satellite broadcasting, cable TV, or the Internet. Image information encoding method and apparatus used when processing on a storage medium such as an optical disk, a magnetic disk or a flash memory, andProgram andThe present invention relates to a recording medium.
[0002]
[Prior art]
In recent years, MPEG treats image information as digital and compresses it by orthogonal transform such as discrete cosine transform and motion compensation using the unique redundancy of image information for the purpose of efficient transmission and storage of information. And the like are being used for both information distribution at broadcast stations and information reception in general households.
[0003]
In particular, MPEG2 (ISO / IEC 13818-2) is defined as a general-purpose image coding system, and is a standard that covers both interlaced and progressively scanned images, standard resolution images, and high-definition images. And widely used in a wide range of applications for consumer use. By using the MPEG2 compression method, for example, a standard resolution interlaced scanning image having 720 × 480 pixels is 4 to 8 Mbps, and a high resolution interlaced scanning image having 1920 × 1088 pixels is 18 to 22 Mbps. (Bit rate) can be assigned to achieve a high compression rate and good image quality.
[0004]
MPEG2 was mainly intended for high-quality encoding suitable for broadcasting, but did not support encoding methods with a lower code amount (bit rate) than MPEG1, that is, a higher compression rate. With the widespread use of mobile terminals, the need for such an encoding system is expected to increase in the future, and the MPEG4 encoding system has been standardized in response to this need. Regarding the image coding system, the standard was approved as an international standard as ISO / IEC 14496-2 in December 1998.
[0005]
Furthermore, in recent years, standardization of a standard called JVT (ITU-T Q6 / 16 VCEG) has been progressing with the initial purpose of image coding for video conferencing. This JVT is known to achieve higher encoding efficiency than the conventional encoding schemes such as MPEG2 and MPEG4, although a large amount of calculation is required for encoding and decoding. Also, as part of the MPEG4 activity, standardization that realizes higher coding efficiency by incorporating functions that are not supported by JVT based on this JVT is now being performed as Joint Model of Enhanced-Compression Video Coding.
[0006]
Here, FIG. 11 shows a schematic configuration of an image information encoding apparatus that realizes image compression by orthogonal transformation such as discrete cosine transformation or Karhunen-Labe transformation and motion compensation. As illustrated in FIG. 11, the image information encoding device 100 includes an A / D conversion unit 101, a screen rearrangement buffer 102, an adder 103, an orthogonal transformation unit 104, a quantization unit 105, and a lossless encoding. Unit 106, accumulation buffer 107, inverse quantization unit 108, inverse orthogonal transform unit 109, frame memory 110, motion prediction / compensation unit 111, and rate control unit 112.
[0007]
In FIG. 11, an A / D converter 101 converts an input image signal into a digital signal. Then, the screen rearrangement buffer 102 rearranges the frames according to the GOP (Group of Pictures) structure of the compressed image information output from the image information encoding device 100. Here, the screen rearrangement buffer 102 supplies the image information of the entire frame to the orthogonal transform unit 104 regarding the image on which intra (intra-image) encoding is performed. The orthogonal transform unit 104 performs orthogonal transform such as discrete cosine transform or Karhunen-Loeve transform on the image information, and supplies the obtained orthogonal transform coefficient to the quantization unit 105. The quantization unit 105 performs a quantization process on the orthogonal transform coefficient supplied from the orthogonal transform unit 104.
[0008]
The lossless encoding unit 106 performs lossless encoding such as variable length encoding and arithmetic encoding on the quantized orthogonal transform coefficient, and supplies the encoded orthogonal transform coefficient to the accumulation buffer 107 for accumulation. . The encoded orthogonal transform coefficient is output as image compression information.
[0009]
The behavior of the quantization unit 105 is controlled by the rate control unit 112. Further, the quantization unit 105 supplies the quantized orthogonal transform coefficient to the inverse quantization unit 108, and the inverse quantization unit 108 inversely quantizes the orthogonal transform coefficient. The inverse orthogonal transform unit 109 performs inverse orthogonal transform processing on the inversely quantized orthogonal transform coefficients to generate decoded image information, and supplies the information to the frame memory 110 for accumulation.
[0010]
On the other hand, the screen rearrangement buffer 102 supplies image information to the motion prediction / compensation unit 111 for an image on which inter (inter-image) encoding is performed. The motion prediction / compensation unit 111 extracts image information that is referred to at the same time from the frame memory 110 and performs motion prediction / compensation processing to generate reference image information. The motion prediction / compensation unit 111 supplies the reference image information to the adder 103, and the adder 103 converts the reference image information into a difference signal from the image information. In addition, the motion compensation / prediction unit 111 supplies motion vector information to the lossless encoding unit 106 at the same time.
[0011]
The lossless encoding unit 106 performs lossless encoding processing such as variable length encoding or arithmetic encoding on the motion vector information, and forms information to be inserted into the header portion of the image compression information. The other processing is the same as the image compression information subjected to intra coding, and thus description thereof is omitted.
[0012]
Next, a schematic configuration of an image information decoding apparatus corresponding to the above-described image information encoding apparatus 100 is shown in FIG. As illustrated in FIG. 12, the image information decoding device 120 includes an accumulation buffer 121, a lossless decoding unit 122, an inverse quantization unit 123, an inverse orthogonal transform unit 124, an adder 125, and a screen rearrangement buffer 126. , A D / A conversion unit 127, a motion prediction / compensation unit 128, and a frame memory 129.
[0013]
In FIG. 12, the accumulation buffer 121 temporarily stores input image compression information, and then transfers it to the lossless decoding unit 14. The lossless decoding unit 122 performs processing such as variable length decoding or arithmetic decoding on the compressed image information based on the determined format of the compressed image information, and supplies the quantized orthogonal transform coefficient to the inverse quantization unit 123. To do. Further, when the frame is inter-coded, the lossless decoding unit 122 also decodes the motion vector information stored in the header portion of the image compression information, and the information is motion prediction / compensation unit 128. To supply.
[0014]
The inverse quantization unit 123 performs inverse quantization on the quantized orthogonal transform coefficient supplied from the lossless decoding unit 122 and supplies the obtained orthogonal transform coefficient to the inverse orthogonal transform unit 124. The inverse orthogonal transform unit 124 performs inverse orthogonal transform such as inverse discrete cosine transform or inverse Karhunen-Loeve transform on the orthogonal transform coefficient based on the determined format of the image compression information.
[0015]
Here, if the frame is intra-coded, the image information subjected to the inverse orthogonal transform processing is stored in the screen rearrangement buffer 126 and is subjected to D / A conversion in the D / A conversion unit 127. Output after processing.
[0016]
On the other hand, when the frame is inter-coded, the motion prediction / compensation unit 128 refers to the motion vector information subjected to the lossless decoding process and the image information stored in the frame memory 129. An image is generated and supplied to the adder 125. The adder 125 synthesizes the reference image and the output of the inverse orthogonal transform unit 124. The other processing is the same as that of the intra-encoded frame, and thus description thereof is omitted.
[0017]
By the way, in the MPEG2 video standard, the direct definition for quantization is not made, but the detailed definition is made only for inverse quantization. Therefore, when actual quantization is performed, several parameters included in the quantization rule are changed, and the quantization characteristics are changed within the range of the degree of freedom, thereby improving the image quality and visualizing. Encoding that reflects the characteristics is performed. Hereinafter, the inverse quantization process in MPEG2 will be described.
[0018]
In the MPEG2 video standard, in the DC coefficient quantization of an intra macroblock, it is possible to specify the quantization accuracy in units of pictures, and in the quantization of other coefficients, each quantization matrix that can be specified in units of pictures. The quantization accuracy of each coefficient can be controlled by a value obtained by multiplying an element by a quantization scale that can be specified in units of macroblocks.
[0019]
The DC coefficient of the intra macroblock is inversely quantized according to the following equation (1).
[0020]
[Formula 6]
Figure 0004254147
[0021]
Here, in Expression (1), F ″ [0] [0] indicates the quantized representative value of the DC coefficient value, and QF [0] [0] indicates the quantized representative value level number of the DC coefficient value. Also, intra_dc_mult is a value determined by the relationship shown in FIG. 13 according to intra_dc_precision, which is a parameter that can be set in units of pictures in order to specify DC coefficient quantization accuracy.
[0022]
In MPEG1, the intra_dc_precision is only an accuracy corresponding to 0 (equivalent to 8-bit accuracy). However, this accuracy is insufficient to encode an image whose luminance level changes slowly with high image quality. Met. Therefore, in MPEG2, as shown in FIG. 13, it is possible to specify DC coefficient quantization accuracy equivalent to 8 to 11 bit accuracy using this parameter. However, except for the High profile that can be used in the 4: 2: 2 format and has a high level of required image quality, the maximum 10-bit accuracy is sufficient and is limited to the 8-10-bit accuracy.
[0023]
Further, the other coefficients of the intra macroblock are inversely quantized according to the following equation (2).
[0024]
[Expression 7]
Figure 0004254147
[0025]
Here, in Expression (2), F ″ [u] [v] represents the quantized representative value of the (u, v) coefficient value, and QF [u] [v] represents the (u, v) coefficient value. The k representative value level number is defined by the following equation (3).
[0026]
[Equation 8]
Figure 0004254147
[0027]
In the above-described equation (2), W [w] [u] [v] and quantizer_scale indicate a quantization matrix and a quantization scale, respectively, and the quantization characteristics are controlled by these parameters.
[0028]
The parameter k is 1, 0, −1 in the non-intra macroblock depending on the sign of QF [u] [v]. For example, when QF [u] [v] is −2, −1, 0, 1, 2, F ″ [u] [v] is −5 m, −3 m, 0, 3 m, 5 m (m is Constant), and a dead zone is provided near zero.
[0029]
Incidentally, the quantization matrix is a matrix provided for setting the relative quantization accuracy between discrete cosine transform coefficient values in the block. By using this quantization matrix, for example, it is possible to coarsely quantize high-frequency discrete cosine coefficient values that are visually inconspicuous compared with low-frequency discrete cosine coefficients that are visually inconspicuous. The quantization characteristic can be matched with the visual characteristic. Note that the quantization matrix can be set in units of pictures.
[0030]
In the case of the MPEG2 and MPEG2 4: 2: 0 formats, two types of quantization matrices for intra macroblocks and non-intra macroblocks can be set, 4: 2: 2 format and 4: 4: 4 format. In this case, a total of four types of quantization matrices can be set independently for the luminance signal and the color difference signal. Note that w (0, 1, 2, 3) in W [w] [u] [v] means one of four types of matrices.
[0031]
Here, the default values of the quantization matrix of the intra macroblock and the non-intra macroblock defined in MPEG2 are shown in FIGS. 14A and 14B, respectively. As described above, the quantization matrix can be set by the user in units of pictures, but this default value is used when it is not set. As shown in FIG. 14, the default value has a weight only for the intra macroblock.
[0032]
In MPEG2 Test Model 5 (ISO / IEC JTC / SC29 / WG11 / N0400), a quantization matrix as shown in FIG. 15 is defined for a non-intra macroblock. Unlike the default value shown in FIG. 14B, this is a characteristic having a weight.
[0033]
The quantization scale (quantiser_scale) is a parameter for controlling the amount of generated code by scaling the quantization characteristics. The parameter q_scale_type is set for each picture, and the quantization is set for each macroblock. Set by scale code quantiser_scale_code. FIG. 16 shows these relationships.
[0034]
Here, when q_scale_type is 0, linear quantization is performed, and a value twice the quantizer_scale_code (1 to 31) is set to quantizer_scale (2 to 62) as in MPEG1.
[0035]
In addition, when q_scale_type is 1, nonlinear quantization is performed, and quantiser_scale_code (1 to 31) is finer for small quantization scale codes and coarser for large quantization scale codes. In comparison, it is converted into a wide range of quantizer_scale (1-112). This mode is newly introduced in MPEG2, and in particular, when encoding at a high rate, finer quantization scale control is performed in a small quantization scale region, or extremely complicated images are encoded. In this case, a coarser quantization scale can be used, and more stable code amount control can be realized as compared with MPEG1.
[0036]
On the other hand, in JVT, 52 different values of 0 to 51 are used for the parameter QP for performing quantization / inverse quantization. Here, QP is set so that the quantization scale is doubled every time the value increases by six. That is, every time QP increases by 1, the quantization scale increases by about 12%.
[0037]
QP used for color difference componentsCIs the QP used for the luminance componentYIs calculated according to the control table shown in Table 1 below. In the following, unless otherwise noted, QPYWill be referred to as QP.
[0038]
[Table 1]
Figure 0004254147
[0039]
Here, in JVT, encoding based on 4 × 4 discrete cosine transform is performed, but the following calculation is actually performed on the luminance signal and the color difference signal. That is, X = (x00, ... x33) Is a pixel value or difference value, and Y is an orthogonal transform coefficient, a process corresponding to discrete cosine transform as shown in the following equation (4) is executed.
[0040]
[Equation 9]
Figure 0004254147
[0041]
Next, as a quantization process, a process as shown in the following equation (5) is executed.
[0042]
[Expression 10]
Figure 0004254147
[0043]
Here, in equation (5), YQIndicates a quantized orthogonal transform coefficient, and Q indicates a quantization coefficient corresponding to the quantization step size. F is 2 for an intra macroblock.15 + QP / 6/ 3, 2 for inter macroblock15 + QP / 6/ 6 and have the same positive / negative sign as the orthogonal transform coefficient Y to be quantized. Q is defined as shown below.
Q [QP% 6] [i] [j] = quantMat [QP% 6] [0] for (i, j) = {(0,0), (0,2), (2,0), (2 , 2)},
Q [QP% 6] [i] [j] = quantMat [QP% 6] [1] for (i, j) = {(1,1), (1,3), (3,1), (3 , 3)},
Q [QP% 6] [i] [j] = quantMat [QP% 6] [2] otherwise.
quantMat [6] [3] = {{13107, 5243, 8224}, {11651, 4660, 7358}, {10486, 4143, 6554}, {9198, 3687, 5825}, {8322, 3290, 5243}, { 7384, 2943, 4660}}
[0044]
Further, as an inverse quantization process after quantization, a process as shown in the following formula (6) is executed.
[0045]
## EQU11 ##
Figure 0004254147
[0046]
Here, in Expression (6), R represents an inverse quantization coefficient and is defined as follows.
R [QP% 6] [i] [j] = dequantMat [QP% 6] [0] for (i, j) = {(0,0), (0,2), (2,0), (2 , 2)},
R [QP% 6] [i] [j] = dequantMat [QP% 6] [1] for (i, j) = {(1,1), (1,3), (3,1), (3 , 3)},
R [QP% 6] [i] [j] = dequantMat [QP% 6] [2] otherwise.
dequantMat [6] [3] = {{10, 16, 13}, {11, 18, 14}, {13, 20, 16}, {14, 23, 18}, {16, 25, 20}, { 18, 29, 23}}
[0047]
Next, processing as shown in the following equation (7) is executed as the inverse discrete cosine transform processing, and processing as shown in the following equation (8) is executed as the normalization processing.
[0048]
[Expression 12]
Figure 0004254147
[0049]
Finally, the decoded prediction residual value X ″ (i, j) is added to the motion compensated prediction value or the spatial prediction value P (i, j) as shown in the following equation (9), The final decoded pixel value is calculated by clipping in the range of 255.
[0050]
[Formula 13]
Figure 0004254147
[0051]
By the way, in the JVT, in the intra 16 × 16 mode, the DC component of the luminance signal is further collected into 4 × 4 unit blocks and subjected to Hadamard transform to improve the compression rate. Orthogonal transformation and quantization of the 4 × 4 DC component of the luminance signal are performed based on the following method.
[0052]
First, 16 luminance signal DC components of orthogonal transform coefficients calculated by 4 × 4 transform are collected to obtain an input matrix X of 4 × 4 units.DAs a process corresponding to the Hadamard transform, a process as shown in the following formula (10) is executed.
[0053]
[Expression 14]
Figure 0004254147
[0054]
Next, as a quantization process, a process as shown in the following formula (11) is executed.
[0055]
[Expression 15]
Figure 0004254147
[0056]
Further, as a process corresponding to the inverse Hadamard transform, a process as shown in the following formula (12) is executed.
[0057]
[Expression 16]
Figure 0004254147
[0058]
Next, when QP is 12 or more, processing as shown in the following equation (13) is performed as inverse quantization processing. When QP is less than 12, as inverse quantization processing, Processing as shown in the following formula (14) is executed.
[0059]
[Expression 17]
Figure 0004254147
[0060]
In JVT, the DC component of the color difference signal is further collected in a 2 × 2 pixel block and subjected to Hadamard transform to improve the compression rate. The orthogonal transformation and quantization of the 2 × 2 DC component of the color difference signal are performed based on the following method.
[0061]
First, four color difference DC components are collected to obtain an input matrix X of 2 × 2 pixels.DAs a process corresponding to the Hadamard transform, a process as shown in the following equation (15) is executed.
[0062]
[Formula 18]
Figure 0004254147
[0063]
Next, as a quantization process, a process as shown in the following equation (16) is executed.
[0064]
[Equation 19]
Figure 0004254147
[0065]
Further, as a process corresponding to the inverse Hadamard transform, a process as shown in the following equation (17) is executed.
[0066]
[Expression 20]
Figure 0004254147
[0067]
Next, when QP is 6 or more, processing as shown in the following equation (18) is executed as inverse quantization processing. When QP is less than 6, as inverse quantization processing, Processing as shown in the following equation (19) is executed.
[0068]
[Expression 21]
Figure 0004254147
[0069]
Note that a series of processes of orthogonal transform and quantization is standardized so that overflow does not occur in 16-bit operations.
[0070]
[Problems to be solved by the invention]
By the way, in the quantization / inverse quantization defined by the above-mentioned JVT, functions related to the weighting of orthogonal transform coefficients using a quantization matrix and the dead zone in the quantization process, as defined in MPEG2. Since it is not included, efficient quantization based on visual characteristics cannot be performed.
[0071]
  The present invention has been proposed in view of such conventional situations, and image information that realizes high-efficiency compression at a low bit rate by providing a dead zone in consideration of visual characteristics and performing quantization. Encoding method and apparatus, and computer to execute such image information encoding processProgram and itsAn object of the present invention is to provide a computer-readable recording medium on which a program is recorded.
[0072]
[Means for Solving the Problems]
  In order to achieve the above-described object, an image information encoding method according to the present invention is an image information encoding method in which an input image signal is blocked and subjected to orthogonal transformation in units of the block to perform quantization. For the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the blockIn consideration of the virtual weighting process for the quantization step size at the time of the quantization, a change was made for each component of the orthogonal transform coefficient.Set dead zoneThe block that is a unit of the orthogonal transformation is composed of 4 × 4 pixels, and the orthogonal transformation coefficient component Y (i) is used for the parameter QP for designating the quantization step size Q. , J) using a variable QQP (i, j) obtained by adding the weighting array W (i, j) for each
  T (i, j) = (2 15 + QQP / 6 -F) / Q ( i, j = 0,1,2,3 )
  Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and has the same positive / negative sign as Y (i, j) above
When the threshold value T (i, j) is calculated and the absolute value of the Y (i, j) is smaller than the absolute value of the T (i, j), the quantum of the Y (i, j) Output is set to 0Is.
  The image information encoding method according to the present invention is an image information encoding method in which an input image signal is blocked and subjected to orthogonal transform in units of blocks to perform quantization. A dead zone in which a predetermined change is added to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient is set, and the dead zone is a DC of the luminance signal after the quantization Considering a virtual weighting process for the quantization step size when quantizing each DC component of a block of 4 × 4 pixels configured by collecting components, a change is made for each DC component, For the parameter QP for specifying the quantization step size Q, the DC component Y D Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
  T D (I, j) = (2 16 + QQP / 6 -2 · f) / Q ( i, j = 0,1,2,3 )
  Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and above Y D Has the same sign as (i, j)
Threshold T D (I, j) is calculated and Y D The absolute value of (i, j) is T D Y is smaller than the absolute value of (i, j) D The quantized output of (i, j) is 0.
  The image information encoding method according to the present invention is an image information encoding method in which an input image signal is blocked and subjected to orthogonal transform in units of blocks to perform quantization. A dead zone in which a predetermined change is added to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient is set, and the dead zone is a DC of the color difference signal after the quantization Considering a virtual weighting process for the quantization step size when quantizing each DC component of a block of 2 × 2 pixels configured by collecting components, a change is made for each DC component, For the parameter QP for specifying the quantization step size Q, the DC component Y D Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
  T D (I, j) = (2 16 + QQP / 6 -2 · f) / Q ( i, j = 0,1 )
  Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and above Y D Has the same sign as (i, j)
Threshold T D (I, j) is calculated and Y D The absolute value of (i, j) is T D Y is smaller than the absolute value of (i, j) D The quantized output of (i, j) is 0.
[0073]
In such an image information encoding method, in consideration of a virtual weighting process for the quantization step size at the time of quantization, for example, a higher-frequency orthogonal transform coefficient is an input range in which the quantization output is 0. A predetermined change is applied to the dead zone for each component of the orthogonal transform coefficient so that the dead zone becomes wider.
[0074]
  In order to achieve the above-described object, an image information encoding device according to the present invention is an image information encoding device that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization. During quantization, the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the blockIn consideration of the virtual weighting process for the quantization step size at the time of the quantization, a change was made for each component of the orthogonal transform coefficient.Provided with dead zone setting means to set dead zoneThe block which is a unit of the orthogonal transform is composed of 4 × 4 pixels, and the dead zone setting means is configured to generate a component Y of the orthogonal transform coefficient with respect to the parameter QP for designating the quantization step size Q. Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
  T (i, j) = (2 15 + QQP / 6 -F) / Q ( i, j = 0,1,2,3 )
  Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and has the same positive / negative sign as Y (i, j) above
When the threshold value T (i, j) is calculated and the absolute value of the Y (i, j) is smaller than the absolute value of the T (i, j), the quantum of the Y (i, j) Set the output to 0.
  The image information encoding apparatus according to the present invention is an image information encoding apparatus that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization. A dead zone setting means for setting a dead zone in which a predetermined change is made to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient, wherein the dead zone is a luminance signal after the quantization Considering a virtual weighting process for the quantization step size when quantizing each DC component of a block of 4 × 4 pixels configured by collecting the DC components, changes are made for each DC component. The dead zone setting means outputs the DC component Y to the parameter QP for designating the quantization step size Q. D Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
  T D (I, j) = (2 16 + QQP / 6 -2 · f) / Q ( i, j = 0,1,2,3 )
  Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and above Y D Has the same sign as (i, j)
Threshold T D (I, j) is calculated and Y D The absolute value of (i, j) is T D Y is smaller than the absolute value of (i, j) D The quantized output of (i, j) is set to 0.
  The image information encoding apparatus according to the present invention is an image information encoding apparatus that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization. A dead zone setting unit that sets a dead zone obtained by adding a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient, and the dead zone includes the color difference signal after the quantization Considering a virtual weighting process for the quantization step size when quantizing each DC component of a block of 2 × 2 pixels configured by collecting the DC components, changes are made for each DC component. The dead zone setting means outputs the DC component Y to the parameter QP for designating the quantization step size Q. D Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
  T D (I, j) = (2 16 + QQP / 6 -2 · f) / Q ( i, j = 0,1 )
  Where f is 2 for intra macroblocks. 15 + QQP / 6 / 3, 2 for inter macroblock 15 + QQP / 6 / 6 and above Y D Has the same sign as (i, j)
Threshold T D (I, j) is calculated and Y D The absolute value of (i, j) is T D Y is smaller than the absolute value of (i, j) D The quantized output of (i, j) is set to 0.
[0075]
Such an image information encoding device has a range of inputs in which the quantization output becomes 0 as the high-frequency orthogonal transform coefficient in consideration of virtual weighting processing for the quantization step size at the time of quantization, for example. A predetermined change is added to the dead zone for each component of the orthogonal transform coefficient so that the dead zone becomes wider.
[0076]
  Also,A program according to the present invention causes a computer to execute the above-described image information encoding process,The recording medium according to the present invention islike thatA computer-readable program on which the program is recorded.
[0077]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings. In this embodiment, the present invention is applied to an image information encoding method and apparatus for realizing high-efficiency compression at a low bit rate by providing a dead zone in consideration of visual characteristics and performing quantization. It is. Specifically, in the image information coding method and apparatus according to the present embodiment, a dead zone is generated for each orthogonal transform coefficient component in consideration of a virtual weighting process for the quantization step size at the time of quantization. Calculated.
[0078]
Therefore, in the following, before describing the image information encoding method and the method according to the present embodiment, an image information encoding apparatus and image information for performing quantization and inverse quantization by actually weighting the quantization step size. A decoding apparatus will be described.
[0079]
First, FIG. 1 shows a schematic configuration of an image information encoding apparatus used for explaining the present embodiment. As illustrated in FIG. 1, the image information encoding device 10 includes an A / D conversion unit 11, a screen rearrangement buffer 12, an adder 13, an orthogonal transformation unit 14, a quantization unit 15, and a weighting unit 16. A lossless encoding unit 17, a storage buffer 18, an inverse quantization unit 19, a weighting unit 20, an inverse orthogonal transform unit 21, a frame memory 22, a motion prediction / compensation unit 23, and a rate control unit 24. It is comprised by.
[0080]
In FIG. 1, an A / D converter 11 converts an input image signal into a digital signal. Then, the screen rearrangement buffer 12 rearranges frames according to the GOP (Group of Pictures) structure of the compressed image information output from the image information encoding device 10. Here, the screen rearrangement buffer 12 supplies the image information of the entire frame to the orthogonal transform unit 14 for the image on which intra (intra-image) encoding is performed. The orthogonal transform unit 14 performs orthogonal transform such as discrete cosine transform or Karhunen-Loeve transform on the image information, and supplies the obtained orthogonal transform coefficient to the quantization unit 15.
[0081]
The quantization unit 15 performs a quantization process on the orthogonal transform coefficient supplied from the orthogonal transform unit 14. At that time, the weighting unit 16 that is a component of the quantization unit 15 performs weighting of the parameter QP for designating the quantization step size for each component of the orthogonal transform coefficient as described later.
[0082]
The lossless encoding unit 17 performs lossless encoding such as variable length encoding or arithmetic encoding on the quantized orthogonal transform coefficient, and supplies the encoded orthogonal transform coefficient to the accumulation buffer 18 for accumulation. . The encoded orthogonal transform coefficient is output as image compression information.
[0083]
The behavior of the quantization unit 15 is controlled by the rate control unit 24. Further, the quantization unit 15 supplies the quantized orthogonal transform coefficient to the inverse quantization unit 19, and the inverse quantization unit 19 performs inverse quantization on the orthogonal transform coefficient. At that time, the weighting unit 20 as a component of the inverse quantization unit 19 weights the parameter QP for designating the quantization step size for each component of the quantized orthogonal transform coefficient as described later. I do.
[0084]
The inverse orthogonal transform unit 21 performs inverse orthogonal transform processing on the inversely quantized orthogonal transform coefficients to generate decoded image information, and supplies the information to the frame memory 22 for accumulation.
[0085]
On the other hand, the screen rearrangement buffer 12 supplies image information to the motion prediction / compensation unit 23 for an image on which inter (inter-image) encoding is performed. At the same time, the motion prediction / compensation unit 23 extracts the referenced image information from the frame memory 22 and performs motion prediction / compensation processing to generate reference image information.
[0086]
The motion prediction / compensation unit 23 supplies the reference image information to the adder 13, and the adder 13 converts the reference image information into a difference signal from the image information. In addition, the motion compensation / prediction unit 23 supplies motion vector information to the lossless encoding unit 17 at the same time.
[0087]
The lossless encoding unit 17 performs lossless encoding processing such as variable length encoding or arithmetic encoding on the motion vector information, and forms information to be inserted into the header portion of the image compression information. The other processing is the same as the image compression information subjected to intra coding, and thus description thereof is omitted.
[0088]
Next, FIG. 2 shows a schematic configuration of an image information decoding apparatus that decodes the compressed image information output from the image information encoding apparatus 10 described above. As shown in FIG. 2, the image information decoding device 30 includes a storage buffer 31, a lossless decoding unit 32, an inverse quantization unit 33, a weighting unit 34, an inverse orthogonal transform unit 35, an adder 36, a screen, The rearrangement buffer 37, the D / A conversion unit 38, the motion prediction / compensation unit 39, and the frame memory 40 are included.
[0089]
In FIG. 2, the accumulation buffer 31 temporarily stores the input image compression information and then transfers it to the lossless decoding unit 32. The lossless decoding unit 32 performs processing such as variable length decoding or arithmetic decoding on the compressed image information based on the determined format of the compressed image information, and supplies the quantized orthogonal transform coefficient to the inverse quantization unit 33. To do. Further, when the frame is inter-coded, the lossless decoding unit 32 also decodes the motion vector information stored in the header portion of the image compression information, and the information is motion prediction / compensation unit 39. To supply.
[0090]
The inverse quantization unit 33 performs inverse quantization on the orthogonal transform coefficient after quantization supplied from the lossless decoding unit 32 and supplies the orthogonal transform coefficient after inverse quantization to the inverse orthogonal transform unit 35. At that time, the weighting unit 34 as a component of the inverse quantization unit 33 weights the parameter QP for designating the quantization step size for each component of the quantized orthogonal transform coefficient as described later. I do. The inverse orthogonal transform unit 35 performs inverse orthogonal transform such as inverse discrete cosine transform or inverse Karhunen-Labe transform on the orthogonal transform coefficient based on the determined format of the image compression information.
[0091]
Here, if the frame is intra-coded, the inverse orthogonal transform unit 35 supplies the image information after the inverse orthogonal transform process to the screen rearrangement buffer 37. The screen rearrangement buffer 37 temporarily stores the image information and then supplies the image information to the D / A conversion unit 38. The D / A conversion unit 38 performs D / A conversion processing on the image information and outputs it.
[0092]
On the other hand, when the frame is inter-coded, the motion prediction / compensation unit 39 refers to the motion vector information subjected to the lossless decoding process and the image information stored in the frame memory 40. Generate an image. The adder 36 combines the reference image and the output of the inverse orthogonal transform unit 35. The other processing is the same as that of the intra-encoded frame, and thus description thereof is omitted.
[0093]
By the way, as described above, in the image information encoding device 10 and the image information decoding device 30, the weighting units 16, 20, and 34 perform the weighting process of the parameter QP for specifying the quantization step size, and the quantum information And dequantization are performed. By this weighting process, it is possible to coarsely quantize the high-frequency orthogonal transform coefficient that is visually less prominent in comparison with the low-frequency orthogonal transform coefficient that is visually less prominent.
[0094]
Therefore, the weighting process will be described below. Since the operation principle of the weighting units 16, 20, and 34 is the same, only the operation principle of the weighting unit 16 will be described below.
[0095]
In the weighting unit 16, for each of the intra macro block and the inter macro block, a W as shown in FIGS. 3A and 3B is provided by default.intra(I, j) and WinterInformation on (i, j) (i, j = 0,1,2,3) is included.
[0096]
In addition, for each of the luminance signal and the color difference signal, W, as shown in FIGS. 3A and 3B, respectively, by default.luma(I, j) and WchromaInformation on (i, j) (i, j = 0,1,2,3) can also be included.
[0097]
In the following, Wintra(I, j) and Winter(I, j) or Wluma(I, j) and WchromaSince the processes related to (i, j) are equivalent, these are expressed as W (i, j) unless otherwise specified.
[0098]
Wintra(I, j) and Winter(I, j) or Wluma(I, j) and Wchroma(I, j) is not limited to the default value shown in FIG. 3, but can be set by the user in units of pictures. At that time, it is possible to embed the value of W (i, j) itself in the compressed image information to be output. However, a difference value is generated, or a lossless encoding method such as variable-length encoding or arithmetic encoding. May be used to reduce the amount of information and be embedded in the output compressed image information.
[0099]
Here, the weighting unit 16 performs the following for each component of the 4 × 4 discrete cosine transform coefficient based on the parameter QP for quantization for each macroblock stored in the image compression information. A variable QQP (i, j) as defined in equation (20) is defined.
[0100]
[Expression 22]
Figure 0004254147
[0101]
Regarding the quantization / inverse quantization process, instead of Q (QP% 6, i, j) and R (QP% 6, i, j) in JVT described above, for each component, Q (QQP% 6, i, j) , j) and R (QQP% 6, i, j), the same processing as JVT is performed.
[0102]
Note that the dynamic range of QP is 0 to 51. However, in the above equation (20), the value of QQP (i, j) may be out of this dynamic range. Therefore, QQP (i, j) = 51 when the value of QQP (i, j) exceeds 51, and QQP (i, j) = 0 when the value is less than 0.
[0103]
Here, as described above, in the image information encoding device 10 and the image information decoding device 30, the weighting matrix used by default is the following expression (21) for both the luminance signal and the color difference signal: It is defined as (22).
[0104]
[Expression 23]
Figure 0004254147
[0105]
Note that the weight matrix actually used for quantization / inverse quantization in the image information encoding device 10 and the image information decoding device 30 is not necessarily the same, and can be set by the user in units of pictures.
[0106]
FIG. 4 shows an example of syntax for embedding information on the weight matrix in the image compression information. In FIG. 4, load_intra_quantiser_matrix, load_non_intra_quantiser_matrix, load_chroma_intra_quantiser_matrix, and load_chroma_non_intra_quantiser_matrix indicate whether or not a weight matrix other than that determined by default is used in the intra macroblock and intermacroblock for the luminance signal and the color difference signal, respectively. When the value is 1, a weight matrix other than the default is used in the picture.
[0107]
For example, when the value of load_intra_quantiser_matrix is 1, information regarding a 4 × 4 weight matrix in which each component is represented by 4 bits is embedded in subsequent intra_quantiser_matrix [16].
[0108]
As described above, each component is not necessarily 4 bits, and may be represented by 8 bits or 12 bits.
[0109]
Further, the information about intra_quantiser_matrix [16] may be compressed by taking the difference or performing lossless encoding such as variable length encoding or arithmetic encoding.
[0110]
In the above description, image information in which each pixel value is represented by 8 bits is targeted as input. However, the present invention can be extended to image information in which each pixel value is represented by 10 bits. is there.
[0111]
As described above, according to the image information encoding device 10 and the image information decoding device 30, the quantization process and the inverse quantization process are performed by performing the weighting process of the parameter QP for specifying the quantization step size. As a result, it is possible to coarsely quantize the high-frequency orthogonal transform coefficient, which is visually inconspicuous, as compared with the low-frequency orthogonal transform coefficient, which is visually inconspicuous.
[0112]
Here, in the above description, the weighting matrix W (i, j) is added to each component of the 4 × 4 discrete cosine transform coefficient to the parameter QP for quantization for each macroblock. Quantization processing and inverse quantization processing were performed using the variable QQP (i, j). However, the present invention is not limited to the example in which the weight matrix W (i, j) is defined for all the components of the 4 × 4 orthogonal transform coefficients as described above, but only for the low-frequency orthogonal transform coefficients that are visually noticeable. An offset value may be given to the parameter QP to perform processing for improving quantization accuracy.
[0113]
Schematic configurations of an image information encoding apparatus that performs such processing and an image information decoding apparatus that decodes compressed image information output from the image encoding apparatus are shown in FIGS. 5 and 6, respectively.
[0114]
As shown in FIG. 5, the basic configuration of the image information encoding device 50 is the same as that of the image information encoding device 10 shown in FIG. 1, but the low frequency accuracy is changed instead of the weighting units 16 and 20. Sections 51 and 52, and is characterized in that the quantization accuracy of the low-frequency orthogonal transform coefficient is changed. 6, the basic configuration of the image information decoding device 60 is the same as that of the image information decoding device 30 previously shown in FIG. 2, but the low frequency accuracy changing unit 61 is used instead of the weighting unit 34. And is characterized by changing the inverse quantization accuracy of the low-frequency orthogonal transform coefficient.
[0115]
Therefore, the same components as those of the image information encoding device 10 and the image information decoding device 30 previously shown in FIGS. 1 and 2 are denoted by the same reference numerals, and detailed description thereof is omitted. Processing in 51, 52, and 61 will be described. Since the operating principle of the low frequency accuracy changing units 51, 52 and 61 is the same, only the operating principle of the low frequency accuracy changing unit 51 will be described below.
[0116]
In the low frequency accuracy changing unit 51, based on the parameter QP for quantization for each macroblock stored in the image compression information, for the component designated by the 4 × 4 discrete cosine transform coefficient, A variable QQP (i, j) as shown in the following equation (23) is defined.
[0117]
[Expression 24]
Figure 0004254147
[0118]
As for the quantization / inverse quantization process, instead of Q (QP% 6, i, j) and R (QP% 6, i, j) in the JVT described above, for each specified component, Q (QQP% 6 , i, j) and R (QQP% 6, i, j), the same processing as JVT is performed.
[0119]
Note that the dynamic range of QP is 0 to 51, but in the above-described equation (23), the value of QQP (i, j) may deviate from this dynamic range. Therefore, QQP (i, j) = 51 when the value of QQP (i, j) exceeds 51, and QQP (i, j) = 0 when the value is less than 0.
[0120]
Here, the low frequency accuracy changing unit 51 can define a syntax that conforms to the combination of each item of the prediction mode, the orthogonal transform coefficient for changing the quantization step size, and the quantization step size.
[0121]
That is, for example, for the prediction mode, the syntax for the 16 × 16 prediction mode and / or the 4 × 4 prediction mode, or any combination of the prediction modes specified by the user can be defined.
[0122]
As for the orthogonal transform coefficient for changing the quantization step size, for example, mode 1 in which only the DC coefficient is changed as shown by the hatched line on the left of FIG. It is possible to define a mode 2 for changing two coefficients, a mode 3 for changing five DC coefficients and five low-frequency AC coefficients as shown by the diagonal lines on the right of FIG. 7, or a syntax for orthogonal transform coefficients specified by the user. it can.
[0123]
Further, as the quantization step size, a syntax for a default value (for example, −6) or an offset value (offset_QP) set by the user can be defined. Moreover, you may make it define the syntax about the absolute value of the variable QQP designated by the user.
[0124]
FIG. 8 shows an example of syntax for embedding information about the prediction mode, the orthogonal transform coefficient for changing the quantization step size, and the quantization step size in the image compression information. Of course, the syntax is not limited to this example, and a syntax conforming to any combination of the above-described items can be defined.
[0125]
In FIG. 8, load_16x16 and load_4x4 are 1-bit bits indicating whether or not a parameter QP other than the default is used in the intra macro block and the inter macro block for the luminance signal and the color difference signal, respectively, in the picture. When the flag has a value of 1, a QP other than the default is used in the picture.
[0126]
For example, when the value of load_16x16 is 1, information regarding the offset value of the parameter QP represented by 4 bits is embedded in the subsequent offset_QP. Further, in the subsequent coef_num, information on the orthogonal transform coefficient for changing the quantization step size represented by 2 bits, for example, information on any of modes 1 to 3 in FIG. 7 described above is embedded.
[0127]
As described above, each component is not necessarily 4 bits, and may be represented by 8 bits or 12 bits.
[0128]
In addition, information regarding offset_QP may be compressed by taking an absolute value or performing lossless encoding such as variable length encoding or arithmetic encoding.
[0129]
In the above description, image information in which each pixel value is represented by 8 bits is targeted as input. However, the present invention can be extended to image information in which each pixel value is represented by 10 bits. is there.
[0130]
As described above, according to the image information encoding device 50 and the image information decoding device 60, the offset value (offset_QP) with respect to the parameter QP for specifying the quantization step size only for the low-frequency orthogonal transform coefficient. Thus, it is possible to increase the quantization accuracy of the low-frequency orthogonal transform coefficient, which is visually noticeable for deterioration, and to improve the image quality of the decoded image.
[0131]
By the way, in the above description, the visual characteristic is obtained by performing the weighting process on each component of the 4 × 4 discrete cosine transform coefficient or the designated component with respect to the parameter QP for quantization for each macroblock. It is assumed that quantization considering the above is realized and has a weighting processing function.
[0132]
However, even if there is no weighting processing function in JVT, as described below, it is also possible to calculate a dead zone in consideration of visual characteristics for orthogonal transform coefficients near zero of the input value as described above. There is an effect.
[0133]
FIG. 9 shows a schematic configuration of an image information encoding apparatus according to an embodiment of the present invention that performs such dead zone calculation processing. As shown in FIG. 9, the basic configuration of the image information encoding device 70 is the same as that of the image information encoding device 10 previously shown in FIG. And is characterized in that a dead zone is calculated in consideration of visual characteristics.
[0134]
Therefore, the same components as those of the image information encoding device 10 shown in FIG. 1 are denoted by the same reference numerals and detailed description thereof is omitted, and only the dead zone calculation process in the dead zone calculation unit 71 will be described below. explain.
[0135]
The dead zone calculation unit 70 obtains a dead zone threshold T (i, j) according to the following equation (24) for each orthogonal transform coefficient.
[0136]
[Expression 25]
Figure 0004254147
[0137]
Here, in Expression (24), f is 2 in the intra macroblock.15 + QQP / 6/ 3, 2 for inter macroblock15 + QQP / 6/ 6 and have the same positive / negative sign as the orthogonal transform coefficient Y to be quantized. QQP is the W used in the weighting process described above.intra(I, j) and WinterIt is assumed that (i, j) (i, j = 0,1,2,3) is used for calculation.
[0138]
If the absolute value of the input value Y (i, j) is smaller than the absolute value of T (i, j) using the dead zone threshold T (i, j) calculated in this way, the quantized value YQLet (i, j) be 0.
[0139]
Similarly, the orthogonal transform coefficient Y obtained by further collecting the DC component of luminance into blocks of 4 × 4 units and performing Hadamard transformDFor (i, j), dead zone threshold T according to equation (25) belowD(I, j) is calculated. Further, the orthogonal transform coefficient Y obtained by further collecting the DC components of the color difference into blocks of 2 × 2 units and performing Hadamard transformDFor (i, j), the dead zone threshold T according to the following equation (26):D(I, j) is calculated.
[0140]
[Equation 26]
Figure 0004254147
[0141]
And the input value YDThe absolute value of (i, j) is TDIf smaller than the absolute value of (i, j), the quantized value YDQLet (i, j) be 0.
[0142]
Input value Y (i, j) and quantized value YQA correspondence graph with (i, j) is shown in FIG. As shown in FIG. 10, the dead zone threshold T (i, j) in the correspondence graph (a) of the present embodiment is the correspondence graph (b) when the weighting process is performed with the weighting matrix W (i, j). In the range of the input value where the quantized value becomes zero, the quantized value is similarly calculated to be zero.
[0143]
As described above, according to the image information encoding device 70 in the present embodiment, a dead zone equivalent to the dead zone of the weighting process considering the visual characteristics can be calculated, and the quantization considering the visual characteristics Processing can be performed.
[0144]
In addition, such a method for calculating a dead zone in consideration of visual characteristics has an advantage that the processing amount is not increased because the conventional JVT decoder can perform the decoding process.
[0145]
It should be noted that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the present invention.
[0146]
For example, the technique according to the present invention can be applied to any conversion method. That is, the present invention can be similarly applied without depending on the calculation accuracy and the conversion matrix of integer conversion.
[0147]
Further, the present invention can be similarly applied to conversion of any size without depending on the size of the conversion block. The present invention is also applicable to an adaptive variable block size conversion method that adaptively performs frequency conversion with any block size of 4 × 4, 4 × 8, 8 × 4, 8 × 8, and 16 × 16.
[0148]
Further, the present invention can realize any processing by causing a CPU (Central Processing Unit) to execute a computer program. In this case, the computer program can be provided by being recorded on a recording medium, or can be provided by being transmitted via the Internet or another transmission medium.
[0149]
【The invention's effect】
As described above in detail, the image information encoding method according to the present invention is an image information encoding method in which an input image signal is blocked and subjected to orthogonal transform in units of the block to perform quantization. In addition, a dead zone is set by adding a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block.
[0150]
In such an image information encoding method, in consideration of a virtual weighting process for the quantization step size at the time of quantization, for example, a higher-frequency orthogonal transform coefficient is an input range in which the quantization output is 0. A predetermined change is applied to the dead zone for each component of the orthogonal transform coefficient so that the dead zone becomes wider.
[0151]
Thereby, a dead zone equivalent to the dead zone of the weighting process considering the visual characteristics can be calculated, and the quantization process considering the visual characteristics can be performed.
[0152]
Also, the image information encoding apparatus according to the present invention blocks an image of a force image, performs orthogonal transform in units of the block, and performs quantization. There is provided a dead zone setting means for setting a dead zone obtained by adding a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient.
[0153]
Such an image information encoding device has a range of inputs in which the quantization output becomes 0 as the high-frequency orthogonal transform coefficient in consideration of virtual weighting processing for the quantization step size at the time of quantization, for example. A predetermined change is added to the dead zone for each component of the orthogonal transform coefficient so that the dead zone becomes wider.
[0154]
Thereby, a dead zone equivalent to the dead zone of the weighting process considering the visual characteristics can be calculated, and the quantization process considering the visual characteristics can be performed.
[0155]
  Also,A program according to the present invention causes a computer to execute the above-described image information encoding process,The recording medium according to the present invention islike thatA computer-readable program having a program recorded thereon.
[0156]
  like thisProgram andAccording to the recording medium, the above-described image information encoding process can be realized by software.
[Brief description of the drawings]
BRIEF DESCRIPTION OF DRAWINGS FIG. 1 is a diagram illustrating a schematic configuration of an image information encoding device provided for explanation of the present embodiment.
[Fig. 2] Fig. 2 is a diagram illustrating a schematic configuration of an image information decoding device provided for explanation of the present embodiment.
FIG. 3 is a diagram for explaining a default value of a weighting matrix stored in a weighting unit of the image information encoding device, and FIG. 3A shows a weighting matrix for an intra macroblock or a luminance signal; FIG. 5B shows a weight matrix for a non-intra macroblock or a color difference signal.
FIG. 4 is a diagram for explaining an example of syntax for embedding information relating to a weight matrix in compressed image information.
FIG. 5 is a diagram for explaining another example of a schematic configuration of an image information encoding device for explaining the present embodiment;
FIG. 6 is a diagram for explaining another example of a schematic configuration of an image information decoding apparatus provided for explanation of the present embodiment;
FIG. 7 is a diagram illustrating an example of orthogonal transform coefficients for changing the quantization step size.
FIG. 8 is a diagram for explaining an example of a syntax for embedding information about a prediction mode, an orthogonal transform coefficient for changing a quantization step size, and a quantization step size in image compression information.
FIG. 9 is a diagram illustrating a schematic configuration of an image information encoding device according to the present embodiment.
FIG. 10 is a diagram illustrating a correspondence graph between an input value and a quantization value in a quantization unit of the image information encoding device.
FIG. 11 is a diagram illustrating a schematic configuration of a conventional image information encoding device that realizes image compression by orthogonal transform and motion compensation.
FIG. 12 is a diagram illustrating a schematic configuration of a conventional image information decoding apparatus that decodes compressed image information compressed by orthogonal transform and motion compensation.
FIG. 13 is a diagram for explaining the relationship between intra_dc_precision, bit precision, inverse quantization coefficient, and DC prediction reset value defined in MPEG2.
FIG. 14 is a diagram illustrating default values of quantization matrices for intra macroblocks and inter macroblocks defined in MPEG2.
FIG. 15 is a diagram for explaining a quantization matrix for a non-intra macroblock defined in MPEG2 Test Model 5;
FIG. 16 is a diagram for explaining a relationship among a quantization scale (quantiser_scale), a parameter q_scale_type set in units of pictures, and a quantization scale code quantiser_scale_code set in units of macroblocks in MPEG2.
[Explanation of symbols]
10, 50, 70 Image information encoding unit, 11 A / D conversion unit, 12 screen rearrangement buffer, 13 adder, 14 orthogonal transformation unit, 15 quantization unit, 16 weighting unit, 17 lossless encoding unit, 18 accumulation Buffer, 19 inverse quantization unit, 20 weighting unit, 21 inverse orthogonal transform unit, 22 frame memory, 23 motion prediction / compensation unit, 24 rate control unit, 30, 60 image information decoding device, 31 storage buffer, 32 lossless decoding unit , 33 Inverse quantization unit, 34 Weighting unit, 35 Inverse orthogonal transform unit, 36 Adder, 37 Screen rearrangement buffer, 38 D / A conversion unit, 39 Motion prediction / compensation unit, 40 Frame memory, 51, 52, 61 Low frequency accuracy change unit, 71 dead zone calculation unit

Claims (11)

入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するものであって、
上記直交変換の単位となるブロックは、4×4画素からなり、
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)が算出され、
上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力が0とされること
を特徴とする画像情報符号化方法。
In an image information encoding method in which an input image signal is blocked and subjected to orthogonal transformation in units of the block to perform quantization,
In the quantization, a virtual weighting process for the quantization step size in the quantization is considered for the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block. Then, a dead zone in which a change is made for each component of the orthogonal transform coefficient is set ,
The block that is the unit of the orthogonal transformation is composed of 4 × 4 pixels,
Obtained by adding an array W (i, j) for weighting for each component Y (i, j) of the orthogonal transform coefficient to the parameter QP for designating the quantization step size Q Using the variable QQP (i, j)
T (i, j) = (2 15 + QQP / 6− f) / Q ( i, j = 0,1,2,3 )
However, f is an intra macroblock is 2 15 + QQP / 6/3 , the inter macroblock and 2 15 + QQP / 6/6 , with the Y (i, j) and of the same sign
The threshold value T (i, j) is calculated as
When the absolute value of Y (i, j) is smaller than the absolute value of T (i, j), the quantized output of Y (i, j) is set to 0. Encoding method.
上記量子化ステップサイズQは、The quantization step size Q is
Y(i,j)Y (i, j) = {(0,0),(0,2),(2,0),(2,2)}{(0,0), (0,2), (2,0), (2,2)} の場合、in the case of, Q[QQP%6][i][j]Q [QQP% 6] [i] [j] = quantMat[QQP%6][0] quantMat [QQP% 6] [0] ,
Y(i,j)Y (i, j) = {(1,1),(1,3),(3,1),(3,3)}{(1,1), (1,3), (3,1), (3,3)} の場合、in the case of, Q[QQP%6][i][j]Q [QQP% 6] [i] [j] = quantMat[QQP%6][1] quantMat [QQP% 6] [1] ,
Y(i,j)Y (i, j) が上記以外の場合、If is other than the above, Q[QQP%6][i][j]Q [QQP% 6] [i] [j] = quantMat[QQP%6][2]quantMat [QQP% 6] [2] であり、And
上記the above quantMatquantMat は、Is
quantMat[6][3]quantMat [6] [3] = {{13107, 5243, 8224}, {11651, 4660, 7358}, {10486, 4143, 6554}, {9198, 3687, 5825}, {8322, 3290, 5243}, {7384, 2943, 4660}}{{13107, 5243, 8224}, {11651, 4660, 7358}, {10486, 4143, 6554}, {9198, 3687, 5825}, {8322, 3290, 5243}, {7384, 2943, 4660}} であることBe
を特徴とする請求項1記載の画像情報符号化方法。The image information encoding method according to claim 1.
上記ブロックを含む符号化単位としてのマクロブロック毎に画像内符号化又は画像間符号化が選択され、上記配列W(i,j)のデフォルト値又はピクチャ単位のユーザ設定値として、画像内符号化マクロブロックの場合にWIntra-picture coding or inter-picture coding is selected for each macroblock as a coding unit including the block, and intra-picture coding is used as a default value of the array W (i, j) or a user-set value in picture units. W for macroblock intraintra (i,j)(I, j) が用いられ、画像間符号化マクロブロックの場合にWAnd W for the case of an inter-picture coded macroblock interinter (i,j)(I, j) が用いられることを特徴とする請求項1記載の画像情報符号化方法。The image information encoding method according to claim 1, wherein: 上記WAbove W intraintra (i,j)として、(I, j)
Figure 0004254147
Figure 0004254147
が用いられ、上記WAnd the above W interinter (i,j)として、(I, j)
Figure 0004254147
Figure 0004254147
が用いられることを特徴とする請求項3記載の画像情報符号化方法。The image information encoding method according to claim 3, wherein:
入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、In an image information encoding method in which an input image signal is blocked and subjected to orthogonal transformation in units of the block to perform quantization,
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更が加えたデッドゾーンを設定するものであって、When the quantization is performed, a dead zone in which a predetermined change is made with respect to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block is set.
上記デッドゾーンは、上記量子化後の輝度信号のDC成分を集めて構成された4×4画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、The dead zone is a virtual weighting process for the quantization step size when quantizing each DC component of a block of 4 × 4 pixel units configured by collecting DC components of the luminance signal after quantization. In consideration, a change is made for each DC component,
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分YFor the parameter QP for specifying the quantization step size Q, the DC component Y D (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
T D (i,j)=(2(I, j) = (2 16+QQP/616 + QQP / 6 −2・f)/Q (-2 · f) / Q ( i,j=0,1,2,3i, j = 0,1,2,3 )
ただし、fはイントラマクロブロックでは2Where f is 2 for intra macroblocks. 15+QQP/615 + QQP / 6 /3、インターマクロブロックでは2/ 3, 2 for inter macroblock 15+QQP/615 + QQP / 6 /6とし、上記Y/ 6 and above Y D (i,j)と同じ正負の符号を持つHas the same sign as (i, j)
のように閾値TThreshold T D (i,j)が算出され、(I, j) is calculated,
上記YY above D (i,j)の絶対値が上記TThe absolute value of (i, j) is T D (i,j)の絶対値よりも小さい場合に、当該YY is smaller than the absolute value of (i, j) D (i,j)の量子化出力が0とされることThe quantized output of (i, j) is set to 0
を特徴とする画像情報符号化方法。An image information encoding method characterized by the above.
入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化方法において、In an image information encoding method in which an input image signal is blocked and subjected to orthogonal transformation in units of the block to perform quantization,
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更が加えたデッドゾーンを設定するものであって、When the quantization is performed, a dead zone in which a predetermined change is made with respect to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block is set.
上記デッドゾーンは、上記量子化後の色差信号のDC成分を集めて構成された2×2画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、The dead zone is a virtual weighting process for the quantization step size when quantizing each DC component of a block of 2 × 2 pixel units configured by collecting DC components of the color difference signals after quantization. In consideration, a change is made for each DC component,
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分YFor the parameter QP for specifying the quantization step size Q, the DC component Y D (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
T D (i,j)=(2(I, j) = (2 16+QQP/616 + QQP / 6 −2・f)/Q (-2 · f) / Q ( i,j=0,1i, j = 0,1 )
ただし、fはイントラマクロブロックでは2Where f is 2 for intra macroblocks. 15+QQP/615 + QQP / 6 /3、インターマクロブロックでは2/ 3, 2 for inter macroblock 15+QQP/615 + QQP / 6 /6とし、上記Y/ 6 and above Y D (i,j)と同じ正負の符号を持つHas the same sign as (i, j)
のように閾値TThreshold T D (i,j)が算出され、(I, j) is calculated,
上記YY above D (i,j)の絶対値が上記TThe absolute value of (i, j) is T D (i,j)の絶対値よりも小さい場合に、当該YY is smaller than the absolute value of (i, j) D (i,j)の量子化出力が0とされることThe quantized output of (i, j) is set to 0
を特徴とする画像情報符号化方法。An image information encoding method characterized by the above.
入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するデッドゾーン設定手段を備え
上記直交変換の単位となるブロックは、4×4画素からなり、
上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)を算出し、
上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力を0とすること
を特徴とする画像情報符号化装置。
In an image information encoding apparatus that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization,
In the quantization, a virtual weighting process for the quantization step size in the quantization is considered for the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block. And a dead zone setting means for setting a dead zone that has been changed for each component of the orthogonal transform coefficient ,
The block that is the unit of the orthogonal transformation is composed of 4 × 4 pixels,
The dead zone setting means weights the array W (i, j) for each component Y (i, j) of the orthogonal transform coefficient with respect to the parameter QP for designating the quantization step size Q. Using the variable QQP (i, j) obtained by adding
T (i, j) = (2 15 + QQP / 6− f) / Q ( i, j = 0,1,2,3 )
However, f is an intra macroblock is 2 15 + QQP / 6/3 , the inter macroblock and 2 15 + QQP / 6/6 , with the Y (i, j) and of the same sign
The threshold value T (i, j) is calculated as
When the absolute value of Y (i, j) is smaller than the absolute value of T (i, j), the quantized output of Y (i, j) is set to 0. Device.
入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、In an image information encoding apparatus that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization,
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備え、A dead zone setting means for setting a dead zone obtained by making a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block at the time of the quantization;
上記デッドゾーンは、上記量子化後の輝度信号のDC成分を集めて構成された4×4画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、The dead zone is a virtual weighting process for the quantization step size when quantizing each DC component of a block of 4 × 4 pixel units configured by collecting DC components of the luminance signal after quantization. In consideration, a change is made for each DC component,
上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分YThe dead zone setting means applies the DC component Y to the parameter QP for specifying the quantization step size Q. D (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
T D (i,j)=(2(I, j) = (2 16+QQP/616 + QQP / 6 −2・f)/Q (-2 · f) / Q ( i,j=0,1,2,3i, j = 0,1,2,3 )
ただし、fはイントラマクロブロックでは2Where f is 2 for intra macroblocks. 15+QQP/615 + QQP / 6 /3、インターマクロブロックでは2/ 3, 2 for inter macroblock 15+QQP/615 + QQP / 6 /6とし、上記Y/ 6 and above Y D (i,j)と同じ正負の符号を持つHas the same sign as (i, j)
のように閾値TThreshold T D (i,j)を算出し、(I, j) is calculated,
上記YY above D (i,j)の絶対値が上記TThe absolute value of (i, j) is T D (i,j)の絶対値よりも小さい場合に、当該YY is smaller than the absolute value of (i, j) D (i,j)の量子化出力を0とすることThe quantization output of (i, j) is set to 0
を特徴とする画像情報符号化装置。An image information encoding device characterized by the above.
入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化装置において、In an image information encoding apparatus that blocks an input image signal, performs orthogonal transform in units of the block, and performs quantization,
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して所定の変更を加えたデッドゾーンを設定するデッドゾーン設定手段を備え、A dead zone setting means for setting a dead zone obtained by making a predetermined change to the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block at the time of the quantization;
上記デッドゾーンは、上記量子化後の色差信号のDC成分を集めて構成された2×2画素単位のブロックの各DC成分を量子化する際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記DC成分毎に変更が加えられ、The dead zone is a virtual weighting process for the quantization step size when quantizing each DC component of a block of 2 × 2 pixel units configured by collecting DC components of the color difference signals after quantization. In consideration, a change is made for each DC component,
上記デッドゾーン設定手段は、上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記DC成分YThe dead zone setting means applies the DC component Y to the parameter QP for specifying the quantization step size Q. D (i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、Using the variable QQP (i, j) obtained by adding the weighting array W (i, j) for each (i, j),
T D (i,j)=(2(I, j) = (2 16+QQP/616 + QQP / 6 −2・f)/Q (-2 · f) / Q ( i,j=0,1i, j = 0,1 )
ただし、fはイントラマクロブロックでは2Where f is 2 for intra macroblocks. 15+QQP/615 + QQP / 6 /3、インターマクロブロックでは2/ 3, 2 for inter macroblock 15+QQP/615 + QQP / 6 /6とし、上記Y/ 6 and above Y D (i,j)と同じ正負の符号を持つHas the same sign as (i, j)
のように閾値TThreshold T D (i,j)を算出し、(I, j) is calculated,
上記YY above D (i,j)の絶対値が上記TThe absolute value of (i, j) is T D (i,j)の絶対値よりも小さい場合に、当該YY is smaller than the absolute value of (i, j) D (i,j)の量子化出力を0とすることThe quantization output of (i, j) is set to 0
を特徴とする画像情報符号化装置。An image information encoding device characterized by the above.
入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化処理をコンピュータに実行させるプログラムにおいて、
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するものであって、
上記直交変換の単位となるブロックは、4×4画素からなり、
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)が算出され、
上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力が0とされること
を特徴とするプログラム。
In a program that causes a computer to execute an image information encoding process that blocks an input image signal, performs orthogonal transformation in units of the block, and performs quantization.
In the quantization, a virtual weighting process for the quantization step size in the quantization is considered for the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block. Then, a dead zone in which a change is made for each component of the orthogonal transform coefficient is set ,
The block that is the unit of the orthogonal transformation is composed of 4 × 4 pixels,
Obtained by adding an array W (i, j) for weighting for each component Y (i, j) of the orthogonal transform coefficient to the parameter QP for designating the quantization step size Q Using the variable QQP (i, j)
T (i, j) = (2 15 + QQP / 6− f) / Q ( i, j = 0,1,2,3 )
However, f is an intra macroblock is 2 15 + QQP / 6/3 , the inter macroblock and 2 15 + QQP / 6/6 , with the Y (i, j) and of the same sign
The threshold value T (i, j) is calculated as
When the absolute value of Y (i, j) is smaller than the absolute value of T (i, j), the quantized output of Y (i, j) is set to 0
A program characterized by
入力画像信号をブロック化し、該ブロック単位で直交変換を施して量子化を行う画像情報符号化処理をコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体において、
上記量子化の際に、上記ブロックの直交変換係数の成分毎に決定された量子化ステップサイズにおけるデッドゾーンに対して、上記量子化の際の上記量子化ステップサイズに対する仮想的な重み付け処理を考慮して、上記直交変換係数の成分毎に変更が加えられたデッドゾーンを設定するものであって、
上記直交変換の単位となるブロックは、4×4画素からなり、
上記量子化ステップサイズQを指定するための媒介変数QPに対して、上記直交変換係数の成分Y(i,j)毎に重み付けのための配列W(i,j)を加算して得られた変数QQP(i,j)を用いて、
T(i,j)=(2 15+QQP/6 −f)/Q ( i,j=0,1,2,3
ただし、fはイントラマクロブロックでは2 15+QQP/6 /3、インターマクロブロックでは2 15+QQP/6 /6とし、上記Y(i,j)と同じ正負の符号を持つ
のように閾値T(i,j)が算出され、
上記Y(i,j)の絶対値が上記T(i,j)の絶対値よりも小さい場合に、当該Y(i,j)の量子化出力が0とされること
を特徴とするプログラムが記録された記録媒体。
In a computer-readable recording medium on which a program for causing a computer to execute an image information encoding process that blocks an input image signal, performs orthogonal transformation in units of the block and performs quantization,
In the quantization, a virtual weighting process for the quantization step size in the quantization is considered for the dead zone in the quantization step size determined for each component of the orthogonal transform coefficient of the block. Then, a dead zone in which a change is made for each component of the orthogonal transform coefficient is set ,
The block that is the unit of the orthogonal transformation is composed of 4 × 4 pixels,
Obtained by adding an array W (i, j) for weighting for each component Y (i, j) of the orthogonal transform coefficient to the parameter QP for designating the quantization step size Q Using the variable QQP (i, j)
T (i, j) = (2 15 + QQP / 6− f) / Q ( i, j = 0,1,2,3 )
However, f is an intra macroblock is 2 15 + QQP / 6/3 , the inter macroblock and 2 15 + QQP / 6/6 , with the Y (i, j) and of the same sign
The threshold value T (i, j) is calculated as
When the absolute value of the Y (i, j) is smaller than the absolute value of the T (i, j), the quantized output of the Y (i, j) is set to 0. Recorded recording medium.
JP2002207487A 2001-11-30 2002-07-16 Image information encoding method and apparatus, program, and recording medium Expired - Fee Related JP4254147B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002207487A JP4254147B2 (en) 2001-11-30 2002-07-16 Image information encoding method and apparatus, program, and recording medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001367868 2001-11-30
JP2001-367868 2001-11-30
JP2002207487A JP4254147B2 (en) 2001-11-30 2002-07-16 Image information encoding method and apparatus, program, and recording medium

Publications (3)

Publication Number Publication Date
JP2003230142A JP2003230142A (en) 2003-08-15
JP2003230142A5 JP2003230142A5 (en) 2005-10-27
JP4254147B2 true JP4254147B2 (en) 2009-04-15

Family

ID=27759605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002207487A Expired - Fee Related JP4254147B2 (en) 2001-11-30 2002-07-16 Image information encoding method and apparatus, program, and recording medium

Country Status (1)

Country Link
JP (1) JP4254147B2 (en)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO319007B1 (en) * 2003-05-22 2005-06-06 Tandberg Telecom As Video compression method and apparatus
EP1564997A1 (en) * 2004-02-12 2005-08-17 Matsushita Electric Industrial Co., Ltd. Encoding and decoding of video images based on a quantization with an adaptive dead-zone size
EP2611157A1 (en) 2004-02-20 2013-07-03 Nec Corporation Image encoding method, device thereof, and control program thereof
EP1766988A2 (en) 2004-06-18 2007-03-28 THOMSON Licensing Method and apparatus for video codec quantization
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US8711925B2 (en) * 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
JPWO2008132890A1 (en) * 2007-04-16 2010-07-22 株式会社東芝 Method and apparatus for image encoding and image decoding
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US20130272390A1 (en) * 2012-04-16 2013-10-17 Qualcomm Incorporated Uniform granularity for quantization matrix in video coding
GB2501535A (en) * 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
GB2512826B (en) * 2013-04-05 2017-05-10 Canon Kk Method and device for determining the value of a quantization parameter

Also Published As

Publication number Publication date
JP2003230142A (en) 2003-08-15

Similar Documents

Publication Publication Date Title
JP4617644B2 (en) Encoding apparatus and method
US7620103B2 (en) Programmable quantization dead zone and threshold for standard-based H.264 and/or VC1 video encoding
KR100785589B1 (en) Image encoding apparatus and image decoding apparatus
KR101156996B1 (en) Decoding apparatus and decoding method
JP4254147B2 (en) Image information encoding method and apparatus, program, and recording medium
WO2005062622A1 (en) Image decoding device, image decoding method, and image decoding program
JP2001054119A (en) Image prediction coding method
KR100949475B1 (en) Apparatus and method for determining scan pattern, and Apparatus and method for encoding image data using the same, and method for decoding image data using the same
JP4560694B2 (en) Encoding apparatus and method thereof
JP2008219205A (en) Picture information encoder and picture information encoding method
JP5375938B2 (en) Decoding apparatus and method
JP4214771B2 (en) Image processing apparatus and method and encoding apparatus
JP2008004984A (en) Image processor and method, program, and recording medium
JP4277530B2 (en) Image processing apparatus and encoding apparatus and methods thereof
KR100366382B1 (en) Apparatus and method for coding moving picture
JP4924708B2 (en) Decoding apparatus and method
JP4348899B2 (en) Image information decoding method
JP2001148852A (en) Image information converter and image information conversion method
JP5375935B2 (en) Encoding apparatus and method
JP4983908B2 (en) Decoding apparatus and method
US20060222065A1 (en) System and method for improving video data compression by varying quantization bits based on region within picture
JP2002354484A (en) Rate transforming method for encoded image and rate transforming apparatus for encoded image
JP4924744B2 (en) Decoding device and method
JP5375936B2 (en) Decoding apparatus and method
JP4983907B2 (en) Encoding apparatus and method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050712

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050712

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120206

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4254147

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120206

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120206

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140206

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees