JP4924708B2 - 復号装置及び方法 - Google Patents

復号装置及び方法 Download PDF

Info

Publication number
JP4924708B2
JP4924708B2 JP2009298736A JP2009298736A JP4924708B2 JP 4924708 B2 JP4924708 B2 JP 4924708B2 JP 2009298736 A JP2009298736 A JP 2009298736A JP 2009298736 A JP2009298736 A JP 2009298736A JP 4924708 B2 JP4924708 B2 JP 4924708B2
Authority
JP
Japan
Prior art keywords
pixel
blocks
image
inverse
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009298736A
Other languages
English (en)
Other versions
JP2010104026A (ja
Inventor
輝彦 鈴木
晃 杉山
恭平 小藪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009298736A priority Critical patent/JP4924708B2/ja
Publication of JP2010104026A publication Critical patent/JP2010104026A/ja
Application granted granted Critical
Publication of JP4924708B2 publication Critical patent/JP4924708B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、MPEG(Moving Picture Experts Group)、H.26x等のように、離散コサイン変換又はカルーネン・レーベ変換等の直交変換と動き予測・補償とによって圧縮された画像圧縮情報(ビットストリーム)を、衛星放送、ケーブルTV若しくはインターネット等のネットワークメディアを介して受信する際に、又は光ディスク、磁気ディスク若しくはフラッシュメモリ等の記憶メディア上で処理する際に用いられる画像情報復号装置及びその方法に関する。
近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き予測・補償とにより圧縮するMPEGなどの方式に準拠した装置が、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。
特に、MPEG2(ISO/IEC 13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4〜8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18〜22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。
MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量(ビットレート)、つまりより高い圧縮率の符号化方式には対応していなかった。しかし、携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。
さらに、近年、テレビ会議用の画像符号化を当初の目的として、H.264(ITU-T Q6/16 VCEG)という標準の規格化が進んでいる。H.264は、MPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.264をベースに、H.264ではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJVT(Joint Video Team)によって行われている。
ここで、離散コサイン変換又はカルーネン・レーベ変換等の直交変換と動き予測・補償とにより画像圧縮を実現する画像情報符号化装置の概略構成を図9に示す。図9に示すように、画像情報符号化装置100は、A/D(Analogue/Digital)変換部101と、画像並び替えバッファ102と、加算器103と、直交変換部104と、量子化部105と、可逆符号化部106と、蓄積バッファ107と、逆量子化部108と、逆直交変換部109と、加算器110と、フレームメモリ111と、動き予測・補償部112と、イントラ予測部113と、レート制御部114とにより構成されている。
図9において、A/D変換部101は、入力された画像信号をデジタル信号に変換する。そして、画像並び替えバッファ102は、当該画像情報符号化装置100から出力される画像圧縮情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行う。ここで、画像並び替えバッファ102は、イントラ(画像内)符号化が行われる画像に関しては、フレーム全体の画像情報を直交変換部104に供給する。直交変換部104は、画像情報に対して離散コサイン変換又はカルーネン・レーベ変換等の直交変換を施し、変換係数を量子化部105に供給する。量子化部105は、直交変換部104から供給された変換係数に対して量子化処理を施す。
可逆符号化部106は、量子化された変換係数に対して可変長符号化、算術符号化等の可逆符号化を施し、符号化された変換係数を蓄積バッファ107に供給して蓄積させる。この符号化された変換係数は、画像圧縮情報として出力される。
量子化部105の挙動は、レート制御部114によって制御される。また、量子化部105は、量子化後の変換係数を逆量子化部108に供給し、逆量子化部108は、その変換係数を逆量子化する。逆直交変換部109は、逆量子化された変換係数に対して逆直交変換処理を施して復号画像情報を生成し、その情報をフレームメモリ111に供給して蓄積させる。
一方、画像並び替えバッファ102は、インター(画像間)符号化が行われる画像に関しては、画像情報を動き予測・補償部112に供給する。動き予測・補償部112は、同時に参照される画像情報をフレームメモリ111より取り出し、動き予測・補償処理を施して参照画像情報を生成する。動き予測・補償部112は、この参照画像情報を加算器103に供給し、加算器103は、参照画像情報を当該画像情報との差分信号に変換する。また、動き補償・予測部112は、同時に動きベクトル情報を可逆符号化部106に供給する。
可逆符号化部106は、その動きベクトル情報に対して可変長符号化又は算術符号化等の可逆符号化処理を施し、画像圧縮情報のヘッダ部に挿入される情報を形成する。なお、その他の処理については、イントラ符号化を施される画像圧縮情報と同様であるため、説明を省略する。
ここで、上述したJVTで標準化が行われている符号化方式(以下、JVT Codecという。)では、イントラ符号化を行う際に、ブロック周辺の画素から予測画像を生成してその差分を符号化するというイントラ予測符号化が採用されている。すなわち、イントラ符号化が行われる画像に関しては、符号化する画素ブロックの近傍の既に符号化が終了した画素値から予測画像を生成し、その予測画像との差分が符号化される。逆量子化部108及び逆直交変換部109は、イントラ符号化された画素をそれぞれ逆量子化及び逆直交変換し、加算器110は、逆直交変換部109の出力と当該画素ブロックを符号化する際に使用された予測画像とを加算し、その加算値をフレームメモリ111に供給して蓄積させる。イントラ予測部113は、イントラ符号化される画素ブロックの場合には、既に符号化が終了しフレームメモリ111に蓄積されている近傍画素を読み出し、予測画像を生成する。このとき、予測画像の生成に用いたイントラ予測モードについても可逆符号化部106において可逆符号化処理を施し、画像圧縮情報に含めて出力する。
続いて、上述した画像情報符号化装置100に対応する画像情報復号装置の概略構成を図10に示す。図10に示すように、画像情報復号装置120は、蓄積バッファ121と、可逆復号部122と、逆量子化部123と、逆直交変換部124と、加算器125と、画像並び替えバッファ126と、D/A(Digital/Analogue)変換部127と、動き予測・補償部128と、フレームメモリ129と、イントラ予測部130とにより構成されている。
図10において、蓄積バッファ121は、入力された画像圧縮情報を一時的に格納した後、可逆復号部122に転送する。可逆復号部122は、定められた画像圧縮情報のフォーマットに基づき、画像圧縮情報に対して可変長復号又は算術復号等の処理を施し、量子化された変換係数を逆量子化部123に供給する。また、可逆復号部122は、当該フレームがインター符号化されたものである場合には、画像圧縮情報のヘッダ部に格納された動きベクトル情報についても復号し、その情報を動き予測・補償部128に供給する。
逆量子化部123は、可逆復号部122から供給された量子化後の変換係数を逆量子化し、変換係数を逆直交変換部124に供給する。逆直交変換部124は、定められた画像圧縮情報のフォーマットに基づき、変換係数に対して逆離散コサイン変換又は逆カルーネン・レーベ変換等の逆直交変換を施す。
ここで、当該フレームがイントラ符号化されたものである場合には、逆直交変換処理が施された画像情報は、画像並び替えバッファ126に格納され、D/A変換部127におけるD/A変換処理の後に出力される。
一方、当該フレームがインター符号化されたものである場合には、動き予測・補償部128は、可逆復号処理が施された動きベクトル情報とフレームメモリ129に格納された画像情報とに基づいて参照画像を生成し、加算器125に供給する。加算器125は、この参照画像と逆直交変換部124の出力とを合成する。なお、その他の処理については、イントラ符号化されたフレームと同様であるため、説明を省略する。
なお、JVT Codecではイントラ予測符号化が採用されているため、当該フレームがイントラ符号化されたものである場合には、イントラ予測部130は、フレームメモリ129から画像を読みだし、可逆復号部122において可逆復号処理が施されたイントラ予測モードに従って予測画像を生成する。加算器125は、逆直交変換部124の出力とこの予測画像とを加算する。
以上説明した画像情報符号化装置100及び画像情報復号装置120については、例えば下記特許文献1、2等に記載されている。
特開2001−199818号公報 特開2002−20953号公報
ところで、JVT Codec(H.264|MPEG-4 AVC)では、上述したように、イントラ符号化を行う際に、ブロックの周辺の画素から予測画像を生成してその差分を符号化するというイントラ予測符号化が採用されている。
ここで、輝度成分に関しては、4×4画素ブロック単位に予測を行うイントラ4×4予測モードと16×16画素ブロック(マクロブロック)単位で予測を行うイントラ16×16予測モードとの2つの予測方式が用いられている。
一方、色差成分に関しては、Cb,Crそれぞれの8×8ブロック単位で予測を行う。この予測符号化の方法は、イントラ16×16予測モードと同様であり、当該予測モードを8×8ブロック単位に変更したものである。色差のイントラ予測符号化における予測モードを図11に示す。図11に示すように、JVT Codecでは、
(a) Vertical mode(mode=0)
(b) Horizontal mode(mode=1)
(c) DC mode(mode=2)
(d) Plane Prediction mode(mode=3)
の4つの予測モードが定義されており、最も予測残差の少ない予測モードに従って予測画像が生成される。以下、この4つの予測モードにおける予測画像の生成手法について説明する。
(a) Vertical mode(mode=0)
Vertical mode においては、色差ブロックの隣接する上側のブロックの画素(4:2:0フォーマットの場合、上のマクロブロック)をコピーして当該ブロックの予測画像とする。この場合の色差ブロックの予測画像predは、隣接する上側のブロックの画素をp[x,−1]とすると、以下の式(1)のように表される。なお、このモードは隣接する上側のブロックが存在する場合にのみ用いることが可能である。
Figure 0004924708
(b) Horizontal mode(mode=1)
Horizontal mode においては、色差ブロックの隣接する左側のブロックの画素(4:2:0フォーマットの場合、左のマクロブロック)をコピーして当該ブロックの予測画像とする。この場合の色差ブロックの予測画像predは、隣接する左側のブロックの画素をp[−1,y]とすると、以下の式(2)のように表される。なお、このモードは隣接する左側のブロックが存在する場合のみ用いることが可能である。
Figure 0004924708
(c) DC mode(mode=2)
DC mode においては、色差ブロックの隣接する上側及び左側のブロックの画素を用いてその平均値を予測画像とする。但し、隣接する画素が存在しない場合には、値128が予測信号として用いられる。
すなわち、x,y=0..3の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x,y=0..3)を用いて生成される。より詳しくは、(i)画素p[x,−1]及び画素p[−1,y]が共に存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iv)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の4つの場合において、それぞれ以下の式(3)〜(6)に従って生成される。
Figure 0004924708
同様に、x=4..7、y=0..3の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x=4..7、y=0..3)を用いて生成される。より詳しくは、(i)画素p[x,−1]が存在する場合、(ii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iii)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の3つの場合において、それぞれ以下の式(7)〜(9)に従って生成される。
Figure 0004924708
同様に、x=0..3、y=4..7の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x=0..3、y=4..7)を用いて生成される。より詳しくは、(i)画素p[−1,y]が存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の3つの場合において、それぞれ以下の式(10)〜(12)に従って生成される。
Figure 0004924708
同様に、x,y=4..7の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x,y=4..7)を用いて生成される。より詳しくは、(i)画素p[x,−1]及び画素p[−1,y]が共に存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iv)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の4つの場合において、それぞれ以下の式(13)〜(16)に従って生成される。
Figure 0004924708
(d) Plane Prediction mode(mode=3)
Plane Prediction mode においては、色差ブロックの隣接する左側のブロックの画素(4:2:0フォーマットの場合、左のマクロブロック)と上側のブロックの画素から予測画像を平面近似して当該ブロックの予測画像とする。この場合の色差の予測画像predは、隣接する左側のブロックの画素をp[−1,y]、上側のブロックをp[x,−1]とすると、以下の式(17)のように表される。ここで、式(17)におけるClip1は、0から255の範囲にクリッピングすることを示す。
Figure 0004924708
以上のように、4つの予測モードの何れかによって色差成分のイントラ予測を行って予測画像を生成した後、加算器103において現在の画素ブロックとこの予測画像との差分信号が生成される。直交変換部104は、この8×8ブロックの差分信号に対して4×4画素ブロック単位で4×4整数変換を適用する。現在の画素ブロックから予測画像を引いた差分信号をF4x4とすると、4×4整数変換は、以下の式(18)のように表される。
Figure 0004924708
さらにJVT Codecでは、4×4整数変換した後、図12に示すように、8×8ブロック中の4つの4×4ブロックの(0,0)係数(DC係数)を集めて2×2ブロックを構成し、この2×2ブロックに対して2×2アダマール変換を適応する。これは、色差で用いられているイントラ予測の効率がそれ程高くなく、隣り合う4×4ブロック間の(0,0)係数の間にまだ相関が残っているためである。この相関を利用してより符号化効率を高めるため、4×4ブロックの(0,0)係数のみを集めて2×2ブロックを構成し、2×2アダマール変換を適用する。2×2のクロマDCブロックをfdc2x2とすると、2×2アダマール変換後のクロマDCブロックfdc'2x2は、以下の式(19)のように表される。
Figure 0004924708
整数変換の後、各係数は量子化される。輝度の量子化係数を求めるためのパラメータをQPとすると、色差の量子化係数を求めるためのパラメータQPは、以下のようにして算出される。
すなわち、先ず画像圧縮情報中に符号化されるQP(0から51の値をとる)及び色差の量子化係数のオフセット値chroma_qp_offsetを用いて、下記の式(20)に従ってパラメータQPを計算する。但し、QPは0から51の範囲にクリッピングされる。
Figure 0004924708
そして、このQPを用いて以下の表1に示すテーブルから色差のパラメータQPを求める。
Figure 0004924708
ここで、量子化前の各AC係数の値をfとし、量子化後の各AC係数の値をf’とすると、量子化後の係数の値は以下の式(21)で表される。
Figure 0004924708
一方、量子化前の各DC係数の値をfdcとし、量子化後の各DC係数の値をfdc’とすると、量子化後の係数の値は以下の式(22)で表される。なお、式(22)におけるrは、丸め処理のための定数である。
Figure 0004924708
また、AC係数の逆量子化は、逆量子化後のAC係数をf”とすると、以下の式(23)で表される。
Figure 0004924708
一方、DC係数の逆量子化は、逆量子化後のDC係数をfdc”とすると、QPが6以上である場合には、以下の式(24)で表され、QPが6未満である場合には、以下の式(25)で表される。
Figure 0004924708
以上のようにして、JVT Codecではイントラ予測符号化が行われているが、上記手法を用いても、色差のイントラ予測符号化はブロックサイズが小さいため、輝度と比べると符号化効率がよくないという問題があった。
また、上記手法は、4:2:0フォーマット、YCbCr色空間のみにしか対応しておらず、4:2:2フォーマット、4:4:4フォーマット、RGB色空間、XYZ色空間等の場合には符号化することができないという問題があった。
本発明は、このような従来の実情に鑑みて提案されたものであり、4:2:2フォーマット,4:4:4フォーマット, RGB色空間、XYZ色空間等の画像であっても、より効率よく符号化することを可能にする画像情報復号装置及びその方法を提供することを目的とする。
上述した目的を達成するために、本発明に係る符号化装置は、画像信号の色差信号の解像度を示すクロマフォーマット信号が4:2:2フォーマットである場合に、4×4画素ブロック単位で整数精度直交変換された4×4ブロックのDC成分のみを集めて構成された2×4ブロックのクロマDCブロックに対して2×4ブロック単位で直交変換されることにより得られる変換係数を、2×4ブロック単位で逆直交変換し、逆直交変換された係数を、8×8画素のブロックを縦方向に並べた8×16画素ブロックに対応する8つの4×4ブロックの各DC係数として逆直交変換する逆変換手段と、上記逆変換手段により変換された係数を用いて、8×8画素のブロックを縦方向に並べた8×16画素ブロック単位で、予測モードがDCモードの場合に、8×8ブロックに分けて上記色差信号を画像内予測復号する際の予測画像を生成する画像内予測手段とを備える。
また、上述した目的を達成するために、本発明に係る符号化方法は、画像信号の色差信号の解像度を示すクロマフォーマット信号が4:2:2フォーマットである場合に、4×4画素ブロック単位で整数精度直交変換された4×4ブロックのDC成分のみを集めて構成された2×4ブロックのクロマDCブロックに対して2×4ブロック単位で直交変換されることにより得られる変換係数を、2×4ブロック単位で逆直交変換し、逆直交変換された係数を、8×8画素のブロックを縦方向に並べた8×16画素ブロックに対応する8つの4×4ブロックの各DC係数として逆直交変換する逆変換工程と、上記逆変換工程により変換された係数を用いて、8×8画素のブロックを縦方向に並べた8×16画素ブロック単位で、予測モードがDCモードの場合に、8×8ブロックに分けて上記色差信号を画像内予測復号する際の予測画像を生成する画像内予測工程とを有する。
このような画像情報符号化装置及びその方法では、入力画像信号を画像内予測符号化する際に、色成分の解像度が例えば4:2:0フォーマット、4:2:2フォーマット、4:4:4フォーマット等の何れであるかを示すクロマフォーマット信号、及び色空間が例えばYCbCr、RGB、XYZ等の何れであるかを示す色空間信号に基づいて、予測画像を生成する際のブロックサイズを適応的に変更する。さらに、この画像情報符号化装置及びその方法では、量子化された変換係数と共に、上記クロマフォーマット信号及び上記色空間信号を符号化する。
上述した目的を達成するために、本発明に係復号装置は、画像信号の色差信号の解像度を示すクロマフォーマット信号が4:2:2フォーマットである場合に、4×4画素ブロック単位で整数精度直交変換された4×4ブロックのDC成分のみを集めて構成された2×4ブロックのクロマDCブロックに対して2×4ブロック単位で直交変換されることにより得られる変換係数を、2×4ブロック単位で逆直交変換し、逆直交変換された係数を、8×8画素のブロックを縦方向に並べた8×16画素ブロックに対応する8つの4×4ブロックの各DC係数として逆直交変換する逆変換手段と、上記逆変換手段により変換された係数を用いて、8×8画素のブロックを縦方向に並べた8×16画素ブロック単位で、上記色差信号を画像内予測復号する際の予測画像を生成する画像内予測手段とを備える。
また、上述した目的を達成するために、本発明に係復号方法は、画像信号の色差信号の解像度を示すクロマフォーマット信号が4:2:2フォーマットである場合に、4×4画素ブロック単位で整数精度直交変換された4×4ブロックのDC成分のみを集めて構成された2×4ブロックのクロマDCブロックに対して2×4ブロック単位で直交変換されることにより得られる変換係数を、2×4ブロック単位で逆直交変換し、逆直交変換された係数を、8×8画素のブロックを縦方向に並べた8×16画素ブロックに対応する8つの4×4ブロックの各DC係数として逆直交変換する逆変換工程と、上記逆変換工程により変換された係数を用いて、8×8画素のブロックを縦方向に並べた8×16画素ブロック単位で、上記色差信号を画像内予測復号する際の予測画像を生成する画像内予測工程とを有する。
このような画像情報復号装置及びその方法では、色成分の解像度が例えば4:2:0フォーマット、4:2:2フォーマット、4:4:4フォーマット等の何れであるかを示すクロマフォーマット信号、及び色空間が例えばYCbCr、RGB、XYZ等の何れであるかを示す色空間信号を復号し、このクロマフォーマット信号及び色空間信号に応じたブロックサイズで、色信号を画像内予測復号する際の予測画像を生成する。
本発明に係る画像情報符号化装置及びその方法、並びに画像情報復号装置及びその方法によれば、4:2:0フォーマット、YCbCr色空間の場合のみならず、4:2:2フォーマット、4:4:4フォーマット、RGB色空間、XYZ色空間等の場合にも、画像内予測によって、効率よく符号化、復号することができる。
本実施の形態における画像情報符号化装置の概略構成を説明する図である。 同画像情報符号化装置におけるイントラ予測部の構成の一例を示す図である。 同画像情報符号化装置における直交変換部の構成の一例を示す図である。 縦方向に連続する2つの8×8ブロック中の8つの4×4ブロックのDC係数を集めて2×4ブロックを構成する様子を示す図である。 同画像情報符号化装置における量子化部の構成の一例を示す図である。 同画像情報符号化装置における逆量子化部の構成の一例を示す図である。 同画像情報符号化装置における逆直交変換部の構成の一例を示す図である。 本実施の形態における画像情報復号装置の概略構成を説明する図である。 離散コサイン変換又はカルーネン・レーベ変換等の直交変換と動き予測・補償とにより画像圧縮を実現する従来の画像情報符号化装置の概略構成を説明する図である。 同画像情報符号化装置に対応する従来の画像情報復号装置の概略構成を説明する図である。 JVT Codec における4つのイントラ予測モードを説明する図である。 8×8ブロック中の4つの4×4ブロックのDC係数を集めて2×2ブロックを構成する様子を示す図である。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明するが、本発明はこの実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
(1)画像情報符号化装置の構成及び動作
先ず、本実施の形態における画像情報符号化装置の概略構成を図1に示す。図1に示すように、画像情報符号化装置10は、A/D(Analogue/Digital)変換部11と、画像並び替えバッファ12と、加算器13と、直交変換部14と、量子化部15と、可逆符号化部16と、蓄積バッファ17と、逆量子化部18と、逆直交変換部19と、加算器20と、フレームメモリ21と、動き予測・補償部22と、イントラ予測部23と、レート制御部24とにより構成されている。
図1において、A/D変換部11は、入力された画像信号をデジタル信号に変換する。そして、画像並び替えバッファ12は、当該画像情報符号化装置10から出力される画像圧縮情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行う。ここで、画像並び替えバッファ12は、イントラ(画像内)符号化が行われる画像に関しては、フレーム全体の画像情報を直交変換部14に供給する。直交変換部14は、画像情報に対して離散コサイン変換又はカルーネン・レーベ変換等の直交変換を施し、変換係数を量子化部15に供給する。量子化部15は、直交変換部14から供給された変換係数に対して量子化処理を施す。
可逆符号化部16は、量子化された変換係数に対して可変長符号化、算術符号化等の可逆符号化を施し、符号化された変換係数を蓄積バッファ17に供給して蓄積させる。この符号化された変換係数は、画像圧縮情報として出力される。
量子化部15の挙動は、レート制御部24によって制御される。また、量子化部15は、量子化後の変換係数を逆量子化部18に供給し、逆量子化部18は、その変換係数を逆量子化する。逆直交変換部19は、逆量子化された変換係数に対して逆直交変換処理を施して復号画像情報を生成し、その情報をフレームメモリ21に供給して蓄積させる。
一方、画像並び替えバッファ12は、インター(画像間)符号化が行われる画像に関しては、画像情報を動き予測・補償部22に供給する。動き予測・補償部22は、同時に参照される画像情報をフレームメモリ21より取り出し、動き予測・補償処理を施して参照画像情報を生成する。動き予測・補償部22は、この参照画像情報を加算器13に供給し、加算器13は、参照画像情報を当該画像情報との差分信号に変換する。また、動き補償・予測部22は、同時に動きベクトル情報を可逆符号化部16に供給する。
可逆符号化部16は、その動きベクトル情報に対して可変長符号化又は算術符号化等の可逆符号化処理を施し、画像圧縮情報のヘッダ部に挿入される情報を形成する。なお、その他の処理については、イントラ符号化を施される画像圧縮情報と同様であるため、説明を省略する。
ここで、上述したJVT Codecでは、イントラ符号化を行う際に、ブロック周辺の画素から予測画像を生成してその差分を符号化するというイントラ予測符号化が採用されている。すなわち、イントラ符号化が行われる画像(Iピクチャ、Iスライス、イントラマクロブロックなど)に関しては、符号化する画素ブロックの近傍の既に符号化が終了した画素値から予測画像を生成し、その予測画像との差分が符号化される。逆量子化部18及び逆直交変換部19は、イントラ符号化された画素をそれぞれ逆量子化及び逆直交変換し、加算器20は、逆直交変換部19の出力と当該画素ブロックを符号化する際に使用された予測画像とを加算し、その加算値をフレームメモリ21に供給して蓄積させる。イントラ予測部23は、イントラ符号化される画素ブロックの場合には、既に符号化が終了しフレームメモリ21に蓄積されている近傍画素を読み出し、予測画像を生成する。このとき、予測画像の生成に用いたイントラ予測モードについても可逆符号化部16において可逆符号化処理を施し、画像圧縮情報に含めて出力する。
(2)画像情報符号化装置における本発明の適用部分
(2−1)イントラ予測部
イントラ予測部23の構成の一例を図2に示す。イントラ予測部23は、色成分の解像度が4:2:0フォーマット、4:2:2フォーマット、4:4:4フォーマット等の何れであるかを示すクロマフォーマット信号、及び色空間がYCbCr、RGB、XYZ等の何れであるかを示す色空間信号に基づいて、予測の手法を切り替える。なお、クロマフォーマット信号及び色空間信号は、予め外部のユーザ等によって設定され、画像情報符号化装置10に供給される。
図2に示すイントラ予測部23において、クロマフォーマット信号及び色空間信号は、スイッチ30,32に供給される。スイッチ30,32では、クロマフォーマット信号及び色空間信号に基づき、イントラ予測器31a,31b,31cの何れかを選択し、フレームメモリ21から読み出した画像信号を選択したイントラ予測器に供給し、選択したイントラ予測器からの予測画像を出力する。スイッチ30,32は、同一のイントラ予測器を選択する。なお、この図2では、3種類のイントラ予測器31a,31b,31cの何れかを選択するものとして説明するが、このイントラ予測器の数、すなわち予測の方式の数は、任意に設定することができる。
(2−1−1)
先ず、イントラ予測器31aの動作を説明する。このイントラ予測器31aでは、クロマフォーマット信号が4:2:0フォーマットを示し、色空間信号がYCbCrを示す画像信号に対し、8×8ブロックを単位として予測を行う。なお、イントラ予測器31aの動作は、前述した従来例と同様であるため、詳細な説明を省略する。
(2−1−2)
次に、イントラ予測器31bの動作を説明する。イントラ予測器31bにおいてもイントラ色差予測モードには、Vertical mode、Horizontal mode、DC mode、Plane prediction mode の4つの予測モードが存在する。このイントラ予測器31bでは、クロマフォーマット信号が4:2:2フォーマットを示し、色空間信号がYCbCrを示す画像信号に対し、マクロブロック中の連続する縦方向の2つの8×8ブロックをまとめて8×16ブロックを構成し、この8×16ブロックを単位として予測を行う。以下、このイントラ予測器31bにおける、4つの予測モードのそれぞれに従った予測画像の生成手法について説明する。
(a) Vertical mode(mode=0)
Vertical mode においては、色差ブロックの隣接する上側のブロックの画素をコピーして当該ブロックの予測画像とする。この場合の色差の予測画像predは、隣接する上側のブロックの画素をp[x,−1]とすると、以下の式(26)のように表される。なお、このモードは隣接する上側のブロックが存在する場合にのみ用いることが可能である。
Figure 0004924708
(b) Horizontal mode(mode=1)
Horizontal mode においては、色差ブロックの隣接する左側のブロックの画素をコピーして当該ブロックの予測画像とする。この場合の色差ブロックの予測画像predは、隣接する左側のブロックの画素をp[−1, y]とすると、以下の式(27)のように表される。なお、このモードは隣接する左側のブロックが存在する場合のみ用いることが可能である。
Figure 0004924708
(c) DC mode(mode=2)
DC mode においては、色差ブロックの隣接する上側及び左側のブロックの画素を用いてその平均値を予測画像とする。但し、隣接する画素が存在しない場合には、値128が予測信号として用いられる。
すなわち、x,y=0..3の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x,y=0..3)を用いて生成される。より詳しくは、(i)画素p[x,−1]及び画素p[−1,y]が共に存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iv)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の4つの場合において、それぞれ以下の式(28)〜(31)に従って生成される。
Figure 0004924708
同様に、x=4..7、y=0..3の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x=4..7、y=0..3)を用いて生成される。より詳しくは、(i)画素p[x,−1]が存在する場合、(ii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iii)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の3つの場合において、それぞれ以下の式(32)〜(34)に従って生成される。
Figure 0004924708
同様に、x=0..3、y=4..7の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x=0..3、y=4..7)を用いて生成される。より詳しくは、(i)画素p[−1,y]が存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の3つの場合において、それぞれ以下の式(35)〜(37)に従って生成される。
Figure 0004924708
同様に、x,y=4..7の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x,y=4..7)を用いて生成される。より詳しくは、(i)画素p[x,−1]及び画素p[−1,y]が共に存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iv)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の4つの場合において、それぞれ以下の式(38)〜(41)に従って生成される。
Figure 0004924708
同様に、x=0..3、y=8..11の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x=0..3、y=8..11)を用いて生成される。より詳しくは、(i)画素p[−1,y]が存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の3つの場合において、それぞれ以下の式(42)〜(44)に従って生成される。
Figure 0004924708
同様に、x=4..7、y=8..11の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x=4..7、y=8..11)を用いて生成される。より詳しくは、(i)画素p[x,−1]及び画素p[−1,y]が共に存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iv)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の4つの場合において、それぞれ以下の式(45)〜(48)に従って生成される。
Figure 0004924708
同様に、x=0..3、y=12..15の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x=0..3、y=12..15)を用いて生成される。より詳しくは、(i)画素p[−1,y]が存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の3つの場合において、それぞれ以下の式(49)〜(51)に従って生成される。
Figure 0004924708
同様に、x=4..7、y=12..15の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x=4..7、y=12..15)を用いて生成される。より詳しくは、(i)画素p[x,−1]及び画素p[−1,y]が共に存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iv)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の4つの場合において、それぞれ以下の式(52)〜(55)に従って生成される。
Figure 0004924708
ここで、上述した予測方法では、単純に上側のブロックの8画素と左側のブロックの16画素との平均値を予測画像としているため、24での割り算を行う必要があり、演算量が多くなるという問題がある。そこで、以下のように予測方法を変形し、16(=2)での割り算を行うようにすることで、演算量を削減することができる。
すなわち、x,y=0..7の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x,y=0..7)を用いて生成される。より詳しくは、(i)画素p[x,−1]及び画素p[−1,y]が共に存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iv)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の4つの場合において、それぞれ以下の式(56)〜(59)に従って生成される。
Figure 0004924708
同様に、x=0..7、y=8..15の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x=0..7、y=8..15)を用いて生成される。より詳しくは、(i)画素p[−1,y]が存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の3つの場合において、それぞれ以下の式(60)〜(62)に従って生成される。
Figure 0004924708
(d) Plane Prediction mode(mode=3)
Plane Prediction mode においては、色差ブロックの隣接する左側のブロックの画素と上側のブロックの画素から予測画像を平面近似して当該ブロックの予測画像とする。この場合の色差の予測画像predは、隣接する左側のブロックの画素をp[−1,y]、上側のブロックをp[x,−1]とすると、以下の式(63)のように表される。ここで、式(63)におけるClip1は、0から255の範囲にクリッピングすることを示す。
Figure 0004924708
(2−1−3)
続いて、イントラ予測器31cの動作を説明する。イントラ予測器31cにおいてもイントラ色差予測モードには、Vertical mode、Horizontal mode、DC mode、Plane prediction mode の4つの予測モードが存在する。このイントラ予測器31cでは、クロマフォーマット信号が4:4:4フォーマットを示し、色空間信号がYCbCr、RGB又はXYZを示す画像信号に対し、マクロブロック中の連続する縦横方向の4つの8×8ブロックをまとめて16×16ブロックを構成し、この16×16ブロックを単位として予測を行う。以下、このイントラ予測器31cにおける、4つの予測モードのそれぞれに従った予測画像の生成手法について説明する。
(a) Vertical mode(mode=0)
Vertical mode においては、色差ブロックの隣接する上側のブロックの画素をコピーして当該ブロックの予測画像とする。この場合の色差の予測画像predは、隣接する上側のブロックの画素をp[x,−1]とすると、以下の式(64)のように表される。なお、このモードは隣接する上側のブロックが存在する場合にのみ用いることが可能である。
Figure 0004924708
(b) Horizontal mode(mode=1)
Horizontal mode においては、色差ブロックの隣接する左側のブロックの画素をコピーして当該ブロックの予測画像とする。この場合の色差ブロックの予測画像predは、隣接する左側のブロックの画素をp[−1, y]とすると、以下の式(65)のように表される。なお、このモードは隣接する左側のブロックが存在する場合のみ用いることが可能である。
Figure 0004924708
(c) DC mode(mode=2)
DC mode においては、色差ブロックの隣接する上側及び左側のブロックの画素を用いてその平均値を予測画像とする。但し、隣接する画素が存在しない場合には、値128が予測信号として用いられる。
すなわち、x,y=0..15の場合、予測画像pred[x,y]は、隣接する上側の画素p[x,−1]及び左側の画素p[−1,y](但し、x,y=0..15)を用いて生成される。より詳しくは、(i)画素p[x,−1]及び画素p[−1,y]が共に存在する場合、(ii)画素p[x,−1]が存在し、画素p[−1,y]が存在しない場合、(iii)画素p[x,−1]が存在せず、画素p[−1,y]が存在する場合、(iv)画素p[x,−1]及び画素p[−1,y]が共に存在しない場合、の4つの場合において、それぞれ以下の式(66)〜(69)に従って生成される。
Figure 0004924708
(d) Plane Prediction mode(mode=3)
Plane Prediction mode においては、色差ブロックの隣接する左側のブロックの画素と上側のブロックの画素から予測画像を平面近似して当該ブロックの予測画像とする。この場合の色差の予測画像predは、隣接する左側のブロックの画素をp[−1,y]、上側のブロックをp[x,−1]とすると、以下の式(70)のように表される。ここで、式(70)におけるClip1は、0から255の範囲にクリッピングすることを示す。
Figure 0004924708
(2−2)直交変換部
クロマフォーマット信号及び色空間信号は、直交変換部14にも供給される。
直交変換部14の構成の一例を図3に示す。直交変換部14は、色成分の解像度が4:2:0フォーマット、4:2:2フォーマット、4:4:4フォーマット等の何れであるかを示すクロマフォーマット信号、及び色空間がYCbCr、RGB、XYZ等の何れであるかを示す色空間信号に基づいて、直交変換の方式を切り替える。
図3に示す直交変換部14において、クロマフォーマット信号及び色空間信号は、スイッチ40,42に供給される。スイッチ40,42では、クロマフォーマット信号及び色空間信号に基づき、直交変換器41a,41b,41cの何れかを選択し、加算器13からの出力を選択した直交変換器に供給し、選択した直交変換器からの信号を出力する。スイッチ40,42は、同一の直交変換器を選択する。なお、この図3では、3種類の直交変換器41a,41b,41cの何れかを選択するものとして説明するが、この直交変換器の数、すなわち直交変換の方式の数は、任意に設定することができる。
(2−2−1)
先ず、直交変換器41aの動作を説明する。この直交変換器41aでは、クロマフォーマット信号が4:2:0フォーマットを示し、色空間信号がYCbCrを示す画像信号に対して直交変換を行う。なお、直交変換器41aの動作は、前述した従来例と同様であるため、詳細な説明を省略する。
(2−2−2)
次に、直交変換器41bの動作を説明する。この直交変換器41bでは、クロマフォーマット信号が4:2:2フォーマットを示し、色空間信号がYCbCrを示す画像信号に対して直交変換を行う。
より詳しくは、色差のイントラ予測を行った後、8×8ブロック中の4×4画素ブロック単位で4×4整数変換を適用する。当該画素ブロックから予測画像を引いた差分信号をf4x4とすると、4×4直交変換は、以下の式(71)のように表される。
Figure 0004924708
4×4整数変換した後、図4に示すように、縦方向に連続する2つの8×8ブロック中の8つの4×4ブロックの(0,0)係数を集めて2×4ブロックを構成し、この2×4ブロックに対して2×4変換を適応する。これは色差で用いられているイントラ予測の効率がそれ程高くなく、隣り合う4×4ブロック間の(0,0)係数の間にまだ相関が残っているためである。この相関を相関を利用してより符号化効率を高めるため、4×4ブロックの(0,0)係数のみを集めて2×4ブロックを構成し、2×4変換を適用する。2×4のクロマDCのブロックをf2x4とすると、このクロマDCブロックに対する変換は、以下の式(72)のように表される。
Figure 0004924708
(2−2−3)
続いて、直交変換器41cの動作を説明する。この直交変換器41cでは、クロマフォーマット信号が4:4:4フォーマットを示し、色空間信号がYCbCr、RGB又はXYZを示す画像信号に対して直交変換を行う。
より詳しくは、4:4:4フォーマット、YCbCr、RGB、XYZを示す色差を4×4整数変換した後、輝度と同様にしてマクロブロック中の16個の(0,0)係数を集めて4×4DCブロックを構成し、4×4変換を適用する。この変換は、以下の式(73)のように表される。
Figure 0004924708
(2−3)量子化部
クロマフォーマット信号及び色空間信号は、量子化部15にも供給される。
量子化部15の構成の一例を図5に示す。量子化部15は、色成分の解像度が4:2:0フォーマット、4:2:2フォーマット、4:4:4フォーマット等の何れであるかを示すクロマフォーマット信号、及び色空間がYCbCr、RGB、XYZ等の何れであるかを示す色空間信号に基づいて、量子化の方式を切り替える。
図5に示す量子化部15において、クロマフォーマット信号及び色空間信号は、スイッチ50,52に供給される。スイッチ50,52では、クロマフォーマット信号及び色空間信号に基づき、量子化器51a,51b,51cの何れかを選択し、直交変換部14からの出力を選択した量子化器に供給し、選択した量子化器からの信号を出力する。スイッチ50,52は、同一の量子化器を選択する。なお、この図5では、3種類の量子化器51a,51b,51cの何れかを選択するものとして説明するが、この量子化器の数、すなわち量子化の方式の数は、任意に設定することができる。
(2−3−1)
先ず、量子化器51aの動作を説明する。この量子化器51aでは、クロマフォーマット信号が4:2:0フォーマットを示し、色空間信号がYCbCrを示す画像信号に対して量子化を行う。なお、量子化器51aの動作は、前述した従来例と同様であるため、詳細な説明を省略する。
(2−3−2)
次に、量子化器51bの動作を説明する。この量子化器51bでは、クロマフォーマット信号が4:2:2フォーマットを示し、色空間信号がYCbCrを示す画像信号に対して量子化を行う。
ここで、4:2:0フォーマットの場合におけるクロマDCの変換に用いられるアダマール変換は、以下の式(74)のように表される。
Figure 0004924708
一方、4:2:2フォーマットの場合におけるクロマDCの変換に用いられる2×4変換は、以下の式(75)のように表される。
Figure 0004924708
したがって、4:2:0フォーマットでの変換による正規化係数は1/2であるのに対し、4:2:2フォーマットでの変換による正規化係数は1/2√2となる。しかしながら、この場合には実数演算が入ってしまうため、以下の式(76)で示すように簡略化する。
Figure 0004924708
この正規化係数は、量子化の際のスケールと一緒に計算されているため、4:2:2フォーマットの変換の場合、量子化方法を以下のように変更する必要がある。
量子化後のDC係数をQf’[ij]とすると、2×4クロマDCブロックの量子化後の係数値は、例えば以下の式(77)で与えられる。ここで、式(77)におけるrは、丸め処理を変更するためのパラメータである。なお、AC係数に対する量子化は4:2:0フォーマットの場合と同様であるため、説明を省略する。
Figure 0004924708
(2−3−3)
続いて、量子化器51cの動作を説明する。この量子化器51cでは、クロマフォーマット信号が4:4:4フォーマットを示し、色空間信号がYCbCr、RGB又はXYZを示す画像信号に対して量子化を行う。
ここで、クロマDCの変換に用いられるアダマール変換は、以下の式(78)のように表される。したがって、この場合、変換の正規化係数は1/4となる。
Figure 0004924708
量子化後のDC係数をQf’[ij]とすると、4×4クロマDCブロックの量子化後の係数値は、例えば以下の式(79)で与えられる。ここで、式(79)におけるrは、丸め処理を変更するためのパラメータである。
Figure 0004924708
(2−4)逆量子化部
クロマフォーマット信号及び色空間信号は、逆量子化部18にも供給される。
逆量子化部18の構成の一例を図6に示す。逆量子化部18は、色成分の解像度が4:2:0フォーマット、4:2:2フォーマット、4:4:4フォーマット等の何れであるかを示すクロマフォーマット信号、及び色空間がYCbCr、RGB、XYZ等の何れであるかを示す色空間信号に基づいて、逆量子化の方式を切り替える。
図6に示す逆量子化部18において、クロマフォーマット信号及び色空間信号は、スイッチ60,62に供給される。スイッチ60,62では、クロマフォーマット信号及び色空間信号に基づき、逆量子化器61a,61b,61cの何れかを選択し、量子化部15からの出力を選択した逆量子化器に供給し、選択した逆量子化器からの信号を出力する。スイッチ60,62は、同一の逆量子化器を選択する。なお、この図6では、3種類の逆量子化器61a,61b,61cの何れかを選択するものとして説明するが、この逆量子化器の数、すなわち逆量子化の方式の数は、任意に設定することができる。
(2−4−1)
先ず、逆量子化器61aの動作を説明する。この逆量子化器61aでは、クロマフォーマット信号が4:2:0フォーマットを示し、色空間信号がYCbCrを示す画像信号に対して逆量子化を行う。なお、逆量子化器61aの動作は、前述した従来例と同様であるため、詳細な説明を省略する。
(2−4−2)
次に、逆量子化器61bの動作を説明する。この逆量子化器61bでは、クロマフォーマット信号が4:2:2フォーマットを示し、色空間信号がYCbCrを示す画像信号に対して逆量子化を行う。
より詳しくは、逆量子化後のDC係数をfdc”とすると、2×2クロマDCブロックの逆量子化後の係数値は、QPが6以上である場合には以下の式(80)で表され、QPが6未満である場合には、以下の式(81)で表される。なお、AC係数に対する逆量子化は4:2:0フォーマットの場合と同様であるため、説明を省略する。
Figure 0004924708
(2−4−3)
次に、逆量子化器61cの動作を説明する。この逆量子化器61cでは、クロマフォーマット信号が4:4:4フォーマットを示し、色空間信号がYCbCr、RGB又はXYZを示す画像信号に対して逆量子化を行う。
より詳しくは、逆量子化後のDC係数をfdc”とすると、4×4クロマDCブロックの逆量子化後の係数値は、QPが6以上である場合には以下の式(82)で表され、QPが6未満である場合には、以下の式(83)で表される。なお、AC係数に対する逆量子化は4:2:0フォーマットの場合と同様であるため、説明を省略する。
Figure 0004924708
(2−5)逆直交変換部
クロマフォーマット信号及び色空間信号は、逆直交変換部19にも供給される。
逆直交変換部19の構成の一例を図7に示す。逆直交変換部19は、色成分の解像度が4:2:0フォーマット、4:2:2フォーマット、4:4:4フォーマット等の何れであるかを示すクロマフォーマット信号、及び色空間がYCbCr、RGB、XYZ等の何れであるかを示す色空間信号に基づいて、逆直交変換の方式を切り替える。
図7に示す逆直交変換部19において、クロマフォーマット信号及び色空間信号は、スイッチ70,72に供給される。スイッチ70,72では、クロマフォーマット信号及び色空間信号に基づき、逆直交変換器71a,71b,71cの何れかを選択し、逆量子化部18からの出力を選択した逆直交変換器に供給し、選択した逆直交変換器からの信号を出力する。スイッチ70,72は、同一の逆直交変換器を選択する。なお、この図7では、3種類の逆直交変換器71a,71b,71cの何れかを選択するものとして説明するが、この逆直交変換器の数、すなわち逆直交変換の方式の数は、任意に設定することができる。
(2−5−1)
先ず、逆直交変換器71aの動作を説明する。この逆直交変換器71aでは、クロマフォーマット信号が4:2:0フォーマットを示し、色空間信号がYCbCrを示す画像信号に対して逆直交変換を行う。なお、逆直交変換器71aの動作は、前述した従来例と同様であるため、詳細な説明を省略する。
(2−5−2)
次に、逆直交変換器71bの動作を説明する。この逆直交変換器71bでは、クロマフォーマット信号が4:2:2フォーマットを示し、色空間信号がYCbCrを示す画像信号に対して逆直交変換を行う。
より詳しくは、2×4DCブロックに対して2×4逆変換を適用する。逆変換後の2×4のクロマDCブロックをfdc2x4'''とすると、このクロマDCブロックに対する逆変換は、以下の式(84)のように表される。
Figure 0004924708
このクロマDC係数を図4に示したような4×4ブロックの(0,0)係数とし、各4×4ブロックの逆変換を行う。逆変換されたクロマDCであるfdc2x4'''を(0,0)係数とする4×4ブロックの各係数をF'4x4とし、逆変換後の4×4ブロックに復号差分信号をF''4x4とすると、逆変換は、以下の式(85)のように表される。
Figure 0004924708
(2−5−3)
続いて、逆直交変換器71cの動作を説明する。この逆直交変換器71cは、クロマフォーマット信号が4:4:4フォーマットを示し、色空間信号がYCbCr、RGB又はXYZを示す画像信号に対して逆直交変換を行う。
より詳しくは、4×4DCブロックに対して4×4逆変換を適用する。逆変換後の4×4のクロマDCブロックをfdc4x4'''とすると、このクロマDCブロックに対する逆変換は、以下の式(86)のように表される。
Figure 0004924708
このクロマDC係数をAC係数の4×4ブロックの(0,0)係数とし、各4×4ブロックの逆変換を行う。逆変換されたクロマDCであるfdc4x4'''を(0,0)係数とする4×4ブロックの各係数をF'4x4とし、逆変換後の4×4ブロックに復号差分信号をF''4x4とすると、逆変換は、以下の式(87)のように表される。
Figure 0004924708
(2−6)その他のブロック
クロマフォーマット信号及び色空間信号は、可逆符号化部16にも供給されて可変長符号化又は算術符号化され、画像圧縮情報に含められて出力される。
このクロマフォーマット信号及び色空間信号は、例えば以下のようなシンタクスで符号化される。
seq_parameter_set_rbsp() {
:
chroma_format_idc u(2)
color_space_idc u(2)
:
}
ここで、u(2)として符号化されるシンタクスは、例えば「001x」という可変長符号で符号化される。このうち、x,xが符号化されるシンタクスの2ビットに相当する。
(3)画像情報復号装置の構成及び動作
上述した画像情報符号化装置10に対応する画像情報復号装置の概略構成を図8に示す。図8に示すように、画像情報復号装置80は、蓄積バッファ81と、可逆復号部82と、逆量子化部83と、逆直交変換部84と、加算器85と、画像並び替えバッファ86と、D/A(Digital/Analogue)変換部87と、動き予測・補償部88と、フレームメモリ89と、イントラ予測部90とにより構成されている。
図8において、入力となる画像圧縮情報は、先ず蓄積バッファ81に格納された後、可逆復号部82に転送される。可逆復号部82は、定められた画像圧縮情報のフォーマットに基づき、可変長復号又は算術復号等の処理を行う。また可逆復号部82は、当該フレームがインター符号化されたものである場合には、画像圧縮情報のヘッダ部に格納された動きベクトル情報をも復号し、その情報を動き予測・補償部88へ転送する。さらに可逆復号部82は、クロマフォーマット信号及び色空間信号を復号し、逆量子化部83、逆直交変換部84及びイントラ予測部90に供給する。
可逆復号部82の出力となる量子化された変換係数は、逆量子化部83に供給され、ここで変換係数として出力される。逆直交変換部84は、変換係数は、定められた画像圧縮情報のフォーマットに基づき、逆離散コサイン変換又は逆カルーネン・レーベ変換等の可逆変換を施す。当該フレームがイントラ符号化されたものである場合には、逆直交変換処理が施された画像情報は、画像並び替えバッファ86に格納され、D/A変換処理の後に出力される。
ここで、当該フレーム又はマクロブロックがイントラ符号化されたものである場合、可逆復号部82で復号されたクロマフォーマット信号及び色空間信号に基づいて、上述と同様の逆量子化方法、逆直交変換方法、イントラ予測方法を用いて復号する。
一方、当該フレームがインター符号化されたものである場合には、可逆復号処理が施された動きベクトル情報、及びフレームメモリ89に格納された画像情報を元に参照画像が生成され、この参照画像と逆直交変換部84の出力とが加算器85において合成される。その他の処理はイントラ符号化されたフレームと同様であるため、説明を省略する。
入力画像信号が4:2:0フォーマット、YCbCr色空間の場合のみならず、4:2:2フォーマット、4:4:4フォーマット、RGB色空間、XYZ色空間等の場合にも、画像内予測符号化を用いて、効率よく符号化することができる。
10 画像情報符号化装置、11 A/D変換部、12 画像並び替えバッファ、13 加算器、14 直交変換部、15 量子化部、16 可逆符号化部、17 蓄積バッファ、18 逆量子化部、19 逆直交変換部、20 加算器、21 フレームメモリ、22 動き予測・補償部、23 イントラ予測部、24 レート制御部、80 画像情報復号装置、81 蓄積バッファ、82 可逆復号部、83 逆量子化部、84 逆直交変換部、85 加算器、86 画像並び替えバッファ、87 D/A変換部、88 動き予測・補償部、89 フレームメモリ、90 イントラ予測部

Claims (2)

  1. 画像信号の色差信号の解像度を示すクロマフォーマット信号が4:2:2フォーマットである場合に、4×4画素ブロック単位で整数精度直交変換された4×4ブロックのDC成分のみを集めて構成された2×4ブロックのクロマDCブロックに対して2×4ブロック単位で直交変換されることにより得られる変換係数を、2×4ブロック単位で逆直交変換し、逆直交変換された係数を、8×8画素のブロックを縦方向に並べた8×16画素ブロックに対応する8つの4×4ブロックの各DC係数として逆直交変換する逆変換手段と、
    上記逆変換手段により変換された係数を用いて、8×8画素のブロックを縦方向に並べた8×16画素ブロック単位で、予測モードがDCモードの場合に、8×8ブロックに分けて上記色差信号を画像内予測復号する際の予測画像を生成する画像内予測手段と
    を備える復号装置。
  2. 画像信号の色差信号の解像度を示すクロマフォーマット信号が4:2:2フォーマットである場合に、4×4画素ブロック単位で整数精度直交変換された4×4ブロックのDC成分のみを集めて構成された2×4ブロックのクロマDCブロックに対して2×4ブロック単位で直交変換されることにより得られる変換係数を、2×4ブロック単位で逆直交変換し、逆直交変換された係数を、8×8画素のブロックを縦方向に並べた8×16画素ブロックに対応する8つの4×4ブロックの各DC係数として逆直交変換する逆変換工程と、
    上記逆変換工程により変換された係数を用いて、8×8画素のブロックを縦方向に並べた8×16画素ブロック単位で、予測モードがDCモードの場合に、8×8ブロックに分けて上記色差信号を画像内予測復号する際の予測画像を生成する画像内予測工程と
    を有する復号方法。
JP2009298736A 2009-12-28 2009-12-28 復号装置及び方法 Expired - Fee Related JP4924708B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009298736A JP4924708B2 (ja) 2009-12-28 2009-12-28 復号装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009298736A JP4924708B2 (ja) 2009-12-28 2009-12-28 復号装置及び方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003277128A Division JP4617644B2 (ja) 2003-07-18 2003-07-18 符号化装置及び方法

Related Child Applications (4)

Application Number Title Priority Date Filing Date
JP2011273675A Division JP5375935B2 (ja) 2011-12-14 2011-12-14 符号化装置及び方法
JP2011273676A Division JP5375936B2 (ja) 2011-12-14 2011-12-14 復号装置及び方法
JP2011273678A Division JP5375938B2 (ja) 2011-12-14 2011-12-14 復号装置及び方法
JP2011273677A Division JP5375937B2 (ja) 2011-12-14 2011-12-14 符号化装置及び方法

Publications (2)

Publication Number Publication Date
JP2010104026A JP2010104026A (ja) 2010-05-06
JP4924708B2 true JP4924708B2 (ja) 2012-04-25

Family

ID=42294171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009298736A Expired - Fee Related JP4924708B2 (ja) 2009-12-28 2009-12-28 復号装置及び方法

Country Status (1)

Country Link
JP (1) JP4924708B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9961343B2 (en) 2011-10-24 2018-05-01 Infobridge Pte. Ltd. Method and apparatus for generating reconstructed block
HUE056519T2 (hu) 2011-10-24 2022-02-28 Innotive Ltd Eljárás és készülék intra predikciósmód dekódolására
DK3402201T3 (da) 2011-10-24 2022-10-31 Gensquare Llc Fremgangsmåde til dekodning af et billede

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000023195A (ja) * 1998-06-26 2000-01-21 Sony Corp 画像符号化装置及び方法、並びに画像復号装置及び方法、並びに符号化データ提供媒体
JP3413721B2 (ja) * 1998-06-26 2003-06-09 ソニー株式会社 画像符号化方法及び装置、並びに画像復号方法及び装置
JP4560694B2 (ja) * 2000-04-05 2010-10-13 ソニー株式会社 符号化装置及びその方法
JP2003324731A (ja) * 2002-04-26 2003-11-14 Sony Corp 符号化装置、復号装置、画像処理装置、それらの方法およびプログラム

Also Published As

Publication number Publication date
JP2010104026A (ja) 2010-05-06

Similar Documents

Publication Publication Date Title
JP4617644B2 (ja) 符号化装置及び方法
JP6371796B2 (ja) 映像復号化装置
KR101246294B1 (ko) 영상의 인트라 예측 부호화, 복호화 방법 및 장치
WO2011125729A1 (ja) 画像処理装置と画像処理方法
JP2004140473A (ja) 画像情報符号化装置、復号化装置並びに画像情報符号化方法、復号化方法
JP5375938B2 (ja) 復号装置及び方法
JP4924708B2 (ja) 復号装置及び方法
JP5375935B2 (ja) 符号化装置及び方法
JP4983908B2 (ja) 復号装置及び方法
JP4983907B2 (ja) 符号化装置及び方法
JP5375937B2 (ja) 符号化装置及び方法
JP5375936B2 (ja) 復号装置及び方法
Agawane Implementation and evaluation of residual color transform for 4: 4: 4 lossless RGB coding

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120123

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4924708

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees