JP5234368B2

JP5234368B2 - 画像処理装置および方法

Info

Publication number: JP5234368B2
Application number: JP2009226220A
Authority: JP
Inventors: 数史佐藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2009-09-30
Filing date: 2009-09-30
Publication date: 2013-07-10
Anticipated expiration: 2029-09-30
Also published as: US20120219216A1; US20150131905A1; WO2011040302A1; US9510014B2; US20150131735A1; US10911772B2; US20170048542A1; US9544614B2; CN102577388B; CN104639945A; US9979981B2; CN104639945B; US20140185946A1; US20150131737A1; US9503748B2; JP2011077761A; US9510015B2; CN104539969B; CN104539969A; US20180199056A1

Description

本発明は画像処理装置および方法に関し、特に、色差信号における符号化効率の改善およびメモリアクセスのためのアドレス計算の削減を実現するようにした画像処理装置および方法に関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮する符号化方式を採用して画像を圧縮符号する装置が普及しつつある。この符号化方式には、例えば、MPEG（Moving Picture Experts Group）などがある。

特に、MPEG2(ISO/IEC 13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準である。例えば、MPEG2は、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4乃至8Mbpsの符号量（ビットレート）が割り当てられる。また、MPEG2圧縮方式を用いることにより、例えば1920×1088画素を持つ高解像度の飛び越し走査画像であれば18乃至22 Mbpsの符号量（ビットレート）が割り当てられる。これにより、高い圧縮率と良好な画質の実現が可能である。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。

さらに、近年、当初テレビ会議用の画像符号化を目的として、H．26L (ITU-T Q6/16 VCEG）という標準の規格化が進んでいる。H．26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH．26Lをベースに、H．26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われている。標準化のスケジュールとしては、2003年3月にはH．264及びMPEG-4 Part10 （Advanced Video Coding、以下H．264/AVCと記す）という国際標準となっている。

さらに、その拡張として、RGBや4:2:2、4:4:4といった、業務用に必要な符号化ツールや、MPEG-2で規定されていた8x8DCTや量子化マトリクスをも含んだFRExt (Fidelity Range Extension) の標準化が2005年2月に完了した。これにより、H．264/AVCを用いて、映画に含まれるフィルムノイズをも良好に表現することが可能な符号化方式となって、Blu-Ray Disc（商標）等の幅広いアプリケーションに用いられる運びとなった。

しかしながら、昨今、ハイビジョン画像の4倍の、4000×2000画素程度の画像を圧縮したい、あるいは、インターネットのような、限られた伝送容量の環境において、ハイビジョン画像を配信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、先述の、ITU-T傘下のVCEG (=Video Coding Expert Group) において、符号化効率の改善に関する検討が継続され行なわれている。

ここで、H．264/AVC方式の動き予測補償においては、１／４画素精度の予測・補償処理を行うことにより、予測効率を向上させている。

例えば、MPEG2方式においては、線形内挿処理により１／２画素精度の動き予測・補償処理が行われている。これに対して、H．264/AVC方式においては、内挿フィルタとして、６タップのFIR (Finite Impulse Response Filter)フィルタを用いた１／４画素精度の予測・補償処理が行われている。

図１は、H．264/AVC方式における１／４画素精度の予測・補償処理を説明する図である。H．264/AVC方式においては、６タップのFIR (Finite Impulse Response Filter)フィルタを用いた１／４画素精度の予測・補償処理が行われている。

図１の例において、位置Ａは、整数精度画素の位置、位置ｂ，ｃ，ｄは、１／２画素精度の位置、位置ｅ１，ｅ２，ｅ３は、１／４画素精度の位置を示している。まず、以下においては、Clip()を次の式（１）のように定義する。

なお、入力画像が８ビット精度である場合、max_pixの値は255となる。

位置ｂおよびｄにおける画素値は、６タップのFIRフィルタを用いて、次の式（２）のように生成される。

位置ｃにおける画素値は、水平方向および垂直方向に６タップのFIRフィルタを適用し、次の式（３）のように生成される。

なお、Clip処理は、水平方向および垂直方向の積和処理の両方を行った後、最後に１度のみ実行される。

位置ｅ１乃至ｅ３は、次の式（４）のように線形内挿により生成される。

図２は、H．264/AVC方式における色差信号に関する予測・補償処理を説明する図である。H．264/AVC方式においては、図１を参照して上述したように、１／４画素精度の予測・補償処理が行われるが、4:2:0信号の場合、色差信号に関しては、１／８画素精度の予測・補償処理が行われる。

図２の例において、黒丸は、フレームメモリに格納されている整数画素精度の画素であり、各黒丸に付されているＡ乃至Ｄは、各画素の画素値を表している。白丸の位置（ｄ^x，ｄ^y）を、Ａ乃至Ｄが付される画素により囲まれる矩形領域内で、動きベクトル情報が１／８画素精度で指し示す位置であるとすると、白丸の位置における予測画素値ｖは、次の式（５）のように生成される。

ただし、ｓ＝８である。

また、上述したような小数画素精度で求められる動きベクトルを、どのような処理により選択するかも、符号化効率の高い圧縮画像を得るためには重要である。この処理の一例としては、非特許文献１において公開されているJM(Joint Model)と呼ばれる参照ソフトウエア（reference software）に実装されている方法が挙げられる。

次に、図３を参照して、JMにおいて実装されている動き探索方法について説明する。

図３の例において、画素Ａ乃至Ｉは、整数画素精度の画素値を有する画素（以下、整数画素精度の画素と称する）を表している。画素１乃至８は、画素Ｅ周辺における１／２画素精度の画素値を有する画素（以下、１／２画素精度の画素と称する）を表している。画素ａ乃至ｈは、画素６周りの１／４画素精度の画素値を有する画素（以下、１／４画素精度の画素と称する）を表している。

JMでは、第１のステップとして、所定の探索範囲内において、SAD(Sum of Absolute Difference)などのコスト関数値を最小にする整数画素精度の動きベクトルが求められる。これにより、求められた動きベクトルに対する画素が、画素Ｅであるとする。

次に、第２のステップとして、画素Ｅ、および画素Ｅ周辺の１／２画素精度の画素１乃至８のうち、上述したコスト関数値を最小にする画素値の画素が求められ、この画素（図２の例の場合、画素６）が、１／２画素精度の最適動きベクトルに対する画素とされる。

そして、第３のステップとして、画素６、および画素６周辺の１／４画素精度の画素ａ乃至ｈのうち、上述したコスト関数値を最小にする画素値の画素が求められる。これにより、求められた画素に対する動きベクトルが、１／４画素精度の最適動きベクトルとなる。

以上のように、H．264/AVC方式において１／４画素精度の予測・補償処理が行われるが、この１／４画素精度の予測・補償処理に対して、さらに符号化効率を向上させるための技術が複数提案されている。

例えば、H．264/AVC方式において、図１を参照して上述した小数画素精度の動きベクトルに対するサンプリング位置の画素値を生成するための内挿フィルタのフィルタ係数は、非特許文献２に記載のように、予め定められたものであった。

そこで、非特許文献３においては、このフィルタ係数を、各対象フレームに対して、予測残差が最小となるよう、適応的に切り替えることが提案されている。

すなわち、非特許文献３においては、まず、第１のステップとして、通常のH．264/AVC方式の動き予測処理が行われ、それぞれの動き補償ブロックに対して、動きベクトル値が算出される。

第２のステップとして、第１のステップで求められた動きベクトル値に対して、動き残差を最小にするよう、フィルタの最適化が行われる。

そして、第３のステップとして、第２のステップで求められたフィルタ係数が用いられて、再び動き探索が行われ、動きベクトル値が更新される。これにより、符号化効率を向上させることができる。

以上のステップをさらに繰り返すことにより、フィルタ係数と動きベクトル値の最適化を行うこともできる。

また、上述したように、H．264/AVC方式において、マクロブロックサイズは１６×１６画素である。しかしながら、マクロブロックサイズを１６×１６画素とするのは、次世代符号化方式の対象となるようなUHD(Ultra High Definition;4000×2000画素)といった大きな画枠に対しては最適ではない。

そこで、非特許文献４などにおいては、マクロブロックサイズを、例えば、３２×３２画素といった大きさに拡張することも提案されている。

なお、上述した図１乃至図３は、以下、本発明を説明する図としても用いられる。

H.264/AVC Software Coordination、Institut Nachrichtentechnik Heinrich-Hertz-Institut、［平成２１年８月２４日検索］、インターネット＜URL： http://iphome.hhi.de/suehring/tml/index.htm＞ "8.4.2.2.1 Luma sample interpolation process", "ITU-T Recommendation H.264 Advanced video coding for generic audiovisual",P162-P164 November 2007 "Prediction of P- and B- Frames Using a Two-dimensional Non-separable Adaptive Wiener Interpolation for H.264/AVC",VCEG-AD08,ITU-Telecommunications Standardization Sector STUDY GROUP Question 6 Video coding Experts Group(VCEG), 23-27 Oct 2006 "Video Coding Using Extended Block Sizes",VCEG-AD09,ITU-Telecommunications Standardization Sector STUDY GROUP Question 16 - Contribution 123, Jan 2009

ところで、輝度信号の動き補償ブロックが４×４画素である場合、入力信号が4:2:0であるなら、色差信号の動き補償ブロックは、２×２画素になる。

しかしながら、H．264/AVC方式において定められている直交変換は、４×４画素が最小単位である。このため、色差信号の動き補償ブロックが２×２画素である場合、直交変換ブロック内に、動き補償ブロックの境界が存在することになってしまう。

さらに、動き補償ブロックが２×２画素であると、その単位で、メモリアクセスのためのアドレス計算を行わなければならず、符号化側および復号側の装置の双方において、メモリバンド幅を圧迫してしまう。

このような事実は、輝度信号の動き補償ブロックが４×４画素である場合に限らず、８×４画素や４×８画素の場合にも存在する。

本発明は、このような状況に鑑みてなされたものであり、色差信号における符号化効率の改善およびメモリアクセスのためのアドレス計算の削減を実現することができるものである。

本発明の第１の側面の画像処理装置は、符号化対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルを生成する色差動きベクトル生成手段と、前記色差動きベクトル生成手段により生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像を生成する予測画像生成手段と、前記予測画像生成手段により生成された予測画像を用いて、前記色差ブロックを符号化する符号化手段とを備える。

前記色差動きベクトル生成手段は、前記単一の色差ブロックの動きベクトルを、前記複数の輝度ブロックの動きベクトルの少なくとも１つを用いて生成することができる。

前記色差動きベクトル生成手段は、前記単一の色差ブロックの動きベクトルを、前記複数の輝度ブロックの動きベクトルの少なくとも１つを用いた関数により生成することができる。

前記色差動きベクトル生成手段は、前記色差ブロックが前記直交変換のブロックサイズ以上のサイズとなる場合、既存の符号化規格と同じ方法で、前記色差ブロックの動きベクトルを生成することができる。

本発明の第１の側面の画像処理方法は、画像処理装置が、符号化対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルを生成し、生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像を生成し、生成された予測画像を用いて、前記色差ブロックを符号化する。

本発明の第２の側面の画像処理装置は、復号対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルを生成する色差動きベクトル生成手段と、前記色差動きベクトル生成手段により生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像を生成する予測画像生成手段と、前記予測画像生成手段により生成された予測画像を用いて、前記色差ブロックを復号する復号手段とを備える。

前記色差動きベクトル生成手段は、前記色差ブロックが前記直交変換のブロックサイズ以上のサイズとなる場合、既存の符号化規格と同じ方法で、前記色差ブロックの動きベクトルを生成して、前記色差ブロックの予測画像を生成することができる。

本発明の第２の側面の画像処理方法は、画像処理装置が、復号対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルを生成し、生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像を生成し、生成された予測画像を用いて、前記色差ブロックを復号する。

本発明の第１の側面においては、符号化対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルが生成される。そして、生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像を生成し、生成された予測画像を用いて、前記色差ブロックが符号化される。

本発明の第２の側面においては、復号対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルが生成される。そして、生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像が生成され、生成された予測画像を用いて、前記色差ブロックが復号される。

なお、上述の画像処理装置のそれぞれは、独立した装置であっても良いし、１つの画像符号化装置または画像復号装置を構成している内部ブロックであってもよい。

本発明の第１の側面によれば、色差信号における符号化効率を改善することができる。また、本発明の第１の側面によれば、メモリアクセスのためのアドレス計算を削減することができる。

本発明の第２の側面によれば、色差信号における符号化効率を改善することができる。また、本発明の第２の側面によれば、メモリアクセスのためのアドレス計算を削減することができる。

H．264/AVC方式における１／４画素精度の動き予測・補償処理を説明する図である。 H．264/AVC方式における色差信号の動き予測・補償処理を説明する図である。 H．264/AVC方式における動き探索方法を説明する図である。本発明を適用した画像符号化装置の一実施の形態の構成を示すブロック図である。可変ブロックサイズ動き予測・補償処理を説明する図である。マルチ参照フレームの動き予測・補償方式について説明する図である。動きベクトル情報の生成方法の例を説明する図である。図４の動き予測・補償部および色差動きベクトル決定部の構成例を示すブロック図である。色差信号の動き予測処理を説明する図である。図４の画像符号化装置の符号化処理を説明するフローチャートである。図１０のステップＳ２１の予測処理を説明するフローチャートである。図１１のステップＳ３１のイントラ予測処理を説明するフローチャートである。図１１のステップＳ３２の輝度信号を用いたインター動き予測処理を説明するフローチャートである。図１１のステップＳ３４の色差信号に対する動き予測処理を説明するフローチャートである。図４の動き予測・補償部および色差動きベクトル決定部の他の構成例を示すブロック図である。図１１のステップＳ３４の色差信号に対する動き予測処理の他の例を説明するフローチャートである。本発明を適用した画像復号装置の一実施の形態の構成を示すブロック図である。図１７の動き予測・補償部および色差動きベクトル決定部の構成例を示すブロック図である。図１７の画像復号装置の復号処理を説明するフローチャートである。図１９のステップＳ１３８の予測処理を説明するフローチャートである。図２０のステップＳ１７６の色差信号に対する動き補償処理を説明するフローチャートである。図２０のステップＳ１７６の色差信号に対する動き補償の他の例を説明するフローチャートである。拡張されたブロックサイズの例を示す図である。入力信号が4:2:2である場合の例を示す図である。コンピュータのハードウエアの構成例を示すブロック図である。本発明を適用したテレビジョン受像機の主な構成例を示すブロック図である。本発明を適用した携帯電話機の主な構成例を示すブロック図である。本発明を適用したハードディスクレコーダの主な構成例を示すブロック図である。本発明を適用したカメラの主な構成例を示すブロック図である。

以下、図を参照して本発明の実施の形態について説明する。

［画像符号化装置の構成例］
図４は、本発明を適用した画像処理装置としての画像符号化装置の一実施の形態の構成を表している。

この画像符号化装置５１は、例えば、4:2:0フォーマットの入力信号の画像が入力され、H．264及びMPEG-4 Part10（Advanced Video Coding）（以下H．264/AVCと記す）方式をベースに、入力された画像を圧縮符号化する。

図４の例において、画像符号化装置５１は、Ａ／Ｄ変換部６１、画面並べ替えバッファ６２、演算部６３、直交変換部６４、量子化部６５、可逆符号化部６６、蓄積バッファ６７、逆量子化部６８、逆直交変換部６９、演算部７０、デブロックフィルタ７１、フレームメモリ７２、スイッチ７３、イントラ予測部７４、動き予測・補償部７５、色差ブロック判別部７６、色差動きベクトル決定部７７、予測画像選択部７８、およびレート制御部７９により構成されている。

Ａ／Ｄ変換部６１は、入力された画像をＡ／Ｄ変換し、画面並べ替えバッファ６２に出力し、記憶させる。画面並べ替えバッファ６２は、記憶した表示の順番のフレームの画像を、ＧＯＰ（Group of Picture）に応じて、符号化のためのフレームの順番に並べ替える。

演算部６３は、画面並べ替えバッファ６２から読み出された画像から、予測画像選択部７８により選択されたイントラ予測部７４からの予測画像または動き予測・補償部７５からの予測画像を減算し、その差分情報を直交変換部６４に出力する。直交変換部６４は、演算部６３からの差分情報に対して、離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、その変換係数を出力する。量子化部６５は直交変換部６４が出力する変換係数を量子化する。

量子化部６５の出力となる、量子化された変換係数は、可逆符号化部６６に入力され、ここで可変長符号化、算術符号化等の可逆符号化が施され、圧縮される。

可逆符号化部６６は、イントラ予測を示す情報をイントラ予測部７４から取得し、インター予測モードを示す情報などを動き予測・補償部７５から取得する。なお、イントラ予測を示す情報およびインター予測を示す情報は、以下、それぞれ、イントラ予測モード情報およびインター予測モード情報とも称する。

可逆符号化部６６は、量子化された変換係数を符号化するとともに、イントラ予測を示す情報、インター予測モードを示す情報などを符号化し、圧縮画像におけるヘッダ情報の一部とする。可逆符号化部６６は、符号化したデータを蓄積バッファ６７に供給して蓄積させる。

例えば、可逆符号化部６６においては、可変長符号化または算術符号化等の可逆符号化処理が行われる。可変長符号化としては、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などがあげられる。算術符号化としては、CABAC（Context-Adaptive Binary Arithmetic Coding）などがあげられる。

蓄積バッファ６７は、可逆符号化部６６から供給されたデータを、H．264/AVC方式で符号化された圧縮画像として、例えば、後段の図示せぬ記録装置や伝送路などに出力する。

また、量子化部６５より出力された、量子化された変換係数は、逆量子化部６８にも入力され、逆量子化された後、さらに逆直交変換部６９において逆直交変換される。逆直交変換された出力は演算部７０により予測画像選択部７８から供給される予測画像と加算されて、局部的に復号された画像となる。デブロックフィルタ７１は、復号された画像のブロック歪を除去した後、フレームメモリ７２に供給し、蓄積させる。フレームメモリ７２には、デブロックフィルタ７１によりデブロックフィルタ処理される前の画像も供給され、蓄積される。

スイッチ７３はフレームメモリ７２に蓄積された参照画像を動き予測・補償部７５またはイントラ予測部７４に出力する。

この画像符号化装置５１においては、例えば、画面並べ替えバッファ６２からのＩピクチャ、Ｂピクチャ、およびＰピクチャが、イントラ予測（イントラ処理とも称する）する画像として、イントラ予測部７４に供給される。また、画面並べ替えバッファ６２から読み出されたＢピクチャおよびＰピクチャが、インター予測（インター処理とも称する）する画像として、動き予測・補償部７５に供給される。

イントラ予測部７４は、画面並べ替えバッファ６２から読み出されたイントラ予測する画像とフレームメモリ７２から供給された参照画像に基づいて、候補となる全てのイントラ予測モードのイントラ予測処理を行い、予測画像を生成する。

その際、イントラ予測部７４は、候補となる全てのイントラ予測モードに対してコスト関数値を算出し、算出したコスト関数値が最小値を与えるイントラ予測モードを、最適イントラ予測モードとして選択する。このコスト関数値についての詳細は、図１２を参照して後述される。

イントラ予測部７４は、最適イントラ予測モードで生成された予測画像とそのコスト関数値を、予測画像選択部７８に供給する。イントラ予測部７４は、予測画像選択部７８により最適イントラ予測モードで生成された予測画像が選択された場合、最適イントラ予測モードを示す情報を、可逆符号化部６６に供給する。可逆符号化部６６は、この情報を符号化し、圧縮画像におけるヘッダ情報の一部とする。

動き予測・補償部７５には、画面並べ替えバッファ６２から読み出されたインター処理する画像と、スイッチ７３を介してフレームメモリ７２から参照画像が供給される。動き予測・補償部７５は、輝度信号を用いて、候補となる全てのインター予測モードのブロックの動き予測を行い、各ブロックの動きベクトルを生成し、蓄積する。

動き予測・補償部７５は、予測した各ブロックの動きベクトルを用いて、候補となる全てのインター予測モードに対してコスト関数値を算出する。動き予測・補償部７５は、算出したコスト関数値のうち、最小値を与えるブロックの予測モードを、最適インター予測モードとして決定し、決定した予測モードの情報を色差ブロック判別部７６に供給する。

動き予測・補償部７５は、最適インター予測モードの動きベクトルに基づいて参照画像に補償処理を施し、対象となる輝度信号のブロック（以下、輝度ブロックまたは輝度信号ブロックとも適宜称する）の予測画像を生成する。動き予測・補償部７５は、色差動きベクトル決定部７７から制御信号が供給された場合、H．264/AVC方式により、対象となる色差信号のブロック（以下、色差ブロックまたは色差信号ブロックとも適宜称する）の動きベクトルを生成する。そして、動き予測・補償部７５は、生成した動きベクトルを用いて、色差信号ブロックの予測画像を生成する。また、動き予測・補償部７５は、色差動きベクトル決定部７７から色差動きベクトル情報が供給された場合、その情報が示す色差信号の動きベクトルを用いて、色差信号ブロックの予測画像を生成する。

動き予測・補償部７５は、生成された最適インター予測モードの対象ブロック（輝度信号および色差信号ブロック）の予測画像とそのコスト関数値を、予測画像選択部７８に供給する。動き予測・補償部７５は、予測画像選択部７８により最適インター予測モードの対象ブロックの予測画像が選択された場合、最適インター予測モードを示す情報（インター予測モード情報）を可逆符号化部６６に出力する。

このとき、動きベクトル情報、参照フレーム情報なども可逆符号化部６６に出力される。可逆符号化部６６は、動き予測・補償部７５からの情報をやはり可変長符号化、算術符号化といった可逆符号化処理し、圧縮画像のヘッダ部に挿入する。

色差ブロック判別部７６は、動き予測・補償部７５からの予測モードの情報が示す輝度信号ブロックのブロックサイズに応じて、色差信号ブロックのブロックサイズを判別する。色差ブロック判別部７６は、判別した色差ブロックサイズの情報を、色差動きベクトル決定部７７に供給する。

図４の例においては、入力信号が4:2:0であるので、色差ブロック判別部７６においては、輝度信号ブロックのブロックサイズが８×８画素である場合、対応する色差信号ブロックのブロックサイズが、４×４画素であると判別される。

色差動きベクトル決定部７７は、色差ブロック判別部７６からの色差ブロックサイズの情報に基づいて、色差信号ブロックが、２つのカテゴリのうちのどちらに属するかを分類する。例えば、第１のカテゴリは、色差信号ブロックのうち、４×４画素以上のブロックサイズのブロックが属する。第２のカテゴリは、色差信号ブロックのうち、４×４画素より小さいブロックサイズのブロックが属する。

色差動きベクトル決定部７７は、色差信号ブロックを第１のカテゴリに分類した場合、動き予測・補償部７５に制御信号を供給し、H．264/AVC方式による色差信号の動き予測を行わせる。これに対して、色差動きベクトル決定部７７は、色差信号ブロックを第２のカテゴリに分類した場合、複数の輝度信号ブロックに対して単一の色差信号ブロックを対応させ、その単位で、色差信号の動きベクトルを生成する。例えば、複数の輝度信号ブロックに対応させた単一の色差信号ブロックの動きベクトルは、動き予測・補償部７５により生成され、蓄積されている複数の輝度信号ブロックの動きベクトルの少なくとも１つを用いて生成される。生成された色差動きベクトルの情報は、動き予測・補償部７５に供給される。

なお、複数の輝度信号ブロックに対応させた単一の色差信号ブロックに対して、動き探索を行い、上述したように複数の輝度信号ブロックの動きベクトルを用いて生成された動きベクトルとの差分情報を生成して、それを復号側に送るようにしてもよい。この場合、生成された差分情報は、点線に示されるように、可逆符号化部６６に供給される。

予測画像選択部７８は、イントラ予測部７４または動き予測・補償部７５より出力された各コスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードから、最適予測モードを決定する。そして、予測画像選択部７８は、決定された最適予測モードの予測画像を選択し、演算部６３，７０に供給する。このとき、予測画像選択部７８は、予測画像の選択情報を、イントラ予測部７４または動き予測・補償部７５に供給する。

レート制御部７９は、蓄積バッファ６７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部６５の量子化動作のレートを制御する。

なお、以下、単に、ブロック、輝度信号ブロック、色差信号ブロックなどと記載する場合には、動き予測・補償のブロックを表すものとする。

［H．264/AVC方式の説明］
図５は、H．264/AVC方式における動き予測・補償のブロックサイズの例を示す図である。H．264/AVC方式においては、ブロックサイズを可変にして、動き予測・補償が行われる。

図５の上段には、左から、１６×１６画素、１６×８画素、８×１６画素、および８×８画素のパーティションに分割された１６×１６画素で構成されるマクロブロックが順に示されている。また、図５の下段には、左から、８×８画素、８×４画素、４×８画素、および４×４画素のサブパーティションに分割された８×８画素のパーティションが順に示されている。

すなわち、H．264/AVC方式においては、１つのマクロブロックを、１６×１６画素、１６×８画素、８×１６画素、あるいは８×８画素のいずれかのパーティションに分割して、それぞれ独立した動きベクトル情報を持つことが可能である。また、８×８画素のパーティションに関しては、８×８画素、８×４画素、４×８画素、あるいは４×４画素のいずれかのサブパーティションに分割し、それぞれ独立した動きベクトル情報を持つことが可能である。

図６は、H．264/AVC方式におけるマルチ参照フレームの予測・補償処理を説明する図である。H．264/AVC方式においては、マルチ参照フレーム(Multi-Reference Frame) の動き予測・補償方式が定められている。

図６の例においては、いまから符号化される対象フレームＦnと、符号化済みのフレームＦn-5,…,Ｆn-1が示されている。フレームＦn-1は、時間軸上、対象フレームＦnの１つ前のフレームであり、フレームＦn-2は、対象フレームＦnの２つ前のフレームであり、フレームＦn-3は、対象フレームＦnの３つ前のフレームである。また、フレームＦn-4は、対象フレームＦnの４つ前のフレームであり、フレームＦn-5は、対象フレームＦnの５つ前のフレームである。一般的には、対象フレームＦnに対して時間軸上に近いフレームほど、小さい参照ピクチャ番号（ref_id）が付加される。すなわち、フレームＦn-1が一番参照ピクチャ番号が小さく、以降、Fn-2,…, Ｆn-5の順に参照ピクチャ番号が小さい。

対象フレームＦnには、ブロックＡ1とブロックＡ2が示されており、ブロックＡ1は、２つ前のフレームＦn-2のブロックＡ1’と相関があるとされて、動きベクトルＶ1が探索されている。また、ブロックＡ2は、４つ前のフレームＦn-4のブロックＡ1’と相関があるとされて、動きベクトルＶ2が探索されている。

以上のように、H．264/AVC方式においては、複数の参照フレームをメモリに格納しておき、１枚のフレーム（ピクチャ）において、異なる参照フレームを参照することが可能である。すなわち、例えば、ブロックＡ1がフレームＦn-2を参照し、ブロックＡ2がフレームＦn-4を参照しているというように、１枚のピクチャにおいて、ブロック毎にそれぞれ独立した参照フレーム情報（参照ピクチャ番号（ref_id））を持つことができる。

ここで、ブロックとは、図５を参照して上述した１６×１６画素、１６×８画素、８×１６画素、および８×８画素のパーティションのいずれかを示す。８×８サブブロック内における参照フレームは同一でなければならない。

H．264/AVC方式においては、図１を参照して上述した１／４画素精度の動き予測・補償処理、および図５および図６を参照して上述したような動き予測・補償処理が行われることにより、膨大な動きベクトル情報が生成される。この膨大な動きベクトル情報をこのまま符号化することは、符号化効率の低下を招いてしまう。これに対して、H．264/AVC方式においては、図７に示す方法により、動きベクトルの符号化情報の低減が実現されている。

図７は、H．264/AVC方式による動きベクトル情報の生成方法について説明する図である。

図７の例において、これから符号化される対象ブロックＥ（例えば、１６×１６画素）と、既に符号化済みであり、対象ブロックＥに隣接するブロックＡ乃至Ｄが示されている。

すなわち、ブロックＤは、対象ブロックＥの左上に隣接しており、ブロックＢは、対象ブロックＥの上に隣接しており、ブロックＣは、対象ブロックＥの右上に隣接しており、ブロックＡは、対象ブロックＥの左に隣接している。なお、ブロックＡ乃至Ｄが区切られていないのは、それぞれ、図４で上述した１６×１６画素乃至４×４画素のうちのいずれかの構成のブロックであることを表している。

例えば、Ｘ（＝Ａ，Ｂ，Ｃ，Ｄ，Ｅ）に対する動きベクトル情報を、mv_Xで表す。まず、対象ブロックＥに対する予測動きベクトル情報pmv_Eは、ブロックＡ，Ｂ，Ｃに関する動きベクトル情報を用いて、メディアン予測により次の式（６）のように生成される。

pmv_E = med(mv_A,mv_B,mv_C) ・・・（６）

ブロックＣに関する動きベクトル情報が、画枠の端であったり、あるいは、まだ符号化されていないなどの理由により、利用可能でない（unavailableである）場合がある。この場合には、ブロックＣに関する動きベクトル情報は、ブロックＤに関する動きベクトル情報で代用される。

対象ブロックＥに対する動きベクトル情報として、圧縮画像のヘッダ部に付加されるデータmvd_Eは、pmv_Eを用いて、次の式（７）のように生成される。

mvd_E = mv_E - pmv_E ・・・（７）

なお、実際には、動きベクトル情報の水平方向、垂直方向のそれぞれの成分に対して、独立に処理が行われる。

このように、予測動きベクトル情報を生成し、隣接するブロックとの相関で生成された予測動きベクトル情報と動きベクトル情報との差分を、圧縮画像のヘッダ部に付加することにより、動きベクトル情報が低減される。

［動き予測・補償部および色差動きベクトル決定部の構成例］
図８は、動き予測・補償部７５および色差動きベクトル決定部７７の詳細な構成例を示すブロック図である。なお、図８においては、図４のスイッチ７３が省略されている。

図８の例において、動き予測・補償部７５は、動き探索部８１、モード判定部８２、および動き補償部８３により構成されている。

色差動きベクトル決定部７７は、ブロックカテゴライズ部９１、および色差動きベクトル生成部９２により構成されている。

フレームメモリ７２からの参照画像画素値は、動き探索部８１、モード判定部８２、および動き補償部８３に供給されている。また、画面並べ替えバッファ６２からのインター処理する画像（入力画像）画素値が、動き探索部８１およびモード判定部８２に供給されている。

動き探索部８１は、インター処理する画像および整数画素精度の参照画像画素値を用いて、候補となる全てのインター予測モードについての輝度信号の各対象ブロックの動き探索を行う。なお、動き探索部８１においては、図３を参照して上述したJM(Joint Model)に実装されている動き探索方法に基づき、整数画素精度の動きベクトルが求められて、小数画素精度の動きベクトルが求められる。動き探索部８１により輝度信号の各対象ブロックについて求められた各動きベクトル情報は、モード判定部８２に供給される。

モード判定部８２は、インター処理する画像および整数画素精度の参照画像画素値を用いて、動き探索部８１により動きベクトルが求められた候補となる全てのインター予測モードについて、図１２を参照して後述するコスト関数値を算出する。モード判定部８２は、算出したコスト関数値が最小値を与えるインター予測モードを、その対象ブロックの最適インター予測モードとして決定する。

モード判定部８２は、決定した最適インター予測モードの情報と、それに対応する動きベクトル情報を、動き補償部８３に供給する。モード判定部８２は、決定した最適インター予測モードの情報を、色差ブロック判別部７６にも供給する。

さらに、モード判定部８２は、予測画像選択部７８により最適インター予測モードの予測画像が選択された場合、最適インター予測モードの情報、コスト関数値の算出の際に得られた最適インター予測モードに対応する動きベクトルの差分情報、および参照フレーム情報などを、可逆符号化部６６に供給する。

動き補償部８３は、モード判定部８２からの最適インター予測モードの動きベクトルに基づいて参照画像に補償処理を施し、対象となる輝度信号ブロックの予測画像を生成する。また、動き補償部８３は、ブロックカテゴライズ部９１から制御信号が供給された場合、H．264/AVC方式により、色差信号の動きベクトルを生成し、生成した動きベクトルを用いて、補償処理を行い、対象となる色差信号ブロックの予測画像を生成する。動き補償部８３は、色差動きベクトル生成部９２から色差動きベクトル情報が供給された場合、その情報が示す色差信号の動きベクトルを用いて、補償処理を行い、対象となる色差信号ブロックの予測画像を生成する。

動き補償部８３は、生成された最適インター予測モードの対象ブロックの予測画像とそのコスト関数値を、予測画像選択部７８に供給する。なお、このコスト関数値は、モード判定部８２より算出されたものを供給するようにしてもよいし、動き補償部８３において再度求めなおしてそれを予測画像選択部７８に供給するようにしてもよい。

ブロックカテゴライズ部９１は、色差ブロック判別部７６からの色差ブロックサイズの情報に基づいて、色差信号ブロックが、２つのカテゴリのうちのどちらに属するかを分類する。ブロックカテゴライズ部９１は、色差信号ブロックを第１のカテゴリに分類した場合、動き補償部８３に制御信号を供給し、H．264/AVC方式による色差信号の動き予測を行わせる。また、ブロックカテゴライズ部９１は、色差信号ブロックを第２のカテゴリに分類した場合、色差動きベクトル生成部９２に制御信号を供給し、色差信号の動き予測を行わせる。

色差動きベクトル生成部９２は、ブロックカテゴライズ部９１からの制御信号に基づいて、複数の輝度信号ブロックに対して単一の色差信号ブロックを対応させる。そして、色差動きベクトル生成部９２は、モード判定部８２から取得される複数の輝度信号ブロックの動きベクトル情報を用いて、その対応させた単一の色差信号ブロックの動きベクトルを生成する。色差動きベクトル生成部９２は、生成した色差信号の動きベクトル情報を、動き補償部８３に供給する。

［色差信号の動き予測処理の説明］
ここで、再度、図５を参照して、色差信号の動き予測処理について詳しく説明する。

動き予測・補償部７５においては、図５に示されるいずれかの動きパーティション（ブロック）サイズ、あるいは、サブ動きパーティションサイズによって、動き予測・補償処理が行われる。なお、図５に示されるサイズは、輝度信号に関するもので、入力となる画像信号が4:2:0フォーマットの場合、色差信号に対するブロックの大きさは、水平も垂直も、それぞれ、輝度信号に対するブロックの大きさの１／２となる。

輝度信号が、どのブロックサイズにより動き予測が行われたかに関する情報、すなわち、予測モードの情報は、色差ブロック判別部７６に供給される。色差ブロック判別部７６においては、予測モードの情報が示す輝度信号の対象ブロックのブロックサイズに応じて、色差信号の対象ブロックのブロックサイズが判別され、判別した色差ブロックサイズの情報が、ブロックカテゴライズ部９１に供給される。

ブロックカテゴライズ部９１においては、対象ブロックが、上述した２つのカテゴリに分類される。すなわち、輝度信号におけるブロックサイズのうち、第１のカテゴリには、図５における１６×１６画素、１６×８画素、８×１６画素、８×８画素のいずれかのサイズのブロックが属している。また、輝度信号におけるブロックサイズのうち、第２のカテゴリには、それ以外のサイズのブロックが属している。

そして、入力信号が4:2:0の場合、色差信号におけるブロックサイズのうち、第１のカテゴリには、８×８画素、８×４画素、４×８画素、４×４画素のいずれかのサイズのブロックが属している。また、輝度信号におけるブロックサイズのうち、第２のカテゴリには、それ以外のサイズ（すなわち、４×２画素、２×４画素、２×２画素）のブロックが属している。

ここで、直交変換部６４が施す直交変換のブロックサイズは、４×４画素である。すなわち、ブロックカテゴライズ部９１は、色差信号のブロックを、直交変換のブロックサイズに応じたカテゴリに分類する。換言するに、第１のカテゴリは、直交変換のブロックサイズ以上のサイズのブロックが属するカテゴリであり、第２のカテゴリは、直交変換のブロックサイズより小さいサイズのブロックが属するカテゴリである。

ブロックカテゴライズ部９１は、このように第１のカテゴリに分類された対象ブロックに関しては、H．264/AVC方式による色差信号の動き予測を行わせるための制御信号を、動き補償部８３に供給する。

これに対して、ブロックカテゴライズ部９１は、第２のカテゴリに分類された対象ブロックに関しては、次に図９を参照して説明される色差信号の動き予測を行わせるための制御信号を、色差動きベクトル生成部９２に供給する。

図９は、色差動きベクトル生成部９２における色差信号の動き予測処理を説明する図である。なお、図９Ａは、輝度信号のマクロブロックが４つの４×４画素ブロックで構成される場合の色差信号の例を示している。図９Ｂは、輝度信号のマクロブロックが２つの８×４画素ブロックで構成される場合の色差信号の例を示している。図９Ｃは、輝度信号のマクロブロックが２つの４×８画素ブロックで構成される場合の色差信号の例を示している。

まず、輝度信号のマクロブロックが４つの０乃至１が付された４×４画素ブロックで構成される場合、それらの４つの輝度信号ブロックに、図９Ａに示されるようにＣが付された１つの色差信号の４×４ブロックを対応させる。

参考として、H．264/AVC方式の場合、色差信号は４つの２×２ブロックで構成される。すなわち、４つの輝度信号ブロックに対して、符号化規格において対応する４つの色差信号の２×２ブロックではなく、単一の色差信号の４×４ブロックを対応させなおす。さらに換言すると、４つの輝度信号のブロックに対して、単一の色差信号の４×４ブロックを新たに対応させる。

このとき、４つの輝度信号ブロックに対して、mv₀，mv₁，mv₂，mv₃と、４つの動きベクトル情報が存在する。これらの４つの動きベクトル情報を用いて、色差動きベクトル生成部９２は、上述した１つの４×４ブロックの色差信号の動きベクトル情報mv_cを、次の式（８）のように算出する。

mv_c = f(mv₀，mv₁，mv₂，mv₃)
・・・（８）

式（８）において、f()としては、例えば、平均による処理が行われる。この場合、色差動きベクトル生成部９２においては、水平成分、垂直成分毎に、次の式（９）のように動きベクトル情報mv_cが算出される。

なお、入力信号が4:2:0フォーマットである場合、輝度信号に対し、色差信号は、半分の解像度しかもたないため、式（９）の右辺においては、４による除算（／４）ではなく、８による除算（／８）となる。

あるいは、次の式（１０）のように算出される色差信号についての予測動きベクトル情報pmv_cと、色差信号に対して行われた動き探索による動きベクトル情報mv_cとを用いて、次の式（１１）のように動きベクトル差分情報dmv_cを求める。

pmv_c= f(mv₀，mv₁，mv₂，mv₃)
・・・（１０）
式（１０）においても、f()として、例えば、式（９）に示されたような平均による処理が行われる。

dmv_c = mv_c - pmv_c
・・・（１１）
この動きベクトル差分情報を、復号側に送るようにしてもよい。なお、この詳細は、図１５および図１６を参照して後述される。

上述した色差信号の動き予測処理は、Cb/Crの両方に対して行ってもよいし、あるいは、Cb/Crそれぞれ独立に行ってもよい。すなわち、Cb/Crの両方に対して、単一の動きベクトル情報mv_cを持つようにしてもよいし、あるいは、Cb/CRに対して、独立に、動きベクトル情報mv_cbおよびmv_crを持つようにしてもよい。

なお、上記説明においては、輝度信号についての対象ブロックが４×４画素の場合（図９Ａの場合）について説明したが、輝度信号についての対象ブロックが８×４画素の場合には、図９Ｂに示されるように、０および１が付された２つの輝度信号のブロックに、Ｃが付された１つの色差信号の４×４ブロックを対応させる。そして、２つの８×４ブロックの動きベクトル情報を用いて、１つの４×４ブロックの色差信号の動きベクトル情報mv_cが算出される。

同様に、輝度信号についての対象ブロックが４×８画素の場合には、図９Ｃに示されるように、０および１が付された２つの輝度信号のブロックに、Ｃが付された１つの色差信号の４×４ブロックを対応させる。そして、２つの４×８ブロックの動きベクトル情報を用いて、１つの４×４ブロックの色差信号の動きベクトル情報mv_cが算出される。

ちなみに、H．264/AVC方式の場合、輝度信号が２つの４×８画素で構成されるのに対して、色差信号は、２×４画素のブロック２つで構成される。輝度信号が２つの８×４画素で構成されるのに対して、色差信号は、４×２画素のブロック２つで構成される。

また、上述した式（８）におけるf()としては、平均による処理の他に、例えば、次の式（１２）に示される処理を行ってもよい。なお、もちろん、式（１０）においても、f()として、例えば、式（１２）に示される処理を行ってもよい。

具体的には、色差動きベクトル生成部９２は、４つの輝度信号ブロックに対する動きベクトル情報mv₀，mv₁，mv₂，mv₃を用いて、式（１２）のように、mv_ciを算出し、i=0乃至3のうち、もっとも残差が小さく、もっとも高い符号化効率を実現するmv_ciを、mv_cとして選択する。

すなわち、色差動きベクトル生成部９２は、対応する輝度信号ブロックに対する動きベクトルのうち、色差信号に対して、もっとも高い符号化効率を与えるものを選択し、これを、例えば、4:2:0といった色差信号のフォーマットを考慮したスケーリングを行うことにより、色差信号ブロックに対する動きベクトルを生成する。その際、色差動きベクトル生成部９２は、i=0乃至3のうち、どのiを用いたかに関するフラグを生成し、可逆符号化部６６に供給して、復号側に送信する圧縮画像のヘッダに付加させる。

このフラグは、水平方向と垂直方向を別々に送信してもよく、あるいは水平方向と垂直方向の両方に対して単一のフラグを送信するようにしてもよい。後述する画像復号装置１０１においては、圧縮画像を復号し、このフラグを取得することで、mv_cを再構築することができる。

以上のように、色差信号のブロックサイズが、直交変換のブロックサイズよりも小さい場合に、複数の輝度信号のブロックに対して対応させた単一の色差信号のブロックの動きベクトルを、複数の輝度信号のブロックの動きベクトルを用いて生成するようにした。

これにより、色差に関する４×４サイズの直交変換ブロック内に、動き予測（補償）のブロック境界が内在しないことになり、直交変換による非０係数の出現が減少されるので、符号化効率を改善することができる。

さらにまた、動き予測の際、H．264/AVC方式においては、輝度信号の対象ブロックが４×４画素であったら、色差信号については、４つの２×２画素ブロックに対してアドレスの計算を行い、メモリアクセスを行う必要があった。これに対して、上述した処理を行うことにより、メモリアクセスの計算は１回で済むことになり、必要となるメモリバンド幅を減少させることができる。

［画像符号化装置の符号化処理の説明］
次に、図１０のフローチャートを参照して、図４の画像符号化装置５１の符号化処理について説明する。

ステップＳ１１において、Ａ／Ｄ変換部６１は入力された画像をＡ／Ｄ変換する。ステップＳ１２において、画面並べ替えバッファ６２は、Ａ／Ｄ変換部６１より供給された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

ステップＳ１３において、演算部６３は、ステップＳ１２で並び替えられた画像と予測画像との差分を演算する。予測画像は、インター予測する場合は動き予測・補償部７５から、イントラ予測する場合はイントラ予測部７４から、それぞれ予測画像選択部７８を介して演算部６３に供給される。

差分データは元の画像データに較べてデータ量が小さくなっている。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ１４において、直交変換部６４は演算部６３から供給された差分情報を直交変換する。具体的には、離散コサイン変換、カルーネン・レーベ変換等の直交変換が行われ、変換係数が出力される。ステップＳ１５において、量子化部６５は変換係数を量子化する。この量子化に際しては、後述するステップＳ２５の処理で説明されるように、レートが制御される。

以上のようにして量子化された差分情報は、次のようにして局部的に復号される。すなわち、ステップＳ１６において、逆量子化部６８は量子化部６５により量子化された変換係数を量子化部６５の特性に対応する特性で逆量子化する。ステップＳ１７において、逆直交変換部６９は逆量子化部６８により逆量子化された変換係数を直交変換部６４の特性に対応する特性で逆直交変換する。

ステップＳ１８において、演算部７０は、予測画像選択部７８を介して入力される予測画像を局部的に復号された差分情報に加算し、局部的に復号された画像（演算部６３への入力に対応する画像）を生成する。ステップＳ１９においてデブロックフィルタ７１は、演算部７０より出力された画像をフィルタリングする。これによりブロック歪みが除去される。ステップＳ２０においてフレームメモリ７２は、フィルタリングされた画像を記憶する。なお、フレームメモリ７２にはデブロックフィルタ７１によりフィルタ処理されていない画像も演算部７０から供給され、記憶される。

ステップＳ２１において、イントラ予測部７４および動き予測・補償部７５は、それぞれ画像の予測処理を行う。すなわち、ステップＳ２１において、イントラ予測部７４は、イントラ予測モードのイントラ予測処理を行う。動き予測・補償部７５は、インター予測モードの動き予測・補償処理を行う。

ステップＳ２１における予測処理の詳細は、図１１を参照して後述するが、まず、この処理により、候補となる全てのイントラ予測モードでの予測処理がそれぞれ行われ、候補となる全てのイントラ予測モードでのコスト関数値がそれぞれ算出される。そして、算出されたコスト関数値に基づいて、最適イントラ予測モードが選択され、最適イントラ予測モードのイントラ予測により生成された予測画像とそのコスト関数値が予測画像選択部７８に供給される。

また、この処理により、候補となる全てのインター予測モードでの予測処理がそれぞれ行われ、候補となる全てのインター予測モードでのコスト関数値がそれぞれ算出される。算出されたコスト関数値に基づいて、インター予測モードの中から、最適インター予測モードが決定される。

なお、具体的には、輝度信号について動き予測、コスト関数値の算出、最適インター予測モードの決定が行われる。最適インター予測モードに示されるブロックサイズにより、対象ブロックのカテゴリ分類が行われ、色差信号については、分類されたカテゴリに応じた動き予測が行われる。そして、最適インター予測モードでの予測画像が生成され、生成された予測画像とそのコスト関数値が、予測画像選択部７８に供給される。

ステップＳ２２において、予測画像選択部７８は、イントラ予測部７４および動き予測・補償部７５より出力された各コスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちの一方を、最適予測モードに決定する。そして、予測画像選択部７８は、決定した最適予測モードの予測画像を選択し、演算部６３，７０に供給する。この予測画像が、上述したように、ステップＳ１３，Ｓ１８の演算に利用される。

なお、この予測画像の選択情報は、イントラ予測部７４または動き予測・補償部７５に供給される。最適イントラ予測モードの予測画像が選択された場合、イントラ予測部７４は、最適イントラ予測モードを示す情報（すなわち、イントラ予測モード情報）を、可逆符号化部６６に供給する。

最適インター予測モードの予測画像が選択された場合、動き予測・補償部７５は、最適インター予測モードを示す情報と、さらに、必要に応じて、最適インター予測モードに応じた情報を可逆符号化部６６に出力する。最適インター予測モードに応じた情報としては、動きベクトル情報や参照フレーム情報などがあげられる。

ステップＳ２３において、可逆符号化部６６は量子化部６５より出力された量子化された変換係数を符号化する。すなわち、差分画像が可変長符号化、算術符号化等の可逆符号化され、圧縮される。このとき、上述したステップＳ２２において可逆符号化部６６に入力された、イントラ予測部７４からのイントラ予測モード情報、または、動き予測・補償部７５からの最適インター予測モードに応じた情報なども符号化され、ヘッダ情報に付加される。

例えば、インター予測モードを示す情報は、マクロブロック毎に符号化される。動きベクトル情報や参照フレーム情報は、対象となるブロック毎に符号化される。

なお、ステップＳ２１におけるインター動き予測により、色差信号の動きベクトル差分情報が生成された場合には、生成された色差信号の動きベクトル差分情報が色差動きベクトル決定部７７から供給されるので、その情報も符号化される。これについて詳しくは図１５および図１６を参照して後述される。

ステップＳ２４において蓄積バッファ６７は差分画像を圧縮画像として蓄積する。蓄積バッファ６７に蓄積された圧縮画像が適宜読み出され、伝送路を介して復号側に伝送される。

ステップＳ２５においてレート制御部７９は、蓄積バッファ６７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部６５の量子化動作のレートを制御する。

［予測処理の説明］
次に、図１１のフローチャートを参照して、図１０のステップＳ２１における予測処理を説明する。

画面並べ替えバッファ６２から供給される処理対象の画像がイントラ処理されるブロックの画像である場合、参照される復号済みの画像がフレームメモリ７２から読み出され、スイッチ７３を介してイントラ予測部７４に供給される。これらの画像に基づいて、ステップＳ３１において、イントラ予測部７４は処理対象のブロックの画素を、候補となる全てのイントラ予測モードでイントラ予測する。なお、参照される復号済みの画素としては、デブロックフィルタ７１によりデブロックフィルタリングされていない画素が用いられる。

ステップＳ３１におけるイントラ予測処理の詳細は、図１２を参照して後述するが、この処理により、候補となる全てのイントラ予測モードでイントラ予測が行われ、候補となる全てのイントラ予測モードに対してコスト関数値が算出される。そして、算出されたコスト関数値に基づいて、最適イントラ予測モードが選択され、最適イントラ予測モードのイントラ予測により生成された予測画像とそのコスト関数値が予測画像選択部７８に供給される。

画面並べ替えバッファ６２から供給される処理対象の画像がインター処理される画像である場合、参照される画像がフレームメモリ７２から読み出され、スイッチ７３を介して動き探索部８１に供給される。これらの画像に基づいて、ステップＳ３２において、動き探索部８１は、輝度信号を用いたインター動き予測処理を行う。すなわち、動き探索部８１は、フレームメモリ７２から供給される画像を参照して、輝度信号を用いて、候補となる全てのインター予測モードの動き予測処理を行う。

ステップＳ３２におけるインター動き予測処理の詳細は、図１３を参照して後述する。この処理により、輝度信号を用いて、候補となる全てのインター予測モードで動き予測処理が行われ、モード判定部８２により、候補となる全てのインター予測モードに対してコスト関数値が算出される。

ステップＳ３３において、モード判定部８２は、候補となる全てのインター予測モードの中から、算出したコスト関数値に基づいて、最適インター予測モードを決定する。すなわち、モード判定部８２は、コスト関数値の最小の予測モードを、最適イントラ予測モードに決定する。

モード判定部８２は、決定した最適インター予測モードの情報と、それに対応する動きベクトル情報を、動き補償部８３に供給する。また、モード判定部８２は、決定した最適インター予測モードの情報を、色差ブロック判別部７６にも供給する。

ステップＳ３４において、色差ブロック判別部７６、色差動きベクトル決定部７７、および動き補償部８３は、色差信号に対する動き予測処理を実行する。

ステップＳ３４における色差信号に対する動き予測処理の詳細は、図１４を参照して後述する。この処理により、最適イントラ予測モードのブロックサイズに応じて、色差信号の動き予測が行われる。

すなわち、最適イントラ予測モードが示すブロックサイズから判別される色差信号ブロックのサイズに基づいて、色差信号ブロックがカテゴリに分類され、分類されたカテゴリに応じて、色差信号ブロックの動きベクトルが生成される。

ステップＳ３５において、動き補償部８３は、モード判定部８２からの最適インター予測モードの動きベクトルに基づいて参照画像に補償処理を施し、対象となるブロックの予測画像を生成する。

すなわち、動き補償部８３は、モード判定部８２からの最適インター予測モードの動きベクトルに基づいて参照画像に補償処理を施し、対象となる輝度信号ブロックの予測画像を生成する。そして、動き補償部８３は、ブロックカテゴライズ部９１から制御信号が供給された場合、H．264/AVC方式により、色差信号の動きベクトルを生成し、生成した動きベクトルを用いて、対象となる色差信号ブロックの予測画像を生成する。一方、動き補償部８３は、色差動きベクトル生成部９２から色差動きベクトル情報が供給された場合、その情報が示す色差信号の動きベクトルを用いて、補償処理を施し、対象となる色差信号ブロックの予測画像を生成する。

以上のようにして生成された最適インター予測モードの予測画像とそのコスト関数値が、予測画像選択部７８に供給される。

［イントラ予測処理の説明］
次に、図１２のフローチャートを参照して、図１１のステップＳ３１におけるイントラ予測処理を説明する。なお、図１２の例においては、輝度信号の場合を例として説明する。

イントラ予測部７４は、ステップＳ４１において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対してイントラ予測を行う。

輝度信号のイントラ予測モードには、９種類の４×４画素および８×８画素のブロック単位、並びに４種類の１６×１６画素のマクロブロック単位の予測モードがあり、色差信号のイントラ予測モードには、４種類の８×８画素のブロック単位の予測モードがある。色差信号のイントラ予測モードは、輝度信号のイントラ予測モードと独立に設定が可能である。輝度信号の４×４画素および８×８画素のイントラ予測モードについては、４×４画素および８×８画素の輝度信号のブロック毎に１つのイントラ予測モードが定義される。輝度信号の１６×１６画素のイントラ予測モードと色差信号のイントラ予測モードについては、１つのマクロブロックに対して１つの予測モードが定義される。

具体的には、イントラ予測部７４は、処理対象のブロックの画素を、フレームメモリ７２から読み出され、スイッチ７３を介して供給される復号済みの画像を参照して、イントラ予測する。このイントラ予測処理が、各イントラ予測モードで行われることで、各イントラ予測モードでの予測画像が生成される。なお、参照される復号済みの画素としては、デブロックフィルタ７１によりデブロックフィルタリングされていない画素が用いられる。

イントラ予測部７４は、ステップＳ４２において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対するコスト関数値を算出する。ここで、コスト関数値としては、High Complexity モードか、Low Complexity モードのいずれかの手法に基づいて行う。これらのモードは、H．264/AVC方式における参照ソフトウエアであるJMで定められている。

すなわち、High Complexity モードにおいては、ステップＳ４１の処理として、候補となる全ての予測モードに対して、仮に符号化処理までが行われる。そして、次の式（１３）で表わされるコスト関数値が各予測モードに対して算出され、その最小値を与える予測モードが最適予測モードであるとして選択される。

Cost(Mode) = D + λ・R ・・・（１３）

Dは、原画像と復号画像の差分（歪）、Rは、直交変換係数まで含んだ発生符号量、λは、量子化パラメータQPの関数として与えられるラグランジュ乗数である。

一方、Low Complexity モードにおいては、ステップＳ４１の処理として、候補となる全ての予測モードに対して、予測画像の生成、および、動きベクトル情報や予測モード情報、フラグ情報などのヘッダビットまでが算出される。そして、次の式（１３）で表わされるコスト関数値が各予測モードに対して算出され、その最小値を与える予測モードが最適予測モードであるとして選択される。

Cost(Mode) = D + QPtoQuant(QP)・Header_Bit ・・・（１４）

Dは、原画像と復号画像の差分（歪）、Header_Bitは、予測モードに対するヘッダビット、QPtoQuantは、量子化パラメータQPの関数として与えられる関数である。

Low Complexity モードにおいては、全ての予測モードに対して、予測画像を生成するのみで、符号化処理および復号処理を行う必要がないため、演算量が少なくて済む。

イントラ予測部７４は、ステップＳ４３において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対して、それぞれ最適モードを決定する。すなわち、上述したように、イントラ４×４予測モードおよびイントラ８×８予測モードの場合には、予測モードの種類が９種類あり、イントラ１６×１６予測モードの場合には、予測モードの種類が４種類ある。したがって、イントラ予測部７４は、ステップＳ４２において算出されたコスト関数値に基づいて、それらの中から、最適イントラ４×４予測モード、最適イントラ８×８予測モード、最適イントラ１６×１６予測モードを決定する。

イントラ予測部７４は、ステップＳ４４において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対して決定された各最適モードの中から、ステップＳ４２において算出されたコスト関数値に基づいて、最適イントラ予測モードを選択する。すなわち、４×４画素、８×８画素、および１６×１６画素に対して決定された各最適モードの中から、コスト関数値が最小値であるモードを、最適イントラ予測モードとして選択する。そして、イントラ予測部７４は、最適イントラ予測モードで生成された予測画像とそのコスト関数値とを、予測画像選択部７８に供給する。

［輝度信号を用いたインター動き予測処理の説明］
次に、図１３のフローチャートを参照して、図１１のステップＳ３２の輝度信号を用いたインター動き予測処理について説明する。なお、動き探索部８１においては、図３を参照して上述したJMに実装されている動き探索方法に基づき整数画素精度の動きベクトルが求められ、小数画素精度の動きベクトルが求められる。

ステップＳ６１において、動き探索部８１は、輝度信号を用いて、図５を参照して上述した１６×１６画素乃至４×４画素からなる８種類の各インター予測モードに対して動きベクトルと参照画像をそれぞれ決定する。

すなわち、動き探索部８１には、画面並べ替えバッファ６２からのインター処理する画像と、フレームメモリ７２からの整数画素精度の参照画像画素値が供給される。動き探索部８１は、これらの画像の輝度信号を用いて、各インター予測モードに対して、候補の参照画像の所定の探索範囲内においてSADなどのコスト関数値を最小にする整数画素精度の動きベクトルと参照画像を求める。また、動き探索部８１は、SADなどのコスト関数を最小にする１／２画素精度の小数画素精度の動きベクトル情報を求め、さらに、SADなどのコスト関数を最小にする１／４画素精度の小数画素精度の動きベクトル情報を求める。

以上により、輝度信号の、各インター予測モードの処理対象の対象ブロックについて、動きベクトルと参照画像がそれぞれ決定される。動き探索部８１により輝度信号の各対象ブロックについて求められた各動きベクトル情報は、モード判定部８２に供給される。

モード判定部８２は、上述した式（１３）または式（１４）で示されるコスト関数値を算出するために、次のステップＳ６２乃至Ｓ６４の処理を行う。

すなわち、モード判定部８２は、ステップＳ６２において、動き探索部８１からの動きベクトルに基づいて、参照画像に補償処理を行う。具体的には、モード判定部８２には、フレームメモリ７２からの整数画素精度の参照画像画素値、小数画素精度の動きベクトル情報、および内挿フィルタのフィルタ係数を用いて、小数画素精度の画素値を補間することで、対象ブロックの予測画像を生成する。

ステップＳ６３において、モード判定部８２は、１６×１６画素乃至４×４画素からなる８種類の各インター予測モードに対して決定された動きベクトルについて、差分動きベクトル情報mvd_Eを生成する。このとき、図７を参照して上述した動きベクトルの生成方法が用いられる。

具体的には、モード判定部８２は、隣接ブロック動きベクトル情報を用いて、上述した式（６）のメディアン予測により対象ブロックＥに対する予測動きベクトル情報pmv_Eを算出する。そして、モード判定部８２は、上述した式（７）に示されるように、モード判定部８２からの動きベクトル情報mv_Eと、算出された予測動きベクトル情報pmv_Eの差分により差分動きベクトル情報mvd_Eを求める。

求められた差分動きベクトル情報は、次のステップＳ６４におけるコスト関数値算出の際に用いられ、最終的に予測画像選択部７８により対応する予測画像が選択された場合には、予測モード情報、および参照フレーム情報などとともに可逆符号化部６６へ供給される。

モード判定部８２は、ステップＳ６４において、１６×１６画素乃至４×４画素からなる８種類の各インター予測モードに対して、上述した式（１３）または式（１４）で示されるコスト関数値を算出する。

具体的には、モード判定部８２は、画面並べ替えバッファ６２からのインター処理する画像、フレームメモリ７２からの整数画素精度の参照画像画素値、小数画素精度の動きベクトル情報、および差分動きベクトル情報などの情報を適宜用いて、コスト関数値を算出する。ここで算出されたコスト関数値は、上述した図１１のステップＳ３３で最適インター予測モードを決定する際に用いられる。

［輝度信号に対する動き予測処理の説明］
次に、図１４のフローチャートを参照して、色差信号に対する動き予測処理について説明する。

色差ブロック判別部７６には、最適インター予測モードの情報が、モード判定部８２から供給される。色差ブロック判別部７６は、最適インター予測モードの情報が示す輝度信号ブロックのブロックサイズに応じて、色差信号ブロックのブロックサイズを判別し、判別した色差ブロックサイズの情報を、ブロックカテゴライズ部９１に供給する。

すなわち、色差ブロック判別部７６は、輝度信号におけるブロックサイズが１６×１６画素、１６×８画素、８×１６画素、８×８画素の場合、色差信号におけるブロックサイズは、それぞれ、８×８画素、８×４画素、４×８画素、４×４画素であることを判別する。また、色差ブロック判別部７６は、輝度信号におけるブロックサイズが８×４画素、４×８画素、４×４画素の場合、色差信号におけるブロックサイズは、それぞれ、４×２画素、２×４画素、２×２画素であることを判別する。

ブロックカテゴライズ部９１は、ステップＳ７１において、色差信号ブロックをカテゴリ分類する。例えば、ブロックカテゴライズ部９１は、色差信号におけるブロックサイズが、８×８画素、８×４画素、４×８画素、４×４画素のいずれかのサイズであった場合、色差信号ブロックを、第１のカテゴリに分類する。一方、ブロックカテゴライズ部９１は、色差信号におけるブロックサイズが、４×２画素、２×４画素、２×２画素のいずれかのサイズであった場合、色差信号ブロックを、第２のカテゴリに分類する。

そして、ブロックカテゴライズ部９１は、ステップＳ７２において、色差信号ブロックが第１のカテゴリに属するブロックであるか否かを判定する。

ステップＳ７２において、第１のカテゴリに属するブロックではない、すなわち、第２のカテゴリに属するブロックであると判定された場合、処理は、ステップＳ７３に進む。この場合、ブロックカテゴライズ部９１から、色差信号の動き補償を行わせるための制御信号が、色差動きベクトル生成部９２に供給される。

これに対応して、色差動きベクトル生成部９２は、ステップＳ７３において、色差動きベクトル情報を生成する。すなわち、色差動きベクトル生成部９２は、図９Ａを参照して上述したように、第２のカテゴリに属するとされた複数の輝度信号ブロック（例えば、４つの４×４ブロック）に単一の色差信号ブロック（例えば、１つの４×４ブロック）を対応させる。そして、色差動きベクトル生成部９２は、モード判定部８２より取得される動きベクトル情報を用いて、その単一の色差信号ブロックの動きベクトル情報を生成する。

生成された色差動きベクトル情報は、動き補償部８３に供給され、図１１のステップＳ３５において、色差信号の予測画像生成に用いられる。

一方、ステップＳ７２において、第１のカテゴリに属するブロックであると判定された場合、処理は、ステップＳ７４に進む。この場合、ブロックカテゴライズ部９１から、H．264/AVC方式による色差信号の動き予測を行わせるための制御信号が動き補償部８３に供給される。

これに対応して、動き補償部８３は、ステップＳ７４において、H．264/AVC方式による色差動き予測処理を行う。例えば、動き補償部８３は、輝度信号ブロックが８×８画素ブロックの場合、４×４画素ブロックの色差信号ブロックについて、図２を参照して上述した動き予測処理を行う。

生成された色差動きベクトル情報は、図１１のステップＳ３５において、色差信号の予測画像生成に用いられる。

以上のように、色差動きベクトル情報は、輝度信号ブロックの動きベクトル情報が用いられて生成されるので、復号側に送る必要がない。これに対して、次に説明するように、予測動きベクトル情報を求めて、色差信号ブロックの動きベクトルも探索し、それらの差分情報を復号側に送るようにしてもよい。

［動き予測・補償部および色差動きベクトル決定部の構成例］
図１５は、色差動きベクトル差分情報を復号側に送る場合の動き予測・補償部７５および色差動きベクトル決定部７７の詳細な構成例を示すブロック図である。

なお、図１５の動き予測・補償部７５は、動き探索部８１、モード判定部８２、および動き補償部８３を備える点が図８の動き予測・補償部７５と共通する。図１５の色差動きベクトル決定部７７は、ブロックカテゴライズ部９１を備える点が図８の動き予測・補償部７５と共通する。一方、図１５の色差動きベクトル決定部７７は、色差動きベクトル生成部９２が、色差予測動きベクトル生成部９５に入れ替わった点と、色差動きベクトル探索部９６が追加された点が異なっている。ただし、色差予測動きベクトル生成部９５は、名前が異なるだけであり、図８の色差動きベクトル生成部９２と基本的に同様な処理を行う。

すなわち、色差予測動きベクトル生成部９５は、ブロックカテゴライズ部９１からの制御信号に基づいて、複数の輝度信号ブロックに対して単一の色差信号ブロックを対応させる。そして、色差予測動きベクトル生成部９５は、モード判定部８２から取得される複数の輝度信号ブロックの動きベクトル情報を用いて、上述した式（１０）のように、単一の色差信号のブロックの予測動きベクトル情報を生成する。

生成された色差信号の予測動きベクトル情報（色差予測動きベクトル情報）は、色差動きベクトル探索部９６に供給される。

色差動きベクトル探索部９６は、フレームメモリ７２からの参照画像画素値を用いて、色差予測動きベクトル生成部９５が複数の輝度信号に対応させた色差信号ブロックについて、動きベクトル情報を求める。このとき、色差動きベクトル探索部９６は、色差予測動きベクトル生成部９５により生成された色差予測動きベクトルを中心として、予め定められた探索範囲で、色差信号についての動きベクトルを求める。

なお、この場合も、図３を参照して上述したJMに実装されている動き探索方法に基づき、整数画素精度の動きベクトルが求められて、小数画素精度の動きベクトルが求められる。したがって、SADなどのコスト関数が求められ、最適な動きベクトルが求められるので、その図示は省略されているが、画面並べ替えバッファ６２からのインターする画像も入力される。

色差動きベクトル探索部９６は、色差信号ブロックについて求めた色差動きベクトル情報を動き補償部８３に供給する。また、色差動きベクトル探索部９６は、色差動きベクトル情報と、色差予測動きベクトル生成部９５からの色差予測動きベクトル情報との差分を求め、求められた色差動きベクトル差分情報を、可逆符号化部６６に供給する。

［輝度信号に対する動き予測処理の説明］
次に、図１６のフローチャートを参照して、図１５の例の場合の図１１のステップＳ３４の色差信号に対する動き予測処理について説明する。なお、それ以外の処理は、図１０を参照して上述した図８の例の場合の処理と基本的に同様な処理であるのでその説明は繰り返しになるので省略する。また、図１６のステップＳ９１、Ｓ９２、およびＳ９５の処理は、図１４のステップＳ７１、Ｓ７２、およびＳ７４の処理と同じ処理である。

ブロックカテゴライズ部９１は、ステップＳ９１において、色差信号ブロックをカテゴリ分類する。例えば、ブロックカテゴライズ部９１は、色差信号におけるブロックサイズが、８×８画素、８×４画素、４×８画素、４×４画素のいずれかのサイズであった場合、色差信号ブロックを、第１のカテゴリに分類する。一方、ブロックカテゴライズ部９１は、色差信号におけるブロックサイズが、４×２画素、２×４画素、２×２画素のいずれかのサイズであった場合、色差信号ブロックを、第２のカテゴリに分類する。

そして、ブロックカテゴライズ部９１は、ステップＳ９２において、色差信号ブロックが第１のカテゴリに属するブロックであるか否かを判定する。

ステップＳ９２において、第１のカテゴリに属するブロックではない、すなわち、第２のカテゴリに属するブロックであると判定された場合、処理は、ステップＳ９３に進む。この場合、ブロックカテゴライズ部９１から、色差信号の動き予測を行わせるための制御信号が、色差予測動きベクトル生成部９５に供給される。

これに対応して、色差予測動きベクトル生成部９５は、ステップＳ９３において、色差予測動きベクトル情報を生成する。すなわち、色差予測動きベクトル生成部９５は、図９Ａを参照して上述したように、第２のカテゴリに属するとされた複数の輝度信号ブロックに単一の色差信号ブロックを対応させる。そして、色差予測動きベクトル生成部９５は、モード判定部８２より取得される動きベクトル情報を用いて、その単一の色差信号ブロックの動き予測ベクトル情報を生成する。

生成された色差予測動きベクトル情報は、色差動きベクトル探索部９６に供給される。色差動きベクトル探索部９６は、ステップＳ９４において、色差動きベクトル差分を算出する。すなわち、色差動きベクトル探索部９６は、フレームメモリ７２からの参照画像画素値を用いて、色差予測動きベクトル生成部９５により生成された予測動きベクトル情報を中心とした探索範囲で、色差信号ブロックについて、動きベクトル情報を求める。そして、色差動きベクトル探索部９６は、色差動きベクトル情報と、色差予測動きベクトル生成部９５からの色差予測動きベクトル情報との差分を算出する。

求められた色差動きベクトル情報は、動き補償部８３に供給され、図１１のステップＳ３５において、色差信号の予測画像生成に用いられる。

また、算出された色差動きベクトル差分情報は、可逆符号化部６６に供給され、図１０のステップＳ２２でインター予測による予測画像が選択された場合に、ステップＳ２３において、符号化され、圧縮画像のヘッダに付加されて、復号側に送信される。

一方、ステップＳ９２において、第１のカテゴリに属するブロックであると判定された場合、処理は、ステップＳ９５に進む。この場合、ブロックカテゴライズ部９１から、H．264/AVC方式による色差信号の動き予測を行わせるための制御信号が動き補償部８３に供給される。

これに対応して、動き補償部８３は、ステップＳ９５において、H．264/AVC方式による色差動き予測処理を行う。例えば、動き補償部８３は、輝度信号の対象ブロックが８×８画素ブロックの場合、４×４画素ブロックの色差信号の対象ブロックについて、図２を参照して上述した動き予測処理を行う。

符号化された圧縮画像は、所定の伝送路を介して伝送され、画像復号装置により復号される。

［画像復号装置の構成例］
図１７は、本発明を適用した画像処理装置としての画像復号装置の一実施の形態の構成を表している。

画像復号装置１０１は、蓄積バッファ１１１、可逆復号部１１２、逆量子化部１１３、逆直交変換部１１４、演算部１１５、デブロックフィルタ１１６、画面並べ替えバッファ１１７、Ｄ／Ａ変換部１１８、フレームメモリ１１９、スイッチ１２０、イントラ予測部１２１、動き予測・補償部１２２、色差動きベクトル決定部１２３、色差ブロック判別部１２４、およびスイッチ１２５により構成されている。

蓄積バッファ１１１は伝送されてきた圧縮画像を蓄積する。可逆復号部１１２は、蓄積バッファ１１１より供給された、図４の可逆符号化部６６により符号化された情報を、可逆符号化部６６の符号化方式に対応する方式で復号する。逆量子化部１１３は可逆復号部１１２により復号された画像を、図４の量子化部６５の量子化方式に対応する方式で逆量子化する。逆直交変換部１１４は、図４の直交変換部６４の直交変換方式に対応する方式で逆量子化部１１３の出力を逆直交変換する。

逆直交変換された出力は演算部１１５によりスイッチ１２５から供給される予測画像と加算されて復号される。デブロックフィルタ１１６は、復号された画像のブロック歪を除去した後、フレームメモリ１１９に供給し、蓄積させるとともに、画面並べ替えバッファ１１７に出力する。

画面並べ替えバッファ１１７は、画像の並べ替えを行う。すなわち、図４の画面並べ替えバッファ６２により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。Ｄ／Ａ変換部１１８は、画面並べ替えバッファ１１７から供給された画像をＤ／Ａ変換し、図示せぬディスプレイに出力し、表示させる。

スイッチ１２０は、インター処理される画像と参照される画像をフレームメモリ１１９から読み出し、動き予測・補償部１２２に出力するとともに、イントラ予測に用いられる画像をフレームメモリ１１９から読み出し、イントラ予測部１２１に供給する。

イントラ予測部１２１には、ヘッダ情報を復号して得られたイントラ予測モードを示す情報が可逆復号部１１２から供給される。イントラ予測部１２１は、この情報に基づいて、予測画像を生成し、生成した予測画像を、スイッチ１２５に出力する。

動き予測・補償部１２２には、ヘッダ情報を復号して得られた情報のうち、インター予測モード情報、動きベクトル情報、参照フレーム情報などが可逆復号部１１２から供給される。インター予測モード情報は、マクロブロック毎に送信されてくる。動きベクトル情報や参照フレーム情報は、対象ブロック毎に送信されてくる。

動き予測・補償部１２２は、可逆復号部１１２から供給されるインター予測モード情報が示す予測モードで、輝度信号について、対象ブロックに対する予測画像の画素値を生成する。

また、動き予測・補償部１２２は、色差ブロック判別部１２４からの制御信号が供給された場合、H．264/AVC方式により、色差信号の動きベクトルを生成し、生成した動きベクトルを用いて、対象となる色差信号ブロックの予測画像を生成する。動き予測・補償部１２２は、色差動きベクトル決定部１２３から色差動きベクトル情報が供給された場合、その情報が示す色差信号の動きベクトルを用いて、対象となる色差信号ブロックの予測画像を生成する。生成された予測画像の画素値は、スイッチ１２５を介して、演算部１１５に供給される。

色差動きベクトル決定部１２３は、図４の色差動きベクトル決定部７７と同様に、色差ブロック判別部１２４からの色差ブロックサイズの情報に基づいて、色差信号ブロックが、２つのカテゴリのうちのどちらに属するかを分類する。

色差動きベクトル決定部１２３は、色差信号ブロックを第１のカテゴリに分類した場合、動き予測・補償部１２２に制御信号を供給し、H．264/AVC方式による色差信号の動き予測を行わせる。これに対して、色差動きベクトル決定部１２３は、色差信号ブロックを第２のカテゴリに分類した場合、複数の輝度信号ブロックに対して単一の色差信号ブロックを対応させ、その単位で、色差信号の動きベクトルを生成する。例えば、複数の輝度信号ブロックに対応させた単一の色差信号ブロックの動きベクトルは、複数の輝度信号ブロックの動きベクトルの少なくとも１つを用いて生成される。生成された色差動きベクトルの情報は、動き予測・補償部１２２に供給される。

なお、画像符号化装置５１より色差動きベクトル差分情報が生成されて送られてくる場合（図１６の場合）、点線に示されるように、色差動きベクトル差分情報が、可逆復号部１１２から色差動きベクトル決定部１２３に供給される。

この場合、色差動きベクトル決定部１２３は、複数の輝度信号ブロックに対応させた単一の色差信号ブロックの予測動きベクトルを算出し、算出した予測動きベクトルと、供給された色差動きベクトル差分情報を用いて、色差動きベクトルを求める。

色差ブロック判別部１２４は、図４の色差ブロック判別部１２４と同様に、動き予測・補償部１２２からの予測モードの情報が示す輝度信号ブロックのブロックサイズに応じて、色差信号ブロックのブロックサイズを判別する。色差ブロック判別部１２４は、判別した色差ブロックサイズの情報を、色差動きベクトル決定部７１２３に供給する。

スイッチ１２５は、動き予測・補償部１２２またはイントラ予測部１２１により生成された予測画像を選択し、演算部１１５に供給する。

なお、図４の画像符号化装置５１においては、装置内部で、動きベクトル情報いよび符号化モード情報が、動き探索およびモード判定の結果求められるものである。これに対して、この画像復号装置１０１においては、これらの情報が、符号化されて送られてくる圧縮画像情報に付加されており、可逆復号処理の結果として得られるものである。この相違点以外の点において、図４の画像符号化装置５１と画像復号装置１０１との動作原理は同じである。

［動き予測・補償部および色差動きベクトル決定部の構成例］
図１８は、動き予測・補償部１２２および色差動きベクトル決定部１２３の詳細な構成例を示すブロック図である。なお、図１８においては、図１７のスイッチ１２０および１２５が省略されている。

図１８の例においては、動き予測・補償部１２２は、動きベクトルバッファ１３１、モード情報バッファ１３２、および予測画像生成部１３３により構成される。

色差動きベクトル決定部１２３は、ブロックカテゴライズ部１４１、および色差動きベクトル生成部１４２により構成される。

動きベクトルバッファ１３１は、可逆復号部１１２からの対象ブロックの動きベクトル情報を蓄積する。モード情報バッファ１３２は、可逆復号部１１２からのマクロブロック毎のインター予測モード情報を蓄積する。

予測画像生成部１３３は、動きベクトルバッファ１３１から対象ブロックの動きベクトル情報を取得し、モード情報バッファ１３２から対応するインター予測モード情報を取得する。予測画像生成部１３３は、取得したこれらの情報と、フレームメモリ１１９から得られる参照画像画素値を用いて、対象となる輝度信号ブロックに対する予測画像の画素値を生成する。

また、予測画像生成部１３３は、ブロックカテゴライズ部１４１から制御信号が供給された場合、H．264/AVC方式により、色差信号の動きベクトルを生成し、生成した動きベクトルを用いて、補償処理を行い、対象となる色差信号ブロックの予測画像を生成する。これに対して、予測画像生成部１３３は、色差動きベクトル生成部１４２から色差動きベクトル情報が供給された場合、その情報が示す色差信号の動きベクトルを用いて、補償処理を行い、対象となる色差信号ブロックの予測画像を生成する。

ブロックカテゴライズ部１４１は、色差ブロック判別部１２４からの色差ブロックサイズの情報に基づいて、色差信号ブロックが、２つのカテゴリのうちのどちらに属するかを分類する。ブロックカテゴライズ部１４１は、色差信号ブロックを第１のカテゴリに分類した場合、予測画像生成部１３３に制御信号を供給し、H．264/AVC方式による色差信号の動き予測を行わせる。また、ブロックカテゴライズ部１４１は、色差信号ブロックを第２のカテゴリに分類した場合、色差動きベクトル生成部１４２に制御信号を供給し、色差信号の動き予測を行わせる。

色差動きベクトル生成部１４２は、ブロックカテゴライズ部１４１からの制御信号に基づいて、複数の輝度信号ブロックに対して単一の色差信号ブロックを対応させる。そして、色差動きベクトル生成部１４２は、動きベクトルバッファ１３１から取得される複数の輝度信号ブロックの動きベクトル情報を用いて、その対応させた単一の色差信号ブロックの動きベクトルを生成する。色差動きベクトル生成部１４２は、生成した色差信号の動きベクトル情報を、予測画像生成部１３３に供給する。

なお、画像符号化装置５１より色差動きベクトル差分情報が生成されて送られてくる場合（図１６の場合）、点線に示されるように、色差動きベクトル差分情報が、可逆復号部１１２から色差動きベクトル生成部１４２に供給される。

この場合、色差動きベクトル生成部１４２は、上述した式（１０）のように、複数の輝度信号ブロックに対応させた単一の色差信号ブロックの予測動きベクトルを算出する。そして、色差動きベクトル生成部１４２は、算出した予測動きベクトルと、供給された色差動きベクトル差分情報を用いて、色差動きベクトルを求める。

［画像復号装置の復号処理の説明］
次に、図１９のフローチャートを参照して、画像復号装置１０１が実行する復号処理について説明する。

ステップＳ１３１において、蓄積バッファ１１１は伝送されてきた画像を蓄積する。ステップＳ１３２において、可逆復号部１１２は、蓄積バッファ１１１から供給される圧縮画像を復号する。すなわち、図４の可逆符号化部６６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャが復号される。

このとき、動きベクトル情報、参照フレーム情報、予測モード情報（イントラ予測モード、またはインター予測モードを示す情報）なども復号される。

すなわち、予測モード情報がイントラ予測モード情報である場合、予測モード情報は、イントラ予測部１２１に供給される。予測モード情報がインター予測モード情報である場合、予測モード情報と対応する動きベクトル情報および参照フレーム情報は、動き予測・補償部１２２に供給される。

また、図１６の処理が行われて送信されてきた画像のヘッダには色差動きベクトル差分情報も付加されており、この場合、色差動きベクトル差分情報も復号され、色差動きベクトル決定部１２３に供給される。

ステップＳ１３３において、逆量子化部１１３は可逆復号部１１２により復号された変換係数を、図４の量子化部６５の特性に対応する特性で逆量子化する。ステップＳ１３４において逆直交変換部１１４は逆量子化部１１３により逆量子化された変換係数を、図４の直交変換部６４の特性に対応する特性で逆直交変換する。これにより図４の直交変換部６４の入力（演算部６３の出力）に対応する差分情報が復号されたことになる。

ステップＳ１３５において、演算部１１５は、後述するステップＳ１３９の処理で選択され、スイッチ１２５を介して入力される予測画像を差分情報と加算する。これにより元の画像が復号される。ステップＳ１３６においてデブロックフィルタ１１６は、演算部１１５より出力された画像をフィルタリングする。これによりブロック歪みが除去される。ステップＳ１３７においてフレームメモリ１１９は、フィルタリングされた画像を記憶する。

ステップＳ１３８において、イントラ予測部１２１または動き予測・補償部１２２は、可逆復号部１１２から供給される予測モード情報に対応して、それぞれ画像の予測処理を行う。

すなわち、可逆復号部１１２からイントラ予測モード情報が供給された場合、イントラ予測部１２１は、イントラ予測モードのイントラ予測処理を行う。可逆復号部１１２からインター予測モード情報が供給された場合、動き予測・補償部１２２は、インター予測モードの動き予測・補償処理を行う。このとき、動き予測・補償部１２２は、色差信号については、インター予測モードが示すブロックサイズにより分類されたカテゴリに応じて、対象ブロックに対する予測画像の画素値を生成する。

ステップＳ１３８における予測処理の詳細は、図２０を参照して後述するが、この処理により、イントラ予測部１２１により生成された予測画像、または動き予測・補償部１２２により生成された予測画像がスイッチ１２５に供給される。

ステップＳ１３９において、スイッチ１２５は予測画像を選択する。すなわち、イントラ予測部１２１により生成された予測画像、または動き予測・補償部１２２により生成された予測画像が供給される。したがって、供給された予測画像が選択されて演算部１１５に供給され、上述したように、ステップＳ１３４において逆直交変換部１１４の出力と加算される。

ステップＳ１４０において、画面並べ替えバッファ１１７は並べ替えを行う。すなわち画像符号化装置５１の画面並べ替えバッファ６２により符号化のために並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。

ステップＳ１４１において、Ｄ／Ａ変換部１１８は、画面並べ替えバッファ１１７からの画像をＤ／Ａ変換する。この画像が図示せぬディスプレイに出力され、画像が表示される。

［画像復号装置の予測処理の説明］
次に、図２０のフローチャートを参照して、図１９のステップＳ１３８の予測処理を説明する。

イントラ予測部１２１は、ステップＳ１７１において、対象ブロックがイントラ符号化されているか否かを判定する。可逆復号部１１２からイントラ予測モード情報がイントラ予測部１２１に供給されると、イントラ予測部１２１は、ステップＳ１７１において、対象ブロックがイントラ符号化されていると判定し、処理は、ステップＳ１７２に進む。

イントラ予測部１２１は、ステップＳ１７２において、イントラ予測モード情報を取得し、ステップＳ１７３において、イントラ予測を行う。

すなわち、処理対象の画像がイントラ処理される画像である場合、必要な画像がフレームメモリ１１９から読み出され、スイッチ１２０を介してイントラ予測部１２１に供給される。ステップＳ１７３において、イントラ予測部１２１は、ステップＳ１７２で取得したイントラ予測モード情報に従ってイントラ予測し、予測画像を生成する。生成した予測画像は、スイッチ１２５に出力される。

一方、ステップＳ１７１において、イントラ符号化されていないと判定された場合、処理は、ステップＳ１７４に進む。

処理対象の画像がインター処理される画像である場合、可逆復号部１１２からインター予測モード情報、参照フレーム情報、動きベクトル情報が動き予測・補償部１２２に供給される。

ステップＳ１７４において、動き予測・補償部１２２は、可逆復号部１１２からの予測モード情報などを取得する。すなわち、インター予測モード情報、参照フレーム情報、動きベクトル情報が取得される。取得された動きベクトル情報は、動きベクトルバッファ１３１に蓄積され、インター予測モード情報は、モード情報バッファ１３２に蓄積される。

ステップＳ１７５において、予測画像生成部１３３は、輝度信号について予測画像を生成する。すなわち、予測画像生成部１３３は、動きベクトルバッファ１３１から対象ブロックの動きベクトル情報を取得し、モード情報バッファ１３２から対応するインター予測モード情報を取得する。予測画像生成部１３３は、取得したこれらの情報と、フレームメモリ１１９から得られる参照画像画素値を用いて、対象となる輝度信号ブロックに対する予測画像の画素値を生成する。

ステップＳ１７６において、色差信号に対する動き予測処理が行われる。この色差信号に対する動き予測処理の詳細は、図２１を参照して後述される。ステップＳ１７６の処理により、インター予測モード情報が示すブロックサイズにより対象となる色差信号ブロックが第１または第２のカテゴリに分類され、分類されたカテゴリに応じて、色差信号ブロックの動きベクトルが求められる。

ステップＳ１７７において、予測画像生成部１３３は、ステップＳ１７６の処理により求められた色差信号の動きベクトルを用いて、補償処理を行い、対象となる色差信号ブロックに対する予測画像を生成する。

生成された予測画像は、スイッチ１２５を介して、演算部１１５に供給され、ステップＳ１３４において逆直交変換部１１４の出力と加算される。

次に、図２１のフローチャートを参照して、図２０のステップＳ１７６における色差信号に対する動き予測処理について説明する。

色差ブロック判別部１２４は、モード情報バッファ１３２からの予測モードの情報が示す輝度信号ブロックのブロックサイズに応じて、色差信号ブロックのブロックサイズを判別する。色差ブロック判別部１２４は、判別した色差ブロックサイズの情報を、ブロックカテゴライズ部１４１に供給する。

ステップＳ１８１において、ブロックカテゴライズ部１４１は、色差ブロック判別部１２４からの色差ブロックサイズの情報に基づいて、色差信号ブロックが、２つのカテゴリのうちのどちらに属するかを分類する。

例えば、ブロックカテゴライズ部１４１は、色差信号におけるブロックサイズが、８×８画素、８×４画素、４×８画素、４×４画素のいずれかのサイズであった場合、色差信号ブロックを、第１のカテゴリに分類する。一方、ブロックカテゴライズ部１４１は、色差信号におけるブロックサイズが、４×２画素、２×４画素、２×２画素のいずれかのサイズであった場合、色差信号ブロックを、第２のカテゴリに分類する。

そして、ブロックカテゴライズ部１４１は、ステップＳ１８２において、色差信号ブロックが第１のカテゴリに属するブロックであるか否かを判定する。ステップＳ１８２において、第１のカテゴリに属するブロックではない、すなわち、第２のカテゴリに属するブロックであると判定された場合、処理は、ステップＳ１８３に進む。この場合、ブロックカテゴライズ部１４１から、色差信号の動き補償を行わせるための制御信号が、色差動きベクトル生成部１４２に供給される。

これに対応して、色差動きベクトル生成部１４２は、ステップＳ１８３において、色差動きベクトル情報を生成する。すなわち、色差動きベクトル生成部１４２は、図９Ａを参照して上述したように、第２のカテゴリに属するとされた複数の輝度信号ブロック（例えば、４つの４×４ブロック）に単一の色差信号ブロック（例えば、１つの４×４ブロック）を対応させる。そして、色差動きベクトル生成部１４２は、動きベクトルバッファ１３１より取得される動きベクトル情報を用いて、その単一の色差信号ブロックの動きベクトル情報を生成する。

生成された色差動きベクトル情報は、予測画像生成部１３３に供給され、図２０のステップＳ１７７において、色差信号の予測画像生成に用いられる。

一方、ステップＳ１８２において、第１のカテゴリに属するブロックであると判定された場合、処理は、ステップＳ１８４に進む。この場合、ブロックカテゴライズ部１４１から、H．264/AVC方式による色差信号の動き予測を行わせるための制御信号が予測画像生成部１３３に供給される。

これに対応して、予測画像生成部１３３は、ステップＳ１８４において、H．264/AVC方式による色差動き予測処理を行う。例えば、予測画像生成部１３３は、輝度信号ブロックが８×８画素ブロックの場合、４×４画素ブロックの色差信号ブロックについて、図２を参照して上述した動き予測処理を行う。

生成された色差動きベクトル情報は、図２０のステップＳ１７７において、色差信号ブロックの予測画像生成に用いられる。

以上のよう、色差動きベクトル情報は、輝度信号ブロックの動きベクトル情報が用いられて生成される。これに対して、次に説明するように、符号化側から色差動きベクトル差分情報が送られてくる場合には、差分情報から、輝度信号ブロックの動きベクトル情報が用いられて生成される色差動きベクトル予測情報が差分されて、色差動きベクトルが生成される。

次に、図２２のフローチャートを参照して、符号化側から色差動きベクトル差分情報が送られてくる場合の色差信号に対する動き予測処理について説明する。なお、図２２のステップＳ１９１、Ｓ１９２、およびＳ１９６の処理は、図２１のステップＳ１８１、Ｓ１８２、およびＳ１８４の処理と同じ処理である。

ステップＳ１９１において、ブロックカテゴライズ部１４１は、色差ブロック判別部１２４からの色差ブロックサイズの情報に基づいて、色差信号ブロックが、２つのカテゴリのうちのどちらに属するかを分類する。

そして、ブロックカテゴライズ部１４１は、ステップＳ１９２において、色差信号ブロックが第１のカテゴリに属するブロックであるか否かを判定する。ステップＳ１９２において、第１のカテゴリに属するブロックではない、すなわち、第２のカテゴリに属するブロックであると判定された場合、処理は、ステップＳ１９３に進む。この場合、ブロックカテゴライズ部１４１から、色差信号の動き補償を行わせるための制御信号が、色差動きベクトル生成部１４２に供給される。

これに対応して、色差動きベクトル生成部１４２は、ステップＳ１９３において、色差予測動きベクトル情報を生成する。すなわち、色差動きベクトル生成部１４２は、図９Ａを参照して上述したように、第２のカテゴリに属するとされた複数の輝度信号ブロックに単一の色差信号ブロックを対応させる。そして、色差動きベクトル生成部１４２は、動きベクトルバッファ１３１より取得される動きベクトル情報を用いて、その単一の色差信号ブロックの予測動きベクトル情報を生成する。

ステップＳ１９４において、色差動きベクトル生成部１４２は、可逆復号部１１２からの色差動きベクトル差分情報を取得する。

ステップＳ１９５において、色差動きベクトル生成部１４２は、生成した色差予測動きベクトル情報と、取得した色差動きベクトル差分情報を加算することで、色差動きベクトル情報を生成する。

一方、ステップＳ１９２において、第１のカテゴリに属するブロックであると判定された場合、処理は、ステップＳ１９６に進む。この場合、ブロックカテゴライズ部１４１から、H．264/AVC方式による色差信号の動き予測を行わせるための制御信号が予測画像生成部１３３に供給される。

これに対応して、予測画像生成部１３３は、ステップＳ１９６において、H．264/AVC方式による色差動き予測処理を行う。生成された色差動きベクトル情報は、図２０のステップＳ１７７において、色差信号の予測画像生成に用いられる。

以上のように、画像符号化装置５１および画像復号装置１０１においては、色差信号の動き予測・補償のブロックサイズにより分類されたカテゴリに応じて色差信号の動き予測が行われる。すなわち、色差信号の動き予測・補償のブロックサイズが直交変換ブロックのサイズより小さい対象ブロックの場合、複数の輝度信号ブロックに対応させられた単一の色差信号ブロックの動きベクトルが、複数の輝度信号ブロックの動きベクトルを用いて生成される。

これにより、色差に関する４×４直交変換ブロック内に、動き補償のブロック境界が内在しないことになり、直交変換による非０係数の出現が減少されるので、符号化効率を改善することができる。

さらにまた、動き補償の際、H．264/AVC方式においては、輝度信号ブロックが４×４画素であったら、色差信号については、４つの２×２画素ブロックに対してアドレスの計算を行い、メモリアクセスを行う必要があった。これに対して、上述した処理を行うことにより、メモリアクセスの計算は１回で済むことになり、必要となるメモリバンド幅を減少させることができる。

また、上記説明においては、マクロブロックの大きさが、１６×１６画素の場合について説明してきたが、本発明は、上述した非特許文献４に記載の拡張されたマクロブロックサイズに対しても適用することが可能である。

［拡張マクロブロックサイズへの適用の説明］
図２３は、非特許文献４で提案されているブロックサイズの例を示す図である。非特許文献４では、マクロブロックサイズが３２×３２画素に拡張されている。

図２３の上段には、左から、３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロック（パーティション）に分割された３２×３２画素で構成されるマクロブロックが順に示されている。図２３の中段には、左から、１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックに分割された１６×１６画素で構成されるブロックが順に示されている。また、図２３の下段には、左から、８×８画素、８×４画素、４×８画素、および４×４画素のブロックに分割された８×８画素のブロックが順に示されている。

すなわち、３２×３２画素のマクロブロックは、図２３の上段に示される３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロックでの処理が可能である。

上段の右側に示される１６×１６画素のブロックは、H．264/AVC方式と同様に、中段に示される１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックでの処理が可能である。

中段の右側に示される８×８画素のブロックは、H．264/AVC方式と同様に、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックでの処理が可能である。

これらのブロックは、以下の３階層に分類することができる。すなわち、図２３の上段に示される３２×３２画素、３２×１６画素、および１６×３２画素のブロックを第１階層と呼ぶ。上段の右側に示される１６×１６画素のブロック、並びに、中段に示される１６×１６画素、１６×８画素、および８×１６画素のブロックを、第２階層と呼ぶ。中段の右側に示される８×８画素のブロック、並びに、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックを、第３階層と呼ぶ。

このような階層構造を採用することにより、非特許文献１の提案では、１６×１６画素のブロック以下に関しては、H．264/AVC方式と互換性を保ちながら、そのスーパーセットとして、より大きなブロックが定義されている。

以上のように提案される拡張されたマクロブロックサイズへの本発明の適用方法は、次の通りである。

例えば、上述した階層構造により、３２×３２マクロブロックが符号化される場合、輝度信号の符号化の最小単位は、H．264/AVC方式で定められているのと同様に、４×４画素、すなわち、色差信号の符号化の最小単位は、２×２画素となる。したがって、直交変換の最小単位が４×４画素である場合、図９Ａに示された方法を適用することが可能になる。

また、拡張マクロブロックサイズにおいては、図２３に示された階層構造のうち、８×８画素未満のブロックサイズが用いられず、直交変換の最小単位が、色差信号を含め、８×８画素である場合も考えられる。このような場合に、入力信号のフォーマットが4:2:0であるときには、色差信号ブロックの最小単位が４×４画素ということになり、直交変換の最小単位よりも小さくなってしまう。

このような場合には、図９Ａの１乃至３、Ｃを付したブロックのサイズが８×８画素として、図９Ａに示した方法を適用することにより、色差ブロックの最小単位が直交変換の最小単位よりも小さくなることを抑制することができる。

さらに、上記説明においては、入力信号のフォーマットが4:2:0の場合について説明したが、次に、図２４を参照して、入力信号のフォーマットが4:2:2の場合について考える。

なお、入力信号のフォーマットが4:4:4の場合、輝度信号ブロックと色差信号ブロックは同一の大きさであるので、上述したように、色差ブロックの最小単位が直交変換の最小単位よりも小さくなることはない。

入力信号のフォーマットが4:2:2の場合で、輝度信号ブロックが、図９Ｂに示された８×４画素であるとき、これに対応する色差信号ブロックは、４×４画素となり、色差ブロックの最小単位が直交変換の最小単位よりも小さくなることはない。

これに対して、輝度信号ブロックが、図２４に示されるように、４×４画素または４×８画素であるとき、本発明を適用することができる。

すなわち、図２４Ａの例においては、入力信号のフォーマットが4:2:2であり、輝度信号ブロックが４×４画素である場合が示されている。このとき、０および１が付された２つの輝度信号の４×４ブロックに、Ｃが付された１つの色差信号の４×４ブロックが対応することになる。

したがって、図２４Ａの場合、０および１が付された２つの輝度信号のブロックに対する動きベクトル情報mv₀，mv₁から、Ｃが付された色差信号のブロックに対する動きベクトル情報mv_c、または予測動きベクトル情報pmv_cが生成可能である。

また、図２４Ｂの例においては、入力信号のフォーマットが4:2:2であり、輝度信号ブロックが４×８画素である場合が示されている。このとき、０および１が付された２つの輝度信号の４×８ブロックに、Ｃが付された１つの色差信号の４×８ブロックが対応することになる。

したがって、図２４Ｂの場合も、０および１が付された２つの輝度信号のブロックに対する動きベクトル情報mv₀，mv₁から、Ｃが付された色差信号のブロックに対する動きベクトル情報mv_c、または予測動きベクトル情報pmv_cが生成可能である。

ただし、Ｃが付された色差信号のブロックのサイズが４×８となるが、図２４Ｂに示されるように、直交変換の大きさは４×４である。

以上においては、符号化方式としてH．264/AVC方式をベースに用いるようにしたが、本発明はこれに限らず、１つのマクロブロックを複数の動きパーティションに分割し、動き補償を行い、差分値に対して直交変換を行う、その他の符号化方式／復号方式を適用することができる。

なお、本発明は、例えば、MPEG、H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本発明は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。さらに、本発明は、それらの画像符号化装置および画像復号装置などに含まれる動き予測補償装置にも適用することができる。

上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な汎用のパーソナルコンピュータなどが含まれる。

［パーソナルコンピュータの構成例］
図２５は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

コンピュータにおいて、CPU(Central Processing Unit)２０１、ROM(Read Only Memory)２０２、RAM(Random Access Memory)２０３は、バス２０４により相互に接続されている。

バス２０４には、さらに、入出力インタフェース２０５が接続されている。入出力インタフェース２０５には、入力部２０６、出力部２０７、記憶部２０８、通信部２０９、およびドライブ２１０が接続されている。

入力部２０６は、キーボード、マウス、マイクロホンなどよりなる。出力部２０７は、ディスプレイ、スピーカなどよりなる。記憶部２０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部２０９は、ネットワークインタフェースなどよりなる。ドライブ２１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア２１１を駆動する。

以上のように構成されるコンピュータでは、CPU２０１が、例えば、記憶部２０８に記憶されているプログラムを入出力インタフェース２０５及びバス２０４を介してRAM２０３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU２０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア２１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブルメディア２１１をドライブ２１０に装着することにより、入出力インタフェース２０５を介して、記憶部２０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部２０９で受信し、記憶部２０８にインストールすることができる。その他、プログラムは、ROM２０２や記憶部２０８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、上述した画像符号化装置５１や画像復号装置１０１は、任意の電子機器に適用することができる。以下にその例について説明する。

［テレビジョン受像機の構成例］
図２６は、本発明を適用した画像復号装置を用いるテレビジョン受像機の主な構成例を示すブロック図である。

図２６に示されるテレビジョン受像機３００は、地上波チューナ３１３、ビデオデコーダ３１５、映像信号処理回路３１８、グラフィック生成回路３１９、パネル駆動回路３２０、および表示パネル３２１を有する。

地上波チューナ３１３は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ３１５に供給する。ビデオデコーダ３１５は、地上波チューナ３１３から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路３１８に供給する。

映像信号処理回路３１８は、ビデオデコーダ３１５から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路３１９に供給する。

グラフィック生成回路３１９は、表示パネル３２１に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路３２０に供給する。また、グラフィック生成回路３１９は、項目の選択などにユーザにより利用される画面を表示するための映像データ（グラフィック）を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路３２０に供給するといった処理も適宜行う。

パネル駆動回路３２０は、グラフィック生成回路３１９から供給されたデータに基づいて表示パネル３２１を駆動し、番組の映像や上述した各種の画面を表示パネル３２１に表示させる。

表示パネル３２１はLCD（Liquid Crystal Display）などよりなり、パネル駆動回路３２０による制御に従って番組の映像などを表示させる。

また、テレビジョン受像機３００は、音声A/D（Analog/Digital)変換回路３１４、音声信号処理回路３２２、エコーキャンセル／音声合成回路３２３、音声増幅回路３２４、およびスピーカ３２５も有する。

地上波チューナ３１３は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ３１３は、取得した音声信号を音声A/D変換回路３１４に供給する。

音声A/D変換回路３１４は、地上波チューナ３１３から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路３２２に供給する。

音声信号処理回路３２２は、音声A/D変換回路３１４から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、音声信号処理回路３２２から供給された音声データを音声増幅回路３２４に供給する。

音声増幅回路３２４は、エコーキャンセル／音声合成回路３２３から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ３２５から出力させる。

さらに、テレビジョン受像機３００は、デジタルチューナ３１６およびMPEGデコーダ３１７も有する。

デジタルチューナ３１６は、デジタル放送（地上デジタル放送、BS（Broadcasting Satellite）／CS（Communications Satellite）デジタル放送）の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS（Moving Picture Experts Group-Transport Stream）を取得し、それをMPEGデコーダ３１７に供給する。

MPEGデコーダ３１７は、デジタルチューナ３１６から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象（視聴対象）になっている番組のデータを含むストリームを抽出する。MPEGデコーダ３１７は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路３２２に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路３１８に供給する。また、MPEGデコーダ３１７は、MPEG-TSから抽出したEPG（Electronic Program Guide)データを図示せぬ経路を介してCPU３３２に供給する。

テレビジョン受像機３００は、このように映像パケットをデコードするMPEGデコーダ３１７として、上述した画像復号装置１０１を用いる。したがって、MPEGデコーダ３１７は、画像復号装置１０１の場合と同様に、色差信号のブロックサイズが、直交変換のブロックサイズよりも小さい場合に、複数の輝度信号ブロックに対して対応させた単一の色差信号ブロックの動きベクトルを、複数の輝度信号ブロックの動きベクトルを用いて生成する。これにより、直交変換による非０係数の出現が減少されるので、符号化効率を改善することができる。また、メモリアクセスの計算が１回で済むので、必要となるメモリバンド幅を減少させることができる。

MPEGデコーダ３１７から供給された映像データは、ビデオデコーダ３１５から供給された映像データの場合と同様に、映像信号処理回路３１８において所定の処理が施される。そして、所定の処理が施された映像データは、グラフィック生成回路３１９において、生成された映像データ等が適宜重畳され、パネル駆動回路３２０を介して表示パネル３２１に供給され、その画像が表示される。

MPEGデコーダ３１７から供給された音声データは、音声A/D変換回路３１４から供給された音声データの場合と同様に、音声信号処理回路３２２において所定の処理が施される。そして、所定の処理が施された音声データは、エコーキャンセル／音声合成回路３２３を介して音声増幅回路３２４に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ３２５から出力される。

また、テレビジョン受像機３００は、マイクロホン３２６、およびA/D変換回路３２７も有する。

A/D変換回路３２７は、音声会話用のものとしてテレビジョン受像機３００に設けられるマイクロホン３２６により取り込まれたユーザの音声の信号を受信する。A/D変換回路３２７は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、テレビジョン受像機３００のユーザ（ユーザＡ）の音声のデータがA/D変換回路３２７から供給されている場合、ユーザＡの音声データを対象としてエコーキャンセルを行う。そして、エコーキャンセル／音声合成回路３２３は、エコーキャンセルの後、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路３２４を介してスピーカ３２５より出力させる。

さらに、テレビジョン受像機３００は、音声コーデック３２８、内部バス３２９、SDRAM（Synchronous Dynamic Random Access Memory)３３０、フラッシュメモリ３３１、CPU３３２、USB（Universal Serial Bus) I/F３３３、およびネットワークI/F３３４も有する。

A/D変換回路３２７は、音声会話用のものとしてテレビジョン受像機３００に設けられるマイクロホン３２６により取り込まれたユーザの音声の信号を受信する。A/D変換回路３２７は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック３２８に供給する。

音声コーデック３２８は、A/D変換回路３２７から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス３２９を介してネットワークI/F３３４に供給する。

ネットワークI/F３３４は、ネットワーク端子３３５に装着されたケーブルを介してネットワークに接続される。ネットワークI/F３３４は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック３２８から供給された音声データを送信する。また、ネットワークI/F３３４は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子３３５を介して受信し、それを、内部バス３２９を介して音声コーデック３２８に供給する。

音声コーデック３２８は、ネットワークI/F３３４から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、音声コーデック３２８から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路３２４を介してスピーカ３２５より出力させる。

SDRAM３３０は、CPU３３２が処理を行う上で必要な各種のデータを記憶する。

フラッシュメモリ３３１は、CPU３３２により実行されるプログラムを記憶する。フラッシュメモリ３３１に記憶されているプログラムは、テレビジョン受像機３００の起動時などの所定のタイミングでCPU３３２により読み出される。フラッシュメモリ３３１には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。

例えば、フラッシュメモリ３３１には、CPU３３２の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ３３１は、例えばCPU３３２の制御により、そのMPEG-TSを、内部バス３２９を介してMPEGデコーダ３１７に供給する。

MPEGデコーダ３１７は、デジタルチューナ３１６から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機３００は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ３１７を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。

また、テレビジョン受像機３００は、リモートコントローラ３５１から送信される赤外線信号を受光する受光部３３７も有する。

受光部３３７は、リモートコントローラ３５１からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU３３２に出力する。

CPU３３２は、フラッシュメモリ３３１に記憶されているプログラムを実行し、受光部３３７から供給される制御コードなどに応じてテレビジョン受像機３００の全体の動作を制御する。CPU３３２とテレビジョン受像機３００の各部は、図示せぬ経路を介して接続されている。

USB I/F３３３は、USB端子３３６に装着されたUSBケーブルを介して接続される、テレビジョン受像機３００の外部の機器との間でデータの送受信を行う。ネットワークI/F３３４は、ネットワーク端子３３５に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。

テレビジョン受像機３００は、MPEGデコーダ３１７として画像復号装置１０１を用いることにより、処理の高速化を実現するとともに、符号化効率を向上することができる。その結果として、テレビジョン受像機３００は、アンテナを介して受信した放送波信号や、ネットワークを介して取得したコンテンツデータから、より高速に、より高精細な復号画像を得て、表示することができる。

［携帯電話機の構成例］
図３１は、本発明を適用した画像符号化装置および画像復号装置を用いる携帯電話機の主な構成例を示すブロック図である。

図３１に示される携帯電話機４００は、各部を統括的に制御するようになされた主制御部４５０、電源回路部４５１、操作入力制御部４５２、画像エンコーダ４５３、カメラI/F部４５４、LCD制御部４５５、画像デコーダ４５６、多重分離部４５７、記録再生部４６２、変復調回路部４５８、および音声コーデック４５９を有する。これらは、バス４６０を介して互いに接続されている。

また、携帯電話機４００は、操作キー４１９、CCD（Charge Coupled Devices）カメラ４１６、液晶ディスプレイ４１８、記憶部４２３、送受信回路部４６３、アンテナ４１４、マイクロホン（マイク）４２１、およびスピーカ４１７を有する。

電源回路部４５１は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機４００を動作可能な状態に起動する。

携帯電話機４００は、CPU、ROMおよびRAM等でなる主制御部４５０の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

例えば、音声通話モードにおいて、携帯電話機４００は、マイクロホン（マイク）４２１で集音した音声信号を、音声コーデック４５９によってデジタル音声データに変換し、これを変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（音声信号）は、公衆電話回線網を介して通話相手の携帯電話機に供給される。

また、例えば、音声通話モードにおいて、携帯電話機４００は、アンテナ４１４で受信した受信信号を送受信回路部４６３で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部４５８でスペクトラム逆拡散処理し、音声コーデック４５９によってアナログ音声信号に変換する。携帯電話機４００は、その変換して得られたアナログ音声信号をスピーカ４１７から出力する。

更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機４００は、操作キー４１９の操作によって入力された電子メールのテキストデータを、操作入力制御部４５２において受け付ける。携帯電話機４００は、そのテキストデータを主制御部４５０において処理し、LCD制御部４５５を介して、画像として液晶ディスプレイ４１８に表示させる。

また、携帯電話機４００は、主制御部４５０において、操作入力制御部４５２が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機４００は、その電子メールデータを、変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（電子メール）は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。

また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機４００は、基地局から送信された信号を、アンテナ４１４を介して送受信回路部４６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機４００は、その受信信号を変復調回路部４５８でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機４００は、復元された電子メールデータを、LCD制御部４５５を介して液晶ディスプレイ４１８に表示する。

なお、携帯電話機４００は、受信した電子メールデータを、記録再生部４６２を介して、記憶部４２３に記録する（記憶させる）ことも可能である。

この記憶部４２３は、書き換え可能な任意の記憶媒体である。記憶部４２３は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。

さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機４００は、撮像によりCCDカメラ４１６で画像データを生成する。CCDカメラ４１６は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。その画像データを、カメラI/F部４５４を介して、画像エンコーダ４５３で、例えばMPEG２やMPEG４等の所定の符号化方式によって圧縮符号化することにより符号化画像データに変換する。

携帯電話機４００は、このような処理を行う画像エンコーダ４５３として、上述した画像符号化装置５１を用いる。したがって、画像エンコーダ４５３は、画像符号化装置５１の場合と同様に、色差信号のブロックサイズが、直交変換のブロックサイズよりも小さい場合に、複数の輝度信号ブロックに対して対応させた単一の色差信号ブロックの動きベクトルを、複数の輝度信号ブロックの動きベクトルを用いて生成する。これにより、直交変換による非０係数の出現が減少されるので、符号化効率を改善することができる。また、メモリアクセスの計算が１回で済むので、必要となるメモリバンド幅を減少させることができる。

なお、携帯電話機４００は、このとき同時に、CCDカメラ４１６で撮像中にマイクロホン（マイク）４２１で集音した音声を、音声コーデック４５９においてアナログデジタル変換し、さらに符号化する。

携帯電話機４００は、多重分離部４５７において、画像エンコーダ４５３から供給された符号化画像データと、音声コーデック４５９から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機４００は、その結果得られる多重化データを、変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（画像データ）は、ネットワーク等を介して、通信相手に供給される。

なお、画像データを送信しない場合、携帯電話機４００は、CCDカメラ４１６で生成した画像データを、画像エンコーダ４５３を介さずに、LCD制御部４５５を介して液晶ディスプレイ４１８に表示させることもできる。

また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機４００は、基地局から送信された信号を、アンテナ４１４を介して送受信回路部４６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機４００は、その受信信号を変復調回路部４５８でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機４００は、多重分離部４５７において、その多重化データを分離して、符号化画像データと音声データとに分ける。

携帯電話機４００は、画像デコーダ４５６において、符号化画像データを、MPEG２やMPEG４等の所定の符号化方式に対応した復号方式でデコードすることにより、再生動画像データを生成し、これを、LCD制御部４５５を介して液晶ディスプレイ４１８に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ４１８に表示される。

携帯電話機４００は、このような処理を行う画像デコーダ４５６として、上述した画像復号装置１０１を用いる。したがって、画像デコーダ４５６は、画像復号装置１０１の場合と同様に、色差信号のブロックサイズが、直交変換のブロックサイズよりも小さい場合に、複数の輝度信号ブロックに対して対応させた単一の色差信号ブロックの動きベクトルを、複数の輝度信号ブロックの動きベクトルを用いて生成する。これにより、直交変換による非０係数の出現が減少されるので、符号化効率を改善することができる。また、メモリアクセスの計算が１回で済むので、必要となるメモリバンド幅を減少させることができる。

このとき、携帯電話機４００は、同時に、音声コーデック４５９において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ４１７より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。

なお、電子メールの場合と同様に、携帯電話機４００は、受信した簡易ホームページ等にリンクされたデータを、記録再生部４６２を介して、記憶部４２３に記録する（記憶させる）ことも可能である。

また、携帯電話機４００は、主制御部４５０において、撮像されてCCDカメラ４１６で得られた２次元コードを解析し、２次元コードに記録された情報を取得することができる。

さらに、携帯電話機４００は、赤外線通信部４８１で赤外線により外部の機器と通信することができる。

携帯電話機４００は、画像エンコーダ４５３として画像符号化装置５１を用いることにより、処理の高速化を実現するとともに、符号化効率を向上させることができる。結果として、携帯電話機４００は、符号化効率のよい符号化データ（画像データ）を、より高速に、他の装置に提供することができる。

また、携帯電話機４００は、画像デコーダ４５６として画像復号装置１０１を用いることにより、処理の高速化を実現するとともに、符号化効率を向上させることができる。その結果として、携帯電話機４００は、例えば、簡易ホームページにリンクされた動画像ファイルから、より高速に、より高精細な復号画像を得て、表示することができる。

なお、以上において、携帯電話機４００が、CCDカメラ４１６を用いるように説明したが、このCCDカメラ４１６の代わりに、CMOS（Complementary Metal Oxide Semiconductor）を用いたイメージセンサ（CMOSイメージセンサ）を用いるようにしてもよい。この場合も、携帯電話機４００は、CCDカメラ４１６を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。

また、以上においては携帯電話機４００として説明したが、例えば、PDA（Personal Digital Assistants）、スマートフォン、UMPC（Ultra Mobile Personal Computer）、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機４００と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機４００の場合と同様に、画像符号化装置５１および画像復号装置１０１を適用することができる。

［ハードディスクレコーダの構成例］
図３２は、本発明を適用した画像符号化装置および画像復号装置を用いるハードディスクレコーダの主な構成例を示すブロック図である。

図３２に示されるハードディスクレコーダ（HDDレコーダ）５００は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号（テレビジョン信号）に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。

ハードディスクレコーダ５００は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ５００は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。

さらに、ハードディスクレコーダ５００は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ５６０に供給し、モニタ５６０の画面にその画像を表示させる。また、ハードディスクレコーダ５００は、モニタ５６０のスピーカよりその音声を出力させることができる。

ハードディスクレコーダ５００は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ５６０に供給し、モニタ５６０の画面にその画像を表示させる。また、ハードディスクレコーダ５００は、モニタ５６０のスピーカよりその音声を出力させることもできる。

もちろん、この他の動作も可能である。

図３２に示されるように、ハードディスクレコーダ５００は、受信部５２１、復調部５２２、デマルチプレクサ５２３、オーディオデコーダ５２４、ビデオデコーダ５２５、およびレコーダ制御部５２６を有する。ハードディスクレコーダ５００は、さらに、EPGデータメモリ５２７、プログラムメモリ５２８、ワークメモリ５２９、ディスプレイコンバータ５３０、OSD（On Screen Display）制御部５３１、ディスプレイ制御部５３２、記録再生部５３３、D/Aコンバータ５３４、および通信部５３５を有する。

また、ディスプレイコンバータ５３０は、ビデオエンコーダ５４１を有する。記録再生部５３３は、エンコーダ５５１およびデコーダ５５２を有する。

受信部５２１は、リモートコントローラ（図示せず）からの赤外線信号を受信し、電気信号に変換してレコーダ制御部５２６に出力する。レコーダ制御部５２６は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ５２８に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部５２６は、このとき、ワークメモリ５２９を必要に応じて使用する。

通信部５３５は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部５３５は、レコーダ制御部５２６により制御され、チューナ（図示せず）と通信し、主にチューナに対して選局制御信号を出力する。

復調部５２２は、チューナより供給された信号を、復調し、デマルチプレクサ５２３に出力する。デマルチプレクサ５２３は、復調部５２２より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ５２４、ビデオデコーダ５２５、またはレコーダ制御部５２６に出力する。

オーディオデコーダ５２４は、入力されたオーディオデータを、例えばMPEG方式でデコードし、記録再生部５３３に出力する。ビデオデコーダ５２５は、入力されたビデオデータを、例えばMPEG方式でデコードし、ディスプレイコンバータ５３０に出力する。レコーダ制御部５２６は、入力されたEPGデータをEPGデータメモリ５２７に供給し、記憶させる。

ディスプレイコンバータ５３０は、ビデオデコーダ５２５またはレコーダ制御部５２６より供給されたビデオデータを、ビデオエンコーダ５４１により、例えばNTSC（National Television Standards Committee）方式のビデオデータにエンコードし、記録再生部５３３に出力する。また、ディスプレイコンバータ５３０は、ビデオデコーダ５２５またはレコーダ制御部５２６より供給されるビデオデータの画面のサイズを、モニタ５６０のサイズに対応するサイズに変換する。ディスプレイコンバータ５３０は、画面のサイズが変換されたビデオデータを、さらに、ビデオエンコーダ５４１によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部５３２に出力する。

ディスプレイ制御部５３２は、レコーダ制御部５２６の制御のもと、OSD（On Screen Display）制御部５３１が出力したOSD信号を、ディスプレイコンバータ５３０より入力されたビデオ信号に重畳し、モニタ５６０のディスプレイに出力し、表示させる。

モニタ５６０にはまた、オーディオデコーダ５２４が出力したオーディオデータが、D/Aコンバータ５３４によりアナログ信号に変換されて供給されている。モニタ５６０は、このオーディオ信号を内蔵するスピーカから出力する。

記録再生部５３３は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。

記録再生部５３３は、例えば、オーディオデコーダ５２４より供給されるオーディオデータを、エンコーダ５５１によりMPEG方式でエンコードする。また、記録再生部５３３は、ディスプレイコンバータ５３０のビデオエンコーダ５４１より供給されるビデオデータを、エンコーダ５５１によりMPEG方式でエンコードする。記録再生部５３３は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部５３３は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。

記録再生部５３３は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部５３３は、デコーダ５５２によりオーディオデータおよびビデオデータをMPEG方式でデコードする。記録再生部５３３は、復号したオーディオデータをD/A変換し、モニタ５６０のスピーカに出力する。また、記録再生部５３３は、復号したビデオデータをD/A変換し、モニタ５６０のディスプレイに出力する。

レコーダ制御部５２６は、受信部５２１を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ５２７から最新のEPGデータを読み出し、それをOSD制御部５３１に供給する。OSD制御部５３１は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部５３２に出力する。ディスプレイ制御部５３２は、OSD制御部５３１より入力されたビデオデータをモニタ５６０のディスプレイに出力し、表示させる。これにより、モニタ５６０のディスプレイには、EPG（電子番組ガイド）が表示される。

また、ハードディスクレコーダ５００は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。

通信部５３５は、レコーダ制御部５２６に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部５２６に供給する。レコーダ制御部５２６は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部５３３に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部５２６および記録再生部５３３が、必要に応じて再エンコード等の処理を行うようにしてもよい。

また、レコーダ制御部５２６は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ５３０に供給する。ディスプレイコンバータ５３０は、ビデオデコーダ５２５から供給されるビデオデータと同様に、レコーダ制御部５２６から供給されるビデオデータを処理し、ディスプレイ制御部５３２を介してモニタ５６０に供給し、その画像を表示させる。

また、この画像表示に合わせて、レコーダ制御部５２６が、復号したオーディオデータを、D/Aコンバータ５３４を介してモニタ５６０に供給し、その音声をスピーカから出力させるようにしてもよい。

さらに、レコーダ制御部５２６は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ５２７に供給する。

以上のようなハードディスクレコーダ５００は、ビデオデコーダ５２５、デコーダ５５２、およびレコーダ制御部５２６に内蔵されるデコーダとして画像復号装置１０１を用いる。したがって、ビデオデコーダ５２５、デコーダ５５２、およびレコーダ制御部５２６に内蔵されるデコーダは、画像復号装置１０１の場合と同様に、色差信号のブロックサイズが、直交変換のブロックサイズよりも小さい場合に、複数の輝度信号ブロックに対して対応させた単一の色差信号ブロックの動きベクトルを、複数の輝度信号ブロックの動きベクトルを用いて生成する。これにより、直交変換による非０係数の出現が減少されるので、符号化効率を改善することができる。また、メモリアクセスの計算が１回で済むので、必要となるメモリバンド幅を減少させることができる。

したがって、ハードディスクレコーダ５００は、処理の高速化を実現するとともに、精度の高い予測画像を生成することができる。その結果として、ハードディスクレコーダ５００は、例えば、チューナを介して受信されたビデオデータの符号化データや、記録再生部５３３のハードディスクから読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高速に、より高精細な復号画像を得て、モニタ５６０に表示させることができる。

また、ハードディスクレコーダ５００は、エンコーダ５５１として画像符号化装置５１を用いる。したがって、エンコーダ５５１は、画像符号化装置５１の場合と同様に、色差信号のブロックサイズが、直交変換のブロックサイズよりも小さい場合に、複数の輝度信号ブロックに対して対応させた単一の色差信号ブロックの動きベクトルを、複数の輝度信号ブロックの動きベクトルを用いて生成する。これにより、直交変換による非０係数の出現が減少されるので、符号化効率を改善することができる。また、メモリアクセスの計算が１回で済むので、必要となるメモリバンド幅を減少させることができる。

したがって、ハードディスクレコーダ５００は、例えば、処理の高速化を実現するとともに、ハードディスクに記録する符号化データの符号化効率を向上させることができる。その結果として、ハードディスクレコーダ５００は、より高速に、ハードディスクの記憶領域をより効率よく使用することができる。

なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ５００について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ５００の場合と同様に、画像符号化装置５１および画像復号装置１０１を適用することができる。

［カメラの構成例］
図３３は、本発明を適用した画像復号装置および画像符号化装置を用いるカメラの主な構成例を示すブロック図である。

図３３に示されるカメラ６００は、被写体を撮像し、被写体の画像をLCD６１６に表示させたり、それを画像データとして、記録メディア６３３に記録したりする。

レンズブロック６１１は、光（すなわち、被写体の映像）を、CCD/CMOS６１２に入射させる。CCD/CMOS６１２は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部６１３に供給する。

カメラ信号処理部６１３は、CCD/CMOS６１２から供給された電気信号を、Ｙ，Ｃｒ，Ｃｂの色差信号に変換し、画像信号処理部６１４に供給する。画像信号処理部６１４は、コントローラ６２１の制御の下、カメラ信号処理部６１３から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ６４１で例えばMPEG方式により符号化したりする。画像信号処理部６１４は、画像信号を符号化して生成した符号化データを、デコーダ６１５に供給する。さらに、画像信号処理部６１４は、オンスクリーンディスプレイ（OSD）６２０において生成された表示用データを取得し、それをデコーダ６１５に供給する。

以上の処理において、カメラ信号処理部６１３は、バス６１７を介して接続されるDRAM（Dynamic Random Access Memory）６１８を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM６１８に保持させる。

デコーダ６１５は、画像信号処理部６１４から供給された符号化データを復号し、得られた画像データ（復号画像データ）をLCD６１６に供給する。また、デコーダ６１５は、画像信号処理部６１４から供給された表示用データをLCD６１６に供給する。LCD６１６は、デコーダ６１５から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。

オンスクリーンディスプレイ６２０は、コントローラ６２１の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス６１７を介して画像信号処理部６１４に出力する。

コントローラ６２１は、ユーザが操作部６２２を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス６１７を介して、画像信号処理部６１４、DRAM６１８、外部インタフェース６１９、オンスクリーンディスプレイ６２０、およびメディアドライブ６２３等を制御する。FLASH ROM６２４には、コントローラ６２１が各種処理を実行する上で必要なプログラムやデータ等が格納される。

例えば、コントローラ６２１は、画像信号処理部６１４やデコーダ６１５に代わって、DRAM６１８に記憶されている画像データを符号化したり、DRAM６１８に記憶されている符号化データを復号したりすることができる。このとき、コントローラ６２１は、画像信号処理部６１４やデコーダ６１５の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部６１４やデコーダ６１５が対応していない方式により符号化・復号処理を行うようにしてもよい。

また、例えば、操作部６２２から画像印刷の開始が指示された場合、コントローラ６２１は、DRAM６１８から画像データを読み出し、それを、バス６１７を介して外部インタフェース６１９に接続されるプリンタ６３４に供給して印刷させる。

さらに、例えば、操作部６２２から画像記録が指示された場合、コントローラ６２１は、DRAM６１８から符号化データを読み出し、それを、バス６１７を介してメディアドライブ６２３に装着される記録メディア６３３に供給して記憶させる。

記録メディア６３３は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア６３３は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。

また、メディアドライブ６２３と記録メディア６３３を一体化し、例えば、内蔵型ハードディスクドライブやSSD（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

外部インタフェース６１９は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ６３４と接続される。また、外部インタフェース６１９には、必要に応じてドライブ６３１が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア６３２が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM６２４にインストールされる。

さらに、外部インタフェース６１９は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ６２１は、例えば、操作部６２２からの指示に従って、DRAM６１８から符号化データを読み出し、それを外部インタフェース６１９から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ６２１は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース６１９を介して取得し、それをDRAM６１８に保持させたり、画像信号処理部６１４に供給したりすることができる。

以上のようなカメラ６００は、デコーダ６１５として画像復号装置１０１を用いる。したがって、デコーダ６１５は、画像復号装置１０１の場合と同様に、色差信号のブロックサイズが、直交変換のブロックサイズよりも小さい場合に、複数の輝度信号ブロックに対して対応させた単一の色差信号ブロックの動きベクトルを、複数の輝度信号ブロックの動きベクトルを用いて生成する。これにより、直交変換による非０係数の出現が減少されるので、符号化効率を改善することができる。また、メモリアクセスの計算が１回で済むので、必要となるメモリバンド幅を減少させることができる。

したがって、カメラ６００は、処理の高速化を実現するとともに、精度の高い予測画像を生成することができる。その結果として、カメラ６００は、例えば、CCD/CMOS６１２において生成された画像データや、DRAM６１８または記録メディア６３３から読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高速に、より高精細な復号画像を得て、LCD６１６に表示させることができる。

また、カメラ６００は、エンコーダ６４１として画像符号化装置５１を用いる。したがって、エンコーダ６４１は、画像符号化装置５１の場合と同様に、色差信号のブロックサイズが、直交変換のブロックサイズよりも小さい場合に、複数の輝度信号ブロックに対して対応させた単一の色差信号ブロックの動きベクトルを、複数の輝度信号ブロックの動きベクトルを用いて生成する。これにより、直交変換による非０係数の出現が減少されるので、符号化効率を改善することができる。また、メモリアクセスの計算が１回で済むので、必要となるメモリバンド幅を減少させることができる。

したがって、カメラ６００は、例えば、処理の高速化を実現するとともに、ハードディスクに記録する符号化データの符号化効率を向上させることができる。その結果として、カメラ６００は、より高速に、DRAM６１８や記録メディア６３３の記憶領域をより効率よく使用することができる。

なお、コントローラ６２１が行う復号処理に画像復号装置１０１の復号方法を適用するようにしてもよい。同様に、コントローラ６２１が行う符号化処理に画像符号化装置５１の符号化方法を適用するようにしてもよい。

また、カメラ６００が撮像する画像データは動画像であってもよいし、静止画像であってもよい。

もちろん、画像符号化装置５１および画像復号装置１０１は、上述した装置以外の装置やシステムにも適用可能である。

５１画像符号化装置，６６可逆符号化部，７４イントラ予測部，７５動き予測・補償部，７６色差ブロック判別部，７７色差動きベクトル決定部，８１動き探索部，８２モード判定部，８３動き補償部，９１ブロックカテゴライズ部，９２色差動きベクトル生成部，９５色差予測動きベクトル生成部，９６色差動きベクトル探索部，１０１画像復号装置，１１２可逆復号部，１２１イントラ予測部，１２２動き予測・補償部，１２３色差動きベクトル決定部，１２４色差ブロック判別部，１３１動きベクトルバッファ，１３２モード情報バッファ，１３３予測画像生成部，１４１ブロックカテゴライズ部，１４２色差動きベクトル生成部

Claims

符号化対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルを生成する色差動きベクトル生成手段と、
前記色差動きベクトル生成手段により生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像を生成する予測画像生成手段と、
前記予測画像生成手段により生成された予測画像を用いて、前記色差ブロックを符号化する符号化手段と
を備える画像処理装置。
前記色差動きベクトル生成手段は、前記単一の色差ブロックの動きベクトルを、前記複数の輝度ブロックの動きベクトルの少なくとも１つを用いて生成する
請求項１に記載の画像処理装置。
前記色差動きベクトル生成手段は、前記単一の色差ブロックの動きベクトルを、前記複数の輝度ブロックの動きベクトルの少なくとも１つを用いた関数により生成する
請求項２に記載の画像処理装置。
前記色差動きベクトル生成手段は、前記色差ブロックが前記直交変換のブロックサイズ以上のサイズとなる場合、既存の符号化規格と同じ方法で、前記色差ブロックの動きベクトルを生成する
請求項２に記載の画像処理装置。
画像処理装置が、
符号化対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルを生成し、
生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像を生成し、
生成された予測画像を用いて、前記色差ブロックを符号化する
画像処理方法。
復号対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルを生成する色差動きベクトル生成手段と、
前記色差動きベクトル生成手段により生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像を生成する予測画像生成手段と、
前記予測画像生成手段により生成された予測画像を用いて、前記色差ブロックを復号する復号手段と
を備える画像処理装置。
前記色差動きベクトル生成手段は、前記単一の色差ブロックの動きベクトルを、前記複数の輝度ブロックの動きベクトルの少なくとも１つを用いて生成する
請求項６に記載の画像処理装置。
前記色差動きベクトル生成手段は、前記単一の色差ブロックの動きベクトルを、前記複数の輝度ブロックの動きベクトルの少なくとも１つを用いた関数により生成する
請求項７に記載の画像処理装置。
前記色差動きベクトル生成手段は、前記色差ブロックが前記直交変換のブロックサイズ以上のサイズとなる場合、既存の符号化規格と同じ方法で、前記色差ブロックの動きベクトルを生成して、前記色差ブロックの予測画像を生成する
請求項７に記載の画像処理装置。
画像処理装置が、
復号対象の輝度ブロックに対応する色差ブロックが直交変換のブロックサイズよりも小さいサイズとなる場合、複数の前記輝度ブロックに対して、単一の色差ブロックを対応させて、前記単一の色差ブロックの動きベクトルを生成し、
生成された色差ブロックの動きベクトルを用いて、前記色差ブロックの予測画像を生成し、
生成された予測画像を用いて、前記色差ブロックを復号する
画像処理方法。