JP2013005077A

JP2013005077A - 画像処理装置および方法

Info

Publication number: JP2013005077A
Application number: JP2011132019A
Authority: JP
Inventors: Kazufumi Sato; 数史佐藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2011-06-14
Filing date: 2011-06-14
Publication date: 2013-01-07
Also published as: CN103597836A; WO2012173022A1; US20140072055A1

Abstract

【課題】動きベクトルの符号化効率を向上させることができるようにする。
【解決手段】時間予測動きベクトル情報決定部は、画像を動き予測する場合、参照画像において、処理対象の当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する。差分動きベクトル生成部は、決定された取り出し領域から取り出された時間予測動きベクトル情報と、当該領域の動き情報の差分である差分動き情報を生成する。参照領域は複数の分割領域により区分されており、時間予測動きベクトル情報決定部は、参照領域内の複数の分割領域のうち、当該領域と重なる面積が最大となる最大領域を、取り出し領域として決定する。本技術は、画像処理装置に適用することができる。
【選択図】図１２

Description

本技術は、画像処理装置および方法に関し、特に、動きベクトルの符号化効率を向上させることができるようにした画像処理装置および方法に関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEG（Moving Picture Experts Group）などの方式に準拠した装置が、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。

特に、MPEG2（ISO（International Organization for Standardization）/IEC（International Electrotechnical Commission） 13818-2）は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば７２０×４８０画素を持つ標準解像度の飛び越し走査画像であれば４〜８Ｍｂｐｓ、１９２０×１０８８画素を持つ高解像度の飛び越し走査画像であれば１８〜２２Ｍｂｐｓの符号量（ビットレート）を割り当てることで、高い圧縮率と良好な画質の実現が可能である。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、１９９８年１２月にISO/IEC 14496-2としてその規格が国際標準に承認されている。

更に、近年、当初テレビ会議用の画像符号化を目的として、H.26L （ITU-T（International Telecommunication Union Telecommunication Standardization Sector） Q6/16 VCEG（Video Coding Expert Group））という標準の規格化が進んでいる。H.26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.26Lをベースに、H.26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われている。これは、２００３年３月にH.264及びMPEG-4 Part10 （Advanced Video Coding、以下AVCと記す）という名で国際標準となっている。

しかしながら、マクロブロックサイズを１６画素×１６画素とするのは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；4000画素×2000画素）といった大きな画枠に対しては、最適ではない恐れがあった。

そこで、現在、AVCより更なる符号化効率の向上を目的として、ITU-Tと、ISO/IECの共同の標準化団体であるJCTVC（Joint Collaboration Team - Video Coding）により、HEVC（High Efficiency Video Coding）と呼ばれる符号化方式の標準化が進められている（例えば、非特許文献１参照）。

このHEVC符号化方式においては、AVCにおけるマクロブロックと同様の処理単位としてコーディングユニット（CU（Coding Unit））が定義されている。このCUは、AVCのマクロブロックのようにサイズが16×16画素に固定されず、それぞれのシーケンスにおいて、画像圧縮情報中において指定される。

ところで、AVCにおけるメディアン予測を用いた動きベクトルの符号化を改善するため、AVCにおいて定義されている、メディアン予測により求められる”Spatial Predictor”に加え、”Temporal Predictor”及び”Spatio-Temporal Predictor”のどれかを、予測動きベクトル情報として、適応的に用いること（以下、MVコンペティション（MVCompetition）とも称する）が提案されている（例えば、非特許文献２参照）。

Thomas Wiegand, Woo-Jin Han, Benjamin Bross, Jens-Rainer Ohm, Gary J. Sullivan, "Working Draft 1 of High-Efficiency Video Coding ", JCTVC-C403, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG113rd Meeting: Guangzhou, CN, 7-15 October, 2010 Joel Jung,Guillaume Laroche,"Competition-Based Scheme for Motion Vector Selection and Coding", VCEG-AC06,ITU - Telecommunications Standardization SectorSTUDY GROUP 16 Question 6Video Coding Experts Group (VCEG)29th Meeting: Klagenfurt, Austria, 17-18 July, 2006

しかしながら、”Temporal Predictor”を用いた動きベクトルの符号化処理において、参照画像内の領域のうち、処理対象領域の左上の画素と同一アドレスの画素を含む領域がCo-Located領域とされる場合、Co-Located領域の面積によっては、動きベクトルの符号化効率が低下するおそれがある。換言すると、参照画像が複数の領域に分割されている場合、複数の領域のうちの面積の小さな領域がCo-Located領域とされると、処理対象領域とCo-Located領域とで共有する面積が小さくなる。したがって、処理対象領域の動きベクトル情報と、Co-Located領域の動きベクトル情報の相関性が低くなり、動きベクトルの符号化効率が低下するおそれがある。

本技術は、このような状況に鑑みてなされたものであり、動きベクトルの符号化効率を向上させることができるようにしたものである。

本技術の第１の側面の画像処理装置は、画像を動き予測する場合、参照画像において、処理対象の当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定部と、前記決定部により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報と、前記当該領域の動き情報の差分である差分動き情報を生成する差分生成部とを備え、前記参照領域は複数の分割領域により区分されており、前記決定部は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定する。

前記決定部は、前記最大領域が複数存在する場合、複数の前記最大領域の中から前記取り出し領域を決定するルールを有することができる。

前記ルールを、前記参照領域をラスタースキャン順に辿ったときに、最先に現れる前記最大領域を前記取り出し領域とする、というルールとすることができる。

前記ルールを、前記参照領域をラスタースキャン順に辿ったときに、最先に現れるインター予測符号化された前記最大領域を前記取り出し領域とする、というルールとすることができる。

前記参照領域は複数の分割領域により区分されており、前記決定部は、前記当該領域が所定の閾値以上のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、前記当該領域が所定の閾値未満のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定することができる。

前記所定の閾値は、入力となる画像圧縮情報中のシーケンスパラメータセット、ピクチャパラメータセット、またはスライスヘッダにおいて指定することができる。

前記決定部は、出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値以上である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値未満である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定することができる。

前記プロファイルレベルとは画枠とすることができる。

本技術の第１の側面の画像処理方法は、上述した本技術の第１の側面の画像処理装置に対応する方法である。

本技術の第１の側面の画像処理装置および方法においては、画像を動き予測する場合、参照画像において、処理対象の当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域が決定され、決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報と、前記当該領域の動き情報の差分である差分動き情報が生成される。前記参照領域は複数の分割領域により区分されており、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域が、前記取り出し領域として決定される。

本技術の第２の側面の画像処理装置は、画像の符号化データを復号する場合、前記画像の符号化に用いられた、時間予測動きベクトル情報と処理対象の当該領域の動き情報の差分である差分動き情報を取得する取得部と、参照画像において、前記当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定部と、前記取得部により取得された前記差分動き情報と、前記決定部により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報を用いて、動き補償のための前記当該領域の動き情報を再構築する動き情報再構築部とを備え、前記参照領域は複数の分割領域により区分されており、前記決定部は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を前記取り出し領域として決定する。

前記プロファイルレベルとは画枠とすることができる。

本技術の第２の側面の画像処理方法は、上述した本技術の第２の側面の画像処理装置に対応する方法である。

本技術の第２の側面の画像処理装置及び方法においては、画像の符号化データを復号する場合、前記画像の符号化に用いられた、時間予測動きベクトル情報と処理対象の当該領域の動き情報の差分である差分動き情報が取得され、参照画像において、前記当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域が決定され、前記差分動き情報と、前記取り出し領域から取り出された前記時間予測動きベクトル情報が用いられて、動き補償のための前記当該領域の動き情報が再構築される。前記参照領域は複数の分割領域により区分されており、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域が前記取り出し領域として決定される。

以上のごとく、本技術によれば、動きベクトルの符号化効率を向上させることができる。

画像符号化装置の主な構成例を示すブロック図である。小数点画素精度の動き予測・補償処理の例を示す図である。マクロブロックの例を示す図である。メディアンオペレーションの様子の例を説明する図である。マルチ参照フレームの例を説明する図である。テンポラルダイレクトモードの様子の例を説明する図である。動きベクトル符号化方法の様子の例を説明する図である。コーディングユニットの構成例を説明する図である。 Motion Partition Mergingの様子の例を説明する図である。 Co-Located領域の面積について説明する図である。時間予測動きベクトル情報取り出し領域の決定について説明する図である。動き予測・補償部、時間予測動きベクトル情報決定部、および動きベクトル符号化部の詳細な構成例を示すブロック図である。符号化処理の流れを説明するフローチャートである。インター動き予測処理の流れを説明するフローチャートである。時間予測動きベクトル情報取り出し領域決定処理の流れを説明するフローチャートである。画像復号装置の主な構成例を示すブロック図である。動き予測・補償部、時間予測動きベクトル情報決定部、および動きベクトル復号部の詳細な構成例を示すブロック図である。復号処理の流れを説明するフローチャートである。予測処理の流れを説明するフローチャートである。インター動き予測処理の流れを説明するフローチャートである。コンピュータの主な構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。

以下、本技術を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
１．第１の実施の形態（画像符号化装置）
２．第２の実施の形態（画像復号装置）
３．第３の実施の形態（コンピュータ）
４．第４の実施の形態（テレビジョン装置）
５．第５の実施の形態（携帯電話機）
６．第６の実施の形態（記録再生装置）
７．第７の実施の形態（撮像装置）

＜１．第１の実施の形態＞
［画像符号化装置］
図１は、画像符号化装置の主な構成例を示すブロック図である。

図１に示される画像符号化装置１００は、H．264及びMPEG（Moving Picture Experts Group）4 Part10（AVC（Advanced Video Coding））符号化方式のように、予測処理を用いて画像データを符号化する。

図１に示されるように画像符号化装置１００は、A/D変換部１０１、画面並べ替えバッファ１０２、演算部１０３、直交変換部１０４、量子化部１０５、可逆符号化部１０６、および蓄積バッファ１０７を有する。また、画像符号化装置１００は、逆量子化部１０８、逆直交変換部１０９、演算部１１０、ループフィルタ１１１、フレームメモリ１１２、選択部１１３、イントラ予測部１１４、動き予測・補償部１１５、予測画像選択部１１６、およびレート制御部１１７を有する。

画像符号化装置１００は、さらに、時間予測動きベクトル情報決定部１２１および動きベクトル符号化部１２２を有する。

A/D変換部１０１は、入力された画像データをA/D変換し、変換後の画像データ（デジタルデータ）を、画面並べ替えバッファ１０２に供給し、記憶させる。画面並べ替えバッファ１０２は、記憶した表示の順番のフレームの画像を、GOP（Group Of Picture）に応じて、符号化のためのフレームの順番に並べ替え、フレームの順番を並び替えた画像を、演算部１０３に供給する。また、画面並べ替えバッファ１０２は、フレームの順番を並び替えた画像を、イントラ予測部１１４および動き予測・補償部１１５にも供給する。

演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、予測画像選択部１１６を介してイントラ予測部１１４若しくは動き予測・補償部１１５から供給される予測画像を減算し、その差分情報を直交変換部１０４に出力する。

例えば、インター符号化が行われる画像の場合、演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、動き予測・補償部１１５から供給される予測画像を減算する。

直交変換部１０４は、演算部１０３から供給される差分情報に対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。なお、この直交変換の方法は任意である。直交変換部１０４は、その変換係数を量子化部１０５に供給する。

量子化部１０５は、直交変換部１０４から供給される変換係数を量子化する。量子化部１０５は、レート制御部１１７から供給される符号量の目標値に関する情報に基づいて量子化パラメータを設定し、その量子化を行う。なお、この量子化の方法は任意である。量子化部１０５は、量子化された変換係数を可逆符号化部１０６に供給する。

可逆符号化部１０６は、量子化部１０５において量子化された変換係数を任意の符号化方式で符号化する。係数データは、レート制御部１１７の制御の下で量子化されているので、この符号量は、レート制御部１１７が設定した目標値となる（若しくは目標値に近似する）。

また、可逆符号化部１０６は、イントラ予測のモードを示す情報などをイントラ予測部１１４から取得し、インター予測のモードを示す情報や動きベクトル情報などを動き予測・補償部１１５から取得する。さらに、可逆符号化部１０６は、ループフィルタ１１１において使用されたフィルタ係数等を取得する。

可逆符号化部１０６は、これらの各種情報を任意の符号化方式で符号化し、符号化データのヘッダ情報の一部とする（多重化する）。可逆符号化部１０６は、符号化して得られた符号化データを蓄積バッファ１０７に供給して蓄積させる。

可逆符号化部１０６の符号化方式としては、例えば、可変長符号化または算術符号化等が挙げられる。可変長符号化としては、例えば、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などが挙げられる。算術符号化としては、例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）などが挙げられる。

蓄積バッファ１０７は、可逆符号化部１０６から供給された符号化データを、一時的に保持する。蓄積バッファ１０７は、所定のタイミングにおいて、保持している符号化データを、例えば、後段の図示せぬ記録装置（記録媒体）や伝送路などに出力する。

また、量子化部１０５において量子化された変換係数は、逆量子化部１０８にも供給される。逆量子化部１０８は、その量子化された変換係数を、量子化部１０５による量子化に対応する方法で逆量子化する。この逆量子化の方法は、量子化部１０５による量子化処理に対応する方法であればどのような方法であってもよい。逆量子化部１０８は、得られた変換係数を、逆直交変換部１０９に供給する。

逆直交変換部１０９は、逆量子化部１０８から供給された変換係数を、直交変換部１０４による直交変換処理に対応する方法で逆直交変換する。この逆直交変換の方法は、直交変換部１０４による直交変換処理に対応する方法であればどのようなものであってもよい。逆直交変換された出力（復元された差分情報）は、演算部１１０に供給される。

演算部１１０は、逆直交変換部１０９から供給された逆直交変換結果、すなわち、復元された差分情報に、予測画像選択部１１６を介してイントラ予測部１１４若しくは動き予測・補償部１１５から供給される予測画像を加算し、局部的に復号された画像（復号画像）を得る。その復号画像は、ループフィルタ１１１またはフレームメモリ１１２に供給される。

ループフィルタ１１１は、デブロックフィルタや適応ループフィルタ等を含み、演算部１１０から供給される復号画像に対して適宜フィルタ処理を行う。例えば、ループフィルタ１１１は、復号画像に対してデブロックフィルタ処理を行うことにより復号画像のブロック歪を除去する。また、例えば、ループフィルタ１１１は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた復号画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。

なお、ループフィルタ１１１が、復号画像に対して任意のフィルタ処理を行うようにしてもよい。また、ループフィルタ１１１は、必要に応じて、フィルタ処理に用いたフィルタ係数等の情報を可逆符号化部１０６に供給し、それを符号化させるようにすることもできる。

ループフィルタ１１１は、フィルタ処理結果（フィルタ処理後の復号画像）をフレームメモリ１１２に供給する。なお、上述したように、演算部１１０から出力される復号画像は、ループフィルタ１１１を介さずにフレームメモリ１１２に供給することができる。つまり、ループフィルタ１１１によるフィルタ処理は省略することができる。

フレームメモリ１１２は、供給される復号画像を記憶し、所定のタイミングにおいて、記憶している復号画像を参照画像として、選択部１１３に供給する。

選択部１１３は、フレームメモリ１１２から供給される参照画像の供給先を選択する。例えば、インター予測の場合、選択部１１３は、フレームメモリ１１２から供給される参照画像を動き予測・補償部１１５に供給する。

イントラ予測部１１４は、選択部１１３を介してフレームメモリ１１２から供給される参照画像である処理対象ピクチャ内の画素値を用いて、基本的にプレディクションユニット（PU(Prediction Unit)）を処理単位として予測画像を生成するイントラ予測（画面内予測）を行う。イントラ予測部１１４は、予め用意された複数のモード（イントラ予測モード）でこのイントラ予測を行う。

イントラ予測部１１４は、候補となる全てのイントラ予測モードで予測画像を生成し、画面並べ替えバッファ１０２から供給される入力画像を用いて各予測画像のコスト関数値を評価し、最適なモードを選択する。イントラ予測部１１４は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１１６に供給する。

また、上述したように、イントラ予測部１１４は、採用されたイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部１０６に供給し、符号化させる。

動き予測・補償部１１５は、画面並べ替えバッファ１０２から供給される入力画像と、選択部１１３を介してフレームメモリ１１２から供給される参照画像とを用いて、基本的にPUを処理単位として、動き予測（インター予測）を行い、検出された動きベクトルに応じて動き補償処理を行い、予測画像（インター予測画像情報）を生成する。動き予測・補償部１１５は、予め用意された複数のモード（インター予測モード）でこのようなインター予測を行う。

動き予測・補償部１１５は、候補となる全てのインター予測モードで予測画像を生成し、各予測画像のコスト関数値を評価し、最適なモードを選択する。動き予測・補償部１１５は、最適なインター予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１１６に供給する。

また、動き予測・補償部１１５は、採用されたインター予測モードを示す情報や、符号化データを復号する際に、そのインター予測モードで処理を行うために必要な情報等を可逆符号化部１０６に供給し、符号化させる。

さらに、動き予測・補償部１１５は、時間予測動きベクトル情報決定部１２１に時間周辺動き情報を供給し、動きベクトル符号化部１２２に空間周辺動き情報および動き情報を供給する。

予測画像選択部１１６は、演算部１０３や演算部１１０に供給する予測画像の供給元を選択する。例えば、インター符号化の場合、予測画像選択部１１６は、予測画像の供給元として動き予測・補償部１１５を選択し、その動き予測・補償部１１５から供給される予測画像を演算部１０３や演算部１１０に供給する。

レート制御部１１７は、蓄積バッファ１０７に蓄積された符号化データの符号量に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

時間予測動きベクトル情報決定部１２１は、動き予測・補償部１１５から供給される時間周辺動き情報の中から、時間予測動きベクトル情報として用いるものを決定し、決定した時間予測動きベクトル情報を動きベクトル符号化部１２２に供給する。

動きベクトル符号化部１２２は、動き予測・補償部１１５から供給された空間周辺動き情報の中から、空間予測動きベクトル情報として用いるものを決定する。そして、動きベクトル符号化部１２２は、決定した空間予測動きベクトル情報と、時間予測動きベクトル情報決定部１２１から供給された時間予測動きベクトル情報の中から、適切な予測動きベクトル情報を選択する。そして、動きベクトル符号化部１２２は、選択した予測動きベクトル情報と、動き予測・補償部１１５から供給された動き情報との差分動き情報を求める。

動き予測・補償部１１５は、動きベクトル符号化部１２２により求められた差分動き情報等を用いて、MVコンペティションやマージモード等の処理を行う。

［１／４画素精度動き予測］
図２は、AVC符号化方式において規定されている、１／４画素精度の動き予測・補償処理の様子の例を説明する図である。図２において、各四角は、画素を示している。その内、Ａはフレームメモリ１１２に格納されている整数精度画素の位置を示し、b,c,dは、１／２画素精度の位置を示し、e1,e2,e3は１／４画素精度の位置を示している。

以下においては、関数Clip1()を以下の式（１）のように定義する。

・・・（１）

例えば、入力画像が８ビット精度である場合、式（１）のmax_pixの値は２５５となる。

b及びdの位置における画素値は、６tapのFIRフィルタを用いて、以下の式（２）および式（３）のように生成される。

・・・（２）

・・・（３）

cの位置における画素値は、水平方向及び垂直方向に６tapのFIRフィルタを適用し、以下の式（４）乃至式（６）のように生成される。

・・・（４）
もしくは、

・・・（５）

・・・（６）

なお、Clip処理は、水平方向及び垂直方向の積和処理の両方を行った後、最後に１度のみ行われる。

e1乃至e3は、以下の式（７）乃至式（９）のように、線形内挿により生成される。

・・・（７）

・・・（８）

・・・（９）

［マクロブロック］
また、MPEG2においては、動き予測・補償処理の単位は、フレーム動き補償モードの場合には１６×１６画素、フィールド動き補償モードの場合には第一フィールド、第二フィールドのそれぞれに対し、１６×８画素を単位として動き予測・補償処理が行なわれる。

これに対し、AVCにおいては、図３に示されるように、１６×１６画素により構成される１つのマクロブロックを、１６×１６、１６×８、８×１６若しくは８×８のいずれかのパーティションに分割し、サブマクロブロック毎に、互いに独立した動きベクトル情報を持つことが可能である。更に、８×８パーティションに関しては、図３に示されるとおり、８×８、８×４、４×８、４×４のいずれかのサブマクロブロックに分割し、それぞれ独立した動きベクトル情報を持つことが可能である。

しかしながら、AVC画像符号化方式において、MPEG2の場合と同様に、かかるような動き予測・補償処理が行なわれるようにすると、膨大な動きベクトル情報が生成されてしまう恐れがあった。そして、その生成された動きベクトル情報をこのまま符号化することは、符号化効率の低下を招く恐れがあった。

［動きベクトルのメディアン予測］
かかる問題を解決する手法として、AVC画像符号化においては、以下のような手法により、動きベクトルの符号化情報の低減が実現されている。

図４に示される各直線は、動き補償ブロックの境界を示している。また、図４において、Ｅはこれから符号化されようとしている当該動き補償ブロックを示し、Ａ乃至Ｄは、それぞれ、既に符号化済の、Ｅに隣接する動き補償ブロックを示す。

今、Ｘ＝Ａ，Ｂ，Ｃ，Ｄ，Ｅとして、Ｘに対する動きベクトル情報を、mv_xとする。

まず、動き補償ブロックＡ，Ｂ、およびＣに関する動きベクトル情報を用い、動き補償ブロックＥに対する予測動きベクトル情報pmv_Eを、メディアンオペレーションにより、以下の式（１０）のように生成する。

・・・（１０）

動き補償ブロックＣに関する情報が、画枠の端である等の理由により利用不可能（unavailable）である場合、動き補償ブロックＤに関する情報で代用される。

画像圧縮情報に、動き補償ブロックＥに対する動きベクトル情報として符号化されるデータmvd_Eは、pmv_Eを用いて、以下の式（１１）のように生成される。

・・・（１１）

なお、実際の処理は、動きベクトル情報の水平方向および垂直方向のそれぞれの成分に対して、独立に処理が行なわれる。

［マルチ参照フレーム］
また、AVCにおいては、Multi-Reference Frame（マルチ（複数）参照フレーム）という、MPEG2やH.263等、従来の画像符号化方式では規定されていなかった方式が規定されている。

図５を用いて、AVCにおいて規定されている、マルチ参照フレーム（Multi-Reference Frame）を説明する。

すなわち、MPEG2やH.263においては、Ｐピクチャの場合、フレームメモリに格納された参照フレーム１枚のみを参照することにより動き予測・補償処理が行われていたが、AVCにおいては、図５に示されるように、複数の参照フレームがメモリに格納され、マクロブロック毎に、異なるメモリを参照することが可能である。

［ダイレクトモード］
ところで、Ｂピクチャにおける動きベクトル情報における情報量は膨大であるが、AVCにおいては、Direct Mode（ダイレクトモード）と称されるモードが用意されている。

このダイレクトモード（Direct Mode）において、動きベクトル情報は、画像圧縮情報中には格納されない。画像復号装置においては、周辺ブロックの動きベクトル情報、若しくは、参照フレームにおける処理対象ブロックと同じ位置のブロックであるCo-Locatedブロックの動きベクトル情報から、当該ブロックの動きベクトル情報が算出される。

ダイレクトモード（Direct Mode）には、Spatial Direct Mode（空間ダイレクトモード）と、Temporal Direct Mode（時間ダイレクトモード）の２種類が存在し、スライス毎に切り替えることが可能である。

空間ダイレクトモード（Spatial Direct Mode）においては、以下の式（１２）に示されるように、処理対象動き補償ブロックＥの動きベクトル情報mv_Eが算出される。

mv_E ＝ pmv_E
・・・（１２）

すなわち、Median（メディアン）予測により生成された動きベクトル情報が、当該ブロックに適用される。

以下においては、図６を用いて、時間ダイレクトモード（Temporal Direct Mode）を説明する。

図６において、L0参照ピクチャにおける、当該ブロックと同じ空間上のアドレスにあるブロックを、Co-Locatedブロックとし、Co-Locatedブロックにおける動きベクトル情報を、mv_colとする。また、当該ピクチャとL0参照ピクチャの時間軸上の距離をTD_Bとし、L0参照ピクチャとL1参照ピクチャの時間軸上の距離をTD_Dとする。

この時、当該ピクチャにおける、L0の動きベクトル情報mv_L0及びL1の動きベクトル情報mv_L1は、以下の式（１３）および式（１４）のように算出される。

・・・（１３）

・・・（１４）

なお、AVC画像圧縮情報においては、時間軸上の距離を表す情報TDが存在しないため、POC（Picture Order Count）を用いて、上述した式（１２）および式（１３）の演算が行われるものとする。

また、AVC画像圧縮情報においては、ダイレクトモード（Direct Mode）は、16×16画素マクロブロック単位、若しくは、8×8画素ブロック単位で定義することが可能である。

［予測モードの選択］
ところで、AVC符号化方式において、より高い符号化効率を達成するには、適切な予測モードの選択が重要である。

かかる選択方式の例として、JM（Joint Model）と呼ばれるH.264/MPEG-4 AVCの参照ソフトウエア（http://iphome.hhi.de/suehring/tml/index.htm において公開されている）に実装されている方法を挙げることが出来る。

JMにおいては、以下に述べる、High Complexity Modeと、Low Complexity Modeの２通りのモード判定方法を選択することができる。どちらも、それぞれの予測モードに関するコスト関数値を算出し、これを最小にする予測モードを当該サブマクロブロック、または、当該マクロブロックに対する最適モードとして選択する。

High Complexity Modeにおけるコスト関数は、以下の式（１５）のように示される。

Cost(Mode∈Ω) ＝ D + λ＊R ・・・（１５）

ここで、Ωは、当該ブロック乃至マクロブロックを符号化するための候補モードの全体集合、Ｄは、当該予測モードで符号化した場合の、復号画像と入力画像の差分エネルギーである。λは、量子化パラメータの関数として与えられるLagrange未定乗数である。Ｒは、直交変換係数を含んだ、当該モードで符号化した場合の総符号量である。

つまり、High Complexity Modeでの符号化を行うには、上記パラメータＤ及びＲを算出するため、全ての候補モードにより、一度、仮エンコード処理を行う必要があり、より高い演算量を要する。

Low Complexity Modeにおけるコスト関数は、以下の式（１６）のように示される。

Cost(Mode∈Ω) ＝ D + QP2Quant(QP) ＊ HeaderBit ・・・（１６）

ここで、Ｄは、High Complexity Modeの場合と異なり、予測画像と入力画像の差分エネルギーとなる。QP2Quant(QP)は、量子化パラメータQPの関数として与えられ、HeaderBitは、直交変換係数を含まない、動きベクトルや、モードといった、Headerに属する情報に関する符号量である。

すなわち、Low Complexity Modeにおいては、それぞれの候補モードに関して、予測処理を行う必要があるが、復号画像までは必要ないため、符号化処理まで行う必要はない。
このため、High Complexity Modeより低い演算量での実現が可能である。

［動きベクトルのコンペティション］
ところで、図４を参照して説明したような、メディアン予測を用いた動きベクトルの符号化を改善するため、非特許文献１では、以下に述べるような方法が提案されている。

すなわち、AVCにおいて定義されている、メディアン予測により求められる”Spatial Predictor（空間予測）”に加え、以下に述べる”Temporal Predictor（時間予測）”及び”Spatio-Temporal Predictor（時間と空間予測）”のどれかを、予測動きベクトル情報として、適応的に用いることが可能にするものである。

すなわち、図７において、”mvcol”を、当該ブロックに対するCo-Locatedブロック（すなわち、参照画像において、xy座標が、当該ブロックと同じであるブロック）に対する動きベクトル情報、mv_tk（ｋ＝０乃至８）をその周辺ブロックの動きベクトル情報であるとして、それぞれの予測動きベクトル情報(Predictor)は、以下の式（１７）乃至（１９）により定義される。

Temporal Predictor：

・・・（１７）

・・・（１８）
Spatio-Temporal Predictor：

・・・（１９）

画像符号化装置１００においては、それぞれのブロックに関して、それぞれの予測動きベクトル情報を用いた場合のコスト関数が算出され、最適な予測動きベクトル情報の選択が行われる。画像圧縮情報においては、それぞれのブロックに対し、どの予測動きベクトル情報が用いられたかに関する情報を示すflagが伝送される。

なお、以下では、Spatial Predictorを空間予測動きベクトル情報と称し、Temporal Predictorを、時間予測動きベクトル情報と称する。

［コーディングユニット］
ところで、マクロブロックサイズを１６画素×１６画素とするのは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；４０００画素×２０００画素）といった大きな画枠に対しては、最適ではない。

そこで、AVCにおいては、図３に示されるように、マクロブロックとサブマクロブロックによる階層構造が規定されているが、例えば、HEVC（High Efficiency Video Coding）においては、図８に示されるように、コーディングユニット（CU（Coding Unit））が規定されている。

CUは、Coding Tree Block（CTB）とも呼ばれ、AVCにおけるマクロブロックと同様の役割を果たす、ピクチャ単位の画像の部分領域である。後者は、１６×１６画素の大きさに固定されているのに対し、前者の大きさは固定されておらず、それぞれのシーケンスにおいて、画像圧縮情報中において指定されることになる。

例えば、出力となる符号化データに含まれるシーケンスパラメータセット（SPS（Sequence Parameter Set））において、CUの最大サイズ（LCU（Largest Coding Unit））と最小サイズ（（SCU（Smallest Coding Unit））が規定される。

それぞれのLCU内においては、SCUのサイズを下回らない範囲で、split-flag＝1とすることにより、より小さなサイズのCUに分割することができる。図８の例では、LCUの大きさが１２８であり、最大階層深度が５となる。２Ｎ×２Ｎの大きさのCUは、split_flagの値が「１」である時、１つ下の階層となる、Ｎ×Ｎの大きさのCUに分割される。

更に、CUは、イントラ若しくはインター予測の処理単位となる領域（ピクチャ単位の画像の部分領域）であるプレディクションユニット（Prediction Unit（PU））に分割され、また、直交変換の処理単位となる領域（ピクチャ単位の画像の部分領域）である、トランスフォームユニット（Transform Unit（TU））に分割される。現在、HEVCにおいては、４×４及び８×８に加え、１６×１６及び３２×３２直交変換を用いることが可能である。

以上のHEVCのように、CUを定義し、そのCUを単位として各種処理を行うような符号化方式の場合、AVCにおけるマクロブロックはLCUに相当すると考えることができる。ただし、CUは図８に示されるように階層構造を有するので、その最上位階層のLCUのサイズは、例えば128×128画素のように、AVCのマクロブロックより大きく設定されることが一般的である。

［動きパーティションのマージ］
ところで、動き情報の符号化方式の１つとして、図９に示されるような、Motion Partition Mergingと呼ばれる手法（マージモード）が提案されている。この手法においては、MergeFlagと、MergeLeftFlagという、２つのflagが、マージモードに関する情報であるマージ情報として伝送される。MergeFlag＝1は、処理対象領域である当該領域Ｘの動き情報が、当該領域Ｘの上に隣接する周辺領域Ｔ、若しくは、当該領域Ｘの左に隣接する周辺領域Ｌの動き情報と同一であることを示す。この時、マージ情報には、MergeLeftFlagが含められ、伝送される。MergeFlag＝0は、当該領域Ｘの動き情報が、周辺領域Ｔおよび周辺領域Ｌのいずれの動き情報とも異なることを示す。この場合、当該領域Ｘの動き情報が伝送される。

[Co-Located領域の面積]
時間予測動きベクトル情報を用いた動きベクトルの符号化処理が実行されるとき、Co-Located領域の面積によっては、動きベクトルの符号化効率が低下するおそれがある。なお、Co-Located領域とは、参照画像内の領域のうち、xy座標が、当該領域と同じである領域のことをいう。符号化効率が低下する具体例について、図１０を参照して説明する。

図１０は、Co-Located領域の面積について説明する図である。図１０の左の図は、参照領域を示し、右の図は、当該領域を示している。なお、参照領域とは、参照画像において、当該領域に対応する領域である。

図１０に示されるように、参照領域が複数の領域（CUまたはPU）に分割されているとする。なお、以下では、参照領域において分割された複数の領域を、それぞれ分割領域と称する。時間予測動きベクトル情報を用いた動きベクトルの符号化処理が行われる場合、参照領域において、当該領域の左上の画素Ｐと同一のアドレスの画素Ｐ’を含む分割領域が、Co-Located領域とされると、このCo-Located領域の動きベクトル情報が、時間予測動きベクトル情報として用いられる。しかしながら、図１０に示されるように、当該領域とCo-Located領域の共有する面積が小さい場合、当該領域の動きベクトル情報と、Co-Located領域の動きベクトル情報の相関性が低くなる傾向にあり、動きベクトルの符号化効率が低下するおそれがある。

そこで、時間予測動きベクトル情報決定部１２１は、分割領域のうち、当該領域と重なる面積が最も大きな領域（以下、最大領域と称する）を、Co-Located領域、すなわち、動きベクトル情報が時間予測動きベクトル情報として取り出される領域（以下、時間予測動きベクトル情報取り出し領域と称する）として決定する。これにより、時間予測動きベクトル情報取り出し領域（Co-Located領域）の動きベクトル情報が、時間予測動きベクトル情報として用いられる。この場合、当該領域と時間予測動きベクトル情報取り出し領域の共有する面積は大きくなることから、当該領域の動きベクトル情報と、時間予測動きベクトル情報取り出し領域の動きベクトル情報の相関性が高くなる場合が多い。これにより、動きベクトルの符号化効率が向上する。

次に、時間予測動きベクトル情報決定部１２１による時間予測動きベクトル情報取り出し領域の決定について、図１１を用いて説明する。

[時間予測動きベクトル情報取り出し領域の決定]
図１１は、時間予測動きベクトル情報取り出し領域の決定について説明する図である。図１１Ａと図１１Ｂにおいて、それぞれ左の図は参照領域を示し、右の図は当該領域を示している。

図１１Ａに示されるように参照領域が複数の領域に分割されている場合、時間予測動きベクトル情報決定部１２１は、分割領域のうち、最大領域Ｘを時間予測動きベクトル情報取り出し領域として決定する。すなわち、最大領域Ｘ（Co-Located領域）の動きベクトル情報が、時間予測動きベクトル情報として用いられる。最大領域Ｘは、当該領域と共有する面積が大きく、当該領域と相関性が高い動きベクトル情報を有している可能性が高い。したがって、最大領域Ｘの動きベクトル情報が、時間予測動きベクトル情報として用いられることにより、動きベクトルの符号化効率が向上する。なお、最大領域Ｘが、動きベクトル情報を有しないイントラ予測符号化された領域である場合には、図１０の例と同様に、参照領域において、当該領域の左上の画素Ｐと同一のアドレスの画素Ｐ’を含む分割領域が、時間予測動きベクトル情報取り出し領域として決定される。すなわち、当該領域の左上の画素Ｐと同一のアドレスの画素Ｐ’を含む分割領域（Co-Located領域）の動きベクトル情報が、時間予測動きベクトル情報として用いられる。なお、以下では、参照領域において、当該領域の左上の画素Ｐと同一のアドレスの画素Ｐ’を含む分割領域を左上領域と称する。

また、図１１Ｂに示されるように参照領域が複数の領域に分割されている場合、分割領域の中に２つの最大領域Ｙ，Ｚが存在する。このように、分割領域の中に最大領域が複数存在する場合、時間予測動きベクトル情報決定部１２１は、所定のルールに従って、時間予測動きベクトル情報取り出し領域を決定する。例えば、所定のルールとして、参照領域をラスタースキャン順（すなわち、１ラインの中では左から右に向かう方向であって、ライン間では上から下に向かう方向）に辿ったときに、最先に現れる最大領域を、時間予測動きベクトル情報取り出し領域とする、というルールを採用することができる。これにより、時間予測動きベクトル情報決定部１２１は、時間予測動きベクトル情報取り出し領域を決定する処理時間を短くすることができる。この場合、図１１Ｂの例では、時間予測動きベクトル情報決定部１２１は、最大領域Ｙを時間予測動きベクトル情報取り出し領域として決定する。すなわち、最大領域Ｙ（Co-Located領域）の動きベクトル情報が、時間予測動きベクトル情報として用いられる。

しかしながら、図１１Ｂの例において、最大領域Ｙが動きベクトル情報を有しないイントラ予測符号化された領域であって、最大領域Ｚが動きベクトル情報を有するインター予測符号化された領域である場合には、最大領域Ｚが、時間予測動きベクトル情報取り出し領域として決定される。すなわち、所定のルールとして、参照領域をラスタースキャン順に辿ったときに、最先に現れる、インター予測符号化された最大領域を、時間予測動きベクトル情報取り出し領域とする、というルールを採用することができる。この場合、最大領域Ｚ（Co-Located領域）の動きベクトル情報が、時間予測動きベクトル情報として用いられる。なお、分割領域の中に、最大領域が複数存在する場合であって、全ての領域が、動きベクトル情報を有しないイントラ予測符号化された領域である場合には、時間予測動きベクトル情報決定部１２１は、左上領域を、時間予測動きベクトル情報取り出し領域として決定する。すなわち、左上領域（Co-Located領域）の動きベクトル情報が、時間予測動きベクトル情報として用いられる。

なお、時間予測動きベクトル情報決定部１２１による時間予測動きベクトル情報取り出し領域の決定の処理（以下、時間予測動きベクトル情報取り出し領域決定処理と称する）は、L0予測とL1予測のそれぞれに対して独立に行われる。

このような時間予測動きベクトル情報決定部１２１による時間予測動きベクトル情報取り出し領域決定処理は、当該領域のサイズが大きくなるほど、効果は顕著なものとなる。換言すると、当該領域のサイズが小さくなるほど、当該領域と左上領域のサイズは近似し、それぞれの動きベクトル情報は相関性の高いものとなるため、その効果は薄くなっていく。すなわち、当該領域のサイズが小さい場合に、時間予測動きベクトル情報取り出し領域決定処理が実行されると、処理に時間かかる割には、大きな効果を得ることができない。

したがって、本実施形態においては、時間予測動きベクトル情報決定部１２１は、当該領域のサイズが所定の閾値以上である場合にのみ時間予測動きベクトル情報取り出し領域決定処理を実行する。一方、当該領域のサイズが所定の閾値未満である場合には、時間予測動きベクトル情報決定部１２１は、左上領域を、時間予測動きベクトル情報取り出し領域として決定する。

なお、当該領域のサイズの所定の閾値は、入力となる画像圧縮情報中のシーケンスパラメータセット、ピクチャパラメータセット、またはスライスヘッダにおいて指定される。

［動き予測・補償部、時間予測動きベクトル情報決定部、および動きベクトル符号化部］
図１２は、図１に示される画像符号化装置のうち、動き予測・補償部１１５、時間予測動きベクトル情報決定部１２１、および動きベクトル符号化部１２２の詳細な構成例を示すブロック図である。

図１２に示されるように、動き予測・補償部１１５は、動き探索部１３１、コスト関数算出部１３２、モード判定部１３３、動き補償部１３４、および動き情報バッファ１３５を有する。

また、動きベクトル符号化部１２２は、空間予測動きベクトル情報決定部１４１、予測動きベクトル情報生成部１４２、および差分動きベクトル生成部１４３を有する。

動き探索部１３１には、画面並べ替えバッファ１０２からの入力画像画素値と、フレームメモリ１１２からの参照画像画素値が入力される。動き探索部１３１は、全てのインター予測モードについて動き探索処理を行い、動きベクトルと参照インデックスを含む動き情報を生成する。動き探索部１３１は、生成した動き情報を、動きベクトル符号化部１２２の予測動きベクトル情報生成部１４２に供給する。

動き情報バッファ１３５には、過去に処理された領域の最適予測モードの動き情報が格納されている。格納されている動き情報は、その領域より時間的に後に処理される領域に対する処理において、周辺動き情報として、各部に供給される。詳細には、動き情報バッファ１３５は、時間周辺動き情報を時間予測動きベクトル情報決定部１２１に供給し、空間周辺動き情報を空間予測動きベクトル情報決定部１４１に供給する。

時間予測動きベクトル情報決定部１２１は、動き情報バッファ１３５から参照領域に含まれる各分割領域の時間周辺動き情報を取得すると、時間予測動きベクトル情報取り出し領域決定処理を実行する。すなわち、図１１を参照して説明したように、時間予測動きベクトル情報決定部１２１は、参照領域に含まれる分割領域のうち、最大領域を、時間予測動きベクトル情報取り出し領域として決定する。これにより、時間予測動きベクトル情報取り出し領域（Co-Located領域）の動きベクトル情報（すなわち時間周辺動き情報）が、時間予測動きベクトル情報として用いられる。時間予測動きベクトル情報決定部１２１は、決定した時間予測動きベクトル情報取り出し領域の動きベクトル情報を、時間予測動きベクトル情報として予測動きベクトル情報生成部１４２に供給する。

空間予測動きベクトル情報決定部１４１は、動き情報バッファ１３５から空間周辺動き情報を取得すると、どの空間周辺動き情報を空間予測動きベクトル情報として用いるのが最適かを、コスト関数値を用いて判定する。そして、空間予測動きベクトル情報決定部１４１は、コスト関数値が最も小さい空間周辺動き情報から空間予測動きベクトル情報を生成して、予測動きベクトル情報生成部１４２に供給する。

予測動きベクトル情報生成部１４２は、時間予測動きベクトル情報決定部１２１から時間予測動きベクトル情報を取得し、空間予測動きベクトル情報決定部１４１から空間予測動きベクトル情報を取得する。そして、予測動きベクトル情報生成部１４２は、各インター予測モードについて、供給された時間予測動きベクトル情報および空間予測動きベクトル情報の中から、予測動きベクトル情報として最適なものを決定する。

予測動きベクトル情報生成部１４２は、動き探索部１３１から取得した動き情報および決定した予測動きベクトル情報を、差分動きベクトル生成部１４３に供給する。

差分動きベクトル生成部１４３は、各インター予測モードについて、動き情報と予測動きベクトル情報生成部１４２から供給された予測動きベクトル情報との差分値を含む差分動き情報を生成する。差分動きベクトル生成部１４３は、生成した各インター予測モードの差分動き情報および各インター予測モードの予測動きベクトル情報を、動き予測・補償部１１５のコスト関数算出部１３２に供給する。

また、動き探索部１３１は、探索した動きベクトル情報を用いて、参照画像に補償処理を行い、予測画像を生成する。さらに、動き探索部１３１は、生成した予測画像と入力画像の差分（差分画素値）を算出し、算出した差分画素値をコスト関数算出部１３２に供給する。

コスト関数算出部１３２は、動き探索部１３１から供給された各インター予測モードの差分画素値を用いて、各インター予測モードのコスト関数値を算出する。コスト関数算出部１３２は、算出した各インター予測モードのコスト関数値をモード判定部１３３に供給する。また、コスト関数算出部１３２は、各インター予測モードの差分動き情報、および各インター予測モードの予測動きベクトル情報もモード判定部１３３に供給する。

モード判定部１３３は、各インター予測モードのうち、どのモードを用いるのが最適かを、各インター予測モードに対するコスト関数値を用いて判定し、コスト関数値が最も小さいインター予測モードを、最適予測モードとする。そして、モード判定部１３３は、その最適予測モードに関する情報である最適予測モード情報を動き補償部１３４に供給する。また、モード判定部１３３は、最適予測モードに選択されたインター予測モードの、差分動き情報および予測動きベクトル情報も動き補償部１３４に供給する。

動き補償部１３４は、モード判定部１３３から供給された、差分動き情報や予測動きベクトル情報等を用いて、最適予測モードの動きベクトルを生成する。動き補償部１３４は、その動きベクトルを用いてフレームメモリ１１２からの参照画像に補償を行うことで、最適予測モードの予測画像を生成する。動き補償部１３４は、生成した予測画像を予測画像選択部１１６に供給する。

予測画像選択部１１６によりインター予測が選択された場合、それを示す信号が予測画像選択部１１６から供給される。これに対応して、動き補償部１３４は、最適予測モード情報を可逆符号化部１０６に供給する。また、動き補償部１３４は、最適予測モードの差分動き情報と予測動きベクトル情報も、可逆符号化部１０６に供給する。なお、可逆符号化部１０６に供給される最適予測モードの予測動きベクトル情報には、予測動きベクトル情報として、時間予測動きベクトル情報と空間予測動きベクトル情報のどちらが用いられているかを示す識別情報も含まれる。

また、動き補償部１３４は、最適予測モードの動き情報を、動き情報バッファ１３５に格納する。なお、予測画像選択部１１６によりインター予測が選択されなかった場合（すなわち、イントラ予測画像が選択された場合）、動きベクトル情報として、０ベクトルが、動き情報バッファ１３５に格納される。

動き情報バッファ１３５には、過去に処理された領域の最適予測モードの動き情報が格納されている。上述したように、動き情報バッファ１３５は、時間周辺動き情報を時間予測動きベクトル情報決定部１２１に供給し、空間周辺動き情報を空間予測動きベクトル情報決定部１４１に供給する。

［符号化処理の流れ］
次に、以上のような画像符号化装置１００により実行される符号化処理の流れについて説明する。

図１３は、符号化処理の流れを説明するフローチャートである。

ステップＳ１０１において、A/D変換部１０１は入力された画像をA/D変換する。ステップＳ１０２において、画面並べ替えバッファ１０２は、A/D変換された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

ステップＳ１０３において、イントラ予測部１１４は、イントラ予測モードのイントラ予測処理を行う。

ステップＳ１０４において、動き予測・補償部１１５は、インター予測モードでの動き予測や動き補償を行うインター動き予測処理を実行する。なお、ステップＳ１０４の処理の詳細については、図１４を参照して後述する。

ステップＳ１０５において、予測画像選択部１１６は、イントラ予測部１１４および動き予測・補償部１１５から出力された各コスト関数値に基づいて、最適なモードを決定する。つまり、予測画像選択部１１６は、イントラ予測部１１４により生成された予測画像と、動き予測・補償部１１５により生成された予測画像のいずれか一方を選択する。

ステップＳ１０６において、演算部１０３は、ステップＳ１０２の処理により並び替えられた画像と、ステップＳ１０５の処理により選択された予測画像との差分を演算する。差分データは元の画像データに較べてデータ量が低減される。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ１０７において、直交変換部１０４は、ステップＳ１０６の処理により生成された差分情報を直交変換する。具体的には、離散コサイン変換、カルーネン・レーベ変換等の直交変換が行われ、変換係数が出力される。

ステップＳ１０８において、量子化部１０５は、ステップＳ１０７の処理により得られた直交変換係数を量子化する。

ステップＳ１０８の処理により量子化された差分情報は、次のようにして局部的に復号される。すなわち、ステップＳ１０９において、逆量子化部１０８は、ステップＳ１０８の処理により生成された量子化された直交変換係数（以下、量子化係数とも称する）を量子化部１０５の特性に対応する特性で逆量子化する。

ステップＳ１１０において、逆直交変換部１０９は、ステップＳ１０７の処理により得られた直交変換係数を、直交変換部１０４の特性に対応する特性で逆直交変換する。

ステップＳ１１１において、演算部１１０は、予測画像を局部的に復号された差分情報に加算し、局部的に復号された画像（すなわち、演算部１０３への入力に対応する画像）を生成する。

ステップＳ１１２においてループフィルタ１１１は、ステップＳ１１１の処理により得られた局部的な復号画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜行う。

ステップＳ１１３において、フレームメモリ１１２は、ステップＳ１１２の処理によりループフィルタ処理が施された復号画像を記憶する。なお、フレームメモリ１１２にはループフィルタ１１１によりフィルタ処理されていない画像も演算部１１０から供給され、記憶される。

ステップＳ１１４において、可逆符号化部１０６は、ステップＳ１０８の処理により量子化された変換係数を符号化する。すなわち、差分画像に対して、可変長符号化や算術符号化等の可逆符号化が行われる。

なお、可逆符号化部１０６は、ステップＳ１０８において算出された量子化パラメータを符号化し、符号化データに付加する。また、可逆符号化部１０６は、ステップＳ１０５の処理により選択された予測画像の予測モードに関する情報を符号化し、差分画像を符号化して得られる符号化データに付加する。つまり、可逆符号化部１０６は、イントラ予測部１１４から供給される最適イントラ予測モード情報、または、動き予測・補償部１１５から供給される最適インター予測モードに応じた情報なども符号化し、符号化データに付加する。

ステップＳ１１５において蓄積バッファ１０７は、ステップＳ１１４の処理により得られた符号化データを蓄積する。蓄積バッファ１０７に蓄積された符号化データは、適宜読み出され、伝送路や記録媒体を介して復号側に伝送される。

ステップＳ１１６においてレート制御部１１７は、ステップＳ１１５の処理により蓄積バッファ１０７に蓄積された符号化データの符号量（発生符号量）に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

これにより、符号化処理が終了する。

［インター動き予測処理の流れ］
次に、図１３のステップＳ１０４において実行されるインター動き予測処理について説明する。

図１４は、インター動き予測処理の流れを説明するフローチャートである。

ステップＳ１３１において、動き探索部１３１は、各インター予測モードに対して動き探索を行い、動き情報と差分画素値を生成する。

ステップＳ１３２において、時間予測動きベクトル情報決定部１２１は、時間予測動きベクトル情報取り出し領域決定処理を実行する。これにより、参照領域に含まれる分割領域のうち、最大領域が、時間予測動きベクトル情報取り出し領域として決定される。なお、ステップＳ１３２の処理については、図１５を参照して後述する。

ステップＳ１３３において、時間予測動きベクトル情報決定部１２１は、時間予測動きベクトル情報を生成する。すなわち、時間予測動きベクトル情報決定部１２１は、ステップＳ１３２において決定された、時間予測動きベクトル情報の取り出し領域の動きベクトル情報を、時間予測動きベクトル情報とする。

ステップＳ１３４において、空間予測動きベクトル情報決定部１４１は、動き情報バッファ１３５から供給された空間周辺動き情報のうち、コスト関数値が最も小さい空間周辺動き情報から空間予測動きベクトル情報を生成する。

ステップＳ１３５において、予測動きベクトル情報生成部１４２は、ステップＳ１３３とステップＳ１３４において生成された時間予測動きベクトル情報および空間予測動きベクトル情報の中から、予測動きベクトル情報として最適なものを決定する。

ステップＳ１３６において、差分動きベクトル生成部１４３は、動き情報とステップＳ１３５において決定された最適な予測動きベクトル情報との差分値を含む差分動き情報を生成する。

ステップＳ１３７において、コスト関数算出部１３２は、各インター予測モードのコスト関数値を算出する。

ステップＳ１３８において、モード判定部１３３は、ステップＳ１３７において算出されたコスト関数値を用いて、最適なインター予測モードである最適インター予測モード（以下、最適予測モードとも称する）を決定する。

ステップＳ１３９において、動き補償部１３４は、最適インター予測モードで動き補償を行う。

ステップＳ１４０において、動き補償部１３４は、ステップＳ１３９の動き補償により得られた予測画像を、予測画像選択部１１６を介して演算部１０３および演算部１１０に供給し、差分画像情報および復号画像を生成させる。

ステップＳ１４１において、動き補償部１３４は、最適予測モード情報、差分動き情報、および予測動きベクトル情報を可逆符号化部１０６に供給し、符号化させる。

ステップＳ１４２において、動き情報バッファ１３５は、最適インター予測モードに選択された動き情報を記憶する。

これにより、インター動き予測処理は終了し、処理は図１３に戻る。

[時間予測動きベクトル情報取り出し領域決定処理の流れ]
次に、図１４のステップＳ１３２において実行される時間予測動きベクトル情報取り出し領域決定処理について説明する。

図１５は、時間予測動きベクトル情報取り出し領域決定処理の流れを説明するフローチャートである。

ステップＳ１６１において、時間予測動きベクトル情報決定部１２１は、当該領域のサイズが閾値以上であるかを判定する。

当該領域のサイズが閾値以上である場合、ステップＳ１６１においてＹＥＳであると判定されて、処理はステップＳ１６２に進む。なお、ステップＳ１６２以降の処理については後述する。

これに対して、当該領域のサイズが閾値未満である場合、ステップＳ１６１においてＮＯであると判定されて、処理はステップＳ１７０に進む。

ステップＳ１７０において、時間予測動きベクトル情報決定部１２１は、左上領域を、時間予測動きベクトル情報取り出し領域として決定する。すなわち、左上領域（Co-Located領域）の動きベクトル情報が、時間予測動きベクトル情報として用いられる。これにより、時間予測動きベクトル情報取り出し領域決定処理は終了し、処理は図１４に戻る。

一方、ステップＳ１６１において、当該領域のサイズが閾値以上である場合、ＹＥＳであると判定されて、処理はステップＳ１６２に進む。

ステップＳ１６２において、時間予測動きベクトル情報決定部１２１は、参照領域において当該領域と重なる全ての領域を抽出する。すなわち、時間予測動きベクトル情報決定部１２１は、参照領域における全ての分割領域を抽出する。

ステップＳ１６３において、時間予測動きベクトル情報決定部１２１は、最大領域は１つかを判定する。すなわち、時間予測動きベクトル情報決定部１２１は、参照領域に含まれる分割領域の中で、当該領域と重なる面積が最も大きな領域は１つかを判定する。

最大領域が１つではない場合、ステップＳ１６３においてＮＯであると判定されて、処理はステップＳ１６６に進む。なお、ステップＳ１６３以降の処理については後述する。

これに対して、最大領域が１つである場合、ステップＳ１６３においてＹＥＳであると判定されて、処理はステップＳ１６４に進む。

ステップＳ１６４において、時間予測動きベクトル情報決定部１２１は、最大領域はインター予測符号化された領域であるかを判定する。

最大領域がインター予測符号化された領域である場合、ステップＳ１６４においてＹＥＳであると判定されて、処理はステップ１６５に進む。

ステップＳ１６５において、時間予測動きベクトル情報決定部１２１は、最大領域を時間予測動きベクトル情報取り出し領域として決定する。すなわち、最大領域（Co-Located領域）の動きベクトル情報が、時間予測動きベクトル情報として用いられる。これにより、時間予測動きベクトル情報取り出し領域決定処理は終了し、処理は図１４に戻る。

一方、ステップＳ１６４において、最大領域はインター予測符号化された領域ではないと判定された場合、すなわちイントラ予測符号化された領域である場合、ＮＯであると判定されて、処理はステップＳ１７０に進む。

ステップＳ１７０において、時間予測動きベクトル情報決定部１２１は、左上領域を、時間予測動きベクトル情報取り出し領域として決定する。これにより、時間予測動きベクトル情報取り出し領域決定処理は終了し、処理は図１４に戻る。

一方、ステップＳ１６３において、最大領域は１つではない場合、ＮＯであると判定されて、処理はステップＳ１６６に進む。

ステップＳ１６６において、時間予測動きベクトル情報決定部１２１は、分割領域をラスタースキャン順に辿ったときに、最先に現れる最大領域を選択する。

ステップＳ１６７において、時間予測動きベクトル情報決定部１２１は、選択された最大領域はインター予測符号化された領域であるかを判定する。

最大領域はインター予測符号化された領域ではないと判定された場合、すなわち最大領域がイントラ予測符号化された領域である場合、ＮＯであると判定されて、処理はステップＳ１６８に進む。

ステップＳ１６８において、時間予測動きベクトル情報決定部１２１は、選択された最大領域が、複数の最大領域のうち最後の最大領域であるかを判定する。すなわち、時間予測動きベクトル情報決定部１２１は、選択された最大領域が、分割領域をラスタースキャン順に辿ったときに、最後に現れる最大領域であるかを判定する。

選択された最大領域が、最後の最大領域ではない場合、ステップＳ１６８においてＮＯであると判定されて、処理はステップＳ１６６に戻され、それ以降の処理が繰り返される。すなわち、インター予測符号化された領域が最大領域として選択されるか、イントラ予測符号化された領域であって、最後の最大領域が選択されるまでの間、ステップＳ１６６乃至Ｓ１６８のループ処理が繰り返される。

その後、ステップＳ１６６において、ラスタースキャン順に次の最大領域が選択され、ステップＳ１６７において、選択された最大領域がインター符号化された領域である場合、ＹＥＳであると判定されて、処理はステップＳ１６９に進む。

ステップＳ１６９において、時間予測動きベクトル情報決定部１２１は、選択された最大領域を時間予測動きベクトル情報取り出し領域として決定する。これにより、選択された最大領域（Co-Located領域）の動きベクトル情報が、時間予測動きベクトル情報として用いられる。これにより、時間予測動きベクトル情報取り出し領域決定処理は終了し、処理は図１４に戻る。

一方、ステップＳ１６６において、ラスタースキャン順に次の最大領域が選択され、ステップＳ１６７において、選択された最大領域がインター予測符号化された領域ではない場合、ＮＯであると判定されて、処理はステップＳ１６８に進む。

ステップＳ１６８において、選択された最大領域が、最後の最大領域である場合、ＹＥＳであると判定されて、処理はステップＳ１７０に進む。

その後、図１４のステップＳ１３３において、時間予測動きベクトル情報の取り出し領域の時間予測動きベクトル情報が生成され、ステップＳ１３４において空間予測動きベクトル情報が生成される。そして、ステップＳ１３５において、生成された時間予測動きベクトル情報および空間予測動きベクトル情報の中から、予測動きベクトル情報として最適なものが決定される。

以上のように、時間予測動きベクトル情報決定部１２１は、当該領域の動きベクトル情報と相関性が高い時間予測動きベクトル情報を、動きベクトル符号化部１２２に供給することができる。したがって、動きベクトル符号化部１２２は、当該領域の動きベクトル情報と相関性が高い時間予測動きベクトル情報を、予測動きベクトル情報として用いることができるので、予測動きベクトルの情報量を削減することができる。これにより、画像符号化装置１００は、動きベクトルの符号化効率を向上させることができる。

なお、上述の例では、当該領域のサイズが所定の閾値以上であることを条件に、時間予測動きベクトル情報取り出し領域決定処理が実行された。しかしながら、時間予測動きベクトル情報取り出し領域決定処理が実行される条件は、これに限定されない。例えば、出力となる画像圧縮情報中におけるプロファイルレベル（例えば、画枠）が、ある規定よりも大きいという条件を採用してもよい。なぜならば、画枠のサイズが大きくなるほど、大きなCUまたはPUを用いた符号化処理が行われやすく、一方、画枠のサイズが小さくなるほど、小さなCUまたはPUを用いた符号化処理が行われやすい。その結果、画枠のサイズが大きい場合に時間予測動きベクトル情報取り出し領域決定処理が実行される方が、より大きな改善が実現できるからである。特に、時間予測動きベクトル情報取り出し領域決定処理を、1920×1080画素のHD（High Definition）画像およびそれ以上の解像度をもつシーケンスに対して適用すると有効である。なお、時間予測動きベクトル情報取り出し領域決定処理は、当該領域のサイズおよびプロファイルレベルの大きさに限らず、実行されてもよい。すなわち、上述した時間予測動きベクトル情報取り出し領域決定処理が実行される２つの条件は必須条件としなくてもよい。

また、マージモードにおいて、当該領域の動きベクトルと比較される周辺領域の動きベクトルとして、当該領域の上または左に隣接する周辺領域の動きベクトルの他に、本実施形態のCo-Located領域（すなわち、時間予測動きベクトル情報取り出し領域）の動きベクトルを追加することができる。

＜２．第２の実施の形態＞
［画像復号装置］
次に、以上のように符号化された符号化データの復号について説明する。

図１６は、図１の画像符号化装置１００に対応する画像復号装置の主な構成例を示すブロック図である。

図１６に示される画像復号装置２００は、画像符号化装置１００が生成した符号化データを、その符号化方法に対応する復号方法で復号する。なお、画像復号装置２００は、画像符号化装置１００と同様に、プレディクションユニット（PU）毎にインター予測を行うものとする。

図１６に示されるように画像復号装置２００は、蓄積バッファ２０１、可逆復号部２０２、逆量子化部２０３、逆直交変換部２０４、演算部２０５、ループフィルタ２０６、画面並べ替えバッファ２０７、およびD/A変換部２０８を有する。また、画像復号装置２００は、フレームメモリ２０９、選択部２１０、イントラ予測部２１１、動き予測・補償部２１２、および選択部２１３を有する。

さらに、画像復号装置２００は、時間予測動きベクトル情報決定部２２１および動きベクトル復号部２２２を有する。

蓄積バッファ２０１は伝送されてきた符号化データを蓄積し、所定のタイミングにおいてその符号化データを可逆復号部２０２に供給する。可逆復号部２０２は、蓄積バッファ２０１より供給された、図１の可逆符号化部１０６により符号化された情報を、可逆符号化部１０６の符号化方式に対応する方式で復号する。可逆復号部２０２は、復号して得られた差分画像の量子化された係数データを、逆量子化部２０３に供給する。

また、可逆復号部２０２は、最適な予測モードにイントラ予測モードが選択されたかインター予測モードが選択されたかを判定し、その最適な予測モードに関する情報を、イントラ予測部２１１および動き予測・補償部２１２のうち、選択されたと判定したモードの方に供給する。つまり、例えば、画像符号化装置１００において最適な予測モードとしてインター予測モードが選択された場合、その最適な予測モードに関する情報が動き予測・補償部２１２に供給される。

逆量子化部２０３は、可逆復号部２０２により復号されて得られた量子化された係数データを、図１の量子化部１０５の量子化方式に対応する方式で逆量子化し、得られた係数データを逆直交変換部２０４に供給する。

逆直交変換部２０４は、図１の直交変換部１０４の直交変換方式に対応する方式で逆量子化部２０３から供給される係数データを逆直交変換する。逆直交変換部２０４は、この逆直交変換処理により、画像符号化装置１００において直交変換される前の残差データに対応する復号残差データを得る。

逆直交変換されて得られた復号残差データは、演算部２０５に供給される。また、演算部２０５には、選択部２１３を介して、イントラ予測部２１１若しくは動き予測・補償部２１２から予測画像が供給される。

演算部２０５は、その復号残差データと予測画像とを加算し、画像符号化装置１００の演算部１０３により予測画像が減算される前の画像データに対応する復号画像データを得る。演算部２０５は、その復号画像データをループフィルタ２０６に供給する。

ループフィルタ２０６は、供給された復号画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜施し、それを画面並べ替えバッファ２０７に供給する。

ループフィルタ２０６は、デブロックフィルタや適応ループフィルタ等を含み、演算部２０５から供給される復号画像に対して適宜フィルタ処理を行う。例えば、ループフィルタ２０６は、復号画像に対してデブロックフィルタ処理を行うことにより復号画像のブロック歪を除去する。また、例えば、ループフィルタ２０６は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた復号画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。

なお、ループフィルタ２０６が、復号画像に対して任意のフィルタ処理を行うようにしてもよい。また、ループフィルタ２０６が、図１の画像符号化装置１００から供給されたフィルタ係数を用いてフィルタ処理を行うようにしてもよい。

ループフィルタ２０６は、フィルタ処理結果（フィルタ処理後の復号画像）を画面並べ替えバッファ２０７およびフレームメモリ２０９に供給する。なお、演算部２０５から出力される復号画像は、ループフィルタ２０６を介さずに画面並べ替えバッファ２０７やフレームメモリ２０９に供給することができる。つまり、ループフィルタ２０６によるフィルタ処理は省略することができる。

画面並べ替えバッファ２０７は、画像の並べ替えを行う。すなわち、図１の画面並べ替えバッファ１０２により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。D/A変換部２０８は、画面並べ替えバッファ２０７から供給された画像をD/A変換し、図示せぬディスプレイに出力し、表示させる。

フレームメモリ２０９は、供給される復号画像を記憶し、所定のタイミングにおいて、若しくは、イントラ予測部２１１や動き予測・補償部２１２等の外部の要求に基づいて、記憶している復号画像を参照画像として、選択部２１０に供給する。

選択部２１０は、フレームメモリ２０９から供給される参照画像の供給先を選択する。選択部２１０は、イントラ符号化された画像を復号する場合、フレームメモリ２０９から供給される参照画像をイントラ予測部２１１に供給する。また、選択部２１０は、インター符号化された画像を復号する場合、フレームメモリ２０９から供給される参照画像を動き予測・補償部２１２に供給する。

イントラ予測部２１１には、ヘッダ情報を復号して得られたイントラ予測モードを示す情報等が可逆復号部２０２から適宜供給される。イントラ予測部２１１は、図１のイントラ予測部１１４において用いられたイントラ予測モードで、フレームメモリ２０９から取得した参照画像を用いてイントラ予測を行い、予測画像を生成する。イントラ予測部２１１は、生成した予測画像を選択部２１３に供給する。

動き予測・補償部２１２は、ヘッダ情報を復号して得られた情報（最適予測モード情報、差分情報等）を可逆復号部２０２から取得する。

動き予測・補償部２１２は、図１の動き予測・補償部１１５において用いられたインター予測モードで、フレームメモリ２０９から取得した参照画像を用いてインター予測を行い、予測画像を生成する。

また、動き予測・補償部２１２は、最適な予測モードの動きベクトル情報として時間予測動きベクトル情報が用いられている場合には、時間予測動きベクトル情報を時間予測動きベクトル情報決定部２２１に供給する。一方、動き予測・補償部２１２は、最適な予測モードの動きベクトル情報として空間予測動きベクトル情報が用いられている場合には、空間予測動きベクトル情報を動きベクトル復号部２２２に供給する。

時間予測動きベクトル情報決定部２２１は、動き予測・補償部２１２から時間予測動きベクトル情報が供給されると、基本的に時間予測動きベクトル情報決定部１２１と同様の処理を行う。そして、時間予測動きベクトル情報決定部２２１は、時間予測動きベクトル情報を再構築する。時間予測動きベクトル情報決定部２２１は、再構築した時間予測動きベクトル情報を動きベクトル復号部２２２に供給する。

動きベクトル復号部２２２は、動き予測・補償部２１２から空間予測動きベクトル情報が供給されると、空間予測動きベクトル情報を再構築する。そして、動きベクトル復号部２２２は、時間予測動きベクトル情報決定部２２１により再構築された時間予測動きベクトル情報、または再構築した時間予測動きベクトル情報を予測動きベクトル情報として動き予測・補償部２１２に供給する。

［動き予測・補償部、時間予測動きベクトル情報決定部、動きベクトル復号部］
図１７は、動き予測・補償部２１２、時間予測動きベクトル情報決定部２２１、および動きベクトル復号部２２２の詳細な構成例を示すブロック図である。

図１７に示されるように、動き予測・補償部２１２は、差分動き情報バッファ２３１、予測動きベクトル情報バッファ２３２、動き情報バッファ２３３、動き情報再構築部２３４、および動き補償部２３５を有する。

また、動きベクトル復号部２２２は、空間予測動きベクトル情報再構築部２４１および予測動きベクトル情報再構築部２４２を有する。

差分動き情報バッファ２３１は、可逆復号部２０２から供給される差分動き情報を記憶する。この差分動き情報は、画像符号化装置１００から供給された、最適な予測モードとして選択されたインター予測モードの差分動き情報（すなわち、予測動きベクトル情報と動き情報の差分）である。差分動き情報バッファ２３１は、所定のタイミングにおいて、若しくは、動き情報再構築部２３４からの要求に基づいて、記憶している差分動き情報を動き情報再構築部２３４に供給する。

予測動きベクトル情報バッファ２３２は、可逆復号部２０２から供給される予測動きベクトル情報を記憶する。この予測動きベクトル情報は、画像符号化装置１００から供給されたものであり、最適な予測モードとして選択されたインター予測モードの予測動きベクトル情報である。予測動きベクトル情報バッファ２３２は、所定のタイミングにおいて、若しくは、空間予測動きベクトル情報再構築部２４１または時間予測動きベクトル情報決定部２２１からの要求に基づいて、記憶している予測動きベクトル情報を、空間予測動きベクトル情報再構築部２４１または時間予測動きベクトル情報決定部２２１に供給する。詳細には、最適な予測モードの予測動きベクトル情報として時間予測動きベクトル情報が用いられている場合には、予測動きベクトル情報バッファ２３２は、時間予測動きベクトル情報を時間予測動きベクトル情報決定部２２１に供給する。一方、最適な予測モードの予測動きベクトル情報として空間予測動きベクトル情報が用いられている場合には、予測動きベクトル情報バッファ２３２は、空間予測動きベクトル情報を空間予測動きベクトル情報再構築部２４１に供給する。

動き情報バッファ２３３は、動き情報再構築部２３４から供給される当該領域の動き情報を記憶する。動き情報バッファ２３３は、当該領域よりも時間的に後に処理される他の領域に対する処理において、その動き情報を周辺動き情報として、空間予測動きベクトル情報再構築部２４１および時間予測動きベクトル情報決定部２２１に供給する。詳細には、動き情報バッファ２３３は、時間予測動きベクトル情報決定部２２１からの要求に基づいて、時間周辺動き情報を時間予測動きベクトル情報決定部２２１に供給する。また、動き情報バッファ２３３は、空間予測動きベクトル情報再構築部２４１からの要求に基づいて、空間周辺動き情報を空間予測動きベクトル情報再構築部２４１に供給する。

時間予測動きベクトル情報決定部２２１は、予測動きベクトル情報バッファ２３２から時間予測動きベクトル情報が供給されると、動き情報バッファ２３３から時間周辺動き情報を取得して、時間予測動きベクトル情報取り出し領域決定処理を実行する。すなわち、時間予測動きベクトル情報決定部２２１は、参照領域に含まれる分割領域のうち、最大領域を、時間予測動きベクトル情報取り出し領域（Co-Located領域）として決定する。そして、時間予測動きベクトル情報決定部２２１は、決定した時間予測動きベクトル情報取り出し領域の時間予測動きベクトル情報を再構築する。時間予測動きベクトル情報決定部２２１は、再構築した時間予測動きベクトル情報を予測動きベクトル情報再構築部２４２に供給する。

空間予測動きベクトル情報再構築部２４１は、予測動きベクトル情報バッファ２３２から空間予測動きベクトル情報が供給されると、動き情報バッファ２３３から空間周辺動き情報を取得して、空間予測動きベクトル情報を再構築する。そして、空間予測動きベクトル情報再構築２４１は、再構築した予測動きベクトル情報を予測動きベクトル情報再構築部２４２に供給する。

予測動きベクトル情報再構築部２４２は、時間予測動きベクトル情報決定部２２１により再構築された時間予測動きベクトル情報、または空間予測動きベクトル情報再構築部２４１により再構築された空間予測動きベクトル情報を取得すると、それを予測動きベクトル情報として動き予測・補償部２１２の動き情報再構築部２３４に供給する。

動き情報再構築部２３４は、差分動き情報バッファ２３１から、画像符号化装置１００から供給された差分動き情報を取得する。動き情報再構築部２３４は、取得した差分動き情報に、予測動きベクトル情報再構築部２４２から取得した予測動きベクトル情報（すなわち、時間予測動きベクトル情報または空間予測動きベクトル情報）を加算し、当該領域の動き情報を再構築する。動き情報再構築部２３４は、再構築した当該領域の動き情報を動き補償部２３５に供給する。

動き補償部２３５は、以上のように動き情報再構築部２３４により再構築された当該領域の動き情報を用いて、フレームメモリ２０９から取得した参照画像画素値に対して動き補償を行い、予測画像を生成する。動き補償部２３５は、その予測画像画素値を、選択部２１３を介して演算部２０５に供給する。

また、動き情報再構築部２３４は、再構築した当該領域の動き情報を動き情報バッファ２３３にも供給する。

動き情報バッファ２３３は、動き情報再構築部２３４から供給される当該領域の動き情報を記憶する。上述したように、動き情報バッファ２３３は、当該領域よりも時間的に後に処理される他の領域に対する処理において、その動き情報を周辺動き情報として、空間予測動きベクトル情報再構築部２４１および時間予測動きベクトル情報決定部２２１に供給する。

以上のように各部が処理を行うことにより、画像復号装置２００は、画像符号化装置１００が符号化した符号化データを正しく復号することができ、動きベクトルの符号化効率の向上を実現させることができる。

［復号処理の流れ］
次に、以上のような画像復号装置２００により実行される復号処理の流れについて説明する。

図１８は、復号処理の流れを説明するフローチャートである。

ステップＳ２０１において、蓄積バッファ２０１は、伝送されてきたコードストリーム（すなわち、符号化された差分画像情報）を蓄積する。

ステップＳ２０２において、可逆復号部２０２は、蓄積バッファ２０１から供給されるコードストリームを復号する。すなわち、図１の可逆符号化部１０６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャが復号される。

このとき、差分動き情報、予測動きベクトル情報など、コードストリームに含められた差分画像情報以外の各種情報も復号される。

ステップＳ２０３において、逆量子化部２０３は、ステップＳ２０２の処理により得られた、量子化された直交変換係数を逆量子化する。

ステップＳ２０４において逆直交変換部２０４は、ステップＳ２０３において逆量子化された直交変換係数を逆直交変換する。

ステップＳ２０５において、イントラ予測部２１１若しくは動き予測・補償部２１２は、供給された情報を用いて予測処理を行う。なお、ステップＳ２０５の処理の詳細については、図１９を参照して後述する。

ステップＳ２０６において、選択部２１３は、ステップＳ２０５において生成された予測画像を選択する。

ステップＳ２０７において、演算部２０５は、ステップＳ２０４において逆直交変換されて得られた差分画像情報に、ステップＳ２０６において選択された予測画像を加算する。これにより元の画像が復号される。

ステップＳ２０８において、ループフィルタ２０６は、ステップＳ２０７において得られた復号画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜行う。

ステップＳ２０９において、画面並べ替えバッファ２０７は、ステップＳ２０８においてフィルタ処理された画像の並べ替えを行う。すなわち画像符号化装置１００の画面並べ替えバッファ１０２により符号化のために並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。

ステップＳ２１０において、D/A変換部２０８は、ステップＳ２０９においてフレームの順序が並べ替えられた画像をD/A変換する。この画像が図示せぬディスプレイに出力され、画像が表示される。

ステップＳ２１１において、フレームメモリ２０９は、ステップＳ２０８においてフィルタ処理された画像を記憶する。

これにより、復号処理が終了する。

［予測処理の流れ］
次に、図１８のステップＳ２０５において実行される予測処理について説明する。

図１９は、予測処理の流れを説明するフローチャートである。

ステップＳ２３１において、可逆復号部２０２は、画像符号化装置１００から供給された最適な予測モードに関する情報に基づいて、処理対象の符号化データがイントラ符号化されているか否かを判定する。

イントラ符号化されていると判定された場合、ステップＳ２３１においてＹＥＳであると判定されて、処理はステップＳ２３２に進む。

ステップＳ２３２において、イントラ予測部２１１は、イントラ予測モード情報を取得する。

ステップＳ２３３において、イントラ予測部２１１は、ステップＳ２３２において取得したイントラ予測モード情報を用いてイントラ予測を行い、予測画像を生成する。予測画像が生成されると、予測処理は終了し、処理は図１８に戻る。

一方、ステップＳ２３１において、インター符号化されている場合、ステップＳ２３１においてＮＯであると判定されて、処理はステップＳ２３４に進む。

ステップＳ２３４において、動き予測・補償部２１２は、インター動き予測処理を実行する。なお、ステップＳ２３４の処理の詳細については、図２０を参照して後述する。

インター動き予測処理が終了すると、予測処理は終了し、処理は図１８に戻る。

［インター動き予測処理の流れ］
次に、図２４のステップＳ２３４において実行されるインター動き予測処理について説明する。

図２０は、インター動き予測処理の流れを説明するフローチャートである。

ステップＳ２５１において、動き予測・補償部２１２は、当該領域に対する動き予測に関する情報を取得する。例えば、差分動き情報バッファ２３１は、差分動き情報を取得し、予測動きベクトル情報バッファ２３２は、予測動きベクトル情報を取得する。

ステップＳ２５２において、予測動きベクトル情報バッファ２３２は、ステップＳ２５１において取得した予測動きベクトル情報に含まれる識別情報から、取得した予測動きベクトル情報が時間予測動きベクトル情報かを判定する。

取得した予測動きベクトル情報が、時間予測動きベクトル情報である場合、ステップＳ２５２においてＹＥＳであると判定されて、処理はステップＳ２５３に進む。

ステップＳ２５３において、時間予測動きベクトル情報決定部２２１は、時間予測動きベクトル情報取り出し領域決定処理を実行する。すなわち、時間予測動きベクトル情報決定部２２１は、参照領域に含まれる分割領域のうち、最大領域を、時間予測動きベクトル情報取り出し領域（Co-Located領域）として決定する。なお、時間予測動きベクトル情報取り出し領域決定処理については、図１５と同様であり、繰り返しになるので説明を省略する。

ステップＳ２５４において、時間予測動きベクトル情報決定部２２１は、時間予測動きベクトル情報を再構築する。時間予測動きベクトル情報が再構築されると、処理はステップＳ２５６に進む。なお、ステップＳ２５６以降の処理については後述する。

一方、ステップＳ２５２において、取得した予測動きベクトル情報が、空間予測動きベクトル情報である場合、ＮＯであると判定されて、処理はステップＳ２５５に進む。

ステップＳ２５５において、空間予測動きベクトル情報再構築部２４１は、空間予測動きベクトル情報を再構築する。空間予測動きベクトル情報が再構築されると、処理はステップＳ２５６に進む。

ステップＳ２５６において、動き情報再構築部２３４は、差分動き情報バッファ２３１から差分動き情報を取得する。

ステップＳ２５７において、動き情報再構築部２３４は、ステップＳ２５４において再構築された時間予測動きベクトル情報またはステップＳ２５５において再構築された空間予測動きベクトル情報に、ステップＳ２５６において取得した差分動き情報を加算し、当該領域の動き情報を再構築する。

ステップＳ２５８において、動き補償部２３５は、ステップＳ２５７において再構築された動き情報を用いて動き補償を行い、予測画像を生成する。

ステップＳ２５９において、動き補償部２３６は、ステップＳ２５８において生成した予測画像を、選択部２１３を介して演算部２０５に供給し、復号画像を生成させる。

ステップＳ２６０において、動き情報バッファ２３３は、ステップＳ２５７において再構築された動き情報を記憶する。

これにより、インター動き予測処理は終了し、処理は図１９に戻る。

以上のように各処理を行うことにより、画像復号装置２００は、画像符号化装置１００が符号化した符号化データを正しく復号することができる。これにより、画像復号装置２００は、画像符号化装置１００による動きベクトルの符号化効率の向上を実現させることができる。

なお、本技術は、例えば、MPEG、H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本技術は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。さらに、本技術は、それらの画像符号化装置および画像復号装置などに含まれる動き予測補償装置にも適用することができる。

＜３．第３の実施の形態＞
［コンピュータ］
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な汎用のパーソナルコンピュータなどが含まれる。

図２１において、コンピュータ５００のCPU（Central Processing Unit）５０１は、ROM（Read Only Memory）５０２に記憶されているプログラム、または記憶部５１３からRAM（Random Access Memory）５０３にロードされたプログラムに従って各種の処理を実行する。RAM５０３にはまた、CPU５０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU５０１、ROM５０２、およびRAM５０３は、バス５０４を介して相互に接続されている。このバス５０４にはまた、入出力インタフェース５１０も接続されている。

入出力インタフェース５１０には、キーボード、マウスなどよりなる入力部５１１、CRT（Cathode Ray Tube）やLCD（Liquid Crystal Display）などよりなるディスプレイ、並びにスピーカなどよりなる出力部５１２、ハードディスクなどより構成される記憶部５１３、モデムなどより構成される通信部５１４が接続されている。通信部５１４は、インターネットを含むネットワークを介しての通信処理を行う。

入出力インタフェース５１０にはまた、必要に応じてドライブ５１５が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア５２１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部５１３にインストールされる。

上述した一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、ネットワークや記録媒体からインストールされる。

この記録媒体は、例えば、図２１に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM（Compact Disc - Read Only Memory）,DVD（Digital Versatile Disc）を含む）、光磁気ディスク（MD（Mini Disc）を含む）、若しくは半導体メモリなどよりなるリムーバブルメディア５２１により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM５０２や、記憶部５１３に含まれるハードディスクなどで構成される。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数のデバイス（装置）により構成される装置全体を表すものである。

また、以上において、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。つまり、本技術は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

上述した実施形態に係る画像符号化装置及び画像復号装置は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

＜４．第４の実施の形態＞
［第１の応用例：テレビジョン受像機］
図２２は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース９０９、制御部９１０、ユーザインタフェース９１１、及びバス９１２を備える。

チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからEPG（Electronic Program Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのGUI（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic ElectroLuminescence Display）（有機ELディスプレイ）など）の映像面上に映像又は画像を表示する。

音声信号処理部９０７は、デコーダ９０４から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

外部インタフェース９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

制御部９１０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

ユーザインタフェース９１１は、制御部９１０と接続される。ユーザインタフェース９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース９０９及び制御部９１０を相互に接続する。

このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施形態に係る画像復号装置の機能を有する。それにより、テレビジョン装置９００での画像の復号に際して、当該領域の動きベクトル情報と相関性が高い動きベクトル情報を、時間予測動きベクトル情報として用いることにより、動きベクトルの符号化効率の向上を実現させることができる。

＜５．第５の実施の形態＞
［第２の応用例：携帯電話機］
図２３は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、ＲＡＭ又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Unallocated Space Bitmap）メモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記憶再生部９２９の記憶媒体に記憶させる。

また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施形態に係る画像符号化装置及び画像復号装置の機能を有する。それにより、携帯電話機９２０での画像の符号化及び復号に際して、当該領域の動きベクトル情報と相関性が高い動きベクトル情報を、時間予測動きベクトル情報として用いることにより、動きベクトルの符号化効率を向上させることができる。

＜６．第６の実施の形態＞
［第３の応用例：記録再生装置］
図２４は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

記録再生装置９４０は、チューナ９４１、外部インタフェース９４２、エンコーダ９４３、HDD（Hard Disk Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、OSD（On-Screen Display）９４８、制御部９４９、及びユーザインタフェース９５０を備える。

チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送手段としての役割を有する。

外部インタフェース９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース９４２は、例えば、IEEE1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース９４２は、記録再生装置９４０における伝送手段としての役割を有する。

エンコーダ９４３は、外部インタフェース９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

HDD９４４は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、HDD９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばDVDディスク（DVD-Video、DVD-RAM、DVD-R、DVD-RW、DVD+R、DVD+RW等）又はBlu-ray（登録商標）ディスクなどであってよい。

セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、HDD９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをOSD９４８へ出力する。また、デコーダ９０４は、生成した音声データを外部のスピーカへ出力する。

OSD９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、OSD９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。

制御部９４９は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

ユーザインタフェース９５０は、制御部９４９と接続される。ユーザインタフェース９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施形態に係る画像符号化装置の機能を有する。また、デコーダ９４７は、上述した実施形態に係る画像復号装置の機能を有する。それにより、記録再生装置９４０での画像の符号化及び復号に際して、当該領域の動きベクトル情報と相関性が高い動きベクトル情報を、時間予測動きベクトル情報として用いることにより、動きベクトルの符号化効率を向上させることができる。

＜７．第７の実施の形態＞
［第４の応用例：撮像装置］
図２５は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、OSD９６９、制御部９７０、ユーザインタフェース９７１、及びバス９７２を備える。

光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、OSD９６９、及び制御部９７０を相互に接続する。

光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、CCD（Charge Coupled Device）又はCMOS（Complementary Metal Oxide Semiconductor）などのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、OSD９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

OSD９６９は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部９６４へ出力する。

外部インタフェース９６６は、例えばUSB入出力端子として構成される。外部インタフェース９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース９６６は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース９６６は、撮像装置９６０における伝送手段としての役割を有する。

メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部９７０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

ユーザインタフェース９７１は、制御部９７０と接続される。ユーザインタフェース９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施形態に係る画像符号化装置及び画像復号装置の機能を有する。それにより、撮像装置９６０での画像の符号化及び復号に際して、当該領域の動きベクトル情報と相関性が高い動きベクトル情報を、時間予測動きベクトル情報として用いることにより、動きベクトルの符号化効率を向上させることができる。

なお、本明細書では、予測動きベクトル情報、差分動き情報などの様々な情報が、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

以上、添付図面を参照しながら本技術の好適な実施形態について詳細に説明したが、本技術はかかる例に限定されない。本技術の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本技術の技術的範囲に属するものと了解される。

なお、本技術は、以下のような構成もとることができる。
（１）
画像を動き予測する場合、参照画像において、処理対象の当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定部と、
前記決定部により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報と、前記当該領域の動き情報の差分である差分動き情報を生成する差分生成部と
を備え、
前記参照領域は複数の分割領域により区分されており、
前記決定部は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定する
画像処理装置。
（２）
前記決定部は、前記最大領域が複数存在する場合、複数の前記最大領域の中から前記取り出し領域を決定するルールを有する
前記（１）に記載の画像処理装置。
（３）
前記ルールは、前記参照領域をラスタースキャン順に辿ったときに、最先に現れる前記最大領域を前記時間予測動きベクトル情報取り出し領域とする、というルールである
前記（１）または（２）に記載の画像処理装置。
（４）
前記ルールは、前記参照領域をラスタースキャン順に辿ったときに、最先に現れるインター予測符号化された前記最大領域を前記取り出し領域とする、というルールである
前記（１）、（２）、または（３）に記載の画像処理装置。
（５）
前記参照領域は複数の分割領域により区分されており、
前記決定部は、
前記当該領域が所定の閾値以上のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、
前記当該領域が所定の閾値未満のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定する
前記（１）乃至（４）のいずれかに記載の画像処理装置。
（６）
前記所定の閾値は、入力となる画像圧縮情報中のシーケンスパラメータセット、ピクチャパラメータセット、またはスライスヘッダにおいて指定される
前記（１）乃至（５）のいずれかに記載の画像処理装置。
（７）
前記決定部は、
出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値以上である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、
出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値未満である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定する
前記（１）乃至（６）のいずれかに記載の画像処理装置。
（８）
前記プロファイルレベルとは画枠である
前記（１）乃至（７）のいずれかに記載の画像処理装置。
（９）
画像を動き予測する場合、参照画像において、処理対象の当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定ステップと、
前記決定ステップの処理により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報と、前記当該領域の動き情報の差分である差分動き情報を生成する差分生成ステップと
を含み、
記参照領域は複数の分割領域により区分されており、
前記決定ステップの処理は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定する
画像処理方法。
（１０）
画像の符号化データを復号する場合、前記画像の符号化に用いられた、時間予測動きベクトル情報と処理対象の当該領域の動き情報の差分である差分動き情報を取得する取得部と、
参照画像において、前記当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定部と、
前記取得部により取得された前記差分動き情報と、前記決定部により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報を用いて、動き補償のための前記当該領域の動き情報を再構築する動き情報再構築部と
を備え、
前記参照領域は複数の分割領域により区分されており、
前記決定部は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を前記取り出し領域として決定する
画像処理装置。
（１１）
前記決定部は、前記最大領域が複数存在する場合、複数の前記最大領域の中から前記時間予測動きベクトル情報取り出し領域を決定するルールを有する
前記（１０）に記載の画像処理装置。
（１２）
前記ルールは、前記参照領域をラスタースキャン順に辿ったときに、最先に現れる前記最大領域を前記時間予測動きベクトル情報取り出し領域とする、というルールである
前記（１０）または（１１）に記載の画像処理装置。
（１３）
前記ルールは、前記参照領域をラスタースキャン順に辿ったときに、最先に現れるインター予測符号化された前記最大領域を前記時間予測動きベクトル情報取り出し領域とする、というルールである
前記（１０）、（１１）、または（１２）に記載の画像処理装置。
（１４）
前記参照領域は複数の分割領域により区分されており、
前記決定部は、
前記当該領域が所定の閾値以上のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、
前記当該領域が所定の閾値未満のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定する
前記（１０）乃至（１３）のいずれかに記載の画像処理装置。
（１５）
前記所定の閾値は、入力となる画像圧縮情報中のシーケンスパラメータセット、ピクチャパラメータセット、またはスライスヘッダにおいて指定される
前記（１０）乃至（１４）のいずれかに記載の画像処理装置。
（１６）
前記決定部は、
出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値以上である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、
出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値未満である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定する
前記（１０）乃至（１５）のいずれかに記載の画像処理装置。
（１７）
前記プロファイルレベルとは画枠である
前記（１０）乃至（１６）のいずれかに記載の画像処理装置。
（１８）
画像の符号化データを復号する場合、前記画像の符号化に用いられた、時間予測動きベクトル情報と処理対象の当該領域の動き情報の差分である差分動き情報を取得する取得ステップと、
参照画像において、前記当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定ステップと、
前記取得ステップの処理により取得された前記差分動き情報と、前記決定ステップの処理により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報を用いて、動き補償のための前記当該領域の動き情報を再構築する動き情報再構築ステップと
を含み、
前記参照領域は複数の分割領域により区分されており、
前記決定ステップの処理は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を前記取り出し領域として決定する
画像処理方法。

１００画像符号化装置，１１５動き予測・補償部，１２１時間予測動きベクトル情報決定部，１２２動きベクトル符号化部，１４１空間予測動きベクトル情報決定部，１４２予測動きベクトル情報生成部，１４３差分動きベクトル生成部，２００画像復号装置，２１２動き予測・補償部，２２１時間予測動きベクトル情報決定部，２２２動きベクトル復号部，２４１時間予測動きベクトル情報再構築部，２４２予測動きベクトル情報再構築部，２４３空間予測動きベクトル情報再構築部，

Claims

画像を動き予測する場合、参照画像において、処理対象の当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定部と、
前記決定部により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報と、前記当該領域の動き情報の差分である差分動き情報を生成する差分生成部と
を備え、
前記参照領域は複数の分割領域により区分されており、
前記決定部は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定する
画像処理装置。
前記決定部は、前記最大領域が複数存在する場合、複数の前記最大領域の中から前記取り出し領域を決定するルールを有する
請求項１に記載の画像処理装置。
前記ルールは、前記参照領域をラスタースキャン順に辿ったときに、最先に現れる前記最大領域を前記取り出し領域とする、というルールである
請求項２に記載の画像処理装置。
前記ルールは、前記参照領域をラスタースキャン順に辿ったときに、最先に現れるインター予測符号化された前記最大領域を前記取り出し領域とする、というルールである
請求項２に記載の画像処理装置。
前記参照領域は複数の分割領域により区分されており、
前記決定部は、
前記当該領域が所定の閾値以上のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、
前記当該領域が所定の閾値未満のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定する
請求項１に記載の画像処理装置。
前記所定の閾値は、入力となる画像圧縮情報中のシーケンスパラメータセット、ピクチャパラメータセット、またはスライスヘッダにおいて指定される
請求項５に記載の画像処理装置。
前記決定部は、
出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値以上である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、
出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値未満である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定する
請求項１に記載の画像処理装置。
前記プロファイルレベルとは画枠である
請求項７に記載の画像処理装置。
画像を動き予測する場合、参照画像において、処理対象の当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定ステップと、
前記決定ステップの処理により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報と、前記当該領域の動き情報の差分である差分動き情報を生成する差分生成ステップと
を含み、
前記参照領域は複数の分割領域により区分されており、
前記決定ステップの処理は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定する
画像処理方法。
画像の符号化データを復号する場合、前記画像の符号化に用いられた、時間予測動きベクトル情報と処理対象の当該領域の動き情報の差分である差分動き情報を取得する取得部と、
参照画像において、前記当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定部と、
前記取得部により取得された前記差分動き情報と、前記決定部により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報を用いて、動き補償のための前記当該領域の動き情報を再構築する動き情報再構築部と
を備え、
前記参照領域は複数の分割領域により区分されており、
前記決定部は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を前記取り出し領域として決定する
画像処理装置。
前記決定部は、前記最大領域が複数存在する場合、複数の前記最大領域の中から前記取り出し領域を決定するルールを有する
請求項１０に記載の画像処理装置。
前記ルールは、前記参照領域をラスタースキャン順に辿ったときに、最先に現れる前記最大領域を前記取り出し領域とする、というルールである
請求項１１に記載の画像処理装置。
前記ルールは、前記参照領域をラスタースキャン順に辿ったときに、最先に現れるインター予測符号化された前記最大領域を前記取り出し領域とする、というルールである
請求項１１に記載の画像処理装置。
前記参照領域は複数の分割領域により区分されており、
前記決定部は、
前記当該領域が所定の閾値以上のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、
前記当該領域が所定の閾値未満のサイズである場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定する
請求項１０に記載の画像処理装置。
前記所定の閾値は、入力となる画像圧縮情報中のシーケンスパラメータセット、ピクチャパラメータセット、またはスライスヘッダにおいて指定される
請求項１４に記載の画像処理装置。
前記決定部は、
出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値以上である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を、前記取り出し領域として決定し、
出力となる画像圧縮情報中におけるプロファイルレベルが所定の閾値未満である場合には、前記参照領域内の前記複数の分割領域のうち、前記当該領域の左上の画素と同一のアドレスの画素を含む分割領域を、前記取り出し領域として決定する
請求項１０に記載の画像処理装置。
前記プロファイルレベルとは画枠である
請求項１６に記載の画像処理装置。
画像の符号化データを復号する場合、前記画像の符号化に用いられた、時間予測動きベクトル情報と処理対象の当該領域の動き情報の差分である差分動き情報を取得する取得ステップと、
参照画像において、前記当該領域に対応する参照領域内から、動きベクトル情報を時間予測動きベクトル情報として取り出すための取り出し領域を決定する決定ステップと、
前記取得ステップの処理により取得された前記差分動き情報と、前記決定ステップの処理により決定された前記取り出し領域から取り出された前記時間予測動きベクトル情報を用いて、動き補償のための前記当該領域の動き情報を再構築する動き情報再構築ステップと
を含み、
前記参照領域は複数の分割領域により区分されており、
前記決定ステップの処理は、前記参照領域内の前記複数の分割領域のうち、前記当該領域と重なる面積が最大となる最大領域を前記取り出し領域として決定する
画像処理方法。