JP2015216632A

JP2015216632A - 符号化装置および符号化方法

Info

Publication number: JP2015216632A
Application number: JP2015078932A
Authority: JP
Inventors: 裕音櫻井; Hironari Sakurai; 田中　潤一; Junichi Tanaka; 潤一田中; 武文名雲; Takefumi Nagumo
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2014-04-22
Filing date: 2015-04-08
Publication date: 2015-12-03
Also published as: WO2015163146A1; US10110916B2; US20170094312A1

Abstract

【課題】双方向予測時に必要な記憶容量を削減することができるようにする。
【解決手段】精度変換部は、入力画像に対して双方向予測を行う場合、予測方向ごとに、入力画像の分数画素精度の動きベクトルを整数画素精度の動きベクトルに変換する。平均化部は、精度変換部により変換された予測方向ごとの整数画素精度の動きベクトルに基づいて、入力画像の双方向予測の予測画像を生成する。本開示は、例えば、HEVC（High Efficiency Video Coding）方式の符号化装置等に適用することができる。
【選択図】図４

Description

本開示は、符号化装置および符号化方法に関し、特に、双方向予測時に必要な記憶容量を削減することができるようにした符号化装置および符号化方法に関する。

ITU-Tと、ISO/IECの共同の標準化団体であるJCTVC(Joint Collaboration Team − Video Coding)により、HEVC(High Efficiency Video Coding)と呼ばれる符号化方式の標準化が行われた（例えば、非特許文献１参照）。

AVC（Advanced Video Coding）方式やHEVC方式では、8ビットの画像の双方向予測（BiP）時、各予測方向について、分数画素精度（小数画素精度）の動きベクトルが検出され、その動きベクトルを用いて動き補償が行われる。そして、AVC方式では、その結果得られる14ビットの各予測方向の予測画像が8ビットに丸められて平均化され、最終的な予測画像が生成される。

しかしながら、HEVC方式では、14ビットの各予測方向の予測画像が丸められず、そのまま平均化されて、最終的な予測画像生成される。従って、AVC方式に比べて予測画像の精度は向上するが、平均化前の各予測方向の予測画像を保持するキャッシュに必要な記憶容量が大きくなる。このことは、予測モードがマージモードである場合においても同様である。

また、双方向予測では、動きベクトルの検出および動き補償を行うために、２方向の参照画像をキャッシュに保持する必要がある。従って、一方向予測に比べて参照画像を保持するキャッシュに必要な記憶容量が大きくなる。

Benjamin Bross，Gary J.Sullivan，Ye-Kui Wang，"Editors’ proposed corrections to HEVC version 1"，JCTVC-M0432_v3，2013.4.18-4.26

従って、双方向予測時に必要な記憶容量を削減することが望まれている。

本開示は、このような状況に鑑みてなされたものであり、双方向予測時に必要な記憶容量を削減することができるようにするものである。

本開示の第１の側面の符号化装置は、画像に対して双方向予測を行う場合、予測方向ごとに、前記画像の分数画素精度の動きベクトルを整数画素精度の動きベクトルに変換する精度変換部と、前記精度変換部により変換された前記予測方向ごとの整数画素精度の動きベクトルに基づいて、前記画像の双方向予測の予測画像を生成する予測画像生成部と、前記予測画像生成部により生成された前記双方向予測の予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化部とを備える符号化装置である。

本開示の第１の側面の符号化方法は、本開示の第１の側面の符号化装置に対応する。

本開示の第１の側面においては、画像に対して双方向予測を行う場合、予測方向ごとに、前記画像の分数画素精度の動きベクトルが整数画素精度の動きベクトルに変換され、変換された前記予測方向ごとの整数画素精度の動きベクトルに基づいて、前記画像の双方向予測の予測画像が生成され、前記双方向予測の予測画像を用いて、前記画像が、再帰的に分割されるブロック構造にしたがって符号化される。

本開示の第２の側面の符号化装置は、画像に対する予測画像を生成する場合に、複数のLCU（Largest Coding Unit）単位で、前記画像に対して、前方向予測または後方向予測のみを行うように制限する方向制限予測部と、前記予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化部とを備える符号化装置である。

本開示の第２の側面の符号化方法は、本開示の第２の側面の符号化装置に対応する。

本開示の第２の側面においては、画像に対する予測画像を生成する場合に、複数のLCU（Largest Coding Unit）単位で、前記画像に対して、前方向予測または後方向予測のみが行われるように制限され、前記予測画像を用いて、前記画像が、再帰的に分割されるブロック構造にしたがって符号化される。

なお、第１および第２の側面の符号化装置は、コンピュータにプログラムを実行させることにより実現することができる。

また、第１および第２の側面の符号化装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。

第１および第２の側面の符号化装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

本開示の第１および第２の側面によれば、画像を符号化することができる。また、本開示の第１および第２の側面によれば、双方向予測時に必要な記憶容量を削減することができる。

なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

本開示を適用した符号化装置の第１実施の形態の構成例を示すブロック図である。図１の符号化部の構成例を示すブロック図である。図２の動き予測・補償部の構成例を示すブロック図である。図３の双方向予測部の構成例を示すブロック図である。図１の符号化装置による効果を説明する図である。図１の符号化装置の符号化処理を説明するフローチャートである。図１の符号化装置の符号化処理を説明するフローチャートである。図７の動き予測・補償処理の詳細を説明するフローチャートである。図８の双方向予測処理の詳細を説明するフローチャートである。本開示を適用した符号化装置の第２実施の形態の構成例を示すブロック図である。図１０の符号化部の構成例を示すブロック図である。図１１の動き予測・補償部の構成例を示すブロック図である。図１２の双方向予測部の構成例を示すブロック図である。図１０の符号化装置における双方向予測モードの予測を説明する図である。図１３の決定部で決定される予測方向を説明する図である。符号化装置の双方向予測処理を説明するフローチャートである。本開示を適用した符号化装置の第３実施の形態の符号化部の構成例を示すブロック図である。制約テーブルの第１の例を示す図である。図１７の符号化部の動き予測・補償処理を説明するフローチャートである。制約テーブルの第２の例を示す図である。制約テーブルの第３の例を示す図である。復号装置の構成例を示すブロック図である。コンピュータのハードウエアの構成例を示すブロック図である。本開示を適用したテレビジョン装置の概略構成例を示す図である。本開示を適用した携帯電話機の概略構成例を示す図である。本開示を適用した記録再生装置の概略構成例を示す図である。本開示を適用した撮像装置の概略構成例を示す図である。本開示を適用したビデオセットの概略的な構成の一例を示している。本開示を適用したビデオプロセッサの概略的な構成の一例を示している。本開示を適用したビデオプロセッサの概略的な構成の他の例を示している。

以下、本開示の前提および本開示を実施するための形態（以下、実施の形態という）について説明する。なお、説明は以下の順序で行う。
１．第１実施の形態：符号化装置（図１乃至図９）
２．第２実施の形態：符号化装置（図１０乃至図１６）
３．第３実施の形態：符号化装置（図１７乃至図２１）
４．復号装置（図２２）
５．第４実施の形態：コンピュータ（図２３）
６．テレビジョン装置（図２４）
７．第５実施の形態：携帯電話機（図２５）
８．第６実施の形態：記録再生装置（図２６）
９．第７実施の形態：撮像装置（図２７）
１０．第８実施の形態：ビデオセット（図２８乃至図３０）

＜第１実施の形態＞
（符号化装置の第１実施の形態の構成例）
図１は、本開示を適用した符号化装置の第１実施の形態の構成例を示すブロック図である。

図１の符号化装置１０は、符号化部１１と外部メモリ１２により構成される。符号化装置１０は、外部メモリ１２に記憶されている画像をHEVC方式で符号化する。

具体的には、符号化装置１０の符号化部１１は、処理部２１とキャッシュ２２により構成される。処理部２１には、外部メモリ１２に記憶されている符号化対象の画像が、キャッシュ２２を介して入力される。処理部２１は、入力された画像（以下、入力画像という）に対して符号化処理を行う。このとき、処理部２１は、符号化処理の途中結果および最終結果を必要に応じてキャッシュ２２に供給し、記憶させる。また、処理部２１は、キャッシュ２２に参照画像として記憶されている符号化済みの画像を読み出し、符号化処理に用いる。

キャッシュ２２は、処理部２１から供給される符号化処理の途中結果および最終結果を一時的に記憶する。キャッシュ２２は、記憶している符号化処理の最終結果である符号化済みの画像を外部メモリ１２に供給し、記憶させる。また、キャッシュ２２は、外部メモリ１２から参照画像として供給される符号化済みの画像および入力画像を一時的に記憶する。

外部メモリ１２は、DRAM（Dynamic Random Access Memory）などにより構成される。外部メモリ１２は、入力画像とキャッシュ２２から供給される符号化済みの画像を記憶する。外部メモリ１２は、記憶している入力画像をキャッシュ２２に供給する。また、外部メモリ１２は、記憶している符号化済みの画像を参照画像としてキャッシュ２２に供給する。

（符号化部の構成例）
図２は、図１の符号化部１１の構成例を示すブロック図である。

図２の符号化部１１は、画面並べ替えバッファ３２、演算部３３、直交変換部３４、量子化部３５、可逆符号化部３６、蓄積バッファ３７、逆量子化部３８、逆直交変換部３９、および加算部４０を有する。また、符号化部１１は、デブロックフィルタ４１、適応オフセットフィルタ４２、フレームメモリ４４、スイッチ４５、イントラ予測部４６、動き予測・補償部４７、予測画像選択部４８、およびレート制御部４９を有する。

処理部２１は、画面並べ替えバッファ３２、蓄積バッファ３７、およびフレームメモリ４４以外のブロックに含まれる処理を行う部により構成される。キャッシュ２２は、画面並べ替えバッファ３２、蓄積バッファ３７、およびフレームメモリ４４、並びに、これら以外のブロックに含まれる処理の途中結果や最終結果を一時的に記憶する部により構成される。

符号化部１１の画面並べ替えバッファ３２は、図１の外部メモリ１２から供給されるデジタル信号である入力画像を記憶する。画面並べ替えバッファ３２は、記憶した表示の順番のフレーム単位の入力画像を、GOP構造に応じて、符号化のための順番に並べ替える。画面並べ替えバッファ３２は、並べ替え後の入力画像を、演算部３３、イントラ予測部４６、および動き予測・補償部４７に出力する。

演算部３３は、符号化部として機能し、予測画像選択部４８から供給される予測画像を用いて、画面並べ替えバッファ３２から供給される入力画像を、再帰的に分割されるブロック構造にしたがって符号化する。具体的には、演算部３３は、CU（Coding Unit）の構造にしたがって、入力画像から予測画像を減算することにより符号化を行う。演算部３３は、その結果得られる画像を、残差情報として直交変換部３４に出力する。なお、予測画像選択部４８から予測画像が供給されない場合、演算部３３は、画面並べ替えバッファ３２から読み出された画像をそのまま残差情報として直交変換部３４に出力する。

直交変換部３４は、演算部３３からの残差情報をＴＵ（transform unit）単位で直交変換する。直交変換部３４は、直交変換の結果得られる直交変換係数を量子化部３５に供給する。

量子化部３５は、直交変換部３４から供給される直交変換係数に対して量子化を行う。量子化部３５は、量子化された直交変換係数を可逆符号化部３６に供給する。

可逆符号化部３６は、最適イントラ予測モードを示すイントラ予測モード情報をイントラ予測部４６から取得する。また、可逆符号化部３６は、最適インター予測モードを示すインター予測モード情報、動きベクトルを表す動きベクトル情報、参照画像を特定する情報などを動き予測・補償部４７から取得する。

また、可逆符号化部３６は、適応オフセットフィルタ４２からオフセットフィルタに関するオフセットフィルタ情報を取得する。

可逆符号化部３６は、量子化部３５から供給される量子化された直交変換係数に対して、可変長符号化（例えば、CAVLC（Context-Adaptive Variable Length Coding）など）、算術符号化（例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）など）などの可逆符号化を行う。

また、可逆符号化部３６は、イントラ予測モード情報、または、インター予測モード情報、動きベクトル情報、および参照画像を特定する情報、並びにオフセットフィルタ情報を、符号化に関する符号化情報として可逆符号化する。可逆符号化部３６は、可逆符号化された符号化情報と直交変換係数を、符号化データとして蓄積バッファ３７に供給し、蓄積させる。なお、可逆符号化された符号化情報は、スライスヘッダ等のヘッダ部として符号化データに付加されるようにしてもよい。

蓄積バッファ３７は、可逆符号化部３６から供給される符号化データを、一時的に記憶する。また、蓄積バッファ３７は、記憶している符号化データを出力する。

また、量子化部３５より出力された、量子化された直交変換係数は、逆量子化部３８にも入力される。逆量子化部３８は、量子化部３５により量子化された直交変換係数に対して、量子化部３５における量子化方法に対応する方法で逆量子化を行う。逆量子化部３８は、逆量子化の結果得られる直交変換係数を逆直交変換部３９に供給する。

逆直交変換部３９は、ＴＵ単位で、逆量子化部３８から供給される直交変換係数に対して、直交変換部３４における直交変換方法に対応する方法で逆直交変換を行う。逆直交変換部３９は、その結果得られる残差情報を加算部４０に供給する。

加算部４０は、逆直交変換部３９から供給される残差情報と、予測画像選択部４８から供給される予測画像を加算し、局部的に復号を行う。なお、予測画像選択部４８から予測画像が供給されない場合、加算部４０は、逆直交変換部３９から供給される残差情報を局部的に復号された画像とする。加算部４０は、局部的に復号された画像をデブロックフィルタ４１とフレームメモリ４４に供給する。

デブロックフィルタ４１は、加算部４０から供給される局部的に復号された画像に対して、ブロック歪を除去するデブロックフィルタ処理を行い、その結果得られる画像を適応オフセットフィルタ４２に供給する。

適応オフセットフィルタ４２は、デブロックフィルタ４１によるデブロックフィルタ処理後の画像に対して、主にリンギングを除去する適応オフセットフィルタ(SAO（Sample adaptive offset)）処理を行う。

具体的には、適応オフセットフィルタ４２は、最大の符号化単位であるLCU（Largest Coding Unit）ごとに適応オフセットフィルタ処理の種類を決定し、その適応オフセットフィルタ処理で用いられるオフセットを求める。適応オフセットフィルタ４２は、求められたオフセットを用いて、デブロックフィルタ処理後の画像に対して、決定された種類の適応オフセットフィルタ処理を行う。

適応オフセットフィルタ４２は、適応オフセットフィルタ処理後の画像をフレームメモリ４４に供給する。また、適応オフセットフィルタ４２は、行われた適応オフセットフィルタ処理の種類とオフセットを示す情報を、オフセットフィルタ情報として可逆符号化部３６に供給する。

フレームメモリ４４は、適応オフセットフィルタ４２から供給される画像と、加算部４０から供給される画像を蓄積する。フレームメモリ４４に蓄積されたフィルタ処理が行われていない画像のうちのＰＵ（Prediction Unit）に隣接する画素は、周辺画素としてスイッチ４５を介してイントラ予測部４６に供給される。

一方、フレームメモリ４４に蓄積されたフィルタ処理が行われた画像は、符号化済みの画像として図１の外部メモリ１２に供給され、記憶される。また、フレームメモリ４４は、外部メモリ１２から供給される参照画像を蓄積する。フレームメモリ４４に蓄積された参照画像はスイッチ４５を介して動き予測・補償部４７に出力される。

イントラ予測部４６は、ＰＵ単位で、フレームメモリ４４からスイッチ４５を介して読み出された周辺画素を用いて、候補となる全てのイントラ予測モードのイントラ予測処理を行う。

また、イントラ予測部４６は、画面並べ替えバッファ３２から読み出された入力画像と、イントラ予測処理の結果生成される予測画像とに基づいて、候補となる全てのイントラ予測モードに対してコスト関数値（詳細は後述する）を算出する。そして、イントラ予測部４６は、コスト関数値が最小となるイントラ予測モードを、最適イントラ予測モードに決定する。

イントラ予測部４６は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、予測画像選択部４８に供給する。イントラ予測部４６は、予測画像選択部４８から最適イントラ予測モードで生成された予測画像の選択が通知された場合、イントラ予測モード情報を可逆符号化部３６に供給する。

なお、コスト関数値は、RD(Rate Distortion)コストともいい、例えば、H．264/AVC方式における参照ソフトウエアであるJM(Joint Model)で定められているような、High Complexity モードまたはLow Complexity モードの手法に基づいて算出される。なお、H．264/AVC方式における参照ソフトウエアは、http://iphome.hhi.de/suehring/tml/index.htmにおいて公開されている。

具体的には、コスト関数値の算出手法としてHigh Complexity モードが採用される場合、候補となる全ての予測モードに対して、仮に復号までが行われ、次の式（１）で表わされるコスト関数値が各予測モードに対して算出される。

Dは、原画像と復号画像の差分（歪）、Rは、直交変換の係数まで含んだ発生符号量、λは、量子化パラメータQPの関数として与えられるラグランジュ未定乗数である。

一方、コスト関数値の算出手法としてLow Complexity モードが採用される場合、候補となる全ての予測モードに対して、予測画像の生成、および、符号化情報の符号量の算出が行われ、次の式（２）で表わされるコスト関数Cost(Mode)が各予測モードに対して算出される。

Dは、原画像と予測画像の差分（歪）、Header_Bitは、符号化情報の符号量、QPtoQuantは、量子化パラメータQPの関数として与えられる関数である。

Low Complexity モードにおいては、全ての予測モードに対して、予測画像を生成するだけでよく、復号画像を生成する必要がないため、演算量が少なくて済む。

動き予測・補償部４７は、ＰＵ単位で、候補となる全てのインター予測モードの動き予測・補償処理を行う。具体的には、動き予測・補償部４７は、画面並べ替えバッファ３２から供給される入力画像と、フレームメモリ４４からスイッチ４５を介して供給される参照画像とに基づいて、候補となる全てのインター予測モードの動きベクトルを1/4画素精度で検出する。なお、インター予測モードとは、ＰＵのサイズ、予測方向、マージモードであるかどうか等を表すモードである。

動き予測・補償部４７は、候補となるインター予測モードが予測方向として双方向を表す場合、1/4画素精度の動きベクトルを整数画素精度の動きベクトルに変換する。そして、動き予測・補償部４７は、変換後の整数画素精度の動きベクトルに基づいて参照画像に補償処理を施し、予測画像を生成する。一方、動き予測・補償部４７は、候補となるインター予測モードが予測方向として前方向または後方向を表す場合、1/4画素精度の動きベクトルに基づいて参照画像に対して線形補間を用いた補償処理を施し、予測画像を生成する。

なお、前方向の予測（Ｌ０予測）とは、符号化する入力画像より表示順で前の画像を参照画像として行う予測であり、後方向の予測（Ｌ１予測）とは、符号化する入力画像より表示順で後の画像を参照画像として行う予測である。

また、動き予測・補償部４７は、入力画像と予測画像に基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター予測モードに決定する。そして、動き予測・補償部４７は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部４８に供給する。

また、動き予測・補償部４７は、予測画像選択部４８から最適インター予測モードで生成された予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトル情報、参照画像を特定する情報などを可逆符号化部３６に出力する。

予測画像選択部４８は、イントラ予測部４６および動き予測・補償部４７から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちの、対応するコスト関数値が小さい方を、最適予測モードに決定する。そして、予測画像選択部４８は、最適予測モードの予測画像を、演算部３３および加算部４０に供給する。また、予測画像選択部４８は、最適予測モードの予測画像の選択をイントラ予測部４６または動き予測・補償部４７に通知する。

レート制御部４９は、蓄積バッファ３７に蓄積された符号化データに基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部３５の量子化動作のレートを制御する。

（動き予測・補償部の構成例）
図３は、図２の動き予測・補償部４７の構成例を示すブロック図である。

図３の動き予測・補償部４７は、L0予測部６１、L1予測部６２、双方向予測部６３、および選択部６４により構成される。

動き予測・補償部４７のL0予測部６１は、ＰＵ単位で、候補となるL0予測を表すインター予測モード（以下、L0予測モードという）の動き予測・補償処理を行う。具体的には、L0予測部６１は、L0予測モードごとに、画面並べ替えバッファ３２からの入力画像とスイッチ４５からの表示順で入力画像より前の参照画像とに基づいて、動きベクトルを1/4画素精度で検出する。そして、L0予測部６１は、L0予測モードごとに、1/4画素精度の動きベクトルに基づいて、参照画像に対して線形補間を用いた補償処理を施し、予測画像を生成する。

さらに、L0予測部６１は、L0予測モードごとに、入力画像と予測画像に基づいてコスト関数値を算出する。L0予測部６１は、各L0予測モードの予測画像とコスト関数値を選択部６４に供給する。

L1予測部６２の処理は、予測方向が後方向である点を除いて、L0予測部６１の処理と同様である。即ち、L1予測部６２は、ＰＵ単位で、候補となるL1予測を表すインター予測モード（以下、L1予測モードという）の動き予測・補償処理を行う。また、L1予測部６２は、L1予測モードごとに、入力画像と予測画像に基づいてコスト関数値を算出する。L1予測部６２は、各L1予測モードの予測画像とコスト関数値を選択部６４に供給する。

双方向予測部６３は、ＰＵ単位で、候補となる双方向予測を表すインター予測モード（以下、双方向予測モードという）の動き予測・補償処理を行う。具体的には、双方向予測部６３は、双方向予測モードごとに、入力画像と表示順で入力画像より前の参照画像とに基づいて、前方向の動きベクトルを1/4画素精度で検出する。また、双方向予測部６３は、双方向予測モードごとに、入力画像と表示順で入力画像より後の参照画像とに基づいて、後方向の動きベクトルを1/4画素精度で検出する。

そして、双方向予測部６３は、双方向予測モードごとに、検出された前方向および後方向の1/4画素精度の動きベクトルを、整数画素精度の動きベクトルに変換する。双方向予測部６３は、双方向予測モードごとに、整数画素精度の前方向および後方向の動きベクトルに基づいて参照画像に対して補償処理を施し、L0予測およびL1予測の予測画像を生成する。また、双方向予測部６３は、双方向予測モードごとに、L0予測の予測画像とL1予測の予測画像を平均化し、双方向予測の予測画像を生成する。

双方向予測部６３は、双方向予測モードごとに、入力画像と双方向予測の予測画像とに基づいてコスト関数値を算出する。双方向予測部６３は、各双方向予測モードの予測画像とコスト関数値を選択部６４に供給する。

選択部６４は、L0予測部６１、L1予測部６２、および双方向予測部６３から供給されるコスト関数値のうちの最小のコスト関数値に対応するインター予測モードを、最適インター予測モードに決定する。そして、選択部６４は、最適インター予測モードのコスト関数値と、対応する予測画像を図２の予測画像選択部４８に供給する。また、選択部６４は、予測画像選択部４８から最適インター予測モードで生成された予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトル情報、参照画像を特定する情報などを可逆符号化部３６に出力する。

（双方向予測部の構成例）
図４は、図３の双方向予測部６３の構成例を示すブロック図である。

図４の双方向予測部６３は、検出部８１、精度変換部８２、中間予測画像生成部８３、メモリ８４、検出部８５、精度変換部８６、中間予測画像生成部８７、メモリ８８、平均化部８９、および算出部９０により構成される。

双方向予測部６３の検出部８１は、２次元の線形内挿適応フィルタを有する。検出部８１は、入力画像の双方向予測を行う場合、候補となる双方向予測モードごとに、前方向の1/4画素精度の動きベクトル検出処理を行う。

具体的には、検出部８１は、２次元の線形内挿適応フィルタを用いて、図２の画面並べ替えバッファ３２から供給される入力画像に対して内挿フィルタ処理を行い、入力画像を高解像度化する。また、検出部８１は、２次元の線形内挿適応フィルタを用いて、図２のスイッチ４５から供給される入力画像より表示順で前の参照画像に対して内挿フィルタ処理を行い、参照画像を高解像度化する。検出部８１は、高解像度化された入力画像と参照画像に基づいて、入力画像の動きベクトルを1/4画素精度で検出する。検出部８１は、検出された1/4画素精度の動きベクトルを精度変換部８２に供給する。

精度変換部８２は、検出部８１から供給される1/4画素精度の動きベクトルを整数画素精度の動きベクトルに変換し、中間予測画像生成部８３に供給する。

中間予測画像生成部８３は、精度変換部８２から供給される整数画素精度の動きベクトルに基づいて、入力画像より表示順で前の参照画像に対して動き補償を行うことにより、L0予測を行う。中間予測画像生成部８３は、その結果生成されるL0予測の予測画像を中間予測画像としてメモリ８４に供給する。

メモリ８４は、キャッシュ２２の一部を構成する。メモリ８４は、中間予測画像生成部８３から中間予測画像として供給されるL0予測の予測画像を記憶する。

検出部８５、精度変換部８６、中間予測画像生成部８７、およびメモリ８８の処理は、それぞれ、予測方向が後方向である点を除いて、検出部８１、精度変換部８２、中間予測画像生成部８３、メモリ８４の処理と同様である。

即ち、検出部８５は、２次元の線形内挿適応フィルタを有し、入力画像の双方向予測を行う場合、候補となる双方向予測モードごとに、後方向の1/4画素精度の動きベクトル検出処理を行う。そして、検出部８５は、検出された1/4画素精度の動きベクトルを精度変換部８２に供給する。

精度変換部８６は、検出部８５から供給される1/4画素精度の動きベクトルを整数画素精度の動きベクトルに変換し、中間予測画像生成部８７に供給する。

中間予測画像生成部８７は、精度変換部８６から供給される整数画素精度の動きベクトルに基づいて、入力画像より表示順で後の参照画像に対して動き補償を行うことにより、L1予測を行う。中間予測画像生成部８７は、その結果生成されるL1予測の予測画像を中間予測画像としてメモリ８８に供給する。

メモリ８８は、キャッシュ２２の一部を構成する。メモリ８８は、中間予測画像生成部８７から中間予測画像として供給されるL1予測の予測画像を記憶する。

平均化部８９は、双方向予測モードごとに、メモリ８４とメモリ８８から中間予測画像を読み出し、平均化する。平均化部８９は、平均化された中間予測画像を双方向予測の予測画像として算出部９０に供給する。

以上のように、中間予測画像生成部８３、メモリ８４、中間予測画像生成部８７、メモリ８８、および平均化部８９は、各予測方向の整数画素精度の動きベクトルに基づいて入力画像の双方向予測の予測画像を生成する予測画像生成部として機能する。

算出部９０は、双方向予測モードごとに、平均化部８９から供給される予測画像と入力画像とに基づいて、コスト関数値を算出する。算出部９０は、各双方向予測モードの予測画像とコスト関数値を図３の選択部６４に供給する。

（効果の説明）
図５は、符号化装置１０による効果を説明する図である。

図５Ａに示すように、双方向予測時に、分数画素精度の動きベクトルを用いて動き補償が行われる場合、線形補間を用いて動き補償を行う必要がある。従って、例えば、入力画像のビット数が８ビットである場合、動き補償の結果生成されるL0予測の予測画像およびL1予測の予測画像のビット数は１４ビットになる。よって、双方向予測の予測画像を生成するためにL0予測の予測画像およびL1予測の予測画像を記憶するキャッシュに必要な記憶容量は大きくなる。

これに対して、符号化装置１０では、双方向予測時に整数画素精度の動きベクトルを用いて動き補償を行う。従って、図５Ｂに示すように、動き補償時に線形補間を行う必要がなくなり、８ビットの入力画像から、８ビットのL0予測の予測画像とL1予測の予測画像が生成される。よって、キャッシュ２２を構成するメモリ８４およびメモリ８８に必要な記憶容量は小さくなる。即ち、符号化装置１０では、双方向予測時に分数画素精度の動きベクトルが用いられる場合に比べて、双方向予測時に必要なキャッシュの記憶容量を削減することができる。

また、符号化装置１０では、双方向予測時に線形補間を行う必要がないため、双方向予測時に分数画素精度の動きベクトルが用いられる場合に比べて、双方向予測時の処理量を削減することができる。

（符号化装置の処理の説明）
図６および図７は、図１の符号化装置１０の符号化処理を説明するフローチャートである。

図７のステップＳ３１において、符号化部１１の画面並べ替えバッファ３２は、図１の外部メモリ１２から供給される入力画像を記憶する。

ステップＳ３２において、画面並べ替えバッファ３２は、記憶した表示の順番のフレームの画像を、GOP構造に応じて、符号化のための順番に並べ替える。画面並べ替えバッファ３２は、並べ替え後のフレーム単位の画像を、演算部３３、イントラ予測部４６、および動き予測・補償部４７に供給する。

ステップＳ３３において、イントラ予測部４６は、ＰＵ単位で候補となる全てのイントラ予測モードのイントラ予測処理を行う。また、イントラ予測部４６は、画面並べ替えバッファ３２から読み出された画像と、イントラ予測処理の結果生成される予測画像とに基づいて、候補となる全てのイントラ予測モードに対してコスト関数値を算出する。そして、イントラ予測部４６は、コスト関数値が最小となるイントラ予測モードを、最適イントラ予測モードに決定する。イントラ予測部４６は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、予測画像選択部４８に供給する。

また、動き予測・補償部４７は、ＰＵ単位で候補となる全てのインター予測モードの動き予測・補償処理を行う。また、動き予測・補償部４７は、画面並べ替えバッファ３２から供給される画像と予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター予測モードに決定する。そして、動き予測・補償部４７は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部４８に供給する。

ステップＳ３４において、予測画像選択部４８は、イントラ予測部４６および動き予測・補償部４７から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちのコスト関数値が最小となる方を、最適予測モードに決定する。そして、予測画像選択部４８は、最適予測モードの予測画像を、演算部３３および加算部４０に供給する。

ステップＳ３５において、予測画像選択部４８は、最適予測モードが最適インター予測モードであるかどうかを判定する。ステップＳ３５で最適予測モードが最適インター予測モードであると判定された場合、予測画像選択部４８は、最適インター予測モードで生成された予測画像の選択を動き予測・補償部４７に通知する。

そして、ステップＳ３６において、動き予測・補償部４７は、インター予測モード情報、動きベクトル情報、および参照画像を特定する情報を可逆符号化部３６に供給し、処理をステップＳ３８に進める。

一方、ステップＳ３５で最適予測モードが最適インター予測モードではないと判定された場合、即ち最適予測モードが最適イントラ予測モードである場合、予測画像選択部４８は、最適イントラ予測モードで生成された予測画像の選択をイントラ予測部４６に通知する。そして、ステップＳ３７において、イントラ予測部４６は、イントラ予測モード情報を可逆符号化部３６に供給し、処理をステップＳ３８に進める。

ステップＳ３８において、演算部３３は、画面並べ替えバッファ３２から供給される入力画像から、予測画像選択部４８から供給される予測画像を減算することにより符号化を行う。演算部３３は、その結果得られる画像を、残差情報として直交変換部３４に出力する。

ステップＳ３９において、直交変換部３４は、演算部３３からの残差情報に対してＴＵ単位で直交変換を施し、その結果得られる直交変換係数を量子化部３５に供給する。

ステップＳ４０において、量子化部３５は、直交変換部３４から供給される直交変換係数を量子化し、量子化された直交変換係数を可逆符号化部３６と逆量子化部３８に供給する。

図７のステップＳ４１において、逆量子化部３８は、量子化部３５から供給される量子化された係数を逆量子化し、その結果得られる直交変換係数を逆直交変換部３９に供給する。

ステップＳ４２において、逆直交変換部３９は、逆量子化部３８から供給される直交変換係数に対してＴＵ単位で逆直交変換を施し、その結果得られる残差情報を加算部４０に供給する。

ステップＳ４３において、加算部４０は、逆直交変換部３９から供給される残差情報と、予測画像選択部４８から供給される予測画像を加算し、局部的に復号を行う。加算部４０は、局部的に復号された画像をデブロックフィルタ４１とフレームメモリ４４に供給する。

ステップＳ４４において、デブロックフィルタ４１は、加算部４０から供給される局部的に復号された画像に対して、デブロックフィルタ処理を行う。デブロックフィルタ４１は、その結果得られる画像を適応オフセットフィルタ４２に供給する。

ステップＳ４５において、適応オフセットフィルタ４２は、デブロックフィルタ４１から供給される画像に対して、LCUごとに適応オフセットフィルタ処理を行う。適応オフセットフィルタ４２は、その結果得られる画像をフレームメモリ４４に供給する。また、適応オフセットフィルタ４２は、LCUごとに、オフセットフィルタ情報を可逆符号化部３６に供給する。

ステップＳ４６において、フレームメモリ４４は、適応オフセットフィルタ４２から供給される画像と加算部４０から供給される画像を蓄積する。フレームメモリ４４に蓄積されたフィルタ処理が行われていない画像のうちのＰＵに隣接する画素は、周辺画素としてスイッチ４５を介してイントラ予測部４６に供給される。一方、フレームメモリ４４に蓄積されたフィルタ処理が行われた画像は、外部メモリ１２に供給され、記憶される。また、フレームメモリ４４は、符号化済みの画像として外部メモリ１２から供給される参照画像を蓄積する。この参照画像は、スイッチ４５を介して動き予測・補償部４７に出力される。

ステップＳ４７において、可逆符号化部３６は、イントラ予測モード情報、または、インター予測モード情報、動きベクトル情報、および参照画像を特定する情報、並びにオフセットフィルタ情報を、符号化情報として可逆符号化する。

ステップＳ４８において、可逆符号化部３６は、量子化部３５から供給される量子化された直交変換係数を可逆符号化する。そして、可逆符号化部３６は、ステップＳ４７の処理で可逆符号化された符号化情報と可逆符号化された直交変換係数から、符号化データを生成し、蓄積バッファ３７に供給する。

ステップＳ４９において、蓄積バッファ３７は、可逆符号化部３６から供給される符号化データを、一時的に蓄積する。

ステップＳ５０において、レート制御部４９は、蓄積バッファ３７に蓄積された符号化データに基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部３５の量子化動作のレートを制御する。

ステップＳ５１において、蓄積バッファ３７は、記憶している符号化データを出力し、処理を終了する。

なお、図６および図７の符号化処理では、説明を簡単化するため、常に、イントラ予測処理と動き予測・補償処理が行われるようにしたが、実際には、ピクチャタイプ等によっていずれか一方のみが行われる場合もある。

図８は、図７のステップＳ３３の動き予測・補償処理の詳細を説明するフローチャートである。この動き予測・補償処理は、ＰＵ単位で行われる。

図８のステップＳ６１において、動き予測・補償部４７のL0予測部６１（図３）は、候補となるL0予測モードの動き予測・補償処理を行い、コスト関数値を算出するL0予測処理を行う。L0予測部６１は、各L0予測モードの予測画像とコスト関数値を選択部６４に供給する。

ステップＳ６２において、L1予測部６２は、候補となるL1予測モードの動き予測・補償処理を行い、コスト関数値を算出するL1予測処理を行う。L1予測部６２は、各L1予測モードの予測画像とコスト関数値を選択部６４に供給する。

ステップＳ６３において、双方向予測部６３は、候補となる双方向予測モードの動き予測・補償処理を行い、コスト関数値を算出する双方向予測処理を行う。この双方向予測処理の詳細は、後述する図９を参照して説明する。双方向予測部６３は、各双方向予測モードの予測画像とコスト関数値を選択部６４に供給する。

ステップＳ６４において、選択部６４は、L0予測部６１、L1予測部６２、および双方向予測部６３から供給されるコスト関数値のうちの最小のコスト関数値に対応するインター予測モードを、最適インター予測モードに決定する。

ステップＳ６５において、選択部６４は、最適インター予測モードの予測画像とコスト関数値を図２の予測画像選択部４８に出力し、処理を終了する。

図９は、図８のステップＳ６３の双方向予測処理の詳細を説明するフローチャートである。この双方向予測処理は、候補となる双方向予測モードごとに行われる。

図９のステップＳ７１において、双方向予測部６３の検出部８１（図４）は、前方向の1/4画素精度の動きベクトル検出処理を行い、検出された1/4画素精度の動きベクトルを精度変換部８２に供給する。

ステップＳ７２において、検出部８５は、後方向の1/4画素精度の動きベクトル検出処理を行い、検出された1/4画素精度の動きベクトルを精度変換部８６に供給する。

ステップＳ７３において、精度変換部８２は、検出部８１から供給される前方向の1/4画素精度の動きベクトルを整数画素精度の動きベクトルに変換し、中間予測画像生成部８３に供給する。

ステップＳ７４において、精度変換部８６は、検出部８５から供給される後方向の1/4画素精度の動きベクトルを整数画素精度の動きベクトルに変換し、中間予測画像生成部８７に供給する。

ステップＳ７５において、中間予測画像生成部８３は、精度変換部８２から供給される前方向の整数画素精度の動きベクトルに基づいて、入力画像より表示順で前の参照画像に対して動き補償を行うことにより、L0予測を行う。中間予測画像生成部８３は、その結果生成されるL0予測の予測画像をメモリ８４に供給する。

ステップＳ７６において、中間予測画像生成部８７は、精度変換部８６から供給される後方向の整数画素精度の動きベクトルに基づいて、入力画像より表示順で後の参照画像に対して動き補償を行うことにより、L1予測を行う。中間予測画像生成部８７は、その結果生成されるL1予測の予測画像をメモリ８８に供給する。

ステップＳ７７において、メモリ８４は、中間予測画像生成部８３から供給されるL0予測の予測画像を記憶する。ステップＳ７８において、メモリ８８は、中間予測画像生成部８７から供給されるL1予測の予測画像を記憶する。

ステップＳ７９において、平均化部８９は、メモリ８４に記憶されているL0予測の予測画像と、メモリ８８に記憶されているL1予測の予測画像を平均化する。平均化部８９は、平均化された予測画像を双方向予測の予測画像として算出部９０に供給する。

ステップＳ８０において、算出部９０は、平均化部８９から供給される予測画像と入力画像とに基づいて、コスト関数値を算出する。算出部９０は、予測画像とコスト関数値を図３の選択部６４に供給する。そして、処理は、図８のステップＳ６３に戻り、ステップＳ６４に進む。

以上のように、符号化装置１０は、双方向予測を行う場合、入力画像の分数画素精度の動きベクトルを整数画素精度の動きベクトルに変換し、整数画素精度の動きベクトルに基づいて双方向予測を行い、予測画像を生成する。従って、双方向予測の予測画像の生成に用いられるL0予測の予測画像とL1予測の予測画像のビット数を削減することができる。その結果、メモリ８４およびメモリ８８に必要な記憶容量を削減することができる。また、双方向予測時の処理量を削減することができる。

＜第２実施の形態＞
（符号化装置の第２実施の形態の構成例）
図１０は、本開示を適用した符号化装置の第２実施の形態の構成例を示すブロック図である。

図１０の符号化装置１００は、符号化部１０１、外部メモリ１０２、およびダウンコンバータ１０３により構成される。符号化装置１００は、外部メモリ１０２に記憶されている画像をHEVC方式で符号化する際、双方向予測時にL0予測またはL1予測のいずれかのみを行う。

具体的には、符号化装置１００の符号化部１０１は、処理部１１１とキャッシュ１１２により構成される。処理部１１１には、外部メモリ１０２に記憶されている符号化対象の画像が、入力画像としてキャッシュ１１２を介して入力される。処理部１１１は、入力画像に対して符号化処理を行う。

このとき、処理部１１１は、符号化処理の途中結果および最終結果を必要に応じてキャッシュ１１２に供給し、記憶させる。また、処理部１１１は、キャッシュ１１２に記憶されている、入力画像より表示順で前および後の1/4倍に縮小された参照画像（以下、縮小参照画像という）と1/4倍に縮小された入力画像（以下、縮小入力画像という）とに基づいて、双方向予測モード時に行う予測として、L0予測またはL１予測を選択する。そして、処理部１１１は、キャッシュ１１２に参照画像として記憶されている符号化済み画像を用いて、選択されたL0予測またはL1予測を行うことにより、双方向予測モードの予測を行う。

キャッシュ１１２は、処理部１１１から供給される符号化処理の途中結果と符号化済みの画像を一時的に記憶する。キャッシュ１１２は、記憶している符号化済みの画像を外部メモリ１０２に供給し、記憶させる。また、キャッシュ１１２は、外部メモリ１０２から参照画像として供給される符号化済みの画像を一時的に記憶する。キャッシュ１１２は、外部メモリ１０２から供給される縮小参照画像、入力画像、および縮小入力画像を一時的に記憶する。

外部メモリ１０２は、DRAMなどにより構成される。外部メモリ１０２は、入力画像とキャッシュ１１２から供給される符号化済みの画像を記憶する。また、外部メモリ１０２は、ダウンコンバータ１０３から供給される縮小入力画像と縮小参照画像を記憶する。

外部メモリ１０２は、記憶している入力画像と、その入力画像に対応する縮小入力画像をキャッシュ１１２に供給する。また、外部メモリ１０２は、記憶している入力画像より表示順で前または後の符号化済みの画像を、参照画像としてキャッシュ１１２に供給する。さらに、外部メモリ１０２は、縮小参照画像をキャッシュ１１２に供給する。

ダウンコンバータ１０３は、外部メモリ１０２から入力画像を読み出し、その入力画像を1/4倍に縮小する。そして、ダウンコンバータ１０３は、その結果得られる縮小入力画像を外部メモリ１０２に供給する。

また、ダウンコンバータ１０３は、外部メモリ１０２から入力画像より表示順で前および後の符号化済みの画像を参照画像として読み出し、その参照画像を1/4倍に縮小する。そして、ダウンコンバータ１０３は、その結果得られる縮小参照画像を外部メモリ１０２に供給する。

なお、ここでは、参照画像と入力画像の縮小率は1/4であるものとするが、参照画像の縮小率と入力画像の縮小率は、同一であれば、1/4に限定されない。

（符号化部の構成例）
図１１は、図１０の符号化部１０１の構成例を示すブロック図である。

図１１に示す構成のうち、図２の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図１１の符号化部１０１の構成は、フレームメモリ４４、動き予測・補償部４７の代わりに、フレームメモリ１３１、動き予測・補償部１３２が設けられる点が、図１の符号化部１１の構成と異なる。

フレームメモリ１３１は、適応オフセットフィルタ４２から供給される画像と、加算部４０から供給される画像を蓄積する。フレームメモリ１３１に蓄積されたフィルタ処理が行われていない画像のうちのＰＵに隣接する画素は、周辺画素としてスイッチ４５を介してイントラ予測部４６に供給される。

一方、フレームメモリ１３１に蓄積されたフィルタ処理が行われた画像は、符号化済みの画像として図１０の外部メモリ１０２に供給され、記憶される。また、フレームメモリ１３１は、外部メモリ１０２から供給される参照画像、縮小参照画像、および縮小入力画像を蓄積する。フレームメモリ１３１に蓄積された参照画像、縮小参照画像、および縮小入力画像は、スイッチ４５を介して動き予測・補償部１３２に出力される。

動き予測・補償部１３２は、ＰＵ単位で、候補となる全てのインター予測モードの動き予測・補償処理を行う。具体的には、動き予測・補償部１３２は、候補となるインター予測モードが双方向予測モードである場合、フレームメモリ１３１からスイッチ４５を介して供給される縮小参照画像と縮小入力画像に基づいて、連続する５個のLCUからなるLCU群単位で予測方向を決定する。

そして、動き予測・補償部１３２は、画面並べ替えバッファ３２から供給される入力画像と、フレームメモリ１３１からスイッチ４５を介して供給される、決定された予測方向の参照画像とに基づいて、1/4画素精度の動きベクトル検出する。

一方、動き予測・補償部１３２は、候補となるインター予測モードがL0予測モードまたはL1予測モードである場合、入力画像より表示順で前または後の参照画像と入力画像とに基づいて、1/4画素精度の動きベクトルを検出する。

動き予測・補償部１３２は、インター予測モードごとに、検出された1/4画素精度の動きベクトルに基づいて、参照画像に対して線形補間を用いた補償処理を施し、予測画像を生成する。そして、動き予測・補償部１３２は、インター予測モードごとに、入力画像と予測画像に基づいてコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター予測モードに決定する。動き予測・補償部１３２は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部４８に供給する。

また、動き予測・補償部１３２は、予測画像選択部４８から最適インター予測モードで生成された予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトル情報、参照画像を特定する情報などを可逆符号化部３６に出力する。

なお、第２実施の形態では、双方向予測時の予測方向の決定単位が、連続する５個のLCUからなるLCU群であるようにするが、連続する５個以外の数のLCUであるようにすることもできる。

（動き予測・補償部の構成例）
図１２は、図１１の動き予測・補償部１３２の構成例を示すブロック図である。

図１２に示す構成のうち、図３の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図１２の動き予測・補償部１３２の構成は、双方向予測部６３の代わりに双方向予測部１５１が設けられる点が、図３の動き予測・補償部４７の構成と異なる。

双方向予測部１５１は、入力画像の双方向予測を行わない場合、双方向予測モードが表す予測方向を前方向または後方向のみに制限した双方向予測モードの動き予測・補償処理を、その双方向予測モードの動き予測・補償処理として行う。具体的には、双方向予測部１５１は、図１１のフレームメモリ１３１からスイッチ４５を介して供給される縮小参照画像と縮小入力画像に基づいて、LCU群単位で予測方向を前方向または後方向に決定する。これにより、双方向予測部１５１（方向制限予測部）は、前方向予測または後方向予測のみを行うように制限する。

そして、双方向予測部１５１は、画面並べ替えバッファ３２から供給される入力画像と、フレームメモリ１３１からスイッチ４５を介して供給される、決定された予測方向の参照画像とに基づいて、1/4画素精度の動きベクトル検出する。双方向予測部１５１は、双方向予測モードごとに、検出された1/4画素精度の動きベクトルに基づいて、決定された予測方向の参照画像に対して線形補間を用いた補償処理を施す。

双方向予測部１５１は、その結果生成される予測画像と入力画像に基づいてコスト関数値を算出する。双方向予測部１５１は、各双方向予測モードの予測画像とコスト関数値を選択部６４に供給する。

（双方向予測部の構成例）
図１３は、図１２の双方向予測部１５１の構成例を示すブロック図である。

図１３の双方向予測部１５１は、縮小予測補償部１７１、特徴量算出部１７２、特徴量保持部１７３、決定部１７４、および予測部１７５により構成される。

双方向予測部１５１の縮小予測補償部１７１には、図１１のスイッチ４５を介して、LUC群単位で、入力画像より表示順で前および後の縮小参照画像と縮小入力画像とが供給される。縮小予測補償部１７１は、縮小参照画像と縮小入力画像を用いて、各LCU群の双方向の動き予測・補償処理を行う。

具体的には、縮小予測補償部１７１は、２次元の線形内挿適応フィルタを有する。縮小予測補償部１７１は、LCU群ごとに、縮小入力画像と縮小参照画像を用いて、各予測方向の1/4画素精度の動きベクトル検出処理を行う。縮小予測補償部１７１は、その結果得られる各予測方向の1/4画素精度の動きベクトルに基づいて、縮小参照画像に対して動き補償を行うことにより、縮小入力画像の双方向予測を行う。

縮小予測補償部１７１は、双方向予測の結果得られる縮小予測画像と縮小入力画像に基づいて、各予測方向の縮小予測画像のコスト関数値を算出する。縮小予測補償部１７１は、各予測方向の縮小入力画像の動きベクトルと縮小予測画像のコスト関数値を、特徴量算出部１７２に供給する。

特徴量算出部１７２は、予測方向ごとに、縮小予測補償部１７１から供給される縮小入力画像の動きベクトルと縮小予測画像のコスト関数値に基づいて、以下の式（３）により、特徴量を算出する。

式（３）において、Costmは、特徴量であり、SADは縮小入力画像のコスト関数値である。また、λは予め決められた係数であり、MVは縮小入力画像の動きベクトルである。

式（３）によれば、コスト関数値が小さいほど、即ち予測精度が高いほど、特徴量が小さくなる。また、動きベクトルが小さいほど、即ち符号化データに含まれる動きベクトル情報の情報量が少ないほど、特徴量が小さくなる。従って、特徴量が小さいほど、符号化効率は高い。

特徴量算出部１７２は、算出された各LCU群の前方向および後方向の特徴量を特徴量保持部１７３に供給し、前方向と後方向の動きベクトルを予測部１７５に供給する。特徴量保持部１７３は、特徴量算出部１７２から供給される各LCU群の前方向および後方向の特徴量を保持する。

決定部１７４は、LCU群ごとに、特徴量保持部１７３から前方向および後方向の特徴量を読み出す。決定部１７４は、読み出された前方向および後方向の特徴量に基づいて、双方向予測の代わりに行う予測の予測方向を決定する。

具体的には、決定部１７４は、前方向の特徴量と後方向の特徴量のうちの小さい方に対応する予測方向を、双方向予測の代わりに行う予測の予測方向に決定する。即ち、決定部１７４は、L0予測とL1予測のうちの符号化効率が高い方を、双方向予測の代わりに行う予測に決定する。決定部１７４は、各LCU群の予測方向を予測部１７５に供給する。

予測部１７５は、候補となる双方向予測モードごとに、双方向予測モードが表す予測方向を、予測部１７５から供給される予測方向に代えて、動き予測・補償処理を行う。具体的には、予測部１７５は、２次元の線形内挿適応フィルタを有する。予測部１７５は、図１１のスイッチ４５を介して供給される入力画像と、決定部１７４から供給される予測方向の参照画像とを用いて、1/4画素精度の動きベクトル検出処理を行う。このとき、予測部１７５は、特徴量算出部１７２から供給される前方向と後方向の動きベクトルのうちの、予測部１７５から供給される予測方向の動きベクトルを用いる。

予測部１７５は、1/4画素精度の動きベクトル検出処理により検出された1/4画素精度の動きベクトルに基づいて、参照画像に対して動き補償を行うことにより、決定部１７４から供給される予測方向の予測を行う。

予測部１７５は、双方向予測モードごとに、予測の結果得られる予測画像と入力画像に基づいて、コスト関数値を算出する。予測部１７５は、各双方向予測モードの予測画像とコスト関数値を図１２の選択部６４に供給する。

なお、図１３では、特徴量算出部１７２が特徴量保持部１７３の前段に設けられたが、後段に設けられるようにしてもよい。この場合、特徴量保持部１７３は、各LCU群の動きベクトルとコスト関数値を保持し、特徴量算出部１７２は、その動きベクトルとコスト関数値に基づいて各LCU群の特徴量を算出し、決定部１７４に供給する。

（双方向予測モードの予測の説明）
図１４は、図１０の符号化装置１００における双方向予測モードの予測を説明する図である。

図１４Ａに示すように、双方向予測モードの予測として双方向予測が行われる場合、外部メモリから、前方向の参照画像（L0参照画像）、後方向の参照画像（L1参照画像）、および入力画像が読み出され、キャッシュを構成するフレームメモリに記憶される。そして、フレームメモリに記憶されている前方向の参照画像、後方向の参照画像、および入力画像を用いて双方向予測が行われ、双方向予測の予測画像が生成される。

これに対して、符号化装置１００では、図１４Ｂに示すように、外部メモリ１０２から、決定部１７４で決定された予測方向の参照画像（L0/L1参照画像）と入力画像が読み出され、フレームメモリ１３１に記憶される。そして、フレームメモリ１３１に記憶されている参照画像と入力画像を用いてL0予測またはL1予測が行われ、L0予測またはL1予測の予測画像が生成される。

このように、符号化装置１００では、外部メモリ１０２から前方向と後方向のいずれか一方の参照画像のみが読み出され、フレームメモリ１３１に記憶される。従って、双方向予測モードの予測として双方向予測が行われる場合に比べて、双方向予測モードの予測時の外部メモリ１０２とキャッシュ１１２間の参照画像の読み出しにおける帯域を半分に削減することができる。

（双方向予測モードの予測方向の説明）
図１５は、図１３の決定部１７４で決定される予測方向を説明する図である。

なお、図１５において、正方形はLCUを表す。また、正方形内に記載されている「L0」および「L1」は、その正方形が表すLCUの双方向予測モードの予測が、それぞれ、L0予測、L1予測であることを表す。

双方向予測モードの予測方向がLCU単位で決定される場合、図１５Ａに示すように、LCUごとに、双方向予測モードの予測方向は異なる。従って、例えば、図１５Ａに示すように、隣接するLCUの双方向予測モードの予測方向が異なる場合、符号化部１０１は、外部メモリ１０２から、LCU単位で、その予測方向の参照画像を読み出す必要がある。

これに対して、決定部１７４は、LCU群ごとに双方向予測モードの予測方向を決定するので、各LCUの双方向予測モードの予測方向は、LCU群ごとに異なる。図１５Ｂの例では、LCU群１９１と、そのLCU群１９１に隣接するLCU群１９２の双方向予測モードの予測方向が異なっている。この場合、符号化部１０１は、外部メモリ１０２から、LCU群単位で、そのLCU群の双方向予測モードの予測方向の参照画像を読み出すことができる。

従って、符号化部１０１は、双方向予測モードの予測方向がLCU単位で決定される場合に比べて、外部メモリ１０２へのアクセス回数を削減することができる。

（符号化装置の処理の説明）
図１０の符号化装置１００の符号化処理は、図８のステップＳ６３の双方向予測処理、および、フレームメモリ４４に縮小参照画像と縮小入力画像が蓄積される点を除いて、図６および図７の符号化処理と同様である。従って、以下では、双方向予測処理についてのみ説明する。

図１６は、符号化装置１００の双方向予測処理を説明するフローチャートである。この双方向予測処理は、候補となる双方向予測モードごとに行われる。

図１６のステップＳ１１１乃至Ｓ１１８の処理は、LCU群単位で行われる。ステップＳ１１１において、双方向予測部１５１の縮小予測補償部１７１（図１３）は、図１１のスイッチ４５を介して供給される縮小参照画像と縮小入力画像を用いて、各予測方向の1/4画素精度の動きベクトル検出処理を行う。

ステップＳ１１２において、縮小予測補償部１７１は、ステップＳ１１１の処理により得られる各予測方向の1/4画素精度の動きベクトルに基づいて、縮小参照画像に対して動き補償を行うことにより、縮小入力画像の双方向予測を行う。

ステップＳ１１３において、縮小予測補償部１７１は、双方向予測の結果得られる縮小予測画像と縮小入力画像に基づいて、各予測方向の縮小予測画像のコスト関数値を算出する。縮小予測補償部１７１は、各予測方向の縮小入力画像の動きベクトルと縮小予測画像のコスト関数値を、特徴量算出部１７２に供給する。

ステップＳ１１４において、特徴量算出部１７２は、予測方向ごとに、縮小予測補償部１７１から供給される動きベクトルとコスト関数値に基づいて、上述した式（３）により、特徴量を算出する。特徴量算出部１７２は、算出された前方向および後方向の特徴量を特徴量保持部１７３に供給し、前方向と後方向の動きベクトルを予測部１７５に供給する。

ステップＳ１１５において、特徴量保持部１７３は、特徴量算出部１７２から供給される前方向および後方向の特徴量を保持する。

ステップＳ１１６において、決定部１７４は、特徴量保持部１７３に記憶されている前方向の特徴量が、後方向の特徴量より小さいかどうかを判定する。ステップＳ１１６で前方向の特徴量が後方向の特徴量より小さいと判定された場合、決定部１７４は、双方向予測モードの予測方向を前方向に決定し、予測部１７５に供給する。

一方、ステップＳ１１６で前方向の特徴量が後方向の特徴量より小さくはないと判定された場合、決定部１７４は、双方向予測モードの予測方向を後方向に決定し、予測部１７５に供給する。

ステップＳ１１７またはＳ１１８の処理後、処理はステップＳ１１９に進む。ステップＳ１１９乃至Ｓ１２１の処理は、ＰＵ単位で行われる。

ステップＳ１１９において、予測部１７５は、決定部１７４から供給される処理対象のＰＵに対応する予測方向の参照画像と、スイッチ４５を介して供給される入力画像とを用いて、1/4画素精度の動きベクトル検出処理を行う。

ステップＳ１２０において、予測部１７５は、ステップＳ１１９の処理により得られる1/4画素精度の動きベクトルに基づいて、参照画像に対して動き補償を行うことにより、決定部１７４から供給される予測方向の予測を行う。

ステップＳ１２１において、予測部１７５は、予測の結果得られる予測画像と入力画像に基づいて、コスト関数値を算出する。予測部１７５は、予測画像とコスト関数値を図１２の選択部６４に供給し、処理は終了する。

以上のように、符号化装置１００は、双方向予測の代わりに、L0予測またはL1予測を行う。従って、符号化部１０１と外部メモリ１０２の間の参照画像の読み出しにおける帯域を削減することができる。また、双方向予測モード時の参照画像の記憶に必要なフレームメモリ１３１の記憶容量を削減することができる。さらに、双方向予測モード時にL0予測およびL1予測のうちの一方のみを行えばよいので、双方向予測モード時の処理量を削減することができる。

また、符号化装置１００は、双方向予測の代わりに行う予測の予測方向を複数のLCU単位で決定するので、符号化部１０１から外部メモリ１０２へのアクセスの回数を削減することができる。

なお、特徴量は、コスト関数と動きベクトルのいずれか一方だけを用いて決定されてもよい。

＜第３実施の形態＞
（符号化装置の第３実施の形態の符号化部の構成例）
本開示を適用した符号化装置の第３実施の形態の構成は、符号化部を除いて、図１０の符号化装置１００の構成と同一である。従って、以下では、符号化部についてのみ説明する。

図１７は、本開示を適用した符号化装置の第３実施の形態の符号化部の構成例を示すブロック図である。

図１７に示す構成のうち、図１１の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図１７の符号化部２００の構成は、レート制御部４９、動き予測・補償部１３２の代わりに、レート制御部２０１、動き予測・補償部２０４が設けられる点、および、テーブル記憶部２０２、設定部２０３が新たに設けられる点が、図１１の符号化部１０１の構成と異なる。符号化部２００は、量子化パラメータ（QP）に応じて、動きベクトルの精度と予測方向を制限する。

具体的には、符号化部２００のレート制御部２０１は、蓄積バッファ３７に蓄積された符号化データに基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部３５の量子化動作のレートを制御する。また、レート制御部２０１は、量子化動作のレートの制御に用いられる量子化パラメータを設定部２０３に供給する。

テーブル記憶部２０２は、量子化パラメータに対応付けて動きベクトル制限情報と予測方向制限情報とが登録された制約テーブルを記憶する。動きベクトル制限情報とは、双方向予測時の動きベクトルの精度の整数精度への制限の有無を表す情報であり、予測方向制限情報とは、双方向予測モード時の予測方向の前方向または後方向への制限の有無を表す情報である。なお、予測方向制限情報が制限の有りを表す場合、双方向予測時は存在しないため、動きベクトル制限情報は登録されない。

設定部２０３は、レート制御部２０１から供給される量子化パラメータを画面単位で平均化し、量子化パラメータの平均値を計算する。設定部２０３は、量子化パラメータの平均値に基づいて、その平均値に対応付けて制約テーブルに登録されている動きベクトル制限情報と予測方向制限情報の読み出しを、テーブル記憶部２０２に要求する。

設定部２０３は、その要求に応じてテーブル記憶部２０２から読み出された動きベクトル制限情報に基づいて、双方向予測の予測画像の生成に用いる動きベクトルの精度を整数画素精度または分数画素精度に設定する。また、設定部２０３（決定部）は、要求に応じてテーブル記憶部２０２から読み出された予測方向制限情報に基づいて、双方向予測を行うかどうかを決定する。

設定部２０３は、設定された動きベクトルの精度と、双方向予測を行うかどうかを表す双方向予測情報とを、動き予測・補償部２０４に供給する。

動き予測・補償部２０４は、双方向予測情報が双方向予測を行わないこと表す場合、図１１の動き予測・補償部１３２と同様の動き予測・補償処理（以下、方向制限処理という）を行う。

また、双方向予測情報が双方向予測を行うことを表し、設定された動きベクトルの精度が整数画素精度である場合、動き予測・補償部２０４は、図２の動き予測・補償部４７と同様の動き予測・補償処理（以下、精度制限処理という）を行う。

さらに、双方向予測情報が双方向予測を行うことを表し、設定された動きベクトルの精度が分数画素精度である場合、動き予測・補償部２０４は、通常の動き予測・補償処理（以下、通常処理という）を行う。通常処理では、双方向予測モードの動き予測・補償処理として、動き予測・補償部１３２と同様に分数画素精度の動きベクトルが検出され、動き予測・補償部４７と同様に双方向予測が行われる。

動き予測・補償部２０４は、入力画像と、方向制限処理、精度制限処理、または通常処理により生成された予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出する。そして、動き予測・補償部２０４は、コスト関数値が最小となるインター予測モードを最適インター予測モードに決定する。動き予測・補償部２０４は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部４８に供給する。

また、動き予測・補償部２０４は、予測画像選択部４８から最適インター予測モードで生成された予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトル情報、参照画像を特定する情報などを可逆符号化部３６に出力する。

（制約テーブルの例）
図１８は、図１７のテーブル記憶部２０２に記憶される制約テーブルの例を示す図である。

量子化パラメータが低い場合、即ち符号化データのビットレートが高い場合、符号化性能の差が見えにくい。また、双方向予測モード時の予測方向の制限や、双方向予測時の動きベクトルの精度の制限によって生じる符号化効率の低下が、問題にならない。従って、双方向予測モード時の予測方向と双方向予測時の動きベクトルの精度を制限することにより、キャッシュ１１２の記憶容量を削減することが望ましい。

一方、量子化パラメータが高い場合、即ち符号化データのビットレートが低い場合、符号化性能の差が見えやすく、符号化効率の低下が問題になる。従って、双方向予測モード時の予測方向と双方向予測時の動きベクトルの精度を制限せずに、符号化性能や符号化効率を向上させることが望ましい。

従って、図１８の制限テーブルでは、量子化パラメータ（QP）が、0〜29、30〜39、40〜51の3段階に区分され、量子化パラメータが最も低い区分（0〜29）に対応付けて、制限の有りを表す予測方向制限情報が登録されている。また、量子化パラメータが２番目に低い区分（30〜39）に対応付けて、制限の無しを表す予測方向制限情報と制限の有りを表す動きベクトル制限情報とが登録されている。さらに、量子化パラメータが最も高い区分（40〜51）に対応付けて、制限の無しを表す予測方向制限情報と動きベクトル制限情報とが登録されている。

なお、図１８の量子化パラメータの区分は、用途（アプリケーション）ごとに区分が異なるように、各用途に対して想定される量子化パラメータに基づいて設定されている。

即ち、符号化部２００がビデオカメラなどに設けられ、撮影画像の符号化データがストレージに記憶される場合、撮影画像であるHD（High Definition）画像の符号化データに要求されるビットレートは、50Mbpsなどの高ビットレートである。そして、この場合、量子化パラメータは、30以下になることが多い。従って、量子化パラメータの最も低い区分は、0〜29になっている。

また、撮影画像の符号化データがネットワーク伝送される場合、撮影画像であるHD画像の符号化データに要求されるビットレートは、5Mbpsなどの低ビットレートである。そして、この場合、量子化パラメータは、30〜39になることが多い。従って、量子化パラメータの２番目に低い区分は、30〜39になっている。

さらに、符号化部２００が監視カメラなどに設けられ、符号化対象の撮影画像が監視カメラにより撮影された画像である場合、HD画像の符号化データに要求されるビットレートは、2Mbpsなどの超低ビットレートである。そして、この場合、量子化パラメータは、40以上になることが多い。従って、量子化パラメータの最も高い区分は、40〜51になっている。量子化パラメータの区分は、図１８の例に限定されない。

（符号化装置の処理の説明）
本開示を適用した符号化装置の第３実施の形態の符号化処理は、図６のステップＳ３３の動き予測・補償処理、および、必要に応じてフレームメモリ１３１に縮小参照画像と縮小入力画像が蓄積される点を除いて、図６および図７の符号化処理と同様である。従って、以下では、動き予測・補償処理についてのみ説明する。

図１９は、図１７の符号化部２００の動き予測・補償処理を説明するフローチャートである。

図１９のステップＳ１４１において、設定部２０３は、レート制御部２０１から供給される量子化パラメータを画面単位で平均化し、量子化パラメータの平均値を計算する。ステップＳ１４２において、設定部２０３は、テーブル記憶部２０２に記憶されている制約テーブルから、量子化パラメータの平均値に対応する動きベクトル制限情報と予測方向制限情報を読み出す。

ステップＳ１４３において、設定部２０３は、読み出された動きベクトル制限情報と予測方向制限情報に基づいて、双方向予測時の動きベクトルの精度と双方向予測情報を設定する。設定部２０３は、設定された動きベクトルの精度と双方向予測情報を動き予測・補償部２０４に供給する。

ステップＳ１４４において、動き予測・補償部２０４は、双方向予測情報が、双方向予測を行わないこと表しているかどうかを判定する。ステップＳ１４４で、双方向予測情報が双方向予測を行わないことを表していると判定された場合、処理はステップＳ１４６に進む。ステップＳ１４６において、動き予測・補償部２０４は、方向制限処理を行い、処理をステップＳ１４９に進める。

一方、ステップＳ１４４で、双方向予測情報が双方向予測を行うことを表していると判定された場合、処理はステップＳ１４５に進む。ステップＳ１４５において、動き予測・補償部２０４は、設定された動きベクトルの精度が整数画素精度であるかどうかを判定する。

ステップＳ１４５で設定された動きベクトルの精度が整数画素精度であると判定された場合、動き予測・補償部２０４は、精度制限処理を行い、処理をステップＳ１４９に進める。

また、ステップＳ１４５で設定された動きベクトルの精度が整数画素精度ではないと判定された場合、即ち設定された動きベクトルの精度が分数画素精度である場合、処理はステップＳ１４８に進む。

ステップＳ１４８において、動き予測・補償部２０４は、通常処理を行い、処理をステップＳ１４９に進める。

ステップＳ１４９において、動き予測・補償部２０４は、入力画像と、方向制限処理、精度制限処理、または通常処理により生成された予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出する。そして、動き予測・補償部２０４は、コスト関数値が最小となるインター予測モードを最適インター予測モードに決定する。

ステップＳ１５０において、動き予測・補償部２０４は、最適インター予測モードの予測画像とコスト関数値を予測画像選択部４８に出力する。そして、処理は終了する。

以上のように、符号化部２００は、量子化パラメータに基づいて、方向制限処理、精度制限処理、および通常処理を選択的に行う。従って、例えば、量子化パラメータが高い場合、即ち符号化性能の差が見えやすく、符号化効率の低下が問題になる場合、符号化部２００は、通常処理を行うことにより、画質および符号化効率を確保することができる。一方、量子化パラメータが低い場合、即ち符号化性能の差が見えにくく、符号化効率の低下が許容される場合、符号化部２００は、方向制限処理や精度制限処理を行うことにより、キャッシュ１１２の記憶容量を削減することができる。

なお、第３実施の形態では、量子化パラメータを画面単位で平均化するものとしたが、スライス単位やLCU単位で平均化するようにしてもよい。平均化がLCU単位で行われる場合、双方向予測情報が双方向予測を行わないことを表すときの双方向予測モード時の予測方向は、LCU群単位ではなく、LCU単位で決定される。

（制約テーブルの他の例）
上述した説明では、符号化部２００は、量子化パラメータに基づいて、方向制限処理、精度制限処理、および通常処理を選択的に行ったが、量子化パラメータ以外の情報に基づいて、方向制限処理、精度制限処理、および通常処理を選択的に行うようにしてもよい。

図２０は、フレームレートに基づいて方向制限処理、精度制限処理、および通常処理を選択的に行う場合の制約テーブルの例を示す図である。

フレームレートが高い場合、入力画像と参照画像の時間的距離が短いため、予測精度の低下による予測画像への影響が小さい。従って、双方向予測モード時の予測方向と双方向予測時の動きベクトルの精度を制限することにより、キャッシュ１１２の記憶容量を削減することが望ましい。

一方、フレームレートが低い場合、入力画像と参照画像の時間的距離が長いため、予測精度の低下による予測画像への影響が大きい。従って、双方向予測モード時の予測方向と双方向予測時の動きベクトルの精度を制限せずに、予測画像の精度を向上させることが望ましい。

従って、図２０の制限テーブルでは、フレームレートが、1p〜9p、10p〜29p、30p以上の3段階に区分され、フレームレートが最も高い区分（30p以上）に対応付けて、制限の有りを表す予測方向制限情報が登録されている。また、フレームレートが２番目に高い区分（10p〜29p）に対応付けて、制限の無しを表す予測方向制限情報と制限の有りを表す動きベクトル制限情報とが登録されている。さらに、フレームレートが最も低い区分（1p〜9p）に対応付けて、制限の無しを表す予測方向制限情報と動きベクトル制限情報とが登録されている。

なお、図２０のフレームレートの区分は、用途（アプリケーション）ごとに区分が異なるように、各用途に対して想定される符号化対象のフレームレートに基づいて設定されている。

即ち、符号化部２００がビデオカメラなどに設けられ、撮影画像の符号化データがストレージに記憶される場合、符号化対象の撮影画像のフレームレートは、30pや60pなどの高フレームレートである。従って、フレームレートの最も高い区分は、30p以上になっている。

また、撮影画像の符号化データがネットワーク伝送される場合、符号化対象の撮影画像のフレームレートは、15pなどの低フレームレートである。従って、フレームレートの２番目に高い区分は、10p〜29pになっている。

さらに、符号化部２００が監視カメラなどに設けられ、符号化対象の撮影画像が監視カメラにより撮影された画像である場合、符号化対象の撮影画像のフレームレートは、5pなどの超低フレームレートである。従って、フレームレートの最も低い区分は、1p〜9pになっている。フレームレートの区分は、図２０の例に限定されない。

テーブル記憶部２０２に図２０の制約テーブルが記憶される場合、設定部２０３にはレート制御部２０１から量子化ビットレートが供給されない。そして、設定部２０３は、ユーザ等により入力されたフレームレートに基づいて、そのフレームレートに対応する動きベクトル制限情報と予測方向制限情報を制約テーブルから読み出す。設定部２０３は、読み出された動きベクトル制限情報と予測方向制限情報に基づいて、双方向予測時の動きベクトルの精度と双方向予測情報を設定する。

以上により、フレームレートが低い場合、即ち予測精度の低下による予測画像への影響が大きい場合、通常処理が行われるので、予測精度を確保することができる。一方、フレームレートが高い場合、即ち予測精度の低下による予測画像への影響が小さい場合、方向制限処理や精度制限処理が行われるので、キャッシュ１１２の記憶容量を削減することができる。

図２１は、解像度に基づいて方向制限処理、精度制限処理、および通常処理を選択的に行う場合の制約テーブルの例を示す図である。

解像度が低い場合、画像の密度が低くなる（絵柄が粗くなる）ため、予測ベクトルの精度の予測画像への影響が小さい。従って、双方向予測モード時の予測方向と双方向予測時の動きベクトルの精度を制限することにより、キャッシュ１１２の記憶容量を削減することが望ましい。

一方、解像度が高い場合、画像の密度が高くなる（絵柄が細かくなる）場合が多いため、予測ベクトルの精度の予測画像への影響が大きい。従って、双方向予測モード時の予測方向と双方向予測時の動きベクトルの精度を制限せずに、予測画像の精度を向上させることが望ましい。

従って、図２１の制限テーブルでは、解像度が、VGA（Video Graphics Array）解像度、HD解像度、4K解像度の3段階に区分され、解像度が最も低い区分（VGA解像度）に対応付けて、制限の有りを表す予測方向制限情報が登録されている。また、解像度が２番目に低い区分（HD解像度）に対応付けて、制限の無しを表す予測方向制限情報と制限の有りを表す動きベクトル制限情報とが登録されている。さらに、解像度が最も高い区分（4K解像度）に対応付けて、制限の無しを表す予測方向制限情報と動きベクトル制限情報とが登録されている。

なお、図２１の解像度の区分は、用途（アプリケーション）ごとに区分が異なるように、各用途に対して想定される符号化対象の解像度に基づいて設定されている。

即ち、符号化部２００がビデオカメラなどに設けられ、撮影画像の符号化データがストレージに記憶される場合、符号化対象の撮影画像の解像度は、例えば4K（QFHD（Quad Full High Definition））解像度などの高解像度である。従って、解像度の最も高い区分は、4K解像度になっている。

また、撮影画像の符号化データがネットワーク伝送される場合、符号化対象の撮影画像の解像度は、HD解像度などの中解像度である。従って、解像度の２番目に高い区分は、HD解像度になっている。

さらに、符号化部２００が監視カメラなどに設けられ、符号化対象の撮影画像が監視カメラにより撮影された画像である場合、符号化対象の撮影画像は、VGA解像度などの低解像度である。従って、解像度の最も低い区分は、VGA解像度になっている。解像度の区分は、図２１の例に限定されない。

テーブル記憶部２０２に図２１に示した制約テーブルが記憶される場合、設定部２０３にはレート制御部２０１から量子化ビットレートが供給されない。そして、設定部２０３は、ユーザ等により入力された解像度に基づいて、その解像度に対応する動きベクトル制限情報と予測方向制限情報を制約テーブルから読み出す。設定部２０３は、読み出された動きベクトル制限情報と予測方向制限情報に基づいて、双方向予測時の動きベクトルの精度と双方向予測情報を設定する。

以上により、解像度が高い場合、即ち予測ベクトルの精度の予測画像への影響が大きい場合、通常処理が行われるので、予測ベクトルの精度を確保することができる。一方、解像度が低い場合、即ち予測ベクトルの精度の予測画像への影響が小さい場合、方向制限処理や精度制限処理が行われるので、キャッシュ１１２の記憶容量を削減することができる。

なお、第３実施の形態では、量子化パラメータ、フレームレート、または解像度に基づいて方向制限処理、精度制限処理、および通常処理が選択的に行われたが、用途（アプリケーション）に応じて方向制限処理、精度制限処理、および通常処理が選択的に行われるようにしてもよい。

＜復号装置＞
（復号装置の構成例）
図２２は、符号化装置の第１乃至第３実施の形態により生成された符号化データを復号する復号装置２２０の構成例を示すブロック図である。

図２２の復号装置２２０は、蓄積バッファ２２１、可逆復号部２２２、逆量子化部２２３、逆直交変換部２２４、加算部２２５、デブロックフィルタ２２６、適応オフセットフィルタ２２７、および画面並べ替えバッファ２２９を有する。また、復号装置２２０は、D/A変換部２３０、フレームメモリ２３１、スイッチ２３２、イントラ予測処理部２３３、動き補償部２３４、およびスイッチ２３５を有する。

復号装置２２０の蓄積バッファ２２１は、符号化装置１０または符号化装置１００から符号化データを受け取り、蓄積する。蓄積バッファ２２１は、蓄積されている符号化データを可逆復号部２２２に供給する。

可逆復号部２２２は、蓄積バッファ２２１からの符号化データに対して、図２の可逆符号化部３６の可逆符号化に対応する、可変長復号や、算術復号等の可逆復号を施すことで、量子化された直交変換係数と符号化情報を得る。可逆復号部２２２は、量子化された直交変換係数を逆量子化部２２３に供給する。また、可逆復号部２２２は、符号化情報としてのイントラ予測モード情報などをイントラ予測処理部２３３に供給する。可逆復号部２２２は、動きベクトル情報、インター予測モード情報、参照画像を特定する情報などを動き補償部２３４に供給する。

さらに、可逆復号部２２２は、符号化情報としてのイントラ予測モード情報またはインター予測モード情報をスイッチ２３５に供給する。可逆復号部２２２は、符号化情報としてのオフセットフィルタ情報を適応オフセットフィルタ２２７に供給する。

逆量子化部２２３、逆直交変換部２２４、加算部２２５、デブロックフィルタ２２６、適応オフセットフィルタ２２７、フレームメモリ２３１、スイッチ２３２、イントラ予測処理部２３３、および動き補償部２３４は、図２の逆量子化部３８、逆直交変換部３９、加算部４０、デブロックフィルタ４１、適応オフセットフィルタ４２、フレームメモリ４４（１３１）、スイッチ４５、イントラ予測部４６、および動き予測・補償部４７（１３２）とそれぞれ同様の処理を行い、これにより、画像が復号される。

具体的には、逆量子化部２２３は、可逆復号部２２２からの量子化された直交変換係数を逆量子化し、その結果得られる直交変換係数を逆直交変換部２２４に供給する。

逆直交変換部２２４は、逆量子化部２２３からの直交変換係数に対してＴＵ単位で逆直交変換を行う。逆直交変換部２２４は、逆直交変換の結果得られる残差情報を加算部２２５に供給する。

加算部２２５は、逆直交変換部２２４から供給される残差情報と、スイッチ２３５から供給される予測画像を加算することにより、復号を行う。加算部２２５は、復号の結果得られる画像をデブロックフィルタ２２６とフレームメモリ２３１に供給する。

なお、スイッチ２３５から予測画像が供給されない場合、加算部２２５は、逆直交変換部２２４から供給される残差情報である画像を復号の結果得られる画像として、デブロックフィルタ２２６とフレームメモリ２３１に供給する。

デブロックフィルタ２２６は、加算部２２５から供給される画像に対してデブロックフィルタ処理を行い、その結果得られる画像を適応オフセットフィルタ２２７に供給する。

適応オフセットフィルタ２２７は、LCUごとに、可逆復号部２２２からのオフセットフィルタ情報が表すオフセットを用いて、デブロックフィルタ処理後の画像に対して、オフセットフィルタ情報が表す種類の適応オフセットフィルタ処理を行う。適応オフセットフィルタ２２７は、適応オフセットフィルタ処理後の画像を画面並べ替えバッファ２２９とフレームメモリ２３１に供給する。

画面並べ替えバッファ２２９は、適応オフセットフィルタ２２７から供給される画像をフレーム単位で記憶する。画面並べ替えバッファ２２９は、記憶した符号化のための順番のフレーム単位の画像を、元の表示の順番に並び替え、D/A変換部２３０に供給する。

D/A変換部２３０は、画面並べ替えバッファ２２９から供給されるフレーム単位の画像をD/A変換し、出力する。

フレームメモリ２３１は、適応オフセットフィルタ２２７から供給される画像と加算部２２５から供給される画像を蓄積する。フレームメモリ２３１に蓄積されたフィルタ処理が行われていない画像のうちのＰＵに隣接する画素は、周辺画素としてスイッチ２３２を介してイントラ予測処理部２３３に供給される。一方、フレームメモリ２３１に蓄積されたフィルタ処理が行われた画像は、参照画像として、スイッチ２３２を介して動き補償部２３４に供給される。

イントラ予測処理部２３３は、ＰＵ単位で、フレームメモリ２３１からスイッチ２３２を介して読み出された周辺画素を用いて、可逆復号部２２２から供給されるイントラ予測モード情報が示す最適イントラ予測モードのイントラ予測処理を行う。イントラ予測処理部２３３は、その結果生成される予測画像をスイッチ２３５に供給する。

動き補償部２３４は、フレームメモリ２３１からスイッチ２３２を介して、可逆復号部２２２から供給される参照画像を特定する情報により特定される参照画像を読み出す。動き補償部２３４は、読み出された参照画像と可逆復号部２２２から供給される動きベクトルとを用いて、ＰＵ単位で、可逆復号部２２２から供給されるインター予測モード情報が示す最適インター予測モードの動き補償処理を行う。動き補償部２３４は、その結果生成される予測画像をスイッチ２３５に供給する。

スイッチ２３５は、可逆復号部２２２からイントラ予測モード情報が供給された場合、イントラ予測処理部２３３から供給される予測画像を加算部２２５に供給する。一方、可逆復号部２２２からインター予測モード情報が供給された場合、スイッチ２３５は、動き補償部２３４から供給される予測画像を加算部２２５に供給する。

＜第４実施の形態＞
（本開示を適用したコンピュータの説明）
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

図２３は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

コンピュータ８００において、CPU（Central Processing Unit）８０１，ROM（Read Only Memory）８０２，RAM（Random Access Memory）８０３は、バス８０４により相互に接続されている。

バス８０４には、さらに、入出力インタフェース８０５が接続されている。入出力インタフェース８０５には、入力部８０６、出力部８０７、記憶部８０８、通信部８０９、及びドライブ８１０が接続されている。

入力部８０６は、キーボード、マウス、マイクロホンなどよりなる。出力部８０７は、ディスプレイ、スピーカなどよりなる。記憶部８０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部８０９は、ネットワークインタフェースなどよりなる。ドライブ８１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア８１１を駆動する。

以上のように構成されるコンピュータ８００では、CPU８０１が、例えば、記憶部８０８に記憶されているプログラムを、入出力インタフェース８０５及びバス８０４を介して、RAM８０３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ８００（CPU８０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータ８００では、プログラムは、リムーバブルメディア８１１をドライブ８１０に装着することにより、入出力インタフェース８０５を介して、記憶部８０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部８０９で受信し、記憶部８０８にインストールすることができる。その他、プログラムは、ROM８０２や記憶部８０８に、あらかじめインストールしておくことができる。

なお、コンピュータ８００が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

＜テレビジョン装置＞
図２４は、本開示を適用した符号化装置により生成された符号化データを含む符号化ビットストリームを取得するテレビジョン装置の概略構成を例示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース部９０９を有している。さらに、テレビジョン装置９００は、制御部９１０、ユーザインタフェース部９１１等を有している。

チューナ９０２は、アンテナ９０１で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ビットストリームをデマルチプレクサ９０３に出力する。

デマルチプレクサ９０３は、符号化ビットストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ９０４に出力する。また、デマルチプレクサ９０３は、ＥＰＧ（Electronic Program Guide）等のデータのパケットを制御部９１０に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。

デコーダ９０４は、パケットの復号化処理を行い、復号処理化によって生成された映像データを映像信号処理部９０５、音声データを音声信号処理部９０７に出力する。

映像信号処理部９０５は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部９０５は、表示部９０６に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部９０５は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部９０５は、このようにして生成した映像データに基づいて駆動信号を生成して表示部９０６を駆動する。

表示部９０６は、映像信号処理部９０５からの駆動信号に基づき表示デバイス（例えば液晶表示素子等）を駆動して、番組の映像などを表示させる。

音声信号処理部９０７は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのＤ／Ａ変換処理や増幅処理を行いスピーカ９０８に供給することで音声出力を行う。

外部インタフェース部９０９は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。

制御部９１０にはユーザインタフェース部９１１が接続されている。ユーザインタフェース部９１１は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９１０に供給する。

制御部９１０は、ＣＰＵ(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータ、ＥＰＧデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置９００の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、テレビジョン装置９００がユーザ操作に応じた動作となるように各部を制御する。

なお、テレビジョン装置９００では、チューナ９０２、デマルチプレクサ９０３、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース部９０９等と制御部９１０を接続するためバス９１２が設けられている。

＜第５実施の形態＞
（携帯電話機の構成例）
図２５は、本開示を適用した携帯電話機の概略構成を例示している。携帯電話機９２０は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１を有している。これらは、バス９３３を介して互いに接続されている。

また、通信部９２２にはアンテナ９２１が接続されており、音声コーデック９２３には、スピーカ９２４とマイクロホン９２５が接続されている。さらに制御部９３１には、操作部９３２が接続されている。

携帯電話機９２０は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

音声通話モードにおいて、マイクロホン９２５で生成された音声信号は、音声コーデック９２３で音声データへの変換やデータ圧縮が行われて通信部９２２に供給される。通信部９２２は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部９２２は、送信信号をアンテナ９２１に供給して図示しない基地局へ送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック９２３に供給する。音声コーデック９２３は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ９２４に出力する。

また、データ通信モードにおいて、メール送信を行う場合、制御部９３１は、操作部９３２の操作によって入力された文字データを受け付けて、入力された文字を表示部９３０に表示する。また、制御部９３１は、操作部９３２におけるユーザ指示等に基づいてメールデータを生成して通信部９２２に供給する。通信部９２２は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部９３０に供給して、メール内容の表示を行う。

なお、携帯電話機９２０は、受信したメールデータを、記録再生部９２９で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、ＲＡＭや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Universal Serial Bus）メモリ、またはメモリカード等のリムーバブルメディアである。

データ通信モードにおいて画像データを送信する場合、カメラ部９２６で生成された画像データを、画像処理部９２７に供給する。画像処理部９２７は、画像データの符号化処理を行い、符号化データを生成する。

多重分離部９２８は、画像処理部９２７で生成された符号化データと、音声コーデック９２３から供給された音声データを所定の方式で多重化して通信部９２２に供給する。通信部９２２は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部９２８に供給する。多重分離部９２８は、多重化データの分離を行い、符号化データを画像処理部９２７、音声データを音声コーデック９２３に供給する。画像処理部９２７は、符号化データの復号化処理を行い、画像データを生成する。この画像データを表示部９３０に供給して、受信した画像の表示を行う。音声コーデック９２３は、音声データをアナログ音声信号に変換してスピーカ９２４に供給して、受信した音声を出力する。

このように構成された携帯電話装置では、画像処理部９２７に本願の符号化装置（符号化方法）の機能が設けられる。このため、双方向予測時に必要な記憶容量を削減することができる。

＜第６実施の形態＞
（記録再生装置の構成例）
図２６は、本開示を適用した記録再生装置の概略構成を例示している。記録再生装置９４０は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置９４０は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置９４０は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。

記録再生装置９４０は、チューナ９４１、外部インタフェース部９４２、エンコーダ９４３、ＨＤＤ（Hard Disk Drive）部９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen Display）部９４８、制御部９４９、ユーザインタフェース部９５０を有している。

チューナ９４１は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ９４１は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ９４６に出力する。

外部インタフェース部９４２は、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース部、ＵＳＢインタフェース、フラッシュメモリインタフェース等の少なくともいずれかで構成されている。外部インタフェース部９４２は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。

エンコーダ９４３は、外部インタフェース部９４２から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームをセレクタ９４６に出力する。

ＨＤＤ部９４４は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。

ディスクドライブ９４５は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばＤＶＤディスク（ＤＶＤ−Ｖｉｄｅｏ、ＤＶＤ−ＲＡＭ、ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）やＢｌｕ−ｒａｙ（登録商標）ディスク等である。

セレクタ９４６は、映像や音声の記録時には、チューナ９４１またはエンコーダ９４３からのいずれかの符号化ビットストリームを選択して、ＨＤＤ部９４４やディスクドライブ９４５のいずれかに供給する。また、セレクタ９４６は、映像や音声の再生時に、ＨＤＤ部９４４またはディスクドライブ９４５から出力された符号化ビットストリームをデコーダ９４７に供給する。

デコーダ９４７は、符号化ビットストリームの復号化処理を行う。デコーダ９４７は、復号処理化を行うことにより生成された映像データをＯＳＤ部９４８に供給する。また、デコーダ９４７は、復号処理化を行うことにより生成された音声データを出力する。

ＯＳＤ部９４８は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ９４７から出力された映像データに重畳して出力する。

制御部９４９には、ユーザインタフェース部９５０が接続されている。ユーザインタフェース部９５０は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９４９に供給する。

制御部９４９は、ＣＰＵやメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置９４０の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、記録再生装置９４０がユーザ操作に応じた動作となるように各部を制御する。

このように構成された記録再生装置では、エンコーダ９４３に本願の符号化装置（符号化方法）の機能が設けられる。このため、双方向予測時に必要な記憶容量を削減することができる。

＜第７実施の形態＞
（撮像装置の構成例）
図２７は、本開示を適用した撮像装置の概略構成を例示している。撮像装置９６０は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、カメラ信号処理部９６３、画像データ処理部９６４、表示部９６５、外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０を有している。また、制御部９７０には、ユーザインタフェース部９７１が接続されている。さらに、画像データ処理部９６４や外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０等は、バス９７２を介して接続されている。

光学ブロック９６１は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤまたはＣＭＯＳイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部９６３に供給する。

カメラ信号処理部９６３は、撮像部９６２から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部９６３は、カメラ信号処理後の画像データを画像データ処理部９６４に供給する。

画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データの符号化処理を行う。画像データ処理部９６４は、符号化処理を行うことにより生成された符号化データを外部インタフェース部９６６やメディアドライブ９６８に供給する。また、画像データ処理部９６４は、外部インタフェース部９６６やメディアドライブ９６８から供給された符号化データの復号化処理を行う。画像データ処理部９６４は、復号化処理を行うことにより生成された画像データを表示部９６５に供給する。また、画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データを表示部９６５に供給する処理や、ＯＳＤ部９６９から取得した表示用データを、画像データに重畳させて表示部９６５に供給する。

ＯＳＤ部９６９は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部９６４に出力する。

外部インタフェース部９６６は、例えば、ＵＳＢ入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部９６６には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部９６６は、ＬＡＮやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部９７０は、例えば、ユーザインタフェース部９７１からの指示にしたがって、メディアドライブ９６８から符号化データを読み出し、それを外部インタフェース部９６６から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部９７０は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部９６６を介して取得し、それを画像データ処理部９６４に供給したりすることができる。

メディアドライブ９６８で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触IC（Integrated Circuit）カード等であってもよい。

また、メディアドライブ９６８と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやＳＳＤ（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

制御部９７０は、ＣＰＵを用いて構成されている。メモリ部９６７は、制御部９７０により実行されるプログラムや制御部９７０が処理を行う上で必要な各種のデータ等を記憶する。メモリ部９６７に記憶されているプログラムは、撮像装置９６０の起動時などの所定タイミングで制御部９７０により読み出されて実行される。制御部９７０は、プログラムを実行することで、撮像装置９６０がユーザ操作に応じた動作となるように各部を制御する。

このように構成された撮像装置では、画像データ処理部９６４に本願の符号化装置（符号化方法）の機能が設けられる。このため、双方向予測時に必要な記憶容量を削減することができる。

＜第８実施の形態＞
（実施のその他の例）
以上において本開示を適用する装置の例を説明したが、本開示は、これに限らず、このような装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。

（ビデオセットの構成例）
本開示をセットとして実施する場合の例について、図２８を参照して説明する。図２８は、本開示を適用したビデオセットの概略的な構成の一例を示している。

近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

図２８に示されるビデオセット１３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

図２８に示されるように、ビデオセット１３００は、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４等のモジュール群と、コネクティビティ１３２１、カメラ１３２２、およびセンサ１３２３等の関連する機能を有するデバイスとを有する。

モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

図２８の例の場合、ビデオモジュール１３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ、ビデオプロセッサ、ブロードバンドモデム１３３３、およびRFモジュール１３３４を有する。

プロセッサは、所定の機能を有する構成をSoC（System On a Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large Scale Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

図２８のアプリケーションプロセッサ１３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ１３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ１３３２等、ビデオモジュール１３１１内外の構成を必要に応じて制御することもできる。

ビデオプロセッサ１３３２は、画像の符号化・復号（その一方若しくは両方）に関する機能を有するプロセッサである。

ブロードバンドモデム１３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（またはその両方）の広帯域通信に関する処理を行うプロセッサ（若しくはモジュール）である。例えば、ブロードバンドモデム１３３３は、送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。例えば、ブロードバンドモデム１３３３は、ビデオプロセッサ１３３２が処理する画像データや画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報をデジタル変調・復調することができる。

RFモジュール１３３４は、アンテナを介して送受信されるRF（Radio Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール１３３４は、ブロードバンドモデム１３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール１３３４は、フロントエンドモジュール１３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

なお、図２８において点線１３４１に示されるように、アプリケーションプロセッサ１３３１とビデオプロセッサ１３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

外部メモリ１３１２は、ビデオモジュール１３１１の外部に設けられた、ビデオモジュール１３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ１３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic Random Access Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

パワーマネージメントモジュール１３１３は、ビデオモジュール１３１１（ビデオモジュール１３１１内の各構成）への電力供給を管理し、制御する。

フロントエンドモジュール１３１４は、RFモジュール１３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図２８に示されるように、フロントエンドモジュール１３１４は、例えば、アンテナ部１３５１、フィルタ１３５２、および増幅部１３５３を有する。

アンテナ部１３５１は、無線信号を送受信するアンテナおよびその周辺の構成を有する。アンテナ部１３５１は、増幅部１３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ１３５２に供給する。フィルタ１３５２は、アンテナ部１３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール１３３４に供給する。増幅部１３５３は、RFモジュール１３３４から供給されるRF信号を増幅し、アンテナ部１３５１に供給する。

コネクティビティ１３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ１３２１の物理構成は、任意である。例えば、コネクティビティ１３２１は、ブロードバンドモデム１３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

例えば、コネクティビティ１３２１が、Bluetooth（登録商標）、IEEE 802.11（例えばWi-Fi（Wireless Fidelity、登録商標））、NFC（Near Field Communication）、IrDA（InfraRed Data Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ１３２１が、USB（Universal Serial Bus）、HDMI（登録商標）（High-Definition Multimedia Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ１３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

なお、コネクティビティ１３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ１３２１が、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid State Drive）、NAS（Network Attached Storage）等も含む）を有するようにしてもよい。また、コネクティビティ１３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

カメラ１３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ１３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ１３３２に供給されて符号化される。

センサ１３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ１３２３により検出されたデータは、例えば、アプリケーションプロセッサ１３３１に供給されてアプリケーション等により利用される。

以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

以上のような構成のビデオセット１３００において、後述するようにビデオプロセッサ１３３２に本開示を適用することができる。したがって、ビデオセット１３００は、本開示を適用したセットとして実施することができる。

（ビデオプロセッサの構成例）
図２９は、本開示を適用したビデオプロセッサ１３３２（図２８）の概略的な構成の一例を示している。

図２９の例の場合、ビデオプロセッサ１３３２は、ビデオ信号およびオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータおよびオーディオデータを復号し、ビデオ信号およびオーディオ信号を再生出力する機能とを有する。

図２９に示されるように、ビデオプロセッサ１３３２は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、フレームメモリ１４０５、およびメモリ制御部１４０６を有する。また、ビデオプロセッサ１３３２は、エンコード・デコードエンジン１４０７、ビデオES（Elementary Stream）バッファ１４０８Ａおよび１４０８Ｂ、並びに、オーディオESバッファ１４０９Ａおよび１４０９Ｂを有する。さらに、ビデオプロセッサ１３３２は、オーディオエンコーダ１４１０、オーディオデコーダ１４１１、多重化部（MUX（Multiplexer））１４１２、逆多重化部（DMUX（Demultiplexer））１４１３、およびストリームバッファ１４１４を有する。

ビデオ入力処理部１４０１は、例えばコネクティビティ１３２１（図２８）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部１４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部１４０３は、画像データに対して、ビデオ出力処理部１４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部１４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部１４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ１３２１（図２８）等に出力する。

フレームメモリ１４０５は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、およびエンコード・デコードエンジン１４０７によって共用される画像データ用のメモリである。フレームメモリ１４０５は、例えばDRAM等の半導体メモリとして実現される。

メモリ制御部１４０６は、エンコード・デコードエンジン１４０７からの同期信号を受けて、アクセス管理テーブル１４０６Ａに書き込まれたフレームメモリ１４０５へのアクセススケジュールに従ってフレームメモリ１４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル１４０６Ａは、エンコード・デコードエンジン１４０７、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３等で実行される処理に応じて、メモリ制御部１４０６により更新される。

エンコード・デコードエンジン１４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン１４０７は、フレームメモリ１４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ１４０８Ａに順次書き込む。また、例えば、ビデオESバッファ１４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ１４０５に順次書き込む。エンコード・デコードエンジン１４０７は、これらの符号化や復号において、フレームメモリ１４０５を作業領域として使用する。また、エンコード・デコードエンジン１４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部１４０６に対して同期信号を出力する。

ビデオESバッファ１４０８Ａは、エンコード・デコードエンジン１４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。ビデオESバッファ１４０８Ｂは、逆多重化部（DMUX）１４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン１４０７に供給する。

オーディオESバッファ１４０９Ａは、オーディオエンコーダ１４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。オーディオESバッファ１４０９Ｂは、逆多重化部（DMUX）１４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ１４１１に供給する。

オーディオエンコーダ１４１０は、例えばコネクティビティ１３２１（図２８）等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode number 3）方式等の所定の方式で符号化する。オーディオエンコーダ１４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ１４０９Ａに順次書き込む。オーディオデコーダ１４１１は、オーディオESバッファ１４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ１３２１（図２８）等に供給する。

多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）１４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）１４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

逆多重化部（DMUX）１４１３は、多重化部（MUX）１４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）１４１３は、ストリームバッファ１４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）１４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）１４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等（いずれも図２８）から供給されたトランスポートストリームを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１により（図２８）各種記録媒体から読み出されたファイルデータを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

ストリームバッファ１４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図２８）等に供給する。

また、例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１（図２８）等に供給し、各種記録媒体に記録させる。

さらに、ストリームバッファ１４１４は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等（いずれも図２８）を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

また、ストリームバッファ１４１４は、例えばコネクティビティ１３２１（図２８）等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

次に、このような構成のビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１（図２８）等からビデオプロセッサ１３３２に入力されたビデオ信号は、ビデオ入力処理部１４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ１４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部１４０２または第２画像拡大縮小部１４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換および拡大縮小処理が行われ、再びフレームメモリ１４０５に書き込まれる。この画像データは、エンコード・デコードエンジン１４０７によって符号化され、ビデオストリームとしてビデオESバッファ１４０８Ａに書き込まれる。

また、コネクティビティ１３２１（図２８）等からビデオプロセッサ１３３２に入力されたオーディオ信号は、オーディオエンコーダ１４１０によって符号化され、オーディオストリームとして、オーディオESバッファ１４０９Ａに書き込まれる。

ビデオESバッファ１４０８Ａのビデオストリームと、オーディオESバッファ１４０９Ａのオーディオストリームは、多重化部（MUX）１４１２に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部（MUX）１４１２により生成されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図２８）等を介して外部ネットワークに出力される。また、多重化部（MUX）１４１２により生成されたファイルデータは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１（図２８）等に出力され、各種記録媒体に記録される。

また、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図２８）等を介して外部ネットワークからビデオプロセッサ１３３２に入力されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。また、例えばコネクティビティ１３２１（図２８）等において各種記録媒体から読み出され、ビデオプロセッサ１３３２に入力されたファイルデータは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。つまり、ビデオプロセッサ１３３２に入力されたトランスポートストリームまたはファイルデータは、逆多重化部（DMUX）１４１３によりビデオストリームとオーディオストリームとに分離される。

オーディオストリームは、オーディオESバッファ１４０９Ｂを介してオーディオデコーダ１４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ１４０８Ｂに書き込まれた後、エンコード・デコードエンジン１４０７により順次読み出されて復号されてフレームメモリ１４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部１４０３によって拡大縮小処理されて、フレームメモリ１４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部１４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

このように構成されるビデオプロセッサ１３３２に本開示を適用する場合、エンコード・デコードエンジン１４０７に、上述した各実施形態に係る本開示を適用すればよい。つまり、例えば、エンコード・デコードエンジン１４０７が、第１および第２実施の形態に係る符号化装置の機能を有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図２３を参照して上述した効果と同様の効果を得ることができる。

なお、エンコード・デコードエンジン１４０７において、本開示（すなわち、上述した各実施形態に係る復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

（ビデオプロセッサの他の構成例）
図３０は、本開示を適用したビデオプロセッサ１３３２（図２８）の概略的な構成の他の例を示している。図３０の例の場合、ビデオプロセッサ１３３２は、ビデオデータを所定の方式で符号化・復号する機能を有する。

より具体的には、図３０に示されるように、ビデオプロセッサ１３３２は、制御部１５１１、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、および内部メモリ１５１５を有する。また、ビデオプロセッサ１３３２は、コーデックエンジン１５１６、メモリインタフェース１５１７、多重化・逆多重化部（MUX DMUX）１５１８、ネットワークインタフェース１５１９、およびビデオインタフェース１５２０を有する。

制御部１５１１は、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６等、ビデオプロセッサ１３３２内の各処理部の動作を制御する。

図３０に示されるように、制御部１５１１は、例えば、メインCPU１５３１、サブCPU１５３２、およびシステムコントローラ１５３３を有する。メインCPU１５３１は、ビデオプロセッサ１３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU１５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU１５３２は、メインCPU１５３１の補助的な役割を果たす。例えば、サブCPU１５３２は、メインCPU１５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ１５３３は、メインCPU１５３１およびサブCPU１５３２が実行するプログラムを指定する等、メインCPU１５３１およびサブCPU１５３２の動作を制御する。

ディスプレイインタフェース１５１２は、制御部１５１１の制御の下、画像データを例えばコネクティビティ１３２１（図２８）等に出力する。例えば、ディスプレイインタフェース１５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、またはデジタルデータの画像データのまま、コネクティビティ１３２１（図２８）のモニタ装置等に出力する。

ディスプレイエンジン１５１３は、制御部１５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

画像処理エンジン１５１４は、制御部１５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６により共用される、ビデオプロセッサ１３３２の内部に設けられたメモリである。内部メモリ１５１５は、例えば、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６の間で行われるデータの授受に利用される。例えば、内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６に供給する。この内部メモリ１５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static Random Access Memory）のような比較的（例えば外部メモリ１３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

コーデックエンジン１５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン１５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン１５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化若しくは符号化データの復号を行うようにしてもよい。

図３０に示される例において、コーデックエンジン１５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video１５４１、AVC/H.264１５４２、HEVC/H.265１５４３、HEVC/H.265(Scalable)１５４４、HEVC/H.265(Multi-view)１５４５、およびMPEG-DASH１５５１を有する。

MPEG-2 Video１５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264１５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265１５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)１５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)１５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

MPEG-DASH１５５１は、画像データをMPEG-DASH（MPEG-Dynamic Adaptive Streaming over HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（HyperText Transfer Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH１５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video１５４１乃至HEVC/H.265(Multi-view)１５４５を利用する。

メモリインタフェース１５１７は、外部メモリ１３１２用のインタフェースである。画像処理エンジン１５１４やコーデックエンジン１５１６から供給されるデータは、メモリインタフェース１５１７を介して外部メモリ１３１２に供給される。また、外部メモリ１３１２から読み出されたデータは、メモリインタフェース１５１７を介してビデオプロセッサ１３３２（画像処理エンジン１５１４若しくはコーデックエンジン１５１６）に供給される。

多重化・逆多重化部（MUX DMUX）１５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX DMUX）１５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX DMUX）１５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

ネットワークインタフェース１５１９は、例えばブロードバンドモデム１３３３やコネクティビティ１３２１（いずれも図２８）等向けのインタフェースである。ビデオインタフェース１５２０は、例えばコネクティビティ１３２１やカメラ１３２２（いずれも図２８）等向けのインタフェースである。

次に、このようなビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図２８）等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース１５１９を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、例えば、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１（図２８）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてファイルデータに変換され、ビデオインタフェース１５２０を介して例えばコネクティビティ１３２１（図２８）等に出力され、各種記録媒体に記録される。

さらに、例えば、コネクティビティ１３２１（図２８）等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース１５２０を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１（図２８）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース１５１９を介して例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図２８）等に供給され図示せぬ他の装置に伝送される。

なお、ビデオプロセッサ１３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ１５１５や外部メモリ１３１２を利用して行われる。また、パワーマネージメントモジュール１３１３は、例えば制御部１５１１への電力供給を制御する。

このように構成されるビデオプロセッサ１３３２に本開示を適用する場合、コーデックエンジン１５１６に、上述した各実施形態に係る本開示を適用すればよい。つまり、例えば、コーデックエンジン１５１６が、第１および第２実施の形態に係る符号化装置を実現する機能ブロックを有するようにすればよい。コーデックエンジン１５１６が、このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図２３を参照して上述した効果と同様の効果を得ることができる。

なお、コーデックエンジン１５１６において、本開示（すなわち、上述した各実施形態に係る復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

以上にビデオプロセッサ１３３２の構成を２例示したが、ビデオプロセッサ１３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ１３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

（装置への適用例）
ビデオセット１３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット１３００は、テレビジョン装置９００（図２４）、携帯電話機９２０（図２５）、記録再生装置９４０（図２６）、撮像装置９６０（図２７）等に組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、図１乃至図２３を参照して上述した効果と同様の効果を得ることができる。

なお、上述したビデオセット１３００の各構成の一部であっても、ビデオプロセッサ１３３２を含むものであれば、本開示を適用した構成として実施することができる。例えば、ビデオプロセッサ１３３２のみを本開示を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線１３４１により示されるプロセッサやビデオモジュール１３１１等を本開示を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４を組み合わせ、本開示を適用したビデオユニット１３６１として実施することもできる。いずれの構成の場合であっても、図１乃至図２３を参照して上述した効果と同様の効果を得ることができる。

つまり、ビデオプロセッサ１３３２を含むものであればどのような構成であっても、ビデオセット１３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ１３３２、点線１３４１により示されるプロセッサ、ビデオモジュール１３１１、または、ビデオユニット１３６１を、テレビジョン装置９００（図２４）、携帯電話機９２０（図２５）、記録再生装置９４０（図２６）、撮像装置９６０（図２７）等に組み込むことができる。そして、本開示を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット１３００の場合と同様に、図１乃至図２３を参照して上述した効果と同様の効果を得ることができる。

本開示は、MPEG，H.26ｘ等のように、離散コサイン変換等の直交変換と動き補償によって圧縮されたビットストリームを、衛星放送、ケーブルＴＶ、インターネット、携帯電話などのネットワークメディアを介して受信する際、または光、磁気ディスク、フラッシュメモリのような記憶メディア上で処理する際に用いられる符号化装置に適用することができる。

また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

さらに、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、第１実施の形態と第２実施の形態を組み合わせてもよい。この場合、双方向予測を行う場合には、整数精度の動きベクトルを用いて双方向予測が行われ、双方向予測を行わない場合には、双方向予測の代わりにL0予測またはL1予測が行われる。

また、例えば、本開示は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

本開示は、以下のような構成もとることができる。

（１）
画像に対して双方向予測を行う場合、予測方向ごとに、前記画像の分数画素精度の動きベクトルを整数画素精度の動きベクトルに変換する精度変換部と、
前記精度変換部により変換された前記予測方向ごとの整数画素精度の動きベクトルに基づいて、前記画像の双方向予測の予測画像を生成する予測画像生成部と、
前記予測画像生成部により生成された前記双方向予測の予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化部と
を備える符号化装置。
（２）
前記予測画像生成部は、
前記予測方向ごとに前記整数画素精度の動きベクトルに基づいて生成された前記画像の予測画像である中間予測画像を平均化し、前記双方向予測の予測画像を生成する平均化部
を備える
前記（１）に記載の符号化装置。
（３）
前記予測画像生成部は、
前記中間予測画像を記憶する記憶部
をさらに備え、
前記平均化部は、前記記憶部に記憶された前記中間予測画像を平均化する
ように構成された
前記（２）に記載の符号化装置。
（４）
前記予測画像生成部は、
前記予測方向ごとに、前記整数画素精度の動きベクトルに基づいて前記中間予測画像を生成する中間予測画像生成部
をさらに備える
前記（２）または（３）に記載の符号化装置。
（５）
アプリケーションに応じて、前記双方向予測の予測画像の生成に用いる前記動きベクトルの精度を整数画素精度または分数画素精度に設定する設定部
をさらに備える
前記（１）乃至（４）のいずれかに記載の符号化装置。
（６）
前記画像の量子化パラメータ、フレームレート、または解像度に基づいて、前記双方向予測の予測画像の生成に用いる前記動きベクトルの精度を整数画素精度または分数画素精度に設定する設定部
をさらに備える
前記（１）乃至（４）のいずれかに記載の符号化装置。
（７）
前記双方向予測を行わない場合、前方向予測または後方向予測のみを行うように制限する方向制限予測部
をさらに備える
前記（１）乃至（６）のいずれかに記載の符号化装置。
（８）
前記方向制限予測部は、
前記双方向予測を行わない場合、前記画像を縮小した縮小画像と前記画像の前方向および後方向の参照画像を縮小した縮小参照画像とを用いて、予測方向を前方向または後方向に決定する決定部と、
前記決定部により決定された前記前方向または後方向の予測を、前記画像と前記画像の前方向または後方向の参照画像とを用いて行う予測部と
を備える
前記（７）に記載の符号化装置。
（９）
前記決定部は、複数のLCU（Largest Coding Unit）単位で前記予測方向を決定する
ように構成された
前記（８）に記載の符号化装置。
（１０）
前記決定部は、前記縮小画像の前方向および後方向の動きベクトルに基づいて、前記予測方向を決定する
ように構成された
前記（８）または（９）に記載の符号化装置。
（１１）
前記決定部は、前記縮小参照画像から生成された前記縮小画像の予測画像である縮小予測画像のコスト関数値に基づいて、前記予測方向を決定する
ように構成された
前記（８）乃至（１０）のいずれかに記載の符号化装置。
（１２）
アプリケーションに応じて前記双方向予測を行わないことを決定する決定部
をさらに備える
前記（７）乃至（１１）のいずれかに記載の符号化装置。
（１３）
前記画像の量子化パラメータ、フレームレート、または解像度に基づいて、前記双方向予測を行わないことを決定する決定部
をさらに備える
前記（７）乃至（１１）のいずれかに記載の符号化装置。
（１４）
符号化装置が、
画像に対して双方向予測を行う場合、予測方向ごとに、前記画像の分数画素精度の動きベクトルを整数画素精度の動きベクトルに変換する精度変換ステップと、
前記精度変換ステップの処理により変換された前記予測方向ごとの整数画素精度の動きベクトルに基づいて、前記画像の双方向予測の予測画像を生成する予測画像生成ステップと
前記予測画像生成ステップの処理により生成された前記双方向予測の予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化ステップと
を含む符号化方法。
（１５）
画像に対する予測画像を生成する場合に、複数のLCU（Largest Coding Unit）単位で、前記画像に対して、前方向予測または後方向予測のみを行うように制限する方向制限予測部と、
前記予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化部と
を備える符号化装置。
（１６）
前記方向制限予測部は、
複数のLCU（Largest Coding Unit）単位で、前記画像を縮小した縮小画像と前記画像の前方向および後方向の参照画像を縮小した縮小参照画像とを用いて、予測方向を前方向または後方向に決定する決定部と、
前記決定部により決定された前記前方向または後方向の予測を、前記画像と前記画像の前方向または後方向の参照画像とを用いて行う予測部と
を備える
前記（１５）に記載の符号化装置。
（１７）
前記方向制限予測部は、アプリケーションに応じて制限を行う
ように構成された
前記（１５）または（１６）に記載の符号化装置。
（１８）
前記方向制限予測部は、前記画像の量子化パラメータ、フレームレート、または解像度に基づいて、制限を行う
ように構成された
前記（１５）または（１６）に記載の符号化装置。
（１９）
符号化装置が、
画像に対する予測画像を生成する場合に、複数のLCU（Largest Coding Unit）単位で、前記画像に対して、前方向予測または後方向予測のみを行うように制限する方向制限予測ステップと、
前記予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化ステップと
を含む符号化方法。

１０符号化装置，３３演算部，８２精度変換部，８３中間予測画像生成部，８４メモリ，８６精度変換部，８７中間予測画像生成部，８８メモリ，８９平均化部，１００符号化装置，１５１双方向予測部，１７４決定部，１７５予測部

Claims

画像に対して双方向予測を行う場合、予測方向ごとに、前記画像の分数画素精度の動きベクトルを整数画素精度の動きベクトルに変換する精度変換部と、
前記精度変換部により変換された前記予測方向ごとの整数画素精度の動きベクトルに基づいて、前記画像の双方向予測の予測画像を生成する予測画像生成部と、
前記予測画像生成部により生成された前記双方向予測の予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化部と
を備える符号化装置。
前記予測画像生成部は、
前記予測方向ごとに前記整数画素精度の動きベクトルに基づいて生成された前記画像の予測画像である中間予測画像を平均化し、前記双方向予測の予測画像を生成する平均化部
を備える
請求項１に記載の符号化装置。
前記予測画像生成部は、
前記中間予測画像を記憶する記憶部
をさらに備え、
前記平均化部は、前記記憶部に記憶された前記中間予測画像を平均化する
ように構成された
請求項２に記載の符号化装置。
前記予測画像生成部は、
前記予測方向ごとに、前記整数画素精度の動きベクトルに基づいて前記中間予測画像を生成する中間予測画像生成部
をさらに備える
請求項２に記載の符号化装置。
アプリケーションに応じて、前記双方向予測の予測画像の生成に用いる前記動きベクトルの精度を整数画素精度または分数画素精度に設定する設定部
をさらに備える
請求項１に記載の符号化装置。
前記画像の量子化パラメータ、フレームレート、または解像度に基づいて、前記双方向予測の予測画像の生成に用いる前記動きベクトルの精度を整数画素精度または分数画素精度に設定する設定部
をさらに備える
請求項１に記載の符号化装置。
前記双方向予測を行わない場合、前方向予測または後方向予測のみを行うように制限する方向制限予測部
をさらに備える
請求項１に記載の符号化装置。
前記方向制限予測部は、
前記双方向予測を行わない場合、前記画像を縮小した縮小画像と前記画像の前方向および後方向の参照画像を縮小した縮小参照画像とを用いて、予測方向を前方向または後方向に決定する決定部と、
前記決定部により決定された前記前方向または後方向の予測を、前記画像と前記画像の前方向または後方向の参照画像とを用いて行う予測部と
を備える
請求項７に記載の符号化装置。
前記決定部は、複数のLCU（Largest Coding Unit）単位で前記予測方向を決定する
ように構成された
請求項８に記載の符号化装置。
前記決定部は、前記縮小画像の前方向および後方向の動きベクトルに基づいて、前記予測方向を決定する
ように構成された
請求項８に記載の符号化装置。
前記決定部は、前記縮小参照画像から生成された前記縮小画像の予測画像である縮小予測画像のコスト関数値に基づいて、前記予測方向を決定する
ように構成された
請求項８に記載の符号化装置。
アプリケーションに応じて前記双方向予測を行わないことを決定する決定部
をさらに備える
請求項７に記載の符号化装置。
前記画像の量子化パラメータ、フレームレート、または解像度に基づいて、前記双方向予測を行わないことを決定する決定部
をさらに備える
請求項７に記載の符号化装置。
符号化装置が、
画像に対して双方向予測を行う場合、予測方向ごとに、前記画像の分数画素精度の動きベクトルを整数画素精度の動きベクトルに変換する精度変換ステップと、
前記精度変換ステップの処理により変換された前記予測方向ごとの整数画素精度の動きベクトルに基づいて、前記画像の双方向予測の予測画像を生成する予測画像生成ステップと
前記予測画像生成ステップの処理により生成された前記双方向予測の予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化ステップと
を含む符号化方法。
画像に対する予測画像を生成する場合に、複数のLCU（Largest Coding Unit）単位で、前記画像に対して、前方向予測または後方向予測のみを行うように制限する方向制限予測部と、
前記予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化部と
を備える符号化装置。
前記方向制限予測部は、
複数のLCU（Largest Coding Unit）単位で、前記画像を縮小した縮小画像と前記画像の前方向および後方向の参照画像を縮小した縮小参照画像とを用いて、予測方向を前方向または後方向に決定する決定部と、
前記決定部により決定された前記前方向または後方向の予測を、前記画像と前記画像の前方向または後方向の参照画像とを用いて行う予測部と
を備える
請求項１５に記載の符号化装置。
前記方向制限予測部は、アプリケーションに応じて制限を行う
ように構成された
請求項１５に記載の符号化装置。
前記方向制限予測部は、前記画像の量子化パラメータ、フレームレート、または解像度に基づいて、制限を行う
ように構成された
請求項１５に記載の符号化装置。
符号化装置が、
画像に対する予測画像を生成する場合に、複数のLCU（Largest Coding Unit）単位で、前記画像に対して、前方向予測または後方向予測のみを行うように制限する方向制限予測ステップと、
前記予測画像を用いて、前記画像を、再帰的に分割されるブロック構造にしたがって符号化する符号化ステップと
を含む符号化方法。