WO2020008769A1

WO2020008769A1 - 画像処理装置、画像処理方法、及び画像処理プログラム

Info

Publication number: WO2020008769A1
Application number: PCT/JP2019/021847
Authority: WO
Inventors: 健治近藤
Original assignee: ソニー株式会社
Priority date: 2018-07-06
Filing date: 2019-05-31
Publication date: 2020-01-09

Abstract

画像処理装置は、符号化済みのブロックに設定されたアフィン変換のための第１の種類の動き情報に基づき生成される第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、第１の種類の動き情報とはアフィン変換のための予測成分の数が異なる第２の種類の動き情報であって前記符号化済みのブロックに設定された第１の種類の動き情報に基づき生成される第２の種類の動き情報を前記所定のブロックの動き情報として取得する第２のモードと、を含む複数のモードのうちのいずれかのモードで動き補償を行う予測部（１１９）、を備える。

Description

画像処理装置、画像処理方法、及び画像処理プログラム

　本開示は、画像処理装置、画像処理方法、及び画像処理プログラムに関する。

　ITU-T（International　Telecommunication　Union　Telecommunication　Standardization　Sector）の次世代ビデオ符号化を探索するJVET（Joint　Video　Exploration　Team）では、２つの頂点の動きベクトルに基づいて参照画像をアフィン変換することによりインター予測処理（Affine　motion　compensation(MC)　prediction）を行うことが提案されている（例えば、非特許文献１）。これにより、画像処理装置は、インター予測処理時に、画面間の並進移動（平行移動）だけでなく、回転方向の動き、及び、拡大や縮小といった形状の変化も補償して高精度の予測画像を生成することができる。

Jianle　Chen等,"Algorithm　Description　of　Joint　Exploration　Test　Model　4(JVET-C1001)",　JVET　of　ITU-T　SG16　WP3　and　ISO/IEC　JTC1/SC29/WG11,26　May-1　June　2016

　インター予測処理では、符号化済みのブロックの動き情報に基づいてカレントブロックの動き情報を取得するマージモードが使用されることがある。しかし、符号化済みのブロックにアフィン変換のための動き情報が設定されている場合、マージモードを使うと高精度の予測画像が生成されない可能性がある。

　そこで、本開示では、高精度の予測画像を生成可能な画像処理装置、画像処理方法、及び画像処理プログラムを提案する。

　上記の課題を解決するために、本開示に係る一形態の画像処理装置は、符号化済みのブロックに設定されたアフィン変換のための第１の種類の動き情報に基づき生成される第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、第１の種類の動き情報とはアフィン変換のための予測成分の数が異なる第２の種類の動き情報であって前記符号化済みのブロックに設定された第１の種類の動き情報に基づき生成される第２の種類の動き情報を前記所定のブロックの動き情報として取得する第２のモードと、を含む複数のモードのうちのいずれかのモードで動き補償を行う予測部、を備える。

　本開示によれば、高精度の予測画像を生成できる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。

１つの動きベクトルに基づいて動き補償を行うインター予測処理を説明する図である。１つの動きベクトルと回転角に基づいて動き補償を行うインター予測処理を説明する図である。２つの動きベクトルに基づいて動き補償を行うインター予測処理を説明する図である。３つの動きベクトルに基づいて動き補償を行うインター予測処理を説明する図である。アフィン変換により、ブロックが並進移動する様子を示す図である。アフィン変換により、ブロックがスキューする様子を示す図である。アフィン変換により、ブロックが回転する様子を示す図である。アフィン変換により、ブロックが拡大又は縮小する様子を示す図である。 QTBTを説明する図である。画像内の各ブロックで発生する動きの第１の例を説明する図である。画像内の各ブロックで発生する動きの第２の例を説明する図である。画像内の各ブロックで発生する動きの第３の例を説明する図である。画像内の各ブロックで発生する動きの第４の例を説明する図である。本開示の画像処理装置の一例である画像符号化装置の構成例を示すブロック図である。並進モードを説明する図である。並進回転モードの第１の例を説明する図である。並進回転モードの第２の例を説明する図である。並進スケーリングモードの第１の例を説明する図である。並進スケーリングモードの第２の例を説明する図である。ＡＭＶＰモードにおける動き補償モード情報とパラメータ情報を説明する図である。マージモードにおける動き補償モード情報とパラメータ情報を説明する図である。予測ベクトルの候補となる対象パラメータに含まれる動きベクトルを説明する図である。画像符号化処理を説明するフローチャートである。設定処理を説明するフローチャートである。インター符号化処理を説明するフローチャートである。カレントブロックと参照候補となる符号化済みのブロックとの位置関係を示す図である。マージの振る舞いを示す図である。マージの振る舞いを示す図である。マージの振る舞いを示す図である。マージの振る舞いを示す図である。マージの振る舞いを示す図である。マージの振る舞いを示す図である。マージ処理を説明するフローチャートである。マージの際に計算のために用いる変数を示す図である。マージ処理の他の例を説明するフローチャートである。マージ処理の他の例を説明するフローチャートである。本開示の画像処理装置の一例である画像復号装置の構成例を示すブロック図である。画像復号処理を説明するフローチャートである。インター復号処理を説明するフローチャートである。コンピュータのハードウエアの構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。ビデオセットの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の他の例を示すブロック図である。ネットワークシステムの概略的な構成の一例を示すブロック図である。

　以下、本開示の前提及び本開示を実施するための形態（以下、実施の形態という）について説明する。なお、説明は以下の順序で行う。
　１．はじめに
　　　１－１．２パラメータＭＣ予測処理
　　　１－２．１つの動きベクトルと回転角に基づいて動き補償を行うインター予測処理
　　　１－３．４パラメータアフィンＭＣ予測処理
　　　１－４．６パラメータアフィンＭＣ予測処理
　　　１－５．ＱＴＢＴ
　　　１－６．各ブロックで発生する動き
　　　１－７．マージモード
　２．第１実施の形態
　　　２－１．画像符号化装置の構成例
　　　２－２．並進モード
　　　２－３．並進回転モード
　　　２－４．並進スケーリングモード
　　　２－５．動き補償モード情報とパラメータ情報
　　　２－６．予測ベクトルの候補
　　　２－７．画像符号化装置の処理
　　　２－８．マージモードの詳細
　　　２－９．画像復号装置の構成例
　　　２－１０．画像復号装置の処理
　３．第２実施の形態：コンピュータ
　４．第３実施の形態：テレビジョン装置
　５．第４実施の形態：携帯電話機
　６．第５実施の形態：記録再生装置
　７．第６実施の形態：撮像装置
　８．第７実施の形態：ビデオセット
　　　８－１．ビデオセットの構成例
　　　８－２．ビデオプロセッサの構成例
　　　８－３．ビデオプロセッサの他の構成例
　　　８－４．装置への適用例
　９．第８実施の形態：ネットワークシステム

　＜＜１．はじめに＞＞
　＜１－１．２パラメータＭＣ予測処理＞
　図１は、１つの動きベクトルに基づいて動き補償を行うインター予測処理（以下、２パラメータＭＣ予測処理という）を説明する図である。

　なお、以下では、特に断りの無い限り、画像（ピクチャ）の横方向（水平方向）をｘ方向とし、縦方向（垂直方向）をｙ方向とする。

　図１に示すように、２パラメータＭＣ予測処理では、予測対象のブロック１１（カレントブロック）に対して１つの動きベクトルｖ_c（ｖ_cx，ｖ_cy）が決定される。そして、ブロック１１を含むピクチャ１０とは異なる時刻の参照画像内の、ブロック１１から動きベクトルｖ_cだけ離れた位置に存在するブロック１１と同一のサイズのブロック１３を、動きベクトルｖ_cに基づいて並進移動することにより動き補償が行われ、ブロック１１の予測画像が生成される。ここで、ブロックは、例えば、TB、TU、PU、CUである。

　即ち、２パラメータＭＣ予測処理では、参照画像に対してアフィン変換が行われず、画面間の並進移動のみを補償した予測画像が生成される。また、インター予測処理に用いられるパラメータは、ｖ_cxとｖ_cyの２つである。このようなインター予測処理は、AVC（Advanced　Video　Coding）やHEVC（High　Efficiency　Video　Coding）などで採用されている。

　＜１－２．１つの動きベクトルと回転角に基づいて動き補償を行うインター予測処理＞
　図２は、１つの動きベクトルと回転角に基づいて動き補償を行うインター予測処理を説明する図である。

　図２に示すように、１つの動きベクトルと回転角に基づいて動き補償を行うインター予測処理では、予測対象のブロック１１に対して１つの動きベクトルｖ_c（ｖ_cx，ｖ_cy）と回転角θが決定される。そして、ブロック１１を含むピクチャ１０とは異なる時刻の参照画像内の、ブロック１１から動きベクトルｖ_cだけ離れた位置に回転角θの傾きで存在するブロック１１と同一のサイズのブロック２１を、動きベクトルｖ_cと回転角θに基づいてアフィン変換することにより動き補償が行われ、ブロック１１の予測画像が生成される。

　即ち、１つの動きベクトルと回転角に基づいて動き補償を行うインター予測処理では、１つの動きベクトルと回転角に基づいて参照画像に対してアフィン変換が行われる。これにより、画面間の並進移動と回転方向の動きを補償した予測画像が生成される。したがって、２パラメータＭＣ予測処理に比べて、予測画像の精度が向上する。また、インター予測処理に用いられるパラメータは、ｖ_cx，ｖ_cy、及びθの３つである。

　＜１－３．４パラメータアフィンＭＣ予測処理＞
　図３は、２つの動きベクトルに基づいて動き補償を行うインター予測処理（以下では、４パラメータアフィンＭＣ予測処理という）を説明する図である。

　図３に示すように、４パラメータアフィンＭＣ予測処理では、予測対象のブロック３１に対して、ブロック３１の左上の頂点Ｋ１における動きベクトルｖ₀（ｖ_0x，ｖ_0y）と右上の頂点Ｋ２における動きベクトルｖ₁（ｖ_1x，ｖ_1y）が決定される。

　そして、ブロック３１を含むピクチャとは異なる時刻の参照画像内の、頂点Ｋ１から動きベクトルｖ₀だけ離れた点Ｋ１’を左上の頂点とし、頂点Ｋ２から動きベクトルｖ₁だけ離れた点Ｋ２’を右上の頂点とするブロック３２を、動きベクトルｖ₀と動きベクトルｖ₁に基づいてアフィン変換することにより動き補償が行われ、ブロック３１の予測画像が生成される。

　具体的には、ブロック３１が所定のサイズのブロック（以下、単位ブロックという）に分割される。そして、各単位ブロックの動きベクトルｖ（ｖ_x，ｖ_y）が、動きベクトルｖ₀（ｖ_0x，ｖ_0y）と動きベクトルｖ₁（ｖ_1x，ｖ_1y）に基づいて、以下の式（１）及び式（２）により求められる。

　なお、Ｗは、ブロック３１のｘ方向のサイズであり、Ｈは、ブロック３１のｙ方向のサイズである。したがって、ブロック３１が正方形である場合、ＷとＨは等しい。また、x,yは、それぞれ、単位ブロックのｘ方向、ｙ方向の位置である。式（１）によれば、単位ブロックの位置に基づいて、単位ブロックの動きベクトルｖが決定される。

　そして、参照画像内の、各単位ブロックから動きベクトルｖだけ離れた単位ブロックと同一のサイズのブロックを、動きベクトルｖに基づいて並進移動することにより、各単位ブロックの予測画像が生成され、その各単位ブロックの予測画像によって、ブロック３１の予測画像が生成される。

　以上のように、４パラメータアフィンＭＣ予測処理では、２つの動きベクトルに基づいて参照画像に対してアフィン変換が行われる。これにより、画面間の並進移動及び回転方向の動きだけでなく、拡大や縮小といった形状の変化を補償した予測画像が生成される。したがって、１つの動きベクトルと回転角に基づいて動き補償を行うインター予測処理に比べて、予測画像の精度が向上する。また、インター予測処理に用いられるパラメータは、ｖ_0x，ｖ_0y，ｖ_1x、及びｖ_1yの４つである。このようなインター予測処理は、JEM（Joint　Exploration　Model）参照ソフトウエアで採用されている。

　なお、２つの動きベクトルに基づくアフィン変換は、アフィン変換前後のブロックが矩形であることを前提としたアフィン変換である。アフィン変換前後のブロックが矩形以外の四角形である場合にもアフィン変換を行うためには、３つの動きベクトルが必要である。

　＜１－４．６パラメータアフィンＭＣ予測処理＞
　図４は、３つの動きベクトルに基づいて動き補償を行うインター予測処理（以下、６パラメータアフィンＭＣ予測処理という）を説明する図である。

　図４に示すように、６パラメータアフィンＭＣ予測処理では、予測対象のブロック３１に対して、動きベクトルｖ₀（ｖ_0x，ｖ_0y）と動きベクトルｖ₁（ｖ_1x，ｖ_1y）だけでなく、左下の頂点Ｋ３の動きベクトルｖ₂（ｖ_2x，ｖ_2y）が決定される。

　そして、ブロック３１を含むピクチャとは異なる時刻の参照画像内の、頂点Ｋ１から動きベクトルｖ₀だけ離れた点Ｋ１’を左上の頂点とし、頂点Ｋ２から動きベクトルｖ₁だけ離れた点Ｋ２’を右上の頂点とし、頂点Ｋ３から動きベクトルｖ₂だけ離れた点Ｋ３’を左下の頂点とするブロック４２を、動きベクトルｖ₀ないしｖ₂に基づいてアフィン変換することにより動き補償が行われ、ブロック３１の予測画像が生成される。

　即ち、６パラメータアフィンＭＣ予測処理では、３つの動きベクトルに基づいて参照画像に対してアフィン変換が行われる。図５Ａ～図５Ｄは、３つの動きベクトルに基づくアフィン変換前後のブロックを説明する図である。アフィン変換により、ブロック４２が図５Ａに示すように並進移動（Translation）したり、図５Ｂに示すようにスキュー（Skew）したり、図５Ｃに示すように回転（Rotation）したり、図５Ｄに示すように拡大又は縮小（Scaling）したりする。

　その結果、画面間の並進移動及び回転方向の動き、並びに、拡大や縮小、及びスキューといった形状の変化を補償した予測画像が生成される。なお、図５Ａ～図５Ｄでは、アフィン変換前のブロック４２を実線で示し、アフィン変換後のブロック４２を点線で示している。

　これに対して、図３で説明した４パラメータアフィンＭＣ予測処理では、予測画像に対して、スキューを補償することはできないが、画面間の並進移動及び回転方向の動き、並びに、拡大や縮小といった形状の変化を補償することはできる。したがって、４パラメータアフィンＭＣ予測処理と６パラメータアフィンＭＣ予測処理では、画面間の並進移動のみを補償する２パラメータＭＣ予測処理に比べて、予測画像の精度が向上する。

　しかしながら、４パラメータアフィンＭＣ予測処理では、インター予測処理におけるパラメータは、ｖ_0x，ｖ_0y，ｖ_1x、及びｖ_1yの４つである。また、６パラメータアフィンＭＣ予測処理では、インター予測処理に用いられるパラメータは、ｖ_0x，ｖ_0y，ｖ_1x，ｖ_1y，ｖ_2x、及びｖ_2yの６つである。したがって、２パラメータＭＣ予測処理に比べて、インター予測処理に用いられるパラメータの数が増加する。よって、インター予測処理の予測精度の向上とオーバーヘッドの抑制とは、トレードオフの関係になる。

　なお、JVETでは、制御信号により、４パラメータアフィンＭＣ予測処理と６パラメータアフィンＭＣ予測処理を切り替える技術が提案されている。

　＜１－５．ＱＴＢＴ＞
　MPEG2（Moving　Picture　Experts　Group　2(ISO/IEC　13818-2)）やAVCなどの旧来の画像符号化方式では、符号化処理は、マクロブロックと呼ばれる処理単位で実行される。マクロブロックは、16x16画素の均一なサイズを有するブロックである。これに対し、HEVCでは、符号化処理は、CUと呼ばれる処理単位（符号化単位）で実行される。CUは、最大符号化単位であるLCU（Largest　Coding　Unit）を再帰的に分割することにより形成される、可変的なサイズを有するブロックである。選択可能なCUの最大サイズは、64x64画素である。選択可能なCUの最小サイズは、8x8画素である。最小サイズのCUは、SCU（Smallest　Coding　Unit）と呼ばれる。なお、CUの最大サイズは、64x64画素に限定されず、より大きい128x128画素、256x256画素などのブロックサイズとしてもよい。

　このように、可変的なサイズを有するCUが採用される結果、HEVCでは、画像の内容に応じて画質及び符号化効率を適応的に調整することが可能である。予測符号化のための予測処理は、PUと呼ばれる処理単位で実行される。PUは、CUをいくつかの分割パタンのうちの１つで分割することにより形成される。また、PUは、輝度(Y)及び色差(Cb,Cr)毎のPB(Prediction　Block)と呼ばれる処理単位から構成される。さらに、直交変換処理は、TU（Transform　Unit）と呼ばれる処理単位で実行される。TUは、CU又はPUをある深さまで分割することにより形成される。また、TUは、輝度(Y)及び色差(Cb,　Cr)毎のTB(Transform　Block)と呼ばれる処理単位（変換ブロック）から構成される。

　以下においては、画像（ピクチャ）の部分領域や処理単位として「ブロック」を用いて説明する場合がある（処理部のブロックではない）。この場合の「ブロック」は、ピクチャ内の任意の部分領域を示し、その大きさ、形状、及び特性等は限定されない。つまり、この場合の「ブロック」には、例えば、TB、TU、PB、PU、SCU、CU、LCU（CTB）、サブブロック、マクロブロック、タイル、又はスライス等、任意の部分領域（処理単位）が含まれるものとする。

　図６は、JVETにおいて採用されたQTBT(Quad　tree　plus　binary　tree)を説明する図である。

　HEVCでは、１つのブロックを水平方向及び垂直方向に分割して４（=2x2）個のサブブロックにのみすることができる。これに対して、QTBTでは、１つのブロックを４（=2x2）個のサブブロックだけでなく、水平方向及び垂直方向のいずれか一方にのみ分割して２（=1x2,2x1）個のサブブロックにもすることができる。即ち、QTBTでは、CU（Coding　Unit）の形成は、１つのブロックの４個又は２個のサブブロックへの分割を再帰的に繰り返すことにより行われ、結果として四分木（Quad-Tree）状、又は、２分木（Binary-Tree）状のツリー構造が形成される。したがって、CUの形状は、正方形だけでなく、長方形になる可能性がある。なお、以下では、PUとTUは、CUと同一であるものとする。

　＜１－６．各ブロックで発生する動き＞
　図７～図１０は、画像内の各ブロックで発生する動きを説明する図である。

　図７の例では、画像６１全体において、参照画像との間で並進移動、スケーリング（拡大や縮小）、及び回転方向の動きが発生している。この場合、画像６１内の全てのブロック（例えば、CUやPU）のインター予測処理において、４パラメータアフィンＭＣ予測処理を行い、画面間の並進移動、スケーリング、及び回転方向の動きが補償された予測画像を生成することが望ましい。

　これに対して、図８の例では、撮影時の手振れなどにより、画像６２全体において、参照画像との間で並進移動と回転方向の動きが発生している。この場合、画像６２内の全てのブロック（例えば、CUやPU）のインター予測処理において、４パラメータアフィンＭＣ予測処理を行うことにより、画面間の並進移動と回転方向の動きだけでなく、スケーリングも補償する必要はない。

　また、図９の例では、撮影時のズームインやズームアウトにより、画像６３全体において、参照画像との間で並進移動とスケーリングが発生している。この場合、画像６３内の全てのブロック（例えば、CUやPU）のインター予測処理において、４パラメータアフィンＭＣ予測処理を行うことにより、画面間の並進移動とスケーリングだけでなく、回転方向の動きも補償する必要はない。

　さらに、図１０の例では、画像６４が、参照画像との間で並進移動とスケーリングが発生している領域６４Ａ、並進移動と回転方向の動きが発生している領域６４Ｂ、並進移動、スケーリング、及び回転方向の動きが発生している領域６４Ｃ、及び並進移動のみが発生している領域６４Ｄからなる。

　この場合、領域６４Ｃ内のブロックのインター予測処理において４パラメータアフィンＭＣ予測処理を行うことが望ましい。しかしながら、領域６４Ａ、領域６４Ｂ、及び領域６４Ｄ内のブロックのインター予測処理において、４パラメータアフィンＭＣ予測処理を行って、画面間の並進移動、回転方向の動き、及びスケーリングの全てを補償する必要はない。

　以上のように、並進移動、回転方向の動き、及びスケーリングの全てが発生していないブロックのインター予測処理では、４パラメータアフィンＭＣ予測処理を行い、画面間の並進移動、回転方向の動き、及びスケーリングの全てを補償する必要はない。したがって、全てのブロックのインター予測処理において、４パラメータアフィンＭＣ予測処理を行うことは、無駄にオーバーヘッド（の符号量）を増加させ、符号化効率を悪化させることになる。

　そこで、本開示では、動き補償モードとして、２パラメータＭＣ予測処理を行う並進モード、並進回転モード、並進スケーリングモード、及び４パラメータアフィンＭＣ予測処理を行うアフィン変換モードを用意する。そして、画像処理装置は、各ブロックのインター予測処理において適切な動き補償モードで動き補償を行う。なお、並進回転モードとは、１つの動きベクトルｖ_c（ｖ_cx，ｖ_cy）と回転角を示す回転角情報の３つのパラメータに基づいて並進移動と回転を行うことにより、並進移動と回転方向の動きを補償するモードである。並進スケーリングモードとは、１つの動きベクトルｖ_c（ｖ_cx，ｖ_cy）とスケーリング率を示すスケーリング情報の３つのパラメータに基づいて並進移動とスケーリングを行うことにより、並進移動とスケーリングを補償するモードである。

　つまり、画像処理装置は、並進移動と回転方向の動きが発生しているブロックのインター予測処理では、並進回転モードの動き補償を行う。また、画像処理装置は、並進移動とスケーリングが発生しているブロックのインター予測処理において、並進スケーリングモードの動き補償を行う。これにより、これらのブロックに対するインター予測処理に用いられるパラメータの数が、４パラメータアフィンＭＣ予測処理に比べて少ない３つになる。したがって、全てのブロックに対して４パラメータアフィンＭＣ予測処理が行われる場合に比べて、オーバーヘッドが削減され、符号化効率が向上する。

　なお、上述の説明では、アフィン変換モードは、４パラメータアフィンＭＣ予測処理を行うモードであるものとしたが、アフィン変換モードは、６パラメータアフィンＭＣ予測処理を行うモードであってもよい。

　＜１－７．マージモード＞
　なお、動き補償のモードには通常の動き補償のモードに加えてマージモードがある。マージモードとは、符号化済みブロックの動き情報（動きパラメータ）に基づいて生成される動き情報（動きパラメータ）に基づいてインター予測処理を行う動き補償モードである。符号化済みのブロックにアフィン変換のための動き情報が設定されている場合、マージモードを使うと予測成分（例えば、並進移動、回転、スケーリングの成分）が多すぎて逆に高精度の予測画像が生成されない可能性がある。

　例えば、参照先となる符号化済みブロックの動き情報がアフィン変換モードの４パラメータであるとする。この場合、処理対象のブロックの動き情報もアフィン変換モードの４パラメータとなるが、必ずしも処理対象のブロックの正しい動きモデルがアフィン変換モードであるとは限らない。処理対象のブロックの正しい動きモデルが、並進移動と回転の予測成分から構成される並進回転モードや、並進移動とスケーリングの予測成分から構成される並進スケーリングモードであることも想定しうる。この場合、動きパラメータの予測精度が低下する恐れがある。

　そこで、本開示では、アフィン変換のマージモード（マージ＆アフィン変換モード）に、予測成分を削減して強制的に並進回転モードや並進スケーリングモードとする第２、第３のマージモード（強制回転モード、強制スケーリングモード）を用意する。これにより、参照先となる符号化済みブロックの動き情報がアフィン変換モードの動き補償モードであっても、高精度の予測画像を生成できるようにする。

　以下、本開示の画像符号化装置を説明する。

　＜＜２．第１実施の形態＞＞
　＜２－１．画像符号化装置の構成例＞
　図１１は、本開示の画像処理装置の一例である画像符号化装置１００の構成例を示すブロック図である。図１１の画像符号化装置１００は、AVCやHEVCのように、画像とその予測画像との予測残差を符号化する装置である。例えば、画像符号化装置１００は、HEVCの技術や、JVETにて提案された技術を実装している。

　なお、図１１においては、処理部やデータの流れ等の主なものを示しており、図１１に示されるものが全てとは限らない。つまり、画像符号化装置１００において、図１１においてブロックとして示されていない処理部が存在したり、図１１において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図１１の画像符号化装置１００は、制御部１０１、演算部１１１、変換部１１２、量子化部１１３、符号化部１１４、逆量子化部１１５、逆変換部１１６、演算部１１７、フレームメモリ１１８、及び予測部１１９を有する。画像符号化装置１００は、入力されるフレーム単位の動画像であるピクチャに対してブロック（例えば、CU）ごとに符号化を行う。

　具体的には、画像符号化装置１００の制御部１０１（設定部）は、外部からの入力及びRDO（Rate-Distortion　Optimization）等に基づいて、符号化パラメータ（ヘッダ情報Hinfo、予測情報Pinfo、変換情報Tinfo等）を設定する。

　ヘッダ情報Hinfoは、例えば、ビデオパラメータセット（VPS（Video　Parameter　Set））、シーケンスパラメータセット（SPS（Sequence　Parameter　Set））、ピクチャパラメータセット（PPS（Picture　Parameter　Set））、スライスヘッダ（SH）等の情報を含む。例えば、ヘッダ情報Hinfoには、画像サイズ（横幅PicWidth、縦幅PicHeight）、ビット深度（輝度bitDepthY、色差bitDepthC）、CUサイズの最大値MaxCUSize／最小値MinCUSizeなどを規定する情報が含まれる。もちろん、ヘッダ情報Hinfoの内容は任意であり、上述した例以外のどのような情報がこのヘッダ情報Hinfoに含まれるようにしてもよい。

　予測情報Pinfoには、例えば、ブロック（例えば、CUやPU）の形成時の各分割階層における水平方向又は垂直方向の分割の有無を示すsplit　flagが含まれる。また、予測情報Pinfoには、ブロックごとに、そのブロックの予測処理がイントラ予測処理であるか、又は、インター予測処理であるかを示すモード情報pred_mode_flagが含まれる。

　モード情報pred_mode_flagがインター予測処理を示す場合、予測情報Pinfoには、Merge　flag、動き補償モード情報、パラメータ情報、参照画像を特定する参照画像特定情報などが含まれる。Merge　flagは、インター予測処理のモードが、マージモードであるか、又は、AMVPモードであるかを示す情報である。マージモードとは、マージ対象となる符号化済みのブロック（例えば、隣接ブロック等の周辺ブロック）の動き補償に用いられたパラメータ（動きベクトル、回転角情報、スケーリング情報）に基づいて生成されるパラメータ（以下、対象パラメータという）を含む候補の中から選択された予測パラメータに基づいてインター予測処理を行うモードである。AMVPモードとは、処理対象のブロックのパラメータに基づいてインター予測処理を行うモードである。Merge　flagは、マージモードであることを示す場合１であり、AMVPモードであることを示す場合０である。

　動き補償モード情報は、動き補償モードが、並進モード、アフィン変換モード、並進回転モード、又は並進スケーリングモードであることを示す情報である。本実施形態では、マージモードのアフィン変換モードは、通常アフィン変換モード、並進回転モード、及び並進スケーリングモードに分かれる。

　パラメータ情報は、Merge　flagが１である場合、対象パラメータを含む候補の中からインター予測処理に用いるパラメータを、予測パラメータ（予測ベクトル、予測回転角情報、予測スケーリング情報）として特定する情報である。また、Merge　flagが０である場合、予測パラメータを特定する情報、及び、予測パラメータと処理対象のブロックのパラメータとの差分である。

　モード情報pred_mode_flagがイントラ予測処理を示す場合、予測情報Pinfoには、そのイントラ予測処理のモードであるイントラ予測モードを示すイントラ予測モード情報などが含まれる。もちろん、予測情報Pinfoの内容は任意であり、上述した例以外のどのような情報がこの予測情報Pinfoに含まれるようにしてもよい。

　変換情報Tinfoには、TBのサイズを示すTBSizeなどが含まれる。もちろん、変換情報Tinfoの内容は任意であり、上述した例以外のどのような情報がこの変換情報Tinfoに含まれるようにしてもよい。

　演算部１１１は、入力されるピクチャを順に符号化対象のピクチャとし、予測情報Pinfoのsplit　flagに基づいて、符号化対象のピクチャに対して符号化対象のブロック（CU,PU,TU）を設定する。演算部１１１は、符号化対象のブロックの画像I（カレントブロック）から、予測部１１９から供給されたブロックの予測画像Ｐ（予測ブロック）を減算して予測残差Ｄを求め、それを変換部１１２に供給する。

　変換部１１２は、制御部１０１から供給される変換情報Tinfoに基づいて、演算部１１１から供給される予測残差Ｄに対して直交変換等を行い、変換係数Coeffを導出する。変換部１１２は、変換係数Coeffを量子化部１１３に供給する。

　量子化部１１３は、制御部１０１から供給される変換情報Tinfoに基づいて、変換部１１２から供給される変換係数Coeffをスケーリング（量子化）し、量子化変換係数レベルlevelを導出する。量子化部１１３は、量子化変換係数レベルlevelを符号化部１１４及び逆量子化部１１５に供給する。

　符号化部１１４は、量子化部１１３から供給される量子化変換係数レベルlevel等を所定の方法で符号化する。例えば、符号化部１１４は、シンタックステーブルの定義に沿って、制御部１０１から供給される符号化パラメータ（ヘッダ情報Hinfo、予測情報Pinfo、変換情報Tinfo等）と、量子化部１１３から供給される量子化変換係数レベルlevelを、各シンタックス要素のシンタックス値へ変換する。そして、符号化部１１４は、各シンタックス値を符号化（例えば、CABAC(Context-based　Adaptive　Binary　Arithmetic　Coding)などの算術符号化）する。

　このとき、符号化部１１４は、マージ対象ブロック（例えば、隣接ブロック等の周囲ブロック）の動き補償モード情報に基づいてCABACの確率モデルのコンテキストを切り替え、マージ対象ブロックの動き補償モード情報の確率が高くなるようにCABACの確率モデルを設定して、ブロックの動き補償モード情報を符号化する。

　即ち、図１０に示したように、参照画像との間で並進移動とスケーリングが発生している領域６４Ａ、並進移動と回転方向の動きが発生している領域６４Ｂ、並進移動、スケーリング、及び回転方向の動きが発生している領域６４Ｃ、及び並進移動のみが発生している領域６４Ｄは、画像６４内にまとまって存在していると推測される。したがって、あるブロックとマージ対象ブロックの動き補償モード情報は同一である可能性が高い。

　例えば、あるブロックのマージ対象ブロックが領域６４Ａ内に存在し、動き補償モードとして並進スケーリングモードが選択されている場合、そのブロックも領域６４Ａ内に存在し、動き補償モードとして並進スケーリングモードが選択される可能性が高い。また、あるブロックのマージ対象ブロックが領域６４Ｂ内に存在し、動き補償モードとして並進回転モードが選択されている場合、そのブロックも領域６４Ｂ内に存在し、動き補償モードとして回転スケーリングモードが選択される可能性が高い。

　さらに、あるブロックのマージ対象ブロックが領域６４Ｃ内に存在し、動き補償モードとしてアフィン変換モードが選択されている場合、そのブロックも領域６４Ｃ内に存在し、動き補償モードとしてアフィン変換モードが選択される可能性が高い。また、あるブロックのマージ対象ブロックが領域６４Ｄ内に存在し、動き補償モードとして並進モードが選択されている場合、そのブロックも領域６４Ｄ内に存在し、動き補償モードとして並進モードが選択される可能性が高い。

　よって、符号化部１１４は、マージ対象ブロックの動き補償モード情報の確率が高くなるように、CABACの確率モデルを設定してブロックの動き補償モード情報を符号化する。これにより、オーバーヘッドを削減し、符号化効率を改善することができる。

　なお、マージ対象ブロックの数が複数である場合、符号化部１１４は、マージ対象ブロックの動き補償モード情報ごとの数に基づいてCABACの確率モデルを設定するようにしてもよい。また、符号化部１１４は、動き補償モード情報に基づいて、CABACの確率モデルのコンテキストを切り替えるのではなく、動き補償モード情報に割り当てる符号（ビット列）を切り替えるようにしてもよい。

　符号化部１１４は、例えば、符号化の結果得られる各シンタックス要素のビット列である符号化データを多重化し、符号化ストリームとして出力する。

　逆量子化部１１５は、制御部１０１から供給される変換情報Tinfoに基づいて、量子化部１１３から供給される量子化変換係数レベルlevelの値をスケーリング（逆量子化）し、逆量子化後の変換係数Coeff_IQを導出する。逆量子化部１１５は、その変換係数Coeff_IQを逆変換部１１６に供給する。この逆量子化部１１５により行われる逆量子化は、量子化部１１３により行われる量子化の逆処理であり、後述する画像復号装置において行われる逆量子化と同様の処理である。

　逆変換部１１６は、制御部１０１から供給される変換情報Tinfoに基づいて、逆量子化部１１５から供給される変換係数Coeff_IQに対して逆直交変換等を行い、予測残差Ｄ’を導出する。逆変換部１１６は、その予測残差Ｄ’を演算部１１７に供給する。この逆変換部１１６により行われる逆直交変換は、変換部１１２により行われる直交変換の逆処理であり、後述する画像復号装置において行われる逆直交変換と同様の処理である。

　演算部１１７は、逆変換部１１６から供給される予測残差Ｄ’と、予測部１１９より供給される、その予測残差Ｄ’に対応する予測画像Ｐとを加算して局所的な復号画像Recを導出する。演算部１１７は、その局所的な復号画像Recをフレームメモリ１１８に供給する。

　フレームメモリ１１８は、演算部１１７より供給される局所的な復号画像Recを用いてピクチャ単位の復号画像を再構築し、フレームメモリ１１８内のバッファへ格納する。フレームメモリ１１８は、予測部１１９により指定される復号画像を参照画像としてバッファより読み出し、予測部１１９に供給する。また、フレームメモリ１１８は、復号画像の生成に係るヘッダ情報Hinfo、予測情報Pinfo、変換情報Tinfoなどを、フレームメモリ１１８内のバッファに格納するようにしても良い。

　予測部１１９は、イントラ予測部１１９ａと、動き補償部１１９ｂと、動き検出部１１９ｃと、を備える。

　イントラ予測部１１９ａは、予測情報Pinfoのモード情報pred_mode_flagがイントラ予測処理を示す場合に動作する。イントラ予測部１１９ａは、フレームメモリ１１８に格納された符号化対象のCUと同一時刻の復号画像を参照画像として取得する。そして、予測部１１９は、参照画像を用いて、符号化対象のブロックに対して、イントラ予測モード情報が示すイントラ予測モードのイントラ予測処理を行う。

　動き補償部１１９ｂと動き検出部１１９ｃは、モード情報pred_mode_flagがインター予測処理を示す場合に動作する。動き補償部１１９ｂと動き検出部１１９ｃは、参照画像特定情報に基づいて、フレームメモリ１１８に格納された符号化対象のCUとは異なる時刻の復号画像を参照画像として取得する。動き補償部１１９ｂと動き検出部１１９ｃは、Merge　flag、動き補償モード情報、及びパラメータ情報に基づいて、参照画像を用いて、符号化対象のブロックのインター予測処理を行う。

　具体的には、動き補償部１１９ｂと動き検出部１１９ｃは、動き補償モード情報が並進モードを示す場合、１つの動きベクトルに基づいて、参照画像に対して並進移動の補償を行うことにより、並進モードのインター予測処理を行う。なお、Merge　flagが１である場合、インター予測処理に用いられる１つの動きベクトルは、パラメータ情報により特定される１つの予測ベクトルである。一方、Merge　flagが０である場合、インター予測処理に用いられる１つの動きベクトルは、パラメータ情報により特定される１つの予測ベクトルとパラメータ情報に含まれる差分とを加算することにより得られる１つの動きベクトルである。

　また、動き補償部１１９ｂと動き検出部１１９ｃは、動き補償モード情報がアフィン変換モードを示す場合、２つの動きベクトルに基づくアフィン変換を参照画像に対して行うことにより、並進移動、回転方向の動き、及びスケーリングを補償して、アフィン変換モードのインター予測処理を行う。なお、Merge　flagが１である場合、インター予測処理に用いられる２つの動きベクトルは、パラメータ情報により特定される２つの予測ベクトルである。一方、Merge　flagが０である場合、インター予測処理に用いられる２つの動きベクトルは、パラメータ情報により特定される２つの予測ベクトルと、各予測ベクトルに対応してパラメータ情報に含まれる差分とをそれぞれ加算することにより得られる２つの動きベクトルである。

　さらに、動き補償部１１９ｂと動き検出部１１９ｃは、動き補償モード情報が並進回転モードを示す場合、１つの動きベクトルと回転角情報とに基づいて、参照画像に対して並進移動と回転方向の動きの補償を行うことにより、並進回転モードのインター予測処理を行う。なお、Merge　flagが１である場合、インター予測処理に用いられる１つの動きベクトルと回転角情報は、パラメータ情報により特定される予測ベクトルと予測回転角情報である。一方、Merge　flagが０である場合、インター予測処理に用いられる１つの動きベクトルは、パラメータ情報により特定される１つの予測ベクトルとパラメータ情報に含まれる差分とを加算することにより得られる１つの動きベクトルである。また、回転角情報は、パラメータ情報により特定される予測回転角情報とパラメータ情報に含まれる差分とを加算することにより得られる１つの回転角情報である。

　動き補償部１１９ｂと動き検出部１１９ｃは、動き補償モード情報が並進スケーリングモードを示す場合、１つの動きベクトルとスケーリング情報とに基づいて、参照画像に対して並進移動とスケーリングの補償を行うことにより、並進スケーリングモードのインター予測処理を行う。なお、Merge　flagが１である場合、インター予測処理に用いられる１つの動きベクトルとスケーリング情報は、パラメータ情報により特定される予測ベクトルと予測スケーリング情報である。一方、Merge　flagが０である場合、インター予測処理に用いられる１つの動きベクトルは、パラメータ情報により特定される１つの予測ベクトルとパラメータ情報に含まれる差分とを加算することにより得られる１つの動きベクトルである。また、スケーリング情報は、パラメータ情報により特定される予測スケーリング情報とパラメータ情報に含まれる差分とを加算することにより得られる１つのスケーリング情報である。

　予測部１１９は、イントラ予測処理又はインター予測処理の結果生成される予測画像Ｐを演算部１１１や演算部１１７に供給する。

　＜２－２．並進モード＞
　図１２は、並進モードを説明する図である。

　図１２に示すように、動き補償モードが並進モードである場合、予測部１１９は、処理対象のブロック３１の左上の頂点Ｋ１の動きベクトルｖ₀に基づいて、参照画像内の、ブロック３１から動きベクトルｖ₀だけ離れた点Ｋ１’を左上の頂点とするブロック３１と同一のサイズのブロック１３３を並進移動する。そして、予測部１１９は、並進移動後のブロック１３３をブロック３１の予測画像とする。この場合、インター予測処理に用いられるパラメータは、ｖ_0xとｖ_0yの２つである。

　＜２－３．並進回転モード＞
　図１３は並進回転モードを説明する図である。

　図１３に示すように、動き補償モードが並進回転モードである場合、予測部１１９は、処理対象のブロック３１の頂点Ｋ１の動きベクトルｖ₀と回転角情報としての回転角θに基づいて、参照画像内の、ブロック３１から動きベクトルｖ₀だけ離れた点Ｋ１’を左上の頂点とし、回転角θだけ回転したブロック３１と同一のサイズのブロック１３４を並進移動及び回転する。そして、予測部１１９は、並進移動及び回転後のブロック１３４をブロック３１の予測画像とする。この場合、インター予測処理に用いられるパラメータは、ｖ_0x，ｖ_0y、及びθの３つである。

　なお、図１３の例では、回転角情報を、回転角θとしたが、図１４に示すように、頂点Ｋ１の動きベクトルｖ₀と頂点Ｋ２の動きベクトルｖ₁の垂直方向の差分ｄｖ_yとしてもよい。即ち、θが小さい場合、Ｗｓｉｎθは差分ｄｖ_yで近似できるため、回転角θを差分ｄｖ_yに置き換えてもよい。この場合、動き補償時に三角関数の計算を行う必要がなく、動き補償時の計算量を削減することができる。

　＜２－４．並進スケーリングモード＞
　図１５は、並進スケーリングモードを説明する図である。

　図１５に示すように、動き補償モードが並進スケーリングモードである場合、予測部１１９は、処理対象のブロック３１の頂点Ｋ１の動きベクトルｖ₀とスケーリング情報としてのスケーリング率Ｓに基づいて、参照画像内の、ブロック３１から動きベクトルｖ₀だけ離れた点Ｋ１’を左上の頂点とするブロック３１のＳ倍のサイズのブロック１３５を、並進移動及び１／Ｓ倍にスケーリングする。そして、予測部１１９は、並進移動及びスケーリング後のブロック１３５をブロック３１の予測画像とする。この場合、インター予測処理に用いられるパラメータは、ｖ_0x，ｖ_0y、及びＳの３つである。

　なお、スケーリング率Ｓとは、ブロック３１のサイズＷをＳ₁とし、ブロック１３５のｘ方向のサイズをＳ₂としたとき、Ｓ₂／Ｓ₁で表される。サイズＳ₁は既知であるため、スケーリング率Ｓを用いて、サイズＳ₁からサイズＳ₂を求めることができる。

　図１５の例では、スケーリング情報を、スケーリング率Ｓとしたが、図１６に示すように、頂点Ｋ１の動きベクトルｖ₀と頂点Ｋ２の動きベクトルｖ₁の水平方向の差分ｄｖ_xであってもよい。即ち、サイズＳ₂をＳ₁＋ｄｖ_xで近似するようにしてもよい。この場合、ブロック１３５の横方向のサイズＳ₂をサイズＳ₁と差分ｄｖ_xの加算のみで求めることができ、動き補償時の計算量を削減することができる。また、スケーリング率Ｓは、（Ｓ₁＋ｄｖ_x）／Ｓ₁になる。

　＜２－５．動き補償モード情報とパラメータ情報＞
　図１７は、ＡＭＶＰモードにおける動き補償モード情報（ＡＭＶＰモード情報）とパラメータ情報を説明する図である。なお、以下の説明では、並進回転モードのことを、単に「回転モード」ということがある。また、並進スケーリング情報のことを、単に「スケーリングモード」ということがある。

　ＡＭＶＰモードでは、動き補償モードとして、並進モード、アフィン変換モード、回転モード、スケーリングモードがある。図１７に示すように、動き補償モード情報（ＡＭＶＰモード情報）は、affine_flag，rotation_flag、及び、scaling_flagにより構成される。

　affine_flagは、動き補償モードが、通常の並進モード以外のアフィン変換モード、スケーリングモード、又は回転モードであるかどうかを示す情報である。affine_flagは、動き補償モードが、アフィン変換モード、回転モード、又はスケーリングモードであることを示す場合１である。一方、affine_flagは、動き補償モードが、アフィン変換モード、回転モード、及びスケーリングモードではないことを示す場合、即ち動き補償モードが並進モードであることを示す場合、０である。

　rotation_flagは、動き補償モードが、回転モードであるかどうかを示す情報であり、affine_flagが１である場合に設定される。rotation_flagは、動き補償モードが、回転モードである場合、１に設定される。一方、rotation_flagは、動き補償モードが、回転モードではない場合、すなわち、動き補償モードが、スケーリングモード又はアフィン変換モードである場合、０に設定される。

　scaling_flagは、動き補償モードがスケーリングモードであるかどうかを示す情報であり、rotation_flagが０である場合に設定される。scaling_flagは、動き補償モードがスケーリングモードである場合、１に設定され、動き補償モードが、スケーリングモードではない場合、すなわち、動き補償モードが、アフィン変換モードである場合、０に設定される。

　また、動き補償モードが並進モードであるとき、処理対象のブロックの１つの動きベクトルに対応する予測ベクトルを特定する情報がパラメータ情報のrefidx0として設定され、その１つの動きベクトルと予測ベクトルとの差分がパラメータ情報のmvd0として設定される。

　動き補償モードがアフィン変換モードであるとき、並進モードであるときと同様に、パラメータ情報のrefidx0とmvd0が設定される。また、処理対象のブロックのもう１つの動きベクトルに対応する予測ベクトルを特定する情報がパラメータ情報のrefidx1として設定され、その動きベクトルと予測ベクトルとの差分がパラメータ情報のmvd1として設定される。

　動き補償モードがスケーリングモードであるとき、並進モードであるときと同様に、パラメータ情報のrefidx0とmvd0が設定される。また、処理対象のブロックのスケーリング情報に対応する予測スケーリング情報を特定する情報がパラメータ情報のrefidx1として設定され、そのスケーリング情報と予測スケーリング情報との差分がパラメータ情報のdsとして設定される。

　したがって、スケーリング情報がスケーリング率Ｓを表す場合、dsは、処理対象のブロックのスケーリング率Ｓと予測スケーリング情報としてのスケーリング率Ｓとの差分dSである。一方、スケーリング情報が差分ｄｖxを表す場合、dsは、処理対象のブロックの差分ｄｖxと予測スケーリング情報としての差分ｄｖxとの差分mvd1.xである。

　動き補償モードが回転モードであるとき、並進モードであるときと同様に、パラメータ情報のrefidx0とmvd0が設定される。また、処理対象のブロックの角度情報に対応する予測角度情報を特定する情報がrefidx1として設定され、その角度情報と予測角度情報との差分がdrとして設定される。

　したがって、角度情報が回転角θを表す場合、drは、処理対象のブロックの回転角θと予測角度情報としての回転角θ´との差分ｄθである。一方、角度情報が差分ｄｖyを表す場合、drは、処理対象のブロックの差分ｄｖyと予測角度情報としての差分ｄｖyとの差分mvd1.yである。

　図１８は、マージモードにおける動き補償モード情報（マージモード情報）とパラメータ情報を説明する図である。マージモードでは、動き補償モードとして、並進モード、アフィン変換モード、回転モード、スケーリングモードがある。なお、マージモードでは、アフィン変換モードに、通常のアフィン変換モードに加えて、回転モード（以下、強制回転モードともいう。）と、スケーリングモード（以下、強制スケーリングモードともいう。）がある。強制回転モードは、アフィン変換モードの複数の予測成分（並進移動、回転、スケーリング）のうち、スケーリングの予測成分を削減して強制的に回転モードにする動き補償モードである。また、強制スケーリングモードは、アフィン変換モードの複数の予測成分（並進移動、回転、スケーリング）のうち、スケーリングの予測成分を削減して強制的に回転モードにする動き補償モードである。

　図１８に示すように、動き補償モード情報（マージモード情報）は、affine_flag，rotation_flag、及び、scaling_flagにより構成される。

　rotation_flagは、動き補償モードが、回転モード、又は強制回転モードであるかどうかを示す情報であり、affine_flagが１である場合に設定される。rotation_flagは、動き補償モードが、回転モード、又は強制回転モードである場合、１に設定される。一方、rotation_flagは、動き補償モードが、回転モード及び強制回転モードではない場合、すなわち、動き補償モードが、スケーリングモード、強制スケーリングモード、又は通常アフィン変換モードである場合、０に設定される。

　scaling_flagは、動き補償モードがスケーリングモード、又は強制スケーリングモードであるかどうかを示す情報であり、rotation_flagが０である場合に設定される。scaling_flagは、動き補償モードがスケーリングモード、又は強制スケーリングモードである場合、１に設定され、動き補償モードが、スケーリングモード、及び強制スケーリングモードではない場合、すなわち、動き補償モードが、通常アフィン変換モード、回転モード、及び強制回転モードである場合、０に設定される。

なお、インター予測処理のモードがマージモードである場合、パラメータ情報としては、mvd0，mvd1，ds，drは設定されず、refidx0，refidx1が、AMVPモードの場合と同様に設定される。

　＜２－６．予測ベクトルの候補＞
　図１９は、予測ベクトルの候補となる対象パラメータに含まれる動きベクトル（以下、候補ベクトルという）を説明する図である。

　予測部１１９は、図１９の予測対象のブロック１５１の左上の頂点Ｋ１の動きベクトルｖ₀の予測ベクトルｐｖ₀の候補となる候補ベクトルを、頂点Ｋ１を頂点とするブロック１５１の左上の符号化済みのブロックであるブロックａ、上側の符号化済みのブロックであるブロックｂ、又は左側の符号化済みのブロックであるブロックｃの動きベクトルに基づいて生成する。

　また、予測部１１９は、ブロック１５１の右上の頂点Ｋ２の動きベクトルｖ₁の予測ベクトルｐｖ₁の候補となる候補ベクトルを、頂点Ｋ２を頂点とするブロック１５１の上側の符号化済みのブロックであるブロックｄ、又は、右上側の符号化済みのブロックであるブロックｅの動きベクトルに基づいて生成する。なお、ブロックａないしｅの動きベクトルは、予測部１１９において保持される、各ブロックに１つの動きベクトルである。

　以上により、予測ベクトルｐｖ₀とｐｖ₁の候補となる候補ベクトルの生成に用いられる動きベクトルの組み合わせの候補は、６（＝３×２）通りある。予測部１１９は、この６通りの組み合わせの候補のうち、以下の式（３）により求められるDVが最も小さくなる組み合わせを、予測ベクトルｐｖ₀とｐｖ₁の候補となる候補ベクトルの生成に用いられる動きベクトルの組み合わせとして選択する。

　なお、ｖ_0x´，ｖ_0y´は、予測ベクトルｐｖ₀の生成に用いられるブロックａないしｃのいずれかのｘ方向、ｙ方向の動きベクトルである。ｖ_1x´，ｖ_1y´は、予測ベクトルｐｖ₁の生成に用いられるブロックｄ及びｅのいずれかのｘ方向、ｙ方向の動きベクトルである。ｖ_2x´，ｖ_2y´は、ブロック１５１の頂点Ｋ３を頂点とするブロック１５１の左側の符号化済みのブロックであるブロックｆ、及び、左下側の符号化済みのブロックであるブロックｇのいずれかのｘ方向、ｙ方向の動きベクトルである。ブロックｆ及びｇの動きベクトルは、予測部１１９において保持される、各ブロックに１つの動きベクトルである。

　式（３）によれば、動きベクトルｖ₀´（ｖ_0x´，ｖ_0y´）ないしｖ₂´（ｖ_2x´，ｖ_2y´）に基づくアフィン変換により、２つの動きベクトルに基づくアフィン変換では不可能なスキュー以外が行われる場合、DVが小さくなる。

　＜２－７．画像符号化装置の処理＞
　図２０は、画像符号化装置１００が実行する画像符号化処理を説明するフローチャートである。

　制御部１０１は、外部からの入力及びRDO等に基づいて、符号化パラメータ（ヘッダ情報Hinfo、予測情報Pinfo、変換情報Tinfo等）を設定する（ステップＳ１１）。制御部１０１は、設定された符号化パラメータを各ブロックへ供給する。制御部１０１は、画像符号化装置１００の設定部として機能する。

　予測部１１９は、現在のスライスがＩ－ＳＬＩＣＥか否か判別する（ステップＳ１２）。Ｉ－ＳＬＩＣＥの場合（ステップＳ１２：Ｙｅｓ）、予測部１１９は、ステップＳ１５に処理を進める。予測部１１９は、現在のスライスがＩ－ＳＬＩＣＥか否か判別する（ステップＳ１２）。Ｉ－ＳＬＩＣＥでない場合（ステップＳ１２：Ｎｏ）、予測部１１９は、現在のモードがスキップモードか否か判別する（ステップＳ１３）。スキップモードの場合（ステップＳ１３：Ｙｅｓ）、予測部１１９は、ステップＳ１８に処理を進める。

　予測部１１９は、現在のモードがインターモードか否か判別する（ステップＳ１４）。例えば、予測部１１９は、予測情報Pinfoのモード情報pred_mode_flagが、インター予測処理を示すかどうかを判定する。インターモードでない場合（ステップＳ１４：Ｎｏ）、予測部１１９のイントラ予測部１１９ａは、イントラ符号化処理を実行する（ステップＳ１５）。

　インターモードの場合（ステップＳ１４：Ｙｅｓ）、予測部１１９は、予測情報PinfoのMerge　flagが１であるかどうかを判定する（ステップＳ１６）。Merge　flagが１でない場合（ステップＳ１６：Ｎｏ）、予測部１１９は、AMVPモード符号化処理を行う（ステップＳ１７）。AMVPモード符号化処理は、AMVPモードのインター予測処理により生成された予測画像Ｐを用いて符号化対象の画像を符号化する処理である。AMVPモード符号化処理については後述する。AMVPモード符号化処理の終了後、画像符号化処理は終了する。

　Merge　flagが１の場合（ステップＳ１６：Ｙｅｓ）、予測部１１９は、affine_flagが１であるかどうかを判定する（ステップＳ１８）。affine_flagが１でない場合（ステップＳ１８：Ｎｏ）、予測部１１９は、並進モード符号化処理を行う（ステップＳ１９）。並進モード符号化処理は、インター符号化処理の一種であり、並進モードのインター予測処理により生成された予測画像Ｐを用いて符号化対象の画像を符号化する処理である。並進モード符号化処理については後述のインター符号化処理の説明の箇所で説明する。並進モード符号化処理の終了後、画像符号化処理は終了する。

　affine_flagが１の場合（ステップＳ１８：Ｙｅｓ）、予測部１１９は、rotation_flagが１であるかどうかを判定する（ステップＳ２０）。rotation_flagが１の場合（ステップＳ２０：Ｙｅｓ）、予測部１１９は、回転モード符号化処理を行う（ステップＳ２１）。回転モード符号化処理は、インター符号化処理の一種であり、回転モード或いは強制回転モードのインター予測処理により生成された予測画像Ｐを用いて符号化対象の画像を符号化する処理である。回転モード符号化処理については後述のインター符号化処理の説明の箇所で説明する。回転モード符号化処理の終了後、画像符号化処理は終了する。

　rotation_flagが１でない場合（ステップＳ２０：Ｎｏ）、予測部１１９は、scaling_flagが１であるかどうかを判定する（ステップＳ２２）。scaling_flagが１の場合（ステップＳ２２：Ｙｅｓ）、予測部１１９は、回転モード符号化処理を行う（ステップＳ２３）。スケーリングモード符号化処理は、インター符号化処理の一種であり、スケーリングモード或いは強制スケーリングモードのインター予測処理により生成された予測画像Ｐを用いて符号化対象の画像を符号化する処理である。スケーリングモード符号化処理については後述のインター符号化処理の説明の箇所で説明する。スケーリングモード符号化処理の終了後、画像符号化処理は終了する。

　scaling_flagが１でない場合（ステップＳ２２：Ｎｏ）、予測部１１９は、通常アフィン変換モード符号化処理を行う（ステップＳ２４）。通常アフィン変換モード符号化処理は、インター符号化処理の一種であり、通常のアフィン変換モードのインター予測処理により生成された予測画像Ｐを用いて符号化対象の画像を符号化する処理である。通常アフィン変換モード符号化処理については後述のインター符号化処理の説明の箇所で説明する。通常アフィン変換モード符号化処理の終了後、画像符号化処理は終了する。

　次に、設定処理を説明する。図２１は、図２０のステップＳ１１の処理のうちの、Merge　flagと動き補償モード情報を設定する設定処理を説明するフローチャートである。この設定処理は、インター予測処理モードの設定のための処理であり、例えば、ブロック単位（PU単位やCU単位）で実行される。なお、以下の説明では、AMVPモードのアフィン変換モードのことを通常アフィン変換モードという。

　制御部１０１は、未だ動き補償モードとして設定されていないモード（並進モード、通常アフィン変換モード、回転モード、強制回転モード、スケーリングモード、又は強制スケーリングモード）を動き補償モードとして設定する（ステップＳ３１）。

　具体的には、まだ並進モードが動き補償モードとして設定されていない場合、制御部１０１は、affine_flagを０に設定する。まだ、通常アフィン変換モードが動き補償モードとして設定されていない場合、制御部１０１は、affine_flagを１に設定し、rotation_flag及びscaling_flagを0に設定する。また、回転モード及び強制回転モードが動き補償モードとして設定されていない場合、affine_flag及びrotation_flagを１に設定し、scaling_flagを0に設定する。また、スケーリングモード及び強制スケーリングモードが動き補償モードとして設定されていない場合、affine_flag及びscaling_flagを１に設定し、rotation_flagを0に設定する。

　制御部１０１は、各ブロックを制御して、処理対象のブロック（PUやCU）に対して、候補となるMerge　flag及び動き補償モード情報以外の予測情報Pinfoごとにンター符号化処理（マージモード符号化処理、及びAMVPモード符号化処理）を行い、ＲＤコストを計算する（ステップＳ３２）。なお、ＲＤコストの計算は、符号化の結果得られる発生ビット量（符号量）、復号画像のSSE（Error　Sum　of　Squares）などに基づいて行われる。

　制御部１０１は、ステップＳ３１で全ての動き補償モードを設定したかどうかを判定する（ステップＳ３３）。全ての動き補償モードを選択していない場合（ステップＳ３３：Ｎｏ）、制御部１０１は、ステップＳ３１に処理を戻す。

　一方、全ての動き補償モードを選択した場合（ステップＳ３３：Ｙｅｓ）、制御部１０１は、マージモードでのＲＤコストが最小か判定する（ステップＳ３４）。具体的には、制御部１０１は、通常アフィン変換モード、回転モード、強制回転モード、スケーリングモード、及び強制スケーリングモードのいずれかでのＲＤコストが最小か判定する。

　マージモードでのＲＤコストが最小でない場合（ステップＳ３４：Ｎｏ）、制御部１０１は、処理対象のブロックのMerge　flagを０に設定し（ステップＳ３５）、ステップＳ３７に処理を進める。一方、マージモードでのＲＤコストが最小の場合（ステップＳ３４：Ｙｅｓ）、制御部１０１は、処理対象のブロックのMerge　flagを１に設定し（ステップＳ３６）、ステップＳ３７に処理を進める。

　続いて、制御部１０１は、並進モードでのＲＤコストが最小か判定する（ステップＳ３７）。並進モードでのＲＤコストが最小の場合（ステップＳ３７：Ｎｏ）、処理対象のブロックのaffine_flagを０に設定し（ステップＳ３９）、設定処理を終了する。一方、並進モードでのＲＤコストが最小でない場合（ステップＳ３７：Ｙｅｓ）、制御部１０１は、処理対象のブロックのaffine_flagを１に設定し（ステップＳ３６）、ステップＳ４０に処理を進める。

　続いて、制御部１０１は、回転モード（或いは強制回転モード）でのＲＤコストが最小か判定する（ステップＳ４０）。回転モード（或いは強制回転モード）でのＲＤコストが最小の場合（ステップＳ４０：Ｎｏ）、処理対象のブロックのrotation_flagを０に設定し（ステップＳ４１）、設定処理を終了する。一方、回転モード（或いは強制回転モード）でのＲＤコストが最小でない場合（ステップＳ４２：Ｙｅｓ）、制御部１０１は、処理対象のブロックのrotation_flagを１に設定し（ステップＳ４２）、ステップＳ４３に処理を進める。

　続いて、制御部１０１は、スケーリングモード（或いは強制スケーリングモード）でのＲＤコストが最小か判定する（ステップＳ４３）。スケーリングモード（或いは強制スケーリングモード）でのＲＤコストが最小の場合（ステップＳ４３：Ｎｏ）、処理対象のブロックのscaling_flagを０に設定し（ステップＳ４４）、設定処理を終了する。一方、スケーリングモード（或いは強制スケーリングモード）でのＲＤコストが最小でない場合（ステップＳ４３：Ｙｅｓ）、制御部１０１は、処理対象のブロックのscaling_flagを１に設定し（ステップＳ４５）、設定処理を終了する。

　次に、インター符号化処理を説明する。図２２は、インター符号化処理を説明するフローチャートである。上述したように、マージモード符号化処理及びＡＭＶＰ符号化処理はインター符号化処理の一種である。このインター符号化処理は、ブロック単位（例えば、CU単位やPU単位）で行われる。

　まず、予測部１１９は、動き情報決定処理を実行する（ステップＳ５１）。動き情報決定処理は、処理対象のブロックに設定する動き情報を決定するための処理である。

　例えば、affine_flagが0である場合、すなわち、動き補償モードが並進モードの場合、予測部１１９は、パラメータ情報に基づいて、予測ベクトルｐｖ₀を決定する。具体的には、予測部１１９は、パラメータ情報が予測ベクトルとして候補ベクトルを特定する情報である場合、図１９に示すブロックａ～ｇの動きベクトルに基づいて、DVが最も小さくなるブロックａ～ｃのいずれかの動きベクトルから生成された候補ベクトルを、予測ベクトルｐｖ₀に決定する。なお、Merge　flagが0の場合は、さらに、予測部１１９は、１つの予測ベクトルｐｖ₀と、パラメータ情報のうちの予測ベクトルｐｖ₀と処理対象のブロックの動きベクトルｖ₀との差分ｄｖ₀とを加算し、処理対象のブロックの動きベクトルｖ₀を計算する。

　また、affine_flagが1、かつ、rotation_flagおよびscaling_flagが0の場合、すなわち、動き補償モードが通常アフィン変換モードの場合、予測部１１９は、パラメータ情報に基づいて、２つの予測ベクトルｐｖ₀及び予測ベクトルｐｖ₁を決定する。具体的には、予測部１１９は、パラメータ情報が予測ベクトルとして候補ベクトルを特定する情報である場合、保持しているブロックａ～ｇの動きベクトルに基づいて、DVが最も小さくなるブロックａ～cのいずれかとブロックｄ及びｅのいずれかの動きベクトルの組み合わせを選択する。そして、予測部１１９は、選択されたブロックａ～cのいずれかの動きベクトルを用いて生成された候補ベクトルを、予測ベクトルｐｖ₀に決定する。また、予測部１１９は、選択されたブロックｄ又はｅの動きベクトルを用いて生成された候補ベクトルを、予測ベクトルｐｖ₁に決定する。そして、予測部１１９は、各予測ベクトルを処理対象のブロックの動きベクトルｖ₀，ｖ₁として用いて、上述した式（１）及び（２）により、各単位ブロックの動きベクトルｖを計算する。

　なお、Merge　flagが0の場合は、予測部１１９は、２つの予測ベクトルのそれぞれと、その予測ベクトルに対応するパラメータ情報のうちの差分とを加算し、処理対象のブロックの２つの動きベクトルを計算する。具体的には、予測部１１９は、予測ベクトルｐｖ₀と、パラメータ情報のうちの予測ベクトルｐｖ₀と処理対象のブロックの動きベクトルｖ₀との差分ｄｖ₀とを加算し、処理対象のブロックの動きベクトルｖ₀を計算する。また、予測部１１９は、予測ベクトルｐｖ₁と、パラメータ情報のうちの予測ベクトルｐｖ₁と処理対象のブロックの動きベクトルｖ₁との差分ｄｖ₁とを加算し、処理対象のブロックの動きベクトルｖ₁を計算する。そして、予測部１１９は、２つの動きベクトルｖ0及びｖ1を用いて、上述した式（１）及び（２）により、各単位ブロックの動きベクトルｖを計算する。

　また、affine_flagおよびrotation_flagが1、かつ、scaling_flagが0の場合、すなわち、動き補償モードが回転モード或いは強制回転モードの場合、予測部１１９は、パラメータ情報に基づいて、１つの予測ベクトルｐｖ0を決定するとともに、予測角度情報を決定する。なお、Merge　flagが0の場合は、さらに、予測部１１９は、１つの動きベクトルｖ0を計算する。また、予測部１１９は、予測角度情報と、パラメータ情報のうちの予測角度情報と処理対象のブロックの角度情報との差分とを加算することにより、処理対象のブロックの角度情報を計算する。

　また、affine_flagおよびscaling_flagが1、かつ、rotation_flagが0の場合、すなわち、動き補償モードがスケーリングモード或いは強制スケーリングモードの場合、予測部１１９は、パラメータ情報に基づいて、１つの予測ベクトルｐｖ₀を決定するとともに、予測スケーリング情報を決定する。なお、Merge　flagが0の場合は、さらに、予測部１１９は、１つの動きベクトルｖ₀を計算する。また、予測部１１９は、予測スケーリング情報と、パラメータ情報のうちの予測スケーリング情報と処理対象のブロックのスケーリング情報とのの差分とを加算することにより、処理対象のブロックのスケーリング情報を計算する。

　次に、予測部１１９は、動き補償を実行する（ステップＳ５２）。

　例えば、affine_flagが０である場合、すなわち、動き補償モードが並進モードの場合、予測部１１９は、フレームメモリ１１８に格納された参照画像特定情報により特定される参照画像に対して並進モードで動き補償を行う。なお、Merge　flagが1の場合は、予測部１１９は、予測ベクトルｐｖ₀を、処理対象のブロックの動きベクトルｖ₀として用いる。予測部１１９は、動き補償が行われた参照画像を予測画像Ｐとして、演算部１１１や演算部１１７に供給する。

　また、affine_flagが1、かつ、rotation_flagおよびscaling_flagが0の場合、すなわち、動き補償モードが通常アフィン変換モードの場合、予測部１１９は、単位ブロックごとに、動きベクトルｖに基づいて、参照画像特定情報により特定される参照画像のブロックを並進移動させることにより、参照画像に対してアフィン変換モードで動き補償を行う。予測部１１９は、動き補償が行われた参照画像を予測画像Ｐとして、演算部１１１や演算部１１７に供給する。

　また、affine_flagおよびrotation_flagが1、かつ、scaling_flagが0の場合、すなわち、動き補償モードが回転モード或いは強制回転モードの場合、予測部１１９は、参照画像に対して回転モードで動き補償を行う。なお、Merge　flagが1の場合は、予測部１１９は、予測ベクトル及び予測角度情報を、処理対象のPUの動きベクトルｖ0及び角度情報として用いる。予測部１１９は、動き補償が行われた参照画像を予測画像Ｐとして、演算部１１１や演算部１１７に供給する。

　また、affine_flagおよびscaling_flagが1、かつ、rotation_flagが0の場合、すなわち、動き補償モードがスケーリングモード或いは強制スケーリングモードの場合、予測部１１９は、参照画像に対してスケーリングモードで動き補償を行う。なお、Merge　flagが1の場合は、予測部１１９は、予測ベクトル及び予測スケーリング情報を、処理対象のブロックの動きベクトルｖ0及びスケーリング情報として用いる。予測部１１９は、動き補償が行われた参照画像を予測画像Ｐとして、演算部１１１や演算部１１７に供給する。

　次に、演算部１１１は、画像Iと予測画像Ｐとの差分を予測残差Ｄとして演算し、それを変換部１１２に供給する（ステップＳ５３）。このようにして求められた予測残差Ｄは、元の画像Ｉに比べてデータ量が低減される。したがって、画像Ｉをそのまま符号化する場合に比べて、データ量を圧縮することができる。

　続いて、変換部１１２は、制御部１０１から供給される変換情報Tinfoに基づいて、演算部１１１から供給される予測残差Ｄに対して直交変換等を行い、変換係数Coeffを導出する（ステップＳ５４）。変換部１１２は、変換係数Coeffを量子化部１１３に供給する。

　量子化部１１３は、制御部１０１から供給される変換情報Tinfoに基づいて、変換部１１２から供給される変換係数Coeffをスケーリング（量子化）し、量子化変換係数レベルlevelを導出する（ステップＳ５５）。量子化部１１３は、量子化変換係数レベルlevelを符号化部１１４及び逆量子化部１１５に供給する。

　逆量子化部１１５は、制御部１０１から供給される変換情報Tinfoに基づいて、量子化部１１３から供給される量子化変換係数レベルlevelを、ステップＳ５５の量子化の特性に対応する特性で逆量子化する（ステップＳ５６）。逆量子化部１１５は、その結果得られる変換係数Coeff_IQを逆変換部１１６に供給する。

　逆変換部１１６は、制御部１０１から供給される変換情報Tinfoに基づいて、逆量子化部１１５から供給される変換係数Coeff_IQに対して、ステップＳ５４の直交変換等に対応する方法で逆直交変換等を行い、予測残差Ｄ’を導出する（ステップＳ５７）。

　演算部１１７は、ステップＳ５７の処理により導出された予測残差Ｄ’を、予測部１１９から供給される予測画像Ｐと加算することにより、局所的な復号画像Recを生成する（ステップＳ５８）。

　フレームメモリ１１８は、ステップＳ５８の処理により得られた、局所的な復号画像Recを用いてピクチャ単位の復号画像を再構築し、フレームメモリ１１８内のバッファへ記憶する（ステップＳ５９）。

　符号化部１１４は、図２０のステップＳ１１の処理により設定された符号化パラメータとステップＳ１１５の処理により得られた量子化変換係数レベルlevelを所定の方法で符号化する（ステップＳ６０）。符号化部１１４は、その結果得られる符号化データを多重化し、符号化ストリームとして画像符号化装置１００の外部に出力する。この符号化ストリームは、例えば、伝送路や記録媒体を介して復号側に伝送される。

　ステップＳ６０の処理が終了すると、インター符号化処理が終了する。

　＜２－８．マージモードの詳細＞
　次に、本開示におけるマージモードの処理を詳細に説明する。

　上述したように、マージモードとは、参照先となる符号化済みのブロックの動き補償に用いられた動き情報に基づいて生成される動き情報に基づいてインター予測処理を行うモードである。図２３は、カレントブロックと参照候補となる符号化済みのブロックとの位置関係を示す図である。図２３の例では、ブロック３１が処理対象のブロック（カレントブロック）であり、ブロックＡ～Ｅが参照候補となる符号化済みのブロックである。多くの場合、カレントブロックに近い位置にあるブロックの動き情報がカレントブロックの動き情報に近い。そのため、図２３の例では、参照候補となるブロックをいずれもカレントブロックに隣接する隣接ブロックとしている。斜め方向にあるブロックも隣接ブロックである。なお、参照候補となるブロックは隣接ブロックに限られない。参照候補となるブロックは同一フレーム中のカレントブロックから離れた位置にあるブロックであってもよい。また、参照候補となるブロックは、他フレーム中のブロック（例えば、前フレームの同一位置にあるブロック）であってもよい。

　図２４～図２９は、マージの振る舞いを示す図である。

　図２４の例では、マージされる領域はブロックＡである。ブロックＡには、スケーリングモードが設定されている。ブロックＡは、ブロックＡを拡大した領域を有するブロックＡ’を参照している。カレントブロック３１には、ブロックＡからブロックＡ’への拡大に合わせて拡大されたブロック１３５を参照するように動き情報が設定される。

　図２５の例では、マージされる領域はブロックＣである。ブロックＣには、スケーリングモードが設定されている。ブロックＣは、ブロックＣを拡大したブロックＣ’を参照している。カレントブロック３１には、ブロックＣからブロックＣ’への拡大に合わせて拡大されたブロック１３５を参照するように動き情報が設定される。

　図２６の例では、マージされる領域はブロックＥである。ブロックＥには、スケーリングモードが設定されている。ブロックＥは、ブロックＥを拡大したブロックＥ’を参照している。カレントブロック３１には、ブロックＥからブロックＥ’への拡大に合わせて拡大されたブロック１３５を参照するように動き情報が設定される。

　図２７の例では、マージされる領域はブロックＡである。ブロックＡには、回転モードが設定されている。ブロックＡは、ブロックＡを回転させたブロックＡ’を参照している。カレントブロック３１には、ブロックＡからブロックＡ’への回転に合わせて回転されたブロック１３４を参照するように動き情報が設定される。

　図２８の例では、マージされる領域はブロックＣである。ブロックＣには、回転モードが設定されている。ブロックＣは、ブロックＣを回転させたブロックＣ’を参照している。カレントブロック３１には、ブロックＣからブロックＣ’への回転に合わせて回転されたブロック１３４を参照するように動き情報が設定される。

　図２９の例では、マージされる領域はブロックＥである。ブロックＥには、回転モードが設定されている。ブロックＥは、ブロックＥを回転させたブロックＥ’を参照している。カレントブロック３１には、ブロックＥからブロックＥ’への回転に合わせて回転されたブロック１３４を参照するように動き情報が設定される。

　図３０は、マージ処理を説明するフローチャートである。マージ処理は、マージモードにおける動き情報決定処理の一例である。図３０の例では、参照候補（マージ候補）となるブロックは図２３に示すブロックＡ～Ｅとなる。

　まず、予測部１１９は、ブロックＡに設定された動き補償モードがアフィン変換モードであるか否か判別する（ステップＳ１０１）。アフィン変換モードの場合（ステップＳ１０１：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＡの動き情報に基づいて生成する（ステップＳ１０２）。このとき、予測部１１９は、通常アフィン変換モード、強制回転モード、及び強制スケーリングモードのうち最もＲＤコストが低いモードで動き情報を生成する。動き情報を生成したら、予測部１１９は、マージ処理を終了する。

　アフィン変換モードでない場合（ステップＳ１０１：Ｎｏ）、予測部１１９は、ブロックＢに設定された動き補償モードがアフィン変換モードであるか否か判別する（ステップＳ１０３）。アフィン変換モードの場合（ステップＳ１０３：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＢの動き情報に基づいて生成する（ステップＳ１０４）。このとき、予測部１１９は、通常アフィン変換モード、強制回転モード、及び強制スケーリングモードのうち最もＲＤコストが低いモードで動き情報を生成する。動き情報を生成したら、予測部１１９は、マージ処理を終了する。

　アフィン変換モードでない場合（ステップＳ１０３：Ｎｏ）、予測部１１９は、ブロックＣに設定された動き補償モードがアフィン変換モードであるか否か判別する（ステップＳ１０５）。アフィン変換モードの場合（ステップＳ１０５：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＣの動き情報に基づいて生成する（ステップＳ１０６）。このとき、予測部１１９は、通常アフィン変換モード、強制回転モード、及び強制スケーリングモードのうち最もＲＤコストが低いモードで動き情報を生成する。動き情報を生成したら、予測部１１９は、マージ処理を終了する。

　アフィン変換モードでない場合（ステップＳ１０５：Ｎｏ）、予測部１１９は、ブロックＤに設定された動き補償モードがアフィン変換モードであるか否か判別する（ステップＳ１０７）。アフィン変換モードの場合（ステップＳ１０７：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＤの動き情報に基づいて生成する（ステップＳ１０８）。このとき、予測部１１９は、通常アフィン変換モード、強制回転モード、及び強制スケーリングモードのうち最もＲＤコストが低いモードで動き情報を生成する。動き情報を生成したら、予測部１１９は、マージ処理を終了する。

　アフィン変換モードでない場合（ステップＳ１０７：Ｎｏ）、予測部１１９は、ブロックＥに設定された動き補償モードがアフィン変換モードであるか否か判別する（ステップＳ１０９）。アフィン変換モードの場合（ステップＳ１０９：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＥの動き情報に基づいて生成する（ステップＳ１１０）。このとき、予測部１１９は、通常アフィン変換モード、強制回転モード、及び強制スケーリングモードのうち最もＲＤコストが低いモードで動き情報を生成する。動き情報を生成したら、予測部１１９は、マージ処理を終了する。

　アフィン変換モードでない場合（ステップＳ１０９：Ｎｏ）、予測部１１９は、通常のマージモードを実行する（ステップＳ１１１）。例えば、予測部１１９は、図２２のインター符号化処理で説明した方法で動き情報を決定する。動き情報を生成したら、予測部１１９は、マージ処理を終了する。

　上述したように、予測部１１９は、マージモードのアフィン変換モードでは、通常アフィン変換モード、強制回転モード、及び強制スケーリングモードのうち最もＲＤコストが低いモードで動き情報を生成する。ここで、通常アフィン変換モード、強制回転モード、及び強制スケーリングモードについて説明する。以下の説明では、通常アフィン変換モード、強制回転モード、及び強制スケーリングモードは、いずれもマージモードでのモードである。

　通常アフィン変換モードは、符号化済みのブロックに設定されたアフィン変換のための第１の種類の動き情報に基づき生成される第１の種類の動き情報をカレントブロックの動き情報として取得する動き補償モードである。ここで、第１の種類の動き情報は、アフィン変換のための複数の予測成分で構成される動き情報である。例えば、第１の種類の動き情報は、並進移動、回転、及びスケーリングの予測成分を少なくとも有する動き情報である。より具体的には、第１の種類の動き情報は、４パラメータ或いは６パラメータの動き情報である。

　強制回転モード、及び強制スケーリングモードは、符号化済みのブロックに設定された第１の種類の動き情報に基づき生成される第２の種類の動き情報をカレントブロックの動き情報として取得する動き補償モードである。ここで、第２の種類の動き情報は、第１の種類の動き情報とはアフィン変換のための予測成分の数が異なる動き情報（例えば、予測成分の数が少ない動き情報）である。例えば、第２の種類の動き情報は、第１の種類の動き情報を構成する複数の予測成分から少なくとも１つの予測成分を除いた１又は複数の予測成分で構成される動き情報である。第１の種類の動き情報が並進移動、回転、及びスケーリングの予測成分を有するのであれば、第２の種類の動き情報は、並進移動、回転、及びスケーリングの予測成分から少なくとも１つの予測成分を除いた動き情報である。

　強制スケーリングモードであれば、第２の種類の動き情報は、並進移動及びスケーリングの予測成分を有し、回転の予測成分を有さない動き情報である。強制回転モードであれば、第２の種類の動き情報は、並進移動及び回転の予測成分を有し、スケーリングの予測成分を有さない動き情報である。第２の種類の動き情報は、第３の種類の動き情報と言い換えることが可能である。

　図３１は、マージの際に計算のために用いる変数を示す図である。小さなブロックがマージされるブロックであり、大きなブロックがカレントブロックである。h_X、w_Xはマージされるブロックの高さと幅である。hとwはカレントブロックの高さと幅である。p_X0はマージされるブロックの左上の位置である。p₀は現時の左上の位置である。v_X0、v_X1、v_X2はマージされるブロックの角の動き情報である。v₀、v₁、v₂はカレントブロックの角の動き情報である。

　図３１の例の場合、スケーリングモードでのマージで使う動き情報の導出式は、例えば、以下の式（４）～（６）の通りである。これにより、予測部１１９は、カレントブロックがスケーリングの動き予測となるようにパラメータを導出できる。

　また、回転モードでのマージで使う動き情報の導出式は、例えば、以下の式（７）～（９）の通りである。これにより、予測部１１９は、カレントブロックが回転の動き予測となるようにパラメータを導出できる。

　図３２は、マージ処理の他の例を説明するフローチャートである。図３２に示すマージ処理は、ブロックＡ～Ｅに、アフィン変換モード或いは回転モードが設定されていることを想定したマージ処理の例である。

　ステップＳ１０１～ステップＳ１１０は、図３０のステップＳ１０１～ステップＳ１１０と同じであるので説明を省略する。

　ブロックＥがアフィン変換モードでない場合（ステップＳ１０９：Ｎｏ）、予測部１１９は、ブロックＡに設定された動き補償モードが回転モードであるか否か判別する（ステップＳ１２１）。回転モードの場合（ステップＳ１２１：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＡの動き情報に基づいて生成する（ステップＳ１２２）。

　ブロックＡが回転モードでない場合（ステップＳ１２１：Ｎｏ）、予測部１１９は、ブロックＢに設定された動き補償モードが回転モードであるか否か判別する（ステップＳ１２３）。回転モードの場合（ステップＳ１２３：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＢの動き情報に基づいて生成する（ステップＳ１２４）。

　ブロックＢが回転モードでない場合（ステップＳ１２３：Ｎｏ）、予測部１１９は、ブロックＣに設定された動き補償モードが回転モードであるか否か判別する（ステップＳ１２５）。回転モードの場合（ステップＳ１２５：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＣの動き情報に基づいて生成する（ステップＳ１２６）。

　ブロックＣが回転モードでない場合（ステップＳ１２５：Ｎｏ）、予測部１１９は、ブロックＤに設定された動き補償モードが回転モードであるか否か判別する（ステップＳ１２７）。回転モードの場合（ステップＳ１２７：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＤの動き情報に基づいて生成する（ステップＳ１２８）。

　ブロックＤが回転モードでない場合（ステップＳ１２７：Ｎｏ）、予測部１１９は、ブロックＥに設定された動き補償モードが回転モードであるか否か判別する（ステップＳ１２９）。回転モードの場合（ステップＳ１２９：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＥの動き情報に基づいて生成する（ステップＳ１３０）。

　ブロックＥが回転モードでない場合（ステップＳ１２９：Ｎｏ）、予測部１１９は、通常のマージモードを実行する（ステップＳ１１１）。動き情報を生成したら、予測部１１９は、マージ処理を終了する。

　図３３は、マージ処理の他の例を説明するフローチャートである。図３３に示すマージ処理は、ブロックＡ～Ｅに、アフィン変換モード或いはスケーリングモードが設定されていることを想定したマージ処理の例である。図３２の例では、参照候補（マージ候補）となるブロックは図２３に示すブロックＡ～Ｅとなる。

　ブロックＥがアフィン変換モードでない場合（ステップＳ１０９：Ｎｏ）、予測部１１９は、ブロックＡに設定された動き補償モードがスケーリングモードであるか否か判別する（ステップＳ１４１）。スケーリングモードの場合（ステップＳ１４１：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＡの動き情報に基づいて生成する（ステップＳ１４２）。

　ブロックＡがスケーリングモードでない場合（ステップＳ１４１：Ｎｏ）、予測部１１９は、ブロックＢに設定された動き補償モードが回転モードであるか否か判別する（ステップＳ１４３）。スケーリングモードの場合（ステップＳ１４３：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＢの動き情報に基づいて生成する（ステップＳ１４４）。

　ブロックＢがスケーリングモードでない場合（ステップＳ１４３：Ｎｏ）、予測部１１９は、ブロックＣに設定された動き補償モードが回転モードであるか否か判別する（ステップＳ１４５）。スケーリングモードの場合（ステップＳ１４５：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＣの動き情報に基づいて生成する（ステップＳ１４６）。

　ブロックＣがスケーリングモードでない場合（ステップＳ１４５：Ｎｏ）、予測部１１９は、ブロックＤに設定された動き補償モードが回転モードであるか否か判別する（ステップＳ１４７）。スケーリングモードの場合（ステップＳ１２７：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＤの動き情報に基づいて生成する（ステップＳ１４８）。

　ブロックＤがスケーリングモードでない場合（ステップＳ１４７：Ｎｏ）、予測部１１９は、ブロックＥに設定された動き補償モードが回転モードであるか否か判別する（ステップＳ１４９）。スケーリングモードの場合（ステップＳ１４９：Ｙｅｓ）、予測部１１９は、カレントブロック３１の動き情報をブロックＥの動き情報に基づいて生成する（ステップＳ１５０）。

　ブロックＥがスケーリングモードでない場合（ステップＳ１４９：Ｎｏ）、予測部１１９は、通常のマージモードを実行する（ステップＳ１１１）。動き情報を生成したら、予測部１１９は、マージ処理を終了する。

　以上に説明したように、本実施形態では、アフィン変換のマージモードに、通常のアフィン変換モード（第１のモード）に加えて、予測成分を削減して強制的に並進回転モードや並進スケーリングモードとする第２、第３のモード（強制回転モード、強制スケーリングモード）が用意されている。そのため、画像符号化装置１００は、参照先となる符号化済みブロックの動き情報がアフィン変換モードの動き補償モードであっても、高精度の予測画像を生成できる。

　＜２－９．画像復号装置の構成例＞
　図３４は、本開示の画像処理装置の一例である画像復号装置２００の構成例を示すブロック図である。画像復号装置２００は、図１１の画像符号化装置１００により生成された符号化ストリームを、画像符号化装置１００における符号化方法に対応する復号方法で復号する。例えば、画像復号装置２００は、HEVCに提案された技術や、JVETにて提案された技術を実装している。

　なお、図３４においては、処理部やデータの流れ等の主なものを示しており、図３４に示されるものが全てとは限らない。つまり、画像復号装置２００において、図３４においてブロックとして示されていない処理部が存在したり、図３４において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図３４の画像復号装置２００は、復号部２１１、逆量子化部２１２、逆変換部２１３、演算部２１４、フレームメモリ２１５、及び予測部２１６を有する。画像符号化装置１００は、画像符号化装置１００により生成された符号化ストリームに対してブロック毎（例えばCUごと）に復号を行う。

　具体的には、画像復号装置２００の復号部２１１は、画像符号化装置１００により生成された符号化ストリームを、符号化部１１４における符号化方法に対応する所定の復号方法で復号する。例えば、復号部２１１は、シンタックステーブルの定義に沿って、符号化ストリームのビット列から、符号化パラメータ（ヘッダ情報Hinfo、予測情報Pinfo、変換情報Tinfo等）と量子化変換係数レベルlevelを復号する。また、復号部２１１は、符号化パラメータに含まれるsplit　flagに基づいてLCUを分割し、各量子化変換係数レベルlevelに対応するCUを順に復号対象のブロック（CU,PU,TU）に設定する。

　これらパラメータには、動き補償モード情報が含まれる。そして、復号部２１１は、これらパラメータを画像復号装置２００に設定する。この場合、復号部２１１は、画像復号装置２００の設定部として機能する。例えば、復号部２１１は、符号化パラメータを各ブロックへ供給する。例えば、復号部２１１は、予測情報Pinfoを予測部２１６に供給し、変換情報Tinfoを逆量子化部２１２と逆変換部２１３に供給し、ヘッダ情報Hinfoを各ブロックに供給する。また、復号部２１１は、量子化変換係数レベルlevelを逆量子化部２１２に供給する。

　逆量子化部２１２は、復号部２１１から供給される変換情報Tinfoに基づいて、復号部２１１から供給される量子化変換係数レベルlevelの値をスケーリング（逆量子化）し、変換係数Coeff_IQを導出する。この逆量子化は、画像符号化装置１００の量子化部１１３（図１１）により行われる量子化の逆処理である。なお、逆量子化部１１５（図１１）は、この逆量子化部２１２と同様の逆量子化を行う。逆量子化部２１２は、得られた変換係数Coeff_IQを逆変換部２１３に供給する。

　逆変換部２１３は、復号部２１１から供給される変換情報Tinfo等に基づいて、逆量子化部２１２より供給される変換係数Coeff_IQに対して逆直交変換等を行い、予測残差Ｄ’を導出する。この逆直交変換は、画像符号化装置１００の変換部１１２（図１１）により行われる直交変換の逆処理である。なお、逆変換部１１６は、この逆変換部２１３と同様の逆直交変換を行う。逆変換部２１３は、得られた予測残差Ｄ’を演算部２１４に供給する。

　演算部２１４は、逆変換部２１３から供給される予測残差Ｄ’とその予測残差Ｄ’に対応する予測画像Ｐとを加算し、局所的な復号画像Recを導出する。演算部２１４は、得られた局所的な復号画像Recを用いてピクチャ単位毎の復号画像を再構築し、得られた復号画像を画像復号装置２００の外部に出力する。また、演算部２１４は、その局所的な復号画像Recをフレームメモリ２１５にも供給する。

　フレームメモリ２１５は、演算部２１４より供給される局所的な復号画像Recを用いてピクチャ単位毎の復号画像を再構築し、フレームメモリ２１５内のバッファに格納する。フレームメモリ２１５は、予測部２１６により指定される復号画像を参照画像としてバッファより読み出し、予測部２１６に供給する。また、フレームメモリ２１５は、その復号画像の生成に係るヘッダ情報Hinfo、予測情報Pinfo、変換情報Tinfoなどをフレームメモリ２１５内のバッファに格納するようにしても良い。

　予測部２１６は、予測情報Pinfoのモード情報pred_mode_flagがイントラ予測処理を示す場合、フレームメモリ２１５に格納された符号化対象のCUと同一時刻の復号画像を参照画像として取得する。そして、予測部２１６は、参照画像を用いて、符号化対象のブロックに対して、イントラ予測モード情報が示すイントラ予測モードのイントラ予測処理を行う。

　また、予測部２１６は、モード情報pred_mode_flagがインター予測処理を示す場合、参照画像特定情報に基づいて、フレームメモリ２１５に格納された符号化対象のブロック（例えば、CU）とは異なる時刻の復号画像を参照画像として取得する。予測部２１６は、図１１の予測部１１９と同様に、Merge　flag、動き補償モード情報、及びパラメータ情報に基づいて、参照画像を用いて、符号化対象のブロックのインター予測処理を行う。予測部２１６は、イントラ予測処理又はインター予測処理の結果生成される予測画像Ｐを演算部２１４に供給する。

　＜２－１０．画像復号装置の処理＞
　図３５は、画像復号装置２００の画像復号処理を説明するフローチャートである。

　復号部２１１は、画像復号装置２００に供給される符号化ストリームを復号し、符号化パラメータと量子化変換係数レベルlevelを得る（ステップＳ７１）。復号部２１１は、符号化パラメータを各ブロックへ供給する。また、復号部２１１は、量子化変換係数レベルlevelを逆量子化部２１２に供給する。

　続いて、復号部２１１は、符号化パラメータに含まれるsplit　flagに基づいてLCUを分割し、各量子化変換係数レベルlevelに対応するCUを復号対象のブロック（CU,PU,TU）に設定する（ステップＳ７２）。後述の処理は、復号対象のブロック（CU,PU,TU）ごとに行われる。

　続いて、予測部２１６は、現在のスライスがＩ－ＳＬＩＣＥか否か判別する（ステップＳ７３）。Ｉ－ＳＬＩＣＥの場合（ステップＳ７３：Ｙｅｓ）、予測部２１６は、ステップＳ７６に処理を進める。予測部２１６は、現在のスライスがＩ－ＳＬＩＣＥか否か判別する（ステップＳ７３）。Ｉ－ＳＬＩＣＥでない場合（ステップＳ７３：Ｎｏ）、予測部２１６は、現在のモードがスキップモードか否か判別する（ステップＳ７４）。スキップモードの場合（ステップＳ７４：Ｙｅｓ）、予測部２１６は、ステップＳ７９に処理を進める。

　予測部２１６は、現在のモードがインターモードか否か判別する（ステップＳ７５）。例えば、予測部２１６は、予測情報Pinfoのモード情報pred_mode_flagが、インター予測処理を示すかどうかを判定する。インターモードでない場合（ステップＳ７５：Ｎｏ）、予測部２１６は、イントラ復号処理を実行する（ステップＳ７６）。

　インターモードの場合（ステップＳ７５：Ｙｅｓ）、予測部２１６は、予測情報PinfoのMerge　flagが１であるかどうかを判定する（ステップＳ７７）。Merge　flagが１でない場合（ステップＳ７７：Ｎｏ）、予測部２１６は、AMVPモード復号処理を行う（ステップＳ７８）。AMVPモード復号処理は、AMVPモードのインター予測処理により生成された予測画像Ｐを用いて復号対象の画像を復号する処理である。AMVPモード復号処理については後述する。AMVPモード復号処理の終了後、画像復号処理は終了する。

　Merge　flagが１の場合（ステップＳ７７：Ｙｅｓ）、予測部２１６は、affine_flagが１であるかどうかを判定する（ステップＳ７９）。affine_flagが１でない場合（ステップＳ７９：Ｎｏ）、予測部２１６は、並進モード復号処理を行う（ステップＳ８０）。並進モード復号処理は、インター復号処理の一種であり、並進モードのインター予測処理により生成された予測画像Ｐを用いて復号対象の画像を復号する処理である。並進モード復号処理については後述のインター復号処理の説明の箇所で説明する。並進モード復号処理の終了後、画像復号処理は終了する。

　affine_flagが１の場合（ステップＳ７９：Ｙｅｓ）、予測部２１６は、rotation_flagが１であるかどうかを判定する（ステップＳ８１）。rotation_flagが１の場合（ステップＳ８１：Ｙｅｓ）、予測部２１６は、回転モード復号処理を行う（ステップＳ８２）。回転モード復号処理は、インター復号処理の一種であり、回転モード或いは強制回転モードのインター予測処理により生成された予測画像Ｐを用いて復号対象の画像を復号する処理である。回転モード復号処理については後述のインター復号処理の説明の箇所で説明する。回転モード復号処理の終了後、画像復号処理は終了する。

　rotation_flagが１でない場合（ステップＳ８１：Ｎｏ）、予測部２１６は、scaling_flagが１であるかどうかを判定する（ステップＳ８３）。scaling_flagが１の場合（ステップＳ８３：Ｙｅｓ）、予測部２１６は、スケーリングモード復号処理を行う（ステップＳ８４）。スケーリングモード復号処理は、インター復号処理の一種であり、スケーリングモード或いは強制スケーリングモードのインター予測処理により生成された予測画像Ｐを用いて復号対象の画像を復号する処理である。スケーリングモード復号処理については後述のインター復号処理の説明の箇所で説明する。スケーリングモード復号処理の終了後、画像復号処理は終了する。

　scaling_flagが１でない場合（ステップＳ８３：Ｎｏ）、予測部２１６は、通常アフィン変換モード復号処理を行う（ステップＳ８５）。通常アフィン変換モード復号処理は、インター復号処理の一種であり、通常のアフィン変換モードのインター予測処理により生成された予測画像Ｐを用いて復号対象の画像を復号する処理である。通常アフィン変換モード復号処理については後述のインター復号処理の説明の箇所で説明する。通常アフィン変換モード復号処理の終了後、画像復号処理は終了する。

　インター復号処理を説明する。図３６は、インター復号処理を説明するフローチャートである。上述したように、マージモード符号化処理及びＡＭＶＰ符号化処理はインター復号処理の一種である。このインター復号処理は、ブロック単位（例えば、CU単位やPU単位）で行われる。

　逆量子化部２１２は、図３５のステップＳ７１の処理により得られた量子化変換係数レベルlevelを逆量子化して変換係数Coeff_IQを導出する（ステップＳ９１）。この逆量子化は、画像符号化処理のステップＳ５５（図２２）において行われる量子化の逆処理であり、画像符号化処理のステップＳ５６（図２２）において行われる逆量子化と同様の処理である。

　逆変換部２１３は、ステップＳ９１の処理により得られた変換係数Coeff_IQに対して逆直交変換等を行い、予測残差Ｄ'を導出する（ステップＳ９１）。この逆直交変換は、画像符号化処理のステップＳ５４（図２２）において行われる直交変換の逆処理であり、画像符号化処理のステップＳ５７（図２２）において行われる逆直交変換と同様の処理である。

　ステップＳ９４及びステップＳ９５の処理は、予測部１１９ではなく予測部２１６により行われる点を除いて、図２２のステップＳ５１及びステップＳ５２の処理と同様であるので、説明は省略する。

　演算部２１４は、ステップＳ９２で導出された予測残差Ｄ’を、予測部２１６から供給される予測画像Ｐと加算し、局所的な復号画像Recを導出する（ステップＳ９６）。演算部２１４は、得られた局所的な復号画像Recを用いてピクチャ単位毎の復号画像を再構築し、得られた復号画像を画像復号装置２００の外部に出力する。また、演算部２１４は、その局所的な復号画像Recをフレームメモリ２１５に供給する。

　フレームメモリ２１５は、演算部２１４より供給される局所的な復号画像Recを用いてピクチャ単位毎の復号画像を再構築し、フレームメモリ２１５内のバッファに記憶する（ステップＳ９６）。そして、画像復号装置２００は、インター復号処理を終了する。

　以上に説明したように、本実施形態では、アフィン変換のマージモードに、通常のアフィン変換モード（第１のモード）に加えて、予測成分を削減して強制的に並進回転モードや並進スケーリングモードとする第２、第３のモード（強制回転モード、強制スケーリングモード）が用意されている。そのため、画像復号装置２００は、参照先となる符号化済みブロックの動き情報がアフィン変換モードの動き補償モードであっても、高精度の予測画像を生成できる。

　＜＜３．第２実施の形態＞＞
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図３７は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータ８００において、CPU（Central　Processing　Unit）８０１，ROM（Read　Only　Memory）８０２，RAM（Random　Access　Memory）８０３は、バス８０４により相互に接続されている。

　バス８０４には、さらに、入出力インタフェース８１０が接続されている。入出力インタフェース８１０には、入力部８１１、出力部８１２、記憶部８１３、通信部８１４、及びドライブ８１５が接続されている。

　入力部８１１は、キーボード、マウス、マイクロホンなどよりなる。出力部８１２は、ディスプレイ、スピーカなどよりなる。記憶部８１３は、ハードディスクや不揮発性のメモリなどよりなる。通信部８１４は、ネットワークインタフェースなどよりなる。ドライブ８１５は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア８２１を駆動する。

　以上のように構成されるコンピュータ８００では、CPU８０１が、例えば、記憶部８１３に記憶されているプログラムを、入出力インタフェース８１０及びバス８０４を介して、RAM８０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ８００（CPU８０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８２１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。

　コンピュータ８００では、プログラムは、リムーバブルメディア８２１をドライブ８１５に装着することにより、入出力インタフェース８１０を介して、記憶部８１３にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部８１４で受信し、記憶部８１３にインストールすることができる。その他、プログラムは、ROM８０２や記憶部８１３に、あらかじめインストールしておくことができる。

　なお、コンピュータ８００が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　＜＜４．第３実施の形態＞＞
　図３８は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース（I/F）部９０９、制御部９１０、ユーザインタフェース（I/F）部９１１、及びバス９１２を備える。

　チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

　デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからEPG（Electronic　Program　Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

　デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

　映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのGUI（Graphical　User　Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

　表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic　ElectroLuminescence　Display）（有機ELディスプレイ）など）の映像面上に映像又は画像を表示する。

　音声信号処理部９０７は、デコーダ９０４から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

　外部インタフェース部９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース部９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース部９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

　制御部９１０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

　ユーザインタフェース部９１１は、制御部９１０と接続される。ユーザインタフェース部９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

　バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース部９０９及び制御部９１０を相互に接続する。

　このように構成されたテレビジョン装置９００において、デコーダ９０４が、上述した画像復号装置２００の機能を有するようにしてもよい。つまり、デコーダ９０４が、符号化データを、以上の各実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、テレビジョン装置９００は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　また、このように構成されたテレビジョン装置９００において、映像信号処理部９０５が、例えば、デコーダ９０４から供給される画像データを符号化し、得られた符号化データを、外部インタフェース部９０９を介してテレビジョン装置９００の外部に出力させることができるようにしてもよい。そして、その映像信号処理部９０５が、上述した画像符号化装置１００の機能を有するようにしてもよい。つまり、映像信号処理部９０５が、デコーダ９０４から供給される画像データを、以上の各実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、テレビジョン装置９００は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　＜＜５．第４実施の形態＞＞
　図３９は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

　アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

　携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

　音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させるとともに、電子メールデータを記録再生部９２９に供給し、その記憶媒体に書き込ませる。

　記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Universal　Serial　Bus）メモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

　また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９に供給し、その記憶媒体に書き込ませる。

　さらに、画像表示モードにおいて、記録再生部９２９は、記憶媒体に記録されている符号化ストリームを読み出して画像処理部９２７へ出力する。画像処理部９２７は、記録再生部９２９から入力される符号化ストリームを復号し、画像データを表示部９３０に供給し、その画像を表示させる。

　また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　このように構成された携帯電話機９２０において、例えば画像処理部９２７が、上述した画像符号化装置１００の機能を有するようにしてもよい。つまり、画像処理部９２７が、画像データを、以上の各実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、携帯電話機９２０は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　また、このように構成された携帯電話機９２０において、例えば画像処理部９２７が、上述した画像復号装置２００の機能を有するようにしてもよい。つまり、画像処理部９２７が、符号化データを、以上の各実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、携帯電話機９２０は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　＜＜６．第５実施の形態＞＞
　図４０は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

　記録再生装置９４０は、チューナ９４１、外部インタフェース（I/F）部９４２、エンコーダ９４３、HDD（Hard　Disk　Drive）部９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、OSD（On-Screen　Display）部９４８、制御部９４９、及びユーザインタフェース（I/F）部９５０を備える。

　チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送部としての役割を有する。

　外部インタフェース部９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース部９４２は、例えば、IEEE（Institute　of　Electrical　and　Electronic　Engineers）1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース部９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース部９４２は、記録再生装置９４０における伝送部としての役割を有する。

　エンコーダ９４３は、外部インタフェース部９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

　HDD部９４４は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、HDD部９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

　ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばDVD（Digital　Versatile　Disc）ディスク（DVD-Video、DVD-RAM（DVD　-　Random　Access　Memory）、DVD-R（DVD　-　Recordable）、DVD-RW（DVD　-　Rewritable）、DVD+R（DVD　+　Recordable）、DVD+RW（DVD　+　Rewritable）等）又はBlu-ray（登録商標）ディスクなどであってよい。

　セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD部９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、HDD部９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

　デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをOSD部９４８へ出力する。また、デコーダ９４７は、生成した音声データを外部のスピーカへ出力する。

　OSD部９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、OSD部９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。

　制御部９４９は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

　ユーザインタフェース部９５０は、制御部９４９と接続される。ユーザインタフェース部９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

　このように構成された記録再生装置９４０において、例えばエンコーダ９４３が、上述した画像符号化装置１００の機能を有するようにしてもよい。つまり、エンコーダ９４３が、画像データを、以上の各実施の形態において説明方法で符号化するようにしてもよい。このようにすることにより、記録再生装置９４０は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　また、このように構成された記録再生装置９４０において、例えばデコーダ９４７が、上述した画像復号装置２００の機能を有するようにしてもよい。つまり、デコーダ９４７が、符号化データを、以上の各実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、記録再生装置９４０は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　＜＜７．第６実施の形態＞＞
　図４１は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

　撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース（I/F）部９６６、メモリ部９６７、メディアドライブ９６８、OSD部９６９、制御部９７０、ユーザインタフェース（I/F）部９７１、及びバス９７２を備える。

　光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース部９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、OSD部９６９、及び制御部９７０を相互に接続する。

　光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、CCD（Charge　Coupled　Device）又はCMOS（Complementary　Metal　Oxide　Semiconductor）などのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

　信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

　画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース部９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース部９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、OSD部９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

　OSD部９６９は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部９６４へ出力する。

　外部インタフェース部９６６は、例えばUSB入出力端子として構成される。外部インタフェース部９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース部９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース部９６６は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース部９６６は、撮像装置９６０における伝送部としての役割を有する。

　メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid　State　Drive）のような非可搬性の記憶部が構成されてもよい。

　制御部９７０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

　ユーザインタフェース部９７１は、制御部９７０と接続される。ユーザインタフェース部９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース部９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

　このように構成された撮像装置９６０において、例えば画像処理部９６４が、上述した画像符号化装置１００の機能を有するようにしてもよい。つまり、画像処理部９６４が、画像データを、以上の各実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、撮像装置９６０は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　また、このように構成された撮像装置９６０において、例えば画像処理部９６４が、上述した画像復号装置２００の機能を有するようにしてもよい。つまり、画像処理部９６４が、符号化データを、以上の各実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、撮像装置９６０は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　＜＜８．第７実施の形態＞＞
　＜８－１．ビデオセットの構成例＞
　また、本技術は、任意の装置又はシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large　Scale　Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。図４２は、本技術を適用したビデオセットの概略的な構成の一例を示している。

　近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

　図４２に示されるビデオセット１３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

　図４２に示されるように、ビデオセット１３００は、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、及びフロントエンドモジュール１３１４等のモジュール群と、コネクティビティ１３２１、カメラ１３２２、及びセンサ１３２３等の関連する機能を有するデバイスとを有する。

　モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

　図４２の例の場合、ビデオモジュール１３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ、ビデオプロセッサ、ブロードバンドモデム１３３３、及びRFモジュール１３３４を有する。

　プロセッサは、所定の機能を有する構成をSoC（System　On　a　Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large　Scale　Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

　図４２のアプリケーションプロセッサ１３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ１３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ１３３２等、ビデオモジュール１３１１内外の構成を必要に応じて制御することもできる。

　ビデオプロセッサ１３３２は、画像の符号化・復号（その一方又は両方）に関する機能を有するプロセッサである。

　ブロードバンドモデム１３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（又はその両方）の広帯域通信により送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、その広帯域通信により受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。ブロードバンドモデム１３３３は、例えば、ビデオプロセッサ１３３２が処理する画像データ、画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報を処理する。

　RFモジュール１３３４は、アンテナを介して送受信されるRF（Radio　Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール１３３４は、ブロードバンドモデム１３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール１３３４は、フロントエンドモジュール１３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

　なお、図４２において点線１３４１に示されるように、アプリケーションプロセッサ１３３１とビデオプロセッサ１３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

　外部メモリ１３１２は、ビデオモジュール１３１１の外部に設けられた、ビデオモジュール１３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ１３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic　Random　Access　Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

　パワーマネージメントモジュール１３１３は、ビデオモジュール１３１１（ビデオモジュール１３１１内の各構成）への電力供給を管理し、制御する。

　フロントエンドモジュール１３１４は、RFモジュール１３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図４２に示されるように、フロントエンドモジュール１３１４は、例えば、アンテナ部１３５１、フィルタ１３５２、及び増幅部１３５３を有する。

　アンテナ部１３５１は、無線信号を送受信するアンテナ及びその周辺の構成を有する。アンテナ部１３５１は、増幅部１３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ１３５２に供給する。フィルタ１３５２は、アンテナ部１３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール１３３４に供給する。増幅部１３５３は、RFモジュール１３３４から供給されるRF信号を増幅し、アンテナ部１３５１に供給する。

　コネクティビティ１３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ１３２１の物理構成は、任意である。例えば、コネクティビティ１３２１は、ブロードバンドモデム１３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

　例えば、コネクティビティ１３２１が、Bluetooth（登録商標）、IEEE　802.11（例えばWi-Fi（Wireless　Fidelity、登録商標））、NFC（Near　Field　Communication）、IrDA（InfraRed　Data　Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ１３２１が、USB（Universal　Serial　Bus）、HDMI（登録商標）（High-Definition　Multimedia　Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ１３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

　なお、コネクティビティ１３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ１３２１が、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid　State　Drive）、NAS（Network　Attached　Storage）等も含む）を有するようにしてもよい。また、コネクティビティ１３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

　カメラ１３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ１３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ１３３２に供給されて符号化される。

　センサ１３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ１３２３により検出されたデータは、例えば、アプリケーションプロセッサ１３３１に供給されてアプリケーション等により利用される。

　以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

　以上のような構成のビデオセット１３００において、後述するようにビデオプロセッサ１３３２に本技術を適用することができる。したがって、ビデオセット１３００は、本技術を適用したセットとして実施することができる。

　＜８－２．ビデオプロセッサの構成例＞
　図４３は、本技術を適用したビデオプロセッサ１３３２（図４２）の概略的な構成の一例を示している。

　図４３の例の場合、ビデオプロセッサ１３３２は、ビデオ信号及びオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータ及びオーディオデータを復号し、ビデオ信号及びオーディオ信号を再生出力する機能とを有する。

　図４３に示されるように、ビデオプロセッサ１３３２は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、フレームメモリ１４０５、及びメモリ制御部１４０６を有する。また、ビデオプロセッサ１３３２は、エンコード・デコードエンジン１４０７、ビデオES（Elementary　Stream）バッファ１４０８Ａ及び１４０８Ｂ、並びに、オーディオESバッファ１４０９Ａ及び１４０９Ｂを有する。さらに、ビデオプロセッサ１３３２は、オーディオエンコーダ１４１０、オーディオデコーダ１４１１、多重化部（MUX（Multiplexer））１４１２、逆多重化部（DMUX（Demultiplexer））１４１３、及びストリームバッファ１４１４を有する。

　ビデオ入力処理部１４０１は、例えばコネクティビティ１３２１（図４２）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部１４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部１４０３は、画像データに対して、ビデオ出力処理部１４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部１４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部１４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ１３２１等に出力する。

　フレームメモリ１４０５は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、及びエンコード・デコードエンジン１４０７によって共用される画像データ用のメモリである。フレームメモリ１４０５は、例えばDRAM等の半導体メモリとして実現される。

　メモリ制御部１４０６は、エンコード・デコードエンジン１４０７からの同期信号を受けて、アクセス管理テーブル１４０６Ａに書き込まれたフレームメモリ１４０５へのアクセススケジュールに従ってフレームメモリ１４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル１４０６Ａは、エンコード・デコードエンジン１４０７、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３等で実行される処理に応じて、メモリ制御部１４０６により更新される。

　エンコード・デコードエンジン１４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン１４０７は、フレームメモリ１４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ１４０８Ａに順次書き込む。また、例えば、ビデオESバッファ１４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ１４０５に順次書き込む。エンコード・デコードエンジン１４０７は、これらの符号化や復号において、フレームメモリ１４０５を作業領域として使用する。また、エンコード・デコードエンジン１４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部１４０６に対して同期信号を出力する。

　ビデオESバッファ１４０８Ａは、エンコード・デコードエンジン１４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。ビデオESバッファ１４０８Ｂは、逆多重化部（DMUX）１４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン１４０７に供給する。

　オーディオESバッファ１４０９Ａは、オーディオエンコーダ１４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。オーディオESバッファ１４０９Ｂは、逆多重化部（DMUX）１４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ１４１１に供給する。

　オーディオエンコーダ１４１０は、例えばコネクティビティ１３２１等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode　number　3）方式等の所定の方式で符号化する。オーディオエンコーダ１４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ１４０９Ａに順次書き込む。オーディオデコーダ１４１１は、オーディオESバッファ１４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ１３２１等に供給する。

　多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）１４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）１４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

　逆多重化部（DMUX）１４１３は、多重化部（MUX）１４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）１４１３は、ストリームバッファ１４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）１４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）１４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等から供給されたトランスポートストリームを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１により各種記録媒体から読み出されたファイルデータを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

　ストリームバッファ１４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、又は外部からの要求等に基づいて、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給する。

　また、例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、又は外部からの要求等に基づいて、例えばコネクティビティ１３２１等に供給し、各種記録媒体に記録させる。

　さらに、ストリームバッファ１４１４は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、又は外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

　また、ストリームバッファ１４１４は、例えばコネクティビティ１３２１等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、又は外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

　次に、このような構成のビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたビデオ信号は、ビデオ入力処理部１４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ１４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部１４０２又は第２画像拡大縮小部１４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換及び拡大縮小処理が行われ、再びフレームメモリ１４０５に書き込まれる。この画像データは、エンコード・デコードエンジン１４０７によって符号化され、ビデオストリームとしてビデオESバッファ１４０８Ａに書き込まれる。

　また、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたオーディオ信号は、オーディオエンコーダ１４１０によって符号化され、オーディオストリームとして、オーディオESバッファ１４０９Ａに書き込まれる。

　ビデオESバッファ１４０８Ａのビデオストリームと、オーディオESバッファ１４０９Ａのオーディオストリームは、多重化部（MUX）１４１２に読み出されて多重化され、トランスポートストリーム又はファイルデータ等に変換される。多重化部（MUX）１４１２により生成されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークに出力される。また、多重化部（MUX）１４１２により生成されたファイルデータは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

　また、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからビデオプロセッサ１３３２に入力されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。また、例えばコネクティビティ１３２１等において各種記録媒体から読み出され、ビデオプロセッサ１３３２に入力されたファイルデータは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。つまり、ビデオプロセッサ１３３２に入力されたトランスポートストリーム又はファイルデータは、逆多重化部（DMUX）１４１３によりビデオストリームとオーディオストリームとに分離される。

　オーディオストリームは、オーディオESバッファ１４０９Ｂを介してオーディオデコーダ１４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ１４０８Ｂに書き込まれた後、エンコード・デコードエンジン１４０７により順次読み出されて復号されてフレームメモリ１４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部１４０３によって拡大縮小処理されて、フレームメモリ１４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部１４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

　このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、エンコード・デコードエンジン１４０７に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン１４０７が、上述した画像符号化装置１００の機能若しくは画像復号装置２００の機能又はその両方を有するようにしてもよい。このようにすることにより、ビデオプロセッサ１３３２は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　なお、エンコード・デコードエンジン１４０７において、本技術（すなわち、画像符号化装置１００の機能若しくは画像復号装置２００の機能又はその両方）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

　＜８－３．ビデオプロセッサの他の構成例＞
　図４４は、本技術を適用したビデオプロセッサ１３３２の概略的な構成の他の例を示している。図４４の例の場合、ビデオプロセッサ１３３２は、ビデオデータを所定の方式で符号化・復号する機能を有する。

　より具体的には、図４４に示されるように、ビデオプロセッサ１３３２は、制御部１５１１、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及び内部メモリ１５１５を有する。また、ビデオプロセッサ１３３２は、コーデックエンジン１５１６、メモリインタフェース１５１７、多重化・逆多重化部（MUX　DMUX）１５１８、ネットワークインタフェース１５１９、及びビデオインタフェース１５２０を有する。

　制御部１５１１は、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６等、ビデオプロセッサ１３３２内の各処理部の動作を制御する。

　図４４に示されるように、制御部１５１１は、例えば、メインCPU１５３１、サブCPU１５３２、及びシステムコントローラ１５３３を有する。メインCPU１５３１は、ビデオプロセッサ１３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU１５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU１５３２は、メインCPU１５３１の補助的な役割を果たす。例えば、サブCPU１５３２は、メインCPU１５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ１５３３は、メインCPU１５３１及びサブCPU１５３２が実行するプログラムを指定する等、メインCPU１５３１及びサブCPU１５３２の動作を制御する。

　ディスプレイインタフェース１５１２は、制御部１５１１の制御の下、画像データを例えばコネクティビティ１３２１等に出力する。例えば、ディスプレイインタフェース１５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、又はデジタルデータの画像データのまま、コネクティビティ１３２１のモニタ装置等に出力する。

　ディスプレイエンジン１５１３は、制御部１５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

　画像処理エンジン１５１４は、制御部１５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

　内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６により共用される、ビデオプロセッサ１３３２の内部に設けられたメモリである。内部メモリ１５１５は、例えば、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６の間で行われるデータの授受に利用される。例えば、内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、又はコーデックエンジン１５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン１５１３、画像処理エンジン１５１４、又はコーデックエンジン１５１６に供給する。この内部メモリ１５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static　Random　Access　Memory）のような比較的（例えば外部メモリ１３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

　コーデックエンジン１５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン１５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン１５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化又は符号化データの復号を行うようにしてもよい。

　図４４に示される例において、コーデックエンジン１５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2　Video１５４１、AVC/H.264１５４２、HEVC/H.265１５４３、HEVC/H.265(Scalable)１５４４、HEVC/H.265(Multi-view)１５４５、及びMPEG-DASH１５５１を有する。

　MPEG-2　Video１５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264１５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265１５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)１５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)１５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

　MPEG-DASH１５５１は、画像データをMPEG-DASH（MPEG-Dynamic　Adaptive　Streaming　over　HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（HyperText　Transfer　Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH１５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2　Video１５４１ないしHEVC/H.265(Multi-view)１５４５を利用する。

　メモリインタフェース１５１７は、外部メモリ１３１２用のインタフェースである。画像処理エンジン１５１４やコーデックエンジン１５１６から供給されるデータは、メモリインタフェース１５１７を介して外部メモリ１３１２に供給される。また、外部メモリ１３１２から読み出されたデータは、メモリインタフェース１５１７を介してビデオプロセッサ１３３２（画像処理エンジン１５１４又はコーデックエンジン１５１６）に供給される。

　多重化・逆多重化部（MUX　DMUX）１５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX　DMUX）１５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX　DMUX）１５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX　DMUX）１５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX　DMUX）１５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

　ネットワークインタフェース１５１９は、例えばブロードバンドモデム１３３３やコネクティビティ１３２１等向けのインタフェースである。ビデオインタフェース１５２０は、例えばコネクティビティ１３２１やカメラ１３２２等向けのインタフェースである。

　次に、このようなビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース１５１９を介して多重化・逆多重化部（MUX　DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、例えば、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX　DMUX）１５１８により多重化されてファイルデータに変換され、ビデオインタフェース１５２０を介して例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

　さらに、例えば、コネクティビティ１３２１等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース１５２０を介して多重化・逆多重化部（MUX　DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX　DMUX）１５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース１５１９を介して例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給され図示せぬ他の装置に伝送される。

　なお、ビデオプロセッサ１３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ１５１５や外部メモリ１３１２を利用して行われる。また、パワーマネージメントモジュール１３１３は、例えば制御部１５１１への電力供給を制御する。

　このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、コーデックエンジン１５１６に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン１５１６が、上述した画像符号化装置１００の機能若しくは画像復号装置２００の機能又はその両方を有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　なお、コーデックエンジン１５１６において、本技術（すなわち、画像符号化装置１００の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

　以上にビデオプロセッサ１３３２の構成を２例示したが、ビデオプロセッサ１３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ１３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

　＜８－４．装置への適用例＞
　ビデオセット１３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット１３００は、テレビジョン装置９００（図３８）、携帯電話機９２０（図３９）、記録再生装置９４０（図４０）、撮像装置９６０（図４１）等に組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　なお、上述したビデオセット１３００の各構成の一部であっても、ビデオプロセッサ１３３２を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ１３３２のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線１３４１により示されるプロセッサやビデオモジュール１３１１等を、本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、及びフロントエンドモジュール１３１４を組み合わせ、本技術を適用したビデオユニット１３６１として実施することもできる。いずれの構成の場合であっても、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　つまり、ビデオプロセッサ１３３２を含むものであればどのような構成であっても、ビデオセット１３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ１３３２、点線１３４１により示されるプロセッサ、ビデオモジュール１３１１、又は、ビデオユニット１３６１を、テレビジョン装置９００（図３８）、携帯電話機９２０（図３９）、記録再生装置９４０（図４０）、撮像装置９６０（図４１）等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット１３００の場合と同様に、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　＜＜９．第８実施の形態＞＞
　また、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。図４５は、本技術を適用したネットワークシステムの概略的な構成の一例を示している。

　図４５に示されるネットワークシステム１６００は、機器同士が、ネットワークを介して画像（動画像）に関する情報を授受するシステムである。このネットワークシステム１６００のクラウドサービス１６０１は、自身に通信可能に接続されるコンピュータ１６１１、AV（Audio　Visual）機器１６１２、携帯型情報処理端末１６１３、IoT（Internet　of　Things）デバイス１６１４等の端末に対して、画像（動画像）に関するサービスを提供するシステムである。例えば、クラウドサービス１６０１は、所謂動画配信（オンデマンドやライブ配信）のような、画像（動画像）のコンテンツの供給サービスを端末に提供する。また、例えば、クラウドサービス１６０１は、端末から画像（動画像）のコンテンツを受け取って保管するバックアップサービスを提供する。また、例えば、クラウドサービス１６０１は、端末同士の画像（動画像）のコンテンツの授受を仲介するサービスを提供する。

　クラウドサービス１６０１の物理構成は任意である。例えば、クラウドサービス１６０１は、動画像を保存し、管理するサーバ、動画像を端末に配信するサーバ、動画像を端末から取得するサーバ、ユーザ（端末）や課金を管理するサーバ等の各種サーバや、インターネットやLAN等の任意のネットワークを有するようにしてもよい。

　コンピュータ１６１１は、例えば、パーソナルコンピュータ、サーバ、ワークステーション等のような情報処理装置により構成される。AV機器１６１２は、例えば、テレビジョン受像機、ハードディスクレコーダ、ゲーム機器、カメラ等のような画像処理装置により構成される。携帯型情報処理端末１６１３は、例えば、ノート型パーソナルコンピュータ、タブレット端末、携帯電話機、スマートフォン等のような携帯型の情報処理装置により構成される。IoTデバイス１６１４は、例えば、機械、家電、家具、その他の物、ICタグ、カード型デバイス等、画像に関する処理を行う任意の物体により構成される。これらの端末は、いずれも通信機能を有し、クラウドサービス１６０１に接続し（セッションを確立し）、クラウドサービス１６０１と情報の授受を行う（すなわち通信を行う）ことができる。また、各端末は、他の端末と通信を行うこともできる。端末間の通信は、クラウドサービス１６０１を介して行うようにしてもよいし、クラウドサービス１６０１を介さずに行うようにしてもよい。

　以上のようなネットワークシステム１６００に本技術を適用し、端末間や、端末とクラウドサービス１６０１との間で画像（動画像）のデータが授受される際に、その画像データを各実施の形態において上述したように符号化・復号するようにしてもよい。つまり、端末（コンピュータ１６１１ないしIoTデバイス１６１４）やクラウドサービス１６０１が、それぞれ、上述した画像符号化装置１００や画像復号装置２００の機能を有するようにしてもよい。このようにすることにより、画像データを授受する端末（コンピュータ１６１１ないしIoTデバイス１６１４）やクラウドサービス１６０１は、図１１～図３２を参照して上述した各実施の形態と同様の効果を得ることができる。

　なお、符号化データ（ビットストリーム）に関する各種情報は、符号化データに多重化されて伝送され又は記録されるようにしてもよいし、符号化データに多重化されることなく、符号化データと関連付けられた別個のデータとして伝送され又は記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

　また、上述したように、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　また、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

　なお、本開示は、以下のような構成もとることができる。

（１）
　符号化済みのブロックに設定されたアフィン変換のための第１の種類の動き情報に基づき生成される第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、第１の種類の動き情報とはアフィン変換のための予測成分の数が異なる第２の種類の動き情報であって前記符号化済みのブロックに設定された第１の種類の動き情報に基づき生成される第２の種類の動き情報を前記所定のブロックの動き情報として取得する第２のモードと、を含む複数のモードのうちのいずれかのモードで動き補償を行う予測部、
　を備える画像処理装置。
（２）
　前記第２の種類の動き情報は、前記第１の種類の動き情報とはアフィン変換のための予測成分の数が少ない動き情報である、
　前記（１）に記載の画像処理装置。
（３）
　前記第１の種類の動き情報は、アフィン変換のための複数の予測成分で構成される動き情報であり、
　前記第２の種類の動き情報は、前記第１の種類の動き情報を構成する複数の予測成分から少なくとも１つの予測成分を除いた１又は複数の予測成分で構成される動き情報である、
　前記（１）又は（２）に記載の画像処理装置。
（４）
　前記第１の種類の動き情報は、並進移動、回転、及びスケーリングの予測成分を少なくとも有する動き情報であり、
　前記第２の種類の動き情報は、並進移動、回転、及びスケーリングの予測成分から少なくとも１つの予測成分を除いた動き情報である、
　前記（１）から（３）のいずれか１つに記載の画像処理装置。
（５）
　前記第２の種類の動き情報は、並進移動及び回転の予測成分を有し、スケーリングの予測成分を有さない動き情報である、
　前記（４）に記載の画像処理装置。
（６）
　前記第２の種類の動き情報は、並進移動及びスケーリングの予測成分を有し、回転の予測成分を有さない動き情報である、
　前記（４）に記載の画像処理装置。
（７）
　前記第１のモードと前記第２のモードとを含む複数のモードのいずれかを示すモード情報を設定する設定部、をさらに備える、
　前記（１）から（６）のいずれか１つに記載の画像処理装置。
（８）
　前記予測部は、前記モード情報に基づいて選択されたモードで動き補償を行う、
　前記（７）に記載の画像処理装置。
（９）
　前記予測部は、
　並進移動、回転、及びスケーリングの予測成分を少なくとも有する前記第１の種類の動き情報であって、符号化済みのブロックに設定された前記第１の種類の動き情報に基づき生成される前記第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、
　並進移動及び回転の予測成分を有し、スケーリングの予測成分を有さない前記第２の種類の動き情報であって、符号化済みのブロックに設定された前記第１の種類の動き情報に基づき生成される前記第２の種類の動き情報を所定のブロックの動き情報として取得する第２のモードと、
　並進移動及びスケーリングの予測成分を有し、回転の予測成分を有さない第３の種類の動き情報であって、符号化済みのブロックに設定された前記第１の種類の動き情報に基づき生成される前記第３の種類の動き情報を所定のブロックの動き情報として取得する第３のモードと、
　を含む複数のモードのうちのいずれかのモードで参照画像に対して動き補償を行う、
　前記（１）に記載の画像処理装置。
（１０）
　前記第１のモードと前記第２のモードと前記第３のモードとを含む複数のモードのいずれかを示すモード情報を設定する設定部、をさらに備える、
　前記（９）に記載の画像処理装置。
（１１）
　前記予測部は、前記モード情報に基づいて選択されたモードで動き補償を行う、
　前記（１０）に記載の画像処理装置。
（１２）
　前記符号化済みのブロックは、前記所定のブロックに隣接するブロックである、
　前記（１）から（１１）のいずれか１つに記載の画像処理装置。
（１３）
　前記符号化済みのブロックは、前記所定のブロックが属するフレームとは別のフレームのブロックである、
　前記（１）から（１１）のいずれか１つに記載の画像処理装置。
（１４）
　符号化済みのブロックに設定されたアフィン変換のための第１の種類の動き情報に基づき生成される第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、第１の種類の動き情報とはアフィン変換のための予測成分の数が異なる第２の種類の動き情報であって前記符号化済みのブロックに設定された第１の種類の動き情報に基づき生成される第２の種類の動き情報を所定のブロックの動き情報として取得する第２のモードと、を含む複数のモードのうちのいずれかのモードで参照画像に対して動き補償を行う、
　画像処理方法。
（１５）
　コンピュータを、
　符号化済みのブロックに設定されたアフィン変換のための第１の種類の動き情報に基づき生成される第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、第１の種類の動き情報とはアフィン変換のための予測成分の数が異なる第２の種類の動き情報であって前記符号化済みのブロックに設定された第１の種類の動き情報に基づき生成される第２の種類の動き情報を前記所定のブロックの動き情報として取得する第２のモードと、を含む複数のモードのうちのいずれかのモードで動き補償を行う予測部、
　として機能させるための画像処理プログラム。

　１００　画像符号化装置
　１０１　制御部
　１１９　予測部
　２００　画像復号装置
　２１１　復号部
　２１６　予測部

Claims

　符号化済みのブロックに設定されたアフィン変換のための第１の種類の動き情報に基づき生成される第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、第１の種類の動き情報とはアフィン変換のための予測成分の数が異なる第２の種類の動き情報であって前記符号化済みのブロックに設定された第１の種類の動き情報に基づき生成される第２の種類の動き情報を前記所定のブロックの動き情報として取得する第２のモードと、を含む複数のモードのうちのいずれかのモードで動き補償を行う予測部、
　を備える画像処理装置。
　前記第２の種類の動き情報は、前記第１の種類の動き情報とはアフィン変換のための予測成分の数が少ない動き情報である、
　請求項１に記載の画像処理装置。
　前記第１の種類の動き情報は、アフィン変換のための複数の予測成分で構成される動き情報であり、
　前記第２の種類の動き情報は、前記第１の種類の動き情報を構成する複数の予測成分から少なくとも１つの予測成分を除いた１又は複数の予測成分で構成される動き情報である、
　請求項２に記載の画像処理装置。
　前記第１の種類の動き情報は、並進移動、回転、及びスケーリングの予測成分を少なくとも有する動き情報であり、
　前記第２の種類の動き情報は、並進移動、回転、及びスケーリングの予測成分から少なくとも１つの予測成分を除いた動き情報である、
　請求項３に記載の画像処理装置。
　前記第２の種類の動き情報は、並進移動及び回転の予測成分を有し、スケーリングの予測成分を有さない動き情報である、
　請求項４に記載の画像処理装置。
　前記第２の種類の動き情報は、並進移動及びスケーリングの予測成分を有し、回転の予測成分を有さない動き情報である、
　請求項４に記載の画像処理装置。
　前記第１のモードと前記第２のモードとを含む複数のモードのいずれかを示すモード情報を設定する設定部、をさらに備える、
　請求項１に記載の画像処理装置。
　前記予測部は、前記モード情報に基づいて選択されたモードで動き補償を行う、
　請求項７に記載の画像処理装置。
　前記予測部は、
　並進移動、回転、及びスケーリングの予測成分を少なくとも有する前記第１の種類の動き情報であって、符号化済みのブロックに設定された前記第１の種類の動き情報に基づき生成される前記第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、
　並進移動及び回転の予測成分を有し、スケーリングの予測成分を有さない前記第２の種類の動き情報であって、符号化済みのブロックに設定された前記第１の種類の動き情報に基づき生成される前記第２の種類の動き情報を所定のブロックの動き情報として取得する第２のモードと、
　並進移動及びスケーリングの予測成分を有し、回転の予測成分を有さない第３の種類の動き情報であって、符号化済みのブロックに設定された前記第１の種類の動き情報に基づき生成される前記第３の種類の動き情報を所定のブロックの動き情報として取得する第３のモードと、
　を含む複数のモードのうちのいずれかのモードで参照画像に対して動き補償を行う、
　請求項１に記載の画像処理装置。
　前記第１のモードと前記第２のモードと前記第３のモードとを含む複数のモードのいずれかを示すモード情報を設定する設定部、をさらに備える、
　請求項９に記載の画像処理装置。
　前記予測部は、前記モード情報に基づいて選択されたモードで動き補償を行う、
　請求項１０に記載の画像処理装置。
　前記符号化済みのブロックは、前記所定のブロックに隣接するブロックである、
　請求項１に記載の画像処理装置。
　前記符号化済みのブロックは、前記所定のブロックが属するフレームとは別のフレームのブロックである、
　請求項１に記載の画像処理装置。
　符号化済みのブロックに設定されたアフィン変換のための第１の種類の動き情報に基づき生成される第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、第１の種類の動き情報とはアフィン変換のための予測成分の数が異なる第２の種類の動き情報であって符号化済みのブロックに設定された前記第１の種類の動き情報に基づき生成される前記第２の種類の動き情報を所定のブロックの動き情報として取得する第２のモードと、を含む複数のモードのうちのいずれかのモードで参照画像に対して動き補償を行う、
　画像処理方法。
　コンピュータを、
　符号化済みのブロックに設定されたアフィン変換のための第１の種類の動き情報に基づき生成される第１の種類の動き情報を所定のブロックの動き情報として取得する第１のモードと、第１の種類の動き情報とはアフィン変換のための予測成分の数が異なる第２の種類の動き情報であって前記符号化済みのブロックに設定された第１の種類の動き情報に基づき生成される第２の種類の動き情報を前記所定のブロックの動き情報として取得する第２のモードと、を含む複数のモードのうちのいずれかのモードで動き補償を行う予測部、
　として機能させるための画像処理プログラム。