WO2020008714A1

WO2020008714A1 - 画像処理装置、画像処理方法及び画像処理プログラム

Info

Publication number: WO2020008714A1
Application number: PCT/JP2019/017519
Authority: WO
Inventors: 健治近藤
Original assignee: ソニー株式会社
Priority date: 2018-07-06
Filing date: 2019-04-24
Publication date: 2020-01-09
Also published as: US20220060723A1

Abstract

画像処理装置（１２）は、画像を分割して得られるブロックに対して直交変換を実行する直交変換部（１１３、１１４）と、前記ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて前記直交変換部を制御する制御部（１０１、２１２）と、を有する。

Description

画像処理装置、画像処理方法及び画像処理プログラム

　本開示は、画像処理装置、画像処理方法及び画像処理プログラムに関する。

　ITU-T（International　Telecommunication　Union　Telecommunication　Standardization　Sector）の次世代ビデオ符号化を探索するJVET（Joint　Video　Exploration　Team）では、処理の簡素化のため、CU（Coding　Unit）とTU（Transform　Unit）とを同一にすることが提案されている。すなわち、CU単位で直交変換及び逆直交変換を実行することが提案されている。

　従来、CUを分割したTU単位で直交変換及び逆直交変換が実行されていた。そして、TUは、高さ方向、又は幅方向の画素数が２のべき乗になるように分割されていた。そのため、高さ方向、又は幅方向の画素数が２のべき乗ではない単位で直交変換及び逆直交変換を実行することは無かった。

Teruhiko　Suzuki,　Masaru　Ikeda,　Karl　Sharman,　"Description　of　SDR　and　HDR　video　coding　technology　proposal　by　Sony(JVET-J0028)"　JVET　of　ITU-T　SG　16　WP　3　and　ISO/IEC　JTC　1/SC　29/WG　11　10-20　Apr.　2018

　ところで、符号化圧縮率を向上させるにはCUのブロック分割のバリエーションを増やす必要がある。CUのブロック分割のバリエーションには、分割後のブロックの幅方向又は高さ方向の画素数が２のべき乗でない場合も想定される。しかしながら、CUを分割したTU単位で直交変換及び逆直交変換を行う場合、直交変換及び逆直交変換の対象ブロックの画素数が２のべき乗にならないことは想定されていなかった。そのため、高さ方向、又は幅方向の画素数が２のべき乗ではブロックに対して直交変換又は逆直交変換を実行した場合に、処理量が大きくなってしまう。

　そこで、本開示では、ブロックの幅方向又は高さ方向の画素数が２のべき乗ではない場合においても処理量の増加を抑制することができる画像処理装置、画像処理方法及び画像処理プログラムを提案する。

　上記の課題を解決するために、本開示に係る一形態の画像処理装置は、画像を分割して得られるブロックに対して直交変換を実行する直交変換部と、前記ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて前記直交変換部を制御する制御部と、を有する。

　本開示によれば、ブロックの幅方向又は高さ方向の画素数が２のべき乗ではない場合においても処理量の増加を抑制することができる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

本開示の第１の実施形態に係る画像処理システムの一実施の形態の構成例を示すブロック図である。本開示の第１の実施形態に係る符号化回路において行われる処理について説明する図である。本開示の第１の実施形態に係る復号回路において行われる処理について説明する図である。本開示の第１の実施形態に係る画像符号化装置の一実施の形態の構成例を示すブロック図である。本開示の第１の実施形態に係る画像復号装置の一実施の形態の構成例を示すブロック図である。本開示の第１の実施形態に係る画像符号化装置１２が実行する画像符号化処理を説明するフローチャートである。本開示の第１の実施形態に係る画像復号装置１３が実行する画像復号処理を説明するフローチャートである。本開示の第１の実施形態に係るCUのブロック分割の一例を示す図（１）である。本開示の第１の実施形態に係るCUのブロック分割の一例を示す図（２）である。本開示の第１の実施形態に係るCUのブロック分割のバリエーションを示す図である。本開示の第１の実施形態に係るCUの分割前後の一例を示した図である。本開示の第１の実施形態に係る符号化処理の一例を示すフローチャートである。本開示の第１の実施形態に係る復号処理の一例を示すフローチャートである。本開示の第１の実施形態の変形例（１）に係る符号化処理の一例を示すフローチャートである。本開示の第１の実施形態の変形例（１）に係る復号処理の一例を示すフローチャートである。本開示の第１の実施形態の変形例（２）に係る符号化処理の一例を示すフローチャートである。本開示の第２の実施形態に係る符号化処理の一例を示すフローチャートである。本開示の第２の実施形態に係るCUの分割態様の一例を示す図である。本開示の第２の実施形態に係るCUの分割態様の一例を示す図である。本開示の第２の実施形態に係るCUの分割態様の一例を示す図である。本開示の第３の実施形態に係る高さ方向、及び幅方向の画素数が２のべき乗のCUに対する直交変換の処理手順を説明する図である。本開示の第３の実施形態に係る高さ方向の画素数が２のべき乗ではないCUを示す図である。本開示の第３の実施形態に係る幅方向の画素数が２のべき乗ではないCUを示す図である。本開示の第４の実施形態に係る直交変換を実行する領域のバリエーションの一例を示す図である。本開示の第４の実施形態に係る符号化処理の一例を示すフローチャートである。本開示の第４の実施形態に係る復号処理の一例を示すフローチャートである。本開示の第４の実施形態に係る直交変換を実行する領域のバリエーションの一例を示す図である。本開示の第４の実施形態の変形例（１）に係る直交変換で残った領域に対して、画素数が２のべき乗になる最大領域に直交変換を再帰的に実行した場合の一例を示す図である。本開示の第４の実施形態の変形例（１）に係る直交変換で残った領域に対して、画素数が２のべき乗になる最大領域に直交変換を再帰的に実行した場合の例を示す図である。上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示すブロック図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　＜技術内容・技術用語をサポートする文献等＞
　本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献に記載されている内容も含まれる。

　非特許文献１：（上述）
　非特許文献２：TELECOMMUNICATION　STANDARDIZATION　SECTOR　OF　ITU（International　Telecommunication　Union）,　"High　efficiency　video　coding",　H.265,　12/2016
　非特許文献３：TELECOMMUNICATION　STANDARDIZATION　SECTOR　OF　ITU（International　Telecommunication　Union）,　"Advanced　video　coding　for　generic　audiovisual　services",　H.264,　04/2017

　つまり、上述の非特許文献１乃至３に記載されている内容もサポート要件を判断する際の根拠となる。例えば、非特許文献１に記載されているQTBT（Quad　Tree　Plus　Binary　Tree）　Block　StrucTUre、または、非特許文献２に記載されているQuad-Tree　Block　StrucTUreが、実施の形態において直接的な記載がない場合でも、本技術の開示範囲内であり、請求の範囲のサポート要件を満たすものとする。また、例えば、パース（Parsing）、シンタックス（Syntax）、セマンティクス（Semantics）等の技術用語についても同様に、実施の形態において直接的な記載がない場合でも、本技術の開示範囲内であり、請求の範囲のサポート要件を満たすものとする。

　＜用語＞
　本願では、以下の用語を、以下のように定義する。

　　　　＜ブロック＞
　画像（ピクチャ）の部分領域や処理単位として説明に用いる「ブロック」（処理部を示すブロックではない）は、特に言及しない限り、ピクチャ内の任意の部分領域を示し、その大きさ、形状、および特性等は限定されない。例えば、「ブロック」には、TB（Transform　Block）、TU（Transform　Unit）、PB（Prediction　Block）、PU（Prediction　Unit）、SCU（Smallest　Coding　Unit）、CU（Coding　Unit）、LCU（Largest　Coding　Unit）、CTB（Coding　Tree　Block）、CTU（Coding　Tree　Unit）、変換ブロック、サブブロック、マクロブロック、タイル、またはスライス等、任意の部分領域（処理単位）が含まれるものとする。

　　　　＜ブロックサイズの指定＞
　また、このようなブロックのサイズを指定するに当たって、直接的にブロックサイズを指定するだけでなく、間接的にブロックサイズを指定するようにしてもよい。例えばサイズを識別する識別情報を用いてブロックサイズを指定するようにしてもよい。また、例えば、基準となるブロック（例えばLCUやSCU等）のサイズとの比または差分によってブロックサイズを指定するようにしてもよい。例えば、シンタックス要素等としてブロックサイズを指定する情報を伝送する場合に、その情報として、上述のような間接的にサイズを指定する情報を用いるようにしてもよい。このようにすることにより、その情報の情報量を低減させることができ、符号化効率を向上させることができる場合もある。また、このブロックサイズの指定には、ブロックサイズの範囲の指定（例えば、許容されるブロックサイズの範囲の指定等）も含む。

　　　　＜情報・処理の単位＞
　各種情報が設定されるデータ単位や、各種処理が対象とするデータ単位は、それぞれ任意であり上述した例に限定されない。例えば、これらの情報や処理が、それぞれ、TU（Transform　Unit）、TB（Transform　Block）、PU（Prediction　Unit）、PB（Prediction　Block）、CU（Coding　Unit）、LCU（Largest　Coding　Unit）、サブブロック、ブロック、タイル、スライス、ピクチャ、シーケンス、またはコンポーネント毎に設定されるようにしてもよいし、それらのデータ単位のデータを対象とするようにしてもよい。もちろん、このデータ単位は、情報や処理毎に設定され得るものであり、全ての情報や処理のデータ単位が統一されている必要はない。なお、これらの情報の格納場所は任意であり、上述したデータ単位のヘッダやパラメータセット等に格納されるようにしてもよい。また、複数個所に格納されるようにしてもよい。

　　　　＜制御情報＞
　本技術に関する制御情報を符号化側から復号側に伝送するようにしてもよい。例えば、上述した本技術を適用することを許可（または禁止）するか否かを制御する制御情報（例えばenabled_flag）を伝送するようにしてもよい。また、例えば、上述した本技術を適用する対象（または適用しない対象）を示す制御情報を伝送するようにしてもよい。例えば、本技術を適用する（または、適用を許可若しくは禁止する）ブロックサイズ（上限若しくは下限、またはその両方）、フレーム、コンポーネント、またはレイヤ等を指定する制御情報を伝送するようにしてもよい。

　　　　＜フラグ＞
　なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の２状態を識別する際に用いる情報だけでなく、３以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の２値であってもよいし、３値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報（フラグも含む）は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。

　　　　＜メタデータを関連付ける＞
　また、符号化データ（ビットストリーム）に関する各種情報（メタデータ等）は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（または同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

　なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

（第１の実施形態）
［第１の実施形態に係る画像処理システムの構成］
　図１乃至図５を参照して、本技術の概要について説明する。

　図１は、本開示の第１の実施形態に係る画像処理システムの一実施の形態の構成例を示すブロック図である。

　図１に示すように、画像処理システム１１は、画像符号化装置１２および画像復号装置１３を備えて構成される。例えば、画像処理システム１１では、図示しない撮像装置により撮像された画像が画像符号化装置１２に入力され、画像符号化装置１２において画像が符号化されることで符号化データが生成される。これにより、画像処理システム１１では、画像符号化装置１２から画像復号装置１３へ、符号化データがビットストリームとして伝送される。そして、画像処理システム１１では、画像復号装置１３において符号化データが復号されることで画像が生成され、図示しない表示装置に表示される。

　画像符号化装置１２は、画像処理チップ２１および外部メモリ２２がバスを介して接続された構成となっている。

　画像処理チップ２１は、画像を符号化する符号化回路２３、および、符号化回路２３が画像を符号化する際に必要となるデータを一時的に記憶するキャッシュメモリ２４により構成される。

　外部メモリ２２は、例えば、DRAM（Dynamic　Random　Access　Memory）により構成され、画像符号化装置１２において符号化の対象となる画像のデータをフレームごとに記憶する。

　例えば、画像符号化装置１２では、外部メモリ２２に記憶されている１フレーム分の画像のデータのうちの、符号化を行う処理単位となるCUごとに分割されたデータがキャッシュメモリ２４に読み込まれる。そして、画像符号化装置１２では、キャッシュメモリ２４に記憶されているCUごとに符号化回路２３による符号化が行われ、符号化データが生成される。

　画像復号装置１３は、画像処理チップ３１および外部メモリ３２がバスを介して接続された構成となっている。

　画像処理チップ３１は、符号化データを復号して画像を生成する復号回路３３、および、復号回路３３が符号化データを復号する際に必要となるデータを一時的に記憶するキャッシュメモリ３４により構成される。

　外部メモリ３２は、例えば、DRAMにより構成され、画像復号装置１３において復号の対象となる符号化データを画像のフレームごとに記憶する。

　そして、画像復号装置１３では、キャッシュメモリ３４に記憶されているCUごとに、復号回路３３により符号化データが復号されることにより画像が生成される。

　ここで、図２は、本開示の第１の実施形態に係る符号化回路において行われる処理について説明する図である。図２を参照して、画像処理装置の一例である画像符号化装置１２の符号化回路２３が行う処理について、さらに説明する。

　例えば、符号化回路２３は、図示するような直交変換部、及び制御部として機能するように設計される。なお、図２では、符号化回路２３により直交変換部、及び制御部が実現される場合を想定して説明しているが、直交変換部、及び制御部は、ソフトウェア等の他の形態により実現されてもよい。例えば、符号化回路２３はハードウェア要素として、CPUと、プログラムが記憶された記憶装置とを備え、直交変換部および制御部の機能は、CPUがプログラムを実行することにより実現してもよい。また、これに限らず、直交変換部および制御部の一部または全部は専用のハードウェア回路で実現されてもよい。さらに、直交変換部、及び制御部は、ハードウェアとソフトウェアとの混合により実現されてもよい。

　即ち、符号化回路２３は、画像を分割して得られるブロックに対して直交変換を実行する。また、符号化回路２３は、ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて直交変換部を制御する。

　さらに詳しくは、符号化回路２３は、画像を分割して得られるCU、つまりブロック単位で直交変換を実行する。この場合において、符号化回路２３は、分割後のCUの高さ方向、又は幅方向の画素数が２のべき乗になるか否かに関わらず分割する。そして、符号化回路２３は、CUの高さ方向、及び幅方向の画素数が２のべき乗の場合には高速フーリエ変換により少ない演算量で高速に直交変換を実行することができる。しかし、符号化回路２３は、CUの高さ方向、及び幅方向の画素数が２のべき乗ではない場合には、高速フーリエ変換を用いることができない。そのため、符号化回路２３は、分割後のCUの高さ方向、又は幅方向の画素数が２のべき乗になるか否かに応じて直交変換を制御することで、処理量が増大し、処理速度が低下してしまうことを抑制する。

　そして、符号化回路２３は、CUの分割形態等が示された分割情報等の各種情報を含めたビットストリームを出力する。

　ここで、図３は、本開示の第１の実施形態に係る復号回路において行われる処理について説明する図である。図３を参照して、画像処理装置の一例である画像復号装置１３の復号回路３３が行う処理について、さらに説明する。

　例えば、復号回路３３は、図示するような直交変換部、及び制御部として機能するように設計される。なお、図３では、復号回路３３により直交変換部、及び制御部が実現される場合を想定して説明しているが、直交変換部、及び制御部はソフトウェア等の他の形態により実現されてもよい。また、復号回路３３においても上述した符号化回路２３と同様に、直交変換部および制御部の機能は、CPUがプログラムを実行することにより実現してもよい。また、直交変換部および制御部の一部または全部を専用のハードウェア回路で実現してもよい。さらに、直交変換部、及び制御部は、ハードウェアとソフトウェアとの混合により実現されてもよい。

　即ち、復号回路３３は、画像を分割して得られるブロックに対して直交変換を実行する。また、符号化回路２３は、ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて直交変換部を制御する。

　ここで、逆直交変換は、広義には直交変換に含まれる概念であり、直交変換の一形態である。すなわち、復号回路３３は、画像を分割して得られるブロックに対して直交変換の一形態である逆直交変換を実行する。また、符号化回路２３は、ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて、直交変換の一形態である逆直交変換を実行する直交変換部を制御する。

　さらに詳しくは、復号回路３３は、画像符号化装置１２から出力されたビットストリームから、CUの分割形態等が示された分割情報を含む各種情報を抽出する。復号回路３３は、画像を分割して得られるCU、つまりブロック単位で直交変換の一形態である逆直交変換を実行する。この場合において、符号化回路２３は、CUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かに応じて直交変換が実行され、直交変換に関する各種情報と共にビットストリームとして出力する。復号回路３３は、ビットストリームに含まれる直交変換に関する各種情報により直交変換の一形態である逆直交変換を実行する直交変換部を制御する。すなわち、復号回路３３は、ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて直交変換部を制御する。そのため、符号化回路２３は、処理量が増大し、処理速度が低下してしまうことを抑制することができる。

［第１の実施形態に係る画像符号化装置の構成例］
　図４は、本開示の第１の実施形態に係る画像符号化装置の一実施の形態の構成例を示すブロック図である。

　図４に示される画像符号化装置１２は、動画像の画像データを符号化する装置である。例えば、画像符号化装置１２は、非特許文献１、非特許文献２、または非特許文献３に記載されている技術を実装し、それらの文献のいずれかに記載された規格に準拠した方法で動画像の画像データを符号化する。

　なお、図４においては、処理部やデータの流れ等の主なものを示しており、図４に示されるものが全てとは限らない。つまり、画像符号化装置１２において、図４においてブロックとして示されていない処理部が存在したり、図４において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図４に示されるように画像符号化装置１２は、制御部１０１、並べ替えバッファ１１１、演算部１１２、直交変換部１１３、量子化部１１４、符号化部１１５、蓄積バッファ１１６、逆量子化部１１７、逆直交変換部１１８、演算部１１９、インループフィルタ部１２０、フレームメモリ１２１、予測部１２２、およびレート制御部１２３を備えて構成される。なお、予測部１２２は、不図示のイントラ予測部およびインター予測部を備えている。画像符号化装置１２は、動画像データを符号化することによって、符号化データ（ビットストリーム）を生成するための装置である。

　　　　＜制御部＞
　制御部１０１は、外部、または予め指定された処理単位のブロックサイズに基づいて、並べ替えバッファ１１１により保持されている動画像データを処理単位のブロック（CU,　PU,　変換ブロックなど）へ分割する。また、制御部１０１は、各ブロックへ供給する符号化パラメータ（ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなど）を、例えば、RDO（Rate-Distortion　Optimization）に基づいて、決定する。

　これらの符号化パラメータの詳細については後述する。制御部１０１は、以上のような符号化パラメータを決定すると、それを各ブロックへ供給する。具体的には、以下の通りである。

　ヘッダ情報Hinfoは、各ブロックに供給される。
　予測モード情報Pinfoは、符号化部１１５と予測部１２２とに供給される。
　変換情報Tinfoは、符号化部１１５、直交変換部１１３、量子化部１１４、逆量子化部１１７、および逆直交変換部１１８に供給される。
　フィルタ情報Finfoは、インループフィルタ部１２０に供給される。

　　　　＜並べ替えバッファ＞
　画像符号化装置１２には、動画像データの各フィールド（入力画像）がその再生順（表示順）に入力される。並べ替えバッファ１１１は、各入力画像をその再生順（表示順）に取得し、保持（記憶）する。並べ替えバッファ１１１は、制御部１０１の制御に基づいて、その入力画像を符号化順（復号順）に並べ替えたり、処理単位のブロックに分割したりする。並べ替えバッファ１１１は、処理後の各入力画像を演算部１１２に供給する。また、並べ替えバッファ１１１は、その各入力画像（元画像）を、予測部１２２やインループフィルタ部１２０にも供給する。

　　　　＜演算部＞
　演算部１１２は、処理単位のブロックに対応する画像I、および予測部１２２より供給される予測画像Pを入力とし、画像Iから予測画像Pを減算して、予測残差Dを導出（D＝Ｉ－Ｐ）し、それを直交変換部１１３に供給する。

　　　　＜直交変換部＞
　直交変換部１１３は、演算部１１２から供給される予測残差Dと、制御部１０１から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、予測残差Dに対して直交変換を行い、変換係数Coeffを導出する。直交変換部１１３は、その得られた変換係数Coeffを量子化部１１４に供給する。

　　　　＜量子化部＞
　量子化部１１４は、直交変換部１１３から供給される変換係数Coeffと、制御部１０１から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、変換係数Coeffをスケーリング（量子化）する。なお、この量子化のレートは、レート制御部１２３により制御される。量子化部１１４は、このような量子化により得られた量子化後の変換係数、すなわち量子化変換係数レベルlevelを、符号化部１１５および逆量子化部１１７に供給する。

　　　　＜符号化部＞
　符号化部１１５は、量子化部１１４から供給された量子化変換係数レベルlevelと、制御部１０１から供給される各種符号化パラメータ（ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなど）と、インループフィルタ部１２０から供給されるフィルタ係数等のフィルタに関する情報と、予測部１２２から供給される最適な予測モードに関する情報とを入力とする。符号化部１１５は、量子化変換係数レベルlevelを可変長符号化（例えば、算術符号化）し、ビット列（符号化データ）を生成する。

　また、符号化部１１５は、その量子化変換係数レベルlevelから残差情報Rinfoを導出し、残差情報Rinfoを符号化し、ビット列を生成する。

　さらに、符号化部１１５は、インループフィルタ部１２０から供給されるフィルタに関する情報をフィルタ情報Finfoに含め、予測部１２２から供給される最適な予測モードに関する情報を予測モード情報Pinfoに含める。そして、符号化部１１５は、上述した各種符号化パラメータ（ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなど）を符号化し、ビット列を生成する。

　また、符号化部１１５は、以上のように生成された各種情報のビット列を多重化し、符号化データを生成する。符号化部１１５は、その符号化データを蓄積バッファ１１６に供給する。

　それらに加え、符号化部１１５は、制御部１０１から供給される直交変換最大サイズ識別情報を符号化し、ビット列を生成して、そのビット列を多重化し、符号化データを生成することができる。これにより、図１を参照して上述したように、直交変換最大サイズ識別情報を含む符号化データ（ビットストリーム）が伝送される。

　　　　＜蓄積バッファ＞
　蓄積バッファ１１６は、符号化部１１５において得られた符号化データを、一時的に保持する。蓄積バッファ１１６は、所定のタイミングにおいて、保持している符号化データを、例えばビットストリーム等として画像符号化装置１２の外部に出力する。例えば、この符号化データは、任意の記録媒体、任意の伝送媒体、任意の情報処理装置等を介して復号側に伝送される。すなわち、蓄積バッファ１１６は、符号化データ（ビットストリーム）を伝送する伝送部でもある。

　　　　＜逆量子化部＞
　逆量子化部１１７は、逆量子化に関する処理を行う。例えば、逆量子化部１１７は、量子化部１１４から供給される量子化変換係数レベルlevelと、制御部１０１から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、量子化変換係数レベルlevelの値をスケーリング（逆量子化）する。なお、この逆量子化は、量子化部１１４において行われる量子化の逆処理である。逆量子化部１１７は、このような逆量子化により得られた変換係数Coeff_IQを、逆直交変換部１１８に供給する。

　　　　＜逆直交変換部＞
　逆直交変換部１１８は、逆直交変換に関する処理を行う。ここで、逆直交変換は、直交変換の一態様である。例えば、逆直交変換部１１８は、逆量子化部１１７から供給される変換係数Coeff_IQと、制御部１０１から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、変換係数Coeff_IQに対して逆直交変換を行い、予測残差D'を導出する。なお、この逆直交変換は、直交変換部１１３において行われる直交変換の逆処理である。逆直交変換部１１８は、このような逆直交変換により得られた予測残差D'を演算部１１９に供給する。なお、逆直交変換部１１８は、復号側の逆直交変換部（後述する）と同様であるので、逆直交変換部１１８については、復号側について行う説明（後述する）を適用することができる。

　　　　＜演算部＞
　演算部１１９は、逆直交変換部１１８から供給される予測残差D’と、予測部１２２から供給される予測画像Pとを入力とする。演算部１１９は、その予測残差D’と、その予測残差D’に対応する予測画像Pとを加算し、局所復号画像R_localを導出（R_local＝D’＋P）する。演算部１１９は、導出した局所復号画像R_localをインループフィルタ部１２０およびフレームメモリ１２１に供給する。

　　　　＜インループフィルタ部＞
　インループフィルタ部１２０は、インループフィルタ処理に関する処理を行う。例えば、インループフィルタ部１２０は、演算部１１９から供給される局所復号画像R_localと、制御部１０１から供給されるフィルタ情報Finfoと、並べ替えバッファ１１１から供給される入力画像（元画像）とを入力する。なお、インループフィルタ部１２０に入力される情報は任意であり、これらの情報以外の情報が入力されてもよい。例えば、必要に応じて、予測モード、動き情報、符号量目標値、量子化パラメータQP、ピクチャタイプ、ブロック（CU、CTU等）の情報等がインループフィルタ部１２０に入力されるようにしてもよい。

　インループフィルタ部１２０は、そのフィルタ情報Finfoに基づいて、局所復号画像R_localに対して適宜フィルタ処理を行う。インループフィルタ部１２０は、必要に応じて入力画像（元画像）や、その他の入力情報もそのフィルタ処理に用いる。

　例えば、インループフィルタ部１２０は、非特許文献１に記載のように、バイラテラルフィルタ、デブロッキングフィルタ（DBF（DeBlocking　Filter））、適応オフセットフィルタ（SAO（Sample　Adaptive　Offset））、および適応ループフィルタ（ALF(Adaptive　Loop　Filter)）の４つのインループフィルタをこの順に適用する。なお、どのフィルタを適用するか、どの順で適用するかは任意であり、適宜選択可能である。

　もちろん、インループフィルタ部１２０が行うフィルタ処理は任意であり、上述の例に限定されない。例えば、インループフィルタ部１２０がウィーナーフィルタ等を適用するようにしてもよい。

　インループフィルタ部１２０は、フィルタ処理された局所復号画像R_localをフレームメモリ１２１に供給する。なお、例えばフィルタ係数等のフィルタに関する情報を復号側に伝送する場合、インループフィルタ部１２０は、そのフィルタに関する情報を符号化部１１５に供給する。

　　　　＜フレームメモリ＞
　フレームメモリ１２１は、画像に関するデータの記憶に関する処理を行う。例えば、フレームメモリ１２１は、演算部１１９から供給される局所復号画像R_localや、インループフィルタ部１２０から供給されるフィルタ処理された局所復号画像R_localを入力とし、それを保持（記憶）する。また、フレームメモリ１２１は、その局所復号画像R_localを用いてピクチャ単位毎の復号画像Rを再構築し、保持する（フレームメモリ１２１内のバッファへ格納する）。フレームメモリ１２１は、予測部１２２の要求に応じて、その復号画像R（またはその一部）を予測部１２２に供給する。

　　　　＜予測部＞
　予測部１２２は、予測画像Pの生成に関する処理を行う。例えば、予測部１２２は、制御部１０１から供給される予測モード情報Pinfoと、並べ替えバッファ１１１から供給される入力画像（元画像）と、フレームメモリ１２１から読み出す復号画像R（またはその一部）を入力とする。予測部１２２は、予測モード情報Pinfoや入力画像（元画像）を用い、インター予測やイントラ予測等の予測処理を行い、復号画像Rを参照画像として参照して予測を行い、その予測結果に基づいて動き補償処理を行い、予測画像Pを生成する。予測部１２２は、生成した予測画像Pを演算部１１２および演算部１１９に供給する。また、予測部１２２は、以上の処理により選択した予測モード、すなわち最適な予測モードに関する情報を、必要に応じて符号化部１１５に供給する。

　　　　＜レート制御部＞
　レート制御部１２３は、レート制御に関する処理を行う。例えば、レート制御部１２３は、蓄積バッファ１１６に蓄積された符号化データの符号量に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部１１４の量子化動作のレートを制御する。

　なお、図２を参照して上述したような符号化回路２３において設定部、および直交変換部として行われる各処理は、図４に示す各ブロックにおいて個々に行われるのではなく、例えば、複数のブロックにより行われるようにしてもよい。

［第１の実施形態に係る画像復号装置の構成例］
　図５は、本開示の第１の実施形態に係る画像復号装置の一実施の形態の構成例を示すブロック図である。図５に示される画像復号装置１３は、AVCやHEVCのように、画像とその予測画像との予測残差が符号化された符号化データを復号する装置である。例えば、画像復号装置１３は、非特許文献１、非特許文献２、または非特許文献３に記載されている技術を実装し、それらの文献のいずれかに記載された規格に準拠した方法で動画像の画像データが符号化された符号化データを復号する。例えば、画像復号装置１３は、上述の画像符号化装置１２により生成された符号化データ（ビットストリーム）を復号する。

　なお、図５においては、処理部やデータの流れ等の主なものを示しており、図５に示されるものが全てとは限らない。つまり、画像復号装置１３において、図５においてブロックとして示されていない処理部が存在したり、図５において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図５において、画像復号装置１３は、蓄積バッファ２１１、復号部２１２、逆量子化部２１３、逆直交変換部２１４、演算部２１５、インループフィルタ部２１６、並べ替えバッファ２１７、フレームメモリ２１８、および予測部２１９を備えて構成される。なお、予測部２１９は、不図示のイントラ予測部およびインター予測部を備えている。画像復号装置１３は、符号化データ（ビットストリーム）を復号することによって、動画像データを生成するための装置である。

　　　　＜蓄積バッファ＞
　蓄積バッファ２１１は、画像復号装置１３に入力されたビットストリームを取得し、保持（記憶）する。蓄積バッファ２１１は、所定のタイミングにおいて、または、所定の条件が整う等した場合、蓄積しているビットストリームを復号部２１２に供給する。

　　　　＜復号部＞
　復号部２１２は、画像の復号に関する処理を行う。例えば、復号部２１２は、蓄積バッファ２１１から供給されるビットストリームを入力とし、シンタックステーブルの定義に沿って、そのビット列から、各シンタックス要素のシンタックス値を可変長復号し、パラメータを導出する。

　シンタックス要素およびシンタックス要素のシンタックス値から導出されるパラメータには、例えば、ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、残差情報Rinfo、フィルタ情報Finfoなどの情報が含まれる。つまり、復号部２１２は、ビットストリームから、これらの情報をパースする（解析して取得する）。これらの情報について以下に説明する。

　　　　　＜ヘッダ情報Hinfo＞
　ヘッダ情報Hinfoは、例えば、VPS（Video　Parameter　Set）／SPS（Sequence　Parameter　Set）／PPS（PicTUre　Parameter　Set）／SH（スライスヘッダ）などのヘッダ情報を含む。ヘッダ情報Hinfoには、例えば、画像サイズ（横幅PicWidth、縦幅PicHeight）、ビット深度（輝度bitDepthY,　色差bitDepthC）、色差アレイタイプChromaArrayType、CUサイズの最大値MaxCUSize／最小値MinCUSize、４分木分割（Quad-tree分割ともいう）の最大深度MaxQTDepth/最小深度MinQTDepth、２分木分割（Binary-tree分割）の最大深度MaxBTDepth/最小深度MinBTDepth、変換スキップブロックの最大値MaxTSSize（最大変換スキップブロックサイズともいう）、各符号化ツールのオンオフフラグ（有効フラグともいう）などを規定する情報が含まれる。

　例えば、ヘッダ情報Hinfoに含まれる符号化ツールのオンオフフラグとしては、以下に示す変換、量子化処理に関わるオンオフフラグがある。なお、符号化ツールのオンオフフラグは、該符号化ツールに関わるシンタックスが符号化データ中に存在するか否かを示すフラグとも解釈することができる。また、オンオフフラグの値が１（真）の場合、該符号化ツールが使用可能であることを示し、オンオフフラグの値が０（偽）の場合、該符号化ツールが使用不可であることを示す。なお、フラグ値の解釈は逆であってもよい。

　コンポーネント間予測有効フラグ（ccp_enabled_flag）:コンポーネント間予測（CCP（Cross-Component　Prediction），CC予測とも称する）が使用可能であるか否かを示すフラグ情報である。例えば、このフラグ情報が「１」（真）の場合、使用可能であることが示され、「０」（偽）の場合、使用不可であることが示される。

　なお、このCCPは、コンポーネント間線形予測（CCLMまたはCCLMP）とも称する。

　　　　　＜予測モード情報Pinfo＞
　予測モード情報Pinfoには、例えば、処理対象PB（予測ブロック）のサイズ情報PBSize（予測ブロックサイズ）、イントラ予測モード情報IPinfo、動き予測情報MVinfo等の情報が含まれる。

　イントラ予測モード情報IPinfoには、例えば、JCTVC-W1005,　7.3.8.5　Coding　Unit　syntax中のprev_intra_luma_pred_flag,　mpm_idx,　rem_intra_pred_mode、およびそのシンタックスから導出される輝度イントラ予測モードIntraPredModeY等が含まれる。

　また、イントラ予測モード情報IPinfoには、例えば、コンポーネント間予測フラグ（ccp_flag（cclmp_flag））、多クラス線形予測モードフラグ（mclm_flag）、色差サンプル位置タイプ識別子（chroma_sample_loc_type_idx）、色差MPM識別子（chroma_mpm_idx）、および、これらのシンタックスから導出される輝度イントラ予測モード（IntraPredModeC）等が含まれる。

　コンポーネント間予測フラグ（ccp_flag（cclmp_flag））は、コンポーネント間線形予測を適用するか否かを示すフラグ情報である。例えば、ccp_flag==1のとき、コンポーネント間予測を適用することを示し、ccp_flag==0のとき、コンポーネント間予測を適用しないことを示す。

　多クラス線形予測モードフラグ（mclm_flag）は、線形予測のモードに関する情報（線形予測モード情報）である。より具体的には、多クラス線形予測モードフラグ（mclm_flag）は、多クラス線形予測モードにするか否かを示すフラグ情報である。例えば、「０」の場合、１クラスモード（単一クラスモード）（例えばCCLMP）であることを示し、「１」の場合、２クラスモード（多クラスモード）（例えばMCLMP）であることを示す。

　色差サンプル位置タイプ識別子（chroma_sample_loc_type_idx）は、色差コンポーネントの画素位置のタイプ（色差サンプル位置タイプとも称する）を識別する識別子である。例えば色フォーマットに関する情報である色差アレイタイプ（ChromaArrayType）が420形式を示す場合、色差サンプル位置タイプ識別子は、次に示すような割り当て方となる。

　　chroma_sample_loc_type_idx　==　0　:　Type2
　　chroma_sample_loc_type_idx　==　1　:　Type3
　　chroma_sample_loc_type_idx　==　2　:　Type0
　　chroma_sample_loc_type_idx　==　3　:　Type1

　なお、この色差サンプル位置タイプ識別子（chroma_sample_loc_type_idx）は、色差コンポーネントの画素位置に関する情報（chroma_sample_loc_info()）として（に格納されて）伝送される。

　色差MPM識別子（chroma_mpm_idx）は、色差イントラ予測モード候補リスト（intraPredModeCandListC）の中のどの予測モード候補を色差イントラ予測モードとして指定するかを表す識別子である。

　動き予測情報MVinfoには、例えば、merge_idx,　merge_flag,　inter_pred_idc,　ref_idx_LX,　mvp_lX_flag,　X=（0,1）,　mvd等の情報が含まれる（例えば、JCTVC-W1005,　7.3.8.6　Prediction　Unit　Syntaxを参照）。

　もちろん、予測モード情報Pinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。

　　　　　＜変換情報Tinfo＞
　変換情報Tinfoには、例えば、以下の情報が含まれる。もちろん、変換情報Tinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。

　処理対象変換ブロックの横幅サイズTBWSizeおよび縦幅TBHSize（または、２を底とする各TBWSize、TBHSizeの対数値log2TBWSize、log2TBHSizeであってもよい）。
　　変換スキップフラグ（ts_flag）:（逆）プライマリ変換および（逆）セカンダリ変換をスキップか否かを示すフラグである。
　　スキャン識別子（scanIdx）
　　量子化パラメータ（qp）
　　量子化マトリックス（scaling_matrix（例えば、JCTVC-W1005,　7.3.4　Scaling　list　data　syntax））

　　　　　＜残差情報Rinfo＞
　残差情報Rinfo（例えば、JCTVC-W1005の7.3.8.11　Residual　Coding　syntaxを参照）には、例えば以下のシンタックスが含まれる。

　　cbf（coded_block_flag）：残差データ有無フラグ
　　last_sig_coeff_x_pos：ラスト非ゼロ係数X座標
　　last_sig_coeff_y_pos：ラスト非ゼロ係数Y座標
　　coded_sub_block_flag：サブブロック非ゼロ係数有無フラグ
　　sig_coeff_flag：非ゼロ係数有無フラグ
　　gr1_flag：非ゼロ係数のレベルが１より大きいかを示すフラグ（GR1フラグとも呼ぶ）
　　gr2_flag：非ゼロ係数のレベルが２より大きいかを示すフラグ(GR2フラグとも呼ぶ)
　　sign_flag：非ゼロ係数の正負を示す符号（サイン符号とも呼ぶ）
　　coeff_abs_level_remaining:非ゼロ係数の残余レベル（非ゼロ係数残余レベルとも呼ぶ）など。

　もちろん、残差情報Rinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。

　　　　　＜フィルタ情報Finfo＞
　フィルタ情報Finfoには、例えば、以下に示す各フィルタ処理に関する制御情報が含まれる。

　　デブロッキングフィルタ(DBF)に関する制御情報
　　画素適応オフセット(SAO)に関する制御情報
　　適応ループフィルタ(ALF)に関する制御情報
　　その他の線形・非線形フィルタに関する制御情報

　より具体的には、例えば、各フィルタを適用するピクチャや、ピクチャ内の領域を指定する情報や、CU単位のフィルタOn/Off制御情報、スライス、タイルの境界に関するフィルタOn/Off制御情報などが含まれる。もちろん、フィルタ情報Finfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。

　復号部２１２の説明に戻り、復号部２１２は、残差情報Rinfoを参照して、各変換ブロック内の各係数位置の量子化変換係数レベルlevelを導出する。復号部２１２は、その量子化変換係数レベルlevelを、逆量子化部２１３に供給する。

　また、復号部２１２は、パースしたヘッダ情報Hinfo、予測モード情報Pinfo、量子化変換係数レベルlevel、変換情報Tinfo、フィルタ情報Finfoを各ブロックへ供給する。具体的には以下の通りである。

　　ヘッダ情報Hinfoは、逆量子化部２１３、逆直交変換部２１４、予測部２１９、インループフィルタ部２１６に供給される。
　　予測モード情報Pinfoは、逆量子化部２１３および予測部２１９に供給される。
　　変換情報Tinfoは、逆量子化部２１３および逆直交変換部２１４に供給される。
　　フィルタ情報Finfoは、インループフィルタ部２１６に供給される。

　もちろん、上述の例は一例であり、この例に限定されない。例えば、各符号化パラメータが任意の処理部に供給されるようにしてもよい。また、その他の情報が、任意の処理部に供給されるようにしてもよい。

　　　　＜逆量子化部＞
　逆量子化部２１３は、逆量子化に関する処理を行う。例えば、逆量子化部２１３は、復号部２１２から供給される変換情報Tinfoおよび量子化変換係数レベルlevelを入力とし、その変換情報Tinfoに基づいて、量子化変換係数レベルlevelの値をスケーリング（逆量子化）し、逆量子化後の変換係数Coeff_IQを導出する。

　なお、この逆量子化は、量子化部１１４による量子化の逆処理として行われる。また、この逆量子化は、逆量子化部１１７による逆量子化と同様の処理である。つまり、逆量子化部１１７は、逆量子化部２１３と同様の処理（逆量子化）を行う。

　逆量子化部２１３は、導出した変換係数Coeff_IQを逆直交変換部２１４に供給する。

　　　　＜逆直交変換部＞
　逆直交変換部２１４は、逆直交変換に関する処理を行う。例えば、逆直交変換部２１４は、逆量子化部２１３から供給される変換係数Coeff_IQ、および、復号部２１２から供給される変換情報Tinfoを入力とし、その変換情報Tinfoに基づいて、変換係数Coeff_IQに対して逆直交変換処理を行い、予測残差D'を導出する。

　なお、この逆直交変換は、直交変換部１１３による直交変換の逆処理として行われる。また、この逆直交変換は、逆直交変換部１１８による逆直交変換と同様の処理である。つまり、逆直交変換部１１８は、逆直交変換部２１４と同様の処理（逆直交変換）を行う。

　逆直交変換部２１４は、導出した予測残差D'を演算部２１５に供給する。

　　　　＜演算部＞
　演算部２１５は、画像に関する情報の加算に関する処理を行う。例えば、演算部２１５は、逆直交変換部２１４から供給される予測残差D'と、予測部２１９から供給される予測画像Pとを入力とする。演算部２１５は、予測残差D'とその予測残差D'に対応する予測画像P（予測信号）とを加算し、局所復号画像R_localを導出（R_local＝D'＋P）する。

　演算部２１５は、導出した局所復号画像R_localを、インループフィルタ部２１６およびフレームメモリ２１８に供給する。

　　　　＜インループフィルタ部＞
　インループフィルタ部２１６は、インループフィルタ処理に関する処理を行う。例えば、インループフィルタ部２１６は、演算部２１５から供給される局所復号画像R_localと、復号部２１２から供給されるフィルタ情報Finfoとを入力とする。なお、インループフィルタ部２１６に入力される情報は任意であり、これらの情報以外の情報が入力されてもよい。

　インループフィルタ部２１６は、そのフィルタ情報Finfoに基づいて、局所復号画像R_localに対して適宜フィルタ処理を行う。

　例えば、インループフィルタ部２１６は、非特許文献１に記載のように、バイラテラルフィルタ、デブロッキングフィルタ（DBF（DeBlocking　Filter））、適応オフセットフィルタ（SAO（Sample　Adaptive　Offset））、および適応ループフィルタ（ALF(Adaptive　Loop　Filter)）の４つのインループフィルタをこの順に適用する。なお、どのフィルタを適用するか、どの順で適用するかは任意であり、適宜選択可能である。

　インループフィルタ部２１６は、符号化側（例えば、図４の画像符号化装置１２のインループフィルタ部１２０）により行われたフィルタ処理に対応するフィルタ処理を行う。

　もちろん、インループフィルタ部２１６が行うフィルタ処理は任意であり、上述の例に限定されない。例えば、インループフィルタ部２１６がウィーナーフィルタ等を適用するようにしてもよい。

　インループフィルタ部２１６は、フィルタ処理された局所復号画像R_localを並べ替えバッファ２１７およびフレームメモリ２１８に供給する。

　　　　＜並べ替えバッファ＞
　並べ替えバッファ２１７は、インループフィルタ部２１６から供給された局所復号画像R_localを入力とし、それを保持（記憶）する。並べ替えバッファ２１７は、その局所復号画像R_localを用いてピクチャ単位毎の復号画像Rを再構築し、保持する（バッファ内に格納する）。並べ替えバッファ２１７は、得られた復号画像Rを、復号順から再生順に並べ替える。並べ替えバッファ２１７は、並べ替えた復号画像R群を動画像データとして画像復号装置１３の外部に出力する。

　　　　＜フレームメモリ＞
　フレームメモリ２１８は、画像に関するデータの記憶に関する処理を行う。例えば、フレームメモリ２１８は、演算部２１５より供給される局所復号画像R_localを入力とし、ピクチャ単位毎の復号画像Rを再構築して、フレームメモリ２１８内のバッファへ格納する。

　また、フレームメモリ２１８は、インループフィルタ部２１６から供給される、インループフィルタ処理された局所復号画像R_localを入力とし、ピクチャ単位毎の復号画像Rを再構築して、フレームメモリ２１８内のバッファへ格納する。フレームメモリ２１８は、適宜、その記憶している復号画像R（またはその一部）を参照画像として予測部２１９に供給する。

　なお、フレームメモリ２１８が、復号画像の生成に係るヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなどを記憶するようにしても良い。

　　　　＜予測部＞
　予測部２１９は、予測画像Pの生成に関する処理を行う。例えば、予測部２１９は、復号部２１２から供給される予測モード情報Pinfoを入力とし、その予測モード情報Pinfoによって指定される予測方法により予測を行い、予測画像Pを導出する。その導出の際、予測部２１９は、その予測モード情報Pinfoによって指定される、フレームメモリ２１８に格納されたフィルタ前またはフィルタ後の復号画像R（またはその一部）を、参照画像として利用する。予測部２１９は、導出した予測画像Pを、演算部２１５に供給する。

　なお、図３を参照して上述したような復号回路３３において直交変換部、および制御部として行われる各処理は、図５に示す各ブロックにおいて個々に行われるのではなく、例えば、複数のブロックにより行われるようにしてもよい。

　［画像符号化処理および画像復号処理］
　図６及び図７のフローチャートを参照して、画像符号化装置１２が実行する画像符号化処理、および、画像復号装置１３が実行する画像復号処理について説明する。

　図６は、本開示の第１の実施形態に係る画像符号化装置１２が実行する画像符号化処理を説明するフローチャートである。

　画像符号化処理が開始されると、並べ替えバッファ１１１は、制御部１０１に制御されて、入力された動画像データのフレームの順を表示順から符号化順に並べ替える（ステップＳ１１）。

　制御部１０１は、並べ替えバッファ１１１が保持する入力画像に対して、処理単位を設定する（ブロック分割を行う）（ステップＳ１２）。

　制御部１０１は、並べ替えバッファ１１１が保持する入力画像についての符号化パラメータを決定（設定）する（ステップＳ１３）。

　予測部１２２は、予測処理を行い、最適な予測モードの予測画像P等を生成する（ステップＳ１４）。例えば、この予測処理において、予測部１２２は、イントラ予測を行って最適なイントラ予測モードの予測画像P等を生成し、インター予測を行って最適なインター予測モードの予測画像P等を生成し、それらの中から、コスト関数値等に基づいて最適な予測モードを選択する。

　演算部１１２は、入力画像と、ステップＳ１４の予測処理により選択された最適なモードの予測画像Pとの差分を演算する（ステップＳ１５）。つまり、演算部１１２は、入力画像と予測画像Pとの予測残差Dを生成する。このようにして求められた予測残差Dは、元の画像データに比べてデータ量が低減される。したがって、画像をそのまま符号化する場合に比べて、データ量を圧縮することができる。

　直交変換部１１３は、ステップＳ１５の処理により生成された予測残差Dに対して直交変換処理を行い、変換係数Coeffを導出する（ステップＳ１６）。

　量子化部１１４は、制御部１０１により算出された量子化パラメータを用いる等して、ステップＳ１６の処理により得られた変換係数Coeffを量子化し、量子化変換係数レベルlevelを導出する（ステップＳ１７）。

　逆量子化部１１７は、ステップＳ１７の処理により生成された量子化変換係数レベルlevelを、そのステップＳ１７の量子化の特性に対応する特性で逆量子化し、変換係数Coeff_IQを導出する（ステップＳ１８）。

　逆直交変換部１１８は、ステップＳ１８の処理により得られた変換係数Coeff_IQを、ステップＳ１６の直交変換処理に対応する方法で逆直交変換し、予測残差D'を導出する（ステップＳ１９）。なお、この逆直交変換処理は、復号側において行われる逆直交変換処理（後述する）と同様であるので、このステップＳ１９の逆直交変換処理については、復号側について行う説明（後述する）を適用することができる。

　演算部１１９は、ステップＳ１９の処理により導出された予測残差D'に、ステップＳ１４の予測処理により得られた予測画像Pを加算することにより、局所的に復号された復号画像を生成する（ステップＳ２０）。

　インループフィルタ部１２０は、ステップＳ２０の処理により導出された、局所的に復号された復号画像に対して、インループフィルタ処理を行う（ステップＳ２１）。

　フレームメモリ１２１は、ステップＳ２０の処理により導出された、局所的に復号された復号画像や、ステップＳ２１においてフィルタ処理された、局所的に復号された復号画像を記憶する（ステップＳ２２）。

　符号化部１１５は、ステップＳ１７の処理により得られた量子化変換係数レベルlevelを符号化する（ステップＳ２３）。例えば、符号化部１１５は、画像に関する情報である量子化変換係数レベルlevelを、算術符号化等により符号化し、符号化データを生成する。また、このとき、符号化部１１５は、各種符号化パラメータ（ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo）を符号化する。さらに、符号化部１１５は、量子化変換係数レベルlevelから残差情報RInfoを導出し、その残差情報RInfoを符号化する。

　蓄積バッファ１１６は、このようにして得られた符号化データを蓄積し、例えばビットストリームとして、それを画像符号化装置１２の外部に出力する（ステップＳ２４）。このビットストリームは、例えば、伝送路や記録媒体を介して復号側に伝送される。また、レート制御部１２３は、必要に応じてレート制御を行う。

　ステップＳ２４の処理が終了すると、画像符号化処理が終了する。

　図７は、本開示の第１の実施形態に係る画像復号装置１３が実行する画像復号処理を説明するフローチャートである。

　画像復号処理が開始されると、蓄積バッファ２１１は、画像復号装置１３の外部から供給される符号化データ（ビットストリーム）を取得して保持する（蓄積する）（ステップＳ３１）。

　復号部２１２は、その符号化データ（ビットストリーム）を復号し、量子化変換係数レベルlevelを得る（ステップＳ３２）。また、復号部２１２は、この復号により、符号化データ（ビットストリーム）から各種符号化パラメータをパースする（解析して取得する）。

　逆量子化部２１３は、ステップＳ３２の処理により得られた量子化変換係数レベルlevelに対して、符号化側で行われた量子化の逆処理である逆量子化を行い、変換係数Coeff_IQを得る（ステップＳ３３）。

　逆直交変換部２１４は、ステップＳ３３の処理により得られた変換係数Coeff_IQに対して、符号化側で行われた直交変換処理の逆処理である逆直交変換処理を行い、予測残差D'を得る（ステップＳ３４）。

　予測部２１９は、ステップＳ３２においてパースされた情報に基づいて、符号化側より指定される予測方法で予測処理を実行し、フレームメモリ２１８に記憶されている参照画像を参照する等して、予測画像Pを生成する（ステップＳ３５）。

　演算部２１５は、ステップＳ３４の処理により得られた予測残差D'と、ステップＳ３５の処理により得られた予測画像Pとを加算し、局所復号画像R_localを導出する（ステップＳ３６）。

　インループフィルタ部２１６は、ステップＳ３６の処理により得られた局所復号画像R_localに対して、インループフィルタ処理を行う（ステップＳ３７）。

　並べ替えバッファ２１７は、ステップＳ３７の処理により得られたフィルタ処理された局所復号画像R_localを用いて復号画像Rを導出し、その復号画像R群の順序を復号順から再生順に並べ替える（ステップＳ３８）。再生順に並べ替えられた復号画像R群は、動画像として画像復号装置１３の外部に出力される。

　また、フレームメモリ２１８は、ステップＳ３６の処理により得られた局所復号画像R_local、および、ステップＳ３７の処理により得られたフィルタ処理後の局所復号画像R_localの内、少なくとも一方を記憶する（ステップＳ３９）。

　ステップＳ３９の処理が終了すると、画像復号処理が終了する。

［第１の実施形態に係るCUブロック分割の概要］
　図８は、本開示の第１の実施形態に係るCUのブロック分割の一例を示す図（１）である。図９は、本開示の第１の実施形態に係るCUのブロック分割の一例を示す図（２）である。制御部１０１は、図８に示すように、CUを分割する。さらに、制御部１０１は、図９に示すように、分割したCUを更に分割することができる。このように、図８及び図９に示すように、分割した場合においても、CUの高さ方向及び幅方向の画素数は、２のべき乗となる。

　ところで、動き補償においては、動きの境界で分割することが好ましいため、自由度の高いブロック分割が望まれている。図１０は、本開示の第１の実施形態に係るCUのブロック分割のバリエーションを示す図である。図１０に示すように、CUのブロック分割のバリエーションを増加させた場合、CUの高さ方向又は幅方向の画素数が、２のべき乗とはならないことがある。

　ここで、CUは、TUと同一サイズとすることが提案されている。すなわち、CU単位で直交変換、又は逆直交変換を実行する仕様とすることが提案されている。そして、図１０に示すようなブロック分割を実行した場合に、幅方向又は高さ方向の画素数が２のべき乗とはならないCUが存在する。このため、幅方向又は高さ方向の画素数が２のべき乗とはならないCU、つまり幅方向又は高さ方向の画素数が２のべき乗とはならないブロックに対して直交変換及び逆直交変換を実行しなければならないことがある。幅方向又は高さ方向の画素数が２のべき乗の場合、高速フーリエ変換により演算量が少なくなるため少ない処理量で高速に処理を実行することができる。しかしながら、２のべき乗ではないCUに対して、直交変換、又は逆直交変換を実行した場合に、高速フーリエ変換を用いることができないため、処理量が増大し、処理速度を向上させることが困難になる。そこで、CUの画素数が２のべき乗ではない場合に、以下方法により量子化、逆量子化、直交変換、及び逆直交変換を実行させる。

［第１の実施形態に係る画像符号化装置１２の符号化処理］
　ここで、図１１は、本開示の第１の実施形態に係るCUの分割前後の一例を示した図である。図１１（ａ）は、分割前のCUの一例を示した図である。図１１（ｂ）は、分割したCUの一例を示した図である。図１１（ｂ）は、境界で分割したことにより右側の領域の幅方向の画素数が２のべき乗ではなくなっている。そのため、図１１（ｂ）に示す右側領域に対して直交変換を実行した場合、処理量が増大し、処理速度を向上させることが困難になる。そこで、図１１（ｂ）に示す右側領域には、直交変換はスキップして、量子化を実行する。

　ここで、図１２は、本開示の第１の実施形態に係る符号化処理の一例を示すフローチャートである。制御部１０１は、動きの境界に合わせて、CUを分割する（ステップＳ４１）。制御部１０１は、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かを判定する（ステップＳ４２）。

　直交変換部１１３は、CUの高さ方向、及び幅方向の画素数が２のべき乗である場合に（ステップＳ４２；Ｙｅｓ）、予測残差Dに対して直交変換を実行する（ステップＳ４３）。

　また、制御部１０１は、予測残差Dが含まれているか否かを示す残差データ有無フラグ（cbf）に１を設定する（ステップＳ４４）。すなわち、制御部１０１は、予測残差Dが含まれていることを残差データ有無フラグ（cbf）に設定する。

　そして、蓄積バッファ１１６は、予測残差Dと、残差データ有無フラグ（cbf）とを含むビットストリームを出力する（ステップＳ４５）。

　ステップＳ４２において、CUの高さ方向、又は幅方向の何れか一方の画素数が２のべき乗ではない場合に（ステップＳ４２；Ｎｏ）、制御部１０１は、Transform　skip、又はPCM（Pulse　Code　Modulation）モード等の処理により予測残差Dに対する直交変換をスキップして、直交変換を実行しない（ステップＳ４６）。

　また、直交変換部１１３は、予測残差Dが含まれていないことを示す０を残差データ有無フラグ（cbf）に設定する（ステップＳ４７）。

　そして、蓄積バッファ１１６は、直交変換が実行されていない予測画像Pと、直交変換された予測残差Dが含まれていないことを示す残差データ有無フラグ（cbf）とを含むビットストリームを出力する（ステップＳ４８）。

　このように、画像符号化装置１２は、CUの高さ方向、又は幅方向の何れか一方の画素数が２のべき乗ではない場合に、直交変換を実行しないことで処理量が増大してしまうことを抑制することができる。

［第１の実施形態に係る画像復号装置１３の復号処理］
　次に、画像符号化装置１２から出力されたビットストリームを復号するデコーダにおける処理について説明する。

　ここで、図１３は、本開示の第１の実施形態に係る復号処理の一例を示すフローチャートである。復号部２１２は、画像符号化装置１２が出力したビットストリームに含まれている残差データ有無フラグ（cbf）に基づいて、ビットストリームに予測残差Dが含まれているか否かを判定する（ステップＳ５１）。

　ビットストリームに予測残差Dが含まれている場合に（ステップＳ５１；Ｙｅｓ）、復号部２１２は、ビットストリームに含まれている予測残差Dに対して逆直交変換部２１４に逆直交変換を実行させる（ステップＳ５２）。

　一方、ビットストリームに予測残差Dが含まれていない場合に（ステップＳ５１；Ｎｏ）、復号部２１２は、ビットストリームに含まれている予測画像Pに対して逆直交変換部２１４に逆直交変換を実行させない（ステップＳ５３）。

［第１の実施形態の変形例（１）］
　上記の第１の実施形態では、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かにより直交変換及び逆直交変換の実行を制御した。変形例１においては、さらに予測モードを制御する。

　予測モードには、処理対象のフレーム画像とは異なる画像に基づいて予測画像を生成するインター予測と、処理対象のフレーム画像に基づいて予測画像を生成するイントラ予測とがある。イントラ予測においては、予測残差Dの量が多くなり、直交変換を実行しなければならない場合が多くある。また、インター予測においては、イントラ予測と比較して、高精細な画像を取得することができる。そこで、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗ではない場合に、インター予測に固定する。

［第１の実施形態の変形例（１）に係る画像符号化装置１２の符号化処理］
　ここで、図１４は、本開示の第１の実施形態の変形例（１）に係る符号化処理の一例を示すフローチャートである。制御部１０１は、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かを判定する（ステップＳ６１）。

　CUの高さ方向、又は幅方向の何れか一方の画素数が２のべき乗ではない場合に（ステップＳ６１；Ｙｅｓ）、予測部１２２は、画像に応じてイントラ予測又はインター予測を実行し、実行した予測モードを示す予測モード情報Pinfoを生成する（ステップＳ６２）。ここで、予測モード情報Pinfoには、イントラ予測とインター予測との何れを実行させるが示されたモード情報（pred_mode_flag）が含まれている。そして、蓄積バッファ１１６は、予測モード情報Pinfoが含まれているビットストリームを出力する。

　一方、CUの高さ方向、又は幅方向の何れか一方の画素数が２のべき乗ではない場合に（ステップＳ６１；Ｎｏ）、予測部１２２は、インター予測を実行し、予測モード情報Pinfoを生成しない（ステップＳ６３）。

　これにより、蓄積バッファ１１６は、予測モード情報Pinfoが含まれていないビットストリームを出力する。よって、画像符号化装置１２は、符号量を削減することができる。

［第１の実施形態の変形例（１）に係る画像復号装置１３の復号処理］
　ここで、図１５は、本開示の第１の実施形態の変形例（１）に係る復号処理の一例を示すフローチャートである。復号部２１２は、受信したビットストリームに予測モード情報Pinfoが含まれているか否かを判定する（ステップＳ７１）。

　ビットストリームに予測モード情報Pinfoが含まれている場合に（ステップＳ７１；Ｙｅｓ）、予測部１２２は、予測モード情報Pinfoに応じて、イントラ予測やインター予測を実行する（ステップＳ７２）。

　一方、ビットストリームに予測モード情報Pinfoが含まれていない場合に（ステップＳ７１；Ｎｏ）、予測部１２２は、インター予測を実行する（ステップＳ７３）。

［第１の実施形態の変形例（２）］
　上記の第１の実施形態では、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かにより直交変換及び逆直交変換の実行を制御した。ここで、CUの画素数が２のべき乗ではない場合に直交変換を実行しないのは、直交変換の処理量が増大し処理速度を低下させてしまうためである。CUのサイズが閾値よりも小さい場合には、直交変換の処理量が増大しても処理速度に与える影響は小さいと考えられる。そこで、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗ではなくても、直交変換を実行してもよい。

［第１の実施形態の変形例（２）に係る画像符号化装置１２の符号化処理］
　ここで、図１６は、本開示の第１の実施形態の変形例（２）に係る符号化処理の一例を示すフローチャートである。制御部１０１は、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かを判定する（ステップＳ８１）。

　直交変換部１１３は、CUの高さ方向、及び幅方向の画素数が２のべき乗である場合に（ステップＳ８１；Ｙｅｓ）、予測残差Dに対して直交変換を実行する（ステップＳ８２）。

　また、直交変換部１１３は、予測残差Dが含まれているか否かを示す残差データ有無フラグ（cbf）に１を設定する（ステップＳ８３）。すなわち、直交変換部１１３は、予測残差Dが含まれていることを残差データ有無フラグ（cbf）に設定する。

　ステップＳ８１において、CUの高さ方向、又は幅方向の何れか一方の画素数が２のべき乗ではない場合に（ステップＳ８１；Ｎｏ）、制御部１０１は、CUのサイズが閾値より小さいか否かを判定する（ステップＳ８４）。

　CUのサイズが閾値より小さい場合に（ステップＳ８４；Ｙｅｓ）、直交変換部１１３は、ステップＳ８２において予測残差Dに対して直交変換を実行する。

　一方、CUのサイズが閾値以上の場合に（ステップＳ８４；Ｙｅｓ）、制御部１０１は、Transform　skip、又はＰＣＭモード等の処理により直交変換部１１３に直交変換を実行しない（ステップＳ８５）。

　また、直交変換部１１３は、予測残差Dが含まれていないことを示す０を残差データ有無フラグ（cbf）に設定する（ステップＳ８６）。

　このように、画像符号化装置１２は、CUのサイズが閾値よりも小さい場合に直交変換を実行し、CUのサイズが閾値よりも大きい場合には直交変換を実行しない。よって、画像符号化装置１２は、処理量が増大してしまうことを抑制することができる。

［第１の実施形態の変形例（２）に係る画像復号装置１３の復号処理］
　画像復号装置１３は、図１３に示すフローチャートと同様の処理を実行する。すなわち、画像復号装置１３は、残差データ有無フラグ（cbf）に基づいて、逆直交変換処理を実行する。

［第２の実施形態］
　上記の第１の実施形態では、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かにより直交変換及び逆直交変換の実行を制御した。第２の実施形態では、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗ではない場合に、高さ方向、及び幅方向の画素数が２のべき乗になるCUを形成するように分割する。このように、CUを分割することで、画素数が２のべき乗ではなかったCUの画素数を２のべき乗に変更する。

［第２の実施形態に係る画像符号化装置１２の符号化処理］
　ここで、図１７は、本開示の第２の実施形態に係る符号化処理の一例を示すフローチャートである。制御部１０１は、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かを判定する（ステップＳ９１）。

　直交変換部１１３は、CUの高さ方向、及び幅方向の画素数が２のべき乗である場合に（ステップＳ９１；Ｙｅｓ）、予測残差Dに対して直交変換を実行する（ステップＳ９２）。

　また、直交変換部１１３は、予測残差Dが含まれているか否かを示す残差データ有無フラグ（cbf）に１を設定する（ステップＳ９３）。すなわち、直交変換部１１３は、予測残差Dが含まれていることを残差データ有無フラグ（cbf）に設定する。

　ステップＳ９１において、CUの高さ方向、又は幅方向の何れか一方の画素数が２のべき乗ではない場合に（ステップＳ９１；Ｎｏ）、制御部１０１は、高さ方向、又は幅方向の何れか一方の画素数が２のべき乗ではないCUを更に分割する（ステップＳ９４）。この時、制御部１０１は、高さ方向、及び幅方向の画素数が２のべき乗になるCUを形成するように分割する。そして、ステップＳ９２に移行する。

　なお、ステップＳ９２に移行するのは一例であって、ステップＳ９１に移行してもよい。すなわち、CUの分割後においてもCUの高さ方向、又は幅方向の何れか一方の画素数が２のべき乗であるか否かを判定し、２のべき乗ではない場合に、再度CUを分割してもよい。

　図１８から図２０によりCUの分割の態様を例示して説明する。ここで、図１８は、本開示の第２の実施形態に係るCUの分割態様の一例を示す図である。図１８（ａ）は、分割前のCUを示している。図１８（ｂ）は、１回目の分割後のCUを示している。図１８（ｃ）は、２回目の分割後のCUを示している。

　図１８（ｂ）に示す１回目のCUの分割により、分割した境界の右側のCUの幅方向の画素数が２のべき乗ではなくなっている。そこで、図１８（ｃ）に示す２回目のCUの分割を実行する。このように、左右対称に分割することにより、CUの幅方向の画素数が２のべき乗になる。

　図１９は、本開示の第２の実施形態に係るCUの分割態様の一例を示す図である。図１９（ａ）は、分割前のCUを示している。図１９（ｂ）は、１回目の分割後のCUを示している。図１９（ｃ）は、２回目の分割後のCUを示している。

　図１９（ｂ）に示す１回目のCUの分割により、分割した境界の下側のCUの高さ方向の画素数が２のべき乗ではなくなっている。そこで、図１９（ｃ）に示す２回目のCUの分割を実行する。このように、上下対称に分割することにより、CUの高さ方向の画素数が２のべき乗になる。

　図２０は、本開示の第２の実施形態に係るCUの分割態様の一例を示す図である。図２０（ａ）は、分割後のCUを示している。図２０（ｂ）は、（ａ）に示すCUを分割した状態を示している。図２０（ｃ）は、（ｂ）に示すCUを分割した状態を示している。

　図２０（ｂ）に示す１回目のCUの分割により、分割した境界の下側のCUの高さ方向の画素数が２のべき乗ではなくなっている。そこで、図２０（ｃ）に示す２回目のCUの分割を実行する。このように、上下対称や左右対称に限らず、非対象になるように分割してもよい。

［第２の実施形態に係る画像復号装置１３の復号化処理］
　第２の実施形態において、画像符号化装置１２は、CUの高さ方向、及び幅方向の画素数が２のべき乗となるように分割し、直交変換を実行する。よって、画像復号装置１３は、各ブロックに対して逆直交変換を実行する。

［第３の実施形態］
　上記の第１の実施形態では、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かにより直交変換及び逆直交変換の実行を制御した。第３の実施形態では、画素数が２のべき乗である方向に対して、直交変換、及び逆直交変換を実行する。

　まず、CUの高さ方向、及び幅方向の両方の画素数が２のべき乗である場合について説明する。ここで、図２１は、本開示の第３の実施形態に係る高さ方向、及び幅方向の画素数が２のべき乗のCUに対する直交変換の処理手順を説明する図である。図２１（ａ）は、幅方向について１ラインごとに直交変換を実行していることを示す図である。図２１（ｂ）は、高さ方向について１ラインごとに直交変換を実行していることを示す図である。

　直交変換部１１３は、図２１（ａ）に示すように、幅方向について１ラインごとに直交変換を実行する。次いで、実行した直交変換後の係数に対して、図２１（ｂ）に示すように、高さ方向について１ラインごとに直交変換を実行する。なお、直交変換を実行する方向は、先に高さ方向について実行し、後で幅方向について実行してもよい。そして、幅方向と高さ方向との何れを先に実行しても理論上は同一の結果が得られる。但し、途中の演算精度で丸め処理が実行されると、直交変換を実行する方向の順番を変更すると誤差が生じる。そこで、どちらの方向を先に実行するかを規定し、規定された順番で直交変換を実行することが好ましい。

　逆直交変換の場合には、逆の順番で直交変換を実行する。すなわち、直交変換において幅方向を先に実行した場合に、先に高さ方向について逆直交変換を実行する。次に、幅方向について逆直交変換を実行する。

［第３の実施形態に係る画像符号化装置１２の符号化処理］
　ここで、図２２は、本開示の第３の実施形態に係る高さ方向の画素数が２のべき乗ではないCUを示す図である。図２２（ａ）は、幅方向の画素数は２のべき乗であるため直交変換を実行することを示している。図２２（ｂ）は、高さ方向の画素数は２のべき乗ではないため直交変換を実行しないことを示している。そして、図２２に示すように、高さ方向の画素数は２のべき乗ではない場合には、幅方向の画素数は２のべき乗であるため直交変換し、高さ方向の直交変換はスキップして、実行しない。

　ここで、図２３は、本開示の第３の実施形態に係る幅方向の画素数が２のべき乗ではないCUを示す図である。図２３（ａ）は、幅方向の画素数は２のべき乗ではないため直交変換を実行しないことを示している。図２３（ｂ）は、高さ方向の画素数は２のべき乗であるため直交変換を実行することを示している。そして、図２３に示すように、幅方向の画素数は２のべき乗ではない場合には、幅方向の直交変換はスキップして実行せずに、高さ方向の直交変換は２のべき乗であるため実行することを示している。

［第３の実施形態に係る画像復号装置１３の復号処理］
　図２２に示す高さ方向の画素数が２のべき乗ではないCUの場合には、幅方向について逆直交変換を実行する。一方、高さ方向について逆直交変換を実行しない。また、図２３に示す幅方向の画素数が２のべき乗ではないCUの場合には、幅方向について逆直交変換を実行しない。一方、高さ方向について逆直交変換を実行する。このように、画像符号化装置１２及び画像復号装置１３は、２のべき乗ではない方向に対しては直交変換を実行しないため大幅な処理量の増加を抑制することができる。

［第４の実施形態］
　上記の第１の実施形態では、分割後における処理対象のCUの高さ方向、及び幅方向の画素数が２のべき乗であるか否かにより直交変換及び逆直交変換の実行を制御した。第４の実施形態では、高さ方向、又は幅方向の何れか一方の画素数が２のべき乗ではないCUの内部における、高さ方向、及び幅方向の画素数が２のべき乗になる最大領域に対して直交変換を実行する。そして、最大領域を除いた残りの領域には、直交変換を実行しない。また、直交変換を実行した領域ごとに、直交変換を実行した際のRD（Rate　Distortion）コストを算出する。また、領域ごとにRDコストを比較する。これにより、RDコストに基づいた最適な領域を決定することが可能になる。

　ここで、図２４は、本開示の第４の実施形態に係る直交変換を実行する領域のバリエーションの一例を示す図である。図２４では、分割した場合に、右側領域の幅方向の画素数が２のべき乗ではなくなってしまった。そこで、右側領域において、画素数が２のべき乗であって、高さ方向及び幅方向が同一の画素数になる最大領域に対して直交変換を実行することを示している。すなわち、右側領域において、画素数が２のべき乗になる正方形の最大領域に対して直交変換を実行することを示している。図２４（ａ）は、右側領域の左上の正方形の領域に直交変換を実行することを示している。図２４（ｂ）は、右側領域の右上の正方形の領域に直交変換を実行することを示している。図２４（ｃ）は、右側領域の左下の正方形の領域に直交変換を実行することを示している。図２４（ｄ）は、右側領域の右下の正方形の領域に直交変換を実行することを示している。

［第４の実施形態に係る画像符号化装置１２の符号化処理］
　ここで、図２５は、本開示の第４の実施形態に係る符号化処理の一例を示すフローチャートである。そして、図２５に示す符号化処理は、図２４に示した各領域に対して直交変換を実行してRDコストを算出することを示している。

　制御部１０１は、図２４（ａ）に示す左上の領域に、直交変換部１１３に直交変換を実行させて、左上の領域に対するRDコストを算出する（ステップＳ１０１）。なお、制御部１０１は、最大領域を除いた残りの領域には、直交変換部１１３に直交変換を実行させない。

　制御部１０１は、図２４（ｂ）に示す右上の領域に、直交変換部１１３に直交変換を実行させて、右上の領域に対するRDコストを算出する（ステップＳ１０２）。なお、制御部１０１は、最大領域を除いた残りの領域には、直交変換部１１３に直交変換を実行させない。

　制御部１０１は、図２４（ｃ）に示す左下の領域に、直交変換部１１３に直交変換を実行させて、左下の領域に対するRDコストを算出する（ステップＳ１０３）。なお、制御部１０１は、最大領域を除いた残りの領域には、直交変換部１１３に直交変換を実行させない。

　制御部１０１は、図２４（ｄ）に示す右下の領域に、直交変換部１１３に直交変換を実行させて、右下の領域に対するRDコストを算出する（ステップＳ１０４）。なお、制御部１０１は、最大領域を除いた残りの領域には、直交変換部１１３に直交変換を実行させない。

　ステップＳ１０１からステップＳ１０４で算出したRDコストのうち、左上のRDコストが最小であるか否かを判定する（ステップＳ１０５）。左上のRDコストが最小である場合に（ステップＳ１０５；Ｙｅｓ）、制御部１０１は、直交変換の位置を示す位置情報にtr_pos=0を設定する（ステップＳ１０６）。すなわち、制御部１０１は、位置情報に左上の領域に直交変換を実行したことを設定する。

　左上のRDコストが最小ではない場合に（ステップＳ１０５；Ｎｏ）、ステップＳ１０１からステップＳ１０４で算出したRDコストのうち、右上のRDコストが最小であるか否かを判定する（ステップＳ１０７）。

　右上のRDコストが最小である場合に（ステップＳ１０７；Ｙｅｓ）、制御部１０１は、直交変換の位置を示す位置情報にtr_pos=1を設定する（ステップＳ１０８）。すなわち、制御部１０１は、位置情報に右上の領域に直交変換を実行したことを設定する。

　右上のRDコストが最小ではない場合に（ステップＳ１０７；Ｎｏ）、ステップＳ１０１からステップＳ１０４で算出したRDコストのうち、左下のRDコストが最小であるか否かを判定する（ステップＳ１０９）。

　右下のRDコストが最小である場合に（ステップＳ１０９；Ｙｅｓ）、制御部１０１は、直交変換の位置を示す位置情報にtr_pos=2を設定する（ステップＳ１１０）。すなわち、制御部１０１は、位置情報に左下の領域に直交変換を実行したことを設定する。

　右下のRDコストが最小ではない場合に（ステップＳ１０９；Ｎｏ）、制御部１０１は、直交変換の位置を示す位置情報にtr_pos=3を設定する（ステップＳ１１１）。すなわち、制御部１０１は、位置情報に右下の領域に直交変換を実行したことを設定する。

　量子化部１１４は、直交変換後の係数を量子化する（ステップＳ１１２）。

　蓄積バッファ１１６は、量子化された信号と、直交変換の位置を示す位置情報を含むビットストリームを出力する（ステップＳ１１３）。

［第４の実施形態に係る画像復号装置１３の復号処理］
　ここで、図２６は、本開示の第４の実施形態に係る復号処理の一例を示すフローチャートである。そして、図２６に示す復号処理は、直交変換の位置を示す位置情報に基づいて、直交変換された領域に対して逆直交変換を実行する。

　蓄積バッファ２１１は、量子化された信号と、直交変換の位置を示す位置情報（tr_pos）とを含むビットストリームを受信する（ステップＳ１２１）。

　逆量子化部２１３は、量子化された信号を逆量子化する（ステップＳ１２２）。

　復号部２１２は、ビットストリームから直交変換が実行された位置を示す位置情報（tr_pos）を抽出する（ステップＳ１２３）。

　復号部２１２は、位置情報（tr_pos）が左上で直交変換が実行されたことを示しているか否かを判定する（ステップＳ１２４）。すなわち、復号部２１２は、tr_pos==0であるか否かを判定する。

　位置情報（tr_pos）が左上で直交変換が実行されたことを示している場合に（ステップＳ１２４；Ｙｅｓ）、復号部２１２は、図２４（ａ）に示す左上の領域に対して逆直交変換部２１４に逆直交変換を実行させる（ステップＳ１２５）。

　位置情報（tr_pos）が左上で直交変換が実行されたことを示していない場合に（ステップＳ１２４；Ｎｏ）、復号部２１２は、位置情報（tr_pos）が右上で直交変換が実行されたことを示しているか否かを判定する（ステップＳ１２６）。すなわち、復号部２１２は、tr_pos==1であるか否かを判定する。

　位置情報（tr_pos）が右上で直交変換が実行されたことを示している場合に（ステップＳ１２６；Ｙｅｓ）、復号部２１２は、図２４（ｂ）に示す右上の領域に対して逆直交変換部２１４に逆直交変換を実行させる（ステップＳ１２７）。

　位置情報（tr_pos）が右上で直交変換が実行されたことを示していない場合に（ステップＳ１２６；Ｎｏ）、復号部２１２は、位置情報（tr_pos）が左下で直交変換が実行されたことを示しているか否かを判定する（ステップＳ１２８）。すなわち、復号部２１２は、tr_pos==2であるか否かを判定する。

　位置情報（tr_pos）が左下で直交変換が実行されたことを示している場合に（ステップＳ１２８；Ｙｅｓ）、復号部２１２は、図２４（ｃ）に示す左下の領域に対して逆直交変換部２１４に逆直交変換を実行させる（ステップＳ１２９）。

　位置情報（tr_pos）が左下で直交変換が実行されたことを示していない場合に（ステップＳ１２８；Ｎｏ）、復号部２１２は、図２４（ｄ）に示す右下の領域に対して逆直交変換部２１４に逆直交変換を実行させる（ステップＳ１３０）。

　なお、RDコストの算出において、画素数が２のべき乗になる正方形の最大領域に対して直交変換を実行した。しかしながら、直交変換を実行する領域は、正方形に限らず、長方形であってもよい。

　ここで、図２７は、本開示の第４の実施形態に係る直交変換を実行する領域のバリエーションの一例を示す図である。図２７（ａ）は、右側領域の左上の長方形の領域に直交変換を実行することを示している。図２７（ｂ）は、右側領域の右上の長方形の領域に直交変換を実行することを示している。図２７では、分割した場合に、右側領域の幅方向の画素数が２のべき乗ではなくなってしまった。一方、右側領域の高さ方向の画素数は２のべき乗になっている。そこで、右側領域において、幅方向の画素数が２のべき乗になる最大領域に対して直交変換を実行することを示している。すなわち、右側領域において、画素数が２のべき乗になる長方形の最大領域に対して直交変換を実行することを示している。そして、最大領域を除いた残りの領域には直交変換は実行されないことを示している。

［第４の実施形態の変形例（１）］
　上記の第４の実施形態では、分割した後における高さ方向、又は幅方向の何れか一方の画素数が２のべき乗ではないCUから、高さ方向、及び幅方向の画素数が２のべき乗になる最大領域に対して直交変換を実行した。第４の実施形態の変形例（１）では、最大領域に対する直交変換で残った領域から、高さ方向、又は幅方向の画素数が２のべき乗になる最大領域を分割し、分割した領域への直交変換を再帰的に繰り返す。すなわち、直交変換が実行されていない領域が無くなるまで、最大領域を分割と、分割した領域への直交変換とを再帰的に繰り返す。

［第４の実施形態の変形例（１）に係る画像符号化装置１２の符号化処理］
　図２８は、本開示の第４の実施形態の変形例（１）に係る直交変換で残った領域に対して、画素数が２のべき乗になる最大領域に直交変換を再帰的に実行した場合の一例を示す図である。そして、図２８は、左側から画素数が２のべき乗になる最大領域を分割している。また、図２８は、左側の領域に直交変換を実行して残った右側の全領域が、画素数が２のべき乗になる最大領域となる。そこで、最大領域を分割し、分割した右側の領域に対して直交変換を実行することを示している。また、図２８（ａ）と（ｂ）とは、異なる分割位置を示している。すなわち、制御部１０１は、最大領域に対する直交変換で残った領域から、高さ方向、又は幅方向の画素数が２のべき乗になる最大領域を更に分割する。また、制御部１０１は、分割した最大領域に対して直交変換部１１３に直交変換を実行させる。そして、制御部１０１は、最大領域を分割し、分割した領域に直交変換を実行させる処理を高さ方向、又は幅方向の画素数が２のべき乗ではない領域が無くなるまで繰り返し実行させる。

　また、図２９は、本開示の第４の実施形態の変形例（１）に係る直交変換で残った領域に対して、画素数が２のべき乗になる最大領域に直交変換を再帰的に実行した場合の例を示す図である。図２９は、図２８が左側から画素数が２のべき乗になる最大領域を分割しているのに対して、右側から領域の分割と、直交変換とを実行している。

［第４の実施形態の変形例（１）に係る画像復号装置１３の復号処理］
　画像復号装置１３は、直交変換が実行された各領域に対して、逆直交変換を実行する。

　＜コンピュータの構成例＞
　次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。

　図３０は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示すブロック図である。

　プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク３０５やROM３０３に予め記録しておくことができる。

　あるいはまた、プログラムは、ドライブ３０９によって駆動されるリムーバブル記録媒体３１１に格納（記録）しておくことができる。このようなリムーバブル記録媒体３１１は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブル記録媒体３１１としては、例えば、フレキシブルディスク、CD-ROM(Compact　Disc　Read　Only　Memory)，MO(Magneto　Optical)ディスク，DVD(Digital　Versatile　Disc)、磁気ディスク、半導体メモリ等がある。

　なお、プログラムは、上述したようなリムーバブル記録媒体３１１からコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵するハードディスク３０５にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local　Area　Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。

　コンピュータは、CPU(Central　Processing　Unit)　３０２を内蔵しており、CPU３０２には、バス３０１を介して、入出力インタフェース３１０が接続されている。

　CPU３０２は、入出力インタフェース３１０を介して、ユーザによって、入力部３０７が操作等されることにより指令が入力されると、それに従って、ROM(Read　Only　Memory)　３０３に格納されているプログラムを実行する。あるいは、CPU３０２は、ハードディスク３０５に格納されたプログラムを、RAM(Random　Access　Memory)　３０４にロードして実行する。

　これにより、CPU３０２は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU３０２は、その処理結果を、必要に応じて、例えば、入出力インタフェース３１０を介して、出力部３０６から出力、あるいは、通信部３０８から送信、さらには、ハードディスク３０５に記録等させる。

　なお、入力部３０７は、キーボードや、マウス、マイク等で構成される。また、出力部３０６は、LCD(Liquid　Crystal　Display)やスピーカ等で構成される。

　ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含む。

　また、プログラムは、１のコンピュータ（プロセッサ）により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

　さらに、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　また、例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、例えば、上述したプログラムは、任意の装置において実行することができる。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

　なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

　＜本技術の適用対象＞
　本技術は、任意の画像符号化・復号方式に適用することができる。つまり、上述した本技術と矛盾しない限り、変換（逆変換）、量子化（逆量子化）、符号化（復号）、予測等、画像符号化・復号に関する各種処理の仕様は任意であり、上述した例に限定されない。また、上述した本技術と矛盾しない限り、これらの処理の内の一部を省略してもよい。

　また本技術は、複数の視点（ビュー（view））の画像を含む多視点画像の符号化・復号を行う多視点画像符号化・復号システムに適用することができる。その場合、各視点（ビュー（view））の符号化・復号において、本技術を適用するようにすればよい。

　さらに本技術は、所定のパラメータについてスケーラビリティ（scalability）機能を有するように複数レイヤ化（階層化）された階層画像の符号化・復号を行う階層画像符号化（スケーラブル符号化）・復号システムに適用することができる。その場合、各階層（レイヤ）の符号化・復号において、本技術を適用するようにすればよい。

　実施形態に係る画像符号化装置や画像復号装置は、例えば、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、およびセルラー通信による端末への配信などにおける送信機や受信機（例えばテレビジョン受像機や携帯電話機）、または、光ディスク、磁気ディスクおよびフラッシュメモリなどの媒体に画像を記録したり、これら記憶媒体から画像を再生したりする装置（例えばハードディスクレコーダやカメラ）などの、様々な電子機器に応用され得る。

　また、本技術は、任意の装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large　Scale　Integration）等としてのプロセッサ（例えばビデオプロセッサ）、複数のプロセッサ等を用いるモジュール（例えばビデオモジュール）、複数のモジュール等を用いるユニット（例えばビデオユニット）、ユニットにさらにその他の機能を付加したセット（例えばビデオセット）等（すなわち、装置の一部の構成）として実施することもできる。

　さらに、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、コンピュータ、AV（Audio　Visual）機器、携帯型情報処理端末、IoT（Internet　of　Things）デバイス等の任意の端末に対して、画像（動画像）に関するサービスを提供するクラウドサービスに適用することもできる。

　なお、本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。

　例えば、本技術は、観賞用コンテンツ等の提供の用に供されるシステムやデバイスに適用することができる。また、例えば、本技術は、交通状況の監理や自動運転制御等、交通の用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、機械等の自動制御の用に供されるシステムやデバイスに適用することができる。さらに、例えば、本技術は、農業や畜産業の用に供されるシステムやデバイスにも適用することができる。また、本技術は、例えば火山、森林、海洋等の自然の状態や野生生物等を監視するシステムやデバイスにも適用することができる。さらに、例えば、本技術は、スポーツの用に供されるシステムやデバイスにも適用することができる。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　画像を分割して得られるブロックに対して直交変換を実行する直交変換部と、
　前記ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて前記直交変換部を制御する制御部と、
　を有する画像処理装置。
（２）
　前記制御部は、前記ブロックの画素数が２のべき乗はない場合に、前記直交変換を実行させないように前記直交変換部を制御する、
　（１）に記載の画像処理装置。
（３）
　量子化を実行する量子化部を更に有し、
　前記制御部は、前記ブロックの画素数が２のべき乗ではない場合に、前記直交変換を前記直交変換部に実行させずに、前記量子化を実行させるように前記量子化部を制御する、
　（１）又は（２）に記載の画像処理装置。
（４）
　前記制御部は、前記ブロックの画素数が２のべき乗であるか否かに応じて、処理対象の画像とは異なる画像に基づいて予測画像を生成するインター予測にするか、処理対象の画像に基づいて予測画像を生成するイントラ予測にするかを制御する、
　（１）乃至（３）の何れか一項に記載の画像処理装置。
（５）
　前記制御部は、前記ブロックの画素数が２のべき乗ではない場合に、前記インター予測を実行させるように制御する、
　（４）に記載の画像処理装置。
（６）
　前記インター予測と、前記イントラ予測との何れを実行させるのかが示された予測モード情報を出力する出力部を更に有し、
　前記制御部は、前記ブロックの画素数が２のべき乗ではない場合に、前記予測モード情報を出力させないように前記出力部を制御する、
　（４）に記載の画像処理装置。
（７）
　前記制御部は、前記予測モード情報が提供されない場合に、前記インター予測を実行させるように制御する、
　（６）に記載の画像処理装置。
（８）
　前記制御部は、高さ方向、又は幅方向の画素数が２のべき乗ではない前記ブロックのサイズが閾値よりも小さい場合に、前記直交変換を実行させるように前記直交変換部を制御する、
　（１）乃至（７）の何れか一項に記載の画像処理装置。
（９）
　前記制御部は、高さ方向、又は幅方向の画素数が２のべき乗ではない前記ブロックを、高さ方向、及び幅方向の画素数が２のべき乗になるブロックを形成するように分割し、
　前記直交変換部は、前記制御部が分割した前記ブロックに対して直交変換を実行する、
　（１）乃至（８）の何れか一項に記載の画像処理装置。
（１０）
　前記制御部は、前記ブロックの高さ方向又は幅方向の何れか一方の画素数が２のべき乗ではない場合に、画素数が２のべき乗である方向に対して、前記直交変換を実行させるように前記直交変換部を制御する、
　（１）乃至（９）の何れか一項に記載の画像処理装置。
（１１）
　前記制御部は、高さ方向、及び幅方向の画素数が２のべき乗ではない前記ブロックの内部における、高さ方向、及び幅方向の画素数が２のべき乗となる最大領域に対して、前記直交変換を実行させるように前記直交変換部を制御する、
　（１）に記載の画像処理装置。
（１２）
　前記制御部は、複数の前記最大領域のうち、直交変換が実行された際にコストが低い位置の当該最大領域に対して、直交変換を実行させるように前記直交変換部を制御する、
　（１１）に記載の画像処理装置。
（１３）
　前記制御部は、前記直交変換が実行された前記最大領域の位置を示す位置情報を出力させるように制御する、
　（１１）又は（１２）に記載の画像処理装置。
（１４）
　前記制御部は、前記ブロックにおける前記最大領域を除いた残りの領域には、前記直交変換を実行させないように前記直交変換部を制御する、
　（１１）乃至（１３）の何れか一項に記載の画像処理装置。
（１５）
　前記制御部は、高さ方向、又は幅方向の画素数が２のべき乗ではない前記ブロックから前記最大領域を分割し、前記直交変換部に当該最大領域に直交変換を実行させる処理を、高さ方向、又は幅方向の画素数が２のべき乗ではない前記ブロックが無くなるまで繰り返し実行させるように制御する、
　（１１）乃至（１４）の何れか一項に記載の画像処理装置。
（１６）
　画像を分割して得られるブロックに対して直交変換を実行し、
　前記ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて前記直交変換を制御する、
　画像処理方法。
（１７）
　画像処理装置が有するコンピュータを、
　画像を分割して得られるブロックに対して直交変換を実行する直交変換部、
　前記ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて前記直交変換部を制御する制御部、
　として機能させるための画像処理プログラム。

　　１１　画像処理システム
　　１２　画像符号化装置
　　１３　画像復号装置
　　２１　画像処理チップ
　　２２　外部メモリ
　　２３　符号化回路
　　２４　キャッシュメモリ
　　３１　画像処理チップ
　　３２　外部メモリ
　　３３　復号回路
　　３４　キャッシュメモリ
　１０１　制御部
　１２２　予測部
　１１３　直交変換部
　１１５　符号化部
　１１８　逆直交変換部
　１２０　インループフィルタ部
　２１２　復号部
　２１４　逆直交変換部
　２１６　インループフィルタ部
　２１９　予測部

Claims

　画像を分割して得られるブロックに対して直交変換を実行する直交変換部と、
　前記ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて前記直交変換部を制御する制御部と、
　を有する画像処理装置。
　前記制御部は、前記ブロックの画素数が２のべき乗はない場合に、前記直交変換を実行させないように前記直交変換部を制御する、
　請求項１に記載の画像処理装置。
　量子化を実行する量子化部を更に有し、
　前記制御部は、前記ブロックの画素数が２のべき乗ではない場合に、前記直交変換を前記直交変換部に実行させずに、前記量子化を実行させるように前記量子化部を制御する、
　請求項１に記載の画像処理装置。
　前記制御部は、前記ブロックの画素数が２のべき乗であるか否かに応じて、処理対象の画像とは異なる画像に基づいて予測画像を生成するインター予測にするか、処理対象の画像に基づいて予測画像を生成するイントラ予測にするかを制御する、
　請求項１に記載の画像処理装置。
　前記制御部は、前記ブロックの画素数が２のべき乗ではない場合に、前記インター予測を実行させるように制御する、
　請求項４に記載の画像処理装置。
　前記インター予測と、前記イントラ予測との何れを実行させるのかが示された予測モード情報を出力する出力部を更に有し、
　前記制御部は、前記ブロックの画素数が２のべき乗ではない場合に、前記予測モード情報を出力させないように前記出力部を制御する、
　請求項４に記載の画像処理装置。
　前記制御部は、前記予測モード情報が提供されない場合に、前記インター予測を実行させるように制御する、
　請求項６に記載の画像処理装置。
　前記制御部は、高さ方向、又は幅方向の画素数が２のべき乗ではない前記ブロックのサイズが閾値よりも小さい場合に、前記直交変換を実行させるように前記直交変換部を制御する、
　請求項１に記載の画像処理装置。
　前記制御部は、高さ方向、又は幅方向の画素数が２のべき乗ではない前記ブロックを、高さ方向、及び幅方向の画素数が２のべき乗になるブロックを形成するように分割し、
　前記直交変換部は、前記制御部が分割した前記ブロックに対して直交変換を実行する、
　請求項１に記載の画像処理装置。
　前記制御部は、前記ブロックの高さ方向又は幅方向の何れか一方の画素数が２のべき乗ではない場合に、画素数が２のべき乗である方向に対して、前記直交変換を実行させるように前記直交変換部を制御する、
　請求項１に記載の画像処理装置。
　前記制御部は、高さ方向、及び幅方向の画素数が２のべき乗ではない前記ブロックの内部における、高さ方向、及び幅方向の画素数が２のべき乗となる最大領域に対して、前記直交変換を実行させるように前記直交変換部を制御する、
　請求項１に記載の画像処理装置。
　前記制御部は、複数の前記最大領域のうち、直交変換が実行された際にコストが低い位置の当該最大領域に対して、直交変換を実行させるように前記直交変換部を制御する、
　請求項１１に記載の画像処理装置。
　前記制御部は、前記直交変換が実行された前記最大領域の位置を示す位置情報を出力させるように制御する、
　請求項１１に記載の画像処理装置。
　前記制御部は、前記ブロックにおける前記最大領域を除いた残りの領域には、前記直交変換を実行させないように前記直交変換部を制御する、
　請求項１１に記載の画像処理装置。
　前記制御部は、高さ方向、又は幅方向の画素数が２のべき乗ではない前記ブロックから前記最大領域を分割し、前記直交変換部に当該最大領域に直交変換を実行させる処理を、高さ方向、又は幅方向の画素数が２のべき乗ではない前記ブロックが無くなるまで繰り返し実行させるように制御する、
　請求項１１に記載の画像処理装置。
　画像を分割して得られるブロックに対して直交変換を実行し、
　前記ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて前記直交変換を制御する、
　画像処理方法。
　画像処理装置が有するコンピュータを、
　画像を分割して得られるブロックに対して直交変換を実行する直交変換部、
　前記ブロックの高さ方向、又は幅方向の画素数が２のべき乗であるか否かに応じて前記直交変換部を制御する制御部、
　として機能させるための画像処理プログラム。