JP2022028089A

JP2022028089A - 画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法

Info

Publication number: JP2022028089A
Application number: JP2018235107A
Authority: JP
Inventors: 健治近藤; Kenji Kondo
Original assignee: Sony Group Corp
Current assignee: Sony Group Corp
Priority date: 2018-12-17
Filing date: 2018-12-17
Publication date: 2022-02-15
Also published as: US20220021899A1; WO2020129636A1

Abstract

【課題】サブブロックを使用するインター予測処理の処理量を削減しつつ、画質の低下を抑制する。【解決手段】アフィン変換における動き補償で用いられる動きベクトルに基づいて、画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別するサブブロックサイズ識別情報が設定され、その設定に応じた大きさまたは形状のサブブロックに対してアフィン変換を適用するインター予測処理を行って画像を符号化し、サブブロックサイズ識別情報を含むビットストリームが生成される。本技術は、例えば、画像を符号化する符号化装置や画像を復号する復号装置に適用できる。【選択図】図１

Description

本開示は、画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法に関し、特に、サブブロックを使用するインター予測処理の処理量を削減しつつ、画質の低下を抑制することができるようにした画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法に関する。

ITU-T(International Telecommunication Union Telecommunication Standardization Sector)では、次世代ビデオ符号化の開発を進めているJVET（Joint Video Exploration Team）において、非特許文献１に開示されているように、多彩なビデオコーディングを提案している。

例えば、JVETでは、サブブロックの頂点の動きベクトルに基づいて参照画像をアフィン変換することにより動き補償を行うインター予測処理（Affine motion compensation (MC) prediction）が提案されている。かかるインター予測処理によれば、画面間の並進移動（平行移動）だけでなく、回転や、スケーリング（拡大／縮小）、スキューと呼ばれる、より複雑な動きなどを予測することができ、予測の品質が改善されるのに伴って符号化効率が改善することが期待される。

Benjamin Bross, Jianle Chen, Shan Liu, "Versatile Video Coding (Draft 2)", Document: JVET-K1001-v7, Joint Video Experts Team (JVET)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 1111th Meeting: Ljubljana, SI, 10-18 July 2018

ところで、上述したようなサブブロックを使用するインター予測処理では、サブブロックのサイズが小さくなるのに伴って、より多くのサブブロックに対して処理を行うことになる結果、符号化または復号を実行する際の処理量が増大することになる。これに対し、インター予測処理の処理量の削減を図った場合には、画質が低下することが懸念される。

本開示は、このような状況に鑑みてなされたものであり、サブブロックを使用するインター予測処理の処理量を削減しつつ、画質の低下を抑制することができるようにするものである。

本開示の第１の側面の画像符号化装置は、アフィン変換における動き補償で用いられる動きベクトルに基づいて、画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する識別情報を設定する設定部と、前記設定部による設定に応じた大きさまたは形状の前記サブブロックに対して前記アフィン変換を適用する前記インター予測処理を行って前記画像を符号化し、前記識別情報を含むビットストリームを生成する符号化部とを備える。

本開示の第１の側面の画像符号化方法は、画像を符号化する画像符号化装置が、アフィン変換における動き補償で用いられる動きベクトルに基づいて、前記画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する識別情報を設定することと、その設定に応じた大きさまたは形状の前記サブブロックに対して前記アフィン変換を適用する前記インター予測処理を行って前記画像を符号化し、前記識別情報を含むビットストリームを生成することとを含む。

本開示の第１の側面においては、アフィン変換における動き補償で用いられる動きベクトルに基づいて、画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する識別情報が設定され、その設定に応じた大きさまたは形状のサブブロックに対してアフィン変換を適用するインター予測処理が行われて画像が符号化されて、識別情報を含むビットストリームが生成される。

本開示の第２の側面の画像符号化装置は、アフィン変換における動き補償で用いられる動きベクトルに基づいて設定される識別情報であって、画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する識別情報を含むビットストリームから、前記識別情報をパースするパース部と、前記パース部によりパースされた前記識別情報に従った大きさまたは形状の前記サブブロックに対してアフィン変換を適用する前記インター予測処理を行って、前記ビットストリームを復号して前記画像を生成する復号部とを備える。

本開示の第２の側面の画像復号方法は、画像を復号する画像復号装置が、アフィン変換における動き補償で用いられる動きベクトルに基づいて設定される識別情報であって、前記画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する前記識別情報を含むビットストリームから、前記識別情報をパースすることと、そのパースされた前記識別情報に従った大きさまたは形状の前記サブブロックに対してアフィン変換を適用する前記インター予測処理を行って、前記ビットストリームを復号して前記画像を生成することとを含む。

本開示の第２の側面においては、アフィン変換における動き補償で用いられる動きベクトルに基づいて設定される識別情報であって、画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する識別情報を含むビットストリームから、識別情報がパースされ、そのパースされた識別情報に従った大きさまたは形状のサブブロックに対してアフィン変換を適用するインター予測処理が行われて、ビットストリームが復号されて画像が生成される。

本技術を適用した画像処理システムの一実施の形態の構成例を示すブロック図である。符号化回路において行われる処理について説明する図である。復号回路において行われる処理について説明する図である。回転操作を伴うアフィン変換について説明する図である。補間フィルタ処理について説明する図である。４×４のサブブロックと８×４のサブブロックとで必要となる画素値の個数について説明する図である。サブブロックの形状が８×４であるタイプ１でアフィン変換が行われる様子を示す図である。サブブロックの形状が４×８であるタイプ２でアフィン変換が行われる様子を示す図である。Ｌ０予測にタイプ１の形状のサブブロックを用い、Ｌ１予測にタイプ２の形状のサブブロックを用いる例について説明する図である。Ｌ０予測にタイプ２の形状のサブブロックを用い、Ｌ１予測にタイプ１の形状のサブブロックを用いる例について説明する図である。Ｌ０予測とＬ１予測とで、タイプ１およびタイプ２の使い分けについて説明する図である。画像符号化装置の一実施の形態の構成例を示すブロック図である。画像復号装置の一実施の形態の構成例を示すブロック図である。画像符号化処理を説明するフローチャートである。サブブロックサイズ識別情報を設定する処理の第１の処理例を説明するフローチャートである。サブブロックサイズ識別情報を設定する処理の第２の処理例を説明するフローチャートである。サブブロックサイズ識別情報を設定する処理の第３の処理例を説明するフローチャートである。サブブロックサイズ識別情報を設定する処理の第４の処理例を説明するフローチャートである。画像復号処理を説明するフローチャートである。本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

＜技術内容・技術用語をサポートする文献等＞
本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献に記載されている内容も含まれる。

非特許文献１：Jianle Chen, Elena Alshina, Gary J. Sullivan, Jens-Rainer, JillBoyce, "Algorithm Description of Joint Exploration Test Model 4", JVET-G1001_v1, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 7th Meeting: Torino, IT, 13-21 July 2017
非特許文献２：TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU（International Telecommunication Union）, "High efficiency video coding", H.265, 12/2016
非特許文献３：TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU（International Telecommunication Union）, "Advanced video coding for generic audiovisual services", H.264, 04/2017

つまり、上述の非特許文献１乃至３に記載されている内容もサポート要件を判断する際の根拠となる。例えば、非特許文献１に記載されているQTBT（Quad Tree Plus Binary Tree） Block Structure、または、非特許文献２に記載されているQT（Quad-Tree Block Structure）が、実施の形態において直接的な記載がない場合でも、本技術の開示範囲内であり、特許請求の範囲のサポート要件を満たすものとする。また、例えば、パース（Parsing）、シンタックス（Syntax）、セマンティクス（Semantics）等の技術用語についても同様に、実施の形態において直接的な記載がない場合でも、本技術の開示範囲内であり、特許請求の範囲のサポート要件を満たすものとする。

＜用語＞
本願では、以下の用語を、以下のように定義する。

＜ブロック＞
画像（ピクチャ）の部分領域や処理単位として説明に用いる「ブロック」（処理部を示すブロックではない）は、特に言及しない限り、ピクチャ内の任意の部分領域を示し、その大きさ、形状、および特性等は限定されない。例えば、「ブロック」には、TB（Transform Block）、TU（Transform Unit）、PB（Prediction Block）、PU（Prediction Unit）、SCU（Smallest Coding Unit）、CU（Coding Unit）、LCU（Largest Coding Unit）、CTB（Coding TreeBlock）、CTU（Coding Tree Unit）、変換ブロック、サブブロック、マクロブロック、タイル、またはスライス等、任意の部分領域（処理単位）が含まれるものとする。

＜ブロックサイズの指定＞
また、このようなブロックのサイズを指定するに当たって、直接的にブロックサイズを指定するだけでなく、間接的にブロックサイズを指定するようにしてもよい。例えばサイズを識別する識別情報を用いてブロックサイズを指定するようにしてもよい。また、例えば、基準となるブロック（例えばLCUやSCU等）のサイズとの比または差分によってブロックサイズを指定するようにしてもよい。例えば、シンタックス要素等としてブロックサイズを指定する情報を伝送する場合に、その情報として、上述のような間接的にサイズを指定する情報を用いるようにしてもよい。このようにすることにより、その情報の情報量を低減させることができ、符号化効率を向上させることができる場合もある。また、このブロックサイズの指定には、ブロックサイズの範囲の指定（例えば、許容されるブロックサイズの範囲の指定等）も含む。

＜情報・処理の単位＞
各種情報が設定されるデータ単位や、各種処理が対象とするデータ単位は、それぞれ任意であり上述した例に限定されない。例えば、これらの情報や処理が、それぞれ、TU（Transform Unit）、TB(Transform Block)、PU（Prediction Unit）、PB(Prediction Block)、CU（Coding Unit）、LCU（Largest Coding Unit）、サブブロック、ブロック、タイル、スライス、ピクチャ、シーケンス、またはコンポーネント毎に設定されるようにしてもよいし、それらのデータ単位のデータを対象とするようにしてもよい。もちろん、このデータ単位は、情報や処理毎に設定され得るものであり、全ての情報や処理のデータ単位が統一されている必要はない。なお、これらの情報の格納場所は任意であり、上述したデータ単位のヘッダやパラメータセット等に格納されるようにしてもよい。また、複数個所に格納されるようにしてもよい。

＜制御情報＞
本技術に関する制御情報を符号化側から復号側に伝送するようにしてもよい。例えば、上述した本技術を適用することを許可（または禁止）するか否かを制御する制御情報（例えばenabled_flag）を伝送するようにしてもよい。また、例えば、上述した本技術を適用する対象（または適用しない対象）を示す制御情報を伝送するようにしてもよい。例えば、本技術を適用する（または、適用を許可若しくは禁止する）ブロックサイズ（上限若しくは下限、またはその両方）、フレーム、コンポーネント、またはレイヤ等を指定する制御情報を伝送するようにしてもよい。

＜フラグ＞
なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の２状態を識別する際に用いる情報だけでなく、３以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の２値であってもよいし、３値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報（フラグも含む）は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。

＜メタデータを関連付ける＞
また、符号化データ（ビットストリーム）に関する各種情報（メタデータ等）は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（または同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。また、本明細書において、符号化とは、画像をビットストリームに変換する全体の処理だけではなく、一部の処理も含む。例えば、予測処理、直交変換、量子化、算術符号化等を包括した処理を含むだけではなく、量子化と算術符号化とを総称した処理、予測処理と量子化と算術符号化とを包括した処理、などを含む。同様に、復号とは、ビットストリームを画像に変換する全体の処理だけではなく、一部の処理も含む。例えば、逆算術復号、逆量子化、逆直交変換、予測処理等を包括した処理を含むだけではなく、逆算術復号と逆量子化とを包括した処理、逆算術復号と逆量子化と予測処理とを包括した処理、などを含む。

以下、本技術を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。

＜本技術の概要＞
図１乃至図１１を参照して、本技術の概要について説明する。

図１は、本技術を適用した画像処理システムの一実施の形態の構成例を示すブロック図である。

図１に示すように、画像処理システム１１は、画像符号化装置１２および画像復号装置１３を備えて構成される。例えば、画像処理システム１１では、図示しない撮像装置により撮像された画像が画像符号化装置１２に入力され、画像符号化装置１２において画像が符号化されることで符号化データが生成される。これにより、画像処理システム１１では、画像符号化装置１２から画像復号装置１３へ、符号化データがビットストリームとして伝送される。そして、画像処理システム１１では、画像復号装置１３において符号化データが復号されることで画像が生成され、図示しない表示装置に表示される。

画像符号化装置１２は、画像処理チップ２１および外部メモリ２２がバスを介して接続された構成となっている。

画像処理チップ２１は、画像を符号化する符号化回路２３、および、符号化回路２３が画像を符号化する際に必要となるデータを一時的に記憶するキャッシュメモリ２４により構成される。

外部メモリ２２は、例えば、DRAM（Dynamic Random Access Memory）により構成され、画像符号化装置１２において符号化の対象となる画像のデータを、画像処理チップ２１で処理する処理単位（例えば、フレーム）ごとに記憶する。なお、非特許文献１に記載されているQTBT（Quad Tree Plus Binary Tree） Block Structure、または、非特許文献２に記載されているQT（Quad-Tree） Block Structureが、Block Structureとして適用される場合には、CTB（Coding TreeBlock）、CTU（Coding Tree Unit）、PB（Prediction Block）、PU（Prediction Unit）、CU（Coding Unit）、CB（Coding Block）を処理単位として外部メモリ２２に記憶される場合もある。好適には、シーケンスレベルでブロックサイズが固定された処理単位であるCTBやCTUを処理単位とすることが想定される。

例えば、画像符号化装置１２では、外部メモリ２２に記憶されている１フレーム分（またはCTB）の画像のデータのうちの、インター予測処理で用いられる処理単位であるサブブロックごとに分割されたデータがキャッシュメモリ２４に読み込まれる。そして、画像符号化装置１２では、キャッシュメモリ２４に記憶されているサブブロックごとに符号化回路２３による符号化が行われ、符号化データが生成される。

ここで、サブブロックの大きさ（画素の総個数）、および、サブブロックの形状（画素の縦個数×横個数）は、サブブロックサイズ識別情報により識別される。そして、画像処理システム１１では、符号化回路２３においてサブブロックサイズ識別情報が設定され、サブブロックサイズ識別情報を含むビットストリームが画像符号化装置１２から画像復号装置１３へ伝送される。

例えば、サブブロックを構成する画素が２×２である場合には、サブブロックサイズ識別情報には０が設定される。同様に、サブブロックを構成する画素が４×４である場合には、サブブロックサイズ識別情報には１が設定され、サブブロックの大きさが８×８である場合には、サブブロックサイズ識別情報には２が設定される。

さらに、サブブロックを構成する画素が８×４である場合（後述の図７のタイプ１）には、サブブロックサイズ識別情報には３が設定され、サブブロックの大きさが４×８である場合（後述の図８のタイプ２）には、サブブロックサイズ識別情報には４が設定される。その他、１６×１６以上の大きさおよび形状のサブブロックを用いてもよい。要するに、サブブロックサイズ識別情報は、サブブロックのサイズおよび形状を識別することができる情報であれば、その表現形態は問われない。なお、サブブロックサイズ識別情報が、サブブロックの大きさまたは形状の一方だけを識別するようにしてもよい。

画像復号装置１３は、画像処理チップ３１および外部メモリ３２がバスを介して接続された構成となっている。

画像処理チップ３１は、符号化データを復号して画像を生成する復号回路３３、および、復号回路３３が符号化データを復号する際に必要となるデータを一時的に記憶するキャッシュメモリ３４により構成される。

外部メモリ３２は、例えば、DRAMにより構成され、画像復号装置１３において復号の対象となる符号化データを画像のフレームごとに記憶する。

例えば、画像復号装置１３では、ビットストリームからサブブロックサイズ識別情報がパースされ、そのサブブロックサイズ識別情報で設定されている大きさおよび形状のサブブロックに従って、外部メモリ３２からキャッシュメモリ３４に符号化データが読み出される。そして、画像復号装置１３では、キャッシュメモリ３４に記憶されているブロックごとに復号回路３３により符号化データが復号されることにより画像が生成される。

このように、画像処理システム１１では、画像符号化装置１２において、サブブロックの大きさおよび形状を識別するためのサブブロックサイズ識別情報が設定され、サブブロックサイズ識別情報を含むビットストリームが画像復号装置１３へ伝送される。例えば、画像処理システム１１では、サブブロックサイズ識別情報（subblocksize_idx）を、SPS，PPS，SLICE headerなどのハイレベルシンタックスで定義することができる。また、予測との関係性と性能向上の観点からSLICE headerにサブブロックサイズ識別情報を定義することが好ましく、処理の簡略化や、画像復号装置１３でのパースの観点からSPSまたはPPSにサブブロックサイズ識別情報を定義することが好ましい。

そして、画像処理システム１１では、大きなサイズのサブブロックを用いることにより、例えば、処理単位（例えば、１フレームや、1CTBなど）当たりのサブブロック数を少なくすることができる結果、サブブロックごとに行われるインター予測処理の処理量を削減することができる。従って、例えば、処理量を抑制することが要求されるアプリケーションでは、大きなサブブロックを使用してインター予測処理を行うようにすることで、より確実に符号化または復号を行うことができる。

また、画像処理システム１１では、大きなサブブロックを使用することで処理量を削減した場合には、画質が低下することが懸念される。そこで、画像処理システム１１では、例えば、処理能力に応じて、８×８のサブブロックではなく、８×４または４×８のサブブロックを用いることによって、画質の低下を抑制することができる。

図２を参照して、画像符号化装置１２の符号化回路２３が行う処理について、さらに説明する。

例えば、符号化回路２３は、図示するような設定部および符号化部として機能するように設計される。

即ち、符号化回路２３は、画像の符号化する際のインター予測処理で用いられるサブブロックの大きさおよび形状（例えば、2×2，4×４，8×8，4×8，8×4など）を識別するためのサブブロックサイズ識別情報を設定する設定処理を行うことができる。

このとき、符号化回路２３は、例えば、画像符号化装置１２における画像の符号化を実行するアプリケーションにおいて要求される処理量が、所定の設定値以下である場合、サブブロックが大きくなるようにサブブロックサイズ識別情報を設定する。同様に、符号化回路２３は、例えば、画像復号装置１３におけるビットストリームの復号を実行するアプリケーションにおいて要求される処理量が、所定の設定値以下である場合、サブブロックが大きくなるようにサブブロックサイズ識別情報を設定する。ここで、画像符号化装置１２および画像復号装置１３には、それぞれが備える処理能力に従って、実行するアプリケーションにおける処理量を規定する設定値が予め設定されている。例えば、処理能力が低いモバイル端末において符号化処理または復号処理が行われる場合には、その処理能力に従った低い設定値が設定される。

さらに、符号化回路２３は、インター予測処理における予測方向に従って、サブブロックの大きさを設定することができる。例えば、符号化回路２３は、インター予測処理における予測方向がBi-predictionであるか否かに従って、サブブロックの大きさが異なるようにサブブロックサイズ識別情報を設定する。また、符号化回路２３は、インター予測処理における予測方向がBi-predictionである場合、サブブロックが大きくなるようにサブブロックサイズ識別情報を設定する。または、符号化回路２３は、インター予測処理としてアフィン変換を適用し、かつ、インター予測処理における予測方向がBi-predictionである場合、サブブロックが大きくなるようにサブブロックサイズ識別情報を設定する。

また、符号化回路２３は、インター予測処理としてアフィン変換が適用される場合、アフィン変換における動きベクトルに従って、サブブロックの形状を設定することができる。例えば、符号化回路２３は、アフィン変換における動きベクトルから後述する式（１）に従って求められるＸ方向ベクトル差分がＹ方向ベクトル差分より小さい場合、矩形形状のサブブロックの長手方向がＸ方向となるタイプ１（図７参照）の形状にサブブロックサイズ識別情報を設定する。一方、符号化回路２３は、アフィン変換における動きベクトルから後述する式（１）に従って求められるＹ方向ベクトル差分がＸ方向ベクトル差分より小さい場合、矩形形状のサブブロックの長手方向がＹ方向となるタイプ２（図８参照）の形状にサブブロックサイズ識別情報を設定する。

そして、符号化回路２３は、サブブロックの大きさまたは形状を切り替えてインター予測処理を行って画像を符号化し、サブブロックサイズ識別情報を含むビットストリームを生成する符号化処理を行うことができる。

このとき、符号化回路２３は、サブブロックに対して、アフィン変換またはFRUC（Frame Rate Up Conversion）を適用してインター予測処理を行う。その他、符号化回路２３は、並進移動などを適用してインター予測処理を行ってもよい。なお、符号化回路２３は、サブブロックサイズ識別情報を参照してサブブロックの大きさまたは形状を切り替えてもよいし、インター予測処理を行う際に、上述したような予測方向などに従った判断を行ってサブブロックの大きさまたは形状を切り替えるようにしてもよい。

図３を参照して、画像復号装置１３の復号回路３３が行う処理について、さらに説明する。

例えば、復号回路３３は、図示するようなパース部および復号部として機能するように設計される。

即ち、復号回路３３は、画像符号化装置１２から伝送されてくるビットストリームから、画像の復号する際のインター予測処理で用いられるサブブロックの大きさを表すサブブロックサイズ識別情報をパースするパース処理を行うことができる。

そして、復号回路３３は、サブブロックサイズ識別情報に従ってサブブロックの大きさまたは形状を切り替えてインター予測処理を行い、ビットストリームを復号して画像を生成する復号処理を行うことができる。このとき、復号回路３３は、符号化回路２３におけるインター予測処理で適用されたアフィン変換またはFRUCに応じて、インター予測処理を行う。

ここで、図４を参照して、異なる大きさのサブブロックで分割されたコーディングユニットにおける回転操作を伴うアフィン変換について説明する。

図４のＡには、4×4の16個のサブブロックに分割されたコーディングユニットで回転操作を伴うアフィン変換が行われる一例が示されている。また、図４のＢには、8×8の64個のサブブロックに分割されたコーディングユニットで回転操作を伴うアフィン変換が行われる一例が示されている。

例えば、アフィン変換の動き補償では、参照画像内の、頂点Aから動きベクトルv₀だけ離れた点A'を左上の頂点とし、頂点Bから動きベクトルv₁だけ離れた点B'を右上の頂点とし、頂点Cから動きベクトルv₂だけ離れた点C'を左下の頂点とするコーディングユニットCU'を参照ブロックとして、そのコーディングユニットCU'を、動きベクトルv₀ないしv₂に基づいてアフィン変換することにより動き補償が行われ、コーディングユニットCUの予測画像が生成される。

すなわち、処理対象のコーディングユニットCUが、サブブロックに分割され、各サブブロックの動きベクトルv=(v_x,v_y)が、動きベクトルv₀=(v_0x,v_0y)，v₁=(v_1x,v_1y)、及び、v₂=(v_2x,v_2y)に基づいて、図示する式に従って求められる。

そして、参照画像内の、各サブブロックから動きベクトルvだけ離れたサブブロックと同一のサイズの参照サブブロックを、動きベクトルvに基づいて並進移動することにより、コーディングユニットCUの予測画像がサブブロック単位で生成される。

ここで、このような回転操作が伴うアフィン変換が行われる場合、図４のＡに示すように大きなサイズのサブブロックに分割するよりも、図４のＢに示すように、小さなサイズのサブブロックに分割する方が、より予測精度の高い予測画像を得ることができる。しかしながら、小さなサイズのサブブロックに分割すると、サブブロックの数が増加するのに伴って、より多くの演算を行う必要があり処理量が増加するだけでなく、メモリからデータを読み出すのに時間を要することになり処理の高速化が妨げられてしまう。

従って、特に、このようなアフィン変換において、サブブロックを大きく設定することで、より効果的に処理量を削減することができるとともに、処理の高速化を図ることができる。なお、ここでは、CUとPUとを同じ次元でブロックと処理していることを説明しているが、QTのようにCUとPUが別次元でブロックを構成できる場合はPUを基準として、サブブロックに分割されてもよい。

ここで、図５を参照して、補間フィルタ処理について説明する。なお、ここでは、画像復号装置１３による復号処理について説明するが、画像符号化装置１２による符号化処理においても同様に補間フィルタ処理が行われる。

例えば、画像復号装置１３が画像を復号する際に、アフィン変換における動き補償を行うとき、例えば、外部メモリ３２に格納されている符号化済みデコードフレーム（または、Decoded picture bufferと称される）のうちの、動き補償で必要な符号化データが、画像処理チップ３１の内部のキャッシュメモリ３４に読み込まれる。そして、復号回路３３において、図５に示すような構成による補間フィルタ処理が施される。

図５のＡには、予測方向がUni- predictionであるときに補間フィルタ処理を行うフィルタ処理部が示されており、図５のＢには、予測方向がBi-predictionであるときに補間フィルタ処理を行うフィルタ処理部が示されている。

例えば、図５のＡに示すように、Uni- predictionでは、キャッシュメモリ３４から読み出されたサブブロック分の符号化データ（画素値）に対して、水平方向補間フィルタ３５において水平方向の補間フィルタ処理が施される。そして、垂直方向に符号化データを取り出すために転置用メモリ３６に記憶された後、転置用メモリ３６から読み出された符号化データに対して、垂直方向補間フィルタ３７において垂直方向の補間フィルタ処理が施され、後段の処理部へ出力される。

また、図５のＢに示すように、Bi-predictionでは、水平方向補間フィルタ３５－１、転置用メモリ３６－１、および垂直方向補間フィルタ３７－１によるＬ０参照の補間フィルタ処理と、水平方向補間フィルタ３５－２、転置用メモリ３６－２、および垂直方向補間フィルタ３７－２によるＬ１参照の補間フィルタ処理とが、並列的に行われる。そして、垂直方向補間フィルタ３７－１からの出力と、垂直方向補間フィルタ３７－２からの出力とが、平均化部３８において平均化された後、後段の処理部へ出力される。

このようなサブブロックに対する補間フィルタ処理を行う際に、キャッシュメモリ３４から水平方向補間フィルタ３５への符号化データの読み出し、および、転置用メモリ３６から垂直方向補間フィルタ３７への符号化データの読み出しにおいて、それぞれメモリの帯域による制限を受けることになる。これにより、高速化が妨げられることになる。特に、インター予測処理における予測方向がBi-predictionである場合には、２倍のメモリの帯域が必要となり、メモリの帯域による制限を、より受け易くなる。

そこで、復号回路３３は、補間フィルタ処理を行う際に、メモリの帯域による制限を回避し、復号処理における処理量を削減することが求められる。

そこで、例えば、従来では４×４のサブブロックで補間フィルタ処理を行っていたのに対し、それよりも大きな８×４または４×８のサブブロックで補間フィルタ処理を行うことで、処理量の削減を図ることができるとともに、補間フィルタ処理に必要な画素値の個数を削減することができる。

例えば、図６のＡに示すように、２×２のサブブロックで４個の画素値を求める補間フィルタ処理を行う場合には、１３×１３個の画素値が必要となる。また、図６のＢに示すように、４×２のサブブロックで８個の画素値を求める補間フィルタ処理を行う場合には、１３×１５個の画素値が必要になる。このため、８個の画素値を求めるのに、２×２のサブブロックを用いた補間フィルタ処理を２回行うときには、１３×１３個の２倍の画素値が必要となってしまい、４×２のサブブロックを用いた補間フィルタ処理を行う方が、必要な画素値の個数が削減されることになる。従って、同様に、８×４のサブブロックを用いることで、４×４のサブブロックを用いるときよりも、同一の個数の画素値を求める補間フィルタ処理に必要な画素値の個数を削減することができる。

このように、例えば、４×４よりも大きな８×４または４×８に分割されたサブブロックを用いることで、１画素を生成するために必要となるメモリアクセス量および補間フィルタの処理量を削減することができる。その一方で、サブブロックの粒度が大きくなったことで、アフィン変換の動き補償における誤差が大きくなるのに伴って、予測の性能が低下することが想定される。そこで、なるべく小さい粒度を保つために矩形形状としている。

ここで、図７および図８を参照して、矩形形状のサブブロックのタイプについて説明する。

図７には、サブブロックの形状が８×４であるタイプ１において、回転操作が伴うアフィン変換が行われる様子が示されている。同様に、図８には、サブブロックの形状が４×８であるタイプ２において、回転操作が伴うアフィン変換が行われる様子が示されている。即ち、図７に示すように、長手方向をＸ方向とした矩形形状のサブブロックをタイプ１と称し、図８に示すように、長手方向をＹ方向とした矩形形状のサブブロックをタイプ２と称する。

そして、符号化回路２３は、予測誤差が少なくなるように、サブブロックの形状をタイプ１とタイプ２とで切り替えて使用する。例えば、コーディングユニットの３つの頂点について、左上頂点の動きベクトルのＸ方向成分と右上頂点の動きベクトルのＸ方向成分との差分に基づいたＸ方向ベクトル差分が、左上頂点の動きベクトルのＹ方向成分と左下頂点の動きベクトルのＹ方向成分との差分に基づいたＹ方向ベクトル差分よりも小さいときは、Ｘ方向に並ぶサブブロックの各動きベクトルの差が小さいことより、８×４のタイプ１を使用する。一方、コーディングユニットの３つの頂点について、左上頂点の動きベクトルのＸ方向成分と右上頂点の動きベクトルのＸ方向成分との差分に基づいたＸ方向ベクトル差分が、左上頂点の動きベクトルのＹ方向成分と左下頂点の動きベクトルのＹ方向成分との差分に基づいたＹ方向ベクトル差分以下であるときは、Ｙ方向に並ぶサブブロックの各動きベクトルの差が小さいことより、４×８のタイプ２を使用する。即ち、サブブロック間の動きベクトルの差が小さいということは、同じ動きベクトルになるように制限した際の影響が小さくなるという特性があり、この特性を利用することで、画質の劣化を抑制することができる。

具体的には、図７および図８に示したように、コーディングユニットの左上頂点の動きベクトルｖ_１（ｖ_１ｘ，ｖ_１ｙ）、コーディングユニットの右上頂点の動きベクトルｖ_２（ｖ_２ｘ，ｖ_２ｙ）、および、コーディングユニットの左下頂点の動きベクトルｖ_３（ｖ_３ｘ，ｖ_３ｙ）を用いて、次の式（１）を演算する。そして、この演算により求められるＸ方向ベクトル差分ｄｖ_ｘおよびＹ方向ベクトル差分ｄｖ_ｙの絶対値の大小関係に従って、タイプ１とタイプ２とが切り替えられる。

即ち、Ｘ方向ベクトル差分ｄｖ_ｘの絶対値がＹ方向ベクトル差分ｄｖ_ｙの絶対値より小さい場合、タイプ１の形状のサブブロックを用い、Ｘ方向ベクトル差分ｄｖ_ｘの絶対値がＹ方向ベクトル差分ｄｖ_ｙの絶対値以上である場合、タイプ２の形状のサブブロックを用いる。

これにより、インター予測処理の処理量を削減しても予測性能の低下を低減することができ、画質の劣化を抑制することができる。

さらに、予測方向がBi-predictionであるときには、処理量が増加することになる。従って、処理量の少ないUni- predictionの場合には、４×４のサブブロックを使用し、処理量の多いBi-predictionの場合には、８×４または４×８のサブブロックを使用するようにしてもよい。

そして、予測方向がBi-predictionであるときに、図９に示すように、Ｌ０予測にタイプ１の形状のサブブロックを用い、Ｌ１予測にタイプ２の形状のサブブロックを用いる。または、予測方向がBi-predictionであるときに、図１０に示すように、Ｌ０予測にタイプ２の形状のサブブロックを用い、Ｌ１予測にタイプ１の形状のサブブロックを用いる。

このように、タイプ１（横方向）とタイプ２（縦方向）のサブブロックの境界のアライメントが、Ｌ１予測とＬ０予測とで異なるようにするため、平均化部３８（図５のＢ）で平均化する際に、予測誤差の低減を図ることが期待される。即ち、Ｌ１予測とＬ０予測とでサブブロックの境界が重なることを回避することで、例えば、その境界でのノイズが増幅することを回避することができる結果、画質の低下を抑制することができる。

さらには、予測方向がBi-predictionであるときに、Ｌ０予測およびＬ１予測それぞれで、上述したようにＸ方向ベクトル差分ｄｖ_ｘとＹ方向ベクトル差分ｄｖ_ｙとの絶対値の大小関係に従って、タイプ１およびタイプ２の切り替えを行ってもよい。しかしながら、この場合、Ｌ０予測およびＬ１予測で同じタイプのサブブロックが用いられると、サブブロックの境界でノイズが目立つことが想定される。

そこで、Ｌ０予測およびＬ１予測で異なるタイプのサブブロックが用いられるようにすることで、サブブロックの境界におけるノイズが目立たないようにし、画質の低下を抑制することができる。

例えば、図１１に示すようなＬ０予測の左上頂点の動きベクトルｖ_１Ｌ０、Ｌ０予測の右上頂点の動きベクトルｖ_２Ｌ０、およびＬ０予測の左下頂点の動きベクトルｖ_３Ｌ０を用いて、次の式（２）を演算することにより、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ｘＬ０およびＬ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０を求める。同様に、図１１に示すようなＬ１予測の左上頂点の動きベクトルｖ_１Ｌ１、Ｌ０予測の右上頂点の動きベクトルｖ_２Ｌ１、およびＬ０予測の左下頂点の動きベクトルｖ_３Ｌ１を用いて、次の式（２）を演算することにより、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ｘＬ１およびＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１を求める。

そして、このように求められるＬ０予測のＸ方向ベクトル差分ｄｖ_ｘＬ０、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ｘＬ１、およびＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１の大小関係に従って、タイプ１とタイプ２とを切り替える。

例えば、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ｘＬ０またはＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１が最も大きい場合、Ｌ０予測で用いるサブブロックをタイプ２とし、かつ、Ｌ１予測で用いるサブブロックをタイプ１とする。また、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０またはＬ１予測のＸ方向ベクトル差分ｄｖ_ｘＬ１が最も大きい場合、Ｌ０予測で用いるサブブロックをタイプ１とし、かつ、Ｌ１予測で用いるサブブロックをタイプ２とする。

これにより、より画質の低下を抑制することができる。

＜画像符号化装置の構成例＞
図１２は、本技術を適用した画像符号化装置の一実施の形態の構成例を示すブロック図である。

図１２に示される画像符号化装置１２は、動画像の画像データを符号化する装置である。例えば、画像符号化装置１２は、非特許文献１、非特許文献２、または非特許文献３に記載されている技術を実装し、それらの文献のいずれかに記載された規格に準拠した方法で動画像の画像データを符号化する。

なお、図１２においては、処理部やデータの流れ等の主なものを示しており、図１２に示されるものが全てとは限らない。つまり、画像符号化装置１２において、図１２においてブロックとして示されていない処理部が存在したり、図１２において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

図１２に示されるように画像符号化装置１２は、制御部１０１、並べ替えバッファ１１１、演算部１１２、直交変換部１１３、量子化部１１４、符号化部１１５、蓄積バッファ１１６、逆量子化部１１７、逆直交変換部１１８、演算部１１９、インループフィルタ部１２０、フレームメモリ１２１、予測部１２２、およびレート制御部１２３を備えて構成される。なお、予測部１２２は、不図示のイントラ予測部およびインター予測部を備えている。画像符号化装置１２は、動画像データを符号化することによって、符号化データ（ビットストリーム）を生成するための装置である。

＜制御部＞
制御部１０１は、外部、または予め指定された処理単位のブロックサイズに基づいて、並べ替えバッファ１１１により保持されている動画像データを処理単位のブロック（CU, PU, 変換ブロックなど）へ分割する。また、制御部１０１は、各ブロックへ供給する符号化パラメータ（ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなど）を、例えば、RDO(Rate-Distortion Optimization)に基づいて、決定する。

これらの符号化パラメータの詳細については後述する。制御部１０１は、以上のような符号化パラメータを決定すると、それを各ブロックへ供給する。具体的には、以下の通りである。

ヘッダ情報Hinfoは、各ブロックに供給される。
予測モード情報Pinfoは、符号化部１１５と予測部１２２とに供給される。
変換情報Tinfoは、符号化部１１５、直交変換部１１３、量子化部１１４、逆量子化部１１７、および逆直交変換部１１８に供給される。
フィルタ情報Finfoは、インループフィルタ部１２０に供給される。

さらに、制御部１０１は、処理単位を設定する際に、図２を参照して上述したように、サブブロックの大きさおよび形状を識別するサブブロックサイズ識別情報を設定することができる。そして、制御部１０１は、サブブロックサイズ識別情報も符号化部１１５に供給する。

＜並べ替えバッファ＞
画像符号化装置１２には、動画像データの各フィールド（入力画像）がその再生順（表示順）に入力される。並べ替えバッファ１１１は、各入力画像をその再生順（表示順）に取得し、保持（記憶）する。並べ替えバッファ１１１は、制御部１０１の制御に基づいて、その入力画像を符号化順（復号順）に並べ替えたり、処理単位のブロックに分割したりする。並べ替えバッファ１１１は、処理後の各入力画像を演算部１１２に供給する。また、並べ替えバッファ１１１は、その各入力画像（元画像）を、予測部１２２やインループフィルタ部１２０にも供給する。

＜演算部＞
演算部１１２は、処理単位のブロックに対応する画像I、および予測部１２２より供給される予測画像Pを入力とし、画像Iから予測画像Pを減算して、予測残差Dを導出（D＝Ｉ－Ｐ）し、それを直交変換部１１３に供給する。

＜直交変換部＞
直交変換部１１３は、演算部１１２から供給される予測残差Dと、制御部１０１から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、予測残差Dに対して直交変換を行い、変換係数Coeffを導出する。直交変換部１１３は、その得られた変換係数Coeffを量子化部１１４に供給する。

＜量子化部＞
量子化部１１４は、直交変換部１１３から供給される変換係数Coeffと、制御部１０１から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、変換係数Coeffをスケーリング（量子化）する。なお、この量子化のレートは、レート制御部１２３により制御される。量子化部１１４は、このような量子化により得られた量子化後の変換係数、すなわち量子化変換係数レベルlevelを、符号化部１１５および逆量子化部１１７に供給する。

＜符号化部＞
符号化部１１５は、量子化部１１４から供給された量子化変換係数レベルlevelと、制御部１０１から供給される各種符号化パラメータ（ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなど）と、インループフィルタ部１２０から供給されるフィルタ係数等のフィルタに関する情報と、予測部１２２から供給される最適な予測モードに関する情報とを入力とする。符号化部１１５は、量子化変換係数レベルlevelを可変長符号化（例えば、算術符号化）し、ビット列（符号化データ）を生成する。

また、符号化部１１５は、その量子化変換係数レベルlevelから残差情報Rinfoを導出し、残差情報Rinfoを符号化し、ビット列を生成する。

さらに、符号化部１１５は、インループフィルタ部１２０から供給されるフィルタに関する情報をフィルタ情報Finfoに含め、予測部１２２から供給される最適な予測モードに関する情報を予測モード情報Pinfoに含める。そして、符号化部１１５は、上述した各種符号化パラメータ（ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなど）を符号化し、ビット列を生成する。

また、符号化部１１５は、以上のように生成された各種情報のビット列を多重化し、符号化データを生成する。符号化部１１５は、その符号化データを蓄積バッファ１１６に供給する。

それらに加え、符号化部１１５は、制御部１０１から供給されるサブブロックサイズ識別情報を符号化し、ビット列を生成して、そのビット列を多重化し、符号化データを生成することができる。これにより、図１を参照して上述したように、サブブロックサイズ識別情報を含む符号化データ（ビットストリーム）が伝送される。

＜蓄積バッファ＞
蓄積バッファ１１６は、符号化部１１５において得られた符号化データを、一時的に保持する。蓄積バッファ１１６は、所定のタイミングにおいて、保持している符号化データを、例えばビットストリーム等として画像符号化装置１２の外部に出力する。例えば、この符号化データは、任意の記録媒体、任意の伝送媒体、任意の情報処理装置等を介して復号側に伝送される。すなわち、蓄積バッファ１１６は、符号化データ（ビットストリーム）を伝送する伝送部でもある。

＜逆量子化部＞
逆量子化部１１７は、逆量子化に関する処理を行う。例えば、逆量子化部１１７は、量子化部１１４から供給される量子化変換係数レベルlevelと、制御部１０１から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、量子化変換係数レベルlevelの値をスケーリング（逆量子化）する。なお、この逆量子化は、量子化部１１４において行われる量子化の逆処理である。逆量子化部１１７は、このような逆量子化により得られた変換係数Coeff_IQを、逆直交変換部１１８に供給する。

＜逆直交変換部＞
逆直交変換部１１８は、逆直交変換に関する処理を行う。例えば、逆直交変換部１１８は、逆量子化部１１７から供給される変換係数Coeff_IQと、制御部１０１から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、変換係数Coeff_IQに対して逆直交変換を行い、予測残差D'を導出する。なお、この逆直交変換は、直交変換部１１３において行われる直交変換の逆処理である。逆直交変換部１１８は、このような逆直交変換により得られた予測残差D'を演算部１１９に供給する。なお、逆直交変換部１１８は、復号側の逆直交変換部（後述する）と同様であるので、逆直交変換部１１８については、復号側について行う説明（後述する）を適用することができる。

＜演算部＞
演算部１１９は、逆直交変換部１１８から供給される予測残差D’と、予測部１２２から供給される予測画像Pとを入力とする。演算部１１９は、その予測残差D’と、その予測残差D’に対応する予測画像Pとを加算し、局所復号画像R_localを導出（R_local＝D’＋P）する。演算部１１９は、導出した局所復号画像R_localをインループフィルタ部１２０およびフレームメモリ１２１に供給する。

＜インループフィルタ部＞
インループフィルタ部１２０は、インループフィルタ処理に関する処理を行う。例えば、インループフィルタ部１２０は、演算部１１９から供給される局所復号画像R_localと、制御部１０１から供給されるフィルタ情報Finfoと、並べ替えバッファ１１１から供給される入力画像（元画像）とを入力とする。なお、インループフィルタ部１２０に入力される情報は任意であり、これらの情報以外の情報が入力されてもよい。例えば、必要に応じて、予測モード、動き情報、符号量目標値、量子化パラメータQP、ピクチャタイプ、ブロック（CU、CTU等）の情報等がインループフィルタ部１２０に入力されるようにしてもよい。

インループフィルタ部１２０は、そのフィルタ情報Finfoに基づいて、局所復号画像R_localに対して適宜フィルタ処理を行う。インループフィルタ部１２０は、必要に応じて入力画像（元画像）や、その他の入力情報もそのフィルタ処理に用いる。

例えば、インループフィルタ部１２０は、非特許文献１に記載のように、バイラテラルフィルタ、デブロッキングフィルタ（DBF（DeBlocking Filter））、適応オフセットフィルタ（SAO（Sample Adaptive Offset））、および適応ループフィルタ（ALF(Adaptive Loop Filter)）の４つのインループフィルタをこの順に適用する。なお、どのフィルタを適用するか、どの順で適用するかは任意であり、適宜選択可能である。

もちろん、インループフィルタ部１２０が行うフィルタ処理は任意であり、上述の例に限定されない。例えば、インループフィルタ部１２０がウィーナーフィルタ等を適用するようにしてもよい。

インループフィルタ部１２０は、フィルタ処理された局所復号画像R_localをフレームメモリ１２１に供給する。なお、例えばフィルタ係数等のフィルタに関する情報を復号側に伝送する場合、インループフィルタ部１２０は、そのフィルタに関する情報を符号化部１１５に供給する。

＜フレームメモリ＞
フレームメモリ１２１は、画像に関するデータの記憶に関する処理を行う。例えば、フレームメモリ１２１は、演算部１１９から供給される局所復号画像R_localや、インループフィルタ部１２０から供給されるフィルタ処理された局所復号画像R_localを入力とし、それを保持（記憶）する。また、フレームメモリ１２１は、その局所復号画像R_localを用いてピクチャ単位毎の復号画像Rを再構築し、保持する（フレームメモリ１２１内のバッファへ格納する）。フレームメモリ１２１は、予測部１２２の要求に応じて、その復号画像R（またはその一部）を予測部１２２に供給する。

＜予測部＞
予測部１２２は、予測画像の生成に関する処理を行う。例えば、予測部１２２は、制御部１０１から供給される予測モード情報Pinfoと、並べ替えバッファ１１１から供給される入力画像（元画像）と、フレームメモリ１２１から読み出す復号画像R（またはその一部）を入力とする。予測部１２２は、予測モード情報Pinfoや入力画像（元画像）を用い、インター予測やイントラ予測等の予測処理を行い、復号画像Rを参照画像として参照して予測を行い、その予測結果に基づいて動き補償処理を行い、予測画像Pを生成する。予測部１２２は、生成した予測画像Pを演算部１１２および演算部１１９に供給する。また、予測部１２２は、以上の処理により選択した予測モード、すなわち最適な予測モードに関する情報を、必要に応じて符号化部１１５に供給する。

ここで、予測部１２２は、このようなインター予測処理を行う際に、図２を参照して上述したように、サブブロックの大きさおよび形状を切り替えることができる。

＜レート制御部＞
レート制御部１２３は、レート制御に関する処理を行う。例えば、レート制御部１２３は、蓄積バッファ１１６に蓄積された符号化データの符号量に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部１１４の量子化動作のレートを制御する。

以上のような構成の画像符号化装置１２において、制御部１０１は、サブブロックの大きさおよび形状を識別するサブブロックサイズ識別情報を設定し、符号化部１１５は、サブブロックサイズ識別情報を含む符号化データを生成する。また、予測部１２２は、サブブロックの大きさおよび形状を切り替えてインター予測処理を行う。従って、画像符号化装置１２は、大きなサブブロックを使用したり、矩形形状のサブブロックを使用したりすることで、インター予測処理における処理量を削減するとともに、画質の低下を抑制することができる。

なお、図２を参照して上述したような符号化回路２３において設定部および符号化部として行われる各処理は、図１２に示す各ブロックにおいて個々に行われるのではなく、例えば、複数のブロックにより行われるようにしてもよい。

＜画像復号装置の構成例＞
図１３は、本技術を適用した画像復号装置の一実施の形態の構成例を示すブロック図である。図１３に示される画像復号装置１３は、AVCやHEVCのように、画像とその予測画像との予測残差が符号化された符号化データを復号する装置である。例えば、画像復号装置１３は、非特許文献１、非特許文献２、または非特許文献３に記載されている技術を実装し、それらの文献のいずれかに記載された規格に準拠した方法で動画像の画像データが符号化された符号化データを復号する。例えば、画像復号装置１３は、上述の画像符号化装置１２により生成された符号化データ（ビットストリーム）を復号する。

なお、図１３においては、処理部やデータの流れ等の主なものを示しており、図１３に示されるものが全てとは限らない。つまり、画像復号装置１３において、図１３においてブロックとして示されていない処理部が存在したり、図１３において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

図１３において、画像復号装置１３は、蓄積バッファ２１１、復号部２１２、逆量子化部２１３、逆直交変換部２１４、演算部２１５、インループフィルタ部２１６、並べ替えバッファ２１７、フレームメモリ２１８、および予測部２１９を備えて構成される。なお、予測部２１９は、不図示のイントラ予測部およびインター予測部を備えている。画像復号装置１３は、符号化データ（ビットストリーム）を復号することによって、動画像データを生成するための装置である。

＜蓄積バッファ＞
蓄積バッファ２１１は、画像復号装置１３に入力されたビットストリームを取得し、保持（記憶）する。蓄積バッファ２１１は、所定のタイミングにおいて、または、所定の条件が整う等した場合、蓄積しているビットストリームを復号部２１２に供給する。

＜復号部＞
復号部２１２は、画像の復号に関する処理を行う。例えば、復号部２１２は、蓄積バッファ２１１から供給されるビットストリームを入力とし、シンタックステーブルの定義に沿って、そのビット列から、各シンタックス要素のシンタックス値を可変長復号し、パラメータを導出する。

シンタックス要素およびシンタックス要素のシンタックス値から導出されるパラメータには、例えば、ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、残差情報Rinfo、フィルタ情報Finfoなどの情報が含まれる。つまり、復号部２１２は、ビットストリームから、これらの情報をパースする（解析して取得する）。これらの情報について以下に説明する。

＜ヘッダ情報Hinfo＞
ヘッダ情報Hinfoは、例えば、VPS（Video Parameter Set）／SPS（Sequence Parameter Set）／PPS（Picture Parameter Set）／SH（スライスヘッダ）などのヘッダ情報を含む。ヘッダ情報Hinfoには、例えば、画像サイズ（横幅PicWidth、縦幅PicHeight）、ビット深度（輝度bitDepthY, 色差bitDepthC）、色差アレイタイプChromaArrayType、CUサイズの最大値MaxCUSize／最小値MinCUSize、４分木分割（Quad-tree分割ともいう）の最大深度MaxQTDepth/最小深度MinQTDepth、２分木分割（Binary-tree分割）の最大深度MaxBTDepth/最小深度MinBTDepth、変換スキップブロックの最大値MaxTSSize（最大変換スキップブロックサイズともいう）、各符号化ツールのオンオフフラグ（有効フラグともいう）などを規定する情報が含まれる。

例えば、ヘッダ情報Hinfoに含まれる符号化ツールのオンオフフラグとしては、以下に示す変換、量子化処理に関わるオンオフフラグがある。なお、符号化ツールのオンオフフラグは、該符号化ツールに関わるシンタックスが符号化データ中に存在するか否かを示すフラグとも解釈することができる。また、オンオフフラグの値が１（真）の場合、該符号化ツールが使用可能であることを示し、オンオフフラグの値が０（偽）の場合、該符号化ツールが使用不可であることを示す。なお、フラグ値の解釈は逆であってもよい。

コンポーネント間予測有効フラグ（ccp_enabled_flag）:コンポーネント間予測（CCP（Cross-Component Prediction），CC予測とも称する）が使用可能であるか否かを示すフラグ情報である。例えば、このフラグ情報が「１」（真）の場合、使用可能であることが示され、「０」（偽）の場合、使用不可であることが示される。

なお、このCCPは、コンポーネント間線形予測（CCLMまたはCCLMP）とも称する。

＜予測モード情報Pinfo＞
予測モード情報Pinfoには、例えば、処理対象PB（予測ブロック）のサイズ情報PBSize（予測ブロックサイズ）、イントラ予測モード情報IPinfo、動き予測情報MVinfo等の情報が含まれる。

イントラ予測モード情報IPinfoには、例えば、JCTVC-W1005, 7.3.8.5 Coding Unit syntax中のprev_intra_luma_pred_flag, mpm_idx, rem_intra_pred_mode、およびそのシンタックスから導出される輝度イントラ予測モードIntraPredModeY等が含まれる。

また、イントラ予測モード情報IPinfoには、例えば、コンポーネント間予測フラグ（ccp_flag（cclmp_flag））、多クラス線形予測モードフラグ（mclm_flag）、色差サンプル位置タイプ識別子（chroma_sample_loc_type_idx）、色差MPM識別子（chroma_mpm_idx）、および、これらのシンタックスから導出される輝度イントラ予測モード（IntraPredModeC）等が含まれる。

コンポーネント間予測フラグ（ccp_flag（cclmp_flag））は、コンポーネント間線形予測を適用するか否かを示すフラグ情報である。例えば、ccp_flag==1のとき、コンポーネント間予測を適用することを示し、ccp_flag==0のとき、コンポーネント間予測を適用しないことを示す。

多クラス線形予測モードフラグ（mclm_flag）は、線形予測のモードに関する情報（線形予測モード情報）である。より具体的には、多クラス線形予測モードフラグ（mclm_flag）は、多クラス線形予測モードにするか否かを示すフラグ情報である。例えば、「０」の場合、１クラスモード（単一クラスモード）（例えばCCLMP）であることを示し、「１」の場合、２クラスモード（多クラスモード）（例えばMCLMP）であることを示す。

色差サンプル位置タイプ識別子（chroma_sample_loc_type_idx）は、色差コンポーネントの画素位置のタイプ（色差サンプル位置タイプとも称する）を識別する識別子である。例えば色フォーマットに関する情報である色差アレイタイプ（ChromaArrayType）が420形式を示す場合、色差サンプル位置タイプ識別子は、次に示すような割り当て方となる。

chroma_sample_loc_type_idx == 0 : Type2
chroma_sample_loc_type_idx == 1 : Type3
chroma_sample_loc_type_idx == 2 : Type0
chroma_sample_loc_type_idx == 3 : Type1

なお、この色差サンプル位置タイプ識別子（chroma_sample_loc_type_idx）は、色差コンポーネントの画素位置に関する情報（chroma_sample_loc_info()）として（に格納されて）伝送される。

色差MPM識別子（chroma_mpm_idx）は、色差イントラ予測モード候補リスト（intraPredModeCandListC）の中のどの予測モード候補を色差イントラ予測モードとして指定するかを表す識別子である。

動き予測情報MVinfoには、例えば、merge_idx, merge_flag, inter_pred_idc, ref_idx_LX, mvp_lX_flag, X={0,1}, mvd等の情報が含まれる（例えば、JCTVC-W1005, 7.3.8.6 Prediction Unit Syntaxを参照）。

もちろん、予測モード情報Pinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。

＜変換情報Tinfo＞
変換情報Tinfoには、例えば、以下の情報が含まれる。もちろん、変換情報Tinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。

処理対象変換ブロックの横幅サイズTBWSizeおよび縦幅TBHSize（または、２を底とする各TBWSize、TBHSizeの対数値log2TBWSize、log2TBHSizeであってもよい）。
変換スキップフラグ（ts_flag）:（逆）プライマリ変換および（逆）セカンダリ変換をスキップか否かを示すフラグである。
スキャン識別子（scanIdx）
量子化パラメータ（qp）
量子化マトリックス（scaling_matrix（例えば、JCTVC-W1005, 7.3.4 Scaling list data syntax））

＜残差情報Rinfo＞
残差情報Rinfo（例えば、JCTVC-W1005の7.3.8.11 Residual Coding syntaxを参照）には、例えば以下のシンタックスが含まれる。

cbf（coded_block_flag）：残差データ有無フラグ
last_sig_coeff_x_pos：ラスト非ゼロ係数X座標
last_sig_coeff_y_pos：ラスト非ゼロ係数Y座標
coded_sub_block_flag：サブブロック非ゼロ係数有無フラグ
sig_coeff_flag：非ゼロ係数有無フラグ
gr1_flag：非ゼロ係数のレベルが１より大きいかを示すフラグ（GR1フラグとも呼ぶ）
gr2_flag：非ゼロ係数のレベルが２より大きいかを示すフラグ（GR2フラグとも呼ぶ）
sign_flag：非ゼロ係数の正負を示す符号（サイン符号とも呼ぶ）
coeff_abs_level_remaining：非ゼロ係数の残余レベル（非ゼロ係数残余レベルとも呼ぶ）
など。

もちろん、残差情報Rinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。

＜フィルタ情報Finfo＞
フィルタ情報Finfoには、例えば、以下に示す各フィルタ処理に関する制御情報が含まれる。

デブロッキングフィルタ(DBF)に関する制御情報
画素適応オフセット(SAO)に関する制御情報
適応ループフィルタ(ALF)に関する制御情報
その他の線形・非線形フィルタに関する制御情報

より具体的には、例えば、各フィルタを適用するピクチャや、ピクチャ内の領域を指定する情報や、CU単位のフィルタOn/Off制御情報、スライス、タイルの境界に関するフィルタOn/Off制御情報などが含まれる。もちろん、フィルタ情報Finfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。

復号部２１２の説明に戻り、復号部２１２は、残差情報Rinfoを参照して、各変換ブロック内の各係数位置の量子化変換係数レベルlevelを導出する。復号部２１２は、その量子化変換係数レベルlevelを、逆量子化部２１３に供給する。

また、復号部２１２は、パースしたヘッダ情報Hinfo、予測モード情報Pinfo、量子化変換係数レベルlevel、変換情報Tinfo、フィルタ情報Finfoを各ブロックへ供給する。具体的には以下の通りである。

ヘッダ情報Hinfoは、逆量子化部２１３、逆直交変換部２１４、予測部２１９、インループフィルタ部２１６に供給される。
予測モード情報Pinfoは、逆量子化部２１３および予測部２１９に供給される。
変換情報Tinfoは、逆量子化部２１３および逆直交変換部２１４に供給される。
フィルタ情報Finfoは、インループフィルタ部２１６に供給される。

もちろん、上述の例は一例であり、この例に限定されない。例えば、各符号化パラメータが任意の処理部に供給されるようにしてもよい。また、その他の情報が、任意の処理部に供給されるようにしてもよい。

さらに、復号部２１２は、サブブロックの大きさおよび形状を識別するサブブロックサイズ識別情報がビットストリームに含まれている場合、そのサブブロックサイズ識別情報をパースすることができる。

＜逆量子化部＞
逆量子化部２１３は、逆量子化に関する処理を行う。例えば、逆量子化部２１３は、復号部２１２から供給される変換情報Tinfoおよび量子化変換係数レベルlevelを入力とし、その変換情報Tinfoに基づいて、量子化変換係数レベルlevelの値をスケーリング（逆量子化）し、逆量子化後の変換係数Coeff_IQを導出する。

なお、この逆量子化は、量子化部１１４による量子化の逆処理として行われる。また、この逆量子化は、逆量子化部１１７による逆量子化と同様の処理である。つまり、逆量子化部１１７は、逆量子化部２１３と同様の処理（逆量子化）を行う。

逆量子化部２１３は、導出した変換係数Coeff_IQを逆直交変換部２１４に供給する。

＜逆直交変換部＞
逆直交変換部２１４は、逆直交変換に関する処理を行う。例えば、逆直交変換部２１４は、逆量子化部２１３から供給される変換係数Coeff_IQ、および、復号部２１２から供給される変換情報Tinfoを入力とし、その変換情報Tinfoに基づいて、変換係数Coeff_IQに対して逆直交変換処理を行い、予測残差D'を導出する。

なお、この逆直交変換は、直交変換部１１３による直交変換の逆処理として行われる。また、この逆直交変換は、逆直交変換部１１８による逆直交変換と同様の処理である。つまり、逆直交変換部１１８は、逆直交変換部２１４と同様の処理（逆直交変換）を行う。

逆直交変換部２１４は、導出した予測残差D'を演算部２１５に供給する。

＜演算部＞
演算部２１５は、画像に関する情報の加算に関する処理を行う。例えば、演算部２１５は、逆直交変換部２１４から供給される予測残差D'と、予測部２１９から供給される予測画像Pとを入力とする。演算部２１５は、予測残差D'とその予測残差D'に対応する予測画像P（予測信号）とを加算し、局所復号画像R_localを導出（R_local＝D'＋P）する。

演算部２１５は、導出した局所復号画像R_localを、インループフィルタ部２１６およびフレームメモリ２１８に供給する。

＜インループフィルタ部＞
インループフィルタ部２１６は、インループフィルタ処理に関する処理を行う。例えば、インループフィルタ部２１６は、演算部２１５から供給される局所復号画像R_localと、復号部２１２から供給されるフィルタ情報Finfoとを入力とする。なお、インループフィルタ部２１６に入力される情報は任意であり、これらの情報以外の情報が入力されてもよい。

インループフィルタ部２１６は、そのフィルタ情報Finfoに基づいて、局所復号画像R_localに対して適宜フィルタ処理を行う。

例えば、インループフィルタ部２１６は、非特許文献１に記載のように、バイラテラルフィルタ、デブロッキングフィルタ（DBF（DeBlocking Filter））、適応オフセットフィルタ（SAO（Sample Adaptive Offset））、および適応ループフィルタ（ALF(Adaptive Loop Filter)）の４つのインループフィルタをこの順に適用する。なお、どのフィルタを適用するか、どの順で適用するかは任意であり、適宜選択可能である。

インループフィルタ部２１６は、符号化側（例えば、図１２の画像符号化装置１２のインループフィルタ部１２０）により行われたフィルタ処理に対応するフィルタ処理を行う。

もちろん、インループフィルタ部２１６が行うフィルタ処理は任意であり、上述の例に限定されない。例えば、インループフィルタ部２１６がウィーナーフィルタ等を適用するようにしてもよい。

インループフィルタ部２１６は、フィルタ処理された局所復号画像R_localを並べ替えバッファ２１７およびフレームメモリ２１８に供給する。

＜並べ替えバッファ＞
並べ替えバッファ２１７は、インループフィルタ部２１６から供給された局所復号画像R_localを入力とし、それを保持（記憶）する。並べ替えバッファ２１７は、その局所復号画像R_localを用いてピクチャ単位毎の復号画像Rを再構築し、保持する（バッファ内に格納する）。並べ替えバッファ２１７は、得られた復号画像Rを、復号順から再生順に並べ替える。並べ替えバッファ２１７は、並べ替えた復号画像R群を動画像データとして画像復号装置１３の外部に出力する。

＜フレームメモリ＞
フレームメモリ２１８は、画像に関するデータの記憶に関する処理を行う。例えば、フレームメモリ２１８は、演算部２１５より供給される局所復号画像R_localを入力とし、ピクチャ単位毎の復号画像Rを再構築して、フレームメモリ２１８内のバッファへ格納する。

また、フレームメモリ２１８は、インループフィルタ部２１６から供給される、インループフィルタ処理された局所復号画像R_localを入力とし、ピクチャ単位毎の復号画像Rを再構築して、フレームメモリ２１８内のバッファへ格納する。フレームメモリ２１８は、適宜、その記憶している復号画像R（またはその一部）を参照画像として予測部２１９に供給する。

なお、フレームメモリ２１８が、復号画像の生成に係るヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなどを記憶するようにしても良い。

＜予測部＞
予測部２１９は、予測画像の生成に関する処理を行う。例えば、予測部２１９は、復号部２１２から供給される予測モード情報Pinfoを入力とし、その予測モード情報Pinfoによって指定される予測方法により予測を行い、予測画像Pを導出する。その導出の際、予測部２１９は、その予測モード情報Pinfoによって指定される、フレームメモリ２１８に格納されたフィルタ前またはフィルタ後の復号画像R（またはその一部）を、参照画像として利用する。予測部２１９は、導出した予測画像Pを、演算部２１５に供給する。

ここで、予測部２１９は、インター予測処理を行う際に、図３を参照して上述したように、復号部２１２がビットストリームからパースしたサブブロックサイズ識別情報に従って、サブブロックの大きさおよび形状を切り替えることができる。

以上のような構成の画像復号装置１３において、復号部２１２は、ビットストリームからサブブロックサイズ識別情報をパースするパース処理を行う。また、予測部２１９は、そのサブブロックサイズ識別情報に従って、サブブロックの大きさおよび形状を切り替えてインター予測処理を行う。従って、画像復号装置１３は、大きなサブブロックを使用したり、矩形形状のサブブロックを使用したりすることで、インター予測処理における処理量を削減するとともに、画質の低下を抑制することができる。

なお、図３を参照して上述したような復号回路３３においてパース部および復号部として行われる各処理は、図１３に示す各ブロックにおいて個々に行われるのではなく、例えば、複数のブロックにより行われるようにしてもよい。

＜画像符号化処理および画像復号処理＞
図１４乃至図１８のフローチャートを参照して、画像符号化装置１２が実行する画像符号化処理、および、画像復号装置１３が実行する画像復号処理について説明する。

図１４は、画像符号化装置１２が実行する画像符号化処理を説明するフローチャートである。

画像符号化処理が開始されると、ステップＳ１１において、並べ替えバッファ１１１は、制御部１０１に制御されて、入力された動画像データのフレームの順を表示順から符号化順に並べ替える。

ステップＳ１２において、制御部１０１は、並べ替えバッファ１１１が保持する入力画像に対して、処理単位を設定する（ブロック分割を行う）。ここで処理単位を設定する際に、図１５乃至図１８を参照して後述するようなサブブロックサイズ識別情報を設定する処理も行われる。

ステップＳ１３において、制御部１０１は、並べ替えバッファ１１１が保持する入力画像についての符号化パラメータを決定（設定）する。

ステップＳ１４において、予測部１２２は、予測処理を行い、最適な予測モードの予測画像等を生成する。例えば、この予測処理において、予測部１２２は、イントラ予測を行って最適なイントラ予測モードの予測画像等を生成し、インター予測を行って最適なインター予測モードの予測画像等を生成し、それらの中から、コスト関数値等に基づいて最適な予測モードを選択する。ここで予測処理を行う際に、図２を参照して上述したように、インター予測処理で用いるサブブロックの大きさおよび形状を切り替えることができる。

ステップＳ１５において、演算部１１２は、入力画像と、ステップＳ１４の予測処理により選択された最適なモードの予測画像との差分を演算する。つまり、演算部１１２は、入力画像と予測画像との予測残差Dを生成する。このようにして求められた予測残差Dは、元の画像データに比べてデータ量が低減される。したがって、画像をそのまま符号化する場合に比べて、データ量を圧縮することができる。

ステップＳ１６において、直交変換部１１３は、ステップＳ１５の処理により生成された予測残差Dに対して直交変換処理を行い、変換係数Coeffを導出する。

ステップＳ１７において、量子化部１１４は、制御部１０１により算出された量子化パラメータを用いる等して、ステップＳ１６の処理により得られた変換係数Coeffを量子化し、量子化変換係数レベルlevelを導出する。

ステップＳ１８において、逆量子化部１１７は、ステップＳ１７の処理により生成された量子化変換係数レベルlevelを、そのステップＳ１７の量子化の特性に対応する特性で逆量子化し、変換係数Coeff_IQを導出する。

ステップＳ１９において、逆直交変換部１１８は、ステップＳ１８の処理により得られた変換係数Coeff_IQを、ステップＳ１６の直交変換処理に対応する方法で逆直交変換し、予測残差D'を導出する。なお、この逆直交変換処理は、復号側において行われる逆直交変換処理（後述する）と同様であるので、このステップＳ１９の逆直交変換処理については、復号側について行う説明（後述する）を適用することができる。

ステップＳ２０において、演算部１１９は、ステップＳ１９の処理により導出された予測残差D'に、ステップＳ１４の予測処理により得られた予測画像を加算することにより、局所的に復号された復号画像を生成する。

ステップＳ２１において、インループフィルタ部１２０は、ステップＳ２０の処理により導出された、局所的に復号された復号画像に対して、インループフィルタ処理を行う。

ステップＳ２２において、フレームメモリ１２１は、ステップＳ２０の処理により導出された、局所的に復号された復号画像や、ステップＳ２１においてフィルタ処理された、局所的に復号された復号画像を記憶する。

ステップＳ２３において、符号化部１１５は、ステップＳ１７の処理により得られた量子化変換係数レベルlevelを符号化する。例えば、符号化部１１５は、画像に関する情報である量子化変換係数レベルlevelを、算術符号化等により符号化し、符号化データを生成する。また、このとき、符号化部１１５は、各種符号化パラメータ（ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo）を符号化する。さらに、符号化部１１５は、量子化変換係数レベルlevelから残差情報RInfoを導出し、その残差情報RInfoを符号化する。

ステップＳ２４において、蓄積バッファ１１６は、このようにして得られた符号化データを蓄積し、例えばビットストリームとして、それを画像符号化装置１２の外部に出力する。このビットストリームは、例えば、伝送路や記録媒体を介して復号側に伝送される。また、レート制御部１２３は、必要に応じてレート制御を行う。

ステップＳ２４の処理が終了すると、画像符号化処理が終了する。

以上のような流れの画像符号化処理において、ステップＳ１２およびステップＳ１４の処理として、上述した本技術を適用した処理が行われる。従って、この画像符号化処理を実行することにより、大きなサブブロックを使用したり、矩形形状のサブブロックを使用したりすることで、インター予測処理における処理量を削減するとともに、画質の低下を抑制することができる。

図１５は、図１４のステップＳ１２においてサブブロックサイズ識別情報を設定する処理の第１の処理例を説明するフローチャートである。

ステップＳ３１において、制御部１０１は、上述した式（１）の演算結果に基づき、Ｘ方向ベクトル差分ｄｖ_ｘが、Ｙ方向ベクトル差分ｄｖ_ｙより小さいか否かを判定する。

ステップＳ３１において、制御部１０１が、Ｘ方向ベクトル差分ｄｖ_ｘが小さいと判定した場合、処理はステップＳ３２に進む。そして、ステップＳ３２において、制御部１０１は、図７のタイプ１（即ち、矩形形状の長手方向がＸ方向）の形状のサブブロックを用いるようにサブブロックサイズ識別情報を設定した後、処理は終了される。

一方、ステップＳ３１において、制御部１０１が、Ｘ方向ベクトル差分ｄｖ_ｘが小さくない（Ｘ方向ベクトル差分ｄｖ_ｘはＹ方向ベクトル差分ｄｖ_ｙ以上である）と判定した場合、処理はステップＳ３３に進む。そして、ステップＳ３３において、制御部１０１は、図８のタイプ２（即ち、矩形形状の長手方向がＹ方向）の形状のサブブロックを用いるようにサブブロックサイズ識別情報を設定した後、処理は終了される。

以上のように、制御部１０１は、Ｙ方向ベクトル差分ｄｖ_ｙおよびＸ方向ベクトル差分ｄｖ_ｘの大小関係に基づいて、矩形形状のサブブロックの長手方向をＸ方向とＹ方向とで切り替えてサブブロックサイズ識別情報を設定することができる。

図１６は、図１４のステップＳ１２においてサブブロックサイズ識別情報を設定する処理の第２の処理例を説明するフローチャートである。

ステップＳ４１において、制御部１０１は、インター予測処理における予測方向はBi-predictionであるか否かを判定する。

ステップＳ４１において、制御部１０１が、インター予測処理における予測方向はBi-predictionであると判定した場合、処理はステップＳ４２に進む。そして、ステップＳ４２乃至Ｓ４４において、図１５のステップＳ３１乃至Ｓ３３と同様の処理が行われ、Ｙ方向ベクトル差分ｄｖ_ｙおよびＸ方向ベクトル差分ｄｖ_ｘの大小関係に基づいて、サブブロックサイズ識別情報が設定される。

一方、ステップＳ４１において、制御部１０１が、インター予測処理における予測方向はBi-predictionでないと判定した場合、処理はステップＳ４５に進む。ステップＳ４５において、制御部１０１は、４×４の大きさのサブブロックを用いるようにサブブロックサイズ識別情報を設定した後、処理は終了される。

以上のように、処理量の多いBi-predictionでインター予測処理を行う場合には、４×４より大きな４×８または８×４のサブブロックを用いることで、インター予測処理における処理量を削減することができる。また、Bi-predictionではなく、例えば、処理量の少ないUni- predictionでインター予測処理を行う場合には、小さな４×４のサブブロックを用いることで、より高画質となるようにインター予測処理を行うことができる。

図１７は、図１４のステップＳ１２においてサブブロックサイズ識別情報を設定する処理の第３の処理例を説明するフローチャートである。

ステップＳ５１において、制御部１０１は、インター予測処理における予測方向はBi-predictionであるか否かを判定する。

ステップＳ５１において、制御部１０１が、インター予測処理における予測方向はBi-predictionであると判定した場合、処理はステップＳ５２に進む。ステップＳ５２において、制御部１０１は、上述の図９に示したように、Ｌ０予測についてはタイプ１の形状のサブブロックを設定し、Ｌ１予測についてはタイプ２の形状のサブブロックを設定した後、処理は終了される。

一方、ステップＳ５１において、制御部１０１が、インター予測処理における予測方向はBi-predictionでないと判定した場合、処理はステップＳ５３に進む。ステップＳ５３において、制御部１０１は、４×４の大きさのサブブロックを用いるようにサブブロックサイズ識別情報を設定した後、処理は終了される。

以上のように、Bi-predictionにおいて、Ｌ０予測にタイプ１の形状のサブブロックを用い、Ｌ１予測にタイプ２の形状のサブブロックを用いることで、図９を参照して上述したように、画質の劣化を抑制することができる。

図１８は、図１４のステップＳ１２においてサブブロックサイズ識別情報を設定する処理の第４の処理例を説明するフローチャートである。

ステップＳ６１において、制御部１０１は、インター予測処理における予測方向はBi-predictionであるか否かを判定する。

ステップＳ６１において、制御部１０１が、インター予測処理における予測方向はBi-predictionであると判定した場合、処理はステップＳ６２に進む。

ステップＳ６２において、制御部１０１は、上述した式（２）の演算結果に基づき、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ｘＬ０がＬ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０より大きいか否かを判定する。

ステップＳ６２において、制御部１０１が、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ｘＬ０はＬ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０より大きくない（Ｌ０予測のＸ方向ベクトル差分ｄｖ_ｘＬ０はＬ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０以下である）と判定した場合、処理はステップＳ６３に進む。

ステップＳ６３において、制御部１０１は、上述した式（２）の演算結果に基づき、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ｘＬ１がＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１より大きいか否かを判定する。

ステップＳ６３において、制御部１０１が、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ｘＬ１はＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１より大きくない（Ｌ１予測のＸ方向ベクトル差分ｄｖ_ｘＬ１はＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１以下である）と判定した場合、処理はステップＳ６４に進む。

ステップＳ６４において、制御部１０１は、上述した式（２）の演算結果に基づき、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０がＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１より大きいか否かを判定する。

ステップＳ６４において、制御部１０１が、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０はＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１より大きくない（Ｌ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０はＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１以下である）と判定した場合、処理はステップＳ６５に進む。即ち、この場合、Ｌ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１が最も大きい。

ステップＳ６５において、制御部１０１は、上述の図１０に示したように、Ｌ０予測についてはタイプ２の形状のサブブロックを設定し、Ｌ１予測についてはタイプ１の形状のサブブロックを設定した後、処理は終了される。

一方、ステップＳ６４において、制御部１０１が、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０はＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１より大きいと判定した場合、処理はステップＳ６６に進む。即ち、この場合、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０が最も大きい。

ステップＳ６６において、制御部１０１は、上述の図９に示したように、Ｌ０予測についてはタイプ１の形状のサブブロックを設定し、Ｌ１予測についてはタイプ１の形状のサブブロックを設定した後、処理は終了される。

一方、ステップＳ６３において、制御部１０１が、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ｘＬ１がＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１より大きいと判定した場合、処理はステップＳ６７に進む。

ステップＳ６７において、制御部１０１は、上述した式（２）の演算結果に基づき、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ＹＬ０がＬ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１より大きいか否かを判定する。

ステップＳ６７において、制御部１０１が、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ＹＬ０はＬ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１より大きくない（Ｌ０予測のＹ方向ベクトル差分ｄｖ_ＹＬ０はＬ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１以下である）と判定した場合、処理はステップＳ６５に進む。即ち、この場合、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１が最も大きい。従って、ステップＳ６５において、上述の図９に示したように、Ｌ０予測についてはタイプ２の形状のサブブロックが設定され、Ｌ１予測についてはタイプ１の形状のサブブロックが設定される。

一方、ステップＳ６７において、制御部１０１が、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０はＬ１予測のＹ方向ベクトル差分ｄｖ_ｙＬ１より大きいと判定した場合、処理はステップＳ６６に進む。即ち、この場合、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ｙＬ０が最も大きい。従って、ステップＳ６６において、上述の図９に示したように、Ｌ０予測についてはタイプ１の形状のサブブロックが設定され、Ｌ１予測についてはタイプ１の形状のサブブロックが設定される。

ステップＳ６８において、制御部１０１は、上述した式（２）の演算結果に基づき、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１がＬ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１より大きいか否かを判定する。

ステップＳ６８において、制御部１０１が、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１はＬ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１より大きくない（Ｌ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１はＬ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１以下である）と判定した場合、処理はステップＳ６９に進む。

ステップＳ６９において、制御部１０１は、上述した式（２）の演算結果に基づき、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０がＬ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１より大きいか否かを判定する。

ステップＳ６９において、制御部１０１が、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０はＬ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１より大きくない（Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０はＬ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１以下である）と判定した場合、処理はステップＳ６６に進む。即ち、この場合、Ｌ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１が最も大きい。従って、ステップＳ６６において、上述の図９に示したように、Ｌ０予測についてはタイプ１の形状のサブブロックが設定され、Ｌ１予測についてはタイプ１の形状のサブブロックが設定される。

一方、ステップＳ６９において、制御部１０１が、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０はＬ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１より大きいと判定した場合、処理はステップＳ６５に進む。即ち、この場合、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０が最も大きい。従って、ステップＳ６５において、上述の図９に示したように、Ｌ０予測についてはタイプ２の形状のサブブロックが設定され、Ｌ１予測についてはタイプ１の形状のサブブロックが設定される。

一方、ステップＳ６８において、制御部１０１が、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１はＬ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１より大きいと判定した場合、処理はステップＳ７０に進む。

ステップＳ７０において、制御部１０１は、上述した式（２）の演算結果に基づき、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０がＬ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１より大きいか否かを判定する。

ステップＳ７０において、制御部１０１が、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０はＬ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１より大きくない（Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０はＬ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１以下である）と判定した場合、処理はステップＳ６６に進む。即ち、この場合、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１が最も大きい。従って、ステップＳ６６において、上述の図９に示したように、Ｌ０予測についてはタイプ１の形状のサブブロックが設定され、Ｌ１予測についてはタイプ１の形状のサブブロックが設定される。

一方、ステップＳ７０において、制御部１０１が、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０はＬ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１より大きいと判定した場合、処理はステップＳ６５に進む。即ち、この場合、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０が最も大きい。従って、ステップＳ６５において、上述の図９に示したように、Ｌ０予測についてはタイプ２の形状のサブブロックが設定され、Ｌ１予測についてはタイプ１の形状のサブブロックが設定される。

一方、ステップＳ６１において、制御部１０１が、インター予測処理における予測方向はBi-predictionでないと判定した場合、処理はステップＳ７１に進む。ステップＳ７１において、制御部１０１は、４×４の大きさのサブブロックを用いるようにサブブロックサイズ識別情報を設定した後、処理は終了される。

以上のように、Ｌ０予測のＸ方向ベクトル差分ｄｖ_ＸＬ０、Ｌ０予測のＹ方向ベクトル差分ｄｖ_ＹＬ０、Ｌ１予測のＸ方向ベクトル差分ｄｖ_ＸＬ１、およびＬ１予測のＹ方向ベクトル差分ｄｖ_ＹＬ１の比較結果に基づいて、Ｌ０予測とＬ１予測とで、矩形形状のサブブロックの長手方向をＸ方向とＹ方向とで切り替えてサブブロックサイズ識別情報を設定することができる。

図１９は、画像復号装置１３が実行する画像復号処理を説明するフローチャートである。

画像復号処理が開始されると、蓄積バッファ２１１は、ステップＳ８１において、画像復号装置１３の外部から供給される符号化データ（ビットストリーム）を取得して保持する（蓄積する）。

ステップＳ８２において、復号部２１２は、その符号化データ（ビットストリーム）を復号し、量子化変換係数レベルlevelを得る。また、復号部２１２は、この復号により、符号化データ（ビットストリーム）から各種符号化パラメータをパースする（解析して取得する）。ここで復号処理を行う際に、図３を参照して上述したように、ビットストリームからサブブロックサイズ識別情報をパースする処理も行われる。

ステップＳ８３において、逆量子化部２１３は、ステップＳ８２の処理により得られた量子化変換係数レベルlevelに対して、符号化側で行われた量子化の逆処理である逆量子化を行い、変換係数Coeff_IQを得る。

ステップＳ８４において、逆直交変換部２１４は、ステップＳ８３の処理により得られた変換係数Coeff_IQに対して、符号化側で行われた直交変換処理の逆処理である逆直交変換処理を行い、予測残差D'を得る。

ステップＳ８５において、予測部２１９は、ステップＳ８２においてパースされた情報に基づいて、符号化側より指定される予測方法で予測処理を実行し、フレームメモリ２１８に記憶されている参照画像を参照する等して、予測画像Pを生成する。ここで予測処理を行う際に、図３を参照して上述したように、ステップＳ８２でパースしたサブブロックサイズ識別情報に従って、インター予測処理で用いるサブブロックの大きさおよび形状を切り替えることができる。

ステップＳ８６において、演算部２１５は、ステップＳ８４の処理により得られた予測残差D'と、ステップＳ８５の処理により得られた予測画像Pとを加算し、局所復号画像R_localを導出する。

ステップＳ８７において、インループフィルタ部２１６は、ステップＳ８６の処理により得られた局所復号画像R_localに対して、インループフィルタ処理を行う。

ステップＳ８８において、並べ替えバッファ２１７は、ステップＳ８７の処理により得られたフィルタ処理された局所復号画像R_localを用いて復号画像Rを導出し、その復号画像R群の順序を復号順から再生順に並べ替える。再生順に並べ替えられた復号画像R群は、動画像として画像復号装置１３の外部に出力される。

また、ステップＳ８９において、フレームメモリ２１８は、ステップＳ８６の処理により得られた局所復号画像R_local、および、ステップＳ８７の処理により得られたフィルタ処理後の局所復号画像R_localの内、少なくとも一方を記憶する。

ステップＳ８９の処理が終了すると、画像復号処理が終了する。

以上のような流れの画像復号処理において、ステップＳ８２およびステップＳ８５の処理として、上述した本技術を適用した処理が行われる。従って、この画像復号処理を実行することにより、大きなサブブロックを使用したり、タイプ１またはタイプ２の形状のサブブロックを使用したりすることで、インター予測処理における処理量を削減することができる。

なお、上述したような補間フィルタについての処理を、例えば、AIF（Adaptive Interpolation Filter）に適用してもよい。

＜コンピュータの構成例＞
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。

図２０は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示すブロック図である。

プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク３０５やROM３０３に予め記録しておくことができる。

あるいはまた、プログラムは、ドライブ３０９によって駆動されるリムーバブル記録媒体３１１に格納（記録）しておくことができる。このようなリムーバブル記録媒体３１１は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブル記録媒体３１１としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。

なお、プログラムは、上述したようなリムーバブル記録媒体３１１からコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵するハードディスク３０５にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。

コンピュータは、CPU(Central Processing Unit) ３０２を内蔵しており、CPU３０２には、バス３０１を介して、入出力インタフェース３１０が接続されている。

CPU３０２は、入出力インタフェース３１０を介して、ユーザによって、入力部３０７が操作等されることにより指令が入力されると、それに従って、ROM(Read Only Memory) ３０３に格納されているプログラムを実行する。あるいは、CPU３０２は、ハードディスク３０５に格納されたプログラムを、RAM(Random Access Memory) ３０４にロードして実行する。

これにより、CPU３０２は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU３０２は、その処理結果を、必要に応じて、例えば、入出力インタフェース３１０を介して、出力部３０６から出力、あるいは、通信部３０８から送信、さらには、ハードディスク３０５に記録等させる。

なお、入力部３０７は、キーボードや、マウス、マイク等で構成される。また、出力部３０６は、LCD(Liquid Crystal Display)やスピーカ等で構成される。

ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含む。

また、プログラムは、１のコンピュータ（プロセッサ）により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

さらに、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

また、例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

また、例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、例えば、上述したプログラムは、任意の装置において実行することができる。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

また、例えば、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

＜本技術の適用対象＞
本技術は、任意の画像符号化・復号方式に適用することができる。つまり、上述した本技術と矛盾しない限り、変換（逆変換）、量子化（逆量子化）、符号化（復号）、予測等、画像符号化・復号に関する各種処理の仕様は任意であり、上述した例に限定されない。また、上述した本技術と矛盾しない限り、これらの処理の内の一部を省略してもよい。

また本技術は、複数の視点（ビュー（view））の画像を含む多視点画像の符号化・復号を行う多視点画像符号化・復号システムに適用することができる。その場合、各視点（ビュー（view））の符号化・復号において、本技術を適用するようにすればよい。

さらに本技術は、所定のパラメータについてスケーラビリティ（scalability）機能を有するように複数レイヤ化（階層化）された階層画像の符号化・復号を行う階層画像符号化（スケーラブル符号化）・復号システムに適用することができる。その場合、各階層（レイヤ）の符号化・復号において、本技術を適用するようにすればよい。

実施形態に係る画像符号化装置や画像復号装置は、例えば、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、およびセルラー通信による端末への配信などにおける送信機や受信機（例えばテレビジョン受像機や携帯電話機）、または、光ディスク、磁気ディスクおよびフラッシュメモリなどの媒体に画像を記録したり、これら記憶媒体から画像を再生したりする装置（例えばハードディスクレコーダやカメラ）などの、様々な電子機器に応用され得る。

また、本技術は、任意の装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ（例えばビデオプロセッサ）、複数のプロセッサ等を用いるモジュール（例えばビデオモジュール）、複数のモジュール等を用いるユニット（例えばビデオユニット）、ユニットにさらにその他の機能を付加したセット（例えばビデオセット）等（すなわち、装置の一部の構成）として実施することもできる。

さらに、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、コンピュータ、AV（Audio Visual）機器、携帯型情報処理端末、IoT（Internet of Things）デバイス等の任意の端末に対して、画像（動画像）に関するサービスを提供するクラウドサービスに適用することもできる。

なお、本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。

例えば、本技術は、観賞用コンテンツ等の提供の用に供されるシステムやデバイスに適用することができる。また、例えば、本技術は、交通状況の監理や自動運転制御等、交通の用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、機械等の自動制御の用に供されるシステムやデバイスに適用することができる。さらに、例えば、本技術は、農業や畜産業の用に供されるシステムやデバイスにも適用することができる。また、本技術は、例えば火山、森林、海洋等の自然の状態や野生生物等を監視するシステムやデバイスにも適用することができる。さらに、例えば、本技術は、スポーツの用に供されるシステムやデバイスにも適用することができる。

＜構成の組み合わせ例＞
なお、本技術は以下のような構成も取ることができる。
（１）
アフィン変換における動き補償で用いられる動きベクトルに基づいて、画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する識別情報を設定する設定部と、
前記設定部による設定に応じた大きさまたは形状の前記サブブロックに対して前記アフィン変換を適用する前記インター予測処理を行って前記画像を符号化し、前記識別情報を含むビットストリームを生成する符号化部と
を備える画像符号化装置。
（２）
前記設定部は、矩形形状の前記サブブロックについて、その矩形形状の長手方向をＸ方向およびＹ方向で切り替えて設定する
上記（１）に記載の画像符号化装置。
（３）
前記設定部は、Ｘ方向ベクトル差分が、Ｙ方向ベクトル差分より小さい場合、矩形形状の前記サブブロックの長手方向をＸ方向として前記識別情報を設定する
上記（１）または（２）に記載の画像符号化装置。
（４）
前記設定部は、前記Ｘ方向ベクトル差分が、前記Ｙ方向ベクトル差分より小さい場合、矩形形状の前記サブブロックのサイズを８×４として前記識別情報を設定する
上記（３）に記載の画像符号化装置。
（５）
前記設定部は、Ｙ方向ベクトル差分が、Ｘ方向ベクトル差分より小さい場合、矩形形状の前記サブブロックの長手方向をＹ方向として前記識別情報を設定する
上記（１）から（４）までのいずれかに記載の画像符号化装置。
（６）
前記設定部は、前記Ｙ方向ベクトル差分が、前記Ｘ方向ベクトル差分より小さい場合、矩形形状の前記サブブロックのサイズを４×８として前記識別情報を設定する
上記（５）に記載の画像符号化装置。
（７）
前記設定部は、前記サブブロックの左上頂点、右上頂点、および左下頂点の動きベクトルを用いてＸ方向ベクトル差分およびＹ方向ベクトル差分を算出し、
前記Ｘ方向ベクトル差分の絶対値が、前記Ｙ方向ベクトル差分の絶対値より大きい場合、矩形形状の前記サブブロックの長手方向をＸ方向として前記識別情報を設定し、
前記Ｘ方向ベクトル差分の絶対値が、前記Ｙ方向ベクトル差分の絶対値以下である場合、矩形形状の前記サブブロックの長手方向をＹ方向として前記識別情報を設定する
上記（１）から（６）までのいずれかに記載の画像符号化装置。
（８）
前記設定部は、前記インター予測処理における予測方向がBi-predictionである場合に、矩形形状の前記サブブロックを用いるように前記識別情報を設定する
上記（１）から（７）までのいずれかに記載の画像符号化装置。
（９）
前記設定部は、Bi-predictionの前記インター予測処理における前方向予測および後方向予想のうちの、いずれか一方で用いる矩形形状の前記サブブロックの長手方向をＸ方向とし、他方で用いる矩形形状の前記サブブロックの長手方向をＹ方向として前記識別情報を設定する
上記（８）に記載の画像符号化装置。
（１０）
前記設定部は、
前記前方向予測で用いる前記サブブロックの左上頂点、右上頂点、および左下頂点の動きベクトルを用いて、前方向予測のＸ方向ベクトル差分および前方向予測のＹ方向ベクトル差分を算出し、
前記後方向予測で用いる前記サブブロックの左上頂点、右上頂点、および左下頂点の動きベクトルを用いて、後方向予測のＸ方向ベクトル差分および後方向予測のＹ方向ベクトル差分を算出して、
前記前方向予測のＸ方向ベクトル差分または前記後方向予測のＸ方向ベクトル差分が最も大きい場合、前記前方向予測で用いる矩形形状の前記サブブロックの長手方向をＹ方向とし、かつ、前記後方向予測で用いる矩形形状の前記サブブロックの長手方向をＸ方向として前記識別情報を設定し、
前方向予測のＹ方向ベクトル差分または前記後方向予測のＹ方向ベクトル差分が最も大きい場合、前記前方向予測で用いる矩形形状の前記サブブロックの長手方向をＸ方向とし、かつ、前記後方向予測で用いる矩形形状の前記サブブロックの長手方向をＹ方向として前記識別情報を設定する
上記（９）に記載の画像符号化装置。
（１１）
画像を符号化する画像符号化装置が、
アフィン変換における動き補償で用いられる動きベクトルに基づいて、前記画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する識別情報を設定することと、
その設定に応じた大きさまたは形状の前記サブブロックに対して前記アフィン変換を適用する前記インター予測処理を行って前記画像を符号化し、前記識別情報を含むビットストリームを生成することと
を含む画像符号化方法。
（１２）
アフィン変換における動き補償で用いられる動きベクトルに基づいて設定される識別情報であって、画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する前記識別情報を含むビットストリームから、前記識別情報をパースするパース部と、
前記パース部によりパースされた前記識別情報に従った大きさまたは形状の前記サブブロックに対して前記アフィン変換を適用する前記インター予測処理を行って、前記ビットストリームを復号して前記画像を生成する復号部と
を備える画像復号装置。
（１３）
画像を復号する画像復号装置が、
アフィン変換における動き補償で用いられる動きベクトルに基づいて設定される識別情報であって、前記画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する前記識別情報を含むビットストリームから、前記識別情報をパースすることと、
そのパースされた前記識別情報に従った大きさまたは形状の前記サブブロックに対してアフィン変換を適用する前記インター予測処理を行って、前記ビットストリームを復号して前記画像を生成することと
を含む画像復号方法。

なお、本実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

１１画像処理システム，１２画像符号化装置，１３画像復号装置，２１画像処理チップ，２２外部メモリ，２３符号化回路，２４キャッシュメモリ３１画像処理チップ，３２外部メモリ，３３復号回路，３４キャッシュメモリ，３５水平方向補間フィルタ，３６転置用メモリ，３７垂直方向補間フィルタ，３８平均化部，１０１制御部，１２２予測部，１１３直交変換部，１１５符号化部，１１８逆直交変換部，１２０インループフィルタ部，２１２復号部，２１４逆直交変換部，２１６インループフィルタ部，２１９予測部

Claims

アフィン変換における動き補償で用いられる動きベクトルに基づいて、画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する識別情報を設定する設定部と、
前記設定部による設定に応じた大きさまたは形状の前記サブブロックに対して前記アフィン変換を適用する前記インター予測処理を行って前記画像を符号化し、前記識別情報を含むビットストリームを生成する符号化部と
を備える画像符号化装置。
前記設定部は、矩形形状の前記サブブロックについて、その矩形形状の長手方向をＸ方向およびＹ方向で切り替えて設定する
請求項１に記載の画像符号化装置。
前記設定部は、Ｘ方向ベクトル差分が、Ｙ方向ベクトル差分より小さい場合、矩形形状の前記サブブロックの長手方向をＸ方向として前記識別情報を設定する
請求項１に記載の画像符号化装置。
前記設定部は、前記Ｘ方向ベクトル差分が、前記Ｙ方向ベクトル差分より小さい場合、矩形形状の前記サブブロックのサイズを８×４として前記識別情報を設定する
請求項３に記載の画像符号化装置。
前記設定部は、Ｙ方向ベクトル差分が、Ｘ方向ベクトル差分より小さい場合、矩形形状の前記サブブロックの長手方向をＹ方向として前記識別情報を設定する
請求項１に記載の画像符号化装置。
前記設定部は、前記Ｙ方向ベクトル差分が、前記Ｘ方向ベクトル差分より小さい場合、矩形形状の前記サブブロックのサイズを４×８として前記識別情報を設定する
請求項５に記載の画像符号化装置。
前記設定部は、前記サブブロックの左上頂点、右上頂点、および左下頂点の動きベクトルを用いてＸ方向ベクトル差分およびＹ方向ベクトル差分を算出し、
前記Ｘ方向ベクトル差分の絶対値が、前記Ｙ方向ベクトル差分の絶対値より大きい場合、矩形形状の前記サブブロックの長手方向をＸ方向として前記識別情報を設定し、
前記Ｘ方向ベクトル差分の絶対値が、前記Ｙ方向ベクトル差分の絶対値以下である場合、矩形形状の前記サブブロックの長手方向をＹ方向として前記識別情報を設定する
請求項１に記載の画像符号化装置。
前記設定部は、前記インター予測処理における予測方向がBi-predictionである場合に、矩形形状の前記サブブロックを用いるように前記識別情報を設定する
請求項１に記載の画像符号化装置。
前記設定部は、Bi-predictionの前記インター予測処理における前方向予測および後方向予想のうちの、いずれか一方で用いる矩形形状の前記サブブロックの長手方向をＸ方向とし、他方で用いる矩形形状の前記サブブロックの長手方向をＹ方向として前記識別情報を設定する
請求項８に記載の画像符号化装置。
前記設定部は、
前記前方向予測で用いる前記サブブロックの左上頂点、右上頂点、および左下頂点の動きベクトルを用いて、前方向予測のＸ方向ベクトル差分および前方向予測のＹ方向ベクトル差分を算出し、
前記後方向予測で用いる前記サブブロックの左上頂点、右上頂点、および左下頂点の動きベクトルを用いて、後方向予測のＸ方向ベクトル差分および後方向予測のＹ方向ベクトル差分を算出して、
前記前方向予測のＸ方向ベクトル差分または前記後方向予測のＸ方向ベクトル差分が最も大きい場合、前記前方向予測で用いる矩形形状の前記サブブロックの長手方向をＹ方向とし、かつ、前記後方向予測で用いる矩形形状の前記サブブロックの長手方向をＸ方向として前記識別情報を設定し、
前方向予測のＹ方向ベクトル差分または前記後方向予測のＹ方向ベクトル差分が最も大きい場合、前記前方向予測で用いる矩形形状の前記サブブロックの長手方向をＸ方向とし、かつ、前記後方向予測で用いる矩形形状の前記サブブロックの長手方向をＹ方向として前記識別情報を設定する
請求項９に記載の画像符号化装置。
画像を符号化する画像符号化装置が、
アフィン変換における動き補償で用いられる動きベクトルに基づいて、前記画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する識別情報を設定することと、
その設定に応じた大きさまたは形状の前記サブブロックに対して前記アフィン変換を適用する前記インター予測処理を行って前記画像を符号化し、前記識別情報を含むビットストリームを生成することと
を含む画像符号化方法。
アフィン変換における動き補償で用いられる動きベクトルに基づいて設定される識別情報であって、画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する前記識別情報を含むビットストリームから、前記識別情報をパースするパース部と、
前記パース部によりパースされた前記識別情報に従った大きさまたは形状の前記サブブロックに対して前記アフィン変換を適用する前記インター予測処理を行って、前記ビットストリームを復号して前記画像を生成する復号部と
を備える画像復号装置。
画像を復号する画像復号装置が、
アフィン変換における動き補償で用いられる動きベクトルに基づいて設定される識別情報であって、前記画像に対するインター予測処理で用いられるサブブロックの大きさまたは形状を識別する前記識別情報を含むビットストリームから、前記識別情報をパースすることと、
そのパースされた前記識別情報に従った大きさまたは形状の前記サブブロックに対してアフィン変換を適用する前記インター予測処理を行って、前記ビットストリームを復号して前記画像を生成することと
を含む画像復号方法。