JP2018014744A

JP2018014744A - 画像処理装置および方法、プログラム、並びに記録媒体

Info

Publication number: JP2018014744A
Application number: JP2017173737A
Authority: JP
Inventors: 健治近藤; Kenji Kondo
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2012-01-19
Filing date: 2017-09-11
Publication date: 2018-01-25
Anticipated expiration: 2033-01-09
Also published as: US20140355677A1; JP6206743B2; US9894355B2; MX2014008483A; JP6586979B2; US20180131931A1; CN104041034B; CN104041034A; US10715798B2; JP5924553B2; JP2016178656A; EP2806641A4; EP2806641A1; WO2013108691A1; JP2020014225A; US20200296357A1; JPWO2013108691A1

Abstract

【課題】装置の高コスト化を防止する画像処理装置および方法、プログラム、並びに記録媒体を提供する。【解決手段】画像処理装置のエンコーダ１０００において、設定部は、画像のブロックのサイズ、及び、そのサイズのブロックに適用する予測方法を制限する制限情報を設定する。インター予測部は、制限情報に従って、予測画像を生成する。エンコーダ１０００は、ブロックを、予測画像を用いて符号化し、符号化ストリームを生成し、符号化ストリームと制限情報とを伝送する。【選択図】図１６

Description

本技術は、画像処理装置および方法、プログラム、並びに記録媒体に関し、特に、例えば、装置の高コスト化を防止することができるようにした画像処理装置および方法、プログラム、並びに記録媒体に関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEG（Moving Picture Experts Group）などの方式に準拠した装置が、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。

特に、MPEG2（ISO（International Organization for Standardization）/IEC（International Electrotechnical Commission） 13818-2）は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば７２０×４８０画素を持つ標準解像度の飛び越し走査画像であれば４〜８Ｍｂｐｓ、１９２０×１０８８画素を持つ高解像度の飛び越し走査画像であれば１８〜２２Ｍｂｐｓの符号量（ビットレート）を割り当てることで、高い圧縮率と良好な画質の実現が可能である。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、１９９８年１２月にISO/IEC 14496-2としてその規格が国際標準に承認された。

更に、近年、当初テレビ会議用の画像符号化を目的として、H.26L（ITU-T（International Telecommunication Union Telecommunication Standardization Sector）Q6/16 VCEG（Video Coding Expert Group））という標準の規格化が進んでいる。H.26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.26Lをベースに、H.26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われている。

標準化のスケジュールとしては、２００３年３月にはH.264及びMPEG-4 Part10（Advanced Video Coding、以下AVCと記す）という名の元に国際標準となった。

しかしながら、マクロブロックサイズを１６画素×１６画素とするのは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；4000画素×2000画素）といった大きな画枠に対しては、最適ではない恐れがあった。

そこで、現在、AVCより更なる符号化効率の向上を目的として、ITU-Tと、ISO/IECの共同の標準化団体であるJCTVC（Joint Collaboration Team - Video Coding）により、HEVC（High Efficiency Video Coding）と呼ばれる符号化方式の標準化が進められている（例えば、非特許文献１参照）。

このHEVC符号化方式においては、AVCにおけるマクロブロックと同様の処理単位としてコーディングユニット（CU（Coding Unit））が定義されている。このCUは、AVCのマクロブロックのようにサイズが16×16画素に固定されず、それぞれのシーケンスにおいて、画像圧縮情報中において指定される。

ところで、AVCにおけるメディアン予測を用いた動きベクトルの符号化を改善するため、AVCにおいて定義されている、メディアン予測により求められる”Spatial Predictor”に加え、”Temporal Predictor”及び”Spatio-Temporal Predictor”のどれかを、予測動きベクトル情報として、適応的に用いることが提案されている（例えば、非特許文献２参照）。

画像情報符号化装置においては、それぞれのブロックに関して、それぞれの予測動きベクトル情報を用いた場合のコスト関数が算出され、最適な予測動きベクトル情報の選択が行われる。画像圧縮情報においては、それぞれのブロックに対し、どの予測動きベクトル情報が用いられたかに関する情報を示すフラグ情報が伝送される。

また、動き情報の符号化方式の１つとして、Motion Partition Mergingと呼ばれる手法（以下、マージモード（merge mode）とも称する）が提案されている（例えば、非特許文献３参照）。この手法においては、当該ブロックの動き情報が周辺のブロックの動き情報と同一である場合、フラグ情報のみが伝送され、復号の際には、その周辺ブロックの動き情報を用いて当該ブロックの動き情報が再構築される。

"Test Model under Consideration",JCTVC-B205,Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG112nd Meeting:Geneva,CH,21-28 July, 2010 Joel Jung,Guillaume Laroche,"Competition-Based Scheme for Motion Vector Selection and Coding", VCEG-AC06,ITU - Telecommunications Standardization SectorSTUDY GROUP 16 Question 6Video Coding Experts Group (VCEG)29th Meeting: Klagenfurt, Austria, 17-18 July, 2006 Martin Winken, Sebastian Bosse, Benjamin Bross, Philipp Helle, Tobias Hinz, Heiner Kirchhoffer, Haricharan Lakshman, Detlev Marpe, Simon Oudin, Matthias Preiss, Heiko Schwarz, Mischa Siekmann, Karsten Suehring, and Thomas Wiegand，"Description of video coding technology proposed by Fraunhofer HHI"，JCTVC-A116,April,2010

AVCやHEVC等では、予測画像を生成し、その予測画像を用いて、画像を符号化する予測符号化が行われる。

予測符号化では、予測画像の生成に、先に（符号化されて）復号された復号画像を用いるため、復号画像が、必要に応じて、DPB(Decode Picture Buffer)等と呼ばれるメモリに記憶される。DPBに記憶された復号画像は、予測画像を生成するときに、参照画像として、DPBから読み出される。

ところで、DPBから復号画像が読み出される伝送レートであるメモリ帯域として、大きな帯域（高レート）を確保しようとすると、装置が高コスト化する。

本技術は、このような状況に鑑みてなされたものであり、装置の高コスト化を防止することができるようにするものである。

本技術の第１の側面の画像処理装置は、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定部と、前記設定部により設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化部とを備え、前記設定部は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する画像処理装置である。

本技術の第１の側面の画像処理方法は、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定ステップと、前記設定ステップにより設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化ステップとを含み、前記設定ステップの処理は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する画像処理方法である。

以上のような第１の側面においては、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、プレディクションユニットのサイズ、及び、プレディクションユニットのサイズのブロックに適用する予測方法を制限する制限情報が設定され、前記制限情報に従って、予測画像が生成され、前記予測画像を用いて符号化され、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報が設定される。

本技術の第２の側面の画像処理装置は、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を含む符号化ストリームを受け取る受け取り部と、前記受け取り部により受け取られた制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取り部により受け取られた前記符号化ストリームを復号する復号部とを備え、前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される画像処理装置である。

本技術の第２の側面の画像処理方法は、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報と、前記画像を符号化することにより生成された符号化ストリームを受け取る受け取りステップと、前記受け取りステップにより受け取られた制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取りステップにより受け取られた符号化ストリームを復号する復号ステップとを含み、前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される画像処理方法である。

以上のような第２の側面においては、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報と、前記画像を符号化することにより生成された符号化ストリームが受け取られ、前記制限情報に従って、予測画像が生成され、前記予測画像を用いて、前記符号化ストリームが復号され、前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される。

本技術の第３の側面の画像処理装置は、プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定部と、前記設定部により設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化部とを備え、前記設定部は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する画像処理装置である。

本技術の第３の側面の画像処理方法は、プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定ステップと、前記設定ステップにより設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化ステップとを含み、前記設定ステップの処理は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する画像処理方法である。

以上のような第３の側面においては、プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報が設定され、設定された制限情報に従って、予測画像が生成され、前記画像が、前記予測画像を用いて符号化されて、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報が設定される。

本技術の第４の側面の画像処理装置は、プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報に従って符号化された符号化ストリームを受け取る受け取り部と、前記プロファイル又はレベルに基づいて認識される前記制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取り部により受け取られた符号化ストリームを復号する復号部とを備え、前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される画像処理装置である。

本技術の第４の側面の画像処理方法は、プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報に従って符号化された符号化ストリームを受け取る受け取りステップと、前記プロファイル又はレベルに基づいて認識される前記制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取りステップにより受け取られた符号化ストリームを復号する復号ステップとを含み、前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される画像処理方法である。

以上のような第４の側面においては、プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報に従って符号化された符号化ストリームが受け取られ、前記プロファイル又はレベルに基づいて認識される前記制限情報に従って、予測画像が生成され、前記予測画像が用いられて、前記符号化ストリームが復号され、前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される。

本技術によれば、装置の高コスト化を防止することができる。

画像符号化装置の主な構成例を示すブロック図である。コーディングユニットを説明する図である。スライスとコーディングユニットの関係を説明する図である。マージモードを説明する図である。可逆符号化部と符号化制御部の主な構成例を示すブロック図である。符号化処理の流れの例を説明するフローチャートである。可逆符号化処理の流れの例を説明するフローチャートである。 CU符号化処理の流れの例を説明するフローチャートである。 CU符号化処理の流れの例を説明する、図８に続くフローチャートである。画像復号装置の主な構成例を示すブロック図である。可逆復号部および復号制御部の主な構成例を示すブロック図である。復号処理の流れの例を説明するフローチャートである。可逆復号処理の流れの例を説明するフローチャートである。 CU復号処理の流れの例を説明するフローチャートである。 CU復号処理の流れの例を説明する、図１４に続くフローチャートである。本技術を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。 disable_bip_small_mrg_idc情報を説明する図である。 disable_bip_small_mrg_idc情報を用いる場合のエンコーダ１０００及びデコーダ２０００の処理を説明するフローチャートである。 disable_bip_small_mrg_idc拡張情報を説明する図である。 modify_bip_small_mrg_l0情報を説明する図である。エンコーダ１０００によるSPSの符号化、及び、デコーダ２０００によるSPSの復号を説明するフローチャートである。エンコーダ１０００によるスライスヘッダの符号化、及び、デコーダ２０００によるスライスヘッダの復号を説明するフローチャートである。エンコーダ１０００によるCUの符号化、及び、デコーダ２０００によるCUの復号を説明するフローチャートである。マージ候補の選出（選択）を説明するフローチャートである。制限モードRBを説明する図である。制限モードRBを用いる場合のエンコーダ１０００及びデコーダ２０００の処理を説明するフローチャートである。縦長のブロックの予測の方が、横長のブロックの予測よりも、メモリ帯域を多く消費することを説明する図である。縦長のブロックの予測の方が、横長のブロックの予測よりも、メモリ帯域を多く消費することを説明する図である。制限モードRVを説明する図である。識別情報を含む、符号化データのヘッダ情報のシンタクスの第１の例を示す図である。フラグdisable_bip_small_mrg_idcがとる値と、各値のフラグdisable_bip_small_mrg_idcによって両方向予測が禁止されるブロックのサイズとを示す図である。識別情報を含む、符号化データのヘッダ情報のシンタクスの第２の例を示す図である。識別情報を含む、符号化データのヘッダ情報のシンタクスの第２の例を示す図である。パーソナルコンピュータの主な構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。多視点画像符号化方式の例を示す図である。本技術を適用した多視点画像符号化装置の主な構成例を示す図である。本技術を適用した多視点画像復号装置の主な構成例を示す図である。階層画像符号化方式の例を示す図である。本技術を適用した階層画像符号化装置の主な構成例を示す図である。本技術を適用した階層画像復号装置の主な構成例を示す図である。スケーラブル符号化利用の一例を示すブロック図である。スケーラブル符号化利用の他の例を示すブロック図である。スケーラブル符号化利用のさらに他の例を示すブロック図である。

以下、本技術の実施の形態について説明するが、その前に、基本となる技術について説明する。

［画像符号化装置］
図１は、画像符号化装置の主な構成例を示すブロック図である。

図１に示される画像符号化装置１００は、H．264及びMPEG（Moving Picture Experts Group）4 Part10（AVC（Advanced Video Coding））符号化方式のように、予測処理を用いて画像データを符号化する。

図１に示されるように画像符号化装置１００は、A/D変換部１０１、画面並べ替えバッファ１０２、演算部１０３、直交変換部１０４、量子化部１０５、可逆符号化部１０６、および蓄積バッファ１０７を有する。また、画像符号化装置１００は、逆量子化部１０８、逆直交変換部１０９、演算部１１０、ループフィルタ１１１、フレームメモリ１１２、選択部１１３、イントラ予測部１１４、動き予測・補償部１１５、予測画像選択部１１６、およびレート制御部１１７を有する。

画像符号化装置１００は、さらに、符号化制御部１２１を有する。

A/D変換部１０１は、入力された画像データをA/D変換し、変換後の画像データ（デジタルデータ）を、画面並べ替えバッファ１０２に供給し、記憶させる。画面並べ替えバッファ１０２は、記憶した表示の順番のフレームの画像を、GOP（Group Of Picture）に応じて、符号化のためのフレームの順番に並べ替え、フレームの順番を並び替えた画像を、演算部１０３に供給する。また、画面並べ替えバッファ１０２は、フレームの順番を並び替えた画像を、イントラ予測部１１４および動き予測・補償部１１５にも供給する。

演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、予測画像選択部１１６を介してイントラ予測部１１４若しくは動き予測・補償部１１５から供給される予測画像を減算し、その差分情報を直交変換部１０４に出力する。

例えば、インター符号化が行われる画像の場合、演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、動き予測・補償部１１５から供給される予測画像を減算する。

直交変換部１０４は、演算部１０３から供給される差分情報に対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。なお、この直交変換の方法は任意である。直交変換部１０４は、直交変換によって得られる変換係数を量子化部１０５に供給する。

量子化部１０５は、直交変換部１０４から供給される変換係数を量子化する。量子化部１０５は、レート制御部１１７から供給される符号量の目標値に関する情報に基づいて量子化パラメータを設定し、その量子化を行う。なお、この量子化の方法は任意である。量子化部１０５は、量子化された変換係数を可逆符号化部１０６に供給する。

可逆符号化部１０６は、量子化部１０５において量子化された変換係数を任意の符号化方式で符号化する。変換係数は、レート制御部１１７の制御の下で量子化されているので、この符号量は、レート制御部１１７が設定した目標値となる（若しくは目標値に近似する）。

また、可逆符号化部１０６は、イントラ予測のモードを示す情報などをイントラ予測部１１４から取得し、インター予測のモードを示す情報や動きベクトル情報などを動き予測・補償部１１５から取得する。さらに、可逆符号化部１０６は、ループフィルタ１１１において使用されたフィルタ係数等を取得する。

可逆符号化部１０６は、これらの各種情報を任意の符号化方式で符号化し、符号化データのヘッダ情報の一部とする（多重化する）。可逆符号化部１０６は、符号化して得られた符号化データを蓄積バッファ１０７に供給して蓄積させる。

可逆符号化部１０６の符号化方式としては、例えば、可変長符号化または算術符号化等が挙げられる。可変長符号化としては、例えば、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などが挙げられる。算術符号化としては、例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）などが挙げられる。

蓄積バッファ１０７は、可逆符号化部１０６から供給された符号化データを、一時的に保持する。蓄積バッファ１０７は、所定のタイミングにおいて、保持している符号化データを、例えば、後段の図示せぬ記録装置（記録媒体）や伝送路などに出力する。

また、量子化部１０５において量子化された変換係数は、逆量子化部１０８にも供給される。逆量子化部１０８は、その量子化された変換係数を、量子化部１０５による量子化に対応する方法で逆量子化する。この逆量子化の方法は、量子化部１０５による量子化処理に対応する方法であればどのような方法であってもよい。逆量子化部１０８は、得られた変換係数を、逆直交変換部１０９に供給する。

逆直交変換部１０９は、逆量子化部１０８から供給された変換係数を、直交変換部１０４による直交変換処理に対応する方法で逆直交変換する。この逆直交変換の方法は、直交変換部１０４による直交変換処理に対応する方法であればどのようなものであってもよい。逆直交変換された出力（復元された差分情報）は、演算部１１０に供給される。

演算部１１０は、逆直交変換部１０９から供給された逆直交変換結果、すなわち、復元された差分情報に、予測画像選択部１１６を介してイントラ予測部１１４若しくは動き予測・補償部１１５から供給される予測画像を加算し、局部的に復号された画像（復号画像）を得る。その復号画像は、ループフィルタ１１１またはフレームメモリ１１２に供給される。

ループフィルタ１１１は、デブロックフィルタや適応ループフィルタ等を含み、演算部１１０から供給される復号画像に対して適宜フィルタ処理を行う。例えば、ループフィルタ１１１は、復号画像に対してデブロックフィルタ処理を行うことにより復号画像のブロック歪を除去する。また、例えば、ループフィルタ１１１は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた復号画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。

なお、ループフィルタ１１１が、復号画像に対して任意のフィルタ処理を行うようにしてもよい。また、ループフィルタ１１１は、必要に応じて、フィルタ処理に用いたフィルタ係数等の情報を可逆符号化部１０６に供給し、それを符号化させるようにすることもできる。

ループフィルタ１１１は、フィルタ処理結果（フィルタ処理後の復号画像）をフレームメモリ１１２に供給する。なお、上述したように、演算部１１０から出力される復号画像は、ループフィルタ１１１を介さずにフレームメモリ１１２に供給することができる。つまり、ループフィルタ１１１によるフィルタ処理は省略することができる。

フレームメモリ１１２は、供給される復号画像を記憶し、所定のタイミングにおいて、記憶している復号画像を参照画像として、選択部１１３に供給する。

選択部１１３は、フレームメモリ１１２から供給される参照画像の供給先を選択する。例えば、インター予測の場合、選択部１１３は、フレームメモリ１１２から供給される参照画像を動き予測・補償部１１５に供給する。

イントラ予測部１１４は、選択部１１３を介してフレームメモリ１１２から供給される参照画像である処理対象ピクチャ内の画素値を用いて、基本的にプレディクションユニット（PU）を処理単位として予測画像を生成するイントラ予測（画面内予測）を行う。イントラ予測部１１４は、予め用意された複数のモード（イントラ予測モード）でこのイントラ予測を行う。

イントラ予測部１１４は、候補となる全てのイントラ予測モードで予測画像を生成し、画面並べ替えバッファ１０２から供給される入力画像を用いて各予測画像のコスト関数値を評価し、最適なモードを選択する。イントラ予測部１１４は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１１６に供給する。

また、上述したように、イントラ予測部１１４は、採用されたイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部１０６に供給し、符号化させる。

動き予測・補償部１１５は、画面並べ替えバッファ１０２から供給される入力画像と、選択部１１３を介してフレームメモリ１１２から供給される参照画像とを用いて、基本的にPUを処理単位として、動き予測（インター予測）を行い、検出された動きベクトルに応じて動き補償処理を行い、予測画像（インター予測画像情報）を生成する。動き予測・補償部１１５は、予め用意された複数のモード（インター予測モード）でこのようなインター予測を行う。

動き予測・補償部１１５は、候補となる全てのインター予測モードで予測画像を生成し、各予測画像のコスト関数値を評価し、最適なモードを選択する。動き予測・補償部１１５は、最適なインター予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１１６に供給する。

また、動き予測・補償部１１５は、採用されたインター予測モードを示す情報や、符号化データを復号する際に、そのインター予測モードで処理を行うために必要な情報等を可逆符号化部１０６に供給し、符号化させる。

予測画像選択部１１６は、演算部１０３や演算部１１０に供給する予測画像の供給元を選択する。例えば、インター符号化の場合、予測画像選択部１１６は、予測画像の供給元として動き予測・補償部１１５を選択し、その動き予測・補償部１１５から供給される予測画像を演算部１０３や演算部１１０に供給する。

レート制御部１１７は、蓄積バッファ１０７に蓄積された符号化データの符号量に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

符号化制御部１２１は、可逆符号化部１０６の符号化処理を制御する。その際、符号化制御部１２１は、マージモードで符号化を行うか否かの判定を行う。

また、符号化制御部１２１は、例えば、スキップモード、イントラ予測モード、インター予測モード、およびダイレクトモード等、マージモード以外のモードについても符号化処理の制御を行う。

可逆符号化部１０６は、符号化制御部１２１により選択されたモードで可逆符号化処理を行う。

［コーディングユニット］
ところで、AVC符号化方式においては、マクロブロックやそのマクロブロックを複数に分割したサブマクロブロックを予測処理や符号化処理等の処理単位としていた。しかしながら、マクロブロックサイズを１６画素×１６画素とするのは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；４０００画素×２０００画素）といった大きな画枠に対しては、最適ではない。

そこで、現在、AVCより更なる符号化効率の向上を目的として、ITU-T（International Telecommunication Union Telecommunication Standardization Sector）と、ISO（International Organization for Standardization）/IEC（International Electrotechnical Commission）の共同の標準化団体であるJCTVC（Joint Collaboration Team - Video Coding）により、HEVC（High Efficiency Video Coding）と呼ばれる符号化方式の標準化が進められている。

AVCにおいては、マクロブロックとサブマクロブロックによる階層構造が規定されているが、HEVCにおいては、図２に示されるように、コーディングユニット（CU（Coding Unit））が規定されている。

CUは、Coding Tree Block（CTB）とも呼ばれ、AVCにおけるマクロブロックと同様の役割を果たす、ピクチャ単位の画像の部分領域である。後者は、１６×１６画素の大きさに固定されているのに対し、前者の大きさは固定されておらず、それぞれのシーケンスにおいて、画像圧縮情報中において指定されることになる。

例えば、出力となる符号化データに含まれるシーケンスパラメータセット（SPS（Sequence Parameter Set））において、CUの最大サイズ（LCU（Largest Coding Unit））と最小サイズ（SCU（Smallest Coding Unit））が規定される。

それぞれのLCU内においては、SCUのサイズを下回らない範囲で、split-flag=1とすることにより、より小さなサイズのCUに分割することができる。図２の例では、LCUの大きさが１２８であり、最大階層深度が５となる。２Ｎ×２Ｎの大きさのCUは、split_flagの値が「１」である時、１つ下の階層となる、Ｎ×Ｎの大きさのCUに分割される。

更に、図３に示すように、CUは、イントラ若しくはインター予測の処理単位となる領域（ピクチャ単位の画像の部分領域）であるプレディクションユニット（Prediction Unit（PU））に分割され、また、直交変換の処理単位となる領域（ピクチャ単位の画像の部分領域）である、トランスフォームユニット（Transform Unit（TU））に分割される。現在、HEVCにおいては、４×４及び８×８に加え、１６×１６及び３２×３２直交変換を用いることが可能である。

以上のHEVCのように、CUを定義し、そのCUを単位として各種処理を行うような符号化方式の場合、AVCにおけるマクロブロックはLCUに相当すると考えることができる。ただし、CUは図２に示されるように階層構造を有するので、その最上位階層のLCUのサイズは、例えば128×128画素のように、AVCのマクロブロックより大きく設定されることが一般的である。

マクロブロックの代わりに、このようなCU、PU、およびTU等を用いる符号化方式にも、本技術を適用することができる。すなわち、予測処理を行う処理単位は任意の領域であってもよい。つまり、以下において、予測処理の処理対象の領域（当該領域や注目領域とも称する）や、その当該領域の周辺に位置する領域である周辺領域には、このようなマクロブロックやサブマクロブロックだけでなく、CU、PU、およびTU等が含まれる。

［動きパーティションのマージ］
ところで、動き情報の符号化方式の１つとして、図４に示されるような、Motion Partition Mergingと呼ばれる手法（マージモード）が提案されている。この手法においては、Merge_Flagと、Merge_Left_Flagという、２つのflagが、マージモードに関する情報であるマージ情報として伝送される。

Merge_Flag=1は、当該領域Ｘの動き情報が、当該領域の上に隣接する周辺領域Ｔ、若しくは、当該領域の左に隣接する周辺領域Ｌの動き情報と同一であることを示す。この時、マージ情報には、Merge_Left_Flagが含められ、伝送される。Merge_Flag=0は、当該領域Ｘの動き情報が、周辺領域Ｔおよび周辺領域Ｌのいずれの動き情報とも異なることを示す。この場合、当該領域Ｘの動き情報が伝送される。

当該領域Ｘの動き情報が、周辺領域Ｌの動き情報と同一である場合、Merge_Flag=1、かつ、Merge_Left_Flag=1となる。当該領域Ｘの動き情報が、周辺領域Ｔの動き情報と同一である場合、Merge_Flag=1、かつ、Merge_Left_Flag=0となる。

［可逆符号化部および符号化制御部］
図５は、可逆符号化部１０６および符号化制御部１２１の主な構成例を示すブロック図である。

図５に示されるように、可逆符号化部１０６は、NAL（Network Abstraction Layer）符号化部１３１およびCUデータ符号化部１３２を有する。

NAL符号化部１３１は、シーケンスパラメータセット（SPS（Sequence Parameter Set））、ピクチャパラメータセット（PPS（Picture Parameter Set））、およびスライスヘッダ等のNALのデータを符号化する。CUデータ符号化部１３２は、CU以下の階層のデータ（VCL（Video Coding Layer））を符号化する。

CUデータ符号化部１３２は、スキップフラグ符号化部１４１、スキップモード符号化部１４２、マージフラグ符号化部１４３、およびマージモード符号化部１４４を有する。また、CUデータ符号化部１３２は、PredMode符号化部１４５、イントラ符号化部１４６、インター符号化部１４７、および、ダイレクトモード符号化部１４８を有する。

スキップフラグ符号化部１４１は、符号化制御部１２１の制御に従って、スキップモードを採用するか否かを示すスキップフラグを生成し、符号化する。スキップモード符号化部１４２は、符号化制御部１２１の制御に従って、スキップモードでの符号化処理を行う。

マージフラグ符号化部１４３は、符号化制御部１２１の制御に従って、マージモードを採用するか否かを示すマージフラグ（MergeFlag）を生成し、符号化する。マージモード符号化部１４４は、符号化制御部１２１の制御に従って、マージモードでの符号化処理を行う。

PredMode符号化部１４５は、符号化制御部１２１の制御に従って、予測モードを示すパラメータであるPredModeを符号化する。イントラ符号化部１４６は、符号化制御部１２１の制御に従って、イントラ予測を用いて生成された差分画像の符号化に関する処理を行う。インター符号化部１４７は、符号化制御部１２１の制御に従って、インター予測を用いて生成された差分画像の符号化に関する処理を行う。ダイレクトモード符号化部１４８は、符号化制御部１２１の制御に従って、ダイレクトモードを用いて生成された差分画像の符号化に関する処理を行う。

［符号化処理の流れ］
次に、以上のような画像符号化装置１００により実行される各処理の流れについて説明する。最初に、図６のフローチャートを参照して、符号化処理の流れの例を説明する。

ステップＳ１０１において、A/D変換部１０１は入力された画像をA/D変換する。ステップＳ１０２において、画面並べ替えバッファ１０２は、A/D変換された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

ステップＳ１０３において、イントラ予測部１１４は、イントラ予測モードのイントラ予測処理を行う。ステップＳ１０４において、動き予測・補償部１１５は、インター予測モードでの動き予測や動き補償を行うインター動き予測処理を行う。

ステップＳ１０５において、予測画像選択部１１６は、イントラ予測部１１４および動き予測・補償部１１５から出力された各コスト関数値に基づいて、最適なモードを決定する。つまり、予測画像選択部１１６は、イントラ予測部１１４により生成された予測画像と、動き予測・補償部１１５により生成された予測画像のいずれか一方を選択する。

ステップＳ１０６において、演算部１０３は、ステップＳ１０２の処理により並び替えられた画像と、ステップＳ１０５の処理により選択された予測画像との差分を演算する。差分データは元の画像データに較べてデータ量が低減される。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ１０７において、直交変換部１０４は、ステップＳ１０６の処理により生成された差分情報を直交変換する。具体的には、離散コサイン変換、カルーネン・レーベ変換等の直交変換が行われ、変換係数が出力される。

ステップＳ１０８において、量子化部１０５は、ステップＳ１０７の処理により得られた変換係数を量子化する。

ステップＳ１０８の処理により量子化された差分情報は、次のようにして局部的に復号される。すなわち、ステップＳ１０９において、逆量子化部１０８は、ステップＳ１０８の処理により生成された量子化された変換係数（量子化係数とも称する）を量子化部１０５の特性に対応する特性で逆量子化する。ステップＳ１１０において、逆直交変換部１０９は、ステップＳ１０７の処理により得られた変換係数を、直交変換部１０４の特性に対応する特性で逆直交変換することにより、差分情報を局部的に復号して、演算部１１０に供給する。

ステップＳ１１１において、演算部１１０は、予測画像を局部的に復号された差分情報に加算し、局部的に復号された画像（演算部１０３への入力に対応する画像）を生成する。ステップＳ１１２においてループフィルタ１１１は、ステップＳ１１１の処理により得られた局部的な復号画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜行う。

ステップＳ１１３において、フレームメモリ１１２は、ステップＳ１１２の処理によりループフィルタ処理が施された復号画像を記憶する。なお、フレームメモリ１１２にはループフィルタ１１１によりフィルタ処理されていない画像も演算部１１０から供給され、記憶される。

ステップＳ１１４において、可逆符号化部１０６は、ステップＳ１０８の処理により量子化された変換係数（量子化係数）を符号化する。すなわち、差分画像に対して、可変長符号化や算術符号化等の可逆符号化が行われる。

なお、可逆符号化部１０６は、ステップＳ１０８において算出された量子化パラメータを符号化し、符号化データに付加する（含める）。また、可逆符号化部１０６は、ステップＳ１０５の処理により選択された予測画像の予測モードに関する情報を符号化し、差分画像を符号化して得られる符号化データに付加する。つまり、可逆符号化部１０６は、イントラ予測部１１４から供給される最適イントラ予測モード情報、または、動き予測・補償部１１５から供給される最適インター予測モードに応じた情報なども符号化し、符号化データに付加する。

ステップＳ１１５において蓄積バッファ１０７は、ステップＳ１１４の処理により得られた符号化データを蓄積する。蓄積バッファ１０７に蓄積された符号化データは、適宜読み出され、伝送路や記録媒体を介して復号側に伝送される。

ステップＳ１１６においてレート制御部１１７は、ステップＳ１１５の処理により蓄積バッファ１０７に蓄積された符号化データの符号量（発生符号量）に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

ステップＳ１１６の処理が終了すると、符号化処理が終了される。

なお、ステップＳ１１４において、可逆符号化部１０６は、符号化制御部１２１の制御に従って符号化処理を行う。

［可逆符号化処理の流れ］
次に、図７のフローチャートを参照して、図６のステップＳ１１４において実行される可逆符号化処理の流れの例を説明する。図７に示されるように、可逆符号化処理は、画像の階層毎に行われる。

つまり、NAL符号化部１３１は、ステップＳ１２１において、SPSを生成して符号化し、ステップＳ１２２において、PPSを生成して符号化し、ステップＳ１２３においてスライスヘッダを生成して符号化する。ステップＳ１２４において、CUデータ符号化部１３２は、処理対象である当該CUを符号化する。

CUデータ符号化部１３２は、このステップＳ１２４の処理を、処理対象である当該スライス内の全てCUについて繰り返す。ステップＳ１２５において、当該スライス内に未処理のCUが存在しないと判定された場合、CUデータ符号化部１３２は、処理をステップＳ１２６に進める。

NAL符号化部１３１は、このステップＳ１２３乃至ステップＳ１２５の処理を、処理対象である当該ピクチャ内の全てのスライスについて繰り返す。ステップＳ１２６において、当該ピクチャ内に未処理のスライスが存在しないと判定された場合、NAL符号化部１３１は、処理をステップＳ１２７に進める。

NAL符号化部１３１は、このステップＳ１２２乃至ステップＳ１２６の処理を、処理対象である当該シーケンス内の全てのピクチャについて繰り返す。ステップＳ１２７において、当該シーケンス内に未処理のピクチャが存在しないと判定された場合、NAL符号化部１３１は、可逆符号化処理を終了し、処理を図６に戻す。

［CU符号化処理の流れ］
次に、図８および図９のフローチャートを参照して、図７のステップＳ１２４において実行されるCU符号化処理の流れの例を説明する。

CU符号化処理が開始されると、符号化制御部１２１は、ステップＳ１３１において、NAL符号化部１３１により生成されたNALデータから、当該スライスのタイプを判定し、当該スライスがＩスライスであるか否かを判定する。当該スライスがＩスライスでない（Ｐスライス若しくはＢスライスである）場合のみ、スキップフラグ符号化部１４１は、ステップＳ１３２において、スキップフラグを生成し、符号化する。

ステップＳ１３３において、符号化制御部１２１が、スキップフラグの値が１であると判定した場合、符号化制御部１２１からその判定結果を取得したスキップモード符号化部１４２は、ステップＳ１３４において、スキップモードでCUデータを符号化する。符号化が終了すると、CU符号化処理が終了され、処理が図７に戻される。

また、図８のステップＳ１３３において、符号化制御部１２１が、スキップフラグの値が０である、若しくは、スキップフラグが存在しないと判定した場合、符号化制御部１２１は、処理をステップＳ１３５に進める。この場合、スキップモードでの符号化は行われない。

マージフラグ符号化部１４３は、ステップＳ１３５において、マージフラグを生成し、符号化する。

ステップＳ１３６において、符号化制御部１２１がマージフラグの値が１であると判定した場合、符号化制御部１２１からその判定結果を取得したマージモード符号化部１４４は、ステップＳ１３７において、マージモードでCUデータを符号化する。符号化が終了すると、CU符号化処理が終了され、処理が図７に戻される。

また、図８のステップＳ１３６において、符号化制御部１２１が、マージフラグの値が０である、若しくは、マージフラグが存在しないと判定した場合、処理は図９のフローチャートに進み、採用された予測モードに応じた符号化が行われる。

すなわち、図９のステップＳ１４１において符号化制御部１２１が処理対象である当該スライスがＩスライスでないと判定した場合のみ、PredMode符号化部１４５が、ステップＳ１４２において、当該スライスの予測モードのタイプを示すパラメータであるpred_modeを生成し、符号化する。

ステップＳ１４３において、符号化制御部１２１が、PredModeを参照し、当該領域の予測モードがイントラ予測モードであると判定した場合、イントラ符号化部１４６は、ステップＳ１４４において、イントラ予測モードのCUデータを符号化する。つまり、差分画像情報（量子化係数）やイントラ予測モードに関する情報等が符号化される。符号化が終了すると、CU符号化処理が終了され、処理が図７に戻される。

また、符号化制御部１２１が、当該領域の予測モードがイントラ予測モードでなく、インター予測モードであると判定した場合（ステップＳ１４３およびステップＳ１４５）、インター符号化部１４７は、ステップＳ１４６において、インター予測モードのCUデータを符号化する。つまり、差分画像情報（量子化係数）やインター予測モードに関する情報等が符号化される。符号化が終了すると、CU符号化処理が終了され、処理が図７に戻される。

さらに、符号化制御部１２１が、当該領域の予測モードがイントラ予測モードでなく、インター予測モードでもないと判定した場合（ステップＳ１４３およびステップＳ１４５）、ダイレクトモード符号化部１４８は、ステップＳ１４７において、ダイレクト予測モードのCUデータを符号化する。符号化が終了すると、CU符号化処理が終了され、処理が図７に戻される。

［画像復号装置］
図１０は、画像復号装置の主な構成例を示すブロック図である。図１０に示される画像復号装置２００は、画像符号化装置１００が生成した符号化データを、その符号化方法に対応する復号方法で復号する。なお、画像復号装置２００は、画像符号化装置１００と同様に、任意の領域毎に（例えば、プレディクションユニット（PU）等）予測処理を行うものとする。

図１０に示されるように画像復号装置２００は、蓄積バッファ２０１、可逆復号部２０２、逆量子化部２０３、逆直交変換部２０４、演算部２０５、ループフィルタ２０６、画面並べ替えバッファ２０７、およびD/A変換部２０８を有する。また、画像復号装置２００は、フレームメモリ２０９、選択部２１０、イントラ予測部２１１、動き予測・補償部２１２、および選択部２１３を有する。

さらに、画像復号装置２００は、復号制御部２２１を有する。

蓄積バッファ２０１は伝送されてきた符号化データを蓄積し、所定のタイミングにおいてその符号化データを可逆復号部２０２に供給する。可逆復号部２０２は、蓄積バッファ２０１より供給された、図１の可逆符号化部１０６により符号化された情報を、可逆符号化部１０６の符号化方式に対応する方式で復号する。可逆復号部２０２は、復号して得られた差分画像の量子化係数を、逆量子化部２０３に供給する。

また、可逆復号部２０２は、最適な予測モードにイントラ予測モードが選択されたかインター予測モードが選択されたかを判定し、その最適な予測モードに関する情報を、イントラ予測部２１１および動き予測・補償部２１２の内、選択されたと判定したモードの方に供給する。つまり、例えば、画像符号化装置１００において最適な予測モードとしてインター予測モードが選択された場合、その最適な予測モードに関する情報が動き予測・補償部２１２に供給される。

逆量子化部２０３は、可逆復号部２０２により復号されて得られた量子化係数を、図１の量子化部１０５の量子化方式に対応する方式で逆量子化し、得られた変換係数を逆直交変換部２０４に供給する。

逆直交変換部２０４は、図１の直交変換部１０４の直交変換方式に対応する方式で逆量子化部２０３から供給される変換係数を逆直交変換する。逆直交変換部２０４は、この逆直交変換処理により、画像符号化装置１００において直交変換される前の残差データに対応する復号残差データ（画像符号化装置１００の逆直交変換部１０９が出力する局部的に復号された差分情報と同一のデータ）を得る。

逆直交変換されて得られた復号残差データは、演算部２０５に供給される。また、演算部２０５には、選択部２１３を介して、イントラ予測部２１１若しくは動き予測・補償部２１２から予測画像が供給される。

演算部２０５は、その復号残差データと予測画像とを加算し、画像符号化装置１００の演算部１０３により予測画像が減算される前の画像データに対応する復号画像データを得る。演算部２０５は、その復号画像データをループフィルタ２０６に供給する。

ループフィルタ２０６は、供給された復号画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜施し、それを画面並べ替えバッファ２０７に供給する。

ループフィルタ２０６は、デブロックフィルタや適応ループフィルタ等を含み、演算部２０５から供給される復号画像に対して適宜フィルタ処理を行う。例えば、ループフィルタ２０６は、復号画像に対してデブロックフィルタ処理を行うことにより復号画像のブロック歪を除去する。また、例えば、ループフィルタ２０６は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた復号画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。

なお、ループフィルタ２０６が、復号画像に対して任意のフィルタ処理を行うようにしてもよい。また、ループフィルタ２０６が、図１の画像符号化装置１００から供給されたフィルタ係数を用いてフィルタ処理を行うようにしてもよい。

ループフィルタ２０６は、フィルタ処理結果（フィルタ処理後の復号画像）を画面並べ替えバッファ２０７およびフレームメモリ２０９に供給する。なお、演算部２０５から出力される復号画像は、ループフィルタ２０６を介さずに画面並べ替えバッファ２０７やフレームメモリ２０９に供給することができる。つまり、ループフィルタ２０６によるフィルタ処理は省略することができる。

画面並べ替えバッファ２０７は、画像の並べ替えを行う。すなわち、図１の画面並べ替えバッファ１０２により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。D/A変換部２０８は、画面並べ替えバッファ２０７から供給された画像をD/A変換し、図示せぬディスプレイに出力し、表示させる。

フレームメモリ２０９は、供給される復号画像を記憶し、所定のタイミングにおいて、若しくは、イントラ予測部２１１や動き予測・補償部２１２等の外部の要求に基づいて、記憶している復号画像を参照画像として、選択部２１０に供給する。

選択部２１０は、フレームメモリ２０９から供給される参照画像の供給先を選択する。選択部２１０は、イントラ符号化された画像を復号する場合、フレームメモリ２０９から供給される参照画像をイントラ予測部２１１に供給する。また、選択部２１０は、インター符号化された画像を復号する場合、フレームメモリ２０９から供給される参照画像を動き予測・補償部２１２に供給する。

イントラ予測部２１１には、符号化データに含まれるヘッダ情報を復号して得られたイントラ予測モードを示す情報等が可逆復号部２０２から適宜供給される。イントラ予測部２１１は、図１のイントラ予測部１１４において用いられたイントラ予測モードで、フレームメモリ２０９から取得した参照画像を用いてイントラ予測を行い、予測画像を生成する。イントラ予測部２１１は、生成した予測画像を選択部２１３に供給する。

動き予測・補償部２１２は、ヘッダ情報を復号して得られた情報（最適予測モード情報、差分情報、および予測動きベクトル情報のコードナンバ等）を可逆復号部２０２から取得する。

動き予測・補償部２１２は、図１の動き予測・補償部１１５において用いられたインター予測モードで、フレームメモリ２０９から取得した参照画像を用いてインター予測を行い、予測画像を生成する。

復号制御部２２１は、可逆復号部２０２の復号処理を制御する。可逆復号部２０２は、基本的に、図１の可逆符号化部１０６に対応する方法で復号処理を行うので、復号制御部２２１の制御方法は、基本的に、図１の符号化制御部１２１の制御方法と同様である。符号化側と復号側で制御方法を揃えることにより、復号制御部２２１は、符号化制御部１２１が選択した符号化方法に対応する復号方法を選択することができ、正しく復号処理が行われるように制御することができる。

つまり、復号制御部２２１は、マージモードで復号を行うか否かの判定を行う。

また、復号制御部２２１は、例えば、スキップモード、イントラ予測モード、インター予測モード、およびダイレクトモード等、マージモード以外のモードについても復号処理の制御を行う。

可逆復号部２０２は、復号制御部２２１により選択されたモードで可逆復号処理を行う。

［可逆復号部および復号制御部］
図１１は、可逆復号部２０２および復号制御部２２１の主な構成例を示すブロック図である。

図１１に示されるように、可逆復号部２０２は、NAL復号部２３１およびCUデータ復号部２３２を有する。

NAL復号部２３１は、シーケンスパラメータセット、ピクチャパラメータセット、およびスライスヘッダ等のNALの符号化データを復号する。CUデータ復号部２３２は、CU以下の階層の符号化データを復号する。

CUデータ復号部２３２は、スキップフラグ復号部２４１、スキップモード復号部２４２、マージフラグ復号部２４３、およびマージモード復号部２４４を有する。また、CUデータ復号部２３２は、PredMode復号部２４５、イントラ復号部２４６、インター復号部２４７、および、ダイレクトモード復号部２４８を有する。

スキップフラグ復号部２４１は、復号制御部２２１の制御に従って、スキップフラグを復号する。スキップモード復号部２４２は、復号制御部２２１の制御に従って、スキップモードでの復号処理を行う。

マージフラグ復号部２４３は、復号制御部２２１の制御に従って、マージフラグ（MergeFlag）を復号する。マージモード復号部２４４は、復号制御部２２１の制御に従って、マージモードでの復号処理を行う。

PredMode復号部２４５は、復号制御部２２１の制御に従って、PredModeを復号する。イントラ復号部２４６は、復号制御部２２１の制御に従って、イントラ予測を用いて生成された差分画像の符号化データの復号に関する処理を行う。インター復号部２４７は、復号制御部２２１の制御に従って、インター予測を用いて生成された差分画像の符号化データの復号に関する処理を行う。ダイレクトモード復号部２４８は、復号制御部２２１の制御に従って、ダイレクトモードを用いて生成された差分画像の符号化データの復号に関する処理を行う。

［復号処理の流れ］
次に、以上のような画像復号装置２００により実行される各処理の流れについて説明する。最初に、図１２のフローチャートを参照して、復号処理の流れの例を説明する。

復号処理が開始されると、ステップＳ２０１において、蓄積バッファ２０１は、伝送されてきた符号化データ（符号化ストリーム）を蓄積する。ステップＳ２０２において、可逆復号部２０２は、蓄積バッファ２０１から供給される符号化データを復号する。すなわち、図１の可逆符号化部１０６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャが復号される。また、差分動き情報、予測動きベクトル情報のコードナンバ、およびマージ情報など、符号化データに含められた差分画像情報以外の各種情報も復号される。

ステップＳ２０３において、逆量子化部２０３は、ステップＳ２０２の処理により得られた、量子化された変換係数（量子化係数）を逆量子化する。ステップＳ２０４において逆直交変換部２０４は、ステップＳ２０３において逆量子化された変換係数を逆直交変換する。

ステップＳ２０５において、イントラ予測部２１１若しくは動き予測・補償部２１２は、供給された情報を用いて予測処理を行う。ステップＳ２０６において、選択部２１３は、ステップＳ２０５において生成された予測画像を選択する。ステップＳ２０７において、演算部２０５は、ステップＳ２０４において逆直交変換されて得られた差分情報に、ステップＳ２０６において選択された予測画像を加算する。これにより復号画像が得られる。

ステップＳ２０８において、ループフィルタ２０６は、ステップＳ２０７において得られた復号画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜行う。

ステップＳ２０９において、画面並べ替えバッファ２０７は、ステップＳ２０８においてフィルタ処理された画像の並べ替えを行う。すなわち画像符号化装置１００の画面並べ替えバッファ１０２により符号化のために並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。

ステップＳ２１０において、D/A変換部２０８は、ステップＳ２０９においてフレームの順序が並べ替えられた画像をD/A変換する。この画像が図示せぬディスプレイに出力され、画像が表示される。

ステップＳ２１１において、フレームメモリ２０９は、ステップＳ２０８においてフィルタ処理された画像を記憶する。この画像は、ステップＳ２０５において、参照画像として、予測画像の生成（予測処理）に使用される。

ステップＳ２１１の処理が終了すると、復号処理が終了される。

［可逆復号処理の流れ］
次に、図１３のフローチャートを参照して、図１２のステップＳ２０２において実行される可逆復号処理の流れの例を説明する。

この可逆復号処理は、可逆符号化処理の場合と同様に、画像の階層毎に行われる。

つまり、NAL復号部２３１は、ステップＳ２２１において、SPSの符号化データを復号し、ステップＳ２２２において、PPSの符号化データを復号し、ステップＳ２２３においてスライスヘッダの符号化データを復号する。ステップＳ２２４において、CUデータ復号部２３２は、処理対象である当該CUを復号する。

CUデータ復号部２３２は、このステップＳ２２４の処理を、処理対象である当該スライス内の全てCUについて繰り返す。ステップＳ２２５において、当該スライス内に未処理のCUが存在しないと判定された場合、CUデータ復号部２３２は、処理をステップＳ２２６に進める。

NAL復号部２３１は、このステップＳ２２３乃至ステップＳ２２５の処理を、処理対象である当該ピクチャ内の全てのスライスについて繰り返す。ステップＳ２２６において、当該ピクチャ内に未処理のスライスが存在しないと判定された場合、NAL復号部２３１は、処理をステップＳ２２７に進める。

NAL復号部２３１は、このステップＳ２２２乃至ステップＳ２２６の処理を、処理対象である当該シーケンス内の全てのピクチャについて繰り返す。ステップＳ２２７において、当該シーケンス内に未処理のピクチャが存在しないと判定された場合、NAL復号部２３１は、可逆復号処理を終了し、処理を図１２に戻す。

［CU復号処理］
次に、図１４および図１５のフローチャートを参照して、図１３のステップＳ２２４において実行されるCU復号処理の流れの例を説明する。

CU復号処理が開始されると、復号制御部２２１は、ステップＳ２３１において、NAL復号部２３１により復号されたNALデータから、当該スライスのタイプを判定し、当該スライスがＩスライスであるか否かを判定する。

当該スライスがＩスライスでない（Ｐスライス若しくはＢスライスである）場合、スキップフラグ復号部２４１は、ステップＳ２３２において、スキップフラグを復号する。当該スライスがＩスライスと判定された場合、スキップフラグは符号化されていないので、この処理は省略される。

復号制御部２２１が、ステップＳ２３３において、スキップフラグが存在し、その値が１であると判定した場合、スキップモード復号部２４２は、ステップＳ２３４において、スキップモードでCUデータを復号する。CUデータを復号すると、スキップモード復号部２４２は、CU復号処理を終了し、処理を図１３に戻す。

ステップＳ２３３において、復号制御部２２１が、スキップフラグが存在しないか、若しくは、その値が０であると判定した場合、マージフラグ復号部２４３は、ステップＳ２３５において、マージフラグを復号する。

ステップＳ２３６において、復号制御部２２１が、マージフラグが存在し、その値が１であると判定した場合、マージモード復号部２４４は、ステップＳ２３７において、マージモードでCUデータを復号する。CUデータを復号すると、マージモード復号部２４４は、CU復号処理を終了し、処理を図１３に戻す。

ステップＳ２３８において、復号制御部２２１は、マージフラグが存在しないか、若しくは、その値が０であると判定した場合、処理を図１５に進める。

この場合、CUデータは予測モードに応じた方法で復号される。つまり、図１５のステップＳ２４１において復号制御部２２１が、当該スライスがＩスライスでないと判定した場合、PredMode復号部２４５は、ステップＳ２４２においてpred_mode(PredMode)を復号する。当該スライスがＩスライスと判定された場合、pred_modeは符号化されていないので、この処理は省略される。

ステップＳ２４３において、復号制御部２２１が、当該領域の予測モードがイントラ予測モードであると判定した場合、イントラ復号部２４６は、ステップＳ２４４において、イントラ予測モードで復号する（イントラ予測モードで符号化されたCUデータを適切な方法で復号する）。CUデータを復号すると、イントラ復号部２４６は、CU復号処理を終了し、処理を図１３に戻す。

また、復号制御部２２１が、当該領域の予測モードについて、ステップＳ２４３においてイントラ予測モードでないと判定し、ステップＳ２４５においてインター予測モードであると判定した場合、インター復号部２４７は、ステップＳ２４６において、インター予測モードで復号する（インター予測モードで符号化されたCUデータを適切な方法で復号する）。CUデータを復号すると、インター復号部２４７は、CU復号処理を終了し、処理を図１３に戻す。

さらに、復号制御部２２１が、当該領域の予測モードについて、ステップＳ２４３においてイントラ予測モードでないと判定し、ステップＳ２４５においてインター予測モードでもないと判定した場合、ダイレクトモード復号部２４８は、ステップＳ２４７において、ダイレクト予測モードで復号する（ダイレクト予測モードで符号化されたCUデータを適切な方法で復号する）。CUデータを復号すると、ダイレクトモード復号部２４８は、CU復号処理を終了し、処理を図１３に戻す。

［本技術を適用した画像処理装置の一実施の形態］

図１６は、本技術を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。

図１６において、画像処理装置は、エンコーダ１０００、及び、デコーダ２０００を有する。なお、エンコーダ１０００、及び、デコーダ２０００は、独立した１個の装置内に、別個のブロックとして実装することもできるし、それぞれを、別個の独立した装置に実装することもできる。また、エンコーダ１０００、及び、デコーダ２０００は、それぞれを、独立した１個の装置として構成することができる。

エンコーダ１０００は、図１の画像符号化装置１００と同様に構成される。

すなわち、エンコーダ１０００において、入力ピクチャバッファ１００１は、図１の画面並べ替えバッファ１０２に相当し、演算部１００２は、図１の演算部１０３に相当する。直交変換部１００３は、図１の直交変換部１０４に相当し、量子化部１００４は、図１の量子化部１００５に相当する。エントロピ符号化部１００５は、図１の可逆符号化部１０６に相当し、逆量子化部１００６は、図１の逆量子化部１０８に相当する。逆直交変換部１００７は、図１の逆直交変換部１０９に相当し、演算部１００８は、図１の演算部１１０に相当する。デブロックフィルタ１００９、適応サンプルオフセット部１０１０、適応サンプルオフセット推定部１０１１、適応ループフィルタ１０１２、及び、適応ループフィルタ推定部１０１３は、図１のループフィルタ１１１に相当し、DPB(Decode Picture Buffer)１０１４は、図１のフレームメモリ１１２に相当する。イントラ方向推定部１０１５、及び、イントラ予測部１０１６は、図１のイントラ予測部１１４に相当し、動き推定部１０１７、及び、インター予測部１０１８は、図１の動き予測・補償部１１５に相当する。モード判定部１０１９は、図１の予測画像選択部１１６に相当する。

なお、エンコーダ１０００は、設定部１０２１が新たに設けられている点、インター予測部１０１８が、設定部１０２１が出力する情報を用いて処理を行う点、及び、エントロピ符号化部１００５において、設定部１０２１が出力する情報が、符号化データに含められる点で、図１の画像符号化装置１００と相違する。

また、図１６のエンコーダ１０００では、図１のA/D変換部１０１、蓄積バッファ１０７、レート制御部１１７、及び、符号化制御部１２１に相当するブロックの図示は、省略してある。

デコーダ２０００は、図１０の画像復号装置２００と同様に構成される。

すなわち、デコーダ２０００において、エントロピ復号部２００１は、図１０の可逆復号部２０２に相当し、逆量子化部２００２は、図１０の逆量子化部２０３に相当する。逆直交変換部２００３は、図１０の逆直交変換部２０４に相当し、演算部２００４は、図１０の演算部２０５に相当する。デブロックフィルタ２００５、適応サンプルオフセット部２００６、及び、適応ループフィルタ２００７は、図１０のループフィルタ２０６に相当し、DPB２００８は、図１０のフレームメモリ２０９に相当する。イントラ予測部２００９は、図１０のイントラ予測部２１１に相当し、インター予測部２０１０は、図１０の動き予測・補償部２１２に相当する。モード選択部２０１１は、図１０の選択部２１３に相当する。

なお、デコーダ２０００は、インター予測部２０１０が、エンコーダ１０００で得られる符号化データに含まれる、設定部１０２１が出力する情報を用いて処理を行う点で、図１０の画像復号装置２００と相違する。

また、図１６のデコーダ２０００では、図１０の蓄積バッファ２０１、画面並べ替えバッファ２０７、D/A変換部２０８、及び、復号制御部２２１に相当するブロックの図示は、省略してある。

以上のように構成される図１６の画像処理装置では、エンコーダ１０００において、図１の画像符号化装置１００と同様に、画像が符号化され、その結果得られる符号化データ（符号化ストリーム）が伝送される。

但し、エンコーダ１０００では、設定部１０２１が、所定の情報を設定して出力する。設定部１０２１が出力する情報（以下、設定情報ともいう）は、インター予測部１０１８、及び、エントロピ符号化部１００５に供給される。

インター予測部１０１８は、設定部１０２１からの設定情報に従って、予測画像を生成する。この予測画像は、必要に応じて、演算部１００２ないしエントロピ符号化部１００５でのCU，PU，PU partition，TU等の画像のブロックの符号化（予測符号化）に用いられる。

また、エントロピ符号化部１００５は、設定部１０２１からの設定情報を、符号化データに含めて伝送する。

一方、デコーダ２０００は、エンコーダ１０００から伝送されてくる符号化データを受け取り、図１０の画像復号装置２００と同様に、その符号化データを、画像に復号する。

但し、デコーダ２０００では、エントロピ復号部２００１が、符号化データから設定情報を分離し、インター予測部２０１０に供給する。

インター予測部２０１０は、エントロピ復号部２００１からの設定情報に従って、予測画像を生成する。この予測画像は、必要に応じて、エントロピ復号部２００１ないし演算部２００４での、予測符号化された画像のブロックの復号に用いられる。

図１６の画像処理装置において、設定部１０２１が設定する設定情報には、例えば、識別情報や、制限情報等がある。

以下、識別情報と制限情報について説明する。

［識別情報］

まず、設定部１０２１において設定される識別情報について説明する。

ここで、マージモードは、上述したように、動き情報 (Prediction direction, Motion vector, Reference index)に代えて（動き情報を伝送せずに）、フラグ（フラグ情報）を伝送する技術であり、符号化効率を改善することができる。

マージモードは、CU単位、及び、PU単位のいずれのブロック単位に対しても用いることができ、以下説明する技術は、CU単位、及び、PU単位のいずれのブロック単位で行われるマージモードにも適用することができる。

いま、エンコーダ１０００において符号化の対象となっているブロック（当該領域）を、注目ブロックということとする。

マージモードでは、注目ブロックに、空間的、時間的に近い領域（周辺領域）から、注目ブロックとマージする領域であるマージ領域の候補（以下、マージ候補ともいう）が選択される。そして、マージ候補の中から符号化効率が高くなるように、マージ領域（となるマージ候補）が選択され、そのマージ領域を表すmerge_idxが、符号化ストリーム（符号化データ）に含められる。

なお、merge_idxについては、以下のように説明されている。

merge_idx[x0][y0] specifies the merging candidate index of the merging candidate list where x0, y0 specify the location (x0,y0) of the top-left luma sample of the considered prediction block relative to the top-left luma sample of the picture.

merge_idxは、上述のMerge_Left_Flagに代えて用いられる、マージ領域とする領域（又は、その領域の動き情報）を表す情報である。Merge_Left_Flagは、注目ブロックの左、又は、上の位置の領域を表すが、merge_idxによれば、その他の位置の領域も表すことができる。

ところで、エンコーダ１０００のMC（動き補償）において、復号画像を記憶するDPB１０１４へのアクセスが頻繁に発生すると、DPB１０１４から復号画像が読み出される伝送レートであるメモリ帯域が大になる。

すなわち、MCに用いられる予測画像の予測として、L0予測及びL1予測のうちの一方の予測（以下、片方向予測(Uni-prediction)ともいう）ではなく、L0予測とL1予測の両方（以下、両方向予測(Bi-prediction)ともいう）が行われる場合や、注目ブロックのブロックサイズが小さい場合に、メモリ帯域は、大になる。

しかしながら、メモリ帯域として、大きな帯域（高レート）を確保しようとすると、エンコーダ１０００が高コスト化する。この点、DPB２００８を有するデコーダ２０００も同様である。

以上から、MCで必要とする最大のメモリ帯域（以下、必要最大帯域ともいう）が、エンコーダ１０００、及び、デコーダ２０００の実装におけるボトルネックになる。

必要最大帯域を小にする方法としては、例えば、小さいサイズのブロックの使用を禁止する方法や、ブロックのサイズに応じて、両方向予測の使用を禁止する方法がある。しかしながら、例えば、所定サイズ以下の小さいブロックについて、両方向予測の使用を禁止した場合、マージ候補が、すべて、両方向予測される領域であったときに、所定サイズ以下のブロックについては、マージ領域とするマージ候補を選択することができず、結果として、マージモードを使用することができなくなって、符号化効率が悪化するおそれがある。

そこで、エンコーダ１０００では、設定部１０２１において、識別情報を設定し、インター予測部１０１８において、その識別情報に従って、予測（予測画像の生成）を行うことで、必要最大帯域を抑制する。

ここで、識別情報は、画像のブロックのサイズと、ブロックに適用する予測方法の変更との対応関係を識別する情報であり、識別情報としては、例えば、以下のような第１の情報、第２の情報、及び、第３の情報のうちのいずれかを採用することができる。

識別情報として採用することができる第１の情報は、disable_bip_small_mrg_idc情報（フラグ）であり、disable_bip_small_mrg_idc情報は、例えば、0,1,2,3の４つの値をとることができる。

図１７は、disable_bip_small_mrg_idc情報を説明する図である。

各値のdisable_bip_small_mrg_idc情報は、両方向予測に代えて片方向予測を適用するように、予測方法を変更するブロック（ここでは、例えば、PU partition）のサイズ（ブロックサイズ）を表す。

すなわち、値が0のdisable_bip_small_mrg_idc情報は、注目ブロックのPUパーティション(PU partition)のブロックサイズに関係なく、マージ候補の予測方法を変更しないこと表す。

値が1のdisable_bip_small_mrg_idc情報は、注目ブロックのPUパーティションのブロックサイズが、4×4（横×縦の画素数）である場合に、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更（置換）して、マージモードの処理を行うことを表す。

ここで、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更して、マージモードの処理を行う、とは、両方向予測が適用されるマージ候補の予測方法を、実際に、片方向予測に変更するのではなく、マージ候補の予測が、片方向予測で行われると仮定して、その片方向予測に関する動き情報を、注目ブロック（のPUパーティション）の処理に用いることを意味する。したがって、（注目ブロックではなく）マージ候補それ自体の予測は、そのマージ候補について決められた（選択された）予測方法をそのまま用いて行われる。

値が1のdisable_bip_small_mrg_idc情報が設定された場合、ブロックサイズが4×4のPUパーティションについては、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更して、マージモードの処理が行われる。

したがって、例えば、ブロックサイズが4×4のPUパーティションについて、両方向予測の使用を禁止した場合に、マージ候補が、すべて、両方向予測される領域であっても、その両方向予測が、片方向予測に変更されて、マージモードの処理が行われる。

その結果、所定サイズ以下のPUパーティションについて、両方向予測の使用を禁止した場合に、マージモードを使用することができなくなって、符号化効率が悪化することを防止することができる。

ここで、マージモードを使用することができない損失よりも、マージモードにおいて、マージ候補の予測方法を、両方向予測から片方向予測に変更する損失の方が小さい。

値が2のdisable_bip_small_mrg_idc情報は、注目ブロックのPUパーティションのブロックサイズが、4×4，8×4、及び、4×8のうちのいずれかである場合に、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更して、マージモードの処理を行うことを表す。

値が3のdisable_bip_small_mrg_idc情報は、注目ブロックのPUパーティションのブロックサイズが、4×4，8×4，4×8、及び、8×8のうちのいずれかである場合に、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更して、マージモードの処理を行うことを表す。

ここで、マージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更するPUパーティションのブロックサイズとしては、上述の4×4や、8×4、4×8，8×8以外のブロックサイズを採用することができる。

また、disable_bip_small_mrg_idc情報がとる値は、0ないし3の４つの値に限定されるものではない。

なお、両方向予測とは、例えば、L0予測及びL1予測の両方を行う予測であり、両方向予測に代えて、マージ候補に適用する片方向予測とは、例えば、両方向予測としてのL0予測、及び、L1予測のうちのいずれか一方である。

第１の情報としてのdisable_bip_small_mrg_idc情報を用いる場合には、両方向予測に代えて、マージ候補に適用する片方向予測を、L0予測、及び、L1予測のうちのいずれとするかは、あらかじめ決定し、エンコーダ１０００とデコーダ２０００とで、統一しておく必要がある。

図１８は、第１の情報としてのdisable_bip_small_mrg_idc情報を用いる場合の、エンコーダ１０００、及び、デコーダ２０００の処理の概要を説明するフローチャートである。

エンコーダ１０００では、ステップＳ１００１において、設定部１０２１が、注目ブロックについて、例えば、DPB１０１４のメモリ帯域の最大値に基づいて、disable_bip_small_mrg_idc情報を設定し、インター予測部１０１８、及び、エントロピ符号化部１００５に供給する。

インター予測部１０１８は、ステップＳ１００２において、設定部１０２１からのdisable_bip_small_mrg_idc情報に従って、マージモードの処理、ひいては、予測画像の生成を行う。すなわち、インター予測部１０１８は、マージモードの処理（符号化）を行う場合には、設定部１０２１からのdisable_bip_small_mrg_idc情報に従って、予測画像を生成する。

なお、設定部１０２１は、DPB１０１４のメモリ帯域の最大値が小さいほど、値が大きいdisable_bip_small_mrg_idc情報を設定する。したがって、DPB１０１４のメモリ帯域の最大値が小さいほど、より大きなブロックサイズのPUパーティションまで、そのPUパーティションのマージ候補の予測方法が、両方向予測から片方向予測に変更され、予測画像の生成のために、DPB１０１４から復号画像が読み出されるときのメモリ帯域が抑制される。

以上のように、DPB１０１４から復号画像が読み出されるときのメモリ帯域が抑制されることにより、エンコーダ１０００の高コスト化を防止することができる。

ステップＳ１００３において、演算部１００２ないしエントロピ符号化部１００５は、必要に応じて、ステップＳ１００２で生成された予測画像を用いて、注目ブロックを符号化する。

ステップＳ１００４において、エントロピ符号化部１００５は、設定部１０２１からのdisable_bip_small_mrg_idc情報を、符号化データに含めて（例えば、多重化して）伝送する。

なお、エントロピ符号化部１００５は、disable_bip_small_mrg_idc情報を、符号化データ（符号化ストリーム）の、例えば、SPSや、PPS，APS、スライスヘッダ（slice header）等に含めることができる。

一方、デコーダ２０００では、ステップＳ１０１１において、エントロピ復号部２００１が、disable_bip_small_mrg_idc情報を含む符号化データを受け取る（受信する）。そして、エントロピ復号部２００１は、符号化データからdisable_bip_small_mrg_idc情報を分離し、インター予測部２０１０に供給する。

ステップＳ１０１２において、インター予測部２０１０は、インター予測部１０１８と同様に、disable_bip_small_mrg_idc情報に従って、マージモードの処理、ひいては、予測画像の生成を行う。すなわち、インター予測部２０１０は、マージモードの処理（符号化）を行う場合には、エントロピ復号部２００１からのdisable_bip_small_mrg_idc情報に従って、予測画像を生成する。

そして、ステップＳ１０１３において、エントロピ復号部２００１ないし演算部２００４は、必要に応じて、ステップＳ１０１２で生成された予測画像を用いて、ステップＳ１０２１で受信された符号化データを復号する。

なお、エンコーダ１０００では、設定部１０２１において、エンコーダ１０００のオペレータ等のユーザの操作に従って、disable_bip_small_mrg_idc情報を設定することができる。

その他、エンコーダ１０００では、各値のメモリ帯域を、必要最大帯域として、その各値の必要最大帯域に応じて、デコーダの処理量を規定するプロファイルやレベルを定義しておき、プロファイル、及び、レベルの情報（profile_idc、及び、level_idc）を符号化データに含めることができる。

ここで、profile_idc、及び、level_idcについては、以下のように説明されている。

profile_idc and level_idc indicate the profile and level to which the coded video sequence conforms.

したがって、profile_idc、及び、level_idcについては、まだ、詳細な定義はされていないが、profile_idcやlevel_idcは、例えば、MCの必要最大帯域の情報を含むように定義することができる。

例えば、profile_idcやlevel_idcは、PUパーティションのブロックサイズの最小値や、両方向予測の使用の可否、PUパーティションのブロックサイズの最小値と、両方向予測の使用の可否との組み合わせ等の情報を含むように定義することができる。

設定部１０２１では、例えば、上述したように、DPB１０１４のメモリ帯域の最大値に基づいて、disable_bip_small_mrg_idc情報が設定される。

そして、エンコーダ１０００では、profile_idcやlevel_idcに従って、所定サイズ以下の小さいブロックサイズのPUパーティションの使用や、所定サイズ以下のブロックサイズのPUパーティションへの両方向予測の適用が禁止される。

但し、例えば、4×4のブロックサイズのPUパーティションへの両方向予測の適用が禁止されているが、値が1のdisable_bip_small_mrg_idc情報が設定されている場合、エンコーダ１０００では、4×4（のブロックサイズ）のPUパーティションについては、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更して、マージモードの処理が行われる。

したがって、両方向予測の適用が禁止されている4×4のPUパーティションについて、マージ候補が、すべて、両方向予測される領域であっても、その両方向予測が、片方向予測に変更されるので、マージモードの処理を行うことができる。

デコーダ２０００でも、disable_bip_small_mrg_idc情報に従い、エンコーダ１０００と同様に、両方向予測が適用されるマージ候補の予測方法が、必要に応じて、両方向予測から片方向予測に変更される。

次に、識別情報として採用することができる第２の情報について説明する。

識別情報として採用することができる第２の情報は、第１の情報であるdisable_bip_small_mrg_idc情報を拡張したdisable_bip_small_mrg_idc拡張情報であり、disable_bip_small_mrg_idc拡張情報は、例えば、0,1,2,3,4,5,6の7つの値をとることができる。

図１９は、disable_bip_small_mrg_idc拡張情報を説明する図である。

各値のdisable_bip_small_mrg_idc拡張情報は、両方向予測に代えて片方向予測を適用するように、予測方法を変更するPUパーティションのブロックサイズと、両方向予測に代えて適用する片方向予測の予測方向とを表し、そのセマンテクス(semantics)は、以下の通りである。

すなわち、値が0のdisable_bip_small_mrg_idc拡張情報は、値が0のdisable_bip_small_mrg_idc情報と同様に、注目ブロックのPUパーティション(PU partition)のブロックサイズに関係なく、マージ候補の予測方法を変更しないこと表す。

値が1又は2のdisable_bip_small_mrg_idc拡張情報は、いずれも、値が1のdisable_bip_small_mrg_idc情報と同様に、注目ブロックのPUパーティションのブロックサイズが、4×4である場合に、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更して、マージモードの処理を行うことを表す。

さらに、値が1のdisable_bip_small_mrg_idc拡張情報は、両方向予測に代えて適用する片方向予測の予測方向が、L0予測及びL1予測のうちの、例えば、L0予測であることも表す。また、値が2のdisable_bip_small_mrg_idc拡張情報は、両方向予測に代えて適用する片方向予測の予測方向が、L0予測及びL1予測のうちの、例えば、L1予測であることも表す。

値が3又は4のdisable_bip_small_mrg_idc拡張情報は、いずれも、値が2のdisable_bip_small_mrg_idc情報と同様に、注目ブロックのPUパーティションのブロックサイズが、4×4，8×4、及び、4×8のうちのいずれかである場合に、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更して、マージモードの処理を行うことを表す。

さらに、値が3のdisable_bip_small_mrg_idc拡張情報は、両方向予測に代えて適用する片方向予測の予測方向が、L0予測及びL1予測のうちの、例えば、L0予測であることも表す。また、値が4のdisable_bip_small_mrg_idc拡張情報は、両方向予測に代えて適用する片方向予測の予測方向が、L0予測及びL1予測のうちの、例えば、L1予測であることも表す。

値が5又は6のdisable_bip_small_mrg_idc拡張情報は、いずれも、値が3のdisable_bip_small_mrg_idc情報と同様に、注目ブロックのPUパーティションのブロックサイズが、4×4，8×4，4×8、及び、8×8のうちのいずれかである場合に、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように変更して、マージモードの処理を行うことを表す。

さらに、値が5のdisable_bip_small_mrg_idc拡張情報は、両方向予測に代えて適用する片方向予測の予測方向が、L0予測及びL1予測のうちの、例えば、L0予測であることも表す。また、値が6のdisable_bip_small_mrg_idc拡張情報は、両方向予測に代えて適用する片方向予測の予測方向が、L0予測及びL1予測のうちの、例えば、L1予測であることも表す。

第２の情報としてのdisable_bip_small_mrg_idc拡張情報は、両方向予測に代えて片方向予測を適用するように、予測方法を変更するPUパーティションのブロックサイズの他、両方向予測に代えて適用する片方向予測の予測方向をも表すので、第１の情報としてのdisable_bip_small_mrg_idc情報のように、両方向予測に代えて、マージ候補に適用する片方向予測を、L0予測、及び、L1予測のうちのいずれとするかを、エンコーダ１０００、及び、デコーダ２０００で、あらかじめ決定しておく必要はない。

disable_bip_small_mrg_idc拡張情報を用いる場合の、図１６のエンコーダ１０００及びデコーダ２０００の処理は、disable_bip_small_mrg_idc情報に代えて、disable_bip_small_mrg_idc拡張情報が用いられることを除いて、図１８で説明した処理と同様であるため、説明を省略する。

次に、識別情報として採用することができる第３の情報について説明する。

識別情報として採用することができる第３の情報は、第１の情報であるdisable_bip_small_mrg_idc情報と、modify_bip_small_mrg_l0情報との２つの情報である。

図２０は、modify_bip_small_mrg_l0情報を説明する図である。

modify_bip_small_mrg_l0情報は、例えば、0及び1の２つの値をとり、両方向予測に代えて適用する片方向予測の予測方向を表す。

すなわち、値が0のmodify_bip_small_mrg_l0情報は、両方向予測に代えて適用する片方向予測が、例えば、L1予測であることを表し、値が1のmodify_bip_small_mrg_l0情報は、両方向予測に代えて適用する片方向予測が、例えば、L0予測であることを表す。

第３の情報によれば、disable_bip_small_mrg_idc情報によって、両方向予測に代えて片方向予測を適用するように、予測方法を変更するPUパーティションのブロックサイズを制御することができ、modify_bip_small_mrg_l0情報によって、両方向予測に代えて適用する片方向予測の予測方向を制御することができる。

その結果、参照方向をより小さい単位で制御することが可能になる。

片方向予測の予測方向、すなわち、参照方向によって予測の品質（予測誤差）に違いがある場合、例えば、L0予測よりもL1予測の方が、予測の対象である注目ピクチャと参照ピクチャ（参照画像）との時間的距離が近い場合、一般に、L1予測の方が予測の品質が高い傾向がある。この場合、両方向予測に代えて適用する片方向予測として、L1予測を用いることで、符号化効率を高くすることができる。

また、L0予測とL1予測の参照ピクチャが符号化されたときの量子化パラメータQPに違いがある場合、より量子化パラメータQPの小さい参照ピクチャの方が高い品質の予測が期待される。さらに、動画像のシーンが変化する時は、同じシーンが選ばれる参照方向を採用した方が予測の品質が高くなる。すなわち、シーンチェンジがあった場合には、シーンチェンジ前のピクチャの符号化時には、シーンチェンジ前のピクチャを、シーンチェンジ後のピクチャの符号化時には、シーンチェンジ後のピクチャを、それぞれ参照ピクチャとして採用した方が、予測の品質が高くなる。

modify_bip_small_mrg_l0情報によれば、両方向予測に代えて適用する片方向予測として、L0予測及びL1予測のうちの、予測の品質の良い方を選択することができる。

なお、modify_bip_small_mrg_l0情報は、disable_bip_small_mrg_idc情報が0以外のときに、符号化データに含めることができる。

したがって、modify_bip_small_mrg_l0情報は、disable_bip_small_mrg_idc情報よりも低い階層で、符号化データに含められる。

例えば、disable_bip_small_mrg_idc情報は、SPSに、modify_bip_small_mrg_l0情報は、スライスヘッダに、それぞれ含めることができる。modify_bip_small_mrg_l0情報は、その他、例えば、PPSや、tile header，LCU，CU，PU等に含めることができる。

modify_bip_small_mrg_l0情報、及び、disable_bip_small_mrg_idc情報を、どの階層に含めるかは、例えば、そのmodify_bip_small_mrg_l0情報、及び、disable_bip_small_mrg_idc情報による予測方法の変更を、どの程度、細かい単位で制御するのかということと、modify_bip_small_mrg_l0情報、及び、disable_bip_small_mrg_idc情報を、符号化データに含めることによるデータ量の増加とのトレードオフによって決めることができる。

modify_bip_small_mrg_l0情報、及び、disable_bip_small_mrg_idc情報を用いる場合の、図１６のエンコーダ１０００及びデコーダ２０００の処理は、disable_bip_small_mrg_idc情報に加えて、modify_bip_small_mrg_l0情報が用いられることを除いて、図１８で説明した処理と同様であるため、説明を省略する。

図２１は、disable_bip_small_mrg_idc情報、又は、disable_bip_small_mrg_idc拡張情報を用いる場合の、エンコーダ１０００によるSPSの符号化、及び、デコーダ２０００によるSPSの復号の概要を説明するフローチャートである。

エンコーダ１０００では、ステップＳ１０２１において、エントロピ符号化部１００５が、profile_idc、及び、level_idcを、符号化データ（符号化ストリーム）のSPSに含める。

さらに、ステップＳ１０２２において、エントロピ符号化部１００５は、設定部１０２１から供給されるdisable_bip_small_mrg_idc情報、又は、disable_bip_small_mrg_idc拡張情報を、符号化データのSPSに含める。

一方、デコーダ２０００では、ステップＳ１０３１において、エントロピ復号部２００１は、符号化データから、profile_idc、及び、level_idcを分離する（読み出す）。

さらに、ステップＳ１０３２において、エントロピ復号部２００１は、符号化データから、disable_bip_small_mrg_idc情報、又は、disable_bip_small_mrg_idc拡張情報を分離し、インター予測部２０１０に供給する。

図２２は、disable_bip_small_mrg_idc情報、及び、modify_bip_small_mrg_l0情報を用いる場合の、エンコーダ１０００によるスライスヘッダの符号化、及び、デコーダ２０００によるスライスヘッダの復号の概要を説明するフローチャートである。

エンコーダ１０００では、ステップＳ１０４１において、エントロピ符号化部１００５が、設定部１０２１からのmodify_bip_small_mrg_l0情報を、符号化データのスライスヘッダに含める。

一方、デコーダ２０００では、ステップＳ１０５１において、エントロピ復号部２００１は、符号化データから、modify_bip_small_mrg_l0情報を分離し（読み出し）、インター予測部２０１０に供給する。

なお、modify_bip_small_mrg_l0情報とともに用いられるdisable_bip_small_mrg_idc情報については、例えば、図２１で説明したように、SPSに含める等の処理が行われる。

図２３は、エンコーダ１０００によるCUの符号化、及び、デコーダ２０００によるCUの復号の概要を説明するフローチャートである。

CUの符号化では、ステップＳ１０６１において、エンコーダ１０００は、注目ブロックとしてのCUを分割した場合と分割しない場合とのそれぞれの場合のコスト関数値を計算する。ここで、コスト関数値としては、例えば、発生符号量と符号化歪みを考慮したRD コストと呼ばれる値が知られている。

ステップＳ１０６２において、エンコーダ１０００は、ステップＳ１０６１で計算したRDコストに基づいて、注目ブロックとしてのCUを分割するかどうかを判定する。

ここで、ステップＳ１０６２では、CUを分割した場合のRDコストが、分割しない場合のRDコストよりも小さい場合（分割した方が、分割しないケースよりも、発生符号量と符号化歪みとが総合的に向上する場合）に、CUを分割すると判定される。

ステップＳ１０６２において、CUを分割すると判定された場合、処理は、ステップＳ１０６３に進み、エンコーダ１０００は、CUの分割に関するフラグであるcu_split_flagに、CUを分割することを表す値である、例えば、1をセットして、符号化データ（符号化ストリーム）に含める。

そして、ステップＳ１０６４において、エンコーダ１０００は、注目ブロックとしてのCUを、例えば、４個（2×2個）の新たなCUに分割する。

さらに、ステップＳ１０６５において、エンコーダ１０００は、ステップＳ１０６４での分割により得られた４個の新たなCUを、順次、注目ブロックとして、CUの符号化の処理を再帰的に行う。

一方、ステップＳ１０６２において、CUを分割しないと判定された場合、処理は、ステップＳ１０６６に進み、エンコーダ１０００は、cu_split_flagに、CUを分割しないことを表す値である、例えば、0をセットして、符号化データに含める。

その後、ステップＳ１０６７において、エンコーダ１０００は、マージ候補を選択するマージ候補の選出の処理を行い、処理は、ステップＳ１０６８に進む。

ステップＳ１０６８では、エンコーダ１０００は、注目ブロックとしてのCUを、マージモードを採用して符号化する場合と、マージモードを採用せずに符号化する場合とのそれぞれの場合のRDコストを計算する。

さらに、ステップＳ１０６８では、エンコーダ１０００は、ステップＳ１０６８で計算したRDコストに基づいて、注目ブロックとしてのCUを、マージモードで符号化するかどうかを判定する。

ここで、ステップＳ１０６８では、注目ブロックをマージモードで符号化した場合のRDコストが、マージモードを採用しない場合のRDコストよりも小さい場合（マージモードを採用した方が、採用しないケースよりも、発生符号量と符号化歪みとが総合的に向上する場合）に、マージモードで符号化すると判定される。

ステップＳ１０６８において、マージモードで符号化する（マージモードを採用する）と判定された場合、処理は、ステップＳ１０６９に進み、エンコーダ１０００は、マージモードに関するフラグであるmerge_flagに、マージモードを採用することを表す値である1をセットするとともに、マージ領域を表すmerge_idxに、マージ領域の位置を表す値をセットし、符号化データに含める。

さらに、ステップＳ１０６９では、エンコーダ１０００は、注目ブロックとしてのCUを、マージモードで符号化する（マージ領域の動き情報を、注目ブロックの動き情報として用いて予測画像を生成し、注目ブロックを符号化する）。

一方、ステップＳ１０６８において、マージモードで符号化しない（マージモードを採用しない）と判定された場合、処理は、ステップＳ１０７０に進み、エンコーダ１０００は、注目ブロックとしてのCUを構成するPUの符号化の処理を行う。

ステップＳ１０７１において、エンコーダ１０００は、ステップＳ１０７０のPUの符号化の処理で得られた予測画像を、注目ブロックとしてのCUを構成するPUに含まれるTU（入力画像）から減算し、そのTUについての差分画像を生成する。

ステップＳ１０７２において、エンコーダ１０００は、ステップＳ１０７１で差分画像を生成したTUの符号化の処理を行う。

そして、ステップＳ１０７３において、エンコーダ１０００は、TUの符号化の処理で得られた、そのTUについての差分画像を直交変換して量子化することにより求められた量子化係数を逆量子化して逆直交変換することにより、差分画像を復号する。

さらに、ステップＳ１０７３において、エンコーダ１０００は、PUの符号化の処理で得られた予測画像と、ステップＳ１０７３で復号された差分画像とを加算する（足し合わせる）ことにより、TUについての復号画像を生成する。この復号画像は、DPB１０１４に記憶され、その後、必要に応じて、参照画像（ピクチャ）として用いられる。

一方、CUの復号では、ステップＳ１０８１において、デコーダ２０００は、符号化データ（符号化ストリーム）から、注目ブロックとしてのCUのcu_split_flagを復号する。

そして、ステップＳ１０８２において、デコーダ２０００は、cu_split_flagが1であるかどうかを判定する。

ステップＳ１０８２において、cu_split_flagが1であると判定された場合、すなわち、注目ブロックとしてのCUが分割されている場合、処理は、ステップＳ１０８３に進み、デコーダ２０００は、注目ブロックとしてのCUを、ステップＳ１０６４の場合と同様に、４個の新たなCUに分割する。

そして、ステップＳ１０８４において、デコーダ２０００は、ステップＳ１０８３での分割により得られた４個の新たなCUを、順次、注目ブロックとして、CUの復号の処理を再帰的に行う。

一方、ステップＳ１０８２において、cu_split_flagが1でない（0である）と判定された場合、すなわち、注目ブロックとしてのCUが分割されていない場合、処理は、ステップＳ１０８５に進み、デコーダ２０００は、merge_flagが1であるかどうかを判定する。

ステップＳ１０８５において、merge_flagが1であると判定された場合、すなわち、注目ブロックとしてのCUがマージモードで符号化されている場合、処理は、ステップＳ１０８６に進み、デコーダ２０００は、符号化データからmerge_idxを読み出すとともに、ステップＳ１０６７の場合と同様のマージ候補の選出の処理を行う。

さらに、ステップＳ１０８６では、デコーダ２０００は、マージ候補の選出の処理で得られたマージ候補の中から、merge_idxが表す位置のマージ候補を、マージ領域に選択し、そのマージ領域（の動き情報）を用い、マージモードで、注目ブロックとしてのCUを復号する（マージ領域の動き情報を、注目ブロックの動き情報として用いて予測画像を生成し、注目ブロックを復号する）。

また、ステップＳ１０８５において、merge_flagが1でない（0である）と判定された場合、すなわち、注目ブロックとしてのCUがマージモードを採用せずに符号化されている場合、処理は、ステップＳ１０８７に進み、デコーダ２０００は、注目ブロックとしてのCUを構成するPUの復号の処理を行い、ステップＳ１０８８において、そのPUに含まれるTUの復号の処理を行う。

そして、ステップＳ１０８９において、デコーダ２０００は、PUの復号の処理で得られた予測画像と、TUの復号の処理で量子化係数を逆量子化して逆直交変換することにより得られた差分画像とを加算する（足し合わせる）ことにより、TUについての復号画像を生成する。この復号画像は、DPB２００８に記憶され、その後、必要に応じて、参照画像（ピクチャ）として用いられる。

図２４は、図２３のステップＳ１０６７のマージ候補の選出（選択）を説明するフローチャートである。

すなわち、図２４は、disable_bip_small_mrg_idc情報、及び、modify_bip_small_mrg_l0情報を用いる場合の、マージ候補の選出を説明するフローチャートである。

ステップＳ１１０１において、エンコーダ１０００は、注目ブロックに対して、空間的、及び、時間的に近いブロックである周囲ブロックの中から、インター予測されたブロックであるインター予測ブロックを、マージ候補に加える。

なお、この段階では、インター予測ブロックの予測方法が、両方向予測である場合には、その両方向予測のまま、インター予測ブロックは、マージ候補に加えられる。

ステップＳ１１０２において、エンコーダ１０００は、マージ候補になっているインター予測ブロックから、動き情報が重複しているインター予測ブロックを、マージ候補から除外する。

ステップＳ１１０３において、エンコーダ１０００は、動きベクトルがゼロベクトルの（仮想的な）インター予測ブロックを、マージ候補に追加する。

その後、ステップＳ１１０４において、エンコーダ１０００は、注目ブロックのスライスタイプがBであるかどうかを判定する。

ステップＳ１１０４において、注目ブロックのスライスタイプがBでないと判定された場合、すなわち、注目ブロックが、両方向予測されることがない場合、マージ候補の選出の処理は終了する。この場合、ステップＳ１１０１及びＳ１１０３で得られたマージ候補をそのまま用いて、マージ領域が選択される。

また、ステップＳ１１０４において、注目ブロックのスライスタイプがBであると判定された場合、すなわち、注目ブロックが、両方向予測されることがある場合、処理は、ステップＳ１１０５に進み、エンコーダ１０００は、注目ブロックのブロックサイズが、disable_bip_small_mrg_idc情報が表す、予測方法を変更するブロックサイズに該当するかどうかを判定する。

ステップＳ１１０５において、注目ブロックのブロックサイズが、disable_bip_small_mrg_idc情報が表すブロックサイズに該当しないと判定された場合、マージ候補の選出の処理は終了する。この場合も、ステップＳ１１０１及びＳ１１０３で得られたマージ候補をそのまま用いて、マージ領域が選択される。

また、ステップＳ１１０５において、注目ブロックのブロックサイズが、disable_bip_small_mrg_idc情報が表すブロックサイズに該当すると判定された場合、処理は、ステップＳ１１０６に進み、エンコーダ１０００は、modify_bip_small_mrg_l0情報が0であるかどうかを判定する。

ステップＳ１１０６において、modify_bip_small_mrg_l0情報が0でないと判定された場合、すなわち、modify_bip_small_mrg_l0情報が1である場合、処理は、ステップＳ１１０７に進み、エンコーダ１０００は、予測方向が両方向予測になっているマージ候補についての、その両方向予測を、片方向予測のうちのL0予測に変更して、マージ候補の選出の処理は終了する。この場合、ステップＳ１１０１及びＳ１１０３で得られたマージ候補のうちの、予測方法が両方向予測になっているマージ候補については、その両方向予測がL0予測に変更され、その後、マージ候補の中から、マージ領域が選択される。

また、ステップＳ１１０６において、modify_bip_small_mrg_l0情報が0であると判定された場合、処理は、ステップＳ１１０８に進み、エンコーダ１０００は、予測方向が両方向予測になっているマージ候補についての、その両方向予測を、片方向予測のうちのL1予測に変更して、マージ候補の選出の処理は終了する。この場合、ステップＳ１１０１及びＳ１１０３で得られたマージ候補のうちの、予測方法が両方向予測になっているマージ候補については、その両方向予測がL0予測に変更され、その後、マージ候補の中から、マージ領域が選択される。

［制限情報］

次に、設定部１０２１において設定される制限情報について説明する。

識別情報で説明したように、MCで必要とする最大のメモリ帯域（必要最大帯域）が、エンコーダ１０００、及び、デコーダ２０００の実装におけるボトルネックになる。

そこで、エンコーダ１０００では、設定部１０２１において、制限情報を設定し、インター予測部１０１８において、その制限情報に従って、予測（予測画像の生成）を行うことで、必要最大帯域を抑制する。

ここで、制限情報は、画像の符号化（復号）の処理を制限する情報であり、例えば、以下説明する制限モードRBや、制限モードRVがある。

制限モードRBによれば、画像のブロックのサイズと、そのサイズのブロックに適用する予測方法が制限され、制限モードRVによれば、画像のブロックのMCにおいて予測画像の生成に用いる動きベクトルの数（参照ブロックの数）が制限される。

図２５は、制限モードRBを説明する図である。

図２５において、例えば、制限モードRBが、B4である場合、Bi-4×4，Bi-4×8，Bi-8×4、及び、Uni-4×4が禁止される。

ここで、例えば、Bi-4×4は、4×4のブロックサイズのPUパーティションに、両方向予測(Bi)を適用することを表す。

また、例えば、Uni-4×4は、4×4のブロックサイズのPUパーティションに、片方向予測(Uni)を適用することを表す。

したがって、制限モードRBが、B4である場合、Bi-4×4、及び、Uni-4×4によって、4×4のブロックサイズのPUパーティションに、両方向予測、及び、片方向予測を適用すること、ひいては、4×4のブロックサイズのPUパーティションの使用（インター予測）が制限される。

また、制限モードRBが、B4である場合、Bi-4×8によって、4×8のブロックサイズのPUパーティションに、両方向予測を適用することが制限される。

さらに、制限モードRBが、B4である場合、Bi-8×4によって、8×4のブロックサイズのPUパーティションに、両方向予測を適用することが制限される。

エンコーダ１０００では、設定部１０２１が、例えば、DPB１０１４のメモリ帯域の最大値に基づいて、制限モードRBを設定し、インター予測部１０１８、及び、エントロピ符号化部１００５に供給する。

インター予測部１０１８は、設定部１０２１からの制限モードRBに従って、予測画像の生成を行う。

一方、エントロピ符号化部１００５は、設定部１０２１からの制限モードRBを、符号化データに含めて伝送する。

エントロピ符号化部１００５では、制限モードRBを、符号化データ（符号化ストリーム）の、例えば、SPSや、PPS，APS，スライスヘッダ（slice header）等に含めることができる。

なお、設定部１０２１は、DPB１０１４のメモリ帯域の最大値が小さいほど、値B#iが大きい制限モードRBを設定する。

ここで、制限モードRBの値B#iが大きいとは、数字#iが大きいことを表す。

図２５において、制限モードRBは、B1,B2,・・・,B7の順で、MCでの必要最大帯域が小さくなる。

ここで、図２５では、制限モードRBが、B1である場合、Bi-4×4が制限され、制限モードRBが、B2である場合、Bi-4×4に加えて、Bi-4×8が制限され、制限モードRBが、B3である場合、Bi-4×4、及び、Bi-4×8に加えて、Bi-8×4が制限され、以下同様に、ある制限モードRB＝B#iでは、１つ前の制限モードB#i-1での制限内容に、新たな制限内容が追加されている。

この新たな制限内容は、その時点で、メモリ帯域の消費が最大の、ブロックサイズと、そのブロックサイズのPUパーティションに適用される予測方法との組み合わせになっている。

上述したように、図２５では、制限モードRBが、B1である場合、Bi-4×4が制限され、制限モードRBが、B2である場合、Bi-4×4に加えて、Bi-4×8が制限され、制限モードRBが、B3である場合、Bi-4×4、及び、Bi-4×8に加えて、Bi-8×4が制限される。

したがって、Bi-4×4の予測（4×4のブロックサイズのPUパーティションに、両方向予測を適用する予測）が、最も多くのメモリ帯域を消費し、Bi-4×8の予測が、２番目に多くのメモリ帯域を消費する。また、Bi-8×4の予測が、３番目に多くのメモリ帯域を消費する。

ここで、以上のように、Bi-4×8の予測、すなわち、横×縦が4×8画素の縦長のブロック（PUパーティション）の予測の方が、Bi-8×4の予測、すなわち、横×縦が8×4画素の横長のブロックの予測よりも、メモリ帯域を多く消費するが、その理由については、後述する。

上述のように、制限モードRBは、B1,B2,・・・,B7の順で、MCでの必要最大帯域が小さくなるので、設定部１０２１において、値B#iが大きい制限モードRBを設定することにより、予測画像の生成のために、DPB１０１４から復号画像が読み出されるときのメモリ帯域を抑制することができる。その結果、エンコーダ１０００の高コスト化を防止することができる。

なお、設定部１０２１が、図２５に従い、DPB１０１４のメモリ帯域の最大値が小さいほど、値B#iが大きい制限モードRBを設定する場合には、DPB１０１４のメモリ帯域の最大値が小であるほど、より大きなサイズのブロックにまで、両方向予測や片方向予測が適用されることが制限される。

デコーダ２０００では、エントロピ復号部２００１が、符号化データから制限モードRBを分離し、インター予測部２０１０に供給する。

インター予測部２０１０は、制限モードRBに従って、予測画像の生成を行う。

すなわち、インター予測部２０１０は、符号化データが、制限モードRBに適合している場合、例えば、制限モードRBにおいて、Bi-4×4が制限されており、そのような制限モードRBに従って、符号化データに、Bi-4×4が含まれていない場合、例えば、予測画像を生成する。

また、インター予測部２０１０は、符号化データが、制限モードRBに適合していない場合、例えば、制限モードRBにおいて、Bi-4×4が制限されているのに、符号化データに、Bi-4×4が含まれる場合、例えば、予測画像を生成せずに、デコーダ２０００に、処理を中止させる。

なお、エンコーダ１０００では、設定部１０２１において、エンコーダ１０００のオペレータ等のユーザの操作に従って、制限モードRBを設定することができる。

その他、エンコーダ１０００では、各値のメモリ帯域を、必要最大帯域として、その各値の必要最大帯域に応じて、プロファイルやレベルを定義しておき、さらに、制限モードRBを、プロファイルやレベルにリンクさせることができる。

ここで、レベルをLv.#iと表すこととし、レベルの値#iが大きいほど、必要最大帯域が小であることとすると、レベルLv.#iは、例えば、制限モードRB=B#iにリンクさせることができる。

この場合、エンコーダ１０００において、例えば、レベルLv.1が設定されると、設定部１０２１は、制限モードRBを、レベルLv.1にリンクしているB1に設定する。

そして、エンコーダ１０００では、制限モードRBに従い、その制限モードRBが表す、ブロックサイズと予測方法との組み合わせを用いずに符号化が行われ、プロファイル、及び、レベルの情報が符号化データに含めて伝送される。

デコーダ２０００では、符号化データから、プロファイル、及び、レベルの情報が復号され、例えば、レベルから、そのレベルにリンクしている制限モードRBを認識することができる。

また、エンコーダ１０００では、符号化データに、制限モードRBを含めて伝送し、デコーダ２０００では、符号化データに含まれる制限モードRBを復号することができる。

デコーダ２０００は、符号化データに、制限モードRBによって制限された、ブロックサイズと予測方法との組み合わせが含まれていないかどうかを確認することができる。

符号化データが、制限モードRBに適合していない場合、すなわち、符号化データに、制限モードRBによって制限された、ブロックサイズと予測方法との組み合わせが含まれる場合、デコーダ２０００は、符号化データが、制限モードRBに適合しない旨を、上位のシステムに伝え、上位のシステムは、その符号化データの取り扱いについて判断することができる。

なお、プロファイル又はレベルによって、画像のサイズ（画枠）が表される場合、エンコーダ１０００では、例えば、プロファイル又はレベルによって表される画像のサイズが大であるほど、より大きなサイズのブロックにまで、両方向予測や片方向予測が適用されることを制限する制限モードRBを設定することができる。

図２６は、制限モードRBを用いる場合の、エンコーダ１０００、及び、デコーダ２０００の処理を説明するフローチャートである。

エンコーダ１０００では、ステップＳ１１２１において、設定部１０２１が、注目ブロックについて、例えば、DPB１０１４のメモリ帯域の最大値や、ユーザの操作、レベル等に基づいて、制限モードRBを設定し、インター予測部１０１８、及び、エントロピ符号化部１００５に供給する。

インター予測部１０１８は、ステップＳ１１２２において、設定部１０２１からの制限モードRBに従い、PUパーティションのブロックサイズと、そのブロックサイズのPUパーティションに適用される予測方法とを制限しながら、予測画像を生成する。

ステップＳ１１２３において、演算部１００２ないしエントロピ符号化部１００５は、必要に応じて、ステップＳ１１２２で生成された予測画像を用いて、注目ブロックを符号化し、符号化データを生成する。

ステップＳ１１２４において、エントロピ符号化部１００５は、設定部１０２１からの制限モードRBを、符号化データに含めて伝送する。

なお、プロファイル及びレベルは、符号化データに含められるので、制限モードRBを、レベル（又はプロファイル）にリンクさせる場合には、符号化データに含まれるレベルの情報から、制限モードRBを認識することができるので、制限モードRBは、符号化データに含める必要がない。

したがって、制限モードRBを、レベルにリンクさせる場合には、符号化データを、制限モードRBを含めずに伝送することができる。

一方、デコーダ２０００では、ステップＳ１１３１において、エントロピ復号部２００１が、符号化データを受け取る（受信する）。そして、エントロピ復号部２００１は、符号化データから制限モードRBを分離し、インター予測部２０１０に供給する。

なお、制限モードRBが、レベルにリンクしており、符号化データに制限モードRBが含まれない場合には、エントロピ復号部２００１は、符号化データに含まれるレベルを、インター予測部２０１０に供給し、インター予測部２０１０は、エントロピ復号部２００１からのレベルに基づいて、制限モードRBを認識する。

ステップＳ１１３２において、インター予測部２０１０は、制限モードRBに従って、予測画像を生成する。

すなわち、インター予測部１０１８は、符号化データが制限モードRBに適合するかどうかを確認しながら、つまり、符号化データに、制限モードRBによって制限された、ブロックサイズと予測方法との組み合わせが含まれていないかどうかを確認しながら、予測画像を生成する。

そして、符号化データが、制限モードRBに適合していない場合、デコーダ２０００は、その旨を、上位のシステムに伝える。

一方、符号化データが、制限モードRBに適合する場合、ステップＳ１１３３において、エントロピ復号部２００１ないし演算部２００４は、必要に応じて、ステップＳ１１３２で生成された予測画像を用いて、ステップＳ１１３１で受信された符号化データを復号する。

図２７及び図２８は、同一の大きさ（画素数）のブロックであっても、4×8等の縦長のブロックの予測の方が、8×4等の横長のブロックの予測よりも、メモリ帯域を多く消費することを説明する図である。

DPB１０１４等のメモリから、そのメモリに格納された復号画像（ピクチャ）の画素を読み出す場合、６４ビットや１２８ビットというようにバス幅（データ転送の経路の幅）単位になる。

1画素が８ビットである場合、６４ビットのバス幅では、８画素が、１２８ビットのバス幅では、１６画素が、それぞれ、並列に一度に読み出される。

一般的な実装においては、メモリから一度に読み出される画素群の最小単位としては、経験上の利便性等から、横長の長方形のブロックが採用される。

例えば、図２７において破線で区切られている、横×縦が4×2画素のブロックごとに、画素（値）が読み出される。

ここで、メモリから一度に読み出される画素群の最小単位を、最小ブロックともいう。

また、図２７において、正方形（□印）は、メモリに記憶された1画素（のデータ）を表し、丸（○印）は、予測画像の画素の位置を表す。図２７では、予測画像は、メモリに記憶されている画像（参照画像）の画素から、横及び縦のそれぞれの方向に1/2画素分だけずれた位置の画像になっている。

さらに、ブロックBは、予測画像の画素のブロックを表し、図２７では、8×4画素のブロックになっている。

ブロックPは、参照画像から予測画像を生成するときに補間フィルタとしてのFIR(Finite Impulse Response)フィルタがかけられる参照画像の画素のブロックを表し、予測画像のブロック（以下、予測ブロックともいう）Bを拡張したブロックになっている。

図２７では、ブロックPは、15×11画素のブロックになっている。インター予測部１０１８及び２０１０では、ブロックPの画素に、補間フィルタがかけられることで、ブロックBの予測画像が生成される。

ブロックRは、メモリからブロックPの画素を読み出すときにメモリから読み出さなければならない（メモリから読み出す必要がある）画素のブロックであり、図２７では、横×縦が5×6個の最小ブロックからなるブロック、すなわち、20×12画素のブロックになっている。

ここで、メモリからブロックPの画素を読み出すときにメモリから読み出さなければならないブロック（以下、読み出し必要ブロックともいう）Rの画素数(number of read pixels)を、NUM_Rと表すとともに、予測ブロックBの画素数(number of prediction pixels)を、NUM_Bと表すこととすると、メモリ帯域bandwidthは、例えば、式（１）で表される。

bandwidth＝NUM_R／NUM_B
・・・（１）

予測ブロックBの画素数NUM_Bは、その横の画素数と縦の画素数を、それぞれ、B_HとB_Vと表すこととすると、式（２）で表される。

NUM_B＝B_H×B_V
・・・（２）

図２７では、B_H×B_Vは、8×4画素になっている。

読み出し必要ブロックRの画素数NUM_Rは、その横の画素数と縦の画素数を、それぞれ、R_HとR_Vと表すこととすると、式（３）で表される。

NUM_R＝R_H×R_V
・・・（３）

いま、最小ブロックの横の画素数と縦の画素数を、それぞれAlign_HとAlign_Vと表すこととすると、最悪の場合で、読み出し必要ブロックRの横の画素数R_Hと縦の画素数R_Vは、それぞれ、式（４）と式（５）で表される。

R_H＝Align_H＋Align_H×ceil((P_H−1)／Align_H)
・・・（４）
R_V＝Align_V＋Align_V×ceil((P_V−1)／Align_V)
・・・（５）

なお、式（４）及び式（５）において、ceil(x)は、x以上の最小の整数を表す。また、P_H及びP_Vは、補間フィルタがかけられるブロックPの横及び縦の画素数を表し、それぞれ、式（６）及び式（７）で表される。

P_H＝B_H＋Tap_H−1
・・・（６）
P_V＝B_V＋Tap_V−1
・・・（７）

式（６）及び式（７）において、Tap_H及びTap_Vは、それぞれ、補間フィルタとしてのFIRフィルタの横及び縦のタップ数を表す。

最小ブロックが、複数の画素で構成される場合、メモリからは、インター予測に不要な画素が読み出されることがあるが、不要な画素は、メモリから読み出された後に破棄される。

最小ブロックが、横長の長方形である場合、メモリから読み出される読み出し必要ブロックRの左右の部分で、上下の部分よりも余分に読み出す画素が多くなる。

4×8等の縦長のブロックと、8×4等の横長のブロックとのように、画素数が同一であるが、形状が異なる予測ブロックBについては、メモリから、予測画像の生成のために読み出される画素に、インター予測に不要な画素が最も含まれる予測ブロックBが、メモリ帯域を最も消費するブロックとなる。

最小ブロックが、横長の長方形である場合、図２８に示すように、予測ブロックBを拡張したブロックP（補間フィルタがかけられるブロック）を含む読み出し必要ブロックRの画素を読み出すときに、予測ブロックBが縦長の長方形であるとき（図２８のＡ）の方が、横長の長方形であるとき（図２８のＢ）よりも、インター予測（補間フィルタによるフィルタリング）に不要な画素が多くなる。

このため、4×8等の縦長の予測ブロックBと、8×4等の横長の予測ブロックBとについては、画素数は同一であるが、縦長の予測ブロックBの予測の方が、横長の予測ブロックBの予測よりも、メモリ帯域を多く消費する。

図２９は、制限モードRVを説明する図である。

上述したように、制限モードRVによれば、画像のブロックのMC(ME)において予測画像の生成に用いる動きベクトルの数（参照ブロックの数）が制限される。

図２９では、制限モードRV＝V#iは、V1,V2、及び、V3の３つの値をとることができ、フレームレート(Frame rate)、及び、LCUのサイズ(LCU size)に応じて、動きベクトルの数が制限される。

例えば、フレームレートrateが、式０＜rate＜＝３０で表される範囲の値であり、LCUのサイズが、16×16画素である場合において、制限モードRVが、値V1に設定されたときには、MCで用いることができる動きベクトルの数は、32個に制限される。

ここで、制限モードRVでは、動きベクトルの数に代えて、DPB１０１４（DPB２００８）から読み出される参照ブロックの数を制限することができる。

図２９によれば、フレームレート及びLCUのサイズによって参照ブロックの数、又は、動きベクトルの数の最大値が制限される。

例えば、フレームレートが高くなると、必要最大帯域は大きくなるため、図２９によれば、フレームレートに比例して、参照ブロックの数、又は、動きベクトルの数が少なくなる。

エンコーダ１０００では、設定部１０２１が、フレームレート及びLCUのサイズの他、例えば、DPB１０１４のメモリ帯域の最大値に基づいて、制限モードRVを設定し、インター予測部１０１８、及び、エントロピ符号化部１００５に供給する。

インター予測部１０１８は、設定部１０２１からの制限モードRVに従って、予測画像の生成を行う。

一方、エントロピ符号化部１００５は、設定部１０２１からの制限モードRVを、符号化データに含めて伝送する。

エントロピ符号化部１００５では、制限モードRVを、符号化データの、例えば、SPSや、PPS，APS，スライスヘッダ等に含めることができる。

なお、設定部１０２１は、DPB１０１４のメモリ帯域の最大値が小さいほど、値V#iが大きい制限モードRVを設定する。

ここで、制限モードRVの値V#iが大きいとは、数字#iが大きいことを表す。

制限モードRVは、V1,V2,V3の順で、MCでの必要最大帯域が小さくなる。

設定部１０２１において、値V#iが大きい制限モードRVを設定することにより、予測画像の生成のために、DPB１０１４から復号画像が読み出されるときのメモリ帯域を抑制することができる。その結果、エンコーダ１０００の高コスト化を防止することができる。

デコーダ２０００では、エントロピ復号部２００１が、符号化データから制限モードRVを分離し、インター予測部２０１０に供給する。

インター予測部２０１０は、制限モードRVに従って、予測画像の生成を行う。

すなわち、インター予測部２０１０は、符号化データが、制限モードRVに適合している場合、例えば、制限モードRVにおいて、動きベクトルが、２つに制限されており、符号化データに、２つを超える動きベクトルを用いて予測画像が生成されるブロックが含まれていない場合、例えば、予測画像を生成する。

また、インター予測部２０１０は、符号化データが、制限モードRVに適合していない場合、例えば、制限モードRVにおいて、動きベクトルが、２つに制限されているのに、符号化データに、２つを超える動きベクトルを用いて予測画像が生成されるブロックが含まれる場合、上述した、符号化データが制限モードRBに適合していない場合と同様の処理を行う。

なお、エンコーダ１０００では、設定部１０２１において、エンコーダ１０００のオペレータ等のユーザの操作に従って、制限モードRVを設定することができる。

その他、エンコーダ１０００では、DPB１０１４のメモリ帯域の最大値を、必要最大帯域として、その必要最大帯域の制限量に応じて、プロファイルやレベルを定義しておき、さらに、制限モードRVを、プロファイルやレベルにリンクさせることができる。

ここで、レベルLv.#iの値#iが大きいほど、必要最大帯域が小であることとすると、レベルLv.#iは、例えば、制限モードRV=V#iにリンクさせることができる。

この場合、エンコーダ１０００において、例えば、レベルLv.1が設定されると、設定部１０２１は、制限モードRVを、レベルLv.1にリンクしているV1に設定する。

そして、エンコーダ１０００では、制限モードRVに従い、その制限モードRVが表す数（以下）に、動きベクトルの数を制限して符号化が行われ、プロファイル、及び、レベルの情報(level_idc等)が符号化データに含めて伝送される。

デコーダ２０００では、符号化データから、プロファイル、及び、レベルの情報が復号され、例えば、レベルから、そのレベルにリンクしている制限モードRVを認識することができる。

また、エンコーダ１０００では、符号化データに、制限モードRVを含めて伝送し、デコーダ２０００では、符号化データに含まれる制限モードRVを復号することができる。

デコーダ２０００は、符号化データが、制限モードRVに適合していない場合、符号化データが、制限モードRVに適合しない旨を、上位のシステムに伝える。この場合、上位のシステムにおいて、符号化データの取り扱いが判断される。

なお、プロファイル又はレベルによって、画像のサイズ（画枠）を表すことができる。例えば、レベルによって、画像のサイズが表される場合において、レベルの値が大きいほど、画像のサイズが大であるときには、レベルLv.#iを、制限モードRV=V#iにリンクさせておくことにより、エンコーダ１０００では、例えば、レベルによって表される画像のサイズが大であるほど、動きベクトルの数を少ない数に制限し、メモリ帯域を小にすることができる。

レベル（又はプロファイル）を制限モードRVにリンクさせる場合には、レベルを制限モードRBにリンクさせる場合と同様に、レベルから制限モードRVを認識することができるので、エンコーダ１０００では、制限モードRVを、符号化データに含めないこととすることができる。

ここで、ＬＣＵサイズが大きくなると、例えば、1ピクチャあたりのLCUの数が少なくなるので、LCUの数が少なくなる分だけ、1つのLCUに使用することができる参照ブロック数又はＭＶの本数は多くなる。

また、画像サイズが大きくなると、例えば、1ピクチャにおいて、所定のLCUサイズのLCUの数が多くなるので、LCUの数が多くなる分だけ、1つのLCUに使用することができる参照ブロック数又はＭＶの本数は少なくなる。

なお、上述したように、フレームレートに比例して、参照ブロックの数（又は、動きベクトル）の数を少なくする場合、図２９において、フレームレートが0<rate<=30で、LCUのサイズが8×8で、制限モードRVがV3であるときに、参照ブロックの数が2個であることを基準とすると、フレームレートが30<rate<=60で、LCUのサイズが8×8で、制限モードRVがV3であるときの、参照ブロックの数は1個（＝2個×1/2）に制限され、フレームレートが0<rate<=30で、LCUのサイズが8×8で、制限モードRVがV3であるときの、参照ブロックの数は0.5個（＝2個×1/2×1/2）に制限されることになる。

しかしながら、参照ブロックの数が、0.5個という非整数となるのは適切でないため、図２９では、計算上は、0.5個という参照ブロックの数が、（１つ以上の）参照ブロックの数として取り得る値の最小値である１に切り上げられている。

以上のように、参照ブロックの数が切り上げられている場合、その切り上げられた数の参照ブロックを読み出すことができるように、エンコーダ１０００のDPB１０１４及びデコーダ２０００のDPB２００８を実装する必要がある。

なお、制限モードRBとRVとは、併用することができる。また、識別情報と制限情報とは、併用することができる。

さらに、図２９の制限モードRVでは、LCUサイズに応じて、そのLCUで使用する動きベクトル、又は、参照ブロックの数を制限することとしたが、動きベクトル、又は、参照ブロックの数は、LCUの他、PUや、TU，SCU、ピクチャ等の領域単位で、その領域のサイズに応じて制限することができる。但し、動きベクトル等の数を制限する領域を、広すぎる領域とすると、その広い領域の一部分に多くの動きベクトル等が割り当てられ、その結果、他の部分に割り当てられる動きベクトルが極端に制限されることがある。また、動きベクトル等の数を制限する領域を、狭すぎる領域とすると、その狭い領域に割り当てられる動きベクトルの数が元々少ないため、動きベクトルの数を制限する自由度が小さくなる。したがって、動きベクトル等の数を制限する領域は、以上のことを考慮して、LCU等のように、適切なサイズの領域とすることが望ましい。

［識別情報を含むヘッダ情報のシンタクスの第１の例］

図３０は、識別情報を含む、符号化データのヘッダ情報のシンタクスの第１の例を示す図である。

すなわち、図３０は、ヘッダ情報seq_parameter_set_rbsp()のシンタクスを示しており、そのヘッダ情報seq_parameter_set_rbsp()に、識別情報としてのフラグdisable_bip_small_mrg_idcが含められている。

図３０のフラグdisable_bip_small_mrg_idcは、両方向予測(bi-prediction)が禁止されるブロック(prediction blocks)のサイズを表す。

図３１は、図３０の識別情報としてのフラグdisable_bip_small_mrg_idcがとる値と、各値のフラグdisable_bip_small_mrg_idcによって両方向予測が禁止されるブロックのサイズとを示す図である。

図３１では、フラグdisable_bip_small_mrg_idcは、0,1,2,3の値をとることができる。

フラグdisable_bip_small_mrg_idcの値が0である場合、両方向予測は、禁止されない。

フラグdisable_bip_small_mrg_idcの値が1である場合、4×4のブロック（ブロックサイズが4×4のブロック）について、両方向予測が禁止される。

フラグdisable_bip_small_mrg_idcの値が2である場合、4×4，8×4、及び、4×8の3種類のブロックについて、両方向予測が禁止され、フラグdisable_bip_small_mrg_idcの値が3である場合、4×4，8×4，4×8、及び、8×8の4種類のブロックについて、両方向予測が禁止される。

なお、図３０の識別情報としてのフラグdisable_bip_small_mrg_idcは、例えば、図１６の画像処理装置の設定部１０２１において設定され、インター予測部１０１８でのインター予測に用いられるとともに、エントロピ符号化部１００５において、符号化データに含められる。

また、図３０の識別情報としてのフラグdisable_bip_small_mrg_idcは、例えば、図１６の画像処理装置のエントロピ復号部２００１において、符号化データから分離され、インター予測部２０１０でのインター予測に用いられる。

［識別情報を含むヘッダ情報のシンタクスの第２の例］

図３２及び図３３は、識別情報を含む、符号化データのヘッダ情報のシンタクスの第２の例を示す図である。

すなわち、図３２は、ヘッダ情報seq_parameter_set_rbsp()のシンタクスを示しており、そのヘッダ情報seq_parameter_set_rbsp()に、識別情報としてのフラグdisable_inter_4x8_8x4_8x8_bidir_flag及びdisable_inter_4x8_8x4_bidir_flagが含められている。

図３２において、識別情報としてのフラグdisable_inter_4x8_8x4_8x8_bidir_flagは、4×8，8×4、及び、8×8の3種類のブロックに両方向予測を適用することができるかどうかを表す。

例えば、フラグdisable_inter_4x8_8x4_8x8_bidir_flagの値が0である場合には、4×8，8×4、及び、8×8の3種類のブロックの両方向予測が禁止されず、フラグdisable_inter_4x8_8x4_8x8_bidir_flagの値が1である場合には、4×8，8×4、及び、8×8の3種類のブロックの両方向予測が禁止される。

また、図３２において、識別情報としてのフラグdisable_inter_4x8_8x4_bidir_flagは、4×8及び8×4の2種類のブロックに両方向予測を適用することができるかどうかを表す。

例えば、フラグdisable_inter_4x8_8x4_bidir_flagの値が0である場合には、4×8及び8×4の2種類のブロックの両方向予測が禁止されず、フラグdisable_inter_4x8_8x4_bidir_flagの値が1である場合には、4×8及び8×4の2種類のブロックの両方向予測が禁止される。

したがって、フラグdisable_inter_4x8_8x4_8x8_bidir_flagの値が1である場合において、注目ブロックが、4×8，8×4、又は、8×8のブロックであるときには、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように置換して、注目ブロックについて、マージモードの処理が行われる。

また、フラグdisable_inter_4x8_8x4_bidir_flagの値が1である場合において、注目ブロックが、4×8又は8×4のブロックであるときには、両方向予測が適用されるマージ候補の予測方法を、両方向予測に代えて片方向予測を適用するように置換して、注目ブロックについて、マージモードの処理が行われる。

図３２において、フラグdisable_inter_4x8_8x4_8x8_bidir_flagは、フラグlog2_min_coding_block_size_minus3が1以下である場合に、ヘッダ情報seq_parameter_set_rbsp()に含められる。また、フラグdisable_inter_4x8_8x4_bidir_flagは、フラグlog2_min_coding_block_size_minus3が0であり、かつ、フラグdisable_inter_4x8_8x4_8x8_bidir_flagが0である場合に、ヘッダ情報seq_parameter_set_rbsp()に含められる。

ここで、フラグlog2_min_coding_block_size_minus3は、CU(coding block)の最小のサイズを表す。

フラグlog2_min_coding_block_size_minus3が表すCUの最小のサイズが、16×16より大きいサイズ（32×32又は64×64）である場合、注目ブロックとしてのPUとしては、16×16（以上）のサイズのブロックが使用され、8×8（以下）のサイズのブロックは使用されない。

したがって、フラグlog2_min_coding_block_size_minus3が表すCUの最小のサイズが、16×16より大きいサイズである場合には、識別情報としてのフラグdisable_inter_4x8_8x4_8x8_bidir_flag及びdisable_inter_4x8_8x4_bidir_flagは、意味がなくなるので、符号化データに含まれていても、エントロピ復号部２００１（図１６）では読み込まれない（無視される）。

なお、ヘッダ情報seq_parameter_set_rbsp()に、フラグdisable_inter_4x8_8x4_8x8_bidir_flagが存在しない場合には、フラグdisable_inter_4x8_8x4_8x8_bidir_flagの値は0であると推測される。

また、ヘッダ情報seq_parameter_set_rbsp()に、フラグdisable_inter_4x8_8x4_bidir_flagが存在しない場合には、フラグdisable_inter_4x8_8x4_8x8_bidir_flagの値が0であれば、フラグdisable_inter_4x8_8x4_bidir_flagの値も0であると推測され、フラグdisable_inter_4x8_8x4_8x8_bidir_flagの値が1であれば、フラグdisable_inter_4x8_8x4_bidir_flagの値も1であると推測される。

図３３は、ヘッダ情報prediction_unit(x0,y0,log2CbSize)のシンタクスを示しており、そのヘッダ情報prediction_unit(x0,y0,log2CbSize)に、識別情報としてのフラグdisable_bidirが含められている。

識別情報としてのフラグdisable_bidirは、図３２の識別情報としてのフラグdisable_inter_4x8_8x4_8x8_bidir_flag及びdisable_inter_4x8_8x4_bidir_flag等に応じて、値が0又は1に設定される。

フラグdisable_bidirの値が0である場合には、両方向予測は禁止されず、フラグdisable_bidirの値が1である場合には、両方向予測が禁止される。

図３３において、フラグdisable_bidirの後に記述されるフラグinter_pred_flag[x0][y0]は、x0及びy0によって表される位置のブロックの予測方法が、片方向予測であるか、又は、両方向予測であるか等を表すが、フラグdisable_bidirの値が1であり、両方向予測が禁止されている場合には、エントロピ復号部２００１（図１６）において、フラグinter_pred_flag[x0][y0]は、符号化データから読み込まれず、x0及びy0によって表される位置のブロックの予測方法が、片方向予測であると解釈される。

なお、図３２の識別情報としてのフラグdisable_inter_4x8_8x4_8x8_bidir_flag及びdisable_inter_4x8_8x4_bidir_flag、並びに、図３３の識別情報としてのフラグdisable_bidirは、例えば、図１６の画像処理装置の設定部１０２１において設定され、インター予測部１０１８でのインター予測に用いられるとともに、エントロピ符号化部１００５において、符号化データに含められる。

また、図３２の識別情報としてのフラグdisable_inter_4x8_8x4_8x8_bidir_flag及びdisable_inter_4x8_8x4_bidir_flag、並びに、図３３の識別情報としてのフラグdisable_bidirは、例えば、図１６の画像処理装置のエントロピ復号部２００１において、符号化データから分離され、インター予測部２０１０でのインター予測に用いられる。

ここで、図３２の識別情報としてのフラグdisable_inter_4x8_8x4_8x8_bidir_flag及びdisable_inter_4x8_8x4_bidir_flag、並びに、図３３の識別情報としてのフラグdisable_bidirは、マージモードを行う場合の他、マージモード以外で、インター予測を行う場合にも適用することができる。

また、図３２のヘッダ情報seq_parameter_set_rbsp()に含まれる識別情報としてのフラグdisable_inter_4x8_8x4_8x8_bidir_flag及びdisable_inter_4x8_8x4_bidir_flagには、8×8以下のブロックのうちの、4×4のブロックについて、両方向予測を適用することができるかどうかを表す情報が含まれていないが、これは、現時点では、ヘッダ情報seq_parameter_set_rbsp()に、フラグinter_4x4_enabled_flagが存在するためである。

すなわち、現時点では、図３０に示したヘッダ情報seq_parameter_set_rbsp()に、4×4のブロックの使用の可否を表すフラグinter_4x4_enabled_flagが定義されており、4×4のブロックの扱いについては、そのフラグinter_4x4_enabled_flagに従うこととするため、図３２では、4×4のブロックについて、両方向予測を適用することができるかどうかを表すフラグが定義されていない。

したがって、例えば、将来的に、フラグinter_4x4_enabled_flagが削除された場合には、4×4のブロックや、4×4以上のブロックサイズのブロックについて、両方向予測を適用することができるかどうかを表すフラグを定義し、4×4のブロックについての情報を含まないフラグdisable_inter_4x8_8x4_8x8_bidir_flag及びdisable_inter_4x8_8x4_bidir_flagに代えて（又は、フラグdisable_inter_4x8_8x4_8x8_bidir_flag及びdisable_inter_4x8_8x4_bidir_flagとともに）、図３２のヘッダ情報seq_parameter_set_rbsp()に含めることができる。

なお、本技術は、例えば、MPEG、H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本技術は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。さらに、本技術は、それらの画像符号化装置および画像復号装置などに含まれる動き予測補償装置にも適用することができる。

［パーソナルコンピュータ］
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な汎用のパーソナルコンピュータなどが含まれる。

図３４において、パーソナルコンピュータ５００のCPU（Central Processing Unit）５０１は、ROM（Read Only Memory）５０２に記憶されているプログラム、または記憶部５１３からRAM（Random Access Memory）５０３にロードされたプログラムに従って各種の処理を実行する。RAM５０３にはまた、CPU５０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU５０１、ROM５０２、およびRAM５０３は、バス５０４を介して相互に接続されている。このバス５０４にはまた、入出力インタフェース５１０も接続されている。

入出力インタフェース５１０には、キーボード、マウスなどよりなる入力部５１１、CRT（Cathode Ray Tube）やLCD（Liquid Crystal Display）などよりなるディスプレイ、並びにスピーカなどよりなる出力部５１２、ハードディスクなどより構成される記憶部５１３、モデムなどより構成される通信部５１４が接続されている。通信部５１４は、インターネットを含むネットワークを介しての通信処理を行う。

入出力インタフェース５１０にはまた、必要に応じてドライブ５１５が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア５２１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部５１３にインストールされる。

上述した一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、ネットワークや記録媒体からインストールされる。

この記録媒体は、例えば、図３４に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM（Compact Disc - Read Only Memory）,DVD（Digital Versatile Disc）を含む）、光磁気ディスク（MD（Mini Disc）を含む）、若しくは半導体メモリなどよりなるリムーバブルメディア５２１により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM５０２や、記憶部５１３に含まれるハードディスクなどで構成される。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数のデバイス（装置）により構成される装置全体を表すものである。

また、以上において、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。つまり、本技術は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

上述した実施の形態に係る画像処理装置は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

［第１の応用例：テレビジョン受像機］
図３５は、上述した実施の形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース９０９、制御部９１０、ユーザインタフェース９１１、及びバス９１２を備える。

チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

デマルチプレクサ９０３は、符号化ストリームから視聴対象の番組の画像（映像）ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ストリームからEPG（Electronic Program Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ９０４は、デマルチプレクサ９０３から入力される画像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される画像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

映像信号処理部９０５は、デコーダ９０４から入力される画像データを再生し、表示部９０６に画像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、画像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのGUI（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic ElectroLuminescence Display）（有機ELディスプレイ）など）の画像面上に画像を表示する。

音声信号処理部９０７は、デコーダ９０４から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

外部インタフェース９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース９０９を介して受信される画像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

制御部９１０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

ユーザインタフェース９１１は、制御部９１０と接続される。ユーザインタフェース９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース９０９及び制御部９１０を相互に接続する。

このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施の形態に係るデコーダ２０００の機能を有する。

［第２の応用例：携帯電話機］
図３６は、上述した実施の形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、ＲＡＭ又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Unallocated Space Bitmap）メモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記憶再生部９２９の記憶媒体に記憶させる。

また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された画像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから画像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、画像ストリームを復号し、画像データを生成する。画像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施の形態に係るエンコーダ１０００及びデコーダ２０００の機能を有する。

［第３の応用例：記録再生装置］
図３７は、上述した実施の形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び画像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び画像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び画像データを復号する。

記録再生装置９４０は、チューナ９４１、外部インタフェース９４２、エンコーダ９４３、HDD（Hard Disk Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、OSD（On-Screen Display）９４８、制御部９４９、及びユーザインタフェース９５０を備える。

チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送手段としての役割を有する。

外部インタフェース９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース９４２は、例えば、IEEE1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース９４２を介して受信される画像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース９４２は、記録再生装置９４０における伝送手段としての役割を有する。

エンコーダ９４３は、外部インタフェース９４２から入力される画像データ及び音声データが符号化されていない場合に、画像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ストリームをセレクタ９４６へ出力する。

HDD９４４は、画像及び音声などのコンテンツデータが圧縮された符号化ストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、HDD９４４は、画像及び音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばDVDディスク（DVD-Video、DVD-RAM、DVD-R、DVD-RW、DVD+R、DVD+RW等）又はBlu-ray（登録商標）ディスクなどであってよい。

セレクタ９４６は、画像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ストリームを選択し、選択した符号化ストリームをHDD９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、画像及び音声の再生時には、HDD９４４又はディスクドライブ９４５から入力される符号化ストリームをデコーダ９４７へ出力する。

デコーダ９４７は、符号化ストリームを復号し、画像データ及び音声データを生成する。そして、デコーダ９４７は、生成した画像データをOSD９４８へ出力する。また、デコーダ９０４は、生成した音声データを外部のスピーカへ出力する。

OSD９４８は、デコーダ９４７から入力される画像データを再生し、画像を表示する。また、OSD９４８は、表示する画像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。

制御部９４９は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

ユーザインタフェース９５０は、制御部９４９と接続される。ユーザインタフェース９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施の形態に係るエンコーダ１０００の機能を有する。また、デコーダ９４７は、上述した実施の形態に係るデコーダ２０００の機能を有する。

［第４の応用例：撮像装置］
図３８は、上述した実施の形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、OSD９６９、制御部９７０、ユーザインタフェース９７１、及びバス９７２を備える。

光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、OSD９６９、及び制御部９７０を相互に接続する。

光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、CCD（Charge Coupled Device）又はCMOS（Complementary Metal Oxide Semiconductor）などのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、OSD９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

OSD９６９は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部９６４へ出力する。

外部インタフェース９６６は、例えばUSB入出力端子として構成される。外部インタフェース９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース９６６は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース９６６は、撮像装置９６０における伝送手段としての役割を有する。

メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部９７０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

ユーザインタフェース９７１は、制御部９７０と接続される。ユーザインタフェース９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施の形態に係るエンコーダ１０００及びデコーダ２０００の機能を有する。

［多視画像点符号化・多視点画像復号への適用］

図３９は、多視点画像符号化方式の一例を示す図である。

上述した一連の処理は、多視点画像符号化・多視点画像復号に適用することができる。

図３９に示されるように、多視点画像は、複数の視点の画像を含み、その複数の視点のうちの所定の１つの視点の画像が、ベースビューの画像(base view)に指定される。ベースビューの画像以外の各視点の画像は、ノンベースビューの画像(non-base view)として扱われる。

図３９では、多視点画像として、３つの視点の画像が存在し、各視点の画像を識別するview_idが0の画像が、ベースビューの画像になっている。また、view_idが1及び2の画像それぞれが、ノンベースビューの画像になっている。

ここで、多視点画像符号化及び多視点画像復号では、ベースビューの画像は、他のビュー（視点）の画像を参照せずに処理（符号化、復号）される。一方、ノンベースビューの画像は、他のビューの画像を参照して処理することができる。図３９において、矢印は、画像の参照を表しており、矢印の始点側にある画像は、必要に応じて、矢印の終点側にある画像を参照して処理することができる。

図３９のような多視点画像を符号化・復号する場合、各ビューの画像を符号化・復号するが、この各ビューの符号化・復号に対して、図１６の画像処理装置の技術を適用することができる。このようにすることにより、上述したように、高コスト化を防止することができる。

さらに、各ビューの符号化・復号では、図１６の画像処理装置の技術において使用されるフラグその他の情報を共有することができる。

［多視点画像符号化装置］

図４０は、上述した多視点画像符号化を行う多視点画像符号化装置の構成例を示すブロック図である。

図４０に示されるように、多視点画像符号化装置６００は、符号化部６０１、符号化部６０２、及び多重化部６０３を有し、例えば、ベースビュー画像及びノンベースビュー画像の２視点の画像からなる多視点画像を符号化する。２視点の画像からなる多視点画像としては、例えば、左眼で観察される左眼用画像と、右眼で観察される右眼用画像とからなる3D(Dimensional)画像がある。

符号化部６０１は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部６０２は、ノンベースビュー画像を、必要に応じてベースビュー画像（符号化部６０１で符号化されてローカル復号されたベースビュー画像）を参照しながら符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部６０３は、符号化部６０１において生成されたベースビュー画像符号化ストリームと、符号化部６０２において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。

この多視点画像符号化装置６００の符号化部６０１及び符号化部６０２に対して、図１６の画像処理装置のエンコーダ１０００の技術を適用することができる。さらに、上述したように、符号化部６０１及び符号化部６０２は、フラグその他の情報を共有することができる。

［多視点画像復号装置］

図４１は、上述した多視点画像復号を行う多視点画像復号装置の構成例を示すブロック図である。

図４１に示されるように、多視点画像復号装置６１０は、逆多重化部６１１、復号部６１２、及び復号部６１３を有し、例えば、図４０の多視点画像符号化装置で得られる多視点画像符号化ストリームを復号する。

逆多重化部６１１は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部６１２は、逆多重化部６１１により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部６１３は、逆多重化部６１１により抽出されたノンベースビュー画像符号化ストリームを、必要に応じて復号部６１２で復号されたベースビュー画像を参照しながら復号し、ノンベースビュー画像を得る。

この多視点画像復号装置６１０の復号部６１２及び復号部６１３に対して、図１６の画像処理装置のデコーダ２０００を適用することができる。さらに、上述したように、復号部６１２及び復号部６１３は、フラグその他の情報を共有することができる。

［階層画像符号化・階層画像復号への適用］

図４２は、階層画像符号化方式の一例を示す図である。

上述した一連の処理は、階層画像符号化・階層画像復号に適用することができる。

図４２に示されるように、階層画像は、複数の階層(解像度)の画像を含み、その複数の階層のうちの所定の１つの階層の画像（例えば、最も低解像度の画像）が、ベースレイヤ(base layer)の画像に指定される。ベースレイヤの画像以外の各階層の画像は、ノンベースレイヤ(non-base layer)の画像として扱われる。

図４２では、階層画像として、３つの階層の画像が存在し、各階層の画像を識別するlayer_idが0の画像が、ベースレイヤの画像になっている。また、layer _idが1及び2の画像それぞれが、ノンベースレイヤの画像になっている。なお、layer_idが2のノンベースレイヤの画像は、例えば、あるコンテンツのオリジナルの解像度の画像であり、layer_idが1のノンベースレイヤの画像は、例えば、layer_idが2のノンベースレイヤの画像の解像度を劣化させた画像である。また、layer_idが0のベースレイヤの画像は、layer_idが1のノンベースレイヤの画像の解像度を劣化させた画像である。

ここで、階層画像符号化及び階層画像復号では、ベースレイヤの画像は、他のレイヤ（階層）の画像を参照せずに処理（符号化、復号）される。一方、ノンベースレイヤの画像は、他のレイヤの画像を参照して処理することができる。図４２では、図３９の場合と同様に、矢印は、画像の参照を表しており、矢印の始点側にある画像は、必要に応じて、矢印の終点側にある画像を参照して処理することができる。

図４２のような階層画像を符号化・復号する場合、各階層の画像を符号化・復号するが、この各階層の符号化・復号に対して、図１６の画像処理装置の技術を適用することができる。このようにすることにより、上述したように、高コスト化を防止することができる。

さらに、各階層の符号化・復号では、図１６の画像処理装置の技術において使用されるフラグその他の情報を共有することができる。

［階層画像符号化装置］

図４３は、上述した階層画像符号化を行う階層画像符号化装置の構成例を示すブロック図である。

図４３に示されるように、階層画像符号化装置６２０は、符号化部６２１、符号化部６２２、及び多重化部６２３を有し、例えば、ベースレイヤ画像及びノンベースレイヤ画像の２階層の画像からなる階層画像を符号化する。

符号化部６２１は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。符号化部６２２は、ノンベースレイヤ画像を、必要に応じてベースレイヤ画像（符号化部６２１で符号化されてローカル復号されたベースレイヤ画像）を参照しながら符号化し、ノンベースレイヤ画像符号化ストリームを生成する。多重化部６２３は、符号化部６２１において生成されたベースレイヤ画像符号化ストリームと、符号化部６２２において生成されたノンベースレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。

この階層画像符号化装置６２０の符号化部６２１及び符号化部６２２に対して、図１６の画像処理装置のエンコーダ１０００の技術を適用することができる。さらに、上述したように、符号化部６２１及び符号化部６２２は、フラグその他の情報を共有することができる。

［階層画像復号装置］

図４４は、上述した階層画像復号を行う階層画像復号装置の構成例を示すブロック図である。

図４４に示されるように、階層画像復号装置６３０は、逆多重化部６３１、復号部６３２、及び復号部６３３を有し、例えば、図４３の階層画像符号化装置で得られる階層画像符号化ストリームを復号する。

逆多重化部６３１は、ベースレイヤ画像符号化ストリームとノンベースレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを逆多重化し、ベースレイヤ画像符号化ストリームと、ノンベースレイヤ画像符号化ストリームとを抽出する。復号部６３２は、逆多重化部６３１により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。復号部６３３は、逆多重化部６３１により抽出されたノンベースレイヤ画像符号化ストリームを、必要に応じて復号部６３２で復号されたベースレイヤ画像を参照しながら復号し、ノンベースレイヤ画像を得る。

この階層画像復号装置６３０の復号部６３２及び復号部６３３に対して、図１６の画像処理装置のデコーダ２０００の技術を適用することができる。さらに、上述したように、復号部６３２及び復号部６３３は、フラグその他の情報を共有することができる。

［階層画像符号化方式の利用例］

上述の階層画像符号化方式の利用例について説明する。

［階層画像符号化方式の第１の利用例］

図４５は、階層画像符号化方式の第１の利用例を説明する図である。

階層画像符号化（以下、スケーラブル符号化ともいう）は、例えば、図４５に示される例のように、伝送するデータの選択のために利用することができる。

図４５に示されるデータ伝送システム３０００において、スケーラブル符号化データ記憶部３００１には、階層画像をスケーラブル符号化したスケーラブル符号化データが記憶されている。

配信サーバ３００２は、スケーラブル符号化データ記憶部３００１に記憶されているスケーラブル符号化データを読み出し、ネットワーク３００３を介して、パーソナルコンピュータ３００４、AV機器３００５、タブレットデバイス３００６、及び携帯電話機３００７等の端末装置に配信する。

その際、配信サーバ３００２は、端末装置の能力や通信環境等に応じて、適切な品質（解像度等）の符号化データを選択して伝送する。配信サーバ３００２が不要に高品質なデータを伝送しても、端末装置において高画質な画像を得られるとは限らず、遅延やオーバフローの発生要因となる恐れがある。また、高品質なデータは、不要に通信帯域を占有することや、端末装置の負荷を不要に増大させる恐れがある。逆に、配信サーバ３００２が低品質なデータしか伝送しないのでは、端末装置の動力や通信環境が十分であっても、高画質の画像を得ることが困難になる。そのため、配信サーバ３００２は、適宜、端末装置の能力や通信環境等に対して適切な品質（レイヤ）の符号化データを、スケーラブル符号化データ記憶部３００１から読み出し、伝送する。

ここで、図４５では、スケーラブル符号化データ記憶部３００１には、スケーラブル符号化データ（BL+EL）３０１１が記憶されている。スケーラブル符号化データ（BL+EL）３０１１は、ベースレイヤ画像符号化ストリームBLとノンベースレイヤ画像符号化ストリームELとが多重化された階層画像符号化ストリームである。

ベースレイヤ画像符号化ストリームBLは、ベースレイヤの画像を符号化することにより得られる符号化データである。また、ノンベースレイヤ画像符号化ストリームELは、必要に応じて、ベースレイヤの画像を参照しながら、ノンベースレイヤ（エンハンスレイヤ）の画像の符号化を行うことにより得られる符号化データである。

したがって、スケーラブル符号化データ（BL+EL）３０１１は、ベースレイヤとノンベースレイヤの両方の画像を含む符号化データであり、復号することにより、ベースレイヤの画像及びノンベースレイヤの画像の両方を得ることができるデータである。

配信サーバ３００２は、データを受信する（配信を受ける）端末装置の能力や通信環境等に応じて、適切なレイヤを選択し、そのレイヤの（画像を復号するのに必要な）データを、スケーラブル符号化データ記憶部３００１から読み出す。例えば、配信サーバ３００２は、処理能力の高いパーソナルコンピュータ３００４やタブレットデバイス３００６に対しては、高品質な（画像が得られる）スケーラブル符号化データ（BL+EL）３０１１をスケーラブル符号化データ記憶部３００１から読み出し、そのまま伝送する。これに対して、例えば、配信サーバ３００２は、処理能力の低いAV機器３００５や携帯電話機３００７に対しては、スケーラブル符号化データ（BL+EL）３０１１からベースレイヤのデータ（ベースレイヤ画像符号化ストリームBL）を抽出し、スケーラブル符号化データ（BL+EL）３０１１と内容的には同じコンテンツのデータであるが、スケーラブル符号化データ（BL+EL）３０１１よりも低品質なスケーラブル符号化データ（BL）３０１２として伝送する。

このようにスケーラブル符号化データを用いることにより、データ量を容易に調整することができるので、遅延やオーバフローの発生を抑制することや、端末装置や通信媒体の負荷の不要な増大を抑制することができる。

また、スケーラブル符号化では、ノンベースレイヤ（エンハンスレイヤ）の画像の符号化は、ベースレイヤの画像を参照しながら行われるので、スケーラブル符号化データ（BL+EL）３０１１については、レイヤ間の冗長性が低減され、ノンベースレイヤの画像を、他のレイヤの画像を参照せずに、いわば独立に符号化する場合よりも、データ量が少なくなる。したがって、スケーラブル符号化データ記憶部３００１の記憶領域をより効率よく使用することができる。

なお、配信サーバ３００２からのデータを受信する端末装置には、パーソナルコンピュータ３００４ないし携帯電話機３００７のような様々な装置を採用することができ、端末装置のハードウエアの性能は、様々である。また、端末装置が実行するアプリケーションは様々であり、そのソフトウエアの能力も様々である。さらに、通信媒体となるネットワーク３００３には、例えばインターネットやLAN（Local Area Network）等、有線若しくは無線、又はその両方を含むあらゆる通信回線網を採用することができ、そのデータ伝送能力は様々である。さらに、通信媒体となるネットワーク３００３のデータ伝送能力は、トラフィック量その他の通信環境によって変化することがある。

そこで、配信サーバ３００２は、データ伝送を開始する前に、データの伝送先となる端末装置と通信を行い、端末装置のハードウエア性能や、端末装置が実行するアプリケーション（ソフトウエア）の性能等といった端末装置の能力に関する情報、並びに、ネットワーク３００３の利用可能帯域幅等の通信環境に関する情報を得ることができる。そして、配信サーバ３００２は、端末装置の能力に関する情報や通信環境に関する情報を基に、適切なレイヤを選択することができる。

なお、スケーラブル符号化データ（BL+EL）３０１１からの、スケーラブル符号化データ（BL）３０１２の抽出は、配信サーバ３００２の他、端末装置において行うことができる。例えば、パーソナルコンピュータ３００４は、配信サーバ３００２から伝送されたスケーラブル符号化データ（BL+EL）３０１１を復号し、ノンベースレイヤの画像を表示する他、配信サーバ３００２から伝送されたスケーラブル符号化データ（BL+EL）３０１１から、ベースレイヤのスケーラブル符号化データ（BL）３０１２を抽出し、記憶することや、他の装置に転送すること、復号してベースレイヤの画像を表示することができる。

もちろん、スケーラブル符号化データ記憶部３００１、配信サーバ３００２、ネットワーク３００３、及び端末装置の数はいずれも任意である。

また、端末装置は、配信サーバ３００２から、例えば、複数のコンテンツのスケーラブル符号化データを受信することができる。さらに、端末装置は、配信サーバ３００２から、複数のコンテンツのスケーラブル符号化データを受信する場合には、例えば、その複数のコンテンツのうちの１つのコンテンツについては、ノンベースレイヤの画像を表示し、他のコンテンツについては、ベースレイヤの画像を表示する、いわゆる２画面表示等の複数画面の表示を行うことができる。

［階層画像符号化方式の第２の利用例］

図４６は、階層画像符号化方式の第２の利用例を説明する図である。

スケーラブル符号化は、例えば、図４６に示される例のように、複数の通信媒体を介する伝送のために利用することができる。

図４６に示されるデータ伝送システム３１００において、放送局３１０１は、地上波放送３１１１により、ベースレイヤのスケーラブル符号化データ（BL）３１２１を伝送する。また、放送局３１０１は、有線若しくは無線又はその両方の通信網よりなる任意のネットワーク３１１２を介して、ノンベースレイヤのスケーラブル符号化データ（EL）３１２２を伝送する（例えばパケット化して伝送する）。

端末装置３１０２は、放送局３１０１が放送する地上波放送３１１１の受信機能を有し、この地上波放送３１１１を介して伝送されるベースレイヤのスケーラブル符号化データ（BL）３１２１を受け取る。また、端末装置３１０２は、ネットワーク３１１２を介した通信を行う通信機能をさらに有し、このネットワーク３１１２を介して伝送されるノンベースレイヤのスケーラブル符号化データ（EL）３１２２を受け取る。

端末装置３１０２は、例えばユーザ指示等に応じて、地上波放送３１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）３１２１を、復号してベースレイヤの画像を得ることや、記憶すること、他の装置に伝送することができる。

また、端末装置３１０２は、例えばユーザ指示等に応じて、地上波放送３１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）３１２１と、ネットワーク３１１２を介して取得したノンベースレイヤのスケーラブル符号化データ（EL）３１２２とを合成して、スケーラブル符号化データ（BL+EL）を得ることや、それを復号してノンベースレイヤの画像を得ること、記憶すること、他の装置に伝送することができる。

以上のように、スケーラブル符号化データは、例えばレイヤ毎に異なる通信媒体を介して伝送させることができる。この場合、負荷を分散させることができ、遅延やオーバフローの発生を抑制することができる。

また、状況に応じて、伝送に使用する通信媒体を、レイヤ毎に選択することができる。例えば、データ量が比較的多いベースレイヤのスケーラブル符号化データ（BL）３１２１を帯域幅の広い通信媒体を介して伝送させ、データ量が比較的少ないノンベースレイヤのスケーラブル符号化データ（EL）３１２２を帯域幅の狭い通信媒体を介して伝送させることができる。また、例えば、ノンベースレイヤのスケーラブル符号化データ（EL）３１２２を伝送する通信媒体を、ネットワーク３１１２とするか、地上波放送３１１１とするかを、ネットワーク３１１２の利用可能帯域幅に応じて切り替えることができる。もちろん、任意のレイヤのデータについて同様である。

このように制御することにより、データ伝送における負荷の増大を、より抑制することができる。

なお、レイヤ数は任意であり、伝送に利用する通信媒体の数も任意である。また、データ配信先となる端末装置３１０２の数も任意である。さらに、図４６に示したような、スケーラブル符号化された符号化データを、レイヤを単位として複数に分割し、複数の回線を介して伝送するデータ伝送システム３１００は、放送を用いるシステムに限定されるものではない。

［階層画像符号化方式の第３の利用例］

図４７は、階層画像符号化方式の第３の利用例を説明する図である。

スケーラブル符号化は、例えば、図４７に示される例のように、符号化データの記憶に利用することができる。

図４７に示される撮像システム３２００において、撮像装置３２０１は、被写体３２１１を撮像して得られた画像データをスケーラブル符号化し、スケーラブル符号化データ（BL+EL）３２２１として、スケーラブル符号化データ記憶装置３２０２に供給する。

スケーラブル符号化データ記憶装置３２０２は、撮像装置３２０１から供給されるスケーラブル符号化データ（BL+EL）３２２１を、状況に応じた品質（解像度）で記憶する。例えば、通常時の場合、スケーラブル符号化データ記憶装置３２０２は、スケーラブル符号化データ（BL+EL）３２２１からベースレイヤのデータを抽出し、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）３２２２として記憶する。これに対して、例えば、注目時の場合、スケーラブル符号化データ記憶装置３２０２は、高品質でデータ量の多いスケーラブル符号化データ（BL+EL）３２２１のまま記憶する。

このようにすることにより、スケーラブル符号化データ記憶装置３２０２は、必要な場合のみ、画像を高画質に保存することができるので、画質劣化による画像の価値の低減を抑制しながら、データ量の増大を抑制することができ、記憶領域の利用効率を向上させることができる。

例えば、撮像装置３２０１が監視カメラであるとする。撮像画像（撮像装置３２０１で得られるが画像データ）に監視対象（例えば侵入者）が写っていない場合（通常時の場合）、撮像画像の内容は重要でない可能性が高いので、データ量の低減が優先され、その撮像画像（スケーラブル符号化データ）は、低品質に記憶される。これに対して、撮像画像に監視対象が被写体３２１１として写っている場合（注目時の場合）、その撮像画像の内容は重要である可能性が高いので、画質が優先され、その撮像画像（スケーラブル符号化データ）は、高品質に記憶される。

なお、通常時であるか注目時であるかは、例えば、スケーラブル符号化データ記憶装置３２０２が、画像を解析することにより判定することができる。また、通常時であるか注目時であるかは、例えば、撮像装置３２０１が判定し、その判定結果をスケーラブル符号化データ記憶装置３２０２に伝送することができる。

なお、通常時であるか注目時であるかの判定基準は任意であり、判定基準とする撮像画像の内容は任意である。もちろん、撮像画像の内容以外の条件を判定基準とすることもできる。例えば、収録した音声の大きさや波形等に応じて、通常時であるか注目時であるかを判定することができる。また、通常時と注目時とは、例えば、所定の時間毎に切り替えることや、ユーザ指示等の外部からの指示によって切り替えることができる。

また、以上においては、通常時と注目時の２つの状態を切り替える例を説明したが、状態の数は任意であり、例えば、通常時、やや注目時、注目時、非常に注目時等のように、３つ以上の状態を切り替えることができる。但し、この切り替える状態の上限数は、スケーラブル符号化データのレイヤ数に依存する。

また、撮像装置３２０１は、スケーラブル符号化のレイヤ数を、状態に応じて決定することができる。例えば、通常時の場合、撮像装置３２０１は、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）３２２２を生成し、スケーラブル符号化データ記憶装置３２０２に供給することができる。また、例えば、注目時の場合、撮像装置３２０１は、高品質でデータ量の多いベースレイヤ及びノンベースレイヤのスケーラブル符号化データ（BL+EL）３２２１を生成し、スケーラブル符号化データ記憶装置３２０２に供給することができる。

なお、撮像システム３２００の用途は任意であり、監視カメラに限定されない。

なお、本明細書では、予測モード情報及びマージ情報などの様々な情報が、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ストリームに多重化されることなく、符号化ストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、符号化ストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又は符号化ストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又は符号化ストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又は符号化ストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

以上、添付図面を参照しながら本技術の好適な実施の形態について詳細に説明したが、本発明はかかる例に限定されない。本技術の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本技術の技術的範囲に属するものと了解される。

１００画像符号化装置，１０６可逆符号化部，１２１符号化制御部，１４３マージフラグ符号化部，１４４マージモード符号化部，２００画像復号装置，２０２可逆復号部，２２１復号制御部，２４３マージフラグ復号部，２４４マージモード復号部，１００１入力ピクチャバッファ，１００２演算部，１００３直交変換部，１００４量子化部，１００５エントロピ符号化部，１００６逆量子化部，１００７逆直交変換部，１００８演算部，１００９デブロックフィルタ，１０１０適応サンプルオフセット部，１０１１適応サンプルオフセット推定部，１０１２適応ループフィルタ，１０１３適応ループフィルタ推定部，１０１４ DPB，１０１５イントラ方向推定部，１０１６イントラ予測部，１０１７動き推定部，１０１８インター予測部，１０１９モード判定部，１０２１設定部，２００１エントロピ復号部，２００２逆量子化部，２００３逆直交変換部，２００４演算部，２００５デブロックフィルタ，２００６適応サンプルオフセット部，２００７適応ループフィルタ，２００８ DPB，２００９イントラ予測部，２０１０インター予測部，２０１１モード選択部

本技術の一側面の画像処理装置は、画像とインター予測による予測画像との差分を符号化して生成され、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定された、前記インター予測を行う際の処理単位であるプレディクションユニットに適用する双方向予測を禁止する制限情報を含む符号化ストリームを受け取る受け取り部と、前記制限情報に従って生成された予測画像を用いて、前記受け取り部により受け取られた前記符号化ストリームを復号する復号部とを備える画像処理装置である。

本技術の一側面の画像処理方法は、画像とインター予測による予測画像との差分を符号化して生成され、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定された、前記インター予測を行う際の処理単位であるプレディクションユニットに適用する双方向予測を禁止する制限情報を含む符号化ストリームを受け取る受け取り処理を含む画像処理方法である。

以上のような一側面においては、画像とインター予測による予測画像との差分を符号化して生成され、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定された、前記インター予測を行う際の処理単位であるプレディクションユニットに適用する双方向予測を禁止する制限情報を含む符号化ストリームが受け取られ、前記制限情報に従って生成された予測画像を用いて、受け取られた前記符号化ストリームが復号される。

Claims

画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定部と、
前記設定部により設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化部とを備え、
前記設定部は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する
画像処理装置。
前記設定部により設定された制限情報に従って、前記予測画像を生成する予測部をさらに含み、
前記符号化部は、前記予測部により生成された前記予測画像を用いて前記画像を符号化し、前記符号化ストリームを生成する
請求項１に記載の画像処理装置。
前記符号化部により生成された符号化ストリームと前記設定部により設定された制限情報とを伝送する伝送部をさらに含む
請求項１に記載の画像処理装置。
前記プレディクションユニットのサイズは、4×4、8×4、4×8，および8×8のうちのいずれかである
請求項１に記載の画像処理装置。
前記設定部は、前記メモリ帯域が小であるほど、大きなサイズのブロックに、所定の予測方法が適用されることを制限する制限情報を設定する
請求項１に記載の画像処理装置。
前記所定の予測方法は、両方向予測、又は、両方向予測及び片方向予測の両方である
請求項５に記載の画像処理装置。
前記設定部は、プロファイル又はレベルに基づいて、前記制限情報を設定する
請求項１に記載の画像処理装置。
前記設定部は、プロファイル又はレベルによって表される前記画像のサイズが大であるほど、大きなサイズのブロックに、所定の予測方法が適用されることを制限する制限情報を設定する
請求項７に記載の画像処理装置。
前記所定の予測方法は、両方向予測、又は、両方向予測及び片方向予測の両方である
請求項８に記載の画像処理装置。
画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定ステップと、
前記設定ステップにより設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化ステップとを含み、
前記設定ステップの処理は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する
画像処理方法。
画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定部と、
前記設定部により設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化部としてコンピュータを機能させ、
前記設定部は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する
プログラム。
画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定部と、
前記設定部により設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化部としてコンピュータを機能させ、
前記設定部は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する
プログラムが記録された記録媒体。
画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を含む符号化ストリームを受け取る受け取り部と、
前記受け取り部により受け取られた制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取り部により受け取られた前記符号化ストリームを復号する復号部とを備え、
前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される
画像処理装置。
前記受け取り部により受け取られた制限情報に従って、予測画像を生成する予測部をさらに含み、
前記受け取り部は、前記制限情報と、前記画像を符号化することにより生成された前記符号化ストリームを受け取り、
前記復号部は、前記予測部により生成された予測画像を用いて、前記受け取り部により受け取られた前記符号化ストリームを復号する
請求項１３に記載の画像処理装置。
前記プレディクションユニットのサイズは、4×4、8×4、4×8，および8×8のうちのいずれかである
請求項１３に記載の画像処理装置。
前記予測部は、前記符号化ストリームが、前記制限情報に適合している場合に、前記予測画像を生成する
請求項１４に記載の画像処理装置。
画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報と、前記画像を符号化することにより生成された符号化ストリームを受け取る受け取りステップと、
前記受け取りステップにより受け取られた制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取りステップにより受け取られた符号化ストリームを復号する復号ステップとを含み、
前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される
画像処理方法。
画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報と、前記画像を符号化することにより生成された符号化ストリームを受け取る受け取り部と、
前記受け取り部により受け取られた制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取り部により受け取られた前記符号化ストリームを復号する復号部としてコンピュータを機能させ、
前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される
プログラム。
画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報と、前記画像を符号化することにより生成された符号化ストリームを受け取る受け取り部と、
前記受け取り部により受け取られた制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取り部により受け取られた前記符号化ストリームを復号する復号部としてコンピュータを機能させ、
前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される
プログラムが記録された記録媒体。
プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定部と、
前記設定部により設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化部とを備え、
前記設定部は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する
画像処理装置。
プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定ステップと、
前記設定ステップにより設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化ステップとを含み、
前記設定ステップの処理は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する
画像処理方法。
プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報を設定する設定部と、
前記設定部により設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化部としてコンピュータを機能させ、
前記設定部は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する
プログラム。
プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記コーディングユニットに適用する双方向予測を禁止する制限情報を設定する設定部と、
前記設定部により設定された制限情報に従って、予測画像を生成し、前記予測画像を用いて前記画像を符号化し、符号化ストリームを生成する符号化部と、
前記符号化部により生成された符号化ストリームを伝送する伝送部としてコンピュータを機能させ、
前記設定部は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて、前記制限情報を設定する
プログラムが記録された記録媒体。
プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報に従って符号化された
符号化ストリームを受け取る受け取り部と、
前記プロファイル又はレベルに基づいて認識される前記制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取り部により受け取られた符号化ストリームを復号する復号部とを備え、
前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される
画像処理装置。
プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報に従って符号化された
符号化ストリームを受け取る受け取りステップと、
前記プロファイル又はレベルに基づいて認識される前記制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取りステップにより受け取られた符号化ストリームを復号する復号ステップとを含み、
前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される
画像処理方法。
プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報に従って符号化された
符号化ストリームを受け取る受け取り部と、
前記プロファイル又はレベルに基づいて認識される前記制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取り部により受け取られた符号化ストリームを復号する復号部としてコンピュータを機能させ、
前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される
プログラム。
プロファイル又はレベルに基づいて、画像の階層構造により表されるブロックであるコーディングユニットがイントラ若しくはインター予測の処理単位となる領域であるプレディクションユニットに分割される場合に、前記プレディクションユニットのサイズ、及び、前記プレディクションユニットのサイズの前記プレディクションユニットに適用する双方向予測を禁止する制限情報に従って符号化された
符号化ストリームを受け取る受け取り部と、
前記プロファイル又はレベルに基づいて認識される前記制限情報に従って、予測画像を生成し、前記予測画像を用いて、前記受け取り部により受け取られた符号化ストリームを復号する復号部としてコンピュータを機能させ、
前記制限情報は、前記予測画像を生成する際に用いられる復号画像を記憶する記憶部から前記復号画像が読み出される伝送レートであるメモリ帯域に基づいて設定される
プログラムが記録された記録媒体。