WO2014050311A1

WO2014050311A1 - 画像処理装置及び画像処理方法

Info

Publication number: WO2014050311A1
Application number: PCT/JP2013/071049
Authority: WO
Inventors: 佐藤　数史
Original assignee: ソニー株式会社
Priority date: 2012-09-28
Filing date: 2013-08-02
Publication date: 2014-04-03

Abstract

【課題】ＢＬＲモードでのリコンストラクト画像の再利用の仕方を改善し、エンハンスメントレイヤの符号量を削減すること。【解決手段】ベースレイヤの符号化ストリームを復号して、前記ベースレイヤのリコンストラクト画像を生成するベースレイヤ復号部と、前記ベースレイヤ復号部により生成される前記リコンストラクト画像を用いて、エンハンスメントレイヤのための量子化パラメータを予測する制御部と、前記制御部により予測される前記量子化パラメータを用いて、前記エンハンスメントレイヤの変換係数データを逆量子化する逆量子化部と、を備える画像処理装置を提供する。

Description

画像処理装置及び画像処理方法

　本開示は、画像処理装置及び画像処理方法に関する。

　現在、Ｈ．２６４／ＡＶＣよりも符号化効率をさらに向上することを目的として、ＩＴＵ－ＴとＩＳＯ／ＩＥＣとの共同の標準化団体であるＪＣＴＶＣ（Joint　Collaboration　Team-Video　Coding）により、ＨＥＶＣ（High　Efficiency　Video　Coding）と呼ばれる画像符号化方式の標準化が進められている。ＨＥＶＣ方式については、２０１２年７月にドラフト版仕様８が発行されている（下記非特許文献１参照）。

　また、端末のケイパビリティの多様化及び通信環境の多様化に対応するために、スケーラブル符号化技術への注目が集まっている。スケーラブル符号化（ＳＶＣ：Scalable　Video　Coding）とは、一般には、粗い画像信号を伝送するレイヤと精細な画像信号を伝送するレイヤとを階層的に符号化する技術をいう。スケーラブル符号化において階層化される典型的な属性は、主に次の３種類である。
　　－空間スケーラビリティ：空間解像度あるいは画像サイズが階層化される。
　　－時間スケーラビリティ：フレームレートが階層化される。
　　－ＳＮＲ（Signal　to　Noise　Ratio）スケーラビリティ：ＳＮ比が階層化される。
さらに、標準規格で未だ採用されていないものの、ビット深度スケーラビリティ及びクロマフォーマットスケーラビリティもまた議論されている。

　スケーラブル符号化では、通常、ベースレイヤで符号化されるパラメータをエンハンスメントレイヤにおいて再利用することで、符号化効率が高められる。但し、レイヤ間でパラメータのマッピングが困難である場合、パラメータの再利用には何らかの制約（例えば、あるレイヤにおいて、他のレイヤによりサポートされないモードが選択されない、など）が伴うことが少なくない。そこで、下記非特許文献２は、ベースレイヤのリコンストラクト画像のみを再利用することによりスケーラビリティを実現する、ＢＬＲ（spatial　scalability　using　BL　Reconstructed　pixel　only）モードという手法を提案している。ＢＬＲモードでは、レイヤごとの独立性が強化される。

Benjamin　Bross,　Woo-Jin　Han,　Jens-Rainer　Ohm,　Gary　J.　Sullivan,　Thomas　Wiegand,　"High　efficiency　video　coding　(HEVC)　text　specification　draft　8"（JCTVC-J1003_d7,　July　11-20，2012） Hisao　Kumai，　Tomoyuki　Yamamoto，　Andrew　Segall，　Maki　Takahashi，　Yukinobu　Yasugi，　Shuichi　Watanabe，　"Proposals　for　HEVC　scalability　Extension"（ISO/IEC　JTC1/SC29/WG11　MPEG2012/m25749，　July　2012，　Stockholm，　Sweden）

　しかしながら、ベースレイヤのリコンストラクト画像のみをエンハンスメントレイヤにおいて再利用するＢＬＲモードでは、エンハンスメントレイヤにおいて多くのパラメータを符号化することが求められる。

　従って、符号化効率の観点からは、リコンストラクト画像の再利用の仕方を改善してエンハンスメントレイヤの符号量を削減することが望ましい。

　本開示によれば、ベースレイヤの符号化ストリームを復号して、前記ベースレイヤのリコンストラクト画像を生成するベースレイヤ復号部と、前記ベースレイヤ復号部により生成される前記リコンストラクト画像を用いて、エンハンスメントレイヤのための量子化パラメータを予測する制御部と、前記制御部により予測される前記量子化パラメータを用いて、前記エンハンスメントレイヤの変換係数データを逆量子化する逆量子化部と、を備える画像処理装置が提供される。

　上記画像処理装置は、画像を復号する画像復号装置として実現されてもよい。その代わりに、上記画像処理装置は、画像を符号化する画像符号化装置として実現されてもよい。後者の場合、ベースレイヤ復号部は、ベースレイヤのために動作するローカルデコーダであってもよい。

　また、本開示によれば、ベースレイヤの符号化ストリームを復号して、前記ベースレイヤのリコンストラクト画像を生成することと、生成される前記リコンストラクト画像を用いて、エンハンスメントレイヤのための量子化パラメータを予測することと、予測される前記量子化パラメータを用いて、前記エンハンスメントレイヤの変換係数データを逆量子化することと、を含む画像処理方法が提供される。

　本開示に係る技術によれば、ＢＬＲモードでのリコンストラクト画像の再利用の仕方が改善され、エンハンスメントレイヤの符号量が削減される結果として、符号化効率が向上し得る。

スケーラブル符号化について説明するための説明図である。ＢＬＲモードでのスケーラブル符号化について説明するための説明図である。レート制御の粒度が大き過ぎる場合の問題点について説明するための説明図である。量子化パラメータと量子化ステップとの間の関係の一例を示す説明図である。ＣＴＢ内予測及びＣＴＢ間予測におけるブロック間の参照関係の一例を示す説明図である。一実施形態に係る画像符号化装置の概略的な構成を示すブロック図である。一実施形態に係る画像復号装置の概略的な構成を示すブロック図である。図６に示したＥＬ符号化部の構成の一例を示すブロック図である。図８に示した量子化制御部の第１の構成例を示すブロック図である。図８に示した量子化制御部の第２の構成例を示すブロック図である。ＪＮＤモデルに従って定義される平均画素値と差分予測値との間の関係の一例を示す説明図である。図８に示した量子化制御部の第３の構成例を示すブロック図である。ＥＬ符号化部の構成の一変形例を示すブロック図である。一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。エンハンスメントレイヤの符号化処理におけるレート制御に関連する処理の流れの一例を示すフローチャートである。図１５に示したレート制御関連パラメータ生成処理の詳細な流れの第１の例を示すフローチャートである。図１５に示したレート制御関連パラメータ生成処理の詳細な流れの第２の例を示すフローチャートである。図１５に示したレート制御関連パラメータ生成処理の詳細な流れの第３の例を示すフローチャートである。図７に示したＥＬ復号部の構成の一例を示すブロック図である。図１９に示した逆量子化制御部の第１の構成例を示すブロック図である。図１９に示した逆量子化制御部の第２の構成例を示すブロック図である。図１９に示した逆量子化制御部の第３の構成例を示すブロック図である。ＥＬ復号部の構成の一変形例を示すブロック図である。一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。エンハンスメントレイヤの復号処理におけるレート制御に関連する処理の流れの一例を示すフローチャートである。図２５に示した量子化パラメータ再構築処理の詳細な流れの第１の例を示すフローチャートである。図２５に示した量子化パラメータ再構築処理の詳細な流れの第２の例を示すフローチャートである。図２５に示した量子化パラメータ再構築処理の詳細な流れの第３の例を示すフローチャートである。許容され又は禁止され得るコーデックの組合せについて説明するための第１の説明図である。許容され又は禁止され得るコーデックの組合せについて説明するための第２の説明図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。スケーラブル符号化の用途の第１の例について説明するための説明図である。スケーラブル符号化の用途の第２の例について説明するための説明図である。スケーラブル符号化の用途の第３の例について説明するための説明図である。マルチビューコーデックについて説明するための説明図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　また、以下の順序で説明を行う。
　　１．概要
　　　１－１．スケーラブル符号化
　　　１－２．ＢＬＲモード
　　　１－３．一般的なレート制御
　　　１－４．エンコーダの基本的な構成例
　　　１－５．デコーダの基本的な構成例
　　２．一実施形態に係るＥＬ符号化部の構成例
　　　２－１．全体的な構成
　　　２－２．量子化制御部の第１の構成例
　　　２－３．量子化制御部の第２の構成例
　　　２－４．量子化制御部の第３の構成例
　　　２－５．追加的なパラメータ
　　　２－６．変形例
　　３．一実施形態に係る符号化時の処理の流れ
　　　３－１．概略的な流れ
　　　３－２．レート制御に関連する処理
　　　３－３．レート制御関連パラメータ生成処理
　　４．一実施形態に係るＥＬ復号部の構成例
　　　４－１．全体的な構成
　　　４－２．逆量子化制御部の第１の構成例
　　　４－３．逆量子化制御部の第２の構成例
　　　４－４．逆量子化制御部の第３の構成例
　　　４－５．追加的なパラメータ
　　　４－６．変形例
　　５．一実施形態に係る復号時の処理の流れ
　　　５－１．概略的な流れ
　　　５－２．レート制御に関連する処理
　　　５－３．量子化パラメータ再構築処理
　　６．コーデックの組合せの例
　　７．応用例
　　　７－１．様々な製品への応用
　　　７－２．スケーラブル符号化の様々な用途
　　　７－３．その他
　　８．まとめ

　＜１．概要＞
　　［１－１．スケーラブル符号化］
　スケーラブル符号化においては、一連の画像をそれぞれ含む複数のレイヤが符号化される。ベースレイヤ（base　layer）は、最初に符号化される、最も粗い画像を表現するレイヤである。ベースレイヤの符号化ストリームは、他のレイヤの符号化ストリームを復号することなく、独立して復号され得る。ベースレイヤ以外のレイヤは、エンハンスメントレイヤ（enhancement　layer）と呼ばれる、より精細な画像を表現するレイヤである。エンハンスメントレイヤの符号化ストリームは、ベースレイヤの符号化ストリームに含まれる情報を用いて符号化される。従って、エンハンスメントレイヤの画像を再現するためには、ベースレイヤ及びエンハンスメントレイヤの双方の符号化ストリームが復号されることになる。スケーラブル符号化において扱われるレイヤの数は、２つ以上のいかなる数であってもよい。３つ以上のレイヤが符号化される場合には、最下位のレイヤがベースレイヤ、残りの複数のレイヤがエンハンスメントレイヤである。より上位のエンハンスメントレイヤの符号化ストリームは、より下位のエンハンスメントレイヤ又はベースレイヤの符号化ストリームに含まれる情報を用いて符号化され及び復号され得る。

　図１は、スケーラブル符号化される３つのレイヤＬ１、Ｌ２及びＬ３を示している。レイヤＬ１はベースレイヤであり、レイヤＬ２及びＬ３はエンハンスメントレイヤである。なお、ここでは、様々な種類のスケーラビリティのうち、空間スケーラビリティを例にとっている。レイヤＬ２のレイヤＬ１に対する空間解像度の比は、２：１である。レイヤＬ３のレイヤＬ１に対する空間解像度の比は、４：１である。なお、ここでの解像度比は一例に過ぎず、例えば１．５：１などの非整数の解像度比が使用されてもよい。レイヤＬ１のブロックＢ１は、ベースレイヤのピクチャ内の予測処理の処理単位である。レイヤＬ２のブロックＢ２は、ブロックＢ１と共通するシーンを映したエンハンスメントレイヤのピクチャ内の予測処理の処理単位である。ブロックＢ２は、レイヤＬ１のブロックＢ１に対応する。レイヤＬ３のブロックＢ３は、ブロックＢ１及びＢ２と共通するシーンを映したより上位のエンハンスメントレイヤのピクチャ内の予測処理の処理単位である。ブロックＢ３は、レイヤＬ１のブロックＢ１及びレイヤＬ２のブロックＢ２に対応する。

　このようなレイヤ構造において、画像の周波数特性は、共通するシーンを映したレイヤ間で類似する。例えば、レイヤＬ１内のブロックＢ１の画像が平坦でその高周波成分が小さい場合、レイヤＬ２内のブロックＢ２の画像の高周波成分もまた小さい可能性が高い。レイヤＬ２内のブロックＢ２とレイヤＬ３内のブロックＢ３との間にも同じことが言える。

　　［１－２．ＢＬＲモード］
　上記非特許文献２により提案されているＢＬＲモードは、スケーラブル符号化の１つの形態である。ＢＬＲモードでは、レイヤ間で異なる画像符号化方式が利用される場合においてレイヤ間のパラメータのマッピングが困難となるケースを想定し、エンハンスメントレイヤにおいてベースレイヤのリコンストラクト画像のみが再利用される。リコンストラクト画像とは、予測符号化、直交変換及び量子化などの処理を経て生成される符号化ストリームを復号することにより再構築される画像をいう。エンコーダ側では、ローカルデコーダによって生成されるリコンストラクト画像が、予測符号化のための参照画像として用いられる。デコーダ側では、リコンストラクト画像は、参照画像として用いられるだけでなく、表示又は編集などのための最終的な出力画像となり得る。ＭＰＥＧ２方式、ＡＶＣ方式及びＨＥＶＣ方式などの予測符号化を含む画像符号化方式では、一般的に、エンコーダ及びデコーダの双方でリコンストラクト画像が生成される。リコンストラクト画像のみを再利用するＢＬＲモードは、画像符号化方式の違いの影響を受けない。

　図２は、ＢＬＲモードでのスケーラブル符号化について説明するための説明図である。図２の下段には、ベースレイヤ（ＢＬ）のリコンストラクト画像ＩＭ_Ｂ１～ＩＭ_Ｂ４が示されている。上記非特許文献２によれば、これらリコンストラクト画像は、必要に応じて、デインターレースされ、及び／又はアップサンプリングされる。図２の中段には、デインターレースされアップサンプリングされたリコンストラクト画像ＩＭ_Ｕ１～ＩＭ_Ｕ４が示されている。図２の上段に示したエンハンスメントレイヤ（ＥＬ）の画像ＩＭ_Ｅ１～ＩＭ_Ｅ４は、リコンストラクト画像ＩＭ_Ｕ１～ＩＭ_Ｕ４を参照することにより符号化され及び復号される。その際、リコンストラクト画像から導かれるパラメータ以外のベースレイヤのパラメータは、再利用されない。

　このように、ＢＬＲモードでは、レイヤごとの独立性が強化される。しかしながら、その独立性に起因して、エンハンスメントレイヤにおいて多くのパラメータを符号化することが求められる。結果として、エンハンスメントレイヤにおいて十分な符号化効率が達成されないケースが生じ得る。次に説明するレート制御に関連するパラメータはその一例である。

　　［１－３．一般的なレート制御］
　画像の周波数特性は、直交変換の結果として発生する変換係数データのビット数を左右する。符号化ストリームのビットレートを一定に保つために、通常、変換係数データのビット数が多ければ、変換係数データは、より大きい量子化ステップで量子化される。期待されるビットレートを実現するためのレート制御方式の一例は、ＭＰＥＧ２テストモデルにおいて示されている。ＭＰＥＧ２テストモデルでは、まず、ＧＯＰに割当てられるビット量と、ＧＯＰ内の各ピクチャのピクチャタイプ及び複雑度（Global　Complexity　Measure）とに基づいて、ピクチャごとの割当て符号量が決定される。そして、各ピクチャ内のマクロブロックごとの量子化パラメータ（量子化スケールコード）が、マクロブロックごとに算出されるアクティビティと当該ピクチャの割当て符号量とに基づいて算出される。ここでのアクティビティは、画像の複雑さを表す指標の一種である。なお、ＭＰＥＧ２テストモデルにおけるレート制御方式の詳細は、次のＷｅｂページにおいて公開されている。
－参考ＵＲＬ　http://www.mpeg.org/MPEG/MSSG/tm5/Ch10/Ch10.html

　ところで、ＭＰＥＧ２方式では、１６×１６画素のサイズを有するマクロブロックごとに上述した量子化スケールコードが決定される。ＨＥＶＣ方式においてマクロブロックに相当するＬＣＵ（最大符号化単位：Largest　Coding　Unit）の最大サイズは、６４×６４画素である。しかし、レート制御の粒度が大き過ぎると、量子化ステップが局所的に画像の複雑さに適合しない領域が生じ得る。例えば、図３において、上段に示された画像の正規化アクティビティを６４×６４画素の粒度で算出した結果が中段に、当該正規化アクティビティを１６×１６画素の粒度で算出した結果が下段に示されている。ここでは、より高いアクティビティが白色で示されている。図３から理解されるように、６４×６４画素の粒度でレート制御を行うと、例えば複雑さが低いにも関わらず大きい量子化ステップで量子化され、又は複雑さが高いにも関わらず小さい量子化ステップでしか量子化されない領域が多く発生し得る。

　上述したブロックサイズに起因する不都合を回避してレート制御を適切に実行するために、ＨＥＶＣ方式では、ＬＣＵよりも小さいブロックの単位で量子化ステップを制御する手法が採用されている。より具体的には、上記非特許文献１に記載されたＰＰＳ（Picture　Parameter　Set）のシンタックスを参照すると、cu_qp_delta_enabled_flagがTrueである場合に、diff_cu_qp_delta_depthというサイズ情報によって、量子化ステップを指定する単位となるブロックのサイズが指定される。実際には、量子化ステップの対数がＳＮ（Signal　to　Noise）比と比例関係にあるため、量子化ステップが直接的に指定される代わりに、量子化パラメータがブロックごとに指定される。量子化パラメータｑｐ（quantization　parameter）に対応する量子化ステップをＳ（ｑｐ）とすると、量子化ステップＳ（ｑｐ）が次式を満たすように、量子化パラメータｑｐと量子化ステップＳ（ｑｐ）との間の関係が定義される。

　ＨＥＶＣ方式では、量子化パラメータ及び量子化ステップのレンジが最適化されるように、変数ａ＝６、変数ｂ＝２という値が採用されている。この場合の量子化パラメータｑｐと量子化ステップＳ（ｑｐ）との間の関係を図４に示す。図４に示したように、量子化パラメータｑｐの値が６増えるごとに、量子化ステップＳ（ｑｐ）の値は２倍になる。

　より具体的には、上記非特許文献１に記載されたシンタックスを参照すると、ＰＰＳ内のpic_init_qp_minus26及びスライスヘッダ内のslice_qp_deltaというパラメータによって、量子化パラメータが初期化される（SliceQP_Y＝26＋pic_init_qp_minus26＋slice_qp_delta）。個々のＣＵ（Coding　Unit）の量子化パラメータは、上の隣接ＣＵ及び左の隣接ＣＵの一方若しくは双方の量子化パラメータから予測され（ＣＴＢ内予測）、又は復号順で直前のＣＵの量子化パラメータから予測される（ＣＴＢ間予測）。図５には、ＣＴＢ（Coding　Tree　Block）内及びＣＴＢ間の量子化パラメータの予測における参照関係が例示されている。上の隣接ＣＵ及び左の隣接ＣＵの双方が参照可能な場合のＣＴＢ内予測では、量子化パラメータの予測値は、上の隣接ＣＵ及び左の隣接ＣＵの量子化パラメータ（TopQP，LeftQP）の平均値（（TopQP＋LeftQP＋1）>>１）に等しい。そして、ＴＵ（Transform　Unit）内のcu_qp_delta_abs及びcu_qp_delta_signにより示される残差を上述した予測値に加算することにより、個々の量子化パラメータの値が算出される。

　このように、ＨＥＶＣ方式の現在の仕様では、レート制御に関連する様々なパラメータが符号化される（例えば、pic_init_qp_minus26、slice_qp_delta、cu_qp_delta_abs及びcu_qp_delta_sign）。上述したＢＬＲモードでも、エンハンスメントレイヤがＨＥＶＣ方式で符号化される場合には、エンハンスメントレイヤの符号化ストリームにこれらパラメータが含まれ得る。しかしながら、画像の特性のレイヤ間の類似性を活用すれば、ＢＬＲモードにおいてレート制御に関連するいくつかのパラメータの符号量を削減することが可能である。そこで、画像の特性のレイヤ間の類似性を活用してエンハンスメントレイヤの符号量を削減する画像処理装置の実施形態について、次節より詳細に説明する。なお、以下の説明では、一例として、エンハンスメントレイヤはＨＥＶＣ方式で符号化されるものとする。ベースレイヤは、ＭＰＥＧ２方式又はＡＶＣ（Advanced　Video　Coding）方式で符号化されるものとする。しかしながら、本開示に係る技術は、かかる例に限定されず、他の画像符号化方式の組合せにも適用可能である。

　　［１－４．エンコーダの基本的な構成例］
　図６は、ＢＬＲモードでのスケーラブル符号化をサポートする、一実施形態に係る画像符号化装置１０の概略的な構成を示すブロック図である。図６を参照すると、画像符号化装置１０は、ＢＬ符号化部１ａ、ＥＬ符号化部１ｂ、中間処理部３及び多重化部４を備える。

　ＢＬ符号化部１ａは、ベースレイヤ画像を符号化し、ベースレイヤの符号化ストリームを生成する。ＢＬ符号化部１ａは、ローカルデコーダ２を含む。ローカルデコーダ２は、ベースレイヤのリコンストラクト画像を生成する。中間処理部３は、デインターレース部又はアップサンプリング部として機能し得る。中間処理部３は、ＢＬ符号化部１ａから入力されるベースレイヤのリコンストラクト画像がインターレースされている場合に、当該リコンストラクト画像をデインターレースする。また、中間処理部３は、ベースレイヤとエンハンスメントレイヤとの間の空間解像度の比に従って、リコンストラクト画像をアップサンプリングする。なお、中間処理部３による処理は、省略されてもよい。ＥＬ符号化部１ｂは、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤの符号化ストリームを生成する。後に詳細に説明するように、ＥＬ符号化部１ｂは、エンハンスメントレイヤ画像を符号化する際に、ベースレイヤのリコンストラクト画像を再利用する。多重化部４は、ＢＬ符号化部１ａにより生成されるベースレイヤの符号化ストリームと、ＥＬ符号化部１ｂにより生成されるエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

　　［１－５．デコーダの基本的な構成例］
　図７は、ＢＬＲモードでのスケーラブル符号化をサポートする、一実施形態に係る画像復号装置６０の概略的な構成を示すブロック図である。図７を参照すると、画像復号装置６０は、逆多重化部５、ＢＬ復号部６ａ、ＥＬ復号部６ｂ及び中間処理部７を備える。

　逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームに逆多重化する。ＢＬ復号部６ａは、ベースレイヤの符号化ストリームからベースレイヤ画像を復号する。中間処理部７は、デインターレース部又はアップサンプリング部として機能し得る。中間処理部７は、ＢＬ復号部６ａから入力されるベースレイヤのリコンストラクト画像がインターレースされている場合に、当該リコンストラクト画像をデインターレースする。また、中間処理部７は、ベースレイヤとエンハンスメントレイヤとの間の空間解像度の比に従って、リコンストラクト画像をアップサンプリングする。なお、中間処理部７による処理は、省略されてもよい。ＥＬ復号部６ｂは、エンハンスメントレイヤの符号化ストリームからエンハンスメントレイヤ画像を復号する。後に詳細に説明するように、ＥＬ復号部６ｂは、エンハンスメントレイヤ画像を復号する際に、ベースレイヤのリコンストラクト画像を再利用する。

　＜２．一実施形態に係るＥＬ符号化部の構成例＞
　　［２－１．全体的な構成］
　図８は、図６に示したＥＬ符号化部１ｂの構成の一例を示すブロック図である。図８を参照すると、ＥＬ符号化部１ｂは、並び替えバッファ１１、減算部１３、直交変換部１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、レート制御部１８、逆量子化部２１、逆直交変換部２２、加算部２３、デブロックフィルタ２４、フレームメモリ２５、セレクタ２６及び２７、イントラ予測部３０、インター予測部３５並びに量子化制御部４０を備える。

　並び替えバッファ１１は、一連の画像データに含まれる画像を並び替える。並び替えバッファ１１は、符号化処理に係るＧＯＰ（Group　of　Pictures）構造に応じて画像を並び替えた後、並び替え後の画像データを減算部１３、イントラ予測部３０、及びインター予測部３５へ出力する。

　減算部１３には、並び替えバッファ１１から入力される画像データ、及び後に説明するイントラ予測部３０又はインター予測部３５から入力される予測画像データが供給される。減算部１３は、並び替えバッファ１１から入力される画像データと予測画像データとの差分である予測誤差データを算出し、算出した予測誤差データを直交変換部１４へ出力する。

　直交変換部１４は、減算部１３から入力される予測誤差データについて直交変換を行う。直交変換部１４により実行される直交変換は、例えば、離散コサイン変換（Discrete　Cosine　Transform：ＤＣＴ）又はカルーネン・レーベ変換などであってよい。直交変換部１４は、直交変換処理により取得される変換係数データを量子化部１５へ出力する。

　量子化部１５には、直交変換部１４から変換係数データが入力されると共に、後に説明する量子化制御部４０から量子化パラメータが入力される。量子化部１５は、入力される量子化パラメータに対応する量子化ステップで、エンハンスメントレイヤの変換係数データを量子化し、量子化データ（量子化された変換係数データ）を生成する。そして、量子化部１５は、量子化データを可逆符号化部１６及び逆量子化部２１へ出力する。量子化パラメータは、レート制御部１８により動的に制御される。

　可逆符号化部１６は、量子化部１５から入力される量子化データについて可逆符号化処理を行うことにより、エンハンスメントレイヤの符号化ストリームを生成する。また、可逆符号化部１６は、符号化ストリームを復号する際に参照される様々なパラメータを符号化して、符号化されたパラメータを符号化ストリームのヘッダ領域に挿入する。可逆符号化部１６により符号化されるパラメータは、後に説明するイントラ予測に関する情報、インター予測に関する情報及びレート制御関連パラメータを含み得る。そして、可逆符号化部１６は、生成した符号化ストリームを蓄積バッファ１７へ出力する。

　蓄積バッファ１７は、可逆符号化部１６から入力される符号化ストリームを半導体メモリなどの記憶媒体を用いて一時的に蓄積する。そして、蓄積バッファ１７は、蓄積した符号化ストリームを、伝送路の帯域に応じたレートで、図示しない伝送部（例えば、通信インタフェース又は周辺機器との接続インタフェースなど）へ出力する。

　レート制御部１８は、蓄積バッファ１７の空き容量を監視する。そして、レート制御部１８は、蓄積バッファ１７の空き容量に応じてレート制御信号を生成し、生成したレート制御信号を量子化制御部４０へ出力する。レート制御部１８は、上述したＭＰＥＧ２テストモデルと同等のレート制御方式又はその他のレート制御方式に従って、ＣＵごとの量子化パラメータを算出してよい。量子化制御部４０へ出力されるレート制御信号は、算出されたＣＵごとの量子化パラメータを含み得る。

　逆量子化部２１、逆直交変換部２２及び加算部２３は、ローカルデコーダを構成する。逆量子化部２１には、量子化部１５から量子化データが入力されると共に、後に説明する量子化制御部４０から量子化パラメータが入力される。逆量子化部２１は、入力される量子化パラメータに対応する量子化ステップで、エンハンスメントレイヤの量子化データを逆量子化し、変換係数データを復元する。そして、逆量子化部２１は、復元した変換係数データを逆直交変換部２２へ出力する。

　逆直交変換部２２は、逆量子化部２１から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを復元する。そして、逆直交変換部２２は、復元した予測誤差データを加算部２３へ出力する。

　加算部２３は、逆直交変換部２２から入力される復元された予測誤差データとイントラ予測部３０又はインター予測部３５から入力される予測画像データとを加算することにより、復号画像データ（エンハンスメントレイヤのリコンストラクト画像）を生成する。そして、加算部２３は、生成した復号画像データをデブロックフィルタ２４及びフレームメモリ２５へ出力する。

　デブロックフィルタ２４は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタリング処理を行う。デブロックフィルタ２４は、加算部２３から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データをフレームメモリ２５へ出力する。

　フレームメモリ２５は、加算部２３から入力される復号画像データ、デブロックフィルタ２４から入力されるフィルタリング後の復号画像データ、及び中間処理部３から入力されるベースレイヤのリコンストラクト画像データを記憶媒体を用いて記憶する。

　セレクタ２６は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部３０に供給する。また、セレクタ２６は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてインター予測部３５に供給する。ベースレイヤのリコンストラクト画像データもまた、イントラ予測部３０又はインター予測部３５へ供給され得る。

　セレクタ２７は、イントラ予測モードにおいて、イントラ予測部３０から出力されるイントラ予測の結果としての予測画像データを減算部１３へ出力すると共に、イントラ予測に関する情報を可逆符号化部１６へ出力する。また、セレクタ２７は、インター予測モードにおいて、インター予測部３５から出力されるインター予測の結果としての予測画像データを減算部１３へ出力すると共に、インター予測に関する情報を可逆符号化部１６へ出力する。セレクタ２７は、イントラ予測モードとインター予測モードとを、コスト関数値の大きさに応じて切り替える。

　イントラ予測部３０は、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣ方式の予測単位（ＰＵ）ごとにイントラ予測処理を行う。例えば、イントラ予測部３０は、予測モードセット内の各候補モードによる予測結果を所定のコスト関数を用いて評価する。次に、イントラ予測部３０は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、イントラ予測部３０は、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。そして、イントラ予測部３０は、選択した最適な予測モードを表す予測モード情報を含むイントラ予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。

　インター予測部３５は、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣ方式の予測単位ごとにインター予測処理を行う。例えば、インター予測部３５は、予測モードセット内の各候補モードによる予測結果を所定のコスト関数を用いて評価する。次に、インター予測部３５は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、インター予測部３５は、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。そして、インター予測部３５は、選択した最適な予測モードを表す予測モード情報と動き情報とを含むインター予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。

　量子化制御部４０は、ＥＬ符号化部１ｂにおける量子化処理及び逆量子化処理を制御する。また、量子化制御部４０は、レート制御関連パラメータを生成する。より具体的には、量子化制御部４０は、量子化及び逆量子化のために使用すべきＣＵごとの量子化パラメータcu_qpを、量子化部１５及び逆量子化部２１へ出力する。また、量子化制御部４０は、レート制御部１８から入力されるレート制御信号に含まれる量子化パラメータに基づいて、スライスごとの量子化パラメータの基準値slice_qpを指定する２つのパラメータpic_init_qp_minus26及びslice_qp_deltaを生成する。なお、pic_init_qp_minus26はピクチャごとに、slice_qp_deltaはスライスごとに算出される。また、量子化制御部４０は、ＢＬ符号化部１ａのローカルデコーダ２により生成されるベースレイヤのリコンストラクト画像を用いて、ＣＵごとの量子化パラメータを予測する。典型的には、量子化パラメータの予測値は、ＣＵごとの基準値と差分予測値との和である。差分予測値は、ベースレイヤのリコンストラクト画像の特性に基づいて決定される。ＣＵごとの量子化パラメータの基準値は、slice_qpそのものであってもよく、又はスライス内で近傍ＣＵの量子化パラメータから予測される予測基準値であってもよい。そして、量子化制御部４０は、少なくともpic_init_qp_minus26及びslice_qp_deltaを含み得るレート制御関連パラメータを、可逆符号化部１６へ出力する。実際に使用される量子化パラメータcu_qpから予測値を減算することによりＣＵごとに算出され得る残差もまた、レート制御関連パラメータに含まれてよい。

　　［２－２．量子化制御部の第１の構成例］
　図９は、図８に示した量子化制御部４０の第１の構成例を示すブロック図である。図９を参照すると、量子化制御部４０は、ブロック設定部４１、アクティビティ算出部４２、アクティビティバッファ４３、差分予測部４５、基準ＱＰ設定部４８、ＱＰバッファ４９及び残差算出部５０を有する。

　ブロック設定部４１は、中間処理部３から入力されるベースレイヤのリコンストラクト画像に、アクティビティを算出する単位となるブロックを設定する。ブロック設定部４１により設定されるブロックのサイズは、パラメータdiff_cu_qp_delta_depthにより指定される。パラメータdiff_cu_qp_delta_depthは、ピクチャごとに設定され、ＰＰＳ内で符号化され得る。

　アクティビティ算出部４２は、ブロック設定部４１により設定されるブロックごとに、リコンストラクト画像の複雑さを示すアクティビティを算出する。アクティビティの値は、ブロック内の画素値の分散が大きいほど大きい値をとる。アクティビティ算出部４２は、例えば、上述したＭＰＥＧ２テストモデルに従って、アクティビティを算出してよい。アクティビティ算出部４２は、典型的には、アクティビティを、その値が所定のレンジに収まるように正規化する。ＭＰＥＧ２テストモデルでは、正規化されたアクティビティの値のレンジは０．５～２．０である。そして、アクティビティ算出部４２は、算出したブロックごとのアクティビティＡ_normを、アクティビティバッファ４３及び差分予測部４５へ出力する。

　アクティビティバッファ４３は、アクティビティ算出部４２から入力されるアクティビティを参照アクティビティとしてバッファリングする。参照アクティビティは、各ブロックのアクティビティを正規化する際に、アクティビティ算出部４２により使用される。

　差分予測部４５は、アクティビティ算出部４２により算出されるブロックごとのアクティビティＡ_normから、次の式（２）に従って量子化パラメータの差分予測値を決定する。

　式（２）において、Ａ_normは正規化されたアクティビティ、pred_qp_deltaは差分予測値である。量子化パラメータｑｐに対応する量子化ステップをＳ（ｑｐ）とすると、変数ａ及びｂは上述した式（１）を満たし、一例として、変数ａ＝６、変数ｂ＝２であってよい。なお、差分予測部４５は、式（２）における対数演算を、予め記憶されるルックアップテーブルを用いて行ってよい。そして、差分予測部４５は、ブロックごとに決定した差分予測値pred_qp_deltaを、残差算出部５０へ出力する。

　基準ＱＰ設定部４８は、レート制御部１８から入力されるレート制御信号に含まれるＣＵごとの量子化パラメータcu_qpを取得する。ここで取得される量子化パラメータは、ＱＰバッファ４９によりバッファリングされる。そして、基準ＱＰ設定部４８は、ピクチャごとの量子化パラメータの初期値を指定するパラメータpic_init_qp_minus26を設定する。また、基準ＱＰ設定部４８は、スライスごとの量子化パラメータの基準値slice_qpと上記初期値との差分を示すパラメータslice_qp_deltaを設定する。なお、これらのパラメータの間には、slice_qp＝26＋pic_init_qp_minus26＋slice_qp_deltaという関係が成立する（詳細は上記非特許文献１を参照されたい）。そして、基準ＱＰ設定部４８は、設定した２つのパラメータpic_init_qp_minus26及びslice_qp_deltaを可逆符号化部１６へ出力する。また、基準ＱＰ設定部４８は、量子化パラメータの基準値slice_qpを残差算出部５０へ出力する。

　なお、残差算出部５０へ出力される量子化パラメータの基準値は、レート制御信号に基づいて設定されるslice_qpそのものであってもよい。また、当該基準値は、スライス内の各ブロック（例えば、ＣＵ）について、当該ブロックの近傍ブロックに適用された量子化パラメータに基づいて予測される予測基準値であってもよい。ここでの近傍ブロックは、上の及び左の隣接ブロック、並びに復号順で直前のブロックのうちの少なくとも１つを含む。例えば、図５に示した参照関係にように、スライスの先頭のブロックの基準値としてレート制御信号に基づいて設定されるslice_qpそのものが使用され、後続するブロックの基準値として基準ＱＰ設定部４８により予測される予測基準値が使用されてもよい。上の隣接ブロック及び左のブロックの双方が参照可能な場合には、予測基準値は、上の隣接ブロック及び左の隣接ブロックの量子化パラメータの平均値に等しい。そうでない場合には、予測基準値は、参照可能な近傍ブロックに適用された量子化パラメータに等しい。以下の説明では、説明の簡明さのために、予測基準値もまたパラメータslice_qpにより表されるものとする。

　ＱＰバッファ４９は、基準ＱＰ設定部４８から入力されるＣＵごとの量子化パラメータcu_qpを参照量子化パラメータとしてバッファリングする。参照量子化パラメータは、各ブロックの量子化パラメータの基準値を予測する際に、基準ＱＰ設定部４８により使用される。

　残差算出部５０は、基準ＱＰ設定部４８から入力される量子化パラメータの基準値slice_qpと差分予測部４５から入力される差分予測値pred_qp_deltaとの和である量子化パラメータの予測値pred_qpをＣＵごとに算出する。そして、残差算出部５０は、量子化部１５及び逆量子化部２１により実際に使用される量子化パラメータcu_qpから量子化パラメータの予測値pred_qpを減算することにより、ＣＵごとの量子化パラメータの残差resi_qp_deltaを算出する。これらパラメータの間の関係は、次式により表される。

　そして、残差算出部５０は、算出した量子化パラメータの残差resi_qp_deltaを可逆符号化部１６へ出力する。第１の構成例では、量子化パラメータの基準値を指定するパラメータpic_init_qp_minus26及びslice_qp_delta、並びに残差を指定するパラメータresi_qp_deltaが、可逆符号化部１６により符号化される。なお、残差は、その絶対値（abs）と符号（sign）とをそれぞれ指定する２つのパラメータに分離された上で符号化されてもよい。

　第１の構成例において残差算出部５０により算出される量子化パラメータの残差は、上記非特許文献１に記載されているパラメータcu_qp_delta_abs及びcu_qp_delta_signにより示される残差と比較して、差分予測値pred_qp_deltaの分だけ減殺されている。従って、可逆符号化を通じて発生するレート制御関連パラメータのための符号量は削減される。

　　［２－３．量子化制御部の第２の構成例］
　図１０は、図８に示した量子化制御部４０の第２の構成例を示すブロック図である。図１０を参照すると、量子化制御部４０は、ブロック設定部４１、平均算出部４４、差分予測部４６、モデル記憶部４７、基準ＱＰ設定部４８、ＱＰバッファ４９及び残差算出部５０を有する。

　平均算出部４４は、ブロック設定部４１により設定されるブロックごとに、リコンストラクト画像のブロック内の平均画素値Ｐ_ＡＶeを算出する。そして、平均算出部４４は、算出したブロックごとの平均画素値Ｐ_ＡＶeを差分予測部４６へ出力する。

　差分予測部４６は、平均算出部４４により算出された平均画素値と差分予測値との間の予め定義される関係に従って、量子化パラメータの差分予測値をブロックごとに決定する。ここで差分予測部４６により利用される平均画素値と差分予測値との間の関係は、例えば、寄書ＪＣＴＶＣ－Ｈ０４７７＿ｒ１（“On　Just　Noticeable　Distortion　Quantization　in　the　HEVC　Codec”，　Matteo　Naccari　and　Marta　Mrak，　February　1-10,　2012）に記載されているＪＮＤ（Just　Noticeable　Distortion）モデルに従って定義されてよい。ＪＮＤモデルによれば、人間の視覚は、白に近い画像領域及び黒に近い画像領域では、中間の画像領域と比較して、画像の歪みに対する識別能力（Noticeability）が低いという特性を有する。従って、白に近い画像領域及び黒に近い画像領域では、中間の画像領域よりも大きい量子化ステップを使用したとしても、そこで生じる画像の歪みはユーザにより感知されにくい。

　図１１は、ＪＮＤモデルに従って定義される平均画素値と差分予測値との間の関係の一例を示す説明図である。図１１に示したグラフの横軸は平均画素値Ｐ_ＡＶeを、縦軸は差分予測値pred_qp_deltaをそれぞれ表す。当該グラフにおいて、平均画素値Ｐ_ＡＶeがＰ_１よりも小さい区間では、平均画素値Ｐ_ＡＶeが小さいほど差分予測値pred_qp_deltaは大きくなる。平均画素値Ｐ_ＡＶeがＰ_１以上Ｐ_２以下の区間では、平均画素値Ｐ_ＡＶeは一定である。平均画素値Ｐ_ＡＶeがＰ_２よりも大きい区間では、平均画素値Ｐ_ＡＶeが大きいほど差分予測値pred_qp_deltaは大きくなる。差分予測部４６は、このようなグラフを参照し、平均算出部４４から入力される平均画素値Ｐ_ＡＶeに対応する差分予測値pred_qp_deltaを取得する。そして、差分予測部４６は、取得した差分予測値pred_qp_deltaを、残差算出部５０へ出力する。

　モデル記憶部４７は、図１１に例示したような平均画素値と差分予測値との間の関係を示すグラフを予め記憶する。当該グラフは、各ブロックの差分予測値を取得するために差分予測部４６により参照される。

　第２の構成例においても、残差算出部５０は、上述した式（３）に従って、実際に使用される量子化パラメータcu_qpと量子化パラメータの予測値pred_qp（基準値slice_qpと差分予測値pred_qp_deltaとの和）との間の残差resi_qp_deltaを算出する。そして、残差算出部５０は、算出した量子化パラメータの残差resi_qp_deltaを可逆符号化部１６へ出力する。そして、量子化パラメータの基準値を指定するパラメータpic_init_qp_minus26及びslice_qp_delta、並びに残差を指定するパラメータresi_qp_deltaが、可逆符号化部１６により符号化される。

　第１の構成例と同様、第２の構成例においても、量子化パラメータの残差は、既存の手法と比較して差分予測値pred_qp_deltaの分だけ減殺されている。従って、可逆符号化を通じて発生するレート制御関連パラメータのための符号量は削減される。

　　［２－４．量子化制御部の第３の構成例］
　図１２は、図８に示した量子化制御部４０の第３の構成例を示すブロック図である。図１２を参照すると、量子化制御部４０は、ブロック設定部４１、アクティビティ算出部４２、アクティビティバッファ４３、差分予測部４５、基準ＱＰ設定部５１、ＱＰバッファ５２及びＱＰ決定部５３を有する。

　基準ＱＰ設定部５１は、レート制御部１８から入力されるレート制御信号に含まれるＣＵごとの量子化パラメータcu_qp_refを取得する。ここで取得される量子化パラメータは、量子化部１５及び逆量子化部２１により実際に使用される量子化パラメータcu_qpとは必ずしも等しくない。そして、基準ＱＰ設定部５１は、ピクチャごとの量子化パラメータの初期値を指定するパラメータpic_init_qp_minus26を設定する。また、基準ＱＰ設定部５１は、スライスごとの量子化パラメータの基準値slice_qpと上記初期値との差分を示すパラメータslice_qp_deltaを設定する。そして、基準ＱＰ設定部５１は、設定した２つのパラメータpic_init_qp_minus26及びslice_qp_deltaを可逆符号化部１６へ出力する。また、基準ＱＰ設定部５１は、量子化パラメータの基準値slice_qpをＱＰ決定部５３へ出力する。第１の構成例及び第２の構成例と同様、量子化パラメータの基準値slice_qpは、近傍ブロックに適用された量子化パラメータに基づいて予測される予測基準値であってもよい。

　ＱＰバッファ５２は、ＱＰ決定部５３から入力されるＣＵごとの量子化パラメータcu_qpを参照量子化パラメータとしてバッファリングする。参照量子化パラメータは、各ブロックの量子化パラメータの基準値を予測する際に、基準ＱＰ設定部５１により使用される。

　ＱＰ決定部５３は、基準ＱＰ設定部５１から入力される量子化パラメータの基準値slice_qpと差分予測部４５から入力される差分予測値pred_qp_deltaとの和である量子化パラメータの予測値pred_qpをＣＵごとに算出する。第３の構成例では、次式の通り、この予測値pred_qpが、量子化部１５及び逆量子化部２１により実際に使用される量子化パラメータcu_qpに等しい。即ち、量子化部１５は、量子化パラメータの予測値pred_qpに対応する量子化ステップで、変換係数データを量子化する。また、逆量子化部２１は、量子化パラメータの予測値pred_qpに対応する量子化ステップで、量子化データを逆量子化する。

　第３の構成例では、量子化パラメータの残差は符号化されず、量子化パラメータの基準値を指定するパラメータpic_init_qp_minus26及びslice_qp_deltaのみがレート制御関連パラメータとして可逆符号化部１６により符号化される。従って、レート制御関連パラメータのための符号量は一層削減される。なお、ここでは、図９に示した第１の構成例と同様にブロックごとのアクティビティに基づいて量子化パラメータの予測値が決定される例を説明した。しかしながら、かかる例に限定されず、第２の構成例と同様に、ブロックごとの平均画素値に基づいて量子化パラメータの予測値が決定されてもよい。

　第３の構成例では、量子化部１５及び逆量子化部２１により実際に使用される量子化パラメータcu_qpは、レート制御部１８により算出される量子化パラメータcu_qp_refと必ずしも等しくない。よって、第１の構成例及び第２の構成例と比較して、第３の構成例におけるレート制御は粗いものとなる。従って、例えば、厳密なレート制御が求められない用途（例えば、ＢＤ（Blu-ray　Disc）又はＤＶＤなどのパッケージメディアへの映像の記録）において、第３の構成例が採用されてもよい。また、固定ビットレートモードにおいて第１の構成例又は第２の構成例のように残差が符号化され、可変ビットレートモードにおいて第３の構成例のように残差の符号化が省略されるというモードの切り替えが実現されてもよい。

　　［２－５．追加的なパラメータ］
　量子化制御部４０は、量子化及び逆量子化を制御するためのいくつかの追加的なパラメータを生成してもよい。例えば、上記非特許文献１によれば、ＬＣＵよりも小さい単位で量子化ステップを指定することが有効か否かを示すフラグcu_qp_delta_enabled_flagが提供される。このフラグに加えて、量子化制御部４０は、ベースレイヤのリコンストラクト画像を用いて量子化パラメータを予測すべきことを示す量子化パラメータ予測フラグを生成してもよい。量子化パラメータ予測フラグがFalseを示す場合には、量子化パラメータの予測はスキップされ得る。また、量子化制御部４０は、量子化パラメータの差分予測値を決定するための決定手法を指定する決定手法フラグを生成してもよい。例えば、決定手法フラグの第１の値は、ブロックごとのアクティビティに基づく予測に対応し、決定手法フラグの第２の値は、ブロックごとの平均画素値に基づく予測に対応し得る。量子化パラメータ予測フラグ及び決定手法フラグは、量子化制御部４０から可逆符号化部１６へ出力され、可逆符号化部１６により符号化され得る。これら追加的なパラメータが採用されることで、量子化プロセスの柔軟性が高められ、エンコーダ及びデコーダの用途に応じた最適なレート制御が可能となる。

　　［２－６．変形例］
　第１の構成例において算出されるブロックごとのアクティビティは、量子化パラメータの予測に限らず、ＴＵ（変換単位：Transform　Unit）サイズの決定という目的においても有益である。

　図１３は、図６に示したＥＬ符号化部１ｂの構成の一変形例を示すブロック図である。図１３を参照すると、ＥＬ符号化部１ｂは、並び替えバッファ１１、減算部１３、直交変換部１１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、レート制御部１８、逆量子化部２１、逆直交変換部１２２、加算部２３、デブロックフィルタ２４、フレームメモリ２５、セレクタ２６及び２７、イントラ予測部３０、インター予測部３５並びに変換・量子化制御部１４０を備える。

　直交変換部１１４は、減算部１３から入力される予測誤差データについて、後に説明する変換・量子化制御部１４０により決定されるＴＵサイズを有するＴＵごとに直交変換を行う。そして、直交変換部１１４は、直交変換処理により取得される変換係数データを量子化部１５へ出力する。

　逆直交変換部１２２は、逆量子化部２１から入力される変換係数データについて、後に説明する変換・量子化制御部１４０により決定されるＴＵサイズを有するＴＵごとに逆直交変換を行う。そして、逆直交変換部１２２は、逆直交変換処理により取得される予測誤差データを加算部２３へ出力する。

　変換・量子化制御部１４０は、ＥＬ符号化部１ｂにおける直交変換処理、逆直交変換処理、量子化処理及び逆量子化処理を制御する。より具体的には、変換・量子化制御部１４０は、図８に示した量子化制御部４０と同様に、量子化及び逆量子化のために使用すべきＣＵごとの量子化パラメータを、量子化部１５及び逆量子化部２１へ出力する。また、変換・量子化制御部１４０は、レート制御部１８から入力されるレート制御信号に含まれる量子化パラメータに基づいて、レート制御関連パラメータを生成する。

　また、変換・量子化制御部１４０は、ベースレイヤのリコンストラクト画像を用いて、エンハンスメントレイヤのための直交変換サイズ（ＴＵサイズ）を制御する。例えば、ＨＥＶＣ方式では、ＴＵサイズは、３２×３２画素、１６×１６画素、８×８画素及び４×４画素という４つの候補から選択され得る。ＴＵサイズが大きいほど、直交変換を通じて画像の歪みが生じる可能性は高まる。しかし、画像がより平坦であれば、即ち画像の複雑さがより低ければ、画像の歪みは生じにくい。従って、変換・量子化制御部１４０は、ベースレイヤのリコンストラクト画像を用いてブロックごとにアクティビティ（例えば、上述した正規化アクティビティＡ_norm）を算出し、算出したアクティビティの大きさに従ってをＴＵサイズを決定する。より具体的には、変換・量子化制御部１４０は、アクティビティのより低いブロックの存在する領域により大きいＴＵサイズを設定し、アクティビティのより高いブロックの存在する領域により小さいＴＵサイズを設定する。変換・量子化制御部１４０は、所定の閾値を上回るアクティビティを示すブロックについて直交変換のスキップ（Transform　Skip）を適用することにより、極めて複雑なテクスチャを有する領域の画質の劣化を回避してもよい。

　変換・量子化制御部１４０は、本変形例において説明したＴＵサイズの制御を、イントラスライスにのみ適用してもよい。また、変換・量子化制御部１４０は、ＴＵサイズを切り替えるためにアクティビティと比較される閾値を、（量子化パラメータなどにより示され得る）期待されるビットレートに応じて変化させてもよい。例えば、より低いビットレートが期待される場合には、大きいＴＵサイズに対応するアクティビティのレンジをより広くすることで、ビットレートを効果的に低減することができる。また、より高いビットレートが許容される場合には、小さいＴＵサイズに対応するアクティビティのレンジをより広くすることで、画質の劣化を抑制することができる。

　＜３．一実施形態に係る符号化時の処理の流れ＞
　　［３－１．概略的な流れ］
　図１４は、一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

　図１４を参照すると、まず、ＢＬ符号化部１ａは、ベースレイヤの符号化処理を実行し、ベースレイヤの符号化ストリームを生成する（ステップＳ１１）。ここで実行される符号化処理において、ローカルデコーダ２は、符号化ストリームを復号して、ベースレイヤのリコンストラクト画像を生成する。

　次に、中間処理部３は、ＢＬ符号化部１ａから入力されるベースレイヤのリコンストラクト画像がインターレースされている場合に、当該リコンストラクト画像をデインターレースする。また、中間処理部３は、必要に応じて、リコンストラクト画像をアップサンプリングする（ステップＳ１２）。

　次に、ＥＬ符号化部１ｂは、中間処理部３により処理されたリコンストラクト画像を用いて、エンハンスメントレイヤの符号化処理を実行し、エンハンスメントレイヤの符号化ストリームを生成する（ステップＳ１３）。

　次に、多重化部４は、ＢＬ符号化部１ａにより生成されるベースレイヤの符号化ストリームと、ＥＬ符号化部１ｂにより生成されるエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する（ステップＳ１４）。

　　［３－２．レート制御に関連する処理］
　図１５は、エンハンスメントレイヤの符号化処理（図１４のステップＳ１３）におけるレート制御に関連する処理の流れの一例を示すフローチャートである。

　図１５を参照すると、まず、レート制御部１８は、例えばＭＰＥＧ２テストモデルと同等のレート制御方式に従って、ＣＵごとの量子化パラメータを算出する（ステップＳ２１）。そして、レート制御部１８は、算出した量子化パラメータを含むレート制御信号を、量子化制御部４０へ出力する。

　次に、量子化制御部４０は、ベースレイヤのリコンストラクト画像を用いて、レート制御関連パラメータ生成処理を実行する（ステップＳ２２）。ここで実行されるレート制御関連パラメータ生成処理の３つの例について、後にさらに説明する。そして、量子化制御部４０は、生成したレート制御関連パラメータを可逆符号化部１６へ出力する。また、量子化制御部４０は、量子化パラメータを量子化部１５及び逆量子化部２１へ出力する。

　次に、量子化部１５は、量子化制御部４０から入力される量子化パラメータに対応する量子化ステップで、エンハンスメントレイヤの変換係数データを量子化し、量子化データを生成する（ステップＳ２３）。そして、量子化部１５は、量子化データを可逆符号化部１６及び逆量子化部２１へ出力する。

　次に、可逆符号化部１６は、量子化部１５から入力される量子化データを符号化して、エンハンスメントレイヤの符号化ストリームを生成する（ステップＳ２４）。また、可逆符号化部１６は、量子化制御部４０から入力されるレート制御関連パラメータを符号化して、符号化されたパラメータを符号化ストリームのヘッダ領域（例えば、ＰＰＳ、スライスヘッダ又はＴＵヘッダ）に挿入する（ステップＳ２５）。そして、可逆符号化部１６は、エンハンスメントレイヤの符号化ストリームを蓄積バッファ１７へ出力する。

　次に、逆量子化部２１は、量子化制御部４０から入力される量子化パラメータに対応する量子化ステップで、エンハンスメントレイヤの量子化データを逆量子化し、変換係数データを復元する（ステップＳ２６）。そして、逆量子化部２１は、復元した変換係数データを逆直交変換部２２へ出力する。

　その後、逆直交変換、フィルタリング、イントラ予測及びインター予測などの後続の処理が実行される。図１５に示した処理は、例えば、各エンハンスメントレイヤ画像のＬＣＵなどの単位で繰り返し実行され得る。

　　［３－３．レート制御関連パラメータ生成処理］
　　　（１）第１の構成例
　図１６は、図１５に示したレート制御関連パラメータ生成処理の詳細な流れの第１の例を示すフローチャートである。ここで説明する第１の例は、図９に示した量子化制御部４０の第１の構成例に対応する。

　図１６を参照すると、まず、ブロック設定部４１は、中間処理部３から入力されるベースレイヤのリコンストラクト画像に、アクティビティを算出する単位となるブロックを設定する（ステップＳ３１）。

　次に、アクティビティ算出部４２は、ブロック設定部４１により設定されたブロックごとに、例えばＭＰＥＧ２テストモデルに従って、リコンストラクト画像の複雑さを示すアクティビティを算出する（ステップＳ３２）。

　次に、差分予測部４５は、アクティビティ算出部４２により算出されたブロックごとのアクティビティを用いて、例えば上述した式（２）に従って、量子化パラメータの差分予測値pred_qp_deltaを決定する（ステップＳ３４）。

　次に、基準ＱＰ設定部４８及び残差算出部５０は、レート制御に従って決定されるブロックごとの量子化パラメータcu_qpを、レート制御部１８から取得する（ステップＳ３６）。

　次に、基準ＱＰ設定部４８は、スライスごとの量子化パラメータの基準値slice_qpを決定し、決定した基準値を指定するパラメータpic_init_qp_minus26及びslice_qp_deltaを生成する（ステップＳ３８）。

　次に、残差算出部５０は、各ブロックが属するスライスに、基準ＱＰ設定部４８により設定された量子化パラメータの基準値slice_qpを、基準ＱＰ設定部４８から取得する（ステップＳ３９）。

　そして、残差算出部５０は、量子化パラメータの基準値slice_qpと差分予測値pred_qp_deltaとの和である予測値pred_qpを、実際に使用される量子化パラメータcu_qpから減算することにより、ブロックごとの残差resi_qp_deltaを算出する（ステップＳ４０）。

　　　（２）第２の構成例
　図１７は、図１５に示したレート制御関連パラメータ生成処理の詳細な流れの第２の例を示すフローチャートである。ここで説明する第２の例は、図１０に示した量子化制御部４０の第２の構成例に対応する。

　図１７を参照すると、まず、ブロック設定部４１は、中間処理部３から入力されるベースレイヤのリコンストラクト画像に、平均画素値を算出する単位となるブロックを設定する（ステップＳ３１）。

　次に、平均算出部４４は、ブロック設定部４１により設定されたブロックごとに、リコンストラクト画像のブロック内の平均画素値を算出する（ステップＳ３３）。

　次に、差分予測部４６は、平均算出部４４により算出された平均画素値とモデル記憶部４７により予め記憶されるグラフ（例えば、図１１に例示したようなＪＮＤモデルに従って定義されるグラフ）とを用いて、量子化パラメータの差分予測値pred_qp_deltaを決定する（ステップＳ３５）。

　　　（３）第３の構成例
　図１８は、図１５に示したレート制御関連パラメータ生成処理の詳細な流れの第３の例を示すフローチャートである。ここで説明する第３の例は、図１２に示した量子化制御部４０の第３の構成例に対応する。

　図１８を参照すると、まず、ブロック設定部４１は、中間処理部３から入力されるベースレイヤのリコンストラクト画像に、アクティビティを算出する単位となるブロックを設定する（ステップＳ３１）。

　次に、基準ＱＰ設定部５１は、レート制御に従って決定されるブロックごとの量子化パラメータcu_qp_refを、レート制御部１８から取得する（ステップＳ３７）。

　次に、基準ＱＰ設定部５１は、スライスごとの量子化パラメータの基準値slice_qpを決定し、決定した基準値を指定するパラメータpic_init_qp_minus26及びslice_qp_deltaを生成する（ステップＳ３８）。

　次に、ＱＰ決定部５３は、各ブロックが属するスライスに、基準ＱＰ設定部４８により設定された量子化パラメータの基準値slice_qpを、基準ＱＰ設定部５１から取得する（ステップＳ４１）。

　そして、ＱＰ決定部５３は、量子化パラメータの基準値slice_qpと差分予測値pred_qp_deltaとを加算することにより、ブロックごとに予測値pred_qpを算出する（ステップＳ４２）。ここで算出される予測値pred_qpは、量子化部１５及び逆量子化部２１により実際に使用される量子化パラメータcu_qpに等しい。

　＜４．一実施形態に係るＥＬ復号部の構成例＞
　　［４－１．全体的な構成］
　図１９は、図７に示したＥＬ復号部６ｂの構成の一例を示すブロック図である。図１９を参照すると、ＥＬ復号部６ｂは、蓄積バッファ６１、可逆復号部６２、逆量子化部６３、逆直交変換部６４、加算部６５、デブロックフィルタ６６、並び替えバッファ６７、Ｄ／Ａ（Digital　to　Analogue）変換部６８、フレームメモリ６９、セレクタ７０及び７１、イントラ予測部７５、インター予測部８０並びに逆量子化制御部８５を備える。

　蓄積バッファ６１は、逆多重化部５から入力されるエンハンスメントレイヤの符号化ストリームを記憶媒体を用いて一時的に蓄積する。

　可逆復号部６２は、蓄積バッファ６１から入力されるエンハンスメントレイヤの符号化ストリームから、符号化の際に使用された符号化方式に従ってエンハンスメントレイヤの量子化データを復号する。また、可逆復号部６２は、符号化ストリームのヘッダ領域に挿入されている情報を復号する。可逆復号部６２により復号される情報は、例えば、イントラ予測に関する情報、インター予測に関する情報及びレート制御関連パラメータを含み得る。可逆復号部６２は、イントラ予測に関する情報をイントラ予測部７５へ出力する。また、可逆復号部６２は、インター予測に関する情報をインター予測部８０へ出力する。また、可逆復号部６２は、量子化データを逆量子化部６３へ出力すると共に、レート制御関連パラメータを逆量子化制御部８５へ出力する。

　逆量子化部６３は、可逆復号部６２から入力される量子化データを、逆量子化制御部８５から入力される量子化パラメータに対応する量子化ステップで逆量子化し、エンハンスメントレイヤの変換係数データを復元する。そして、逆量子化部６３は、復元した変換係数データを逆直交変換部６４へ出力する。

　逆直交変換部６４は、符号化の際に使用された直交変換方式に従い、逆量子化部６３から入力される変換係数データについて逆直交変換を行うことにより、予測誤差データを生成する。そして、逆直交変換部６４は、生成した予測誤差データを加算部６５へ出力する。

　加算部６５は、逆直交変換部６４から入力される予測誤差データと、セレクタ７１から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部６５は、生成した復号画像データをデブロックフィルタ６６及びフレームメモリ６９へ出力する。

　デブロックフィルタ６６は、加算部６５から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データを並び替えバッファ６７及びフレームメモリ６９へ出力する。

　並び替えバッファ６７は、デブロックフィルタ６６から入力される画像を並び替えることにより、時系列の一連の画像データを生成する。そして、並び替えバッファ６７は、生成した画像データをＤ／Ａ変換部６８へ出力する。

　Ｄ／Ａ変換部６８は、並び替えバッファ６７から入力されるデジタル形式の画像データをアナログ形式の画像信号に変換する。そして、Ｄ／Ａ変換部６８は、例えば、画像復号装置６０と接続されるディスプレイ（図示せず）にアナログ画像信号を出力することにより、エンハンスメントレイヤの画像を表示させる。

　フレームメモリ６９は、加算部６５から入力されるフィルタリング前の復号画像データ、デブロックフィルタ６６から入力されるフィルタリング後の復号画像データ、及び中間処理部７から入力されるベースレイヤのリコンストラクト画像データを記憶媒体を用いて記憶する。

　セレクタ７０は、可逆復号部６２により取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ６９からの画像データの出力先をイントラ予測部７５とインター予測部８０との間で切り替える。例えば、セレクタ７０は、イントラ予測モードが指定された場合には、フレームメモリ６９から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部７５へ出力する。また、セレクタ７０は、インター予測モードが指定された場合には、フィルタリング後の復号画像データを参照画像データとしてインター予測部８０へ出力する。ベースレイヤのリコンストラクト画像データもまた、イントラ予測部７５又はインター予測部８０へ供給され得る。

　セレクタ７１は、可逆復号部６２により取得されるモード情報に応じて、加算部６５へ供給すべき予測画像データの出力元をイントラ予測部７５とインター予測部８０との間で切り替える。例えば、セレクタ７１は、イントラ予測モードが指定された場合には、イントラ予測部７５から出力される予測画像データを加算部６５へ供給する。また、セレクタ７１は、インター予測モードが指定された場合には、インター予測部８０から出力される予測画像データを加算部６５へ供給する。

　イントラ予測部７５は、可逆復号部６２から入力されるイントラ予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤのイントラ予測処理を行い、予測画像データを生成する。そして、イントラ予測部７５は、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。

　インター予測部８０は、可逆復号部６２から入力されるインター予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤの動き補償処理を行い、予測画像データを生成する。そして、インター予測部８０は、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。

　逆量子化制御部８５は、可逆復号部６２により復号されるレート制御関連パラメータを用いて、ＥＬ復号部６ｂにおける逆量子化処理を制御する。より具体的には、逆量子化制御部８５は、レート制御関連パラメータを用いてＣＵごとの量子化パラメータcu_qpを決定し、決定した量子化パラメータcu_qpを逆量子化部６３へ出力する。例えば、レート制御関連パラメータは、スライスごとの量子化パラメータの基準値slice_qpを指定する２つのパラメータpic_init_qp_minus26及びslice_qp_deltaを含む。逆量子化制御部８５は、これら２つのパラメータを用いて、量子化パラメータの基準値slice_qpを決定する。なお、pic_init_qp_minus26はピクチャごとに、slice_qp_deltaはスライスごとに復号され得る。また、逆量子化制御部８５は、ＢＬ復号部６ａにより生成されるベースレイヤのリコンストラクト画像を用いて、ＣＵごとの量子化パラメータを予測する。典型的には、量子化パラメータの予測値は、ＣＵごとの基準値と差分予測値との和である。差分予測値は、ベースレイヤのリコンストラクト画像の特性に基づいて決定される。ＣＵごとの量子化パラメータの基準値は、スライス内で近傍ＣＵの量子化パラメータから予測される予測基準値であってもよい。実際に使用される量子化パラメータcu_qpは、量子化パラメータの基準値と差分予測値との和に等しくてもよい。その代わりに、量子化パラメータcu_qpは、可逆復号部６２により復号され得る残差を、量子化パラメータの基準値と差分予測値との和に加算した値であってもよい。

　　［４－２．逆量子化制御部の第１の構成例］
　図２０は、図１９に示した逆量子化制御部８５の第１の構成例を示すブロック図である。図２０を参照すると、逆量子化制御部８５は、ブロック設定部８６、アクティビティ算出部８７、アクティビティバッファ８８、差分予測部９０、基準ＱＰ設定部９３、ＱＰバッファ９４及びＱＰ算出部９５を有する。

　ブロック設定部８６は、中間処理部７から入力されるベースレイヤのリコンストラクト画像に、アクティビティを算出する単位となるブロックを設定する。ブロック設定部８６により設定されるブロックのサイズは、サイズ情報に相当するパラメータdiff_cu_qp_delta_depthにより指定される。パラメータdiff_cu_qp_delta_depthは、ピクチャごとに可逆復号部６２により復号され得る。

　アクティビティ算出部８７は、ブロック設定部８６により設定されるブロックごとに、リコンストラクト画像の複雑さを示すアクティビティを算出する。アクティビティの値は、ブロック内の画素値の分散が大きいほど大きい値をとる。アクティビティ算出部８７は、例えば、上述したＭＰＥＧ２テストモデルに従って、アクティビティを算出してよい。アクティビティ算出部８７は、典型的には、アクティビティを、その値が所定のレンジに収まるように正規化する。ＭＰＥＧ２テストモデルでは、正規化されたアクティビティの値のレンジは０．５～２．０である。そして、アクティビティ算出部８７は、算出したブロックごとのアクティビティＡ_normを、アクティビティバッファ８８及び差分予測部９０へ出力する。

　アクティビティバッファ８８は、アクティビティ算出部８７から入力されるアクティビティを参照アクティビティとしてバッファリングする。参照アクティビティは、各ブロックのアクティビティを正規化する際に、アクティビティ算出部８７により使用される。

　差分予測部９０は、アクティビティ算出部８７により算出されるブロックごとのアクティビティＡ_normから、上述した式（２）に従って量子化パラメータの差分予測値pred_qp_deltaを決定する。なお、差分予測部９０は、式（２）における対数演算を、予め記憶されるルックアップテーブルを用いて実行してよい。そして、差分予測部９０は、ブロックごとに決定した差分予測値pred_qp_deltaを、ＱＰ算出部９５へ出力する。

　基準ＱＰ設定部９３は、可逆復号部６２により復号されるレート制御関連パラメータpic_init_qp_minus26及びslice_qp_deltaを取得する。パラメータpic_init_qp_minus26は、ピクチャごとの量子化パラメータの初期値を指定する。パラメータslice_qp_deltaは、スライスごとの量子化パラメータの基準値slice_qpと上記初期値との差分を指定する。そして、基準ＱＰ設定部９３は、これらパラメータを用いてスライスごとに算出される量子化パラメータの基準値slice_qpを、ＱＰ算出部９５へ出力する。

　なお、基準ＱＰ設定部９３は、スライスごとの量子化パラメータの基準値slice_qpを、スライス内の各ブロック（例えば、ＣＵ）について、当該ブロックの近傍ブロックに適用された量子化パラメータに基づいて予測してもよい。ここでの近傍ブロックは、上の及び左の隣接ブロック、並びに復号順で直前のブロックのうちの少なくとも１つを含む。例えば、スライスの先頭のブロックの基準値としてレート制御関連パラメータにより指定されるslice_qpが使用され、後続するブロックの基準値として基準ＱＰ設定部９３により予測される予測基準値が使用されてもよい（図５参照）。上の隣接ブロック及び左のブロックの双方が参照可能な場合には、予測基準値は、上の隣接ブロック及び左の隣接ブロックの量子化パラメータの平均値に等しい。そうでない場合には、予測基準値は、参照可能な近傍ブロックに適用された量子化パラメータに等しい。

　ＱＰバッファ９４は、ＱＰ算出部９５から入力されるＣＵごとの量子化パラメータcu_qpを参照量子化パラメータとしてバッファリングする。参照量子化パラメータは、各ブロックの量子化パラメータの基準値を予測する際に、基準ＱＰ設定部９３により使用される。

　ＱＰ算出部９５は、基準ＱＰ設定部９３から入力される量子化パラメータの基準値slice_qpと差分予測部９０から入力される差分予測値pred_qp_deltaとを加算することにより、量子化パラメータの予測値pred_qpをＣＵごとに算出する。また、ＱＰ算出部９５は、可逆復号部６２により復号される量子化パラメータの残差resi_qp_deltaを、可逆復号部６２から取得する。そして、ＱＰ算出部９５は、量子化パラメータの予測値pred_qpと取得した残差resi_qp_deltaとの和に等しい量子化パラメータcu_qpを、上述した式（３）に従って算出する。そして、ＱＰ算出部９５は、ＣＵごとに算出される量子化パラメータcu_qpを、ＱＰバッファ９４及び逆量子化部６３へ出力する。

　第１の構成例において可逆復号部６２により復号される量子化パラメータの残差は、上記非特許文献１に記載されているパラメータcu_qp_delta_abs及びcu_qp_delta_signにより示される残差と比較して、差分予測値pred_qp_deltaの分だけ減殺されている。即ち、エンハンスメントレイヤの符号化ストリーム内のレート制御関連パラメータの符号量は、既存の手法と比較して少ない。

　　［４－３．逆量子化制御部の第２の構成例］
　図２１は、図１９に示した逆量子化制御部８５の第２の構成例を示すブロック図である。図２１を参照すると、逆量子化制御部８５は、ブロック設定部８６、平均算出部８９、差分予測部９１、モデル記憶部９２、基準ＱＰ設定部９３、ＱＰバッファ９４及びＱＰ算出部９５を有する。

　平均算出部８９は、ブロック設定部８６により設定されるブロックごとに、リコンストラクト画像のブロック内の平均画素値Ｐ_ＡＶeを算出する。そして、平均算出部８９は、算出したブロックごとの平均画素値Ｐ_ＡＶeを差分予測部９１へ出力する。

　差分予測部９１は、平均算出部８９により算出された平均画素値と差分予測値との間の予め定義される関係に従って、量子化パラメータの差分予測値をブロックごとに決定する。ここで差分予測部９１により利用される平均画素値と差分予測値との間の関係は、例えば、上述した寄書ＪＣＴＶＣ－Ｈ０４７７＿ｒ１に記載されているＪＮＤモデルに従って定義されてよい。差分予測部９１は、例えば、図１１に例示したようなＪＮＤモデルのグラフを参照し、平均算出部８９から入力される平均画素値Ｐ_ＡＶeに対応する差分予測値pred_qp_deltaを取得する。そして、差分予測部９１は、取得した差分予測値pred_qp_deltaを、ＱＰ算出部９５へ出力する。

　モデル記憶部９２は、平均画素値と差分予測値との間の関係を示すグラフ（例えば、ＪＮＤモデルのグラフ）を予め記憶する。当該グラフは、各ブロックの差分予測値を取得するために差分予測部９１により参照される。

　第２の構成例においても、ＱＰ算出部９５は、基準ＱＰ設定部９３から入力される量子化パラメータの基準値slice_qpと差分予測部９１から入力される差分予測値pred_qp_deltaとを加算することにより、量子化パラメータの予測値pred_qpをＣＵごとに算出する。また、ＱＰ算出部９５は、可逆復号部６２により復号される量子化パラメータの残差resi_qp_deltaを、可逆復号部６２から取得する。そして、ＱＰ算出部９５は、量子化パラメータの予測値pred_qpと取得した残差resi_qp_deltaとの和に等しい量子化パラメータcu_qpを、上述した式（３）に従って算出する。そして、ＱＰ算出部９５は、ＣＵごとに算出される量子化パラメータcu_qpを、ＱＰバッファ９４及び逆量子化部６３へ出力する。

　第１の構成例と同様、第２の構成例においても、量子化パラメータの残差は、既存の手法と比較して差分予測値pred_qp_deltaの分だけ減算されている。即ち、エンハンスメントレイヤの符号化ストリーム内のレート制御関連パラメータの符号量は、既存の手法と比較して少ない。

　　［４－４．逆量子化制御部の第３の構成例］
　図２２は、図１９に示した逆量子化制御部８５の第３の構成例を示すブロック図である。図２２を参照すると、逆量子化制御部８５は、ブロック設定部８６、アクティビティ算出部８７、アクティビティバッファ８８、差分予測部９０、基準ＱＰ設定部９３、ＱＰバッファ９４及びＱＰ算出部９６を有する。

　ＱＰ算出部９６は、基準ＱＰ設定部９３から入力される量子化パラメータの基準値slice_qpと差分予測部９０から入力される差分予測値pred_qp_deltaとを加算することにより、量子化パラメータの予測値pred_qpをＣＵごとに算出する。第３の構成例において、この予測値pred_qpは、上述した式（４）に示した通り、逆量子化部６３により実際に使用される量子化パラメータcu_qpに等しい。そして、ＱＰ算出部９６は、算出した量子化パラメータcu_qp（＝pred_qpを）、ＱＰバッファ９４及び逆量子化部６３へ出力する。この場合、逆量子化部６３は、量子化パラメータの予測値pred_qpに対応する量子化ステップで、エンハンスメントレイヤの量子化データを逆量子化する。

　第３の構成例では、量子化パラメータの残差は符号化ストリーム内に符号化されない。従って、レート制御関連パラメータのための符号量は一層削減される。なお、ここでは、図２０に示した第１の構成例と同様にブロックごとのアクティビティに基づいて量子化パラメータの予測値が決定される例を説明した。しかしながら、かかる例に限定されず、第２の構成例と同様に、ブロックごとの平均画素値に基づいて量子化パラメータの予測値が決定されてもよい。

　　［４－５．追加的なパラメータ］
　可逆復号部６２は、逆量子化を制御するためのいくつかの追加的なパラメータをエンハンスメントレイヤの符号化ストリームから復号してもよい。例えば、可逆復号部６２は、上記非特許文献１に記載されたフラグcu_qp_delta_enabled_flagを復号する。このフラグがTrueを示している場合に、ＬＣＵよりも小さい単位で量子化ステップが指定される。また、可逆復号部６２は、上述した量子化パラメータ予測フラグを復号し得る。逆量子化制御部８５は、復号された量子化パラメータ予測フラグがTrueを示している場合に、ベースレイヤのリコンストラクト画像を用いて、エンハンスメントレイヤの量子化パラメータを予測し得る。また、可逆復号部６２は、上述した決定手法フラグを復号してもよい。例えば、決定手法フラグの第１の値は、ブロックごとのアクティビティに基づく予測に対応し、決定手法フラグの第２の値は、ブロックごとの平均画素値に基づく予測に対応し得る。逆量子化制御部８５は、決定手法フラグに従って、差分予測値pred_qp_deltaを決定するための手法を切り替える。これら追加的なパラメータが採用されることで、逆量子化プロセスの柔軟性が高められ、エンコーダ及びデコーダの用途に応じた最適なレート制御が可能となる。

　　［４－６．変形例］
　図２３は、図１３に示したＥＬ符号化部１ｂにより生成されるエンハンスメントレイヤの符号化ストリームを復号する、ＥＬ復号部６ｂの構成の一変形例を示すブロック図である。図２３を参照すると、ＥＬ復号部６ｂは、蓄積バッファ６１、可逆復号部６２、逆量子化部６３、逆直交変換部１６４、加算部６５、デブロックフィルタ６６、並び替えバッファ６７、Ｄ／Ａ変換部６８、フレームメモリ６９、セレクタ７０及び７１、イントラ予測部７５、インター予測部８０並びに逆量子化・変換制御部１８５を備える。

　逆直交変換部１６４は、逆量子化部６３から入力される変換係数データについて、後に説明する逆量子化・変換制御部１８５により決定されるＴＵサイズを有するＴＵごとに逆直交変換を行うことにより、予測誤差データを生成する。そして、逆直交変換部１６４は、生成した予測誤差データを加算部６５へ出力する。

　逆量子化・変換制御部１８５は、可逆復号部６２により復号されるレート制御関連パラメータを用いて、ＥＬ復号部６ｂにおける逆量子化処理を制御する。より具体的には、逆量子化制御部８５は、図１９に示した逆量子化制御部８５と同様に、レート制御関連パラメータを用いてＣＵごとの量子化パラメータcu_qpを決定し、決定した量子化パラメータcu_qpを逆量子化部６３へ出力する。

　また、逆量子化・変換制御部１８５は、ベースレイヤのリコンストラクト画像を用いて、エンハンスメントレイヤのための直交変換サイズ（ＴＵサイズ）を制御する。例えば、逆量子化・変換制御部１８５は、ベースレイヤのリコンストラクト画像を用いてブロックごとにアクティビティ（例えば、上述した正規化アクティビティＡ_norm）を算出し、算出したアクティビティの大きさに従ってをＴＵサイズを決定する。より具体的には、逆量子化・変換制御部１８５は、アクティビティのより低いブロックの存在する領域により大きいＴＵサイズを設定し、アクティビティのより高いブロックの存在する領域により小さいＴＵサイズを設定する。逆量子化・変換制御部１８５は、所定の閾値を上回るアクティビティを示すブロックについて逆直交変換のスキップ（Transform　Skip）を適用してもよい。

　逆量子化・変換制御部１８５は、本変形例において説明したＴＵサイズの制御を、イントラスライスにのみ適用してもよい。また、逆量子化・変換制御部１８５は、ＴＵサイズを切り替えるためにアクティビティと比較される閾値を、量子化パラメータに応じて変化させてもよい。例えば、逆量子化・変換制御部１８５は、より大きい量子化パラメータが使用される場合には、より大きいＴＵサイズをエンハンスメントレイヤ画像に設定する。また、逆量子化・変換制御部１８５は、より小さい量子化パラメータが使用される場合には、より小さいＴＵサイズをエンハンスメントレイヤ画像に設定する。

　＜５．一実施形態に係る復号時の処理の流れ＞
　　［５－１．概略的な流れ］
　図２４は、一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

　図２４を参照すると、まず、逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームに逆多重化する（ステップＳ６０）。

　次に、ＢＬ復号部６ａは、ベースレイヤの復号処理を実行し、ベースレイヤの符号化ストリームからベースレイヤ画像を再構築する（ステップＳ６１）。ここで再構築されるベースレイヤ画像は、リコンストラクト画像として中間処理部７へ出力される。

　次に、中間処理部７は、ＢＬ復号部６ａから入力されるベースレイヤのリコンストラクト画像がインターレースされている場合に、当該リコンストラクト画像をデインターレースする。また、中間処理部７は、必要に応じて、リコンストラクト画像をアップサンプリングする（ステップＳ６２）。

　次に、ＥＬ復号部６ｂは、中間処理部７により処理されたリコンストラクト画像を用いて、エンハンスメントレイヤの復号処理を実行し、エンハンスメントレイヤ画像を再構築する（ステップＳ６３）。

　　［５－２．レート制御に関連する処理］
　図２５は、エンハンスメントレイヤの復号処理（図２４のステップＳ６３）におけるレート制御に関連する処理の流れの一例を示すフローチャートである。

　図２５を参照すると、まず、可逆復号部６２は、符号化ストリームのヘッダ領域に挿入されているレート制御関連パラメータを復号する（ステップＳ７１）。ここで復号されるレート制御関連パラメータは、例えば、量子化パラメータの基準値を指定するパラメータ及び量子化パラメータの残差を指定するパラメータを含み得る。上述した追加的なパラメータもまた復号されてよい。そして、可逆復号部６２は、復号したレート制御関連パラメータを逆量子化制御部８５へ出力する。

　次に、逆量子化制御部８５は、ベースレイヤのリコンストラクト画像を用いて、量子化パラメータ再構築処理を実行する（ステップＳ７２）。ここで実行される量子化パラメータ再構築処理の３つの例について、後にさらに説明する。そして、逆量子化制御部８５は、再構築した量子化パラメータを逆量子化部６３へ出力する。

　次に、可逆復号部６２は、エンハンスメントレイヤの符号化ストリームから、エンハンスメントレイヤの量子化データを復号する（ステップＳ７３）。そして、可逆復号部６２は、復号した量子化データを逆量子化部６３へ出力する。

　次に、逆量子化部６３は、逆量子化制御部８５から入力される量子化パラメータに対応する量子化ステップで、エンハンスメントレイヤの量子化データを逆量子化し、変換係数データを復元する（ステップＳ７４）。そして、逆量子化部６３は、復元した変換係数データを逆直交変換部６４へ出力する。

　その後、逆直交変換、予測画像と予測誤差との加算、及びフィルタリングなどの後続の処理が実行される。図２５に示した処理は、例えば、各エンハンスメントレイヤ画像のＬＣＵなどの単位で繰り返し実行され得る。

　　［５－３．量子化パラメータ再構築処理］
　　　（１）第１の構成例
　図２６は、図２５に示した量子化パラメータ再構築処理の詳細な流れの第１の例を示すフローチャートである。ここで説明する第１の例は、図２０に示した逆量子化制御部８５の第１の構成例に対応する。

　図２６を参照すると、まず、ブロック設定部８６は、中間処理部７から入力されるベースレイヤのリコンストラクト画像に、アクティビティを算出する単位となるブロックを設定する（ステップＳ８１）。

　次に、アクティビティ算出部８７は、ブロック設定部８６により設定されたブロックごとに、例えばＭＰＥＧ２テストモデルに従って、リコンストラクト画像の複雑さを示すアクティビティを算出する（ステップＳ８２）。

　次に、差分予測部９０は、アクティビティ算出部８７により算出されたブロックごとのアクティビティを用いて、例えば上述した式（２）に従って、量子化パラメータの差分予測値pred_qp_deltaを決定する（ステップＳ８４）。

　次に、基準ＱＰ設定部９３は、各ブロックが属するスライスに、量子化パラメータの基準値slice_qpを設定する（ステップＳ８６）。量子化パラメータの基準値slice_qpは、可逆復号部６２により復号されるパラメータpic_init_qp_minus26及びslice_qp_deltaにより指定され得る。また、あるブロックについての量子化パラメータの基準値slice_qpは、近傍ブロックに適用される量子化パラメータから予測されてもよい。

　次に、ＱＰ算出部９５は、可逆復号部６２により復号される量子化パラメータの残差resi_qp_deltaを、ブロックごとに可逆復号部６２から取得する（ステップＳ８８）。

　次に、ＱＰ算出部９５は、量子化パラメータの基準値slice_qpと差分予測値pred_qp_deltaとの和である予測値pred_qpに残差resi_qp_deltaを加算することにより、ブロックごとの量子化パラメータcu_qpを算出する（ステップＳ８９）。

　　　（２）第２の構成例
　図２７は、図２５に示した量子化パラメータ再構築処理の詳細な流れの第２の例を示すフローチャートである。ここで説明する第２の例は、図２１に示した逆量子化制御部８５の第２の構成例に対応する。

　図２７を参照すると、まず、ブロック設定部８６は、中間処理部７から入力されるベースレイヤのリコンストラクト画像に、平均画素値を算出する単位となるブロックを設定する（ステップＳ８１）。

　次に、平均算出部８９は、ブロック設定部８６により設定されたブロックごとに、リコンストラクト画像のブロック内の平均画素値を算出する（ステップＳ８３）。

　次に、差分予測部９１は、平均算出部８９により算出されたブロックごとの平均画素値とモデル記憶部９２により予め記憶されるグラフとを用いて、量子化パラメータの差分予測値pred_qp_deltaを決定する（ステップＳ８５）。

　次に、基準ＱＰ設定部９３は、各ブロックが属するスライスに、量子化パラメータの基準値slice_qpを設定する（ステップＳ８６）。

　　　（３）第３の構成例
　図２８は、図２５に示した量子化パラメータ再構築処理の詳細な流れの第３の例を示すフローチャートである。ここで説明する第３の例は、図２２に示した逆量子化制御部８５の第３の構成例に対応する。

　図２８を参照すると、まず、ブロック設定部８６は、中間処理部７から入力されるベースレイヤのリコンストラクト画像に、アクティビティを算出する単位となるブロックを設定する（ステップＳ８１）。

　次に、ＱＰ算出部９６は、量子化パラメータの基準値slice_qpと差分予測値pred_qp_deltaとを加算することにより、ブロックごとの量子化パラメータcu_qpを算出する（ステップＳ９０）。

　＜６．コーデックの組合せの例＞
　本開示に係る技術は、様々なコーデックの組合せでのスケーラブル符号化に適用可能である。多重化されるレイヤの数は、２つ以上のいかなる数であってもよい。但し、標準化されていないコーデックの組合せが利用されると、デコーダが正常に動作しない可能性が生じ得る。そこで、予め定義されるコーデックの組合せのみが、階層的に符号化されることを許容されてもよい。その代わりに、いくつかのコーデックの組合せが、階層的に符号化されることを禁止されてもよい。

　図２９Ａ及び図２９Ｂは、許容され又は禁止され得るコーデックの組合せについて説明するための説明図である。

　図２９Ａを参照すると、最も下位の第１のレイヤＬ１０から最も上位の第５のレイヤＬ１４までの５つのレイヤが示されている。第１のレイヤＬ１０及び第２のレイヤＬ１１は、ＭＰＥＧ２方式で符号化される。第３のレイヤＬ１２及び第４のレイヤＬ１３は、ＡＶＣ方式で符号化される。第５のレイヤＬ１４は、ＨＥＶＣ方式で符号化される。これらレイヤのうち、第１のレイヤＬ１０及び第２のレイヤＬ１１を階層的に符号化することは、コーデックが共通しているため、許容される。第２のレイヤＬ１１及び第３のレイヤＬ１２を階層的に符号化することは、ＭＰＥＧ２方式とＡＶＣ方式との組合せが標準化されていないため、禁止され得る。第３のレイヤＬ１２及び第４のレイヤＬ１３を階層的に符号化することは、コーデックが共通しているため、許容される。第４のレイヤＬ１３及び第５のレイヤＬ１４を階層的に符号化することは、ＡＶＣ方式とＨＥＶＣ方式との組合せが標準化されるため、許容される。図２９Ａの例では、第１のレイヤＬ１０及び第２のレイヤＬ１１の多重化ストリームと、第３のレイヤＬ１２、第４のレイヤＬ１３及び第５のレイヤＬ１４の多重化ストリームとは、スケーラブル符号化ではなく、サイマルキャスト符号化（simulcast-coding）によって多重化され得る。

　図２９Ｂを参照すると、最も下位の第１のレイヤＬ２０から最も上位の第５のレイヤＬ２４までの５つのレイヤが示されている。第１のレイヤＬ２０及び第２のレイヤＬ２１は、ＡＶＣ方式で符号化される。第３のレイヤＬ２２及び第４のレイヤＬ２３は、ＭＰＥＧ２方式で符号化される。第５のレイヤＬ２４は、ＨＥＶＣ方式で符号化される。これらレイヤのうち、第１のレイヤＬ２０及び第２のレイヤＬ２１を階層的に符号化することは、コーデックが共通しているため、許容される。第２のレイヤＬ２１及び第３のレイヤＬ２２を階層的に符号化することは、ＡＶＣ方式とＭＰＥＧ２方式との組合せが標準化されていないため、禁止され得る。第３のレイヤＬ２２及び第４のレイヤＬ２３を階層的に符号化することは、コーデックが共通しているため、許容される。第４のレイヤＬ２３及び第５のレイヤＬ２４を階層的に符号化することは、ＭＰＥＧ２方式とＨＥＶＣ方式との組合せが標準化されるため、許容される。図２９Ｂの例では、第１のレイヤＬ２０及び第２のレイヤＬ２１の多重化ストリームと、第３のレイヤＬ２２、第４のレイヤＬ２３及び第５のレイヤＬ２４の多重化ストリームとは、スケーラブル符号化ではなく、サイマルキャスト符号化によって多重化され得る。

　＜７．応用例＞
　　［７－１．様々な製品への応用］
　上述した実施形態に係る画像符号化装置１０及び画像復号装置６０は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

　　　（１）第１の応用例
　図３０は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース９０９、制御部９１０、ユーザインタフェース９１１、及びバス９１２を備える。

　チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

　デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからＥＰＧ（Electronic　Program　Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

　デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

　映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのＧＵＩ（Graphical　User　Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

　表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はＯＬＥＤなど）の映像面上に映像又は画像を表示する。

　音声信号処理部９０７は、デコーダ９０４から入力される音声データについてＤ／Ａ変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

　外部インタフェース９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

　制御部９１０は、ＣＰＵ（Central　Processing　Unit）などのプロセッサ、並びにＲＡＭ（Random　Access　Memory）及びＲＯＭ（Read　Only　Memory）などのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、プログラムデータ、ＥＰＧデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

　ユーザインタフェース９１１は、制御部９１０と接続される。ユーザインタフェース９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

　バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース９０９及び制御部９１０を相互に接続する。

　このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、テレビジョン装置９００での画像のスケーラブル復号に際して、複数のレイヤがＢＬＲスケーラビリティを実装する場合に、リコンストラクト画像の再利用の仕方を改善してエンハンスメントレイヤの符号量を削減することができる。

　　　（２）第２の応用例
　図３１は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

　アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

　携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

　音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをＡ／Ｄ変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

　記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、ＲＡＭ又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

　また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９の記憶媒体に記憶させる。

　また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、携帯電話機９２０での画像のスケーラブル符号化及び復号に際して、複数のレイヤがＢＬＲスケーラビリティを実装する場合に、リコンストラクト画像の再利用の仕方を改善してエンハンスメントレイヤの符号量を削減することができる。

　　　（３）第３の応用例
　図３２は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

　記録再生装置９４０は、チューナ９４１、外部インタフェース９４２、エンコーダ９４３、ＨＤＤ（Hard　Disk　Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen　Display）９４８、制御部９４９、及びユーザインタフェース９５０を備える。

　チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送手段としての役割を有する。

　外部インタフェース９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース９４２は、例えば、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース、ＵＳＢインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース９４２は、記録再生装置９４０における伝送手段としての役割を有する。

　エンコーダ９４３は、外部インタフェース９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

　ＨＤＤ９４４は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、ＨＤＤ９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

　ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばＤＶＤディスク（ＤＶＤ－Ｖｉｄｅｏ、ＤＶＤ－ＲＡＭ、ＤＶＤ－Ｒ、ＤＶＤ－ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）又はＢｌｕ－ｒａｙ（登録商標）ディスクなどであってよい。

　セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをＨＤＤ９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、ＨＤＤ９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

　デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをＯＳＤ９４８へ出力する。また、デコーダ９０４は、生成した音声データを外部のスピーカへ出力する。

　ＯＳＤ９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、ＯＳＤ９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を重畳してもよい。

　制御部９４９は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

　ユーザインタフェース９５０は、制御部９４９と接続される。ユーザインタフェース９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

　このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施形態に係る画像符号化装置１０の機能を有する。また、デコーダ９４７は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、記録再生装置９４０での画像のスケーラブル符号化及び復号に際して、複数のレイヤがＢＬＲスケーラビリティを実装する場合に、リコンストラクト画像の再利用の仕方を改善してエンハンスメントレイヤの符号量を削減することができる。

　　　（４）第４の応用例
　図３３は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

　撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、制御部９７０、ユーザインタフェース９７１、及びバス９７２を備える。

　光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、及び制御部９７０を相互に接続する。

　光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤ又はＣＭＯＳなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

　信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

　画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、ＯＳＤ９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

　ＯＳＤ９６９は、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を生成して、生成した画像を画像処理部９６４へ出力する。

　外部インタフェース９６６は、例えばＵＳＢ入出力端子として構成される。外部インタフェース９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース９６６は、ＬＡＮ又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース９６６は、撮像装置９６０における伝送手段としての役割を有する。

　メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はＳＳＤ（Solid　State　Drive）のような非可搬性の記憶部が構成されてもよい。

　制御部９７０は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

　ユーザインタフェース９７１は、制御部９７０と接続される。ユーザインタフェース９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

　このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、撮像装置９６０での画像のスケーラブル符号化及び復号に際して、複数のレイヤがＢＬＲスケーラビリティを実装する場合に、リコンストラクト画像の再利用の仕方を改善してエンハンスメントレイヤの符号量を削減することができる。

　　［７－２．スケーラブル符号化の様々な用途］
　上述したスケーラブル符号化の利点は、様々な用途において享受され得る。以下、３つの用途の例について説明する。

　　　（１）第１の例
　第１の例において、スケーラブル符号化は、データの選択的な伝送のために利用される。図３４を参照すると、データ伝送システム１０００は、ストリーム記憶装置１００１及び配信サーバ１００２を含む。配信サーバ１００２は、ネットワーク１００３を介して、いくつかの端末装置と接続される。ネットワーク１００３は、有線ネットワークであっても無線ネットワークであってもよく、又はそれらの組合せであってもよい。図３４には、端末装置の例として、ＰＣ（Personal　Computer）１００４、ＡＶ機器１００５、タブレット装置１００６及び携帯電話機１００７が示されている。

　ストリーム記憶装置１００１は、例えば、画像符号化装置１０により生成される多重化ストリームを含むストリームデータ１０１１を記憶する。多重化ストリームは、ベースレイヤ（ＢＬ）の符号化ストリーム及びエンハンスメントレイヤ（ＥＬ）の符号化ストリームを含む。配信サーバ１００２は、ストリーム記憶装置１００１に記憶されているストリームデータ１０１１を読み出し、読み出したストリームデータ１０１１の少なくとも一部分を、ネットワーク１００３を介して、ＰＣ１００４、ＡＶ機器１００５、タブレット装置１００６、及び携帯電話機１００７へ配信する。

　端末装置へのストリームの配信の際、配信サーバ１００２は、端末装置の能力又は通信環境などの何らかの条件に基づいて、配信すべきストリームを選択する。例えば、配信サーバ１００２は、端末装置が扱うことのできる画質を上回るほど高い画質を有する符号化ストリームを配信しないことにより、端末装置における遅延、オーバフロー又はプロセッサの過負荷の発生を回避してもよい。また、配信サーバ１００２は、高い画質を有する符号化ストリームを配信しないことにより、ネットワーク１００３の通信帯域が占有されることを回避してもよい。一方、配信サーバ１００２は、これら回避すべきリスクが存在しない場合、又はユーザとの契約若しくは何らかの条件に基づいて適切だと判断される場合に、多重化ストリームの全てを端末装置へ配信してもよい。

　図３４の例では、配信サーバ１００２は、ストリーム記憶装置１００１からストリームデータ１０１１を読み出す。そして、配信サーバ１００２は、高い処理能力を有するＰＣ１００４へ、ストリームデータ１０１１をそのまま配信する。また、ＡＶ機器１００５は低い処理能力を有するため、配信サーバ１００２は、ストリームデータ１０１１から抽出されるベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を生成し、ストリームデータ１０１２をＡＶ機器１００５へ配信する。また、配信サーバ１００２は、高い通信レートで通信可能であるタブレット装置１００６へストリームデータ１０１１をそのまま配信する。また、携帯電話機１００７は低い通信レートでしか通信できないため、配信サーバ１００２は、ベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を携帯電話機１００７へ配信する。

　このように多重化ストリームを用いることにより、伝送されるトラフィックの量を適応的に調整することができる。また、個々のレイヤがそれぞれ単独に符号化されるケースと比較して、ストリームデータ１０１１の符号量は削減されるため、ストリームデータ１０１１の全体が配信されるとしても、ネットワーク１００３に掛かる負荷は抑制される。さらに、ストリーム記憶装置１００１のメモリリソースも節約される。

　端末装置のハードウエア性能は、装置ごとに異なる。また、端末装置において実行されるアプリケーションのケイパビリティも様々である。さらに、ネットワーク１００３の通信容量もまた様々である。データ伝送のために利用可能な容量は、他のトラフィックの存在に起因して、時々刻々と変化し得る。そこで、配信サーバ１００２は、ストリームデータの配信を開始する前に、配信先の端末装置との間のシグナリングを通じて、端末装置のハードウエア性能及びアプリケーションケイパビリティなどに関する端末情報と、ネットワーク１００３の通信容量などに関するネットワーク情報とを取得してもよい。そして、配信サーバ１００２は、取得した情報に基づいて、配信すべきストリームを選択し得る。

　なお、復号すべきレイヤの抽出は、端末装置において行われてもよい。例えば、ＰＣ１００４は、受信した多重化ストリームから抽出され復号されるベースレイヤ画像をその画面に表示してもよい。また、ＰＣ１００４は、受信した多重化ストリームからベースレイヤの符号化ストリームを抽出してストリームデータ１０１２を生成し、生成したストリームデータ１０１２を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　図３４に示したデータ伝送システム１０００の構成は一例に過ぎない。データ伝送システム１０００は、いかなる数のストリーム記憶装置１００１、配信サーバ１００２、ネットワーク１００３、及び端末装置を含んでもよい。

　　　（２）第２の例
　第２の例において、スケーラブル符号化は、複数の通信チャネルを介するデータの伝送のために利用される。図３５を参照すると、データ伝送システム１１００は、放送局１１０１及び端末装置１１０２を含む。放送局１１０１は、地上波チャネル１１１１上で、ベースレイヤの符号化ストリーム１１２１を放送する。また、放送局１１０１は、ネットワーク１１１２を介して、エンハンスメントレイヤの符号化ストリーム１１２２を端末装置１１０２へ送信する。

　端末装置１１０２は、放送局１１０１により放送される地上波放送を受信するための受信機能を有し、地上波チャネル１１１１を介してベースレイヤの符号化ストリーム１１２１を受信する。また、端末装置１１０２は、放送局１１０１と通信するための通信機能を有し、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信する。

　端末装置１１０２は、例えば、ユーザからの指示に応じて、ベースレイヤの符号化ストリーム１１２１を受信し、受信した符号化ストリーム１１２１からベースレイヤ画像を復号してベースレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したベースレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　また、端末装置１１０２は、例えば、ユーザからの指示に応じて、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信し、ベースレイヤの符号化ストリーム１１２１とエンハンスメントレイヤの符号化ストリーム１１２２とを多重化することにより多重化ストリームを生成してもよい。また、端末装置１１０２は、エンハンスメントレイヤの符号化ストリーム１１２２からエンハンスメントレイヤ画像を復号してエンハンスメントレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したエンハンスメントレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　上述したように、多重化ストリームに含まれる各レイヤの符号化ストリームは、レイヤごとに異なる通信チャネルを介して伝送され得る。それにより、個々のチャネルに掛かる負荷を分散させて、通信の遅延若しくはオーバフローの発生を抑制することができる。

　また、何らかの条件に応じて、伝送のために使用される通信チャネルが動的に選択されてもよい。例えば、データ量が比較的多いベースレイヤの符号化ストリーム１１２１は帯域幅の広い通信チャネルを介して伝送され、データ量が比較的少ないエンハンスメントレイヤの符号化ストリーム１１２２は帯域幅の狭い通信チャネルを介して伝送され得る。また、特定のレイヤの符号化ストリーム１１２２が伝送される通信チャネルが、通信チャネルの帯域幅に応じて切り替えられてもよい。それにより、個々のチャネルに掛かる負荷をより効果的に抑制することができる。

　なお、図３５に示したデータ伝送システム１１００の構成は一例に過ぎない。データ伝送システム１１００は、いかなる数の通信チャネル及び端末装置を含んでもよい。また、放送以外の用途において、ここで説明したシステムの構成が利用されてもよい。

　　　（３）第３の例
　第３の例において、スケーラブル符号化は、映像の記憶のために利用される。図３６を参照すると、データ伝送システム１２００は、撮像装置１２０１及びストリーム記憶装置１２０２を含む。撮像装置１２０１は、被写体１２１１を撮像することにより生成される画像データをスケーラブル符号化し、多重化ストリーム１２２１を生成する。多重化ストリーム１２２１は、ベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームを含む。そして、撮像装置１２０１は、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給する。

　ストリーム記憶装置１２０２は、撮像装置１２０１から供給される多重化ストリーム１２２１を、モードごとに異なる画質で記憶する。例えば、ストリーム記憶装置１２０２は、通常モードにおいて、多重化ストリーム１２２１からベースレイヤの符号化ストリーム１２２２を抽出し、抽出したベースレイヤの符号化ストリーム１２２２を記憶する。これに対し、ストリーム記憶装置１２０２は、高画質モードにおいて、多重化ストリーム１２２１をそのまま記憶する。それにより、ストリーム記憶装置１２０２は、高画質での映像の記録が望まれる場合にのみ、データ量の多い高画質のストリームを記録することができる。そのため、画質の劣化のユーザへの影響を抑制しながら、メモリリソースを節約することができる。

　例えば、撮像装置１２０１は、監視カメラであるものとする。撮像画像に監視対象（例えば侵入者）が映っていない場合には、通常モードが選択される。この場合、撮像画像は重要でない可能性が高いため、データ量の削減が優先され、映像は低画質で記録される（即ち、ベースレイヤの符号化ストリーム１２２２のみが記憶される）。これに対し、撮像画像に監視対象（例えば、侵入者である被写体１２１１）が映っている場合には、高画質モードが選択される。この場合、撮像画像は重要である可能性が高いため、画質の高さが優先され、映像は高画質で記録される（即ち、多重化ストリーム１２２１が記憶される）。

　図３６の例では、モードは、例えば画像解析結果に基づいて、ストリーム記憶装置１２０２により選択される。しかしながら、かかる例に限定されず、撮像装置１２０１がモードを選択してもよい。後者の場合、撮像装置１２０１は、通常モードにおいて、ベースレイヤの符号化ストリーム１２２２をストリーム記憶装置１２０２へ供給し、高画質モードにおいて、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給してもよい。

　なお、モードを選択するための選択基準は、いかなる基準であってもよい。例えば、マイクロフォンを通じて取得される音声の大きさ又は音声の波形などに応じて、モードが切り替えられてもよい。また、周期的にモードが切り替えられてもよい。また、ユーザがらの指示に応じてモードが切り替えられてもよい。さらに、選択可能なモードの数は、階層化されるレイヤの数を超えない限り、いかなる数であってもよい。

　図３６に示したデータ伝送システム１２００の構成は一例に過ぎない。データ伝送システム１２００は、いかなる数の撮像装置１２０１を含んでもよい。また、監視カメラ以外の用途において、ここで説明したシステムの構成が利用されてもよい。

　　［７－３．その他］
　　　（１）マルチビューコーデックへの応用
　マルチビューコーデックは、いわゆる多視点映像を符号化し及び復号するための画像符号化方式である。図３７は、マルチビューコーデックについて説明するための説明図である。図３７を参照すると、３つの視点においてそれぞれ撮影される３つのビューのフレームのシーケンスが示されている。各ビューには、ビューＩＤ（view_id）が付与される。これら複数のビューのうちいずれか１つのビューが、ベースビュー（base　view）に指定される。ベースビュー以外のビューは、ノンベースビューと呼ばれる。図３７の例では、ビューＩＤが“０”であるビューがベースビューであり、ビューＩＤが“１”又は“２”である２つのビューがノンベースビューである。

　本開示に係る技術に従って、マルチビューの画像データを符号化し又は復号する際、ベースビューのリコンストラクト画像を用いてノンベースビューのための量子化パラメータを予測することにより、全体としての符号量を削減することができる。それにより、スケーラブル符号化のケースと同様に、マルチビューコーデックにおいても、符号化効率を一層向上させることができる。

　　　（２）ストリーミング技術への応用
　本開示に係る技術は、ストリーミングプロトコルに適用されてもよい。例えば、ＭＰＥＧ－ＤＡＳＨ（Dynamic　Adaptive　Streaming　over　HTTP）では、解像度などのパラメータが互いに異なる複数の符号化ストリームがストリーミングサーバにおいて予め用意される。そして、ストリーミングサーバは、複数の符号化ストリームからストリーミングすべき適切なデータをセグメント単位で動的に選択し、選択したデータを配信する。このようなストリーミングプロトコルにおいて、１つの符号化ストリームのリコンストラクト画像から他の符号化ストリームのための量子化パラメータが予測されてもよい。

　＜８．まとめ＞
　ここまで、図１～図３７を用いて、本開示に係る技術のいくつかの実施形態について詳細に説明した。上述した実施形態によれば、ベースレイヤの符号化ストリームを復号することにより生成されるリコンストラクト画像を用いて、エンハンスメントレイヤの変換係数データを逆量子化する際に使用される量子化パラメータが予測される。従って、エンハンスメントレイヤにおいてベースレイヤから完全に独立して量子化パラメータが決定される手法と比較して、エンハンスメントレイヤにおけるレート制御に関連するパラメータのための符号量を削減し、符号化効率を高めることができる。

　また、上述した実施形態によれば、量子化パラメータの基準値との差分に相当する差分予測値が、リコンストラクト画像を用いて決定される。一般的なレート制御方式において、量子化パラメータの増加又は減少は、画像の局所的な特性（例えば、複雑さ）との相関を有する。従って、量子化パラメータの基準値からの差分を予測の対象とすることで、画像の特性のレイヤ間の類似性を活用することが可能となり、高い精度での量子化パラメータの予測を実現することができる。

　また、上述した実施形態によれば、量子化パラメータの基準値は、エンハンスメントレイヤの符号化ストリームから復号されるパラメータによって指定され、又はエンハンスメントレイヤ内で近傍ブロックの量子化パラメータから予測され得る。従って、量子化パラメータの基準値の柔軟な設定が可能である。

　ある実施例によれば、量子化パラメータの予測の残差が符号化される。この場合、エンハンスメントレイヤにおけるレート制御の正確性を維持することができる。また、別の実施例によれば、量子化パラメータの予測の残差の符号化は省略される。この場合、エンハンスメントレイヤの符号量をさらに削減することができる。

　また、ある実施例によれば、ブロックごとの画像の複雑さを示すアクティビティに基づいて、量子化パラメータの差分予測値が決定される。この場合、局所的な画像の複雑さに応じて、量子化パラメータの予測値を適切に変化させることができる。また、別の実施例によれば、ブロックごとの平均画素値に基づいて、量子化パラメータの差分予測値が決定される。この場合、人間の視覚特性としての画像の歪みに対する識別能力に応じて、量子化パラメータの予測値を適切に変化させることができる。

　また、ある変形例によれば、ベースレイヤのリコンストラクト画像を用いて、エンハンスメントレイヤのための直交変換サイズが制御される。従って、平坦な画像領域についてはより大きい直交変換サイズを設定し、複雑なテクスチャを有する画像領域についてはより小さい直交変換サイズを設定するというよう画像の特性に応じた適応的な制御が可能となる。それにより、画質の劣化を回避しながら、変換係数データの符号量を削減することができる。また、エンハンスメントレイヤにおいてＴＵサイズを指定するパラメータの符号化を省略することも可能となる。

　なお、本明細書では、レート制御及び量子化に関する情報が、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について主に説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　ベースレイヤの符号化ストリームを復号して、前記ベースレイヤのリコンストラクト画像を生成するベースレイヤ復号部と、
　前記ベースレイヤ復号部により生成される前記リコンストラクト画像を用いて、エンハンスメントレイヤのための量子化パラメータを予測する制御部と、
　前記制御部により予測される前記量子化パラメータを用いて、前記エンハンスメントレイヤの変換係数データを逆量子化する逆量子化部と、
　を備える画像処理装置。
（２）
　前記制御部は、前記量子化パラメータの基準値との差分に相当する差分予測値を、前記リコンストラクト画像を用いて決定する、前記（１）に記載の画像処理装置。
（３）
　前記画像処理装置は、前記エンハンスメントレイヤの符号化ストリームから前記量子化パラメータの前記基準値を指定するパラメータを復号する復号部、をさらに備え、
　前記制御部は、前記復号部により復号される前記基準値と前記差分予測値との和を算出することにより、前記量子化パラメータの予測値を算出する、
　前記（２）に記載の画像処理装置。
（４）
　前記制御部は、第１のブロックに適用される前記量子化パラメータの前記基準値を、前記第１のブロックの近傍ブロックに適用された量子化パラメータに基づいて予測し、予測した前記基準値と前記差分予測値との和を算出することにより、前記量子化パラメータの予測値を算出する、前記（２）に記載の画像処理装置。
（５）
　前記逆量子化部は、前記量子化パラメータの前記予測値と残差との和に対応する量子化ステップで前記変換係数データを逆量子化する、前記（３）又は前記（４）に記載の画像処理装置。
（６）
　前記画像処理装置は、前記エンハンスメントレイヤの符号化ストリームから前記量子化パラメータの前記残差を復号する復号部、をさらに備え、
　前記制御部は、前記量子化パラメータの前記予測値と前記復号部により復号される前記残差との和を算出する、
　前記（５）に記載の画像処理装置。
（７）
　前記逆量子化部は、前記量子化パラメータの前記予測値に対応する量子化ステップで前記変換係数データを逆量子化する、前記（３）又は前記（４）に記載の画像処理装置。
（８）
　前記制御部は、符号化ストリームから復号される第１のフラグが前記量子化パラメータを予測すべきことを示している場合に、前記リコンストラクト画像を用いて前記量子化パラメータを予測する、前記（１）～（７）のいずれか１項に記載の画像処理装置。
（９）
　前記制御部は、ブロックごとの画像の複雑さを示すアクティビティを前記リコンストラクト画像を用いて算出し、算出した前記アクティビティから前記差分予測値を決定する、前記（２）～（７）のいずれか１項に記載の画像処理装置。
（１０）
　前記制御部は、次の式に従って前記アクティビティから前記差分予測値を決定し、

　ここで、Ａ_normは正規化された前記アクティビティであり、pred_qp_deltaは前記差分予測値であり、
　量子化パラメータｑｐに対応する量子化ステップをＳ（ｑｐ）とすると、変数ａ及びｂは次式を満たす、

　前記（９）に記載の画像処理装置。
（１１）
　前記制御部は、予め記憶されるルックアップテーブルを用いて、前記アクティビティから前記差分予測値を決定するための演算を実行する、前記（１０）に記載の画像処理装置。
（１２）
　前記制御部は、ブロックごとの平均画素値を前記リコンストラクト画像を用いて算出し、算出した前記平均画素値と前記差分予測値との間の予め定義される関係に従って、前記差分予測値を決定する、前記（２）～（７）のいずれか１項に記載の画像処理装置。
（１３）
　前記制御部は、符号化ストリームから復号される第２のフラグに従って、前記差分予測値を決定するための手法を切り替える、前記（２）～（７）のいずれか１項に記載の画像処理装置。
（１４）
　前記画像処理装置は、前記エンハンスメントレイヤの符号化ストリームから前記ブロックのサイズを示すサイズ情報を復号する復号部、をさらに備え、
　前記制御部は、前記復号部により復号される前記サイズ情報により示されるサイズを有する前記ブロックごとに、前記差分予測値を決定する、
　前記（９）～（１２）のいずれか１項に記載の画像処理装置。
（１５）
　前記画像処理装置は、前記量子化パラメータの前記基準値を指定するパラメータを符号化する符号化部、をさらに備える、前記（２）に記載の画像処理装置。
（１６）
　前記画像処理装置は、前記量子化パラメータの予測値に対応する残差を指定するパラメータを符号化する符号化部、をさらに備える、前記（１）又は前記（２）に記載の画像処理装置。
（１７）
　前記画像処理装置は、前記量子化パラメータを予測すべきことを示す第１のフラグを符号化する符号化部、をさらに備える、前記（１）又は前記（２）に記載の画像処理装置。
（１８）
　前記画像処理装置は、前記差分予測値を決定するための決定手法を指定する第２のフラグを符号化する符号化部、をさらに備える、前記（２）に記載の画像処理装置。
（１９）
　前記制御部は、前記リコンストラクト画像を用いて、前記エンハンスメントレイヤのための直交変換サイズを制御する、前記（１）～（１８）のいずれか１項に記載の画像処理装置。
（２０）
　ベースレイヤの符号化ストリームを復号して、前記ベースレイヤのリコンストラクト画像を生成することと、
　生成される前記リコンストラクト画像を用いて、エンハンスメントレイヤのための量子化パラメータを予測することと、
　予測される前記量子化パラメータを用いて、前記エンハンスメントレイヤの変換係数データを逆量子化することと、
　を含む画像処理方法。

　１０　　　　　画像符号化装置（画像処理装置）
　１ａ　　　　　ベースレイヤ符号化部
　１ｂ　　　　　エンハンスメントレイヤ符号化部
　２　　　　　　ローカルデコーダ（ベースレイヤ復号部）
　３　　　　　　中間処理部（アップサンプリング部／デインターレース部）
　１４，１１４　直交変換部
　１５　　　　　量子化部
　１６　　　　　可逆符号化部
　２１　　　　　逆量子化部
　２２，１２２　逆直交変換部
　４０，１４０　制御部
　６０　　　　　画像復号装置（画像処理装置）
　６ａ　　　　　ベースレイヤ復号部
　６ｂ　　　　　エンハンスメントレイヤ復号部
　７　　　　　　中間処理部（アップサンプリング部／デインターレース部）
　６２　　　　　可逆復号部
　６３　　　　　逆量子化部
　６４，１６４　逆直交変換部
　８５，１８５　制御部

Claims

　ベースレイヤの符号化ストリームを復号して、前記ベースレイヤのリコンストラクト画像を生成するベースレイヤ復号部と、
　前記ベースレイヤ復号部により生成される前記リコンストラクト画像を用いて、エンハンスメントレイヤのための量子化パラメータを予測する制御部と、
　前記制御部により予測される前記量子化パラメータを用いて、前記エンハンスメントレイヤの変換係数データを逆量子化する逆量子化部と、
　を備える画像処理装置。
　前記制御部は、前記量子化パラメータの基準値との差分に相当する差分予測値を、前記リコンストラクト画像を用いて決定する、請求項１に記載の画像処理装置。
　前記画像処理装置は、前記エンハンスメントレイヤの符号化ストリームから前記量子化パラメータの前記基準値を指定するパラメータを復号する復号部、をさらに備え、
　前記制御部は、前記復号部により復号される前記基準値と前記差分予測値との和を算出することにより、前記量子化パラメータの予測値を算出する、
　請求項２に記載の画像処理装置。
　前記制御部は、第１のブロックに適用される前記量子化パラメータの前記基準値を、前記第１のブロックの近傍ブロックに適用された量子化パラメータに基づいて予測し、予測した前記基準値と前記差分予測値との和を算出することにより、前記量子化パラメータの予測値を算出する、請求項２に記載の画像処理装置。
　前記逆量子化部は、前記量子化パラメータの前記予測値と残差との和に対応する量子化ステップで前記変換係数データを逆量子化する、請求項３に記載の画像処理装置。
　前記画像処理装置は、前記エンハンスメントレイヤの符号化ストリームから前記量子化パラメータの前記残差を復号する復号部、をさらに備え、
　前記制御部は、前記量子化パラメータの前記予測値と前記復号部により復号される前記残差との和を算出する、
　請求項５に記載の画像処理装置。
　前記逆量子化部は、前記量子化パラメータの前記予測値に対応する量子化ステップで前記変換係数データを逆量子化する、請求項３に記載の画像処理装置。
　前記制御部は、符号化ストリームから復号される第１のフラグが前記量子化パラメータを予測すべきことを示している場合に、前記リコンストラクト画像を用いて前記量子化パラメータを予測する、請求項１に記載の画像処理装置。
　前記制御部は、ブロックごとの画像の複雑さを示すアクティビティを前記リコンストラクト画像を用いて算出し、算出した前記アクティビティから前記差分予測値を決定する、請求項２に記載の画像処理装置。
　前記制御部は、次の式に従って前記アクティビティから前記差分予測値を決定し、

　ここで、Ａ_normは正規化された前記アクティビティであり、pred_qp_deltaは前記差分予測値であり、
　量子化パラメータｑｐに対応する量子化ステップをＳ（ｑｐ）とすると、変数ａ及びｂは次式を満たす、

　請求項９に記載の画像処理装置。
　前記制御部は、予め記憶されるルックアップテーブルを用いて、前記アクティビティから前記差分予測値を決定するための演算を実行する、請求項１０に記載の画像処理装置。
　前記制御部は、ブロックごとの平均画素値を前記リコンストラクト画像を用いて算出し、算出した前記平均画素値と前記差分予測値との間の予め定義される関係に従って、前記差分予測値を決定する、請求項２に記載の画像処理装置。
　前記制御部は、符号化ストリームから復号される第２のフラグに従って、前記差分予測値を決定するための手法を切り替える、請求項２に記載の画像処理装置。
　前記画像処理装置は、前記エンハンスメントレイヤの符号化ストリームから前記ブロックのサイズを示すサイズ情報を復号する復号部、をさらに備え、
　前記制御部は、前記復号部により復号される前記サイズ情報により示されるサイズを有する前記ブロックごとに、前記差分予測値を決定する、
　請求項９に記載の画像処理装置。
　前記画像処理装置は、前記量子化パラメータの前記基準値を指定するパラメータを符号化する符号化部、をさらに備える、請求項２に記載の画像処理装置。
　前記画像処理装置は、前記量子化パラメータの予測値に対応する残差を指定するパラメータを符号化する符号化部、をさらに備える、請求項１に記載の画像処理装置。
　前記画像処理装置は、前記量子化パラメータを予測すべきことを示す第１のフラグを符号化する符号化部、をさらに備える、請求項１に記載の画像処理装置。
　前記画像処理装置は、前記差分予測値を決定するための決定手法を指定する第２のフラグを符号化する符号化部、をさらに備える、請求項２に記載の画像処理装置。
　前記制御部は、前記リコンストラクト画像を用いて、前記エンハンスメントレイヤのための直交変換サイズを制御する、請求項１に記載の画像処理装置。
　ベースレイヤの符号化ストリームを復号して、前記ベースレイヤのリコンストラクト画像を生成することと、
　生成される前記リコンストラクト画像を用いて、エンハンスメントレイヤのための量子化パラメータを予測することと、
　予測される前記量子化パラメータを用いて、前記エンハンスメントレイヤの変換係数データを逆量子化することと、
　を含む画像処理方法。