WO2014097703A1

WO2014097703A1 - 画像処理装置及び画像処理方法

Info

Publication number: WO2014097703A1
Application number: PCT/JP2013/076039
Authority: WO
Inventors: 佐藤　数史
Original assignee: ソニー株式会社
Priority date: 2012-12-20
Filing date: 2013-09-26
Publication date: 2014-06-26

Abstract

【課題】マルチレイヤコーデックにおける予測に際して、各レイヤの画像の品質を考慮してどのレイヤの画像をどのように参照すべきかを適応的に決定できる仕組みを提供すること。【解決手段】第１レイヤを参照して符号化され又は復号される第２レイヤにおける画素予測のために第１レイヤ画素及び第２レイヤ画素を算入する際の重みを、第１レイヤ画像及び第２レイヤ画像の画質に依存する指標に基づいて設定する予測制御部、を備える画像処理装置を提供する。

Description

画像処理装置及び画像処理方法

　本開示は、画像処理装置及び画像処理方法に関する。

　現在、Ｈ．２６４／ＡＶＣよりも符号化効率をさらに向上することを目的として、ＩＴＵ－ＴとＩＳＯ／ＩＥＣとの共同の標準化団体であるＪＣＴＶＣ（Joint　Collaboration　Team-Video　Coding）により、ＨＥＶＣ（High　Efficiency　Video　Coding）と呼ばれる画像符号化方式の標準化が進められている（例えば、下記非特許文献１参照）。

　ＨＥＶＣは、ＭＰＥＧ２及びＡＶＣ（Advanced　Video　Coding）などの既存の画像符号化方式と同様、シングルレイヤの符号化のみならず、スケーラブル符号化をも提供する（例えば、下記非特許文献２参照）。ＨＥＶＣのスケーラブル符号化技術を、ＳＨＶＣ（Scalable　HEVC）ともいう。ＳＨＶＣでは、エンハンスメントレイヤがＨＥＶＣ方式で符号化される一方で、ベースレイヤはＨＥＶＣ方式で符号化されてもよく、又はＨＥＶＣ方式以外の画像符号化方式（例えば、ＡＶＣ方式）で符号化されてもよい。

　スケーラブル符号化とは、一般には、粗い画像信号を伝送するレイヤと精細な画像信号を伝送するレイヤとを階層的に符号化する技術をいう。スケーラブル符号化において階層化される典型的な属性は、主に次の３種類である。
　　－空間スケーラビリティ：空間解像度あるいは画像サイズが階層化される。
　　－時間スケーラビリティ：フレームレートが階層化される。
　　－ＳＮＲ（Signal　to　Noise　Ratio）スケーラビリティ：ＳＮ比が階層化される。
さらに、標準規格で未だ採用されていないものの、ビット深度スケーラビリティ及びクロマフォーマットスケーラビリティもまた議論されている。

　スケーラブル符号化において、あるレイヤの情報から他のレイヤの情報を予測することを、インターレイヤ予測という。下記非特許文献３には、エンハンスメントレイヤの復号画像又は参照画像をベースレイヤの情報から予測するための様々なインターレイヤ予測の手法が記載されている。下記非特許文献４には、エンハンスメントレイヤにおける予測に際して、ベースレイヤの情報及びエンハンスメントレイヤの情報を組合せて使用する組合せ予測（Combined　Prediction）の手法が記載されている。

Benjamin　Bross,　Woo-Jin　Han,　Jens-Rainer　Ohm,　Gary　J.　Sullivan,　Thomas　Wiegand,　"High　Efficiency　Video　Coding　(HEVC)　text　specification　draft　9"（JCTVC-K1003_v9,　2012年10月10-19日） Jill　Boyce,　Ye-Kui　Wang,　"NAL　unit　header　and　parameter　set　designs　for　HEVC　extensions"（JCTVC-K1007，　2012年10月10-19日） Liwei　Guo，　Yong　He，　Do-Kyoung　Kwon，　Jinwen　Zan，　Haricharan　Lakshman，　Jung　Won　Kang,　"Description　of　Tool　Experiment　A2:　Inter-layer　Texture　Prediction　Signaling　in　SHVC"（JCTVC-K1102，　2012年10月10-19日） X.　Li,　E.　Francois,　P.　Lai,　D.　Kwon,　A.　Saxena,　"Description　of　Tool　Experiment　B3:　Combined　Prediction　in　SHVC"（JCTVC-K1103，　2012年10月10-19日）

　しかしながら、予測の際に参照される画像の品質を考慮した手法は、これまでに提案されていない。インターレイヤ予測及びイントラレイヤ予測（同一レイヤ内の参照）のいずれが行われるにしても、参照される画像の品質が低ければ、高い予測精度を得ることは難しい。この点は、スケーラブル符号化のみならず、インターレイヤ予測をサポートするマルチレイヤコーデック一般について同様である。マルチレイヤコーデックの他の例は、マルチビューコーデックである。

　従って、マルチレイヤコーデックにおける予測に際して、各レイヤの画像の品質を考慮してどのレイヤの画像をどのように参照すべきかを適応的に決定できる仕組みが提供されることが望ましい。

　本開示によれば、第１レイヤを参照して符号化され又は復号される第２レイヤにおける画素予測のために第１レイヤ画素及び第２レイヤ画素を算入する際の重みを、第１レイヤ画像及び第２レイヤ画像の画質に依存する指標に基づいて設定する予測制御部、を備える画像処理装置が提供される。

　上記画像処理装置は、典型的には、画像を符号化する画像符号化装置又は画像を復号する画像復号装置として実現され得る。

　また、本開示によれば、第１レイヤを参照して符号化され又は復号される第２レイヤにおける画素予測のために第１レイヤ画素及び第２レイヤ画素を算入する際の重みを、第１レイヤ画像及び第２レイヤ画像の画質に依存する指標に基づいて設定すること、を含む画像処理方法が提供される。

　本開示に係る技術によれば、マルチレイヤコーデックにおける予測に際して、各レイヤの画像の品質を考慮してどのレイヤの画像をどのように参照すべきかを適応的に決定し、予測精度を高めることができる。

スケーラブル符号化について説明するための説明図である。組合せ予測について説明するための説明図である。一実施形態に係る画像符号化装置の概略的な構成を示すブロック図である。一実施形態に係る画像復号装置の概略的な構成を示すブロック図である。図３に示したＥＬ符号化部の構成の一例を示すブロック図である。図５に示した予測制御部の構成の一例を示すブロック図である。量子化パラメータの比較に基づく重みの設定の第１の例について説明するための説明図である。量子化パラメータの比較に基づく重みの設定の第２の例について説明するための説明図である。量子化パラメータの比較に基づく重みの設定の第３の例について説明するための説明図である。量子化パラメータの比較に基づく重みの設定の第４の例について説明するための説明図である。一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。エンハンスメントレイヤの符号化処理における予測制御に関連する処理の流れの一例を示すフローチャートである。図４に示したＥＬ復号部の構成の一例を示すブロック図である。図１０に示した予測制御部の構成の一例を示すブロック図である。一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。エンハンスメントレイヤの復号処理における予測制御に関連する処理の流れの一例を示すフローチャートである。許容され又は禁止され得るコーデックの組合せについて説明するための第１の説明図である。許容され又は禁止され得るコーデックの組合せについて説明するための第２の説明図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。スケーラブル符号化の用途の第１の例について説明するための説明図である。スケーラブル符号化の用途の第２の例について説明するための説明図である。スケーラブル符号化の用途の第３の例について説明するための説明図である。マルチビューコーデックについて説明するための説明図である。マルチビューコーデックのための画像符号化装置の概略的な構成を示すブロック図である。マルチビューコーデックのための画像復号装置の概略的な構成を示すブロック図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　また、以下の順序で説明を行う。
　　１．概要
　　　１－１．スケーラブル符号化
　　　１－２．インターレイヤ予測及びイントラレイヤ予測
　　　１－３．エンコーダの基本的な構成例
　　　１－４．デコーダの基本的な構成例
　　２．一実施形態に係るＥＬ符号化部の構成例
　　　２－１．全体的な構成
　　　２－２．予測制御部の詳細な構成
　　３．一実施形態に係る符号化時の処理の流れ
　　　３－１．概略的な流れ
　　　３－２．予測制御に関連する処理
　　４．一実施形態に係るＥＬ復号部の構成例
　　　４－１．全体的な構成
　　　４－２．予測制御部の詳細な構成
　　５．一実施形態に係る復号時の処理の流れ
　　　５－１．概略的な流れ
　　　５－２．予測制御に関連する処理
　　６．コーデックの組合せの例
　　７．応用例
　　　７－１．様々な製品への応用
　　　７－２．スケーラブル符号化の様々な用途
　　　７－３．その他
　　８．まとめ

　＜１．概要＞
　　［１－１．スケーラブル符号化］
　スケーラブル符号化においては、一連の画像をそれぞれ含む複数のレイヤが符号化される。ベースレイヤ（base　layer）は、最初に符号化される、最も粗い画像を表現するレイヤである。ベースレイヤの符号化ストリームは、他のレイヤの符号化ストリームを復号することなく、独立して復号され得る。ベースレイヤ以外のレイヤは、エンハンスメントレイヤ（enhancement　layer）と呼ばれる、より精細な画像を表現するレイヤである。エンハンスメントレイヤの符号化ストリームは、ベースレイヤの符号化ストリームに含まれる情報を用いて符号化される。従って、エンハンスメントレイヤの画像を再現するためには、ベースレイヤ及びエンハンスメントレイヤの双方の符号化ストリームが復号されることになる。スケーラブル符号化において扱われるレイヤの数は、２つ以上のいかなる数であってもよい。３つ以上のレイヤが符号化される場合には、最下位のレイヤがベースレイヤ、残りの複数のレイヤがエンハンスメントレイヤである。より上位のエンハンスメントレイヤの符号化ストリームは、より下位のエンハンスメントレイヤ又はベースレイヤの符号化ストリームに含まれる情報を用いて符号化され及び復号され得る。

　図１は、スケーラブル符号化される３つのレイヤＬ１、Ｌ２及びＬ３を示している。レイヤＬ１はベースレイヤであり、レイヤＬ２及びＬ３はエンハンスメントレイヤである。なお、ここでは、様々な種類のスケーラビリティのうち、空間スケーラビリティを例にとっている。レイヤＬ２のレイヤＬ１に対する空間解像度の比は、２：１である。レイヤＬ３のレイヤＬ１に対する空間解像度の比は、４：１である。なお、ここでの解像度比は一例に過ぎず、例えば１．５：１などの非整数の解像度比が使用されてもよい。レイヤＬ１のブロックＢ１は、ベースレイヤのピクチャ内の符号化処理の処理単位である。レイヤＬ２のブロックＢ２は、ブロックＢ１と共通するシーンを映したエンハンスメントレイヤのピクチャ内の符号化処理の処理単位である。ブロックＢ２は、レイヤＬ１のブロックＢ１に対応する。レイヤＬ３のブロックＢ３は、ブロックＢ１及びＢ２と共通するシーンを映したより上位のエンハンスメントレイヤのピクチャ内の符号化処理の処理単位である。ブロックＢ３は、レイヤＬ１のブロックＢ１及びレイヤＬ２のブロックＢ２に対応する。

　　［１－２．インターレイヤ予測及びイントラレイヤ予測］
　図１に例示したレイヤ構造において、画像のテクスチャは、共通するシーンを映したレイヤ間で類似する。即ち、レイヤＬ１内のブロックＢ１、レイヤＬ２内のブロックＢ２、及びレイヤＬ３内のブロックＢ３のテクスチャは類似する。従って、例えばブロックＢ１を参照ブロックとして用いてブロックＢ２又はブロックＢ３の画素を予測し、又はブロックＢ２を参照ブロックとして用いてブロックＢ３の画素を予測すれば、高い予測精度が得られる可能性がある。このようなレイヤ間の予測を、インターレイヤ予測という。これに対し、同じレイヤ内の他のブロックを参照ブロックとして用いる予測を、イントラレイヤ予測という。イントラレイヤ予測は、当業者に知られているイントラ予測及びインター予測を含み、イントラ予測では予測対象ブロックと同じ画像内に参照ブロックが存在し、インター予測では予測対象ブロックとは異なる参照画像内に参照ブロックが存在する。

　上記非特許文献４に記載された組合せ予測（ハイブリッド予測ともいう）は、上述したインターレイヤ予測及びイントラレイヤ予測の組合せである。図２は、組合せ予測について説明するための説明図である。図２の下段には、ベースレイヤ画像ＩＭ_Ｂ１～ＩＭ_Ｂ４が示されている。ベースレイヤ画像ＩＭ_Ｂ１～ＩＭ_Ｂ４は、ベースレイヤの符号化処理又は復号処理において生成されるリコンストラクト画像である。ベースレイヤ画像は、レイヤ間の解像度比に応じて、アップサンプリングされる。図２の中段には、アップサンプリングされたベースレイヤ画像ＩＭ_Ｕ１～ＩＭ_Ｕ４が示されている。図２の上段には、エンハンスメントレイヤ画像ＩＭ_Ｅ１～ＩＭ_Ｅ４が示されている。

　図２において、一例として、エンハンスメントレイヤ画像ＩＭ_Ｅ３のブロックＢ_Ｅ３が予測対象ブロックであるものとする。インターレイヤ予測が行われる場合、ベースレイヤ画像ＩＭ_Ｕ３のブロックＢ_Ｕ３が参照ブロックとして使用される。イントラレイヤ予測が行われる場合、エンハンスメントレイヤ画像ＩＭ_Ｅ２のブロックＢ_Ｕ２（又はその他のエンハンスメントレイヤ内のブロック）が参照ブロックとして使用される。そして、組合せ予測においては、これら２つの参照ブロックの画素の双方が、予測に算入される。組合せ予測の単純な例では、予測対象ブロックＢ_Ｅ３の予測画素値は、参照ブロックＢ_Ｕ３の画素値及び参照ブロックＢ_Ｅ２の画素値の平均である。上記非特許文献４では、より複雑ないくつかの組合せ予測が提案されている。

　このような組合せ予測は、レイヤ間のテクスチャの類似性を活用する手法であり、概して画素予測の全般において有益である。画素予測とは、例えばモード情報などの予測とは異なり、画素値の形式をとる情報についての予測である。例えば、画素予測は、インター予測若しくはイントラ予測において参照される参照画素の予測、インター予測若しくはイントラ予測の予測誤差（残差）の予測、又は復号画像の画素の予測を含み得る。これら画素予測に際して、予測精度は、予測値にベースレイヤ画素及びエンハンスメントレイヤ画素をそれぞれどの程度算入するかに左右される。特に、参照画像としてのベースレイヤ画像及びエンハンスメントレイヤ画像の画質が高ければ予測精度は相対的に高く、当該画質が低ければ予測精度は相対的に低くなるであろう。従って、各レイヤの画質を考慮してどのレイヤの画像をどのように参照すべきかを適応的に決定することにより、高い予測精度を達成して符号化効率を向上させることができるものと期待される。そこで、スケーラブル符号化の組合せ予測において各レイヤの画質を考慮するための画像処理装置の実施形態について、次節より詳細に説明する。

　　［１－３．エンコーダの基本的な構成例］
　図３は、スケーラブル符号化をサポートする、一実施形態に係る画像符号化装置１０の概略的な構成を示すブロック図である。図３を参照すると、画像符号化装置１０は、ベースレイヤ（ＢＬ）符号化部１ａ、エンハンスメントレイヤ（ＥＬ）符号化部１ｂ、共通メモリ２及び多重化部３を備える。

　ＢＬ符号化部１ａは、ベースレイヤ画像を符号化し、ベースレイヤの符号化ストリームを生成する。ＥＬ符号化部１ｂは、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤの符号化ストリームを生成する。共通メモリ２は、レイヤ間で共通的に利用される情報を記憶する。多重化部３は、ＢＬ符号化部１ａにより生成されるベースレイヤの符号化ストリームと、ＥＬ符号化部１ｂにより生成される１つ以上のエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

　　［１－４．デコーダの基本的な構成例］
　図４は、スケーラブル符号化をサポートする、一実施形態に係る画像復号装置６０の概略的な構成を示すブロック図である。図４を参照すると、画像復号装置６０は、逆多重化部５、ベースレイヤ（ＢＬ）復号部６ａ、エンハンスメントレイヤ（ＥＬ）復号部６ｂ及び共通メモリ７を備える。

　逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及び１つ以上のエンハンスメントレイヤの符号化ストリームに逆多重化する。ＢＬ復号部６ａは、ベースレイヤの符号化ストリームからベースレイヤ画像を復号する。ＥＬ復号部６ｂは、エンハンスメントレイヤの符号化ストリームからエンハンスメントレイヤ画像を復号する。共通メモリ７は、レイヤ間で共通的に利用される情報を記憶する。

　図３に例示した画像符号化装置１０において、ベースレイヤの符号化のためのＢＬ符号化部１ａの構成と、エンハンスメントレイヤの符号化のためのＥＬ符号化部１ｂの構成とは、互いに類似する。ＢＬ符号化部１ａにより生成され又は取得されるいくつかのパラメータ及びリコンストラクト画像は、共通メモリ２を用いてバッファリングされ、ＥＬ符号化部１ｂにより再利用され得る。次節では、そのようなＥＬ符号化部１ｂの構成について詳細に説明する。

　同様に、図４に例示した画像復号装置６０において、ベースレイヤの復号のためのＢＬ復号部６ａの構成と、エンハンスメントレイヤの復号のためのＥＬ復号部６ｂの構成とは、互いに類似する。ＢＬ復号部６ａにより生成され又は取得されるいくつかのパラメータ及びリコンストラクト画像は、共通メモリ７を用いてバッファリングされ、ＥＬ復号部６ｂにより再利用され得る。さらに次の節では、そのようなＥＬ復号部６ｂの構成について詳細に説明する。

　＜２．一実施形態に係るＥＬ符号化部の構成例＞
　　［２－１．全体的な構成］
　図５は、図３に示したＥＬ符号化部１ｂの構成の一例を示すブロック図である。図５を参照すると、ＥＬ符号化部１ｂは、並び替えバッファ１１、減算部１３、直交変換部１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、レート制御部１８、逆量子化部２１、逆直交変換部２２、加算部２３、デブロックフィルタ２４、フレームメモリ２５、セレクタ２６及び２７、イントラ予測部３０、インター予測部３５並びに予測制御部４０を備える。

　並び替えバッファ１１は、一連の画像データに含まれる画像を並び替える。並び替えバッファ１１は、符号化処理に係るＧＯＰ（Group　of　Pictures）構造に応じて画像を並び替えた後、並び替え後の画像データを減算部１３、イントラ予測部３０、及びインター予測部３５へ出力する。

　減算部１３には、並び替えバッファ１１から入力される画像データ、及び後に説明するイントラ予測部３０又はインター予測部３５から入力される予測画像データが供給される。減算部１３は、並び替えバッファ１１から入力される画像データと予測画像データとの差分である予測誤差データを算出し、算出した予測誤差データを直交変換部１４へ出力する。

　直交変換部１４は、減算部１３から入力される予測誤差データについて直交変換を行う。直交変換部１４により実行される直交変換は、例えば、離散コサイン変換（Discrete　Cosine　Transform：ＤＣＴ）又はカルーネン・レーベ変換などであってよい。直交変換部１４は、直交変換処理により取得される変換係数データを量子化部１５へ出力する。

　量子化部１５には、直交変換部１４から入力される変換係数データ、及び後に説明するレート制御部１８からのレート制御信号が供給される。レート制御信号は、ブロックごとの各色成分についての量子化パラメータを特定する。量子化行列もまた特定され得る。量子化部１５は、レート制御信号に従って決定される量子化ステップで変換係数データを量子化し、量子化後の変換係数データ（以下、量子化データという）を可逆符号化部１６及び逆量子化部２１へ出力する。

　可逆符号化部１６は、量子化部１５から入力される量子化データについて可逆符号化処理を行うことにより、エンハンスメントレイヤの符号化ストリームを生成する。また、可逆符号化部１６は、符号化ストリームを復号する際に参照される様々なパラメータを符号化して、符号化されたパラメータを符号化ストリームのヘッダ領域に挿入する。可逆符号化部１６により符号化されるパラメータは、後に説明するイントラ予測に関する情報、インター予測に関する情報及び予測制御関連パラメータを含み得る。そして、可逆符号化部１６は、生成した符号化ストリームを蓄積バッファ１７へ出力する。

　蓄積バッファ１７は、可逆符号化部１６から入力される符号化ストリームを半導体メモリなどの記憶媒体を用いて一時的に蓄積する。そして、蓄積バッファ１７は、蓄積した符号化ストリームを、伝送路の帯域に応じたレートで、図示しない伝送部（例えば、通信インタフェース又は周辺機器との接続インタフェースなど）へ出力する。

　レート制御部１８は、蓄積バッファ１７の空き容量を監視する。そして、レート制御部１８は、蓄積バッファ１７の空き容量に応じてレート制御信号を生成し、生成したレート制御信号を量子化部１５へ出力する。例えば、レート制御部１８は、蓄積バッファ１７の空き容量が少ない時には、量子化データのビットレートを低下させるためのレート制御信号を生成する。また、例えば、レート制御部１８は、蓄積バッファ１７の空き容量が十分大きい時には、量子化データのビットレートを高めるためのレート制御信号を生成する。

　逆量子化部２１、逆直交変換部２２及び加算部２３は、ローカルデコーダを構成する。逆量子化部２１は、量子化部１５により使用されたものと同じ量子化ステップで、エンハンスメントレイヤの量子化データを逆量子化し、変換係数データを復元する。そして、逆量子化部２１は、復元した変換係数データを逆直交変換部２２へ出力する。

　逆直交変換部２２は、逆量子化部２１から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを復元する。そして、逆直交変換部２２は、復元した予測誤差データを加算部２３へ出力する。

　加算部２３は、逆直交変換部２２から入力される復元された予測誤差データとイントラ予測部３０又はインター予測部３５から入力される予測画像データとを加算することにより、復号画像データ（エンハンスメントレイヤのリコンストラクト画像）を生成する。そして、加算部２３は、生成した復号画像データをデブロックフィルタ２４及びフレームメモリ２５へ出力する。

　デブロックフィルタ２４は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタリング処理を行う。デブロックフィルタ２４は、加算部２３から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データをフレームメモリ２５へ出力する。

　フレームメモリ２５は、加算部２３から入力される復号画像データ及びデブロックフィルタ２４から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。

　セレクタ２６は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部３０に供給する。また、セレクタ２６は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてインター予測部３５に供給する。

　セレクタ２７は、イントラ予測モードにおいて、イントラ予測部３０から出力されるイントラ予測の結果としての予測画像データを減算部１３へ出力すると共に、イントラ予測に関する情報を可逆符号化部１６へ出力する。また、セレクタ２７は、インター予測モードにおいて、インター予測部３５から出力されるインター予測の結果としての予測画像データを減算部１３へ出力すると共に、インター予測に関する情報を可逆符号化部１６へ出力する。セレクタ２７は、イントラ予測モードとインター予測モードとを、コスト関数値の大きさに応じて切り替える。

　イントラ予測部３０は、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣ方式の予測単位（ＰＵ）ごとにイントラ予測処理を行う。例えば、イントラ予測部３０は、予測モードセット内の各候補モードによる予測結果を所定のコスト関数を用いて評価する。次に、イントラ予測部３０は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、イントラ予測部３０は、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。そして、イントラ予測部３０は、選択した最適な予測モードを表す予測モード情報を含むイントラ予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。

　インター予測部３５は、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣ方式の予測単位ごとにインター予測処理を行う。例えば、インター予測部３５は、予測モードセット内の各候補モードによる予測結果を所定のコスト関数を用いて評価する。次に、インター予測部３５は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、インター予測部３５は、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。そして、インター予測部３５は、選択した最適な予測モードを表す予測モード情報と動き情報とを含むインター予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。

　予測制御部４０は、共通メモリ２によりバッファリングされる情報を用いて、ＥＬ符号化部１ｂにおける画素予測を制御する。例えば、予測制御部４０は、ベースレイヤのリコンストラクト画像をイントラ予測部３０に供給し、イントラ予測のための参照画素をイントラ予測部３０に組合せ予測によって予測させる。その代わりに、予測制御部４０は、イントラ予測部３０に復号画像の画素を組合せ予測によって予測させてもよい。また、例えば、予測制御部４０は、ベースレイヤのリコンストラクト画像をインター予測部３５に供給し、インター予測のための参照画素をインター予測部３５に組合せ予測によって予測させる。その代わりに、予測制御部４０は、インター予測部３５に復号画像の画素を組合せ予測によって予測させてもよい。予測制御部４０は、ベースレイヤのリコンストラクト画像を、レイヤ間の解像度比に応じてアップサンプリングしてもよい。本実施形態において、予測制御部４０は、これら組合せ予測のための重みを、ベースレイヤ画像及びエンハンスメントレイヤ画像の画質に依存する指標に基づいて制御する。予測制御部４０による当該重みの制御について、後にさらに説明する。

　なお、予測制御部４０は、ベースレイヤの予測誤差（残差）データを減算部１３及び加算部２３に供給し、減算部１３及び加算部２３に予測誤差を予測させてもよい（図中の点線矢印）。この場合、ベースレイヤの予測誤差データもまた、レイヤ間の解像度比に応じてアップサンプリングされ得る。

　予測制御部４０により使用されるいくつかのパラメータは、可逆符号化部１６により符号化され、符号化ストリームのヘッダ領域に挿入される。本明細書では、これらパラメータを予測制御関連パラメータという。予測制御関連パラメータのいくつかの例について、後にさらに説明する。

　　［２－２．予測制御部の詳細な構成］
　図６は、図５に示した予測制御部４０の構成の一例を示すブロック図である。図６を参照すると、予測制御部４０は、解像度比取得部４１、量子化パラメータ取得部４２、重み設定部４３及びアップサンプリング部４４を有する。

　　　（１）解像度比取得部
　解像度比取得部４１は、ベースレイヤ画像とエンハンスメントレイヤ画像との間の予め決定される解像度比Ｒ_ＢＥを取得する。空間スケーラビリティが実現される場合には、解像度比Ｒ_ＢＥは１よりも大きい。一方、ＳＮＲスケーラビリティが実現される場合には、解像度比Ｒ_ＢＥは１に等しい。解像度比取得部４１は、取得した解像度比Ｒ_ＢＥを可逆符号化部１６、重み設定部４３及びアップサンプリング部４４へ出力する。解像度比Ｒ_ＢＥを示すパラメータは、例えば、可逆符号化部１６により符号化され、エンハンスメントレイヤのＳＰＳ（Sequence　Parameter　Set）又はＰＰＳ（Picture　Parameter　Set）に挿入され得る。

　　　（２）量子化パラメータ取得部
　量子化パラメータ取得部４２は、組合せ予測の重みを設定するために使用される量子化パラメータを取得する。例えば、量子化パラメータ取得部４２は、共通メモリ２から、ベースレイヤ画像に適用された量子化パラメータＱＰ_Ｂを取得する。また、量子化パラメータ取得部４２は、量子化部１５から、エンハンスメントレイヤ画像に適用された量子化パラメータＱＰ_Ｅを取得する。量子化パラメータ取得部４２は、輝度成分の量子化パラメータのみを取得してもよく、又は輝度成分（Ｙ）及び２つの色差成分（Ｃｂ，Ｃｒ）の量子化パラメータを取得してもよい。そして、量子化パラメータ取得部４２は、取得した量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅを、重み設定部４３へ出力する。

　なお、量子化行列が利用されるブロックについて画素予測が行われる場合には、量子化パラメータは、変換係数データの周波数成分ごとに異なる。この場合、各レイヤの画質は変換係数データの直流成分に最もよく現れるため、量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅは、量子化行列の直流成分に対応する量子化パラメータ（量子化行列の直流成分の要素によってスケーリングされた量子化パラメータ）であってよい。

　上記非特許文献１に記載されているように、ＨＥＶＣ方式では、ピクチャレベルの量子化パラメータの初期値がＰＰＳ内のpic_init_qp_minus26で、スライスレベルの調整値がスライスヘッダ内のslice_qp_deltaにより示される。さらに、個々の符号化単位（ＣＵ：Coding　Unit）の量子化パラメータは、上の隣接ＣＵ及び左の隣接ＣＵの一方若しくは双方の量子化パラメータから予測され（ＣＴＢ内予測）、又は復号順で直前のＣＵの量子化パラメータから予測される（ＣＴＢ間予測）。そして、変換単位（ＴＵ：Transform　Unit）内のcu_qp_delta_abs及びcu_qp_delta_signにより示される残差を予測値に加算することにより算出される量子化パラメータが、各ＣＵに設定される。従って、組合せ予測の重みは、エンハンスメントレイヤのＣＵごとに、ベースレイヤ及びエンハンスメントレイヤの量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅの比較に基づいて設定されてよい。エンハンスメントレイヤのＣＵに対応する複数の対応ブロックがベースレイヤに存在し、当該複数の対応ブロックに異なる複数の量子化パラメータが適用された場合には、量子化パラメータ取得部４２は、当該複数の量子化パラメータの平均値を、ベースレイヤの量子化パラメータＱＰ_Ｂとして取得してもよい。その代わりに、量子化パラメータ取得部４２は、当該複数の対応ブロックのうち先頭の対応ブロックに適用された量子化パラメータを、ベースレイヤの量子化パラメータＱＰ_Ｂとして取得してもよい。また、量子化パラメータ取得部４２は、ベースレイヤにおいてピクチャレベルで設定される量子化パラメータ（例えば、26＋pic_init_qp_minus26）又はスライスレベルで設定される量子化パラメータ（例えば、26＋pic_init_qp_minus26＋slice_qp_delta）を、ベースレイヤの量子化パラメータＱＰ_Ｂとして取得してもよい。この場合、ＣＵレベルでベースレイヤの量子化パラメータをバッファリグする必要性がなくなるため、共通メモリ２のメモリリソースを節約することができる。いずれのレベルの量子化パラメータをベースレイヤの量子化パラメータＱＰ_Ｂとして使用すべきかを示すフラグが、可逆符号化部１６により符号化されてもよい。なお、ＡＶＣ方式では、マクロブロックごとに量子化パラメータが設定される。

　　　（３）重み設定部
　重み設定部４３は、エンハンスメントレイヤにおける組合せ予測の重みを、ベースレイヤ画像及びエンハンスメントレイヤ画像の画質に依存する指標に基づいて設定する。本実施形態において、重み設定部４３により使用される画質に依存する指標は、量子化パラメータ取得部９２から入力される量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅを含む。空間スケーラビリティが実現される場合には、画質に依存する指標は、解像度比取得部９１から入力される解像度比Ｒ_ＢＥをさらに含み得る。

　一例として、エンハンスメントレイヤにおける組合せ予測は、次式のように表現され得る：

　式（１）において、左辺のＰ_ｐｒｅｄは予測画素値である。右辺のＷ_Ｂ及びＷ_Ｅは、それぞれ、ベースレイヤの重み及びエンハンスメントレイヤの重みである。右辺のＰ_ＵＢは必要に応じてアップサンプリングされたベースレイヤの参照画素値、Ｐ_Ｅはエンハンスメントレイヤの参照画素値である。このように、組合せ予測では、エンハンスメントレイヤにおける画素予測のために、ベースレイヤ画素及びエンハンスメントレイヤ画素が算入される。なお、式（１）よりも複雑な予測式が、エンハンスメントレイヤにおける組合せ予測のために使用されてもよい。

　本実施形態において、重み設定部４３は、ベースレイヤの量子化パラメータＱＰ_Ｂとエンハンスメントレイヤの量子化パラメータＱＰ_Ｅとの比較に基づいて、ベースレイヤの重みＷ_Ｂ及びエンハンスメントレイヤの重みＷ_Ｅを設定する。例えば、重み設定部４３は、量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅが互いに等しい場合、又はそれらの差が所定の閾値を下回る場合には、レイヤ間で画質に大きな差が無いことから、重みＷ_Ｂ及びＷ_Ｅを同等の値に設定し得る。また、重み設定部４３は、量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅの差が所定の閾値を上回る場合には、より小さい量子化パラメータの適用されたレイヤの画質がより高いことから、より小さい量子化パラメータの適用されたレイヤについてより大きい重みを設定し得る。また、重み設定部４３は、量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅの差が別の閾値を上回る場合に、より大きい量子化パラメータの適用されたレイヤについて重みをゼロに設定してもよい。この場合、より小さい量子化パラメータの適用されたレイヤの画素のみが、画素予測に算入される。

　なお、量子化パラメータが同じであっても、レイヤ間で解像度が異なる場合には、より高い解像度を有するレイヤの方が画質は高いと言える。そこで、重み設定部４３は、量子化パラメータをレイヤ間で比較する前に、次式に従って、解像度比Ｒ_ＢＥに依存する補正値で量子化パラメータＱＰ_Ｂを補正してもよい。

　式（２）の左辺は、補正後のベースレイヤの量子化パラメータＱＰ_Ｂ´である。右辺の補正値ｄＱＰは、例えば、解像度比Ｒ_ＢＥが大きいほど大きくなるように、予め決定され得る。解像度比Ｒ_ＢＥが１に等しい場合には、補正値ｄＱＰはゼロである。このように量子化パラメータを補正することにより、レイヤ間で解像度が異なる場合にも重みを適切に設定し、画素予測の予測精度を高めることができる。なお、ベースレイヤの量子化パラメータＱＰ_Ｂの代わりに、エンハンスメントレイヤの量子化パラメータＱＰ_Ｅが補正されてもよい。なお、重み設定部４３は、解像度比Ｒ_ＢＥを用いて量子化パラメータを補正する代わりに、式（１）の重みＷ_Ｂ及びＷ_Ｅを解像度比Ｒ_ＢＥに基づいて設定してもよい。例えば、解像度比Ｒ_ＢＥが１に等しい場合には、重みＷ_Ｂ及びＷ_Ｅは互いに等しい値（例えば、０．５）に設定され得る。解像度比Ｒ_ＢＥが１に等しくない場合には、解像度比Ｒ_ＢＥがより大きいほど、重みＷ_Ｅは重みＷ_Ｂに対して相対的に大きい値に設定され得る。

　また、重み設定部４３は、３つの色成分について別々に、ベースレイヤ及びエンハンスメントレイヤの量子化パラメータに基づいて重みＷ_Ｂ及びＷ_Ｅを設定してもよい。上記非特許文献１に記載されているように、ＨＥＶＣ方式では、Ｃｂ成分及びＣｒ成分についてそれぞれ、輝度成分の量子化パラメータにオフセットを加算することにより調整された量子化パラメータを使用することができる。Ｃｂ成分の量子化パラメータオフセットは、ＰＰＳ内のpic_cb_qp_offset及びスライスヘッダ内のslice_cb_qp_offsetの和である。Ｃｒ成分の量子化パラメータオフセットは、ＰＰＳ内のpic_cr_qp_offset及びスライスヘッダ内のslice_cr_qp_offsetの和である。これら量子化パラメータオフセットが加算された量子化パラメータを色成分ごとに用いることで、色成分ごとに最適な重みを画素予測のために設定することができる。一方、全ての色成分の重みを、例えば輝度成分の量子化パラメータに基づいて行うことで、色成分ごとのパラメータのバッファリングが不要となり、メモリリソースを節約することができる。なお、ＡＶＣ方式では、スライス単位の量子化パラメータオフセットは存在せず、pic_cb_qp_offset及びslice_cr_qp_offsetの代わりに、chroma_qp_index_offset及びsecond_chroma_qp_index_offsetがピクチャ単位で使用され得る。

　図７Ａ～図７Ｄは、量子化パラメータの比較に基づく重みの設定の４つの例についてそれぞれ説明するための説明図である。図７Ａ～図７Ｄに示した横軸は、必要に応じて補正されたベースレイヤの量子化パラメータＱＰ_Ｂ´とエンハンスメントレイヤの量子化パラメータＱＰ_Ｅとの差分Ｄｉｆｆ（＝ＱＰ_Ｂ´－ＱＰ_Ｅ）を表す。

　図７Ａの第１の例において、差分Ｄｉｆｆが閾値Ｔｈ１よりも大きい場合、エンハンスメントレイヤの画質はベースレイヤの画質よりも有意に高いと判定される。この場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０．２５，０．７５）と設定する。差分Ｄｉｆｆの絶対値が閾値Ｔｈ１よりも小さい場合、ベースレイヤ及びエンハンスメントレイヤの画質に有意な差はないと判定される。この場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０．５，０．５）と設定する。差分Ｄｉｆｆが閾値－Ｔｈ１（＝Ｔｈ１×（－１））よりも小さい場合、ベースレイヤの画質はエンハンスメントレイヤの画質よりも有意に高いと判定される。この場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０．７５，０．２５）と設定する。

　図７Ｂの第２の例において、差分Ｄｉｆｆが閾値Ｔｈ２よりも大きい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０，１）と設定する。この場合、より小さい量子化パラメータの適用されたエンハンスメントレイヤの画素のみが、画素予測に算入される。差分Ｄｉｆｆの絶対値が閾値Ｔｈ２よりも小さい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０．５，０．５）と設定する。差分Ｄｉｆｆが閾値－Ｔｈ２（＝Ｔｈ２×（－１））よりも小さい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（１，０）と設定する。この場合、より小さい量子化パラメータの適用されたベースレイヤの画素のみが、画素予測に算入される。

　図７Ｃの第３の例において、差分Ｄｉｆｆが閾値Ｔｈ４よりも大きい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０，１）と設定する。差分Ｄｉｆｆが閾値Ｔｈ４よりも小さく、閾値Ｔｈ３よりも大きい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０．２５，０．７５）と設定する。差分Ｄｉｆｆの絶対値が閾値Ｔｈ３よりも小さい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０．５，０．５）と設定する。差分Ｄｉｆｆが閾値－Ｔｈ４よりも大きく、閾値－Ｔｈ３よりも小さい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０．７５，０．２５）と設定する。差分Ｄｉｆｆが閾値－Ｔｈ４よりも小さい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（１，０）と設定する。

　図７Ｄの第４の例において、差分Ｄｉｆｆが閾値Ｔｈ５よりも大きい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０，１）と設定する。差分Ｄｉｆｆが閾値Ｔｈ５よりも小さい場合、重み設定部４３は、一例として、ベースレイヤ及びエンハンスメントレイヤの重み（Ｗ_Ｂ，Ｗ_Ｅ）＝（０．５，０．５）と設定する。

　重み設定部４３は、このように設定したベースレイヤ及びエンハンスメントレイヤの重みを、イントラ予測部３０及びインター予測部３５へ出力する。予測誤差について組合せ予測が行われる場合には、これら重みは、減算部１３及び加算部２３へ出力され得る。また、重み設定部４３は、設定したベースレイヤの重みを、アップサンプリング部４４へ出力する。

　なお、重み設定部４３により設定される重みの値は、上述した例に限定されず、他の値であってもよい。また、組合せ予測の重みを変化させるために使用される閾値（例えば、閾値Ｔｈ１～Ｔｈ５）の数は、いくつであってもよい。重み設定部４３は、これら閾値を可逆符号化部１６へ出力してもよい。その場合、可逆符号化部１６は、重み設定部４３から入力される閾値をエンハンスメントレイヤのＰＰＳ、ＳＰＳ又はスライスヘッダ内に符号化し得る。

　　　（４）アップサンプリング部
　アップサンプリング部４４は、重み設定部４３により設定されたベースレイヤの重みがゼロでない場合に、共通メモリ２によりバッファリングされているベースレイヤのリコンストラクト画像を、レイヤ間の解像度比Ｒ_ＢＥに従ってアップサンプリングする。そして、アップサンプリング部４４は、アップサンプリングされたベースレイヤのリコンストラクト画像を、ベースレイヤ画像として、イントラ予測部３０及びインター予測部３５へ出力する。予測誤差について組合せ予測が行われる場合には、アップサンプリング部４４は、アップサンプリングされたベースレイヤの予測誤差データを、減算部１３及び加算部２３へ出力してもよい。なお、解像度比取得部４１から入力される解像度比Ｒ_ＢＥが１に等しい場合には、アップサンプリング部４４は、ベースレイヤ画像をアップサンプリングしなくてよい。

　＜３．一実施形態に係る符号化時の処理の流れ＞
　　［３－１．概略的な流れ］
　図８は、一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

　図８を参照すると、まず、ＢＬ符号化部１ａは、ベースレイヤの符号化処理を実行し、ベースレイヤの符号化ストリームを生成する（ステップＳ１１）。

　共通メモリ２は、ベースレイヤの符号化処理において生成されるリコンストラクト画像及び画質依存の指標をバッファリングする（ステップＳ１２）。ここでバッファリングされる指標は、例えば、ベースレイヤに設定された量子化パラメータを含み得る。

　次に、ＥＬ符号化部１ｂは、共通メモリ２によりバッファリングされている情報を用いて、エンハンスメントレイヤの符号化処理を実行し、エンハンスメントレイヤの符号化ストリームを生成する（ステップＳ１３）。

　次に、多重化部３は、ＢＬ符号化部１ａにより生成されるベースレイヤの符号化ストリームと、ＥＬ符号化部１ｂにより生成されるエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する（ステップＳ１４）。

　　［３－２．予測制御に関連する処理］
　図９は、エンハンスメントレイヤの符号化処理（図８のステップＳ１３）における予測制御に関連する処理の流れの一例を示すフローチャートである。図９に示した処理は、例えば、エンハンスメントレイヤ画像内のＣＵごとに繰り返され得る。

　図９を参照すると、まず、量子化パラメータ取得部４２は、ベースレイヤ画像に適用された量子化パラメータＱＰ_Ｂを共通メモリ２から取得する（ステップＳ２０）。また、量子化パラメータ取得部４２は、エンハンスメントレイヤ画像に適用された量子化パラメータＱＰ_Ｅを量子化部１５から取得する（ステップＳ２１）。そして、量子化パラメータ取得部４２は、取得した量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅを、重み設定部４３へ出力する。

　また、解像度比取得部４１は、ベースレイヤ画像とエンハンスメントレイヤ画像との間の予め決定される解像度比Ｒ_ＢＥを取得する（ステップＳ２２）。そして、解像度比取得部４１は、取得した解像度比Ｒ_ＢＥを可逆符号化部１６、重み設定部４３及びアップサンプリング部４４へ出力する。

　次に、重み設定部４３は、解像度比取得部４１から入力される解像度比Ｒ_ＢＥに基づいて、ベースレイヤの量子化パラメータＱＰ_Ｂを補正するか否かを判定する（ステップＳ２３）。例えば、重み設定部４３は、解像度比Ｒ_ＢＥが１に等しくない場合、上記式（２）に従って、量子化パラメータＱＰ_Ｂを補正された量子化パラメータＱＰ_Ｂ´（＝ＱＰ_Ｂ＋ｄＱＰ）に補正する（ステップＳ２４）。解像度比Ｒ_ＢＥが１に等しい場合には、ベースレイヤの量子化パラメータＱＰ_Ｂは補正されなくてよい。

　次に、重み設定部４３は、レイヤ間の量子化パラメータの比較に基づいて、ベースレイヤの重みＷ_Ｂ及びエンハンスメントレイヤの重みＷ_Ｅを設定する（ステップＳ２５）。ここで設定される重みＷ_Ｂ及びＷ_Ｅの値は、図７Ａ～図７Ｄに例示した値であってもよく、又は他の値であってもよい。そして、重み設定部４３は、設定したベースレイヤ及びエンハンスメントレイヤの重みＷ_Ｂ及びＷ_Ｅを、イントラ予測部３０及びインター予測部３５へ出力する。

　次に、アップサンプリング部４４は、重み設定部４３により設定されたベースレイヤの重みＷ_Ｂがゼロではなく、且つ解像度比Ｒ_ＢＥが１よりも大きいかを判定する（ステップＳ２６）。ベースレイヤの重みＷ_Ｂがゼロではなく解像度比Ｒ_ＢＥが１よりも大きい場合には、アップサンプリング部４４は、ベースレイヤのリコンストラクト画像を解像度比Ｒ_ＢＥに従ってアップサンプリングする（ステップＳ２７）。ベースレイヤの重みＷ_Ｂがゼロであり又は解像度比Ｒ_ＢＥが１に等しい場合には、アップサンプリング部４４は、ベースレイヤのリコンストラクト画像をアップサンプリングしなくてよい、

　そして、イントラ予測部３０又はインター予測部３５は、例えば上記式（１）に従い、重み設定部４３により設定された重みを用いて、エンハンスメントレイヤの画素予測を実行し、参照画素又は復号画素の予測画素値を計算する（ステップＳ２８）。なお、予測誤差について組合せ予測が行われる場合には、減算部１３及び加算部２３により予測が実行され得る。

　＜４．一実施形態に係るＥＬ復号部の構成例＞
　　［４－１．全体的な構成］
　図１０は、図４に示したＥＬ復号部６ｂの構成の一例を示すブロック図である。図１０を参照すると、ＥＬ復号部６ｂは、蓄積バッファ６１、可逆復号部６２、逆量子化部６３、逆直交変換部６４、加算部６５、デブロックフィルタ６６、並び替えバッファ６７、Ｄ／Ａ（Digital　to　Analogue）変換部６８、フレームメモリ６９、セレクタ７０及び７１、イントラ予測部８０、インター予測部８５並びに予測制御部９０を備える。

　蓄積バッファ６１は、逆多重化部５から入力されるエンハンスメントレイヤの符号化ストリームを記憶媒体を用いて一時的に蓄積する。

　可逆復号部６２は、蓄積バッファ６１から入力されるエンハンスメントレイヤの符号化ストリームから、符号化の際に使用された符号化方式に従ってエンハンスメントレイヤの量子化データを復号する。また、可逆復号部６２は、符号化ストリームのヘッダ領域に挿入されている情報を復号する。可逆復号部６２により復号される情報は、例えば、イントラ予測に関する情報、インター予測に関する情報及び予測制御関連パラメータを含み得る。可逆復号部６２は、量子化データを逆量子化部６３へ出力する。また、可逆復号部６２は、イントラ予測に関する情報をイントラ予測部８０へ出力する。また、可逆復号部６２は、インター予測に関する情報をインター予測部８５へ出力する。また、可逆復号部６２は、予測制御関連パラメータを予測制御部９０へ出力する。

　逆量子化部６３は、可逆復号部６２から入力される量子化データを、符号化の際に使用されたものと同じ量子化ステップで逆量子化し、エンハンスメントレイヤの変換係数データを復元する。そして、逆量子化部６３は、復元した変換係数データを逆直交変換部６４へ出力する。

　逆直交変換部６４は、符号化の際に使用された直交変換方式に従い、逆量子化部６３から入力される変換係数データについて逆直交変換を行うことにより、予測誤差データを生成する。そして、逆直交変換部６４は、生成した予測誤差データを加算部６５へ出力する。

　加算部６５は、逆直交変換部６４から入力される予測誤差データと、セレクタ７１から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部６５は、生成した復号画像データをデブロックフィルタ６６及びフレームメモリ６９へ出力する。

　デブロックフィルタ６６は、加算部６５から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データを並び替えバッファ６７及びフレームメモリ６９へ出力する。

　並び替えバッファ６７は、デブロックフィルタ６６から入力される画像を並び替えることにより、時系列の一連の画像データを生成する。そして、並び替えバッファ６７は、生成した画像データをＤ／Ａ変換部６８へ出力する。

　Ｄ／Ａ変換部６８は、並び替えバッファ６７から入力されるデジタル形式の画像データをアナログ形式の画像信号に変換する。そして、Ｄ／Ａ変換部６８は、例えば、画像復号装置６０と接続されるディスプレイ（図示せず）にアナログ画像信号を出力することにより、エンハンスメントレイヤの画像を表示させる。

　フレームメモリ６９は、加算部６５から入力されるフィルタリング前の復号画像データ及びデブロックフィルタ６６から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。

　セレクタ７０は、可逆復号部６２により取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ６９からの画像データの出力先をイントラ予測部８０とインター予測部８５との間で切り替える。例えば、セレクタ７０は、イントラ予測モードが指定された場合には、フレームメモリ６９から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部８０へ出力する。また、セレクタ７０は、インター予測モードが指定された場合には、フィルタリング後の復号画像データを参照画像データとしてインター予測部８５へ出力する。

　セレクタ７１は、可逆復号部６２により取得されるモード情報に応じて、加算部６５へ供給すべき予測画像データの出力元をイントラ予測部８０とインター予測部８５との間で切り替える。例えば、セレクタ７１は、イントラ予測モードが指定された場合には、イントラ予測部８０から出力される予測画像データを加算部６５へ供給する。また、セレクタ７１は、インター予測モードが指定された場合には、インター予測部８５から出力される予測画像データを加算部６５へ供給する。

　イントラ予測部８０は、可逆復号部６２から入力されるイントラ予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤのイントラ予測処理を行い、予測画像データを生成する。そして、イントラ予測部８０は、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。

　インター予測部８５は、可逆復号部６２から入力されるインター予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤの動き補償処理を行い、予測画像データを生成する。そして、インター予測部８５は、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。

　予測制御部９０は、共通メモリ７によりバッファリングされる情報を用いて、ＥＬ復号部６ｂにおける画素予測を制御する。例えば、予測制御部９０は、ベースレイヤのリコンストラクト画像をイントラ予測部８０に供給し、イントラ予測のための参照画素をイントラ予測部８０に組合せ予測によって予測させる。その代わりに、予測制御部９０は、イントラ予測部８０に復号画像の画素を組合せ予測によって予測させてもよい。また、例えば、予測制御部９０は、ベースレイヤのリコンストラクト画像をインター予測部８５に供給し、インター予測のための参照画素をインター予測部８５に組合せ予測によって予測させる。その代わりに、予測制御部９０は、インター予測部８５に復号画像の画素を組合せ予測によって予測させてもよい。予測制御部９０は、ベースレイヤのリコンストラクト画像を、レイヤ間の解像度比に応じてアップサンプリングしてもよい。本実施形態において、予測制御部９０は、これら組合せ予測のための重みを、ベースレイヤ画像及びエンハンスメントレイヤ画像の画質に依存する指標に基づいて制御する。予測制御部９０による当該重みの制御について、後にさらに説明する。

　なお、予測制御部９０は、ベースレイヤの予測誤差（残差）データを加算部６５に供給し、加算部６５に予測誤差を予測させてもよい（図中の点線矢印）。この場合、ベースレイヤの予測誤差データもまた、レイヤ間の解像度比に応じてアップサンプリングされ得る。

　　［４－２．予測制御部の詳細な構成］
　図１１は、図１０に示した予測制御部９０の構成の一例を示すブロック図である。図１１を参照すると、予測制御部９０は、解像度比取得部９１、量子化パラメータ取得部９２、重み設定部９３及びアップサンプリング部９４を有する。

　　　（１）解像度比取得部
　解像度比取得部９１は、ベースレイヤ画像とエンハンスメントレイヤ画像との間の解像度比Ｒ_ＢＥを取得する。解像度比Ｒ_ＢＥは、例えば、エンハンスメントレイヤのＳＰＳ又はＰＰＳから、可逆復号部６２により復号され得る。そして、解像度比取得部９１は、取得した解像度比Ｒ_ＢＥを、重み設定部９３及びアップサンプリング部９４へ出力する。

　　　（２）量子化パラメータ取得部
　量子化パラメータ取得部９２は、組合せ予測の重みを設定するために使用される量子化パラメータを取得する。例えば、量子化パラメータ取得部９２は、共通メモリ７から、ベースレイヤ画像に適用された量子化パラメータＱＰ_Ｂを取得する。また、量子化パラメータ取得部９２は、逆量子化部６３から、エンハンスメントレイヤ画像に適用された量子化パラメータＱＰ_Ｅを取得する。量子化行列が利用されるブロックについて画素予測が行われる場合には、量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅは、量子化行列の直流成分に対応する量子化パラメータであってよい。量子化パラメータ取得部９２は、輝度成分の量子化パラメータのみを取得してもよく、又は輝度成分（Ｙ）及び２つの色差成分（Ｃｂ，Ｃｒ）の量子化パラメータを取得してもよい。そして、量子化パラメータ取得部９２は、取得した量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅを、重み設定部９３へ出力する。

　典型的には、組合せ予測の重みは、エンハンスメントレイヤのＣＵごとに設定され得る。エンハンスメントレイヤのＣＵに対応する複数の対応ブロックがベースレイヤに存在し、当該複数の対応ブロックに異なる複数の量子化パラメータが適用された場合には、量子化パラメータ取得部９２は、当該複数の量子化パラメータの平均値を、ベースレイヤの量子化パラメータＱＰ_Ｂとして取得してもよい。その代わりに、量子化パラメータ取得部９２は、当該複数の対応ブロックのうち先頭の対応ブロックに適用された量子化パラメータを、ベースレイヤの量子化パラメータＱＰ_Ｂとして取得してもよい。

　また、量子化パラメータ取得部９２は、ベースレイヤの量子化パラメータＱＰ_Ｂとして、ベースレイヤにおいてピクチャレベルで設定された量子化パラメータを取得してもよく、又はスライスレベルで設定された量子化パラメータを取得してもよい。それにより、レイヤ間でのパラメータのバッファリングに要するメモリリソースを節約することができる。また、量子化パラメータ取得部９２は、符号化ストリームから可逆復号部６２により復号されるフラグにより示されるレベルでベースレイヤに設定された量子化パラメータを、ベースレイヤの量子化パラメータＱＰ_Ｂとして取得してもよい。

　　　（３）重み設定部
　重み設定部９３は、エンハンスメントレイヤにおける組合せ予測の重みを、ベースレイヤ画像及びエンハンスメントレイヤ画像の画質に依存する指標に基づいて設定する。本実施形態において、重み設定部９３により使用される画質に依存する指標は、量子化パラメータ取得部９２から入力される量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅを含む。空間スケーラビリティが実現される場合には、画質に依存する指標は、解像度比取得部９１から入力される解像度比Ｒ_ＢＥをさらに含み得る。

　より具体的には、重み設定部９３は、図６を用いて説明した重み設定部４３と同様に、ベースレイヤの量子化パラメータＱＰ_Ｂとエンハンスメントレイヤの量子化パラメータＱＰ_Ｅとの比較に基づいて、ベースレイヤの重みＷ_Ｂ及びエンハンスメントレイヤの重みＷ_Ｅを設定する。重み設定部９３は、量子化パラメータをレイヤ間で比較する前に、上記式（２）に従って、解像度比Ｒ_ＢＥに依存する補正値で量子化パラメータＱＰ_Ｂを補正してもよい。また、重み設定部９３は、３つの色成分について別々に、ベースレイヤ及びエンハンスメントレイヤの量子化パラメータに基づいて重みＷ_Ｂ及びＷ_Ｅを設定してもよい。また、重み設定部９３は、エンハンスメントレイヤの符号化ストリームから可逆復号部６２により復号される閾値を用いて、ベースレイヤの重みＷ_Ｂとエンハンスメントレイヤの重みＷ_Ｅとの間の差分を評価してもよい。なお、重み設定部９３は、解像度比Ｒ_ＢＥのみに基づいて重みＷ_Ｂ及びＷ_Ｅを設定してもよい。

　重み設定部９３は、例えば、図７Ａ～図７Ｄの例のようにベースレイヤ及びエンハンスメントレイヤの重みＷ_Ｂ及びＷ_Ｅを設定し、設定した重みをイントラ予測部８０及びインター予測部８５へ出力する。予測誤差について組合せ予測が行われる場合には、これら重みは、加算部６５へ出力され得る。また、重み設定部９３は、設定したベースレイヤの重みを、アップサンプリング部９４へ出力する。

　　　（４）アップサンプリング部
　アップサンプリング部９４は、重み設定部９３により設定されたベースレイヤの重みがゼロでない場合に、共通メモリ２によりバッファリングされているベースレイヤのリコンストラクト画像を、レイヤ間の解像度比Ｒ_ＢＥに従ってアップサンプリングする。そして、アップサンプリング部９４は、アップサンプリングされたベースレイヤのリコンストラクト画像を、ベースレイヤ画像として、イントラ予測部８０及びインター予測部８５へ出力する。予測誤差について組合せ予測が行われる場合には、アップサンプリング部９４は、アップサンプリングされたベースレイヤの予測誤差データを、加算部６５へ出力してもよい。なお、解像度比取得部９１から入力される解像度比Ｒ_ＢＥが１に等しい場合には、アップサンプリング部９４は、ベースレイヤ画像をアップサンプリングしなくてよい。

　＜５．一実施形態に係る復号時の処理の流れ＞
　　［５－１．概略的な流れ］
　図１２は、一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

　図１２を参照すると、まず、逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームに逆多重化する（ステップＳ６０）。

　次に、ＢＬ復号部６ａは、ベースレイヤの復号処理を実行し、ベースレイヤの符号化ストリームからベースレイヤ画像を再構築する（ステップＳ６１）。

　共通メモリ７は、ベースレイヤの復号処理において復号されるリコンストラクト画像及び画質依存の指標をバッファリングする（ステップＳ６２）。ここでバッファリングされる指標は、例えば、ベースレイヤに設定された量子化パラメータを含み得る。

　次に、ＥＬ復号部６ｂは、共通メモリ７によりバッファリングされている情報を用いて、エンハンスメントレイヤの復号処理を実行し、エンハンスメントレイヤ画像を再構築する（ステップＳ６３）。

　　［５－２．予測制御に関連する処理］
　図１３は、エンハンスメントレイヤの符号化処理（図１２のステップＳ６３）における予測制御に関連する処理の流れの一例を示すフローチャートである。図１３に示した処理は、例えば、エンハンスメントレイヤ画像内のＣＵごとに繰り返され得る。

　図１３を参照すると、まず、量子化パラメータ取得部９２は、ベースレイヤ画像に適用された量子化パラメータＱＰ_Ｂを共通メモリ７から取得する（ステップＳ７０）。また、量子化パラメータ取得部９２は、エンハンスメントレイヤ画像に適用された量子化パラメータＱＰ_Ｅを逆量子化部６３から取得する（ステップＳ７１）。そして、量子化パラメータ取得部９２は、取得した量子化パラメータＱＰ_Ｂ及びＱＰ_Ｅを、重み設定部９３へ出力する。

　また、解像度比取得部９１は、ベースレイヤ画像とエンハンスメントレイヤ画像との間の解像度比Ｒ_ＢＥを、可逆復号部６２から取得する（ステップＳ７２）。そして、解像度比取得部９１は、取得した解像度比Ｒ_ＢＥを重み設定部９３及びアップサンプリング部９４へ出力する。

　次に、重み設定部９３は、解像度比取得部９１から入力される解像度比Ｒ_ＢＥに基づいて、ベースレイヤの量子化パラメータＱＰ_Ｂを補正するか否かを判定する（ステップＳ７３）。例えば、重み設定部９３は、解像度比Ｒ_ＢＥが１に等しくない場合、上記式（２）に従って、量子化パラメータＱＰ_Ｂを補正された量子化パラメータＱＰ_Ｂ´（＝ＱＰ_Ｂ＋ｄＱＰ）に補正する（ステップＳ７４）。解像度比Ｒ_ＢＥが１に等しい場合には、ベースレイヤの量子化パラメータＱＰ_Ｂは補正されなくてよい。

　次に、重み設定部９３は、レイヤ間の量子化パラメータの比較に基づいて、ベースレイヤの重みＷ_Ｂ及びエンハンスメントレイヤの重みＷ_Ｅを設定する（ステップＳ７５）。ここで設定される重みＷ_Ｂ及びＷ_Ｅの値は、図７Ａ～図７Ｄに例示した値であってもよく、又は他の値であってもよい。そして、重み設定部９３は、設定したベースレイヤ及びエンハンスメントレイヤの重みＷ_Ｂ及びＷ_Ｅを、イントラ予測部８０及びインター予測部８５へ出力する。

　次に、アップサンプリング部９４は、重み設定部９３により設定されたベースレイヤの重みＷ_Ｂがゼロではなく、且つ解像度比Ｒ_ＢＥが１よりも大きいかを判定する（ステップＳ７６）。ベースレイヤの重みＷ_Ｂがゼロではなく解像度比Ｒ_ＢＥが１よりも大きい場合には、アップサンプリング部９４は、ベースレイヤのリコンストラクト画像を解像度比Ｒ_ＢＥに従ってアップサンプリングする（ステップＳ７７）。ベースレイヤの重みＷ_Ｂがゼロであり又は解像度比Ｒ_ＢＥが１に等しい場合には、アップサンプリング部９４は、ベースレイヤのリコンストラクト画像をアップサンプリングしなくてよい、

　そして、イントラ予測部８０又はインター予測部８５は、例えば上記式（１）に従い、重み設定部９３により設定された重みを用いて、エンハンスメントレイヤの画素予測を実行し、参照画素又は復号画素の予測画素値を計算する（ステップＳ７８）。なお、予測誤差について組合せ予測が行われる場合には、加算部６５により予測が実行され得る。

　＜６．コーデックの組合せの例＞
　本開示に係る技術は、様々なコーデックの組合せでのスケーラブル符号化に適用可能である。多重化されるレイヤの数は、２つ以上のいかなる数であってもよい。但し、標準化されていないコーデックの組合せが利用されると、デコーダが正常に動作しない可能性が生じ得る。そこで、予め定義されるコーデックの組合せのみが、階層的に符号化されることを許容されてもよい。その代わりに、いくつかのコーデックの組合せが、階層的に符号化されることを禁止されてもよい。

　図１４Ａ及び図１４Ｂは、許容され又は禁止され得るコーデックの組合せについて説明するための説明図である。

　図１４Ａを参照すると、最も下位の第１のレイヤＬ１０から最も上位の第５のレイヤＬ１４までの５つのレイヤが示されている。第１のレイヤＬ１０及び第２のレイヤＬ１１は、ＭＰＥＧ２方式で符号化される。第３のレイヤＬ１２及び第４のレイヤＬ１３は、ＡＶＣ方式で符号化される。第５のレイヤＬ１４は、ＨＥＶＣ方式で符号化される。これらレイヤのうち、第１のレイヤＬ１０及び第２のレイヤＬ１１を階層的に符号化することは、コーデックが共通しているため、許容される。第２のレイヤＬ１１及び第３のレイヤＬ１２を階層的に符号化することは、ＭＰＥＧ２方式とＡＶＣ方式との組合せが標準化されていないため、禁止され得る。第３のレイヤＬ１２及び第４のレイヤＬ１３を階層的に符号化することは、コーデックが共通しているため、許容される。第４のレイヤＬ１３及び第５のレイヤＬ１４を階層的に符号化することは、ＡＶＣ方式とＨＥＶＣ方式との組合せが標準化されるため、許容される。図１４Ａの例では、第１のレイヤＬ１０及び第２のレイヤＬ１１の多重化ストリームと、第３のレイヤＬ１２、第４のレイヤＬ１３及び第５のレイヤＬ１４の多重化ストリームとは、スケーラブル符号化ではなく、サイマルキャスト符号化（simulcast-coding）によって多重化され得る。

　図１４Ｂを参照すると、最も下位の第１のレイヤＬ２０から最も上位の第５のレイヤＬ２４までの５つのレイヤが示されている。第１のレイヤＬ２０及び第２のレイヤＬ２１は、ＡＶＣ方式で符号化される。第３のレイヤＬ２２及び第４のレイヤＬ２３は、ＭＰＥＧ２方式で符号化される。第５のレイヤＬ２４は、ＨＥＶＣ方式で符号化される。これらレイヤのうち、第１のレイヤＬ２０及び第２のレイヤＬ２１を階層的に符号化することは、コーデックが共通しているため、許容される。第２のレイヤＬ２１及び第３のレイヤＬ２２を階層的に符号化することは、ＡＶＣ方式とＭＰＥＧ２方式との組合せが標準化されていないため、禁止され得る。第３のレイヤＬ２２及び第４のレイヤＬ２３を階層的に符号化することは、コーデックが共通しているため、許容される。第４のレイヤＬ２３及び第５のレイヤＬ２４を階層的に符号化することは、ＭＰＥＧ２方式とＨＥＶＣ方式との組合せが標準化されるため、許容される。図１４Ｂの例では、第１のレイヤＬ２０及び第２のレイヤＬ２１の多重化ストリームと、第３のレイヤＬ２２、第４のレイヤＬ２３及び第５のレイヤＬ２４の多重化ストリームとは、スケーラブル符号化ではなく、サイマルキャスト符号化によって多重化され得る。

　＜７．応用例＞
　　［７－１．様々な製品への応用］
　上述した実施形態に係る画像符号化装置１０及び画像復号装置６０は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

　　　（１）第１の応用例
　図１５は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース９０９、制御部９１０、ユーザインタフェース９１１、及びバス９１２を備える。

　チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

　デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからＥＰＧ（Electronic　Program　Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

　デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

　映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのＧＵＩ（Graphical　User　Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

　表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はＯＬＥＤなど）の映像面上に映像又は画像を表示する。

　音声信号処理部９０７は、デコーダ９０４から入力される音声データについてＤ／Ａ変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

　外部インタフェース９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

　制御部９１０は、ＣＰＵ（Central　Processing　Unit）などのプロセッサ、並びにＲＡＭ（Random　Access　Memory）及びＲＯＭ（Read　Only　Memory）などのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、プログラムデータ、ＥＰＧデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

　ユーザインタフェース９１１は、制御部９１０と接続される。ユーザインタフェース９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

　バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース９０９及び制御部９１０を相互に接続する。

　このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、テレビジョン装置９００が画像をマルチレイヤコーデックで復号する際に、各レイヤの画質に応じて画素予測の予測精度を高めることができる。

　　　（２）第２の応用例
　図１６は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

　アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

　携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

　音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをＡ／Ｄ変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

　記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、ＲＡＭ又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

　また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９の記憶媒体に記憶させる。

　また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、携帯電話機９２０が画像をマルチレイヤコーデックで符号化し又は復号する際に、各レイヤの画質に応じて画素予測の予測精度を高めることができる。

　　　（３）第３の応用例
　図１７は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

　記録再生装置９４０は、チューナ９４１、外部インタフェース９４２、エンコーダ９４３、ＨＤＤ（Hard　Disk　Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen　Display）９４８、制御部９４９、及びユーザインタフェース９５０を備える。

　チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送手段としての役割を有する。

　外部インタフェース９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース９４２は、例えば、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース、ＵＳＢインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース９４２は、記録再生装置９４０における伝送手段としての役割を有する。

　エンコーダ９４３は、外部インタフェース９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

　ＨＤＤ９４４は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、ＨＤＤ９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

　ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばＤＶＤディスク（ＤＶＤ－Ｖｉｄｅｏ、ＤＶＤ－ＲＡＭ、ＤＶＤ－Ｒ、ＤＶＤ－ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）又はＢｌｕ－ｒａｙ（登録商標）ディスクなどであってよい。

　セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをＨＤＤ９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、ＨＤＤ９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

　デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをＯＳＤ９４８へ出力する。また、デコーダ９０４は、生成した音声データを外部のスピーカへ出力する。

　ＯＳＤ９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、ＯＳＤ９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を重畳してもよい。

　制御部９４９は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

　ユーザインタフェース９５０は、制御部９４９と接続される。ユーザインタフェース９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

　このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施形態に係る画像符号化装置１０の機能を有する。また、デコーダ９４７は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、記録再生装置９４０が画像をマルチレイヤコーデックで符号化し又は復号する際に、各レイヤの画質に応じて画素予測の予測精度を高めることができる。

　　　（４）第４の応用例
　図１８は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

　撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、制御部９７０、ユーザインタフェース９７１、及びバス９７２を備える。

　光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、及び制御部９７０を相互に接続する。

　光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤ又はＣＭＯＳなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

　信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

　画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、ＯＳＤ９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

　ＯＳＤ９６９は、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を生成して、生成した画像を画像処理部９６４へ出力する。

　外部インタフェース９６６は、例えばＵＳＢ入出力端子として構成される。外部インタフェース９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース９６６は、ＬＡＮ又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース９６６は、撮像装置９６０における伝送手段としての役割を有する。

　メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はＳＳＤ（Solid　State　Drive）のような非可搬性の記憶部が構成されてもよい。

　制御部９７０は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

　ユーザインタフェース９７１は、制御部９７０と接続される。ユーザインタフェース９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

　このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、撮像装置９６０が画像をマルチレイヤコーデックで符号化し又は復号する際に、各レイヤの画質に応じて画素予測の予測精度を高めることができる。

　　［７－２．スケーラブル符号化の様々な用途］
　上述したスケーラブル符号化の利点は、様々な用途において享受され得る。以下、３つの用途の例について説明する。

　　　（１）第１の例
　第１の例において、スケーラブル符号化は、データの選択的な伝送のために利用される。図１９を参照すると、データ伝送システム１０００は、ストリーム記憶装置１００１及び配信サーバ１００２を含む。配信サーバ１００２は、ネットワーク１００３を介して、いくつかの端末装置と接続される。ネットワーク１００３は、有線ネットワークであっても無線ネットワークであってもよく、又はそれらの組合せであってもよい。図１９には、端末装置の例として、ＰＣ（Personal　Computer）１００４、ＡＶ機器１００５、タブレット装置１００６及び携帯電話機１００７が示されている。

　ストリーム記憶装置１００１は、例えば、画像符号化装置１０により生成される多重化ストリームを含むストリームデータ１０１１を記憶する。多重化ストリームは、ベースレイヤ（ＢＬ）の符号化ストリーム及びエンハンスメントレイヤ（ＥＬ）の符号化ストリームを含む。配信サーバ１００２は、ストリーム記憶装置１００１に記憶されているストリームデータ１０１１を読み出し、読み出したストリームデータ１０１１の少なくとも一部分を、ネットワーク１００３を介して、ＰＣ１００４、ＡＶ機器１００５、タブレット装置１００６、及び携帯電話機１００７へ配信する。

　端末装置へのストリームの配信の際、配信サーバ１００２は、端末装置の能力又は通信環境などの何らかの条件に基づいて、配信すべきストリームを選択する。例えば、配信サーバ１００２は、端末装置が扱うことのできる画質を上回るほど高い画質を有する符号化ストリームを配信しないことにより、端末装置における遅延、オーバフロー又はプロセッサの過負荷の発生を回避してもよい。また、配信サーバ１００２は、高い画質を有する符号化ストリームを配信しないことにより、ネットワーク１００３の通信帯域が占有されることを回避してもよい。一方、配信サーバ１００２は、これら回避すべきリスクが存在しない場合、又はユーザとの契約若しくは何らかの条件に基づいて適切だと判断される場合に、多重化ストリームの全てを端末装置へ配信してもよい。

　図１９の例では、配信サーバ１００２は、ストリーム記憶装置１００１からストリームデータ１０１１を読み出す。そして、配信サーバ１００２は、高い処理能力を有するＰＣ１００４へ、ストリームデータ１０１１をそのまま配信する。また、ＡＶ機器１００５は低い処理能力を有するため、配信サーバ１００２は、ストリームデータ１０１１から抽出されるベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を生成し、ストリームデータ１０１２をＡＶ機器１００５へ配信する。また、配信サーバ１００２は、高い通信レートで通信可能であるタブレット装置１００６へストリームデータ１０１１をそのまま配信する。また、携帯電話機１００７は低い通信レートでしか通信できないため、配信サーバ１００２は、ベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を携帯電話機１００７へ配信する。

　このように多重化ストリームを用いることにより、伝送されるトラフィックの量を適応的に調整することができる。また、個々のレイヤがそれぞれ単独に符号化されるケースと比較して、ストリームデータ１０１１の符号量は削減されるため、ストリームデータ１０１１の全体が配信されるとしても、ネットワーク１００３に掛かる負荷は抑制される。さらに、ストリーム記憶装置１００１のメモリリソースも節約される。

　端末装置のハードウエア性能は、装置ごとに異なる。また、端末装置において実行されるアプリケーションのケイパビリティも様々である。さらに、ネットワーク１００３の通信容量もまた様々である。データ伝送のために利用可能な容量は、他のトラフィックの存在に起因して、時々刻々と変化し得る。そこで、配信サーバ１００２は、ストリームデータの配信を開始する前に、配信先の端末装置との間のシグナリングを通じて、端末装置のハードウエア性能及びアプリケーションケイパビリティなどに関する端末情報と、ネットワーク１００３の通信容量などに関するネットワーク情報とを取得してもよい。そして、配信サーバ１００２は、取得した情報に基づいて、配信すべきストリームを選択し得る。

　なお、復号すべきレイヤの抽出は、端末装置において行われてもよい。例えば、ＰＣ１００４は、受信した多重化ストリームから抽出され復号されるベースレイヤ画像をその画面に表示してもよい。また、ＰＣ１００４は、受信した多重化ストリームからベースレイヤの符号化ストリームを抽出してストリームデータ１０１２を生成し、生成したストリームデータ１０１２を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　図１９に示したデータ伝送システム１０００の構成は一例に過ぎない。データ伝送システム１０００は、いかなる数のストリーム記憶装置１００１、配信サーバ１００２、ネットワーク１００３、及び端末装置を含んでもよい。

　　　（２）第２の例
　第２の例において、スケーラブル符号化は、複数の通信チャネルを介するデータの伝送のために利用される。図２０を参照すると、データ伝送システム１１００は、放送局１１０１及び端末装置１１０２を含む。放送局１１０１は、地上波チャネル１１１１上で、ベースレイヤの符号化ストリーム１１２１を放送する。また、放送局１１０１は、ネットワーク１１１２を介して、エンハンスメントレイヤの符号化ストリーム１１２２を端末装置１１０２へ送信する。

　端末装置１１０２は、放送局１１０１により放送される地上波放送を受信するための受信機能を有し、地上波チャネル１１１１を介してベースレイヤの符号化ストリーム１１２１を受信する。また、端末装置１１０２は、放送局１１０１と通信するための通信機能を有し、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信する。

　端末装置１１０２は、例えば、ユーザからの指示に応じて、ベースレイヤの符号化ストリーム１１２１を受信し、受信した符号化ストリーム１１２１からベースレイヤ画像を復号してベースレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したベースレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　また、端末装置１１０２は、例えば、ユーザからの指示に応じて、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信し、ベースレイヤの符号化ストリーム１１２１とエンハンスメントレイヤの符号化ストリーム１１２２とを多重化することにより多重化ストリームを生成してもよい。また、端末装置１１０２は、エンハンスメントレイヤの符号化ストリーム１１２２からエンハンスメントレイヤ画像を復号してエンハンスメントレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したエンハンスメントレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　上述したように、多重化ストリームに含まれる各レイヤの符号化ストリームは、レイヤごとに異なる通信チャネルを介して伝送され得る。それにより、個々のチャネルに掛かる負荷を分散させて、通信の遅延若しくはオーバフローの発生を抑制することができる。

　また、何らかの条件に応じて、伝送のために使用される通信チャネルが動的に選択されてもよい。例えば、データ量が比較的多いベースレイヤの符号化ストリーム１１２１は帯域幅の広い通信チャネルを介して伝送され、データ量が比較的少ないエンハンスメントレイヤの符号化ストリーム１１２２は帯域幅の狭い通信チャネルを介して伝送され得る。また、特定のレイヤの符号化ストリーム１１２２が伝送される通信チャネルが、通信チャネルの帯域幅に応じて切り替えられてもよい。それにより、個々のチャネルに掛かる負荷をより効果的に抑制することができる。

　なお、図２０に示したデータ伝送システム１１００の構成は一例に過ぎない。データ伝送システム１１００は、いかなる数の通信チャネル及び端末装置を含んでもよい。また、放送以外の用途において、ここで説明したシステムの構成が利用されてもよい。

　　　（３）第３の例
　第３の例において、スケーラブル符号化は、映像の記憶のために利用される。図２１を参照すると、データ伝送システム１２００は、撮像装置１２０１及びストリーム記憶装置１２０２を含む。撮像装置１２０１は、被写体１２１１を撮像することにより生成される画像データをスケーラブル符号化し、多重化ストリーム１２２１を生成する。多重化ストリーム１２２１は、ベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームを含む。そして、撮像装置１２０１は、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給する。

　ストリーム記憶装置１２０２は、撮像装置１２０１から供給される多重化ストリーム１２２１を、モードごとに異なる画質で記憶する。例えば、ストリーム記憶装置１２０２は、通常モードにおいて、多重化ストリーム１２２１からベースレイヤの符号化ストリーム１２２２を抽出し、抽出したベースレイヤの符号化ストリーム１２２２を記憶する。これに対し、ストリーム記憶装置１２０２は、高画質モードにおいて、多重化ストリーム１２２１をそのまま記憶する。それにより、ストリーム記憶装置１２０２は、高画質での映像の記録が望まれる場合にのみ、データ量の多い高画質のストリームを記録することができる。そのため、画質の劣化のユーザへの影響を抑制しながら、メモリリソースを節約することができる。

　例えば、撮像装置１２０１は、監視カメラであるものとする。撮像画像に監視対象（例えば侵入者）が映っていない場合には、通常モードが選択される。この場合、撮像画像は重要でない可能性が高いため、データ量の削減が優先され、映像は低画質で記録される（即ち、ベースレイヤの符号化ストリーム１２２２のみが記憶される）。これに対し、撮像画像に監視対象（例えば、侵入者である被写体１２１１）が映っている場合には、高画質モードが選択される。この場合、撮像画像は重要である可能性が高いため、画質の高さが優先され、映像は高画質で記録される（即ち、多重化ストリーム１２２１が記憶される）。

　図２１の例では、モードは、例えば画像解析結果に基づいて、ストリーム記憶装置１２０２により選択される。しかしながら、かかる例に限定されず、撮像装置１２０１がモードを選択してもよい。後者の場合、撮像装置１２０１は、通常モードにおいて、ベースレイヤの符号化ストリーム１２２２をストリーム記憶装置１２０２へ供給し、高画質モードにおいて、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給してもよい。

　なお、モードを選択するための選択基準は、いかなる基準であってもよい。例えば、マイクロフォンを通じて取得される音声の大きさ又は音声の波形などに応じて、モードが切り替えられてもよい。また、周期的にモードが切り替えられてもよい。また、ユーザがらの指示に応じてモードが切り替えられてもよい。さらに、選択可能なモードの数は、階層化されるレイヤの数を超えない限り、いかなる数であってもよい。

　図２１に示したデータ伝送システム１２００の構成は一例に過ぎない。データ伝送システム１２００は、いかなる数の撮像装置１２０１を含んでもよい。また、監視カメラ以外の用途において、ここで説明したシステムの構成が利用されてもよい。

　　［７－３．その他］
　　　（１）マルチビューコーデックへの応用
　マルチビューコーデックは、マルチレイヤコーデックの一種であり、いわゆる多視点映像を符号化し及び復号するための画像符号化方式である。図２２は、マルチビューコーデックについて説明するための説明図である。図２２を参照すると、３つの視点においてそれぞれ撮影される３つのビューのフレームのシーケンスが示されている。各ビューには、ビューＩＤ（view_id）が付与される。これら複数のビューのうちいずれか１つのビューが、ベースビュー（base　view）に指定される。ベースビュー以外のビューは、ノンベースビューと呼ばれる。図２２の例では、ビューＩＤが“０”であるビューがベースビューであり、ビューＩＤが“１”又は“２”である２つのビューがノンベースビューである。これらビューが階層的に符号化される場合、各ビューがレイヤに相当し得る。図中に矢印で示したように、ノンベースビューの画像は、ベースビューの画像を参照して符号化され及び復号される（他のノンベースビューの画像も参照されてよい）。

　図２３は、マルチビューコーデックをサポートする画像符号化装置１０ｖの概略的な構成を示すブロック図である。図２３を参照すると、画像符号化装置１０ｖは、第１レイヤ符号化部１ｃ、第２レイヤ符号化部１ｄ、共通メモリ２及び多重化部３を備える。

　第１レイヤ符号化部１ｃの機能は、入力としてベースレイヤ画像の代わりにベースビュー画像を受け取ることを除き、図３を用いて説明したＢＬ符号化部１ａの機能と同等である。第１レイヤ符号化部１ｃは、ベースビュー画像を符号化し、第１レイヤの符号化ストリームを生成する。第２レイヤ符号化部１ｄの機能は、入力としてエンハンスメントレイヤ画像の代わりにノンベースビュー画像を受け取ることを除き、図３を用いて説明したＥＬ符号化部１ｂの機能と同等である。第２レイヤ符号化部１ｄは、ノンベースビュー画像を符号化し、第２レイヤの符号化ストリームを生成する。共通メモリ２は、レイヤ間で共通的に利用される情報を記憶する。多重化部３は、第１レイヤ符号化部１ｃにより生成される第１レイヤの符号化ストリームと、第２レイヤ符号化部１ｄにより生成される第２レイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

　図２４は、マルチビューコーデックをサポートする画像復号装置６０ｖの概略的な構成を示すブロック図である。図２４を参照すると、画像復号装置６０ｖは、逆多重化部５、第１レイヤ復号部６ｃ、第２レイヤ復号部６ｄ及び共通メモリ７を備える。

　逆多重化部５は、マルチレイヤの多重化ストリームを第１レイヤの符号化ストリーム及び第２レイヤの符号化ストリームに逆多重化する。第１レイヤ復号部６ｃの機能は、入力としてベースレイヤ画像の代わりにベースビュー画像が符号化された符号化ストリームを受け取ることを除き、図４を用いて説明したＢＬ復号部６ａの機能と同等である。第１レイヤ復号部６ｃは、第１レイヤの符号化ストリームからベースビュー画像を復号する。第２レイヤ復号部６ｄの機能は、入力としてエンハンスメントレイヤ画像の代わりにノンベースビュー画像が符号化された符号化ストリームを受け取ることを除き、図４を用いて説明したＥＬ復号部６ｂの機能と同等である。第２レイヤ復号部６ｄは、第２レイヤの符号化ストリームからノンベースビュー画像を復号する。共通メモリ７は、レイヤ間で共通的に利用される情報を記憶する。

　マルチビューの画像データを符号化し又は復号する際、本開示に係る技術に従って、ベースビューの情報とノンベースビューの情報とに基づく組合せ予測が実現されてもよい。それにより、スケーラブル符号化のケースと同様に、マルチビューコーデックにおいても、予測精度を高め、符号化効率を一層向上させることができる。

　　　（２）ストリーミング技術への応用
　本開示に係る技術は、ストリーミングプロトコルに適用されてもよい。例えば、ＭＰＥＧ－ＤＡＳＨ（Dynamic　Adaptive　Streaming　over　HTTP）では、解像度などのパラメータが互いに異なる複数の符号化ストリームがストリーミングサーバにおいて予め用意される。そして、ストリーミングサーバは、複数の符号化ストリームからストリーミングすべき適切なデータをセグメント単位で動的に選択し、選択したデータを配信する。このようなストリーミングプロトコルにおいて、本開示に係る技術に従って、複数の符号化ストリームの情報に基づく組合せ予測が実現されてもよい。

　＜８．まとめ＞
　ここまで、図１～図２４を用いて、本開示に係る技術の実施形態について詳細に説明した。上述した実施形態によれば、第１レイヤを参照して符号化される第２レイヤにおける画素予測のために第１レイヤ画素及び第２レイヤ画素を算入する際の重みが、第１レイヤ画像及び第２レイヤ画像の画質に依存する指標に基づいて設定される。即ち、マルチレイヤコーデックにおける画素予測に際して、各レイヤの画質を考慮してどのレイヤの画像をどのように参照すべきかが適応的に決定されるため、予測精度を高め、符号化効率を向上させることができる。

　また、上述した実施形態によれば、画質に依存する上記指標は、レイヤごとの量子化パラメータを含む。量子化パラメータが大きければ画像は粗く量子化され、それにより画質は低下するため、上記指標として量子化パラメータを用いることで、レイヤ間で画質を簡易に比較することが可能となる。

　また、上述した実施形態によれば、レイヤ間で量子化パラメータが等しい場合には、第１レイヤ及び第２レイヤに同等の重みが設定される。また、量子化パラメータが異なる場合には、量子化パラメータがより小さい値を示すレイヤについてより大きい重みが設定される。従って、画質が等しい場合には第１レイヤ画素及び第２レイヤ画素を同等の重みで画素予測に算入し、画質が異なる場合にはより画質の高いレイヤの画素をより大きい重みで画素予測に算入することができる。

　また、上述した実施形態によれば、レイヤ間の解像度比に依存する補正値で量子化パラメータが補正された上で、レイヤ間で量子化パラメータが比較される。従って、画質への解像度の影響を、重みの設定に反映させることができる。重みの設定のために使用される量子化パラメータがピクチャレベル又はスライスレベルのパラメータである場合には、バッファリングされるパラメータの情報量が削減されるため、メモリリソースを節約することができる。

　また、上述した実施形態によれば、重みを変化させるために使用される閾値、及び使用される量子化パラメータのレベル（ピクチャ、スライス又はＣＵなど）を示すフラグなどが、符号化され及び復号され得る。これら追加的なパラメータの採用により、マルチレイヤコーデックにおける画素予測の予測精度を最適化するような符号化処理の柔軟な設計が可能となる。

　なお、本明細書では、予測制御に関する情報が、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について主に説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　第１レイヤを参照して符号化され又は復号される第２レイヤにおける画素予測のために第１レイヤ画素及び第２レイヤ画素を算入する際の重みを、第１レイヤ画像及び第２レイヤ画像の画質に依存する指標に基づいて設定する予測制御部、
　を備える画像処理装置。
（２）
　画質に依存する前記指標は、前記第１レイヤ画像に適用された第１の量子化パラメータ及び前記第２レイヤ画像に適用された第２の量子化パラメータを含む、前記（１）に記載の画像処理装置。
（３）
　前記予測制御部は、前記第１の量子化パラメータと前記第２の量子化パラメータとが等しい場合には、前記第１レイヤ画素及び前記第２レイヤ画素の重みを同等の値に設定する、前記（２）に記載の画像処理装置。
（４）
　前記予測制御部は、より小さい量子化パラメータの適用されたレイヤの画素についてより大きい重みを設定する、前記（２）又は前記（３）に記載の画像処理装置。
（５）
　前記予測制御部は、前記第１の量子化パラメータと前記第２の量子化パラメータとの差が閾値を上回る場合に、より小さい量子化パラメータの適用されたレイヤの画素のみを前記画素予測のために算入する、前記（２）～（４）のいずれか１項に記載の画像処理装置。
（６）
　前記画像処理装置は、前記重みを変化させるために使用される閾値を符号化ストリームから復号する復号部、をさらに備える、前記（２）～（５）のいずれか１項に記載の画像処理装置。
（７）
　前記予測制御部は、前記第１レイヤ画像と前記第２レイヤ画像との間の解像度比に依存する補正値で前記第１の量子化パラメータを補正し、補正された前記第１の量子化パラメータと前記第２の量子化パラメータとを比較する、前記（２）～（６）のいずれか１項に記載の画像処理装置。
（８）
　前記予測制御部は、量子化行列が利用されるブロックについて前記画素予測が行われる場合には、前記量子化行列の直流成分に対応する量子化パラメータを、前記第１の量子化パラメータ又は前記第２の量子化パラメータとして使用する、前記（２）～（７）のいずれか１項に記載の画像処理装置。
（９）
　前記予測制御部は、前記第２レイヤの符号化単位ごとに前記重みを設定する、前記（２）～（８）のいずれか１項に記載の画像処理装置。
（１０）
　前記予測制御部は、前記第２レイヤの符号化単位に対応する複数の対応ブロックが前記第１レイヤに存在し、当該複数の対応ブロックに異なる複数の量子化パラメータが適用された場合には、当該複数の量子化パラメータの平均値を前記第１の量子化パラメータとして使用する、前記（９）に記載の画像処理装置。
（１１）
　前記予測制御部は、前記第２レイヤの符号化単位に対応する複数の対応ブロックが前記第１レイヤに存在し、当該複数の対応ブロックに異なる複数の量子化パラメータが適用された場合には、先頭の対応ブロックに適用された量子化パラメータを前記第１の量子化パラメータとして使用する、前記（９）に記載の画像処理装置。
（１２）
　前記第１の量子化パラメータは、前記第１レイヤにおいてピクチャレベルで設定されるパラメータである、前記（２）～（８）のいずれか１項に記載の画像処理装置。
（１３）
　前記第１の量子化パラメータは、前記第１レイヤにおいてスライスレベルで設定されるパラメータである、前記（２）～（８）のいずれか１項に記載の画像処理装置。
（１４）
　前記予測制御部は、符号化ストリームから復号されるフラグにより示されるレベルで前記第１レイヤに設定される量子化パラメータを、前記第１の量子化パラメータとして使用する、前記（２）～（８）のいずれか１項に記載の画像処理装置。
（１５）
　前記予測制御部は、３つの色成分について別々に、画質に依存する前記指標に基づいて前記重みを設定する、前記（１）～（１４）のいずれか１項に記載の画像処理装置。
（１６）
　画質に依存する前記指標は、前記第１レイヤと前記第２レイヤとの間の解像度比を含む、前記（１）～（１５）のいずれか１項に記載の画像処理装置。
（１７）
　前記画素予測は、インター予測又はイントラ予測において参照される参照画素を予測するために行われる、前記（１）～（１６）のいずれか１項に記載の画像処理装置。
（１８）
　前記画素予測は、インター予測又はイントラ予測の予測誤差を予測するために行われる、前記（１）～（１６）のいずれか１項に記載の画像処理装置。
（１９）
　前記画素予測は、復号画像の画素を予測するために行われる、前記（１）～（１６）のいずれか１項に記載の画像処理装置。
（２０）
　第１レイヤを参照して符号化され又は復号される第２レイヤにおける画素予測のために第１レイヤ画素及び第２レイヤ画素を算入する際の重みを、第１レイヤ画像及び第２レイヤ画像の画質に依存する指標に基づいて設定すること、
　を含む画像処理方法。

　１０，１０ｖ　画像符号化装置（画像処理装置）
　１ａ　　　　　ベースレイヤ符号化部
　１ｂ　　　　　エンハンスメントレイヤ符号化部
　１６　　　　　可逆符号化部
　４０　　　　　予測制御部
　６０，６０ｖ　画像復号装置（画像処理装置）
　６ａ　　　　　ベースレイヤ復号部
　６ｂ　　　　　エンハンスメントレイヤ復号部
　６２　　　　　可逆復号部
　９０　　　　　予測制御部

Claims

　第１レイヤを参照して符号化され又は復号される第２レイヤにおける画素予測のために第１レイヤ画素及び第２レイヤ画素を算入する際の重みを、第１レイヤ画像及び第２レイヤ画像の画質に依存する指標に基づいて設定する予測制御部、
　を備える画像処理装置。
　画質に依存する前記指標は、前記第１レイヤ画像に適用された第１の量子化パラメータ及び前記第２レイヤ画像に適用された第２の量子化パラメータを含む、請求項１に記載の画像処理装置。
　前記予測制御部は、前記第１の量子化パラメータと前記第２の量子化パラメータとが等しい場合には、前記第１レイヤ画素及び前記第２レイヤ画素の重みを同等の値に設定する、請求項２に記載の画像処理装置。
　前記予測制御部は、より小さい量子化パラメータの適用されたレイヤの画素についてより大きい重みを設定する、請求項２に記載の画像処理装置。
　前記予測制御部は、前記第１の量子化パラメータと前記第２の量子化パラメータとの差が閾値を上回る場合に、より小さい量子化パラメータの適用されたレイヤの画素のみを前記画素予測のために算入する、請求項２に記載の画像処理装置。
　前記画像処理装置は、前記重みを変化させるために使用される閾値を符号化ストリームから復号する復号部、をさらに備える、請求項２に記載の画像処理装置。
　前記予測制御部は、前記第１レイヤ画像と前記第２レイヤ画像との間の解像度比に依存する補正値で前記第１の量子化パラメータを補正し、補正された前記第１の量子化パラメータと前記第２の量子化パラメータとを比較する、請求項２に記載の画像処理装置。
　前記予測制御部は、量子化行列が利用されるブロックについて前記画素予測が行われる場合には、前記量子化行列の直流成分に対応する量子化パラメータを、前記第１の量子化パラメータ又は前記第２の量子化パラメータとして使用する、請求項２に記載の画像処理装置。
　前記予測制御部は、前記第２レイヤの符号化単位ごとに前記重みを設定する、請求項２に記載の画像処理装置。
　前記予測制御部は、前記第２レイヤの符号化単位に対応する複数の対応ブロックが前記第１レイヤに存在し、当該複数の対応ブロックに異なる複数の量子化パラメータが適用された場合には、当該複数の量子化パラメータの平均値を前記第１の量子化パラメータとして使用する、請求項９に記載の画像処理装置。
　前記予測制御部は、前記第２レイヤの符号化単位に対応する複数の対応ブロックが前記第１レイヤに存在し、当該複数の対応ブロックに異なる複数の量子化パラメータが適用された場合には、先頭の対応ブロックに適用された量子化パラメータを前記第１の量子化パラメータとして使用する、請求項９に記載の画像処理装置。
　前記第１の量子化パラメータは、前記第１レイヤにおいてピクチャレベルで設定されるパラメータである、請求項２に記載の画像処理装置。
　前記第１の量子化パラメータは、前記第１レイヤにおいてスライスレベルで設定されるパラメータである、請求項２に記載の画像処理装置。
　前記予測制御部は、符号化ストリームから復号されるフラグにより示されるレベルで前記第１レイヤに設定される量子化パラメータを、前記第１の量子化パラメータとして使用する、請求項２に記載の画像処理装置。
　前記予測制御部は、３つの色成分について別々に、画質に依存する前記指標に基づいて前記重みを設定する、請求項１に記載の画像処理装置。
　画質に依存する前記指標は、前記第１レイヤと前記第２レイヤとの間の解像度比を含む、請求項１に記載の画像処理装置。
　前記画素予測は、インター予測又はイントラ予測において参照される参照画素を予測するために行われる、請求項１に記載の画像処理装置。
　前記画素予測は、インター予測又はイントラ予測の予測誤差を予測するために行われる、請求項１に記載の画像処理装置。
　前記画素予測は、復号画像の画素を予測するために行われる、請求項１に記載の画像処理装置。
　第１レイヤを参照して符号化され又は復号される第２レイヤにおける画素予測のために第１レイヤ画素及び第２レイヤ画素を算入する際の重みを、第１レイヤ画像及び第２レイヤ画像の画質に依存する指標に基づいて設定すること、
　を含む画像処理方法。