WO2015052979A1

WO2015052979A1 - 画像処理装置及び画像処理方法

Info

Publication number: WO2015052979A1
Application number: PCT/JP2014/070390
Authority: WO
Inventors: 佐藤　数史
Original assignee: ソニー株式会社
Priority date: 2013-10-11
Filing date: 2014-08-01
Publication date: 2015-04-16

Abstract

【課題】クロマフォーマットスケーラビリティをサポートする際に、固有のロジックの追加を抑制しつつ、符号量の低減又は処理の高速化を図ること。【解決手段】第１レイヤに基づいてスケーラブル符号化された第２レイヤの符号化ストリームから当該第２レイヤの画像を復号するための所定の処理を実行する処理部と、前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定する判定部と、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のための前記所定の処理を前記処理部にスキップさせる制御部と、を備える画像処理装置を提供する。

Description

画像処理装置及び画像処理方法

　本開示は、画像処理装置及び画像処理方法に関する。

　現在、Ｈ．２６４／ＡＶＣよりも符号化効率をさらに向上することを目的として、ＩＴＵ－ＴとＩＳＯ／ＩＥＣとの共同の標準化団体であるＪＣＴＶＣ（Joint　Collaboration　Team-Video　Coding）により、ＨＥＶＣ（High　Efficiency　Video　Coding）と呼ばれる画像符号化方式の標準化が進められている（例えば、非特許文献１参照）。ＨＥＶＣは、ＭＰＥＧ２及びＡＶＣ（Advanced　Video　Coding）などの既存の画像符号化方式と同様、シングルレイヤの符号化のみならず、スケーラブル符号化をも提供する。ＨＥＶＣのスケーラブル符号化技術を、ＳＨＶＣ（Scalable　HEVC）ともいう（例えば、非特許文献２参照）。

　スケーラブル符号化とは、一般には、粗い画像信号を伝送するレイヤと精細な画像信号を伝送するレイヤとを階層的に符号化する技術をいう。スケーラブル符号化は、典型的には、階層化される属性に応じて、空間スケーラビリティ、時間スケーラビリティ及びＳＮＲ（Signal　to　Noise　Ratio）スケーラビリティという３種類の種別に分類される。空間スケーラビリティでは、空間解像度（あるいはピクチャサイズ）が階層化され、下位レイヤの画像は、アップサンプリングされた後に上位レイヤの画像を符号化し又は復号するために用いられる。時間スケーラビリティでは、フレームレートが階層化される。ＳＮＲスケーラビリティでは、量子化の粗さを変化させることにより、ＳＮ比が階層化される。さらに、標準規格で未だ採用されていないものの、ビット深度スケーラビリティ及びクロマフォーマットスケーラビリティもまた議論されている。

　クロマフォーマットとは、輝度（Ｙ）成分の画素密度に対する色差（Ｃｒ，Ｃｂ）成分の画素密度の比を水平方向及び垂直方向について特定する標識である。クロマフォーマットが４：２：０である場合、水平方向及び垂直方向において、色差成分の画素密度は、輝度成分の画素密度の半分である。クロマフォーマットが４：２：２である場合、水平方向において色差成分の画素密度は輝度成分の画素密度の半分であり、垂直方向において色差成分の画素密度は輝度成分の画素密度に等しい。クロマフォーマットが４：４：４である場合、水平方向及び垂直方向において色差成分の画素密度は輝度成分の画素密度に等しい。クロマフォーマットスケーラビリティでは、このような色差成分の画素密度が階層化される。

Benjamin　Bross,　Woo-Jin　Han,　Gary　J.　Sullivan,　Jens-Rainer　Ohm,　Gary　J.　Sullivan,　Ye-Kui　Wang,　Thomas　Wiegand,　"High　Efficiency　Video　Coding　(HEVC)　text　specification　draft　10　(for　FDIS　&　Consent)"（JCTVC-L1003_v4,　2013年1月14-23日） Jianle　Chen,　el.　al,　"SHVC　Draft　3"（JCTVC-N1008，　2013年7月25-8月2日）

　クロマフォーマットスケーラビリティにおいては、輝度成分の画像は、レイヤ間で再利用可能である。よって、上位レイヤにおいて、輝度成分に関する情報を可能な限り伝送せず、省略可能な処理ステップを省略することで、符号量の低減と処理の高速化とを図ることができる。但し、クロマフォーマットスケーラビリティに固有のロジックを導入することは、実装の複雑さを高め、装置の開発コストを上昇させる。

　従って、クロマフォーマットスケーラビリティをサポートする際に、固有のロジックの追加を抑制しつつ、符号量の低減又は処理の高速化を図ることのできる仕組みが提供されることが望ましい。

　本開示によれば、第１レイヤに基づいてスケーラブル符号化された第２レイヤの符号化ストリームから当該第２レイヤの画像を復号するための所定の処理を実行する処理部と、前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定する判定部と、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のための前記所定の処理を前記処理部にスキップさせる制御部と、を備える画像処理装置が提供される。

　上記画像処理装置は、典型的には、画像を復号する画像復号装置として実現され得る。

　また、本開示によれば、第１レイヤに基づいてスケーラブル符号化された第２レイヤの符号化ストリームから当該第２レイヤの画像を復号するための所定の処理の実行を制御する装置において、前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定することと、判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のための前記所定の処理の実行をスキップさせることと、を含む画像処理方法が提供される。

　また、本開示によれば、第１レイヤに基づいて第２レイヤの画像をスケーラブル符号化するための所定の処理を実行する処理部と、前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定する判定部と、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のために前記処理部により設定されるべき符号化パラメータを最も符号量の小さい値に設定する制御部と、を備える画像処理装置が提供される。

　上記画像処理装置は、典型的には、画像を符号化する画像符号化装置として実現され得る。

　また、本開示によれば、第１レイヤに基づいて第２レイヤの画像をスケーラブル符号化するための所定の処理の実行を制御する装置において、前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定することと、判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のために前記所定の処理において設定されるべき符号化パラメータを最も符号量の小さい値に設定することと、を含む画像処理方法が提供される。

　本開示に係る技術によれば、クロマフォーマットスケーラビリティをサポートする際に、固有のロジックの追加を抑制しつつ、符号量の低減又は処理の高速化を図ることが可能となる。
　なお、上記の効果は必ずしも限定的なものではなく、上記の効果と共に、又は上記の効果に代えて、本明細書に示されたいずれかの効果、又は本明細書から把握され得る他の効果が奏されてもよい。

空間スケーラビリティについて説明するための説明図である。クロマフォーマットスケーラビリティについて説明するための説明図である。クロマフォーマットスケーラビリティに固有のロジックを有するシンタックスの一例を示す説明図である。図３Ａの例と比較して簡略化されたシンタックスの一例を示す説明図である。スケーラブル復号における典型的な処理シーケンスを示す説明図である。画像符号化装置の概略的な構成を示すブロック図である。画像復号装置の概略的な構成を示すブロック図である。一実施形態に係るＥＬ符号化部の構成の一例を示すブロック図である。図７に示したスケーラビリティ制御部の詳細な構成の一例を示すブロック図である。符号化時の概略的な処理の流れの一例を示すフローチャートである。スケーラビリティ種別に応じた符号化処理の制御に関連する処理の流れの一例を示すフローチャートである。一実施形態に係るＥＬ復号部の構成の一例を示すブロック図である。図１１に示したスケーラビリティ制御部の詳細な構成の一例を示すブロック図である。復号時の概略的な処理の流れの一例を示すフローチャートである。スケーラビリティ種別に応じた復号処理の制御に関連する処理の流れの一例を示すフローチャートである。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。スケーラブル符号化の用途の第１の例について説明するための説明図である。スケーラブル符号化の用途の第２の例について説明するための説明図である。スケーラブル符号化の用途の第３の例について説明するための説明図である。マルチビューコーデックについて説明するための説明図である。マルチビューコーデックのための画像符号化装置の概略的な構成を示すブロック図である。マルチビューコーデックのための画像復号装置の概略的な構成を示すブロック図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　また、以下の順序で説明を行う。
　　１．概要
　　　１－１．クロマフォーマットスケーラビリティ
　　　１－２．基本的な原理
　　　１－３．エンコーダの基本的な構成例
　　　１－４．デコーダの基本的な構成例
　　２．ＥＬ符号化部の構成例
　　　２－１．全体的な構成
　　　２－２．スケーラビリティ制御部の構成
　　　２－３．処理の流れ
　　３．ＥＬ復号部の構成例
　　　３－１．全体的な構成
　　　３－２．スケーラビリティ制御部の構成
　　　３－３．処理の流れ
　　４．応用例
　　　４－１．様々な製品への応用
　　　４－２．スケーラブル符号化の様々な用途
　　　４－３．その他
　　５．まとめ

　＜１．概要＞
　　［１－１．クロマフォーマットスケーラビリティ］
　スケーラブル符号化においては、一連の画像をそれぞれ含む複数のレイヤが符号化される。ベースレイヤ（base　layer）は、最初に符号化される、最も粗い画像を表現するレイヤである。ベースレイヤの符号化ストリームは、他のレイヤの符号化ストリームを復号することなく、独立して復号され得る。ベースレイヤ以外のレイヤは、エンハンスメントレイヤ（enhancement　layer）と呼ばれる、より精細な画像を表現するレイヤである。エンハンスメントレイヤの符号化ストリームは、ベースレイヤの符号化ストリームに含まれる情報を用いて符号化される。従って、エンハンスメントレイヤの画像を再現するためには、ベースレイヤ及びエンハンスメントレイヤの双方の符号化ストリームが復号されることになる。スケーラブル符号化において扱われるレイヤの数は、２つ以上のいかなる数であってもよい。３つ以上のレイヤが符号化される場合には、最下位のレイヤがベースレイヤ、残りの複数のレイヤがエンハンスメントレイヤである。より上位のエンハンスメントレイヤの符号化ストリームは、より下位のエンハンスメントレイヤ又はベースレイヤの符号化ストリームに含まれる情報を用いて符号化され及び復号され得る。

　図１は、クロマフォーマットスケーラビリティとの対比のために、空間スケーラビリティについて説明するための説明図である。図１を参照すると、空間スケーラビリティ方式でスケーラブル符号化される３つのレイヤＬ１１、Ｌ１２及びＬ１３が示されている。レイヤＬ１１はベースレイヤであり、レイヤＬ１２及びＬ１３はエンハンスメントレイヤである。レイヤＬ１２のレイヤＬ１１に対する空間解像度の比は、２：１である。レイヤＬ１３のレイヤＬ１１に対する空間解像度の比は、４：１である。なお、ここでの解像度比は一例に過ぎず、例えば１．５：１などの非整数の解像度比が使用されてもよい。空間スケーラビリティにおいては、輝度成分及び色差成分の双方について、エンハンスメントレイヤの空間解像度は、ベースレイヤの空間解像度よりも高い。従って、ベースレイヤの輝度成分の画像は、解像度比に従ってアップサンプリングされた上で、エンハンスメントレイヤの輝度成分のインターレイヤ予測において参照画像として使用され得る。また、エンハンスメントレイヤにおいて原画像と参照画像との間の輝度成分の誤差が直交変換され、量子化され、及び符号化され得る。同様に、ベースレイヤの色差成分の画像は、解像度比に従ってアップサンプリングされた上で、エンハンスメントレイヤの色差成分のインターレイヤ予測において参照画像として使用され得る。また、エンハンスメントレイヤにおいて原画像と参照画像との間の色差成分の誤差が直交変換され、量子化され、及び符号化され得る。インターレイヤ予測のためのアップサンプリングフィルタは、通常、動き補償のための補間フィルタと同様に設計される。動き補償のための補間フィルタは、輝度成分について７タップ又は８タップ、色差成分について４タップのタップ数を有する。

　図２は、クロマフォーマットスケーラビリティについて説明するための説明図である。図２を参照すると、クロマフォーマットスケーラビリティ方式でスケーラブル符号化される３つのレイヤＬ２１、Ｌ２２及びＬ２３が示されている。レイヤＬ２１はベースレイヤであり、レイヤＬ２２及びＬ２３はエンハンスメントレイヤである。レイヤＬ２１、Ｌ２２及びＬ２３の輝度成分の画素密度は、互いに等しい。従って、ベースレイヤの輝度成分の画像は、エンハンスメントレイヤの輝度成分のインターレイヤ予測において参照画像としてそのまま使用可能である。原画像と参照画像との間の輝度成分の誤差は、ベースレイヤにおける符号化誤差（主に、量子化誤差）に等しい。一方、レイヤＬ２１のクロマフォーマットは４：２：０であるため、水平方向及び垂直方向において、色差成分の画素密度は、輝度成分の画素密度の半分である。レイヤＬ２２のクロマフォーマットは４：２：２であるため、水平方向において、色差成分の画素密度は、輝度成分の画素密度の半分である。レイヤＬ２３のクロマフォーマットは４：４：４であるため、水平方向及び垂直方向において、色差成分の画素密度は、輝度成分の画素密度に等しい。よって、ベースレイヤの色差成分の画像は、解像度比に従ってアップサンプリングされた上で、エンハンスメントレイヤの色差成分のインターレイヤ予測において参照画像として使用され得る。また、エンハンスメントレイヤにおいて原画像と参照画像との間の色差成分の誤差が直交変換され、量子化され、及び符号化され得る。

　　［１－２．基本的な原理］
　上述した説明から理解されるように、クロマフォーマットスケーラビリティにおいて、色差成分の符号化処理及び復号処処理は、空間スケーラビリティのケースと同様に実行され得る。一方、輝度成分の画像はレイヤ間でほとんどそのまま再利用可能であるため、エンハンスメントレイヤにおいて輝度成分に関する情報を可能な限り伝送しないことにより、符号量を低減することができる。また、エンハンスメントレイヤにおいて省略可能な処理ステップを省略することで、処理を高速化することができる。但し、例えばエンハンスメントレイヤのシンタックスにクロマフォーマットスケーラビリティに固有のロジックを導入することは、実装の複雑さを高め、装置の開発コストを上昇させる。

　図３Ａは、クロマフォーマットスケーラビリティに固有のロジックを有するシンタックスの一例を示す説明図である。図３Ａの上段にはシンタックスＳＴＸ１が、下段にはシンタックスＳＴＸ１を解釈するためのセマンティクスＳＭＴ１がそれぞれ示されている。シンタックスＳＴＸ１の第１行のパラメータbasic_param_for_lumaは、輝度成分のためのある情報の基礎値を示す。シンタックスＳＴＸ１の第２行はスケーラビリティ種別に依存する条件分岐であり、スケーラビリティ種別がクロマフォーマットスケーラビリティであるか否かが判定される。シンタックスＳＴＸ１の第３行のパラメータdiff_param_for_lumaは、スケーラビリティ種別がクロマフォーマットスケーラビリティでない場合にのみ符号化され、輝度成分のための上記情報の差分値を示す。

　セマンティクスＳＭＴ１に記述されているように、輝度成分のための上記情報の値param_for_lumaは、クロマフォーマットスケーラビリティの場合にはパラメータbasic_param_for_lumaに等しく、そうでない場合にはパラメータbasic_param_for_lumaとパラメータdiff_param_for_lumaとの和に等しい。

　図３Ａの例によれば、クロマフォーマットスケーラビリティをサポートする際、エンハンスメントレイヤにおける輝度成分に関する情報のうちパラメータdiff_param_for_lumaに相当する符号量が低減される。しかし、クロマフォーマットスケーラビリティに固有のロジック（例えば、シンタックスＳＴＸ１の条件分岐）がシンタックスに導入されるため、エンコーダ及びデコーダの双方の実装が複雑化する。その結果、例えば標準仕様への適合性を確認するためのテスト条件が増加するなどの理由によって、装置の開発コストが上昇してしまう。

　図３Ｂは、図３Ａの例と比較して簡略化されたシンタックスの一例を示す説明図である。図３Ｂの上段にはシンタックスＳＴＸ２が、下段にはシンタックスＳＴＸ２を解釈するための２つの例示的なセマンティクスＳＭＴ２ａ及びスＳＭＴ２ｂがそれぞれ示されている。シンタックスＳＴＸ２の第１行のパラメータbasic_param_for_lumaは、輝度成分のためのある情報の基礎値を示す。シンタックスＳＴＸ２の第２行のパラメータdiff_param_for_lumaは、輝度成分のための上記情報の差分値を示す。スケーラビリティ種別がクロマフォーマットスケーラビリティである場合、パラメータdiff_param_for_lumaの値はゼロに拘束されるが、その拘束条件はシンタックスには現れない。

　セマンティクスＳＭＴ２ａの例では、スケーラビリティ種別に関わらず、輝度成分のための上記情報の値param_for_lumaは、パラメータbasic_param_for_lumaとパラメータdiff_param_for_lumaとの和として計算される。セマンティクスＳＭＴ２ｂの例では、輝度成分のための上記情報の値param_for_lumaは、パラメータdiff_param_for_lumaがゼロである場合にはパラメータbasic_param_for_lumaに等しく、そうでない場合にはパラメータbasic_param_for_lumaとパラメータdiff_param_for_lumaとの和に等しい。これら２つのセマンティクスにおいて、結果として導かれる値param_for_lumaは同一である。

　図３Ｂの例によれば、クロマフォーマットスケーラビリティに固有のロジックはシンタックスに導入されない。デコーダは、スケーラビリティ種別を意識することなく、情報を復号することができる。よって、実装は単純化され、装置の開発コストを抑制することが可能となる。例えば、クロマフォーマットスケーラビリティをサポートしていないデコーダの機能を拡張することにより事後的にクロマフォーマットスケーラビリティをサポートすることも容易となる。エンハンスメントレイヤにおける輝度成分に関する情報の符号量は図３Ａの例と比較するとより多いが、可変長符号化によって値ゼロは最も短い符号語に割当てられると期待されるため、符号量の相対的な増加はわずかである。

　なお、図３Ａ及び図３Ｂに示したシンタックス及びセマンティクスは、本開示に係る技術の原理を説明するための単純化された例に過ぎない。上述した原理は、様々な符号化パラメータ及び様々な処理に適用可能である

　図４は、スケーラブル復号における典型的な処理シーケンスを示す説明図である。図４の上段にはベースレイヤのための処理シーケンスが、下段にはエンハンスメントレイヤのための処理シーケンスがそれぞれ示されている。ベースレイヤのための処理シーケンスは、可逆復号処理ＰＲ０１、逆量子化処理ＰＲ０２、逆直交変換処理ＰＲ０３、予測処理ＰＲ０４、加算（再構築）処理ＰＲ０５、及びフィルタリング処理ＰＲ０６を含む。エンハンスメントレイヤのための処理シーケンスは、可逆復号処理ＰＲ１１、逆量子化処理ＰＲ１２、逆直交変換処理ＰＲ１３、予測処理ＰＲ１４、加算（再構築）処理ＰＲ１５、及びフィルタリング処理ＰＲ１６を含む。クロマフォーマットスケーラビリティの場合であっても、ベースレイヤのための処理シーケンスは、他のスケーラビリティ種別の場合と同様に実行され得る。一方、クロマフォーマットスケーラビリティの場合、輝度成分の画像はレイヤ間で再利用可能であるため、エンハンスメントレイヤのための処理シーケンスに含まれるいくつかの処理ステップは省略可能である。

　例えば、ベースレイヤの輝度成分のリコンストラクト画像がそのままエンハンスメントレイヤにおいて使用される場合、インターレイヤ予測の全ての予測誤差をゼロに拘束すれば、変換係数を逆量子化するための逆量子化処理ＰＲ１２、及び逆量子化された変換係数から予測誤差を復元するための逆直交変換処理ＰＲ１３を実行しなくてもよい。フィルタリング処理ＰＲ１６（典型的には、デブロックフィルタリング処理及びサンプル適応オフセット処理を含む）もまた、ベースレイヤにおいてフィルタリング処理ＰＲ０６が実行済みであることから、冗長である。但し、フィルタリング処理ＰＲ１６は、明示的に無効化されない限りは実行されてしまう。そこで、フィルタリング処理ＰＲ１６のような冗長だが通常は省略されない処理は、明示的な条件判定のためのパラメータを採用することにより、当該処理をスキップすることを可能とすることが有益である。ここで採用され得るパラメータとは、例えば、スケーラビリティ種別を識別するパラメータであってもよく、又は省略可能な処理の各々をスキップすべきかを示すパラメータであってもよい。

　　［１－３．エンコーダの基本的な構成例］
　図５は、スケーラブル符号化をサポートする画像符号化装置１０の概略的な構成を示すブロック図である。図５を参照すると、画像符号化装置１０は、ベースレイヤ（ＢＬ）符号化部１ａ、エンハンスメントレイヤ（ＥＬ）符号化部１ｂ、共通メモリ２及び多重化部３を備える。

　ＢＬ符号化部１ａは、ベースレイヤ画像を符号化し、ベースレイヤの符号化ストリームを生成する。ＥＬ符号化部１ｂは、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤの符号化ストリームを生成する。共通メモリ２は、レイヤ間で共通的に利用される情報を記憶する。多重化部３は、ＢＬ符号化部１ａにより生成されるベースレイヤの符号化ストリームと、ＥＬ符号化部１ｂにより生成される１つ以上のエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

　　［１－４．デコーダの基本的な構成例］
　図６は、スケーラブル符号化をサポートする画像復号装置６０の概略的な構成を示すブロック図である。図６を参照すると、画像復号装置６０は、逆多重化部５、ベースレイヤ（ＢＬ）復号部６ａ、エンハンスメントレイヤ（ＥＬ）復号部６ｂ及び共通メモリ７を備える。

　逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及び１つ以上のエンハンスメントレイヤの符号化ストリームに逆多重化する。ＢＬ復号部６ａは、ベースレイヤの符号化ストリームからベースレイヤ画像を復号する。ＥＬ復号部６ｂは、エンハンスメントレイヤの符号化ストリームからエンハンスメントレイヤ画像を復号する。共通メモリ７は、レイヤ間で共通的に利用される情報を記憶する。

　図５に例示した画像符号化装置１０において、ベースレイヤの符号化のためのＢＬ符号化部１ａの構成と、エンハンスメントレイヤの符号化のためのＥＬ符号化部１ｂの構成とは、互いに類似する。ＢＬ符号化部１ａにより生成され又は取得されるいくつかのパラメータ及び画像は、共通メモリ２を用いてバッファリングされ、ＥＬ符号化部１ｂにより再利用され得る。次節以降で、そのようなＥＬ符号化部１ｂの構成のいくつかの実施形態について説明する。

　同様に、図６に例示した画像復号装置６０において、ベースレイヤの復号のためのＢＬ復号部６ａの構成と、エンハンスメントレイヤの復号のためのＥＬ復号部６ｂの構成とは、互いに類似する。ＢＬ復号部６ａにより生成され又は取得されるいくつかのパラメータ及び画像は、共通メモリ７を用いてバッファリングされ、ＥＬ復号部６ｂにより再利用され得る。次節以降で、そのようなＥＬ復号部６ｂの構成のいくつかの実施形態についても説明する。

　＜２．ＥＬ符号化部の構成例＞
　　［２－１．全体的な構成］
　図７は、一実施形態に係るＥＬ符号化部１ｂの構成の一例を示すブロック図である。図７を参照すると、ＥＬ符号化部１ｂは、スケーラビリティ制御部１１、並び替えバッファ１２、減算部１３、直交変換部１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、レート制御部１８、逆量子化部２１、逆直交変換部２２、加算部２３、ループフィルタ２４、フレームメモリ２５、セレクタ２６及び２７、イントラ予測部３０、インター予測部３５並びにアップサンプリング部４０を備える。

　スケーラビリティ制御部１１は、ＥＬ符号化部１ｂにおけるエンハンスメントレイヤのためのスケーラブル符号化を制御する。より具体的には、スケーラビリティ制御部１１は、ベースレイヤの属性とエンハンスメントレイヤの属性とを比較することによりスケーラビリティ種別を判定し、判定したスケーラビリティ種別に応じた処理が実行されるようにＥＬ符号化部１ｂの様々な処理部を制御する。スケーラビリティ制御部１１のより詳細な構成の一例について、後にさらに説明する。

　並び替えバッファ１２は、一連の画像データに含まれる画像を並び替える。並び替えバッファ１２は、符号化処理に係るＧＯＰ（Group　of　Pictures）構造に応じて画像を並び替えた後、並び替え後の画像データを減算部１３、イントラ予測部３０、及びインター予測部３５へ出力する。

　減算部１３には、並び替えバッファ１２から入力される画像データ、及び後に説明するイントラ予測部３０又はインター予測部３５から入力される予測画像データが供給される。減算部１３は、並び替えバッファ１２から入力される画像データと予測画像データとの差分である予測誤差データを算出し、算出した予測誤差データを直交変換部１４へ出力する。

　直交変換部１４は、減算部１３から入力される予測誤差データについて直交変換を行う。直交変換部１４により実行される直交変換は、例えば、離散コサイン変換（Discrete　Cosine　Transform：ＤＣＴ）又はカルーネン・レーベ変換などであってよい。ＨＥＶＣにおいて、直交変換は、ＴＵ（変換単位：Transform　Unit）と呼ばれるブロックごとに実行される。直交変換部１４は、直交変換処理により取得される変換係数データを量子化部１５へ出力する。直交変換部１４から出力される輝度成分の変換係数データは、スケーラビリティ制御部１１によりスケーラビリティ種別がクロマフォーマットスケーラビリティであると判定された場合には、変換係数がゼロであることを示すように設定され得る。

　量子化部１５には、直交変換部１４から入力される変換係数データ、及び後に説明するレート制御部１８からのレート制御信号が供給される。レート制御信号は、ブロックごとの各色成分についての量子化パラメータを特定する。また、量子化部１５は、量子化データの周波数成分ごとに異なる量子化ステップを使用する場合、量子化行列を設定する。典型的には、量子化行列設定処理において、ＴＵサイズ、予測モード（イントラ／インター）及び色成分の組合せごとに１つの量子化行列が設定される。そして、量子化部１５は、量子化パラメータ（及び量子化行列）に依存する量子化ステップで変換係数データを量子化し、量子化後の変換係数データ（以下、量子化データという）を可逆符号化部１６及び逆量子化部２１へ出力する。また、量子化部１５は、設定した量子化行列を特定する量子化行列情報を生成し、生成した量子化行列情報を可逆符号化部１６へ出力する。量子化行列情報は、過去に符号化された量子化行列をコピーし、又は行列の要素をスキャンしながら差分符号化することにより、各量子化行列を特定する。輝度成分についての量子化行列情報は、スケーラビリティ制御部１１によりスケーラビリティ種別がクロマフォーマットスケーラビリティであると判定された場合には、最も符号量の小さい値を含むように生成され得る。

　可逆符号化部１６は、量子化部１５から入力される量子化データについて可逆符号化処理を行うことにより、エンハンスメントレイヤの符号化ストリームを生成する。また、可逆符号化部１６は、符号化ストリームを復号する際に参照される様々なパラメータを符号化して、符号化されたパラメータを符号化ストリームのヘッダ領域に挿入する。可逆符号化部１６により符号化されるパラメータは、後に説明するイントラ予測に関する情報及びインター予測に関する情報を含み得る。上述した量子化行列情報もまた、エンハンスメントレイヤにおいて符号化され得る。そして、可逆符号化部１６は、生成した符号化ストリームを蓄積バッファ１７へ出力する。

　また、可逆符号化部１６は、デコーダにスケーラビリティ種別を判定させるためのスケーラビリティ関連情報を符号化する。一例として、スケーラビリティ関連情報は、スケーラビリティ種別を直接的に示す種別情報であってもよい。例えば、非特許文献２によれば、ビデオパラメータセット（ＶＰＳ）の拡張（extension）内で次の表１に示すパラメータが符号化される。パラメータscalability_mask_flag[i]は、インデックスｉに対応するスケーラビリティ種別が有効か否かを示すフラグである。インデックスｉとスケーラビリティ種別とのマッピングは、表２のように定義されている。

　即ち、最新のＳＨＶＣの仕様では、空間スケーラビリティ又はＳＮＲスケーラビリティが有効である場合、パラメータscalability_mask_flag[2]が真（True）を示すように符号化される。クロマフォーマットスケーラビリティが有効であることを示すためのインデックスは未だ定義されていないが、将来の使用のために予約された３から１５までの範囲内のいずれかのインデックスｉ_chromaをクロマフォーマットスケーラビリティにマッピングすることにより、パラメータscalability_mask_flag[ｉ_chroma]をクロマフォーマットスケーラビリティのための種別情報として使用することができる。

　他の例として、スケーラビリティ関連情報は、クロマフォーマットを識別するクロマフォーマット識別情報であってもよい。ベースレイヤのクロマフォーマットを識別するクロマフォーマット識別情報は、ＢＬ符号化部１ａにより、例えばベースレイヤのシーケンスパラメータセット（ＳＰＳ）内へ符号化される。一方、ＢＬ符号化部１ｂの可逆符号化部１６は、エンハンスメントレイヤのクロマフォーマットを識別するクロマフォーマット識別情報を、エンハンスメントレイヤのＳＰＳ内へ符号化する。例えば、非特許文献１によれば、ＳＰＳ内で次の表１に示すパラメータが符号化される。

　パラメータchroma_format_idcは、クロマフォーマットを識別するインデックスである。レイヤ間でパラメータchroma_format_idcの値を比較することにより、クロマフォーマットスケーラビリティが有効か否かを判定することができる。パラメータpic_width_in_luma_samples及びpic_height_in_luma_samplesは、輝度成分のピクチャサイズを特定するパラメータである。パラメータpic_width_in_luma_samples及びpic_height_in_luma_samplesにより特定されるピクチャサイズをレイヤ間で比較することにより、空間スケーラビリティが有効か否かを判定することができる。パラメータscalability_mask_flag[2]が真（True）であってレイヤ間でピクチャサイズが等しい場合には、ＳＮＲスケーラビリティが有効である。なお、クロマフォーマットスケーラビリティは、空間スケーラビリティの一種であるものとして扱われてもよい。

　蓄積バッファ１７は、可逆符号化部１６から入力される符号化ストリームを半導体メモリなどの記憶媒体を用いて一時的に蓄積する。そして、蓄積バッファ１７は、蓄積した符号化ストリームを、伝送路の帯域に応じたレートで、図示しない伝送部（例えば、通信インタフェース又は周辺機器との接続インタフェースなど）へ出力する。

　レート制御部１８は、蓄積バッファ１７の空き容量を監視する。そして、レート制御部１８は、蓄積バッファ１７の空き容量に応じてレート制御信号を生成し、生成したレート制御信号を量子化部１５へ出力する。例えば、レート制御部１８は、蓄積バッファ１７の空き容量が少ない時には、量子化データのビットレートを低下させるためのレート制御信号を生成する。また、例えば、レート制御部１８は、蓄積バッファ１７の空き容量が十分大きい時には、量子化データのビットレートを高めるためのレート制御信号を生成する。

　逆量子化部２１、逆直交変換部２２及び加算部２３は、ローカルデコーダを構成する。逆量子化部２１は、量子化部１５により使用されたものと同じ量子化ステップで、エンハンスメントレイヤの量子化データを逆量子化し、変換係数データを復元する。そして、逆量子化部２１は、復元した変換係数データを逆直交変換部２２へ出力する。

　逆直交変換部２２は、逆量子化部２１から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを復元する。直交変換と同様、逆直交変換は、ＴＵごとに実行される。変換係数が全てゼロである場合には、予測誤差データも全ての予測誤差がゼロであることを示す。そして、逆直交変換部２２は、復元した予測誤差データを加算部２３へ出力する。

　加算部２３は、逆直交変換部２２から入力される復元された予測誤差データとイントラ予測部３０又はインター予測部３５から入力される予測画像データとを加算することにより、復号画像データ（エンハンスメントレイヤのリコンストラクト画像）を生成する。そして、加算部２３は、生成した復号画像データをループフィルタ２４及びフレームメモリ２５へ出力する。

　ループフィルタ２４は、画質の向上を目的とするフィルタ群を含む。デブロックフィルタ（ＤＦ）は、画像の符号化時に生じるブロック歪みを軽減するフィルタである。サンプル適応オフセット（ＳＡＯ）フィルタは、各画素値に適応的に決定されるオフセット値を加えるフィルタである。ループフィルタ２４は、加算部２３から入力される復号画像データをフィルタリングし、フィルタリング後の復号画像データをフレームメモリ２５へ出力する。スケーラビリティ制御部１１によりスケーラビリティ種別がクロマフォーマットスケーラビリティであると判定された場合には、エンハンスメントレイヤの輝度成分について、デブロックフィルタリング処理及びサンプル適応オフセット処理はスキップされてもよい。

　フレームメモリ２５は、加算部２３から入力されるエンハンスメントレイヤの復号画像データ、ループフィルタ２４から入力されるエンハンスメントレイヤのフィルタリング後の復号画像データ、及びアップサンプリング部４０から入力されるベースレイヤの参照画像データを記憶媒体を用いて記憶する。

　セレクタ２６は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部３０に供給する。また、セレクタ２６は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてインター予測部３５に供給する。さらに、イントラ予測部３０又はインター予測部３５においてインターレイヤ予測が実行される場合、セレクタ２６は、ベースレイヤの参照画像データをイントラ予測部３０又はインター予測部３５へ供給する。

　セレクタ２７は、イントラ予測モードにおいて、イントラ予測部３０から出力されるイントラ予測の結果としての予測画像データを減算部１３へ出力すると共に、イントラ予測に関する情報を可逆符号化部１６へ出力する。また、セレクタ２７は、インター予測モードにおいて、インター予測部３５から出力されるインター予測の結果としての予測画像データを減算部１３へ出力すると共に、インター予測に関する情報を可逆符号化部１６へ出力する。セレクタ２７は、イントラ予測モードとインター予測モードとを、コスト関数値の大きさに応じて切り替える。

　イントラ予測部３０は、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣのＰＵ（予測単位：Prediction　Unit）ごとにイントラ予測処理を行う。例えば、イントラ予測部３０は、予測モードセット内の各候補モードによる予測結果を所定のコスト関数を用いて評価する。次に、イントラ予測部３０は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、イントラ予測部３０は、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。イントラ予測部３０は、エンハンスメントレイヤにおける予測モードセットに、インターレイヤ予測を含めてもよい。イントラ予測部３０は、選択した最適な予測モードを表す予測モード情報を含むイントラ予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。

　インター予測部３５は、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣのＰＵごとにインター予測処理を行う。例えば、インター予測部３５は、予測モードセット内の各候補モードによる予測結果を所定のコスト関数を用いて評価する。次に、インター予測部３５は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、インター予測部３５は、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。インター予測部３５は、エンハンスメントレイヤにおける予測モードセットに、インターレイヤ予測を含めてもよい。インター予測部３５は、選択した最適な予測モードを表す予測モード情報と動き情報とを含むインター予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。動き情報は、動き探索の結果としてＰＵごとに設定される動きベクトルを特定する動きベクトル情報を含む。動きベクトル情報は、スケーラビリティ制御部１１によりスケーラビリティ種別がクロマフォーマットスケーラビリティであると判定された場合には、動きベクトルがゼロであることを示すように設定され得る。

　アップサンプリング部４０は、スケーラビリティ制御部１１による制御の下、共通メモリ２によりバッファリングされるベースレイヤの画像をインターレイヤ予測のための参照画像として取得し、取得した参照画像を必要に応じてアップサンプリングする。例えば、アップサンプリング部４０は、スケーラビリティ制御部１１によりスケーラビリティ種別が空間スケーラビリティであると判定された場合には、輝度成分及び色差成分の双方について、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従って参照画像をアップサンプリングする。また、アップサンプリング部４０は、スケーラビリティ制御部１１によりスケーラビリティ種別がクロマフォーマットスケーラビリティであると判定された場合にも、色差成分について、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従って参照画像をアップサンプリングする。一方、アップサンプリング部４０は、スケーラビリティ制御部１１によりスケーラビリティ種別がクロマフォーマットスケーラビリティであると判定された場合、空間スケーラビリティとの組合せでない限り、輝度成分について参照画像をアップサンプリングしない。アップサンプリング部４０により取得される参照画像は、フレームメモリ２５に格納され、イントラ予測部３０又はインター予測部３５により、インターレイヤ予測において参照され得る。

　　［２－２．スケーラビリティ制御部の構成］
　図８は、図７に示したスケーラビリティ制御部１１の詳細な構成の一例を示すブロック図である。図８を参照すると、スケーラビリティ制御部１１は、種別判定部１１０、シンタックス制御部１２０及び処理制御部１３０を有する。

　　　（１）種別判定部
　種別判定部１１０は、ベースレイヤに対するエンハンスメントレイヤのスケーラビリティ種別を判定する。例えば、種別判定部１１０は、ベースレイヤの空間解像度（又はピクチャサイズ）よりもエンハンスメントレイヤの空間解像度が大きい場合には、スケーラビリティ種別が空間スケーラビリティであると判定する。また、種別判定部１１０は、ベースレイヤのクロマフォーマットよりもエンハンスメントレイヤのクロマフォーマットがより高い色差成分の画素密度を示している場合には、スケーラビリティ種別がクロマフォーマットスケーラビリティであると判定する。なお、空間スケーラビリティ及びクロマフォーマットスケーラビリティは同時に実現されてもよい。しかし、本明細書において輝度成分画像のレイヤ間での再利用に関連して述べる特徴の多くは、空間スケーラビリティとの組み合わせではないクロマフォーマットスケーラビリティに適用される。

　　　（２）シンタックス制御部
　シンタックス制御部１２０は、種別判定部１１０により判定されたエンハンスメントレイヤのスケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、エンハンスメントレイヤの輝度成分のために設定されるべきいくつかの符号化パラメータを、最も符号量の小さい値に設定する。

　一例として、シンタックス制御部１２０は、クロマフォーマットスケーラビリティの場合に、直交変換部１４により輝度成分について実行される直交変換処理において生成される変換係数データを、直交変換の変換係数がゼロであることを示すように設定してもよい。変換係数がゼロであるということは、予測誤差がゼロであることを意味する。デコーダではインターレイヤ予測の予測画像に相当するベースレイヤからの参照画像に予測誤差を加算することにより復号画像が生成されるが、予測誤差がゼロであれば復号画像はベースレイヤからの参照画像のままである。例えば、非特許文献１によれば、ＣＵ内のパラメータcbf_luma[x][y][trafoDepth]は、位置（ｘ，ｙ）及び分割の深さtrafoDepthにおける変換係数の有無を特定する。パラメータcbf_luma[x][y][trafoDepth]がゼロであれば、対応する１つ以上の変換係数は全てゼロである。この場合、個々の変換係数の符号化は省略されるため、エンハンスメントレイヤの符号量を大きく低減することができる。

　他の例として、シンタックス制御部１２０は、クロマフォーマットスケーラビリティの場合に、インター予測部３５により輝度成分について実行されるインター予測処理において生成される動きベクトル情報を、動きベクトルがゼロであることを示すように設定してもよい。エンハンスメントレイヤにおいて同じ時点のベースレイヤの輝度成分の画像を予測画像として再利用する場合には、動きは無いと想定することができるため、動きベクトルがゼロに拘束されても輝度成分の画像の復号に支障はない。動きベクトルを全てゼロに設定することにより、動きベクトル情報の符号量は最小化されるものと期待される。それにより、エンハンスメントレイヤにおける動きベクトル情報の符号量を低減することができる。例えば、非特許文献１によれば、ＰＵ内の動きベクトル情報は次の表４のようなシンタックスを有する。

　また別の例として、シンタックス制御部１２０は、クロマフォーマットスケーラビリティの場合に、量子化部１５により実行される量子化行列設定処理において生成される量子化行列情報のうち、色差成分のために使用されない量子化行列を特定する情報を、最も符号量の小さい値に設定してもよい。例えば、非特許文献１によれば、ＳＰＳ又はＰＰＳ（Picture　Parameter　Set）内で次の表５に示す量子化行列情報が符号化される。なお、表５における変数sizeIdは量子化行列のサイズを識別する識別子であり、“０”（４×４画素）、“１”（８×８画素）、“２”（１６×１６画素）及び“３”（３２×３２画素）のいずれかの値をとる。変数matrixIdは予測モード及び色成分の組合せを識別する識別子であり、表６のように定義されている。

　表５に示したシンタックスにおいて、パラメータscaling_list_pred_mode_flag　[sizeId][matrixId]は、変数sizeId及びmatrixIdに対応する量子化行列が過去に符号化済みの量子化行列のコピーであるかを示すフラグである。当該フラグがゼロであれば、パラメータscaling_list_pred_matrix_id_delta[sizeId][matrixId]により特定される参照量子化行列がコピーされる。そうでなければ、変数sizeId及びmatrixIdに対応する量子化行列の要素が順にスキャンされつつ差分符号化される。エンハンスメントレイヤにおいてベースレイヤの輝度成分の変換係数が全てゼロに拘束される場合には、変換係数の量子化は実質的に実行されない。そのため、輝度成分のみのために使用される量子化行列がどのように定義されても、輝度成分の画像の復号には影響しない。輝度成分のみのために使用される量子化行列とは、表６においてmatrixId＝“０”or”３”、又はsizeId＝“３”によって特定される行列である。これら行列について、例えば表５のシンタックスにおけるパラメータscaling_list_pred_mode_flag[sizeId][matrixId]及びscaling_list_pred_matrix_id_delta[sizeId][matrixId]を共にゼロに設定することにより、量子化行列情報の符号量は最小化されるものと期待される。それにより、エンハンスメントレイヤにおける動きベクトル情報の符号量を低減することができる。

　なお、シンタックス制御部１２０は、種別判定部１１０により判定されたスケーラビリティ種別がクロマフォーマットスケーラビリティと他のスケーラビリティとの組合せである場合には、上述した符号化パラメータの最も符号量の小さい値への設定を行わなくてよい。例えば、クロマフォーマットスケーラビリティと空間スケーラビリティ又はＳＮＲスケーラビリティが組合せられる場合には、ベースレイヤの輝度成分の画像はそのまま参照画像として再利用されるわけではなく、アップサンプリング又は追加的な予測誤差データの加算が行われ得る。そのため、こうした複合的なスケーラビリティの場合にはここで説明した符号化パラメータの制御を回避することで、デコーダにおいてエンハンスメントレイヤの精細な画像を適切に復号することが可能となる。

　　　（３）処理制御部
　処理制御部１３０は、種別判定部１１０により判定されたスケーラビリティ種別に従って、アップサンプリング部４０によるベースレイヤの参照画像のアップサンプリングを制御する。例えば、処理制御部１３０は、スケーラビリティ種別が空間スケーラビリティである場合に、レイヤ間の解像度比に従って、ベースレイヤの輝度成分及び色差成分の参照画像をアップサンプリング部４０にアップサンプリングさせる。また、処理制御部１３０は、スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、ベースレイヤの色差成分の参照画像をアップサンプリング部４０にアップサンプリングさせる。

　また、処理制御部１３０は、スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、エンハンスメントレイヤの輝度成分のための所定の処理の実行をスキップさせる。ここでの所定の処理は、例えば、ループフィルタ２４におけるデブロックフィルタリング処理を含んでもよい。クロマフォーマットスケーラビリティにおいて、輝度成分の画像がレイヤ間で再利用される場合には、当該画像に対するデブロックフィルタリング処理は既にベースレイヤにおいて実行されている。そのため、エンハンスメントレイヤにおいてデブロックフィルタリング処理をスキップすることにより、冗長な処理の実行を回避し、処理を高速化することができる。特にデブロックフィルタリング処理は画像の全てのブロックにわたるフィルタリング要否の判定及びフィルタ演算のための多大な演算量を要するため、デブロックフィルタリング処理の回避は、符号化処理及び復号処理の全体的な処理速度の向上に大きく寄与し得る。

　また、スキップされる上述した所定の処理は、ループフィルタ２４におけるサンプル適応オフセット処理を含んでもよい。クロマフォーマットスケーラビリティにおいて、輝度成分の画像がレイヤ間で再利用される場合には、当該画像に対するサンプル適応オフセット処理もまた既にベースレイヤにおいて実行されている。そのため、エンハンスメントレイヤにおいてサンプル適応オフセット処理をスキップすることにより、冗長な処理の実行を回避し、処理を高速化することができる。

　なお、ここで言及したデブロックフィルタリング処理及びサンプル適応オフセット処理は、クロマフォーマットスケーラビリティの場合に省略可能な処理の一例に過ぎない。即ち、処理制御部１３０は、スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、エンハンスメントレイヤの輝度成分のための他の処理をスキップさせてもよい。

　シンタックス制御部１２０は、エンハンスメントレイヤの輝度成分についてデブロックフィルタリング処理及びサンプル適応オフセット処理がスキップされるべきことを明示的に示すパラメータを生成してもよい。例えば、非特許文献１によれば、スライスヘッダ内でパラメータslice_sao_luma_flagが符号化される。シンタックス制御部１２０は、このパラメータの値を偽（False）に設定することにより、デコーダにおいてサンプル適応オフセット処理を無効化することができる。また、当該パラメータと同等の役割を有する符号化パラメータが、ＶＰＳ、ＳＰＳ若しくはＰＰＳ又はその拡張において追加的に採用されてもよい。

　なお、非特許文献１によれば、最新のＨＥＶＣの仕様において、ＰＰＳ内で符号化されるパラメータpps_disable_deblocking_filter_flag及びスライスヘッダ内で符号化されるパラメータslice_disable_deblocking_filter_flagを用いて、輝度成分及び色差成分の双方について共通的にデブロックフィルタリング処理を無効化することはできる。このシンタックスを改変し、輝度成分のみのための同様のフラグを採用することにより、デコーダにおいて輝度成分のみについてデブロックフィルタリング処理を無効化することが可能となる。また、輝度成分のみのための同様のフラグに相当する符号化パラメータが、ＶＰＳ若しくはＳＰＳ又はその拡張において追加的に採用されてもよい。その代わりに、デコーダ側で、これらフラグの値に関わらず、スケーラビリティ種別の判定結果に基づいて輝度成分についてのデブロックフィルタリング処理が無効化されてもよい。

　　［２－３．処理の流れ］
　　　（１）概略的な流れ
　図９は、符号化時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

　図９を参照すると、まず、ＢＬ符号化部１ａは、ベースレイヤの符号化処理を実行し、ベースレイヤの符号化ストリームを生成する（ステップＳ１１）。

　共通メモリ２は、ベースレイヤの符号化処理において生成されるベースレイヤの画像及びいくつかのパラメータ（例えば、ピクチャサイズ情報及びクロマフォーマット識別情報）をバッファリングする（ステップＳ１２）。

　次に、ＥＬ符号化部１ｂは、エンハンスメントレイヤの符号化処理を実行し、エンハンスメントレイヤの符号化ストリームを生成する（ステップＳ１３）。ここで実行されるエンハンスメントレイヤの符号化処理は、スケーラビリティ種別に依存して異なる。共通メモリ２によりバッファリングされているベースレイヤの画像は、インターレイヤ予測において参照画像として使用される。

　次に、多重化部３は、ＢＬ符号化部１ａにより生成されるベースレイヤの符号化ストリームと、ＥＬ符号化部１ｂにより生成されるエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する（ステップＳ１４）。

　　　（２）スケーラビリティ種別に応じた制御
　図１０は、スケーラビリティ種別に応じた符号化処理の制御に関連する処理の流れの一例を示すフローチャートである。

　図１０を参照すると、まず、種別判定部１１０は、ベースレイヤに対するエンハンスメントレイヤのスケーラビリティ種別を判定する（ステップＳ２１）。その後の処理は、判定されたスケーラビリティ種別がクロマフォーマットスケーラビリティであるか否かに依存して分岐する（ステップＳ２３）。

　種別判定部１１０により判定されたスケーラビリティ種別がクロマフォーマットスケーラビリティではない場合には、スケーラビリティ制御部１１は、ＥＬ符号化部１ｂに、通常のエンハンスメントレイヤの符号化処理を実行させる（ステップＳ２５）。

　種別判定部１１０により判定されたスケーラビリティ種別がクロマフォーマットスケーラビリティである場合の符号化処理は、処理対象の色成分が輝度成分であるか否かに依存して分岐する（ステップＳ２７）。処理対象の色成分が輝度成分である場合、アップサンプリング部４０は、共通メモリ２によりバッファリングされるベースレイヤの輝度成分の画像を参照画像として取得する（ステップＳ３１）。処理制御部１３０は、アップサンプリング部４０にベースレイヤの輝度成分の画像のアップサンプリングを実行させない。次に、処理制御部１３０は、エンハンスメントレイヤの輝度成分のための冗長な処理をスキップさせつつ、ＥＬ符号化部１ｂに、輝度成分のための符号化処理を実行させる（ステップＳ３３）。ここでの冗長な処理は、例えば、ループフィルタ２４におけるデブロックフィルタリング処理及びサンプル適応オフセット処理のうち少なくとも１つを含み得る。次に、シンタックス制御部１２０は、エンハンスメントレイヤの輝度成分のためのいくつかの符号化パラメータを、最も符号量の小さい値に設定する（ステップＳ３５）。ここでの符号化パラメータは、変換係数データ、動きベクトル情報及び量子化行列情報のうち少なくとも１つを含み得る。

　一方、スケーラビリティ種別がクロマフォーマットスケーラビリティであって、処理対象の色成分が色差成分である場合、アップサンプリング部４０は、共通メモリ２によりバッファリングされるベースレイヤの色差成分の画像を参照画像として取得し、取得した参照画像をアップサンプリングする（ステップＳ３７）。そして、スケーラビリティ制御部１１は、ＥＬ符号化部１ｂに、エンハンスメントレイヤの色差成分の符号化処理を実行させる（ステップＳ３９）。

　上述したエンハンスメントレイヤの符号化処理は、輝度成分及び２つの色差成分について符号化が終了するまで繰り返される（ステップＳ４１）。そして、輝度成分及び２つの色差成分について符号化が終了すると、図１０に示したフローチャートは終了する。

　＜３．ＥＬ復号部の構成例＞
　　［３－１．全体的な構成］
　図１１は、一実施形態に係るＥＬ復号部６ｂの構成の一例を示すブロック図である。図１１を参照すると、ＥＬ復号部６ｂは、蓄積バッファ５９、スケーラビリティ制御部６１、可逆復号部６２、逆量子化部６３、逆直交変換部６４、加算部６５、ループフィルタ６６、並び替えバッファ６７、Ｄ／Ａ（Digital　to　Analogue）変換部６８、フレームメモリ６９、セレクタ７０及び７１、イントラ予測部８０、インター予測部８５並びにアップサンプリング部９０を備える。

　蓄積バッファ５９は、逆多重化部５から入力されるエンハンスメントレイヤの符号化ストリームを記憶媒体を用いて一時的に蓄積する。

　スケーラビリティ制御部６１は、ＥＬ復号部６ｂにおけるエンハンスメントレイヤのためのスケーラブル復号を制御する。より具体的には、スケーラビリティ制御部６１は、ベースレイヤに対するエンハンスメントレイヤのスケーラビリティ種別を判定し、判定したスケーラビリティ種別に応じた処理が実行されるようにＥＬ復号部６ｂの様々な処理部を制御する。スケーラビリティ制御部６１のより詳細な構成の一例について、後にさらに説明する。

　可逆復号部６２は、蓄積バッファ５９から入力されるエンハンスメントレイヤの符号化ストリームから、符号化の際に使用された符号化方式に従ってエンハンスメントレイヤの量子化データを復号する。また、可逆復号部６２は、符号化ストリームのヘッダ領域に挿入されている情報を復号する。可逆復号部６２により復号される情報は、例えば、イントラ予測に関する情報及びインター予測に関する情報を含み得る。スケーラビリティ制御部６１がスケーラビリティ種別を判定するために使用するスケーラビリティ関連情報もまた、可逆復号部６２により復号され得る。上述したように、スケーラビリティ関連情報は、スケーラビリティ種別を直接的に示す種別情報を含んでもよい。また、スケーラビリティ関連情報は、ピクチャサイズ情報、及びクロマフォーマットを識別するクロマフォーマット識別情報を含んでもよい。可逆復号部６２は、量子化データを逆量子化部６３へ出力する。また、可逆復号部６２は、イントラ予測に関する情報をイントラ予測部８０へ出力する。また、可逆復号部６２は、インター予測に関する情報をインター予測部８５へ出力する。また、可逆復号部６２は、スケーラビリティ関連情報をスケーラビリティ制御部６１へ出力する。

　逆量子化部６３は、可逆復号部６２から入力される量子化データを、符号化の際に使用されたものと同じ量子化ステップ（又は同じ量子化行列）で逆量子化し、エンハンスメントレイヤの変換係数データを復元する。そして、逆量子化部６３は、復元した変換係数データを逆直交変換部６４へ出力する。スケーラビリティ種別がクロマフォーマットスケーラビリティの場合、ＥＬ符号化部１ｂにより符号化された輝度成分の量子化データは、全ての変換係数がゼロであることを示し得る。この場合、逆量子化部６３は、逆量子化処理を実質的に実行しなくてよい。また、スケーラビリティ種別がクロマフォーマットスケーラビリティの場合、可逆復号部６２により復号される量子化行列情報は、輝度成分のみのための量子化行列を、最小の符号量しか要しない値で特定し得る。実際には、この輝度成分のみのための量子化行列は、逆量子化部６３による逆量子化処理において使用されない。

　逆直交変換部６４は、符号化の際に使用された直交変換方式に従い、逆量子化部６３から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを生成する。そして、逆直交変換部６４は、生成した予測誤差データを加算部６５へ出力する。スケーラビリティ種別がクロマフォーマットスケーラビリティの場合、輝度成分の変換係数データは、全ての変換係数がゼロ（即ち、予測誤差がゼロ）であることを示し得る。この場合、逆直交変換部６４は、逆直交変換処理を実質的に実行しなくてよい。

　加算部６５は、逆直交変換部６４から入力される予測誤差データと、セレクタ７１から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部６５は、生成した復号画像データをループフィルタ６６及びフレームメモリ６９へ出力する。

　ループフィルタ６６は、ＥＬ符号化部１ｂのループフィルタ２４と同様、ブロック歪みを軽減するデブロックフィルタ及び各画素値にオフセット値を加えるサンプル適応オフセットフィルタを含み得る。ループフィルタ６６は、加算部６５から入力される復号画像データをフィルタリングし、フィルタリング後の復号画像データを並び替えバッファ６７及びフレームメモリ６９へ出力する。スケーラビリティ種別がクロマフォーマットスケーラビリティの場合、エンハンスメントレイヤの輝度成分について、デブロックフィルタリング処理及びサンプル適応オフセット処理はスキップされる。ループフィルタ６６は、エンハンスメントレイヤの輝度成分についてデブロックフィルタリング処理がスキップされるべきことを明示的に示すパラメータに従って、デブロックフィルタリング処理をスキップしてもよい。同様に、ループフィルタ６６は、エンハンスメントレイヤの輝度成分についてサンプル適応オフセット処理がスキップされるべきことを明示的に示すパラメータに従って、サンプル適応オフセット処理をスキップしてもよい。

　並び替えバッファ６７は、ループフィルタ６６から入力される画像を並び替えることにより、時系列の一連の画像データを生成する。そして、並び替えバッファ６７は、生成した画像データをＤ／Ａ変換部６８へ出力する。

　Ｄ／Ａ変換部６８は、並び替えバッファ６７から入力されるデジタル形式の画像データをアナログ形式の画像信号に変換する。そして、Ｄ／Ａ変換部６８は、例えば、画像復号装置６０と接続されるディスプレイ（図示せず）にアナログ画像信号を出力することにより、エンハンスメントレイヤの画像を表示させる。

　フレームメモリ６９は、加算部６５から入力されるフィルタリング前の復号画像データ、ループフィルタ６６から入力されるフィルタリング後の復号画像データ、及びアップサンプリング部９０から入力されるベースレイヤの参照画像データを記憶媒体を用いて記憶する。

　セレクタ７０は、可逆復号部６２により取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ６９からの画像データの出力先をイントラ予測部８０とインター予測部８５との間で切り替える。例えば、セレクタ７０は、イントラ予測モードが指定された場合には、フレームメモリ６９から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部８０へ出力する。また、セレクタ７０は、インター予測モードが指定された場合には、フィルタリング後の復号画像データを参照画像データとしてインター予測部８５へ出力する。さらに、イントラ予測部８０又はインター予測部８５においてインターレイヤ予測が実行される場合、セレクタ７０は、ベースレイヤの参照画像データをイントラ予測部８０又はインター予測部８５へ供給する。

　セレクタ７１は、可逆復号部６２により取得されるモード情報に応じて、加算部６５へ供給すべき予測画像データの出力元をイントラ予測部８０とインター予測部８５との間で切り替える。例えば、セレクタ７１は、イントラ予測モードが指定された場合には、イントラ予測部８０から出力される予測画像データを加算部６５へ供給する。また、セレクタ７１は、インター予測モードが指定された場合には、インター予測部８５から出力される予測画像データを加算部６５へ供給する。

　イントラ予測部８０は、可逆復号部６２から入力されるイントラ予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤのイントラ予測処理を行い、予測画像データを生成する。イントラ予測処理は、ＰＵごとに実行される。イントラ予測部８０は、イントラ予測モードとしてインターレイヤ予測に相当するモードが指定された場合には、ベースレイヤの参照画像データを参照する。イントラ予測部８０は、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。

　インター予測部８５は、可逆復号部６２から入力されるインター予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤのインター予測処理（動き補償処理）を行い、予測画像データを生成する。インター予測処理は、ＰＵごとに実行される。インター予測部８５は、インター予測モードとしてインターレイヤ予測に相当するモードが指定された場合には、ベースレイヤの参照画像データを参照する。インター予測部８５は、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。スケーラビリティ種別がクロマフォーマットスケーラビリティの場合、インター予測において使用される輝度成分についての動きベクトル情報は、動きベクトルがゼロであることを示し得る。この場合、インター予測部８５は、インターレイヤ予測において、ベースレイヤの輝度成分の参照画像をそのままエンハンスメントレイヤの予測画像として使用し得る。

　アップサンプリング部９０は、スケーラビリティ制御部６１による制御の下、共通メモリ７によりバッファリングされるベースレイヤの画像をインターレイヤ予測のための参照画像として取得し、取得した参照画像を必要に応じてアップサンプリングする。例えば、アップサンプリング部９０は、スケーラビリティ種別が空間スケーラビリティであると判定された場合には、輝度成分及び色差成分の双方について、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従って参照画像をアップサンプリングする。また、アップサンプリング部９０は、スケーラビリティ種別がクロマフォーマットスケーラビリティであると判定された場合にも、色差成分について、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従って参照画像をアップサンプリングする。一方、アップサンプリング部９０は、スケーラビリティ種別がクロマフォーマットスケーラビリティであると判定された場合、空間スケーラビリティとの組合せでない限り、輝度成分について参照画像をアップサンプリングしない。アップサンプリング部９０により取得される参照画像は、
フレームメモリ６９に格納され、イントラ予測部８０又はインター予測部８５により、インターレイヤ予測において参照画像として使用され得る。

　　［３－２．スケーラビリティ制御部の構成］
　図１２は、図１１に示したスケーラビリティ制御部６１の詳細な構成の一例を示すブロック図である。図１２を参照すると、スケーラビリティ制御部６１は、種別判定部１６０及び処理制御部１７０を有する。

　　　（１）種別判定部
　種別判定部１６０は、可逆復号部６２により復号されるスケーラビリティ関連情報に基づいて、ベースレイヤに対するエンハンスメントレイヤのスケーラビリティ種別を判定する。例えば、種別判定部１６０は、スケーラビリティ種別を直接的に示す種別情報に基づいて、スケーラビリティ種別を判定してもよい。ここでの種別情報は、例えば、ＶＰＳの拡張から復号される上述したフラグのセットscalability_mask_flag[i]であってもよい。それに加えて又はその代わりに、種別判定部１６０は、ベースレイヤのクロマフォーマット識別情報とエンハンスメントレイヤのクロマフォーマット識別情報とを比較することにより、エンハンスメントレイヤのスケーラビリティ種別を判定してもよい。クロマフォーマット識別情報は、例えば、各レイヤのＳＰＳから復号され得る。

　　　（２）処理制御部
　処理制御部１７０は、種別判定部１６０により判定されたスケーラビリティ種別に従って、アップサンプリング部９０によるベースレイヤの参照画像のアップサンプリングを制御する。例えば、処理制御部１７０は、スケーラビリティ種別が空間スケーラビリティである場合に、レイヤ間の解像度比に従って、ベースレイヤの輝度成分及び色差成分の参照画像をアップサンプリング部９０にアップサンプリングさせる。また、処理制御部１７０は、スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、ベースレイヤの色差成分の参照画像をアップサンプリング部９０にアップサンプリングさせる。

　また、処理制御部１７０は、スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、エンハンスメントレイヤの輝度成分のための所定の処理の実行をスキップさせる。ここでの所定の処理は、例えば、ループフィルタ６６におけるデブロックフィルタリング処理を含んでもよい。また、スキップされる所定の処理は、ループフィルタ６６におけるサンプル適応オフセット処理を含んでもよい。これら処理をスキップすることにより、冗長な処理の実行を回避し、処理を高速化することができる。なお、かかる例に限定されず、処理制御部１７０は、スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、エンハンスメントレイヤの輝度成分のための、デブロックフィルタリング処理及びサンプル適応オフセット処理以外の処理をスキップさせてもよい。処理制御部１７０は、種別判定部１６０により判定されたスケーラビリティ種別がクロマフォーマットスケーラビリティと他のスケーラビリティとの組合せである場合には、エンハンスメントレイヤの輝度成分のための上述した所定の処理の実行をスキップさせなくてもよい。

　　［３－３．処理の流れ］
　　　（１）概略的な流れ
　図１３は、復号時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

　図１３を参照すると、まず、逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームに逆多重化する（ステップＳ６０）。

　次に、ＢＬ復号部６ａは、ベースレイヤの復号処理を実行し、ベースレイヤの符号化ストリームからベースレイヤ画像を再構築する（ステップＳ６１）。

　共通メモリ７は、ベースレイヤの復号処理において生成されるベースレイヤの画像及びいくつかのパラメータ（例えば、ピクチャサイズ情報及びクロマフォーマット識別情報）をバッファリングする（ステップＳ６２）。

　次に、ＥＬ復号部６ｂは、エンハンスメントレイヤの復号処理を実行し、エンハンスメントレイヤ画像を再構築する（ステップＳ６３）。ここで実行されるエンハンスメントレイヤの復号処理は、スケーラビリティ種別に依存して異なる。共通メモリ７によりバッファリングされているベースレイヤの画像は、インターレイヤ予測において参照画像として使用される。

　　　（２）スケーラビリティ種別に応じた制御
　図１４は、スケーラビリティ種別に応じた復号処理の制御に関連する処理の流れの一例を示すフローチャートである。

　図１４を参照すると、まず、種別判定部１６０は、ベースレイヤに対するエンハンスメントレイヤのスケーラビリティ種別を判定する（ステップＳ７１）。その後の処理は、判定されたスケーラビリティ種別がクロマフォーマットスケーラビリティであるか否かに依存して分岐する（ステップＳ７３）。

　種別判定部１６０により判定されたスケーラビリティ種別がクロマフォーマットスケーラビリティではない場合には、スケーラビリティ制御部１１は、ＥＬ復号部６ｂに、通常のエンハンスメントレイヤの復号処理を実行させる（ステップＳ７５）。

　種別判定部１６０により判定されたスケーラビリティ種別がクロマフォーマットスケーラビリティである場合の復号処理は、処理対象の色成分が輝度成分であるか否かに依存して分岐する（ステップＳ７７）。処理対象の色成分が輝度成分である場合、アップサンプリング部９０は、共通メモリ７によりバッファリングされるベースレイヤの輝度成分の画像を参照画像として取得する（ステップＳ８１）。処理制御部１７０は、アップサンプリング部９０にベースレイヤの輝度成分の画像のアップサンプリングを実行させない。次に、処理制御部１７０は、エンハンスメントレイヤの輝度成分のための冗長な処理をスキップさせつつ、ＥＬ復号部６ｂに、輝度成分のための復号処理を実行させる（ステップＳ８３）。ここでの冗長な処理は、例えば、ループフィルタ６６におけるデブロックフィルタリング処理及びサンプル適応オフセット処理のうち少なくとも１つを含み得る。

　一方、スケーラビリティ種別がクロマフォーマットスケーラビリティであって、処理対象の色成分が色差成分である場合、アップサンプリング部９０は、共通メモリ７によりバッファリングされるベースレイヤの色差成分の画像を参照画像として取得し、取得した参照画像をアップサンプリングする（ステップＳ８７）。そして、スケーラビリティ制御部１１は、ＥＬ復号部６ｂに、エンハンスメントレイヤの色差成分の復号処理を実行させる（ステップＳ８９）。

　上述したエンハンスメントレイヤの復号処理は、輝度成分及び２つの色差成分について復号が終了するまで繰り返される（ステップＳ９１）。そして、輝度成分及び２つの色差成分について復号が終了すると、図１４に示したフローチャートは終了する。

　＜４．応用例＞
　　［４－１．様々な製品への応用］
　上述した実施形態に係る画像符号化装置１０及び画像復号装置６０は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

　　　（１）第１の応用例
　図１５は、テレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース９０９、制御部９１０、ユーザインタフェース９１１、及びバス９１２を備える。

　チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

　デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからＥＰＧ（Electronic　Program　Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

　デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

　映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのＧＵＩ（Graphical　User　Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

　表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はＯＬＥＤなど）の映像面上に映像又は画像を表示する。

　音声信号処理部９０７は、デコーダ９０４から入力される音声データについてＤ／Ａ変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

　外部インタフェース９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

　制御部９１０は、ＣＰＵ（Central　Processing　Unit）などのプロセッサ、並びにＲＡＭ（Random　Access　Memory）及びＲＯＭ（Read　Only　Memory）などのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、プログラムデータ、ＥＰＧデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

　ユーザインタフェース９１１は、制御部９１０と接続される。ユーザインタフェース９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

　バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース９０９及び制御部９１０を相互に接続する。

　このように構成されたテレビジョン装置９００において、デコーダ９０４は、画像復号装置６０の機能を有する。よって、テレビジョン装置９００は、少ない開発コストで、高い符号化効率又は高速化された処理と共に、クロマフォーマットスケーラビリティをサポートすることができる。

　　　（２）第２の応用例
　図１６は、携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

　アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

　携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

　音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをＡ／Ｄ変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

　記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、ＲＡＭ又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

　また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９の記憶媒体に記憶させる。

　また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　このように構成された携帯電話機９２０において、画像処理部９２７は、画像符号化装置１０及び画像復号装置６０の機能を有する。よって、携帯電話機９２０は、少ない開発コストで、高い符号化効率又は高速化された処理と共に、クロマフォーマットスケーラビリティをサポートすることができる。

　　　（３）第３の応用例
　図１７は、記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

　記録再生装置９４０は、チューナ９４１、外部インタフェース９４２、エンコーダ９４３、ＨＤＤ（Hard　Disk　Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen　Display）９４８、制御部９４９、及びユーザインタフェース９５０を備える。

　チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送手段としての役割を有する。

　外部インタフェース９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース９４２は、例えば、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース、ＵＳＢインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース９４２は、記録再生装置９４０における伝送手段としての役割を有する。

　エンコーダ９４３は、外部インタフェース９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

　ＨＤＤ９４４は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、ＨＤＤ９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

　ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばＤＶＤディスク（ＤＶＤ－Ｖｉｄｅｏ、ＤＶＤ－ＲＡＭ、ＤＶＤ－Ｒ、ＤＶＤ－ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）又はＢｌｕ－ｒａｙ（登録商標）ディスクなどであってよい。

　セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをＨＤＤ９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、ＨＤＤ９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

　デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをＯＳＤ９４８へ出力する。また、デコーダ９０４は、生成した音声データを外部のスピーカへ出力する。

　ＯＳＤ９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、ＯＳＤ９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を重畳してもよい。

　制御部９４９は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

　ユーザインタフェース９５０は、制御部９４９と接続される。ユーザインタフェース９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

　このように構成された記録再生装置９４０において、エンコーダ９４３は、画像符号化装置１０の機能を有する。また、デコーダ９４７は、画像復号装置６０の機能を有する。よって、記録再生装置９４０は、少ない開発コストで、高い符号化効率又は高速化された処理と共に、クロマフォーマットスケーラビリティをサポートすることができる。

　　　（４）第４の応用例
　図１８は、撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

　撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、制御部９７０、ユーザインタフェース９７１、及びバス９７２を備える。

　光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、及び制御部９７０を相互に接続する。

　光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤ又はＣＭＯＳなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

　信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

　画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、ＯＳＤ９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

　ＯＳＤ９６９は、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を生成して、生成した画像を画像処理部９６４へ出力する。

　外部インタフェース９６６は、例えばＵＳＢ入出力端子として構成される。外部インタフェース９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース９６６は、ＬＡＮ又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース９６６は、撮像装置９６０における伝送手段としての役割を有する。

　メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はＳＳＤ（Solid　State　Drive）のような非可搬性の記憶部が構成されてもよい。

　制御部９７０は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

　ユーザインタフェース９７１は、制御部９７０と接続される。ユーザインタフェース９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

　このように構成された撮像装置９６０において、画像処理部９６４は、画像符号化装置１０及び画像復号装置６０の機能を有する。よって、撮像装置９６０は、少ない開発コストで、高い符号化効率又は高速化された処理と共に、クロマフォーマットスケーラビリティをサポートすることができる。

　　［４－２．スケーラブル符号化の様々な用途］
　上述したスケーラブル符号化の利点は、様々な用途において享受され得る。以下、３つの用途の例について説明する。

　　　（１）第１の例
　第１の例において、スケーラブル符号化は、データの選択的な伝送のために利用される。図１９を参照すると、データ伝送システム１０００は、ストリーム記憶装置１００１及び配信サーバ１００２を含む。配信サーバ１００２は、ネットワーク１００３を介して、いくつかの端末装置と接続される。ネットワーク１００３は、有線ネットワークであっても無線ネットワークであってもよく、又はそれらの組合せであってもよい。図１９には、端末装置の例として、ＰＣ（Personal　Computer）１００４、ＡＶ機器１００５、タブレット装置１００６及び携帯電話機１００７が示されている。

　ストリーム記憶装置１００１は、例えば、画像符号化装置１０により生成される多重化ストリームを含むストリームデータ１０１１を記憶する。多重化ストリームは、ベースレイヤ（ＢＬ）の符号化ストリーム及びエンハンスメントレイヤ（ＥＬ）の符号化ストリームを含む。配信サーバ１００２は、ストリーム記憶装置１００１に記憶されているストリームデータ１０１１を読み出し、読み出したストリームデータ１０１１の少なくとも一部分を、ネットワーク１００３を介して、ＰＣ１００４、ＡＶ機器１００５、タブレット装置１００６、及び携帯電話機１００７へ配信する。

　端末装置へのストリームの配信の際、配信サーバ１００２は、端末装置の能力又は通信環境などの何らかの条件に基づいて、配信すべきストリームを選択する。例えば、配信サーバ１００２は、端末装置が扱うことのできる画質を上回るほど高い画質を有する符号化ストリームを配信しないことにより、端末装置における遅延、オーバフロー又はプロセッサの過負荷の発生を回避してもよい。また、配信サーバ１００２は、高い画質を有する符号化ストリームを配信しないことにより、ネットワーク１００３の通信帯域が占有されることを回避してもよい。一方、配信サーバ１００２は、これら回避すべきリスクが存在しない場合、又はユーザとの契約若しくは何らかの条件に基づいて適切だと判断される場合に、多重化ストリームの全てを端末装置へ配信してもよい。

　図１９の例では、配信サーバ１００２は、ストリーム記憶装置１００１からストリームデータ１０１１を読み出す。そして、配信サーバ１００２は、高い処理能力を有するＰＣ１００４へ、ストリームデータ１０１１をそのまま配信する。また、ＡＶ機器１００５は低い処理能力を有するため、配信サーバ１００２は、ストリームデータ１０１１から抽出されるベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を生成し、ストリームデータ１０１２をＡＶ機器１００５へ配信する。また、配信サーバ１００２は、高い通信レートで通信可能であるタブレット装置１００６へストリームデータ１０１１をそのまま配信する。また、携帯電話機１００７は低い通信レートでしか通信できないため、配信サーバ１００２は、ベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を携帯電話機１００７へ配信する。

　このように多重化ストリームを用いることにより、伝送されるトラフィックの量を適応的に調整することができる。また、個々のレイヤがそれぞれ単独に符号化されるケースと比較して、ストリームデータ１０１１の符号量は削減されるため、ストリームデータ１０１１の全体が配信されるとしても、ネットワーク１００３に掛かる負荷は抑制される。さらに、ストリーム記憶装置１００１のメモリリソースも節約される。

　端末装置のハードウエア性能は、装置ごとに異なる。また、端末装置において実行されるアプリケーションのケイパビリティも様々である。さらに、ネットワーク１００３の通信容量もまた様々である。データ伝送のために利用可能な容量は、他のトラフィックの存在に起因して、時々刻々と変化し得る。そこで、配信サーバ１００２は、ストリームデータの配信を開始する前に、配信先の端末装置との間のシグナリングを通じて、端末装置のハードウエア性能及びアプリケーションケイパビリティなどに関する端末情報と、ネットワーク１００３の通信容量などに関するネットワーク情報とを取得してもよい。そして、配信サーバ１００２は、取得した情報に基づいて、配信すべきストリームを選択し得る。

　なお、復号すべきレイヤの抽出は、端末装置において行われてもよい。例えば、ＰＣ１００４は、受信した多重化ストリームから抽出され復号されるベースレイヤ画像をその画面に表示してもよい。また、ＰＣ１００４は、受信した多重化ストリームからベースレイヤの符号化ストリームを抽出してストリームデータ１０１２を生成し、生成したストリームデータ１０１２を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　図１９に示したデータ伝送システム１０００の構成は一例に過ぎない。データ伝送システム１０００は、いかなる数のストリーム記憶装置１００１、配信サーバ１００２、ネットワーク１００３、及び端末装置を含んでもよい。

　　　（２）第２の例
　第２の例において、スケーラブル符号化は、複数の通信チャネルを介するデータの伝送のために利用される。図２０を参照すると、データ伝送システム１１００は、放送局１１０１及び端末装置１１０２を含む。放送局１１０１は、地上波チャネル１１１１上で、ベースレイヤの符号化ストリーム１１２１を放送する。また、放送局１１０１は、ネットワーク１１１２を介して、エンハンスメントレイヤの符号化ストリーム１１２２を端末装置１１０２へ送信する。

　端末装置１１０２は、放送局１１０１により放送される地上波放送を受信するための受信機能を有し、地上波チャネル１１１１を介してベースレイヤの符号化ストリーム１１２１を受信する。また、端末装置１１０２は、放送局１１０１と通信するための通信機能を有し、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信する。

　端末装置１１０２は、例えば、ユーザからの指示に応じて、ベースレイヤの符号化ストリーム１１２１を受信し、受信した符号化ストリーム１１２１からベースレイヤ画像を復号してベースレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したベースレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　また、端末装置１１０２は、例えば、ユーザからの指示に応じて、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信し、ベースレイヤの符号化ストリーム１１２１とエンハンスメントレイヤの符号化ストリーム１１２２とを多重化することにより多重化ストリームを生成してもよい。また、端末装置１１０２は、エンハンスメントレイヤの符号化ストリーム１１２２からエンハンスメントレイヤ画像を復号してエンハンスメントレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したエンハンスメントレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　上述したように、多重化ストリームに含まれる各レイヤの符号化ストリームは、レイヤごとに異なる通信チャネルを介して伝送され得る。それにより、個々のチャネルに掛かる負荷を分散させて、通信の遅延若しくはオーバフローの発生を抑制することができる。

　また、何らかの条件に応じて、伝送のために使用される通信チャネルが動的に選択されてもよい。例えば、データ量が比較的多いベースレイヤの符号化ストリーム１１２１は帯域幅の広い通信チャネルを介して伝送され、データ量が比較的少ないエンハンスメントレイヤの符号化ストリーム１１２２は帯域幅の狭い通信チャネルを介して伝送され得る。また、特定のレイヤの符号化ストリーム１１２２が伝送される通信チャネルが、通信チャネルの帯域幅に応じて切り替えられてもよい。それにより、個々のチャネルに掛かる負荷をより効果的に抑制することができる。

　なお、図２０に示したデータ伝送システム１１００の構成は一例に過ぎない。データ伝送システム１１００は、いかなる数の通信チャネル及び端末装置を含んでもよい。また、放送以外の用途において、ここで説明したシステムの構成が利用されてもよい。

　　　（３）第３の例
　第３の例において、スケーラブル符号化は、映像の記憶のために利用される。図２１を参照すると、データ伝送システム１２００は、撮像装置１２０１及びストリーム記憶装置１２０２を含む。撮像装置１２０１は、被写体１２１１を撮像することにより生成される画像データをスケーラブル符号化し、多重化ストリーム１２２１を生成する。多重化ストリーム１２２１は、ベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームを含む。そして、撮像装置１２０１は、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給する。

　ストリーム記憶装置１２０２は、撮像装置１２０１から供給される多重化ストリーム１２２１を、モードごとに異なる画質で記憶する。例えば、ストリーム記憶装置１２０２は、通常モードにおいて、多重化ストリーム１２２１からベースレイヤの符号化ストリーム１２２２を抽出し、抽出したベースレイヤの符号化ストリーム１２２２を記憶する。これに対し、ストリーム記憶装置１２０２は、高画質モードにおいて、多重化ストリーム１２２１をそのまま記憶する。それにより、ストリーム記憶装置１２０２は、高画質での映像の記録が望まれる場合にのみ、データ量の多い高画質のストリームを記録することができる。そのため、画質の劣化のユーザへの影響を抑制しながら、メモリリソースを節約することができる。

　例えば、撮像装置１２０１は、監視カメラであるものとする。撮像画像に監視対象（例えば侵入者）が映っていない場合には、通常モードが選択される。この場合、撮像画像は重要でない可能性が高いため、データ量の削減が優先され、映像は低画質で記録される（即ち、ベースレイヤの符号化ストリーム１２２２のみが記憶される）。これに対し、撮像画像に監視対象（例えば、侵入者である被写体１２１１）が映っている場合には、高画質モードが選択される。この場合、撮像画像は重要である可能性が高いため、画質の高さが優先され、映像は高画質で記録される（即ち、多重化ストリーム１２２１が記憶される）。

　図２１の例では、モードは、例えば画像解析結果に基づいて、ストリーム記憶装置１２０２により選択される。しかしながら、かかる例に限定されず、撮像装置１２０１がモードを選択してもよい。後者の場合、撮像装置１２０１は、通常モードにおいて、ベースレイヤの符号化ストリーム１２２２をストリーム記憶装置１２０２へ供給し、高画質モードにおいて、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給してもよい。

　なお、モードを選択するための選択基準は、いかなる基準であってもよい。例えば、マイクロフォンを通じて取得される音声の大きさ又は音声の波形などに応じて、モードが切り替えられてもよい。また、周期的にモードが切り替えられてもよい。また、ユーザがらの指示に応じてモードが切り替えられてもよい。さらに、選択可能なモードの数は、階層化されるレイヤの数を超えない限り、いかなる数であってもよい。

　図２１に示したデータ伝送システム１２００の構成は一例に過ぎない。データ伝送システム１２００は、いかなる数の撮像装置１２０１を含んでもよい。また、監視カメラ以外の用途において、ここで説明したシステムの構成が利用されてもよい。

　　［４－３．その他］
　　　（１）マルチビューコーデックへの応用
　マルチビューコーデックは、マルチレイヤコーデックの一種であり、いわゆる多視点映像を符号化し及び復号するための画像符号化方式である。図２２は、マルチビューコーデックについて説明するための説明図である。図２２を参照すると、３つの視点においてそれぞれ撮影される３つのビューのフレームのシーケンスが示されている。各ビューには、ビューＩＤ（view_id）が付与される。これら複数のビューのうちいずれか１つのビューが、ベースビュー（base　view）に指定される。ベースビュー以外のビューは、ノンベースビューと呼ばれる。図２２の例では、ビューＩＤが“０”であるビューがベースビューであり、ビューＩＤが“１”又は“２”である２つのビューがノンベースビューである。これらビューが階層的に符号化される場合、各ビューがレイヤに相当し得る。図中に矢印で示したように、ノンベースビューの画像は、ベースビューの画像を参照して符号化され及び復号される（他のノンベースビューの画像も参照されてよい）。

　図２３は、マルチビューコーデックをサポートする画像符号化装置１０ｖの概略的な構成を示すブロック図である。図２３を参照すると、画像符号化装置１０ｖは、第１レイヤ符号化部１ｃ、第２レイヤ符号化部１ｄ、共通メモリ２及び多重化部３を備える。

　第１レイヤ符号化部１ｃの機能は、入力としてベースレイヤ画像の代わりにベースビュー画像を受け取ることを除き、図５を用いて説明したＢＬ符号化部１ａの機能と同等である。第１レイヤ符号化部１ｃは、ベースビュー画像を符号化し、第１レイヤの符号化ストリームを生成する。第２レイヤ符号化部１ｄの機能は、入力としてエンハンスメントレイヤ画像の代わりにノンベースビュー画像を受け取ることを除き、図５を用いて説明したＥＬ符号化部１ｂの機能と同等である。第２レイヤ符号化部１ｄは、ノンベースビュー画像を符号化し、第２レイヤの符号化ストリームを生成する。共通メモリ２は、レイヤ間で共通的に利用される情報を記憶する。多重化部３は、第１レイヤ符号化部１ｃにより生成される第１レイヤの符号化ストリームと、第２レイヤ符号化部１ｄにより生成される第２レイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

　図２４は、マルチビューコーデックをサポートする画像復号装置６０ｖの概略的な構成を示すブロック図である。図２４を参照すると、画像復号装置６０ｖは、逆多重化部５、第１レイヤ復号部６ｃ、第２レイヤ復号部６ｄ及び共通メモリ７を備える。

　逆多重化部５は、マルチレイヤの多重化ストリームを第１レイヤの符号化ストリーム及び第２レイヤの符号化ストリームに逆多重化する。第１レイヤ復号部６ｃの機能は、入力としてベースレイヤ画像の代わりにベースビュー画像が符号化された符号化ストリームを受け取ることを除き、図６を用いて説明したＢＬ復号部６ａの機能と同等である。第１レイヤ復号部６ｃは、第１レイヤの符号化ストリームからベースビュー画像を復号する。第２レイヤ復号部６ｄの機能は、入力としてエンハンスメントレイヤ画像の代わりにノンベースビュー画像が符号化された符号化ストリームを受け取ることを除き、図６を用いて説明したＥＬ復号部６ｂの機能と同等である。第２レイヤ復号部６ｄは、第２レイヤの符号化ストリームからノンベースビュー画像を復号する。共通メモリ７は、レイヤ間で共通的に利用される情報を記憶する。

　マルチビューの画像データを符号化し又は復号する際、ビュー間でクロマフォーマットのみが異なる場合には、本開示に係る技術に従って、ビュー間で輝度成分の画像が再利用されてもよい。それにより、マルチビューコーデックにおいても、高い符号化効率又は高速化された処理と共に、クロマフォーマットスケーラビリティをサポートすることができる。

　　　（２）ストリーミング技術への応用
　本開示に係る技術は、ストリーミングプロトコルに適用されてもよい。例えば、ＭＰＥＧ－ＤＡＳＨ（Dynamic　Adaptive　Streaming　over　HTTP）では、解像度などのパラメータが互いに異なる複数の符号化ストリームがストリーミングサーバにおいて予め用意される。そして、ストリーミングサーバは、複数の符号化ストリームからストリーミングすべき適切なデータをセグメント単位で動的に選択し、選択したデータを配信する。このようなストリーミングプロトコルにおいて、クロマフォーマットスケーラビリティが採用される場合に、本開示に係る技術に従って符号量の低減又は処理の高速化が図られてもよい。

　＜５．まとめ＞
　ここまで、図１～図２４を用いて、本開示に係る技術の様々な実施形態について詳細に説明した。上述した実施形態によれば、エンコーダ側で、第１レイヤに基づいて第２レイヤの画像をスケーラブル符号化するための所定の処理が、スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、第２レイヤの輝度成分についてスキップされる。同様に、デコーダ側で、第１レイヤに基づいてスケーラブル符号化された第２レイヤの符号化ストリームから当該第２レイヤの画像を復号するための所定の処理が、スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、第２レイヤの輝度成分についてスキップされる。従って、第２レイヤの復号処理において、既に第１レイヤで実行された処理を冗長的に実行することを回避し、全体としての処理速度を高速化することができる。例えば、デブロックフィルタリング処理は画像の全てのブロックにわたって多大な演算量を要するため、これを回避することで復号処理の処理速度を大きく向上させることができる。サンプル適応オフセット処理についても同様である。

　また、上述した実施形態によれば、スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、第２レイヤの輝度成分のためにエンハンスメントレイヤにおいて設定されるべき符号化パラメータが、最も符号量の小さい値に設定される。ここでの符号化パラメータは、変換係数データ、動きベクトル情報又は量子化行列情報などの、クロマフォーマットスケーラビリティに限らず符号化されるパラメータである。従って、クロマフォーマットスケーラビリティに固有のロジックをシンタックスに導入することなく、輝度成分に関する情報の符号量を低減することができる。それにより、実装の複雑化に起因する装置の開発コストの上昇を抑制しつつ、高い符号化効率と共にクロマフォーマットスケーラビリティをサポートすることが可能となる。

　なお、本明細書に記述したＣＵ、ＰＵ及びＴＵとの用語は、ＨＥＶＣにおいて、個々のブロックに関連付られるシンタックスをも含む論理的な単位を意味する。画像の一部分としての個々のブロックのみに着目する場合、これらは、ＣＢ（Coding　Block）、ＰＢ（Prediction　Block）及びＴＢ（Transform　Block）との用語にそれぞれ置き換えられてもよい。ＣＢは、ＣＴＢ（Coding　Tree　Block）を四分木（Quad-Tree）状に階層的に分割することにより形成される。１つの四分木の全体がＣＴＢに相当し、ＣＴＢに対応する論理的な単位はＣＴＵ（Coding　Tree　Unit）と呼ばれる。ＨＥＶＣにおけるＣＴＢ及びＣＢは、符号化処理の処理単位である点でＨ．２６４／ＡＶＣにおけるマクロブロックに類似する役割を有する。但し、ＣＴＢ及びＣＢは、そのサイズが固定的でない点でマクロブロックと異なる（マクロブロックのサイズは常に１６×１６画素である）。ＣＴＢのサイズは１６×１６画素、３２×３２画素及び６４×６４画素から選択され、符号化ストリーム内でパラメータにより指定される。ＣＢのサイズは、ＣＴＢの分割の深さによって変化し得る。

　また、本明細書では、スケーラビリティの制御に関する情報が、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について主に説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的又は例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果と共に、又は上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏し得る。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　第１レイヤに基づいてスケーラブル符号化された第２レイヤの符号化ストリームから当該第２レイヤの画像を復号するための所定の処理を実行する処理部と、
　前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定する判定部と、
　前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のための前記所定の処理を前記処理部にスキップさせる制御部と、
　を備える画像処理装置。
（２）
　前記所定の処理は、デブロックフィルタリング処理を含む、前記（１）に記載の画像処理装置。
（３）
　前記所定の処理は、サンプル適応オフセット処理を含む、前記（１）又は前記（２）に記載の画像処理装置。
（４）
　前記判定部は、ビデオパラメータセットの拡張から復号される種別情報に基づいて、前記第２レイヤの前記スケーラビリティ種別を判定する、前記（１）～（３）のいずれか１項に記載の画像処理装置。
（５）
　前記判定部は、前記第１レイヤのクロマフォーマット識別情報と前記第２レイヤのクロマフォーマット識別情報とを比較することにより、前記第２レイヤの前記スケーラビリティ種別を判定する、前記（１）～（４）のいずれか１項に記載の画像処理装置。
（６）
　前記制御部は、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別が前記クロマフォーマットスケーラビリティと他のスケーラビリティとの組合せである場合には、前記第２レイヤの前記輝度成分のための前記所定の処理を前記処理部にスキップさせない、前記（１）～（５）のいずれか１項に記載の画像処理装置。
（７）
　第１レイヤに基づいてスケーラブル符号化された第２レイヤの符号化ストリームから当該第２レイヤの画像を復号するための所定の処理の実行を制御する装置において、
　前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定することと、
　判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のための前記所定の処理の実行をスキップさせることと、
　を含む画像処理方法。
（８）
　第１レイヤに基づいて第２レイヤの画像をスケーラブル符号化するための所定の処理を実行する処理部と、
　前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定する判定部と、
　前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のために前記処理部により設定されるべき符号化パラメータを最も符号量の小さい値に設定する制御部と、
　を備える画像処理装置。
（９）
　前記所定の処理は、直交変換処理を含み、
　前記制御部は、直交変換の変換係数がゼロであることを示すように前記符号化パラメータを設定する、
　前記（８）に記載の画像処理装置。
（１０）
　前記所定の処理は、動きベクトルを設定するためのインター予測処理を含み、
　前記制御部は、前記動きベクトルがゼロであることを示すように前記符号化パラメータを設定する、
　前記（８）に記載の画像処理装置。
（１１）
　前記所定の処理は、量子化行列を設定するための量子化行列設定処理を含み、
　前記制御部は、色差成分のために使用されない量子化行列を特定する前記符号化パラメータを最も符号量の小さい値に設定する、
　前記（８）に記載の画像処理装置。
（１２）
　前記制御部は、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、さらに、前記第２レイヤの輝度成分のためのデブロックフィルタリング処理をスキップさせる、前記（８）～（１１）のいずれか１項に記載の画像処理装置。
（１３）
　前記制御部は、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、さらに、前記第２レイヤの輝度成分のためのサンプル適応オフセット処理をスキップさせる、前記（８）～（１２）のいずれか１項に記載の画像処理装置。
（１４）
　前記画像処理装置は、前記第２レイヤの前記スケーラビリティ種別をデコーダに判定させるための種別情報を、ビデオパラメータセットの拡張内へ符号化する符号化部、をさらに備える、前記（８）～（１３）のいずれか１項に記載の画像処理装置。
（１５）
　前記画像処理装置は、記第２レイヤの前記スケーラビリティ種別を判定するためにデコーダにより前記第１レイヤのクロマフォーマット識別情報と比較される前記第２レイヤのクロマフォーマット識別情報を符号化する符号化部、をさらに備える、前記（８）～（１４）のいずれか１項に記載の画像処理装置。
（１６）
　前記制御部は、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別が前記クロマフォーマットスケーラビリティと他のスケーラビリティとの組合せである場合には、前記符号化パラメータの前記最も符号量の小さい値への設定を行わない、前記（８）～（１５）のいずれか１項に記載の画像処理装置。
（１７）
　第１レイヤに基づいて第２レイヤの画像をスケーラブル符号化するための所定の処理の実行を制御する装置において、
　前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定することと、
　判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のために前記所定の処理において設定されるべき符号化パラメータを最も符号量の小さい値に設定することと、
　を含む画像処理方法。

　１０，１０ｖ　　　　画像符号化装置（画像処理装置）
　１１　　　　　　　　スケーラビリティ制御部
　１１０　　　　　　　種別判定部
　１２０　　　　　　　シンタックス制御部
　１３０　　　　　　　処理制御部
　６０，６０ｖ　　　　画像復号装置（画像処理装置）
　６１　　　　　　　　スケーラビリティ制御部
　１６０　　　　　　　種別判定部
　１７０　　　　　　　処理制御部

Claims

　第１レイヤに基づいてスケーラブル符号化された第２レイヤの符号化ストリームから当該第２レイヤの画像を復号するための所定の処理を実行する処理部と、
　前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定する判定部と、
　前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のための前記所定の処理を前記処理部にスキップさせる制御部と、
　を備える画像処理装置。
　前記所定の処理は、デブロックフィルタリング処理を含む、請求項１に記載の画像処理装置。
　前記所定の処理は、サンプル適応オフセット処理を含む、請求項１に記載の画像処理装置。
　前記判定部は、ビデオパラメータセットの拡張から復号される種別情報に基づいて、前記第２レイヤの前記スケーラビリティ種別を判定する、請求項１に記載の画像処理装置。
　前記判定部は、前記第１レイヤのクロマフォーマット識別情報と前記第２レイヤのクロマフォーマット識別情報とを比較することにより、前記第２レイヤの前記スケーラビリティ種別を判定する、請求項１に記載の画像処理装置。
　前記制御部は、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別が前記クロマフォーマットスケーラビリティと他のスケーラビリティとの組合せである場合には、前記第２レイヤの前記輝度成分のための前記所定の処理を前記処理部にスキップさせない、請求項１に記載の画像処理装置。
　第１レイヤに基づいてスケーラブル符号化された第２レイヤの符号化ストリームから当該第２レイヤの画像を復号するための所定の処理の実行を制御する装置において、
　前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定することと、
　判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のための前記所定の処理の実行をスキップさせることと、
　を含む画像処理方法。
　第１レイヤに基づいて第２レイヤの画像をスケーラブル符号化するための所定の処理を実行する処理部と、
　前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定する判定部と、
　前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のために前記処理部により設定されるべき符号化パラメータを最も符号量の小さい値に設定する制御部と、
　を備える画像処理装置。
　前記所定の処理は、直交変換処理を含み、
　前記制御部は、直交変換の変換係数がゼロであることを示すように前記符号化パラメータを設定する、
　請求項８に記載の画像処理装置。
　前記所定の処理は、動きベクトルを設定するためのインター予測処理を含み、
　前記制御部は、前記動きベクトルがゼロであることを示すように前記符号化パラメータを設定する、
　請求項８に記載の画像処理装置。
　前記所定の処理は、量子化行列を設定するための量子化行列設定処理を含み、
　前記制御部は、色差成分のために使用されない量子化行列を特定する前記符号化パラメータを最も符号量の小さい値に設定する、
　請求項８に記載の画像処理装置。
　前記制御部は、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、さらに、前記第２レイヤの輝度成分のためのデブロックフィルタリング処理をスキップさせる、請求項８に記載の画像処理装置。
　前記制御部は、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、さらに、前記第２レイヤの輝度成分のためのサンプル適応オフセット処理をスキップさせる、請求項８に記載の画像処理装置。
　前記画像処理装置は、前記第２レイヤの前記スケーラビリティ種別をデコーダに判定させるための種別情報を、ビデオパラメータセットの拡張内へ符号化する符号化部、をさらに備える、請求項８に記載の画像処理装置。
　前記画像処理装置は、記第２レイヤの前記スケーラビリティ種別を判定するためにデコーダにより前記第１レイヤのクロマフォーマット識別情報と比較される前記第２レイヤのクロマフォーマット識別情報を符号化する符号化部、をさらに備える、請求項８に記載の画像処理装置。
　前記制御部は、前記判定部により判定された前記第２レイヤの前記スケーラビリティ種別が前記クロマフォーマットスケーラビリティと他のスケーラビリティとの組合せである場合には、前記符号化パラメータの前記最も符号量の小さい値への設定を行わない、請求項８に記載の画像処理装置。
　第１レイヤに基づいて第２レイヤの画像をスケーラブル符号化するための所定の処理の実行を制御する装置において、
　前記第１レイヤに対する前記第２レイヤのスケーラビリティ種別を判定することと、
　判定された前記第２レイヤの前記スケーラビリティ種別がクロマフォーマットスケーラビリティである場合に、前記第２レイヤの輝度成分のために前記所定の処理において設定されるべき符号化パラメータを最も符号量の小さい値に設定することと、
　を含む画像処理方法。