WO2014203763A1

WO2014203763A1 - 復号装置および復号方法、並びに、符号化装置および符号化方法

Info

Publication number: WO2014203763A1
Application number: PCT/JP2014/065287
Authority: WO
Inventors: 佐藤　数史
Original assignee: ソニー株式会社
Priority date: 2013-06-21
Filing date: 2014-06-10
Publication date: 2014-12-24
Also published as: JP2015005899A; EP2871846A1; CN104584551A; EP2871846A4; US20150222913A1

Abstract

　本開示は、色域ごとに階層化された画像の符号化効率を向上させることができるようにする復号装置および復号方法、並びに、符号化装置および符号化方法に関する。色域変換部は、ベースレイヤの復号画像の色域をエンハンスメントレイヤの色域に変換する。適応オフセット部は、色域変換後のベースレイヤの復号画像の所定の帯域に対してフィルタ処理を行う。加算部は、フィルタ処理されたベースレイヤの復号画像を用いて、エンハンスメントレイヤの符号化画像を復号し、エンハンスメントレイヤの復号画像を生成する。本開示は、例えば、復号装置に適用することができる。

Description

復号装置および復号方法、並びに、符号化装置および符号化方法

　本開示は、復号装置および復号方法、並びに、符号化装置および符号化方法に関し、特に、色域ごとに階層化された画像の符号化効率を向上させることができるようにした復号装置および復号方法、並びに、符号化装置および符号化方法に関する。

　近年、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEG（Moving Picture Experts Group phase）などの方式に準拠した装置が、放送局などの情報配信、および一般家庭における情報受信の双方において普及しつつある。

　特に、MPEG2（ISO/IEC 13818-2）方式は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに現在広く用いられている。MPEG2方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4乃至8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18乃至22MBpsの符号量（ビットレート）を割り当てることで、高い圧縮率と良好な画質の実現が可能である。

　MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。MPEG4の画像符号化方式に関しては、1998年12月にISO/IEC 14496-2として規格が国際標準に承認された。

　更に、近年、当初テレビ会議用の画像符号化を目的として、H．26L（ITU-T Q6/16 VCEG）という標準の規格化が進んでいる。H．26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。

　また、近年、MPEG4の活動の一環として、このH．26Lをベースに、H．26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われた。この標準化は、2003年3月にH．264及びMPEG-4 Part10（AVC（Advanced Video Coding））という名の元に国際標準化された。

　更に、その拡張として、RGBやYUV422、YUV444といった、業務用に必要な符号化ツールや、MPEG-2で規定されていた8×8DCTや量子化マトリクスをも含んだFRExt (Fidelity Range Extension)の標準化が2005年2月に完了した。これにより、AVC方式が、映画に含まれるフィルムノイズをも良好に表現することが可能な符号化方式となり、ＢＤ（Blu-ray（登録商標） Disc ）等の幅広いアプリケーションに用いられる運びとなった。

　しかしながら、昨今、ハイビジョン画像の4倍の4000×2000画素程度の画像を圧縮したい、または、インターネットのような限られた伝送容量の環境においてハイビジョン画像を配信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、ITU-T傘下のVCEG(Video Coding Expert Group)において、符号化効率の改善に関する検討が継続されている。

　また、現在、AVCより更なる符号化効率の向上を目的として、ITU-Tと、ISO/IECの共同の標準化団体であるJCTVC(Joint Collaboration Team － Video Coding)により、 HEVC(High Efficiency Video Coding)と呼ばれる符号化方式の標準化が進められている。2013年5月現在、Draftとして非特許文献１が発行されている。

　ところで、MPEG-2、AVCといった画像符号化方式は、画像を階層化して符号化するscalable機能を有していた。scalable機能によれば、トランスコード処理を行うことなく、復号側の処理能力に応じた符号化データを伝送することができる。

　具体的には、例えば携帯電話のような処理能力の低い端末に対しては、ベースとなる階層であるベースレイヤ（base layer）の画像の符号化ストリームのみを伝送することができる。一方、テレビジョン受像機やパーソナルコンピュータのような処理能力の高い端末に対しては、ベースレイヤと、ベースレイヤ以外の階層であるエンハンスメントレイヤ（enhancement layer）の画像の符号化ストリームを伝送することができる。

　HEVC方式では、画像を色域で階層化して符号化するscalable機能（以下、色域スケーラビリティという）が提案されている（例えば、非特許文献２参照)。

　色域スケーラビリティにおいては、例えば、ベースレイヤの画像が、1920×1080画素のHD画像の色域BT.709の画像とされ、エンハンスメントレイヤの画像が、UHD(Ultra High Definition)画像の色域として検討されている色域BT.2020の画像とされる。UHD画像は、4000×2000画素程度や8000×4000画素程度の画像であり、ビット深度としては、従来の8ビットではなく、10ビットまたは12ビットが検討されている。

　色域スケーラビリティにおいてエンハンスメントレイヤの画像の符号化時にベースレイヤの復号画像を参照する場合、ベースレイヤの復号画像の色域をエンハンスメントレイヤの色域に変換する必要がある。

　色域変換の方法としては、ベースレイヤとエンハンスメントレイヤの色域の関係の線形近似に基づいて、ベースレイヤの復号画像の画素値をビットシフトする方法、ゲインとオフセットを用いて変換後の画素値を演算する方法などがある。なお、以下では、前者の方法をビットシフト法といい、後者の方法をゲインオフセット法という。

Benjamin Bross,Woo-Jin Han,Jens-Rainer Ohm,Gary J. Sullivan,Ye-Kui Wang,Thomas Wiegand,"High Efficiency Video Coding (HEVC) text specification draft 10", JCTVC-L1003_v34,2013.1.14-1.23 Louis Kerofsky,Andrew Segall,Seung-Hwan Kim,Kiran Misra,"Color Gamut Scalable Video Coding: New Results",JCTVC-L0334,2013.1.14-1.23

　しかしながら、上述した色域変換の方法における線形近似は低域（低輝度）と高域（高輝度）において成立しないため、低域と高域において高精度に色域を変換することができない。その結果、ベースレイヤの画像を参照して生成されるエンハンスメントレイヤの予測画像の精度が悪くなり、符号化効率が低下する。

　本開示は、このような状況に鑑みてなされたものであり、色域ごとに階層化された画像の符号化効率を向上させることができるようにするものである。

　本開示の第１の側面の復号装置は、色域ごとに階層化された画像の第１の階層の符号化画像を受け取る受け取り部と、第２の階層の復号画像の色域を前記第１の階層の色域に変換する色域変換部と、前記色域変換部により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理部と、前記フィルタ処理部によりフィルタ処理された前記第２の階層の復号画像を用いて、前記受け取り部により受け取られた前記第１の階層の符号化画像を復号し、前記第１の階層の復号画像を生成する復号部とを備える復号装置である。

　本開示の第１の側面の復号方法は、本開示の第１の側面の復号装置に対応する。

　本開示の第１の側面においては、色域ごとに階層化された画像の第１の階層の符号化画像が受け取られ、第２の階層の復号画像の色域が前記第１の階層の色域に変換され、変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理が行われ、フィルタ処理された前記第２の階層の復号画像を用いて前記第１の階層の符号化画像が復号され、前記第１の階層の復号画像が生成される。

　本開示の第２の側面の符号化装置は、色域ごとに階層化された画像の第１の階層の画像の符号化に用いる第２の階層の復号画像の色域を、前記第１の階層の色域に変換する色域変換部と、前記色域変換部により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理部と、前記フィルタ処理によりフィルタ処理された前記第２の階層の復号画像を用いて、前記第１の階層の画像を符号化し、前記第１の階層の符号化画像を生成する符号化部と、前記符号化部により生成された前記第１の階層の符号化画像を伝送する伝送部とを備える符号化装置である。

　本開示の第２の側面の符号化方法は、本開示の第２の側面の符号化装置に対応する。

　本開示の第２の側面においては、色域ごとに階層化された画像の第１の階層の画像の符号化に用いる第２の階層の復号画像の色域が、前記第１の階層の色域に変換され、変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理が行われ、フィルタ処理された前記第２の階層の復号画像を用いて、前記第１の階層の画像が符号化されて前記第１の階層の符号化画像が生成され、前記第１の階層の符号化画像が伝送される。

　なお、第１の側面の復号装置及び第２の側面の符号化装置は、コンピュータにプログラムを実行させることにより実現することができる。

　また、第１の側面の復号装置および第２の側面の符号化装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。

　第１の側面の復号装置及び第２の側面の符号化装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

　本開示の第１の側面によれば、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。

　本開示の第２の側面によれば、色域ごとに階層化された画像の符号化効率を向上させることができる。

spatial scalabilityを説明する図である。 temporal scalabilityを説明する図である。 SNR scalabilityを説明する図である。色域BT.709と色域BT.2020を示す図である。従来の色域スケーラブル符号化を説明する図である。中域の色域BT.2020と色域BT.709における輝度信号および色差信号の関係を示す図である。復号側に伝送されるビットシフト法とゲインオフセット法におけるパラメータの数を示す図である。 PPSの一部のシンタックスの例を示す図である。低域や高域の色域BT.2020と色域BT.709における輝度信号および色差信号の関係を示す図である。本開示を適用した符号化装置の一実施の形態の構成例を示すブロック図である。図１０のエンハンスメント符号化部の構成例を示すブロック図である。図１１の符号化部の構成例を示すブロック図である。 CUを説明する図である。図１２の適応オフセット部の構成例を示すブロック図である。バンドオフセット処理を説明する図である。ベース画像のバンドオフセット処理における帯域を示す図である。エッジオフセット処理における隣接画素を説明する図である。エッジオフセット処理におけるカテゴリを説明する図である。オフセット情報のシンタックスの例を示す図である。適応オフセット処理の種類と種類情報の関係を示す図である。図１０の符号化装置の階層符号化処理を説明するフローチャートである。図２１のエンハンスメント符号化処理の詳細を説明するフローチャートである。図２１のエンハンスメント符号化処理の詳細を説明するフローチャートである。図２２の適応オフセット処理の詳細を説明するフローチャートである。本開示を適用した復号装置の一実施の形態の構成例を示すブロック図である。図２５のエンハンスメント復号部の構成例を示すブロック図である。図２６の復号部の構成例を示すブロック図である。図２７の適応オフセット部の構成例を示すブロック図である。図２５の復号装置の階層復号処理を説明するフローチャートである。図２９のエンハンスメント復号処理の詳細を説明するフローチャートである。図３０の適応オフセット処理の詳細を説明するフローチャートである。 Scalable機能による符号化の他の例を示す図である。コンピュータのハードウエアの構成例を示すブロック図である。多視点画像符号化方式の例を示す図である。本技術を適用した多視点画像符号化装置の構成例を示す図である。本技術を適用した多視点画像復号装置の構成例を示す図である。本開示を適用したテレビジョン装置の概略構成例を示す図である。本開示を適用した携帯電話機の概略構成例を示す図である。本開示を適用した記録再生装置の概略構成例を示す図である。本開示を適用した撮像装置の概略構成例を示す図である。スケーラブル符号化利用の一例を示すブロック図である。スケーラブル符号化利用の他の例を示すブロック図である。スケーラブル符号化利用のさらに他の例を示すブロック図である。本技術を適用したビデオセットの概略的な構成の一例を示すブロック図である。本技術を適用したビデオプロセッサの概略的な構成の一例を示すブロック図である。本技術を適用したビデオプロセッサの概略的な構成の他の例を示すブロック図である。コンテンツ再生システムの構成を示した説明図である。コンテンツ再生システムにおけるデータの流れを示した説明図である。 MPDの具体例を示した説明図である。コンテンツ再生システムのコンテンツサーバの構成を示した機能ブロック図である。コンテンツ再生システムのコンテンツ再生装置の構成を示した機能ブロック図である。コンテンツ再生システムのコンテンツサーバの構成を示した機能ブロック図である。無線通信システムの各装置による通信処理例を示すシーケンスチャートである。無線通信システムの各装置による通信処理例を示すシーケンスチャートである。無線通信システムの各装置による通信処理において送受信されるフレームフォーマット（frame format）の構成例を模式的に示す図である。無線通信システムの各装置による通信処理例を示すシーケンスチャートである。

　＜scalable機能の説明＞
　（spatial scalabilityの説明）
　図１は、spatial scalabilityを説明する図である。

　図１に示すように、spatial scalabilityは、画像を空間解像度で階層化して符号化するscalable機能である。具体的には、spatial scalabilityでは、低解像度の画像がベースレイヤの画像として符号化され、高解像度の画像がエンハンスメントレイヤの画像として符号化される。

　従って、符号化装置は、処理能力の低い復号装置に対してベースレイヤの画像の符号化データのみを伝送することにより、復号装置は、低解像度の画像を生成することができる。また、符号化装置は、処理能力の高い復号装置に対してベースレイヤとエンハンスメントレイヤの画像の符号化データを伝送することにより、復号装置は、ベースレイヤとエンハンスメントレイヤの画像を復号し、高解像度の画像を生成することができる。

　（temporal scalabilityの説明）
　図２は、temporal scalabilityを説明する図である。

　図２に示すように、temporal scalabilityは、画像をフレームレートで階層化して符号化するscalable機能である。具体的には、temporal scalabilityでは、例えば、低フレームレート（図２の例では7.5fps）の画像がベースレイヤの画像として符号化される。また、中フレームレート（図２の例では15fps）の画像がエンハンスメントレイヤの画像として符号化される。さらに、高フレームレート（図２の例では30fps）の画像がエンハンスメントレイヤの画像として符号化される。

　従って、符号化装置は、処理能力の低い復号装置に対してベースレイヤの画像の符号化データのみを伝送することにより、復号装置は、低フレームレートの画像を生成することができる。また、符号化装置は、処理能力の高い復号装置に対してベースレイヤとエンハンスメントレイヤの画像の符号化データを伝送することにより、復号装置は、ベースレイヤとエンハンスメントレイヤの画像を復号し、高フレームレートまたは中フレームレートの画像を生成することができる。

　（SNR scalabilityの説明）
　図３は、SNR scalabilityを説明する図である。

　図３に示すように、SNR scalabilityは、画像をSNR(signal-noise ratio)で階層化して符号化するscalable機能である。具体的には、SNR scalabilityでは、低SNRの画像がベースレイヤの画像として符号化され、高SNRの画像がエンハンスメントレイヤの画像として符号化される。

　従って、符号化装置は、処理能力の低い復号装置に対してベースレイヤの画像の符号化データのみを伝送することにより、復号装置は、低SNRの画像を生成することができる。また、符号化装置は、処理能力の高い復号装置に対してベースレイヤとエンハンスメントレイヤの画像の符号化データを伝送することにより、復号装置は、ベースレイヤとエンハンスメントレイヤの画像を復号し、高SNRの画像を生成することができる。

　なお、図示は省略するが、scalable機能としては、色域スケーラビリティ、spatial scalability, temporal scalability、SNR scalabilityの他にも存在する。

　例えば、scalable機能としては、画像をビット数で階層化して符号化するbit-depth scalabilityもある。この場合、例えば、8bitビデオの画像がベースレイヤの画像とされ、10bitビデオの画像がエンハンスメントレイヤの画像とされ、符号化される。

　また、scalable機能としては、画像を色差信号のフォーマットで階層化して符号化するchroma scalabilityもある。この場合、例えば、YUV420の画像がベースレイヤの画像とされ、YUV422の画像がエンハンスメントレイヤの画像とされ、符号化される。

　なお、以下では、説明の便宜上、エンハンスメントレイヤが１つである場合について説明する。

　＜本開示の前提＞
　（色域の説明）
　図４は、色域BT.709と色域BT.2020を示す図である。

　図４のグラフは、所定の拘束条件を用いて３次元の色空間を２次元平面へマッピングした色域のグラフである。なお、グラフ中の十字マークは、白色がマッピングされる位置を示し、破線は、色域BT.709で表現可能な色の範囲を表す。また、実線は、色域BT.2020で表現可能な色の範囲を表し、点線は、人間の識別可能な色の範囲を表している。

　図４に示すように、色域BT.2020は、色域BT.709に比べて多彩な色を表現可能である。

　（従来の色域スケーラビリティによる符号化の説明）
　図５は、HD画像をベースレイヤの画像とし、UHD画像をエンハンスメントレイヤの画像としたときの従来の色域スケーラビリティによる符号化（以下、色域スケーラブル符号化という）を説明する図である。

　図５に示すように、符号化装置にベースレイヤの画像(以下、ベース画像という)としてHD画像が入力されると、ベース画像が符号化され、ベースストリームが生成される。符号化されたベース画像は復号され、参照用のベース画像とされる。参照用のベース画像は、そのベース画像より符号化順で後のベース画像の符号化時に用いられる。

　また、参照用のベース画像は、解像度がエンハンスメントの画像(以下、エンハンスメント画像という)の解像度になるようにアップサンプリングされ、ビットシフト法やゲインオフセット法により色域がエンハンスメント画像の色域に変換される。

　符号化装置にエンハンスメント画像として入力されたUHD画像は、色域変換後の参照用のベース画像と参照用のエンハンスメント画像とを用いて符号化され、エンハンスメントストリームが生成される。参照用のエンハンスメント画像は、符号化順で前の符号化済みのエンハンスメント画像を復号したものである。ベースストリームとエンハンスメントストリームは合成され、出力される。

　（中域の色域BT.2020と色域BT.709の関係）
　図６は、低域と高域以外の帯域である中域の色域BT.2020と色域BT.709における輝度信号および色差信号の関係を示す図である。

　図６のＡ乃至図６のＣのグラフは、それぞれ、中域の色域BT.2020と色域BT.709における輝度信号Ｙの値、色差信号Ｕの値、色差信号Ｖの値の関係を示すグラフである。なお、図６において、横軸は、色域BT.709の値を表し、縦軸は色域BT.2020値を表す。

　図６に示すように、中域の色域BT.2020と色域BT.709における輝度信号および色差信号の関係は線形近似することができる。具体的には、色域BT.2020と色域BT.709における輝度信号および色差信号の関係は、図６中直線で近似したり、点線で近似することができる。直線は、以下の式（１）で表すことができ、点線は、以下の式（２）で表すことができる。

　なお、式（１）および式（２）において、Ｙ_２０１０，Ｕ_２０１０，Ｖ_２０１０は、それぞれ、色域BT.2020における輝度信号Ｙの値、色差信号Ｕの値、色差信号Ｖの値である。また、Ｙ_７０９，Ｕ_７０９，Ｖ_７０９は、それぞれ、色域BT.709における輝度信号Ｙの値、色差信号Ｕの値、色差信号Ｖの値である。

　また、式（２）において、ｇ_１乃至ｇ_３は、それぞれ、Ｙ_７０９，Ｕ_７０９，Ｖ_７０９に乗算されるゲインであり、ｏ_１乃至ｏ_３は、それぞれ、Ｙ_７０９，Ｕ_７０９，Ｖ_７０９に加算されるオフセットである。ゲインｇ_１乃至ｇ_３およびオフセットｏ_１乃至ｏ_３は、予め決められた固定値であってもよいし、ピクチャごとに設定される可変値であってもよい。

　以上のように、色域BT.2020と色域BT.709における輝度信号および色差信号の関係は、式（１）で表される直線または式（２）で表される点線で線形近似することができる。従って、式（１）により色域BT.709の値を用いて色域BT.2020の値を演算するビットシフト法や、式（２）により色域BT.709の値を用いて色域BT.2020の値を演算するゲインオフセット法を用いて、色域BT.709を色域BT.2020に変換することができる。

　（ビットシフト法とゲインオフセット法におけるパラメータの数の説明）
　図７は、復号側に伝送されるビットシフト法とゲインオフセット法におけるパラメータの数を示す図である。

　図７に示すように、ビットシフト法では、色域BT.709の値Ｙ_７０９，Ｕ_７０９，Ｖ_７０９を２ビット左にシフトすることにより色域BT.2020の値Ｙ_２０１０，Ｕ_２０１０，Ｖ_２０１０が演算される。従って、復号側に伝送する必要があるパラメータは存在しない。よって、復号側に伝送されるパラメータの数は０である。

　また、図７に示すように、ゲインオフセット法では、色域BT.709の値Ｙ_７０９，Ｕ_７０９，Ｖ_７０９に、それぞれゲインｇ_１，ｇ_２，ｇ_３を乗算し、オフセットｏ_１，ｏ_２，ｏ_３を加算することにより色域BT.2020の値Ｙ_２０１０，Ｕ_２０１０，Ｖ_２０１０が演算される。従って、ゲインｇ_１乃至ｇ_３とオフセットｏ_１乃至ｏ_３が固定値である場合、復号側に伝送する必要があるパラメータは存在しない。よって、復号側に伝送されるパラメータの数は０である。

　一方、ゲインｇ_１乃至ｇ_３とオフセットｏ_１乃至ｏ_３が可変値である場合、そのゲインｇ_１乃至ｇ_３とオフセットｏ_１乃至ｏ_３を復号側に伝送する必要がある。従って、復号側に伝送されるパラメータの数は６個である。

　（色域変換の方法を指定する情報の例）
　図８は、PPS（Picture Parameter Set）の一部のシンタックスの例を示す図である。

　図８のＡに示すように、PPS（Picture Parameter Set）には、PPSを拡張するかどうかを示す拡張フラグ（pps_extension_flag）が設定される。拡張フラグは、PPSを拡張することを示す場合１であり、PPSを拡張しないことを示す場合０である。

　また、拡張フラグが１である場合、PPSには、色域変換を行うかどうかを示す変換フラグ（use_color_prediction）が設定される。変換フラグは、色域変換を行うことを示す場合１であり、色域変換を行わないことを示す場合０である。

　変換フラグが１である場合、PPSには、さらに、色域変換に関する色域変換情報（color_pred_data）が設定される。この色域変換情報には、色域変換の方法を指定する色域変換方法情報（color_prediction_model）が含まれる。

　色域変換方法情報は、図８のＢに示すように、色域変換の方法がビットシフト法である場合０である。また、色域変換の方法がゲインおよびオフセットとして固定値を用いるゲインオフセット法である固定ゲインオフセット法である場合、色域変換方法情報は１である。また、色域変換の方法がゲインおよびオフセットとして可変値を用いるゲインオフセット法である適応ゲインオフセット法である場合、色域変換方法情報は２である。

　以上のように、ビットシフト法、固定ゲインオフセット法、または適応ゲインオフセット法により色域を変換することはできる。しかしながら、図６の関係は低域や高域において成立しない。

　（低域や高域の色域BT.2020と色域BT.709の関係）
　図９は、低域や高域の色域BT.2020と色域BT.709における輝度信号および色差信号の関係を示す図である。

　図９のＡ乃至図９のＣのグラフは、それぞれ、低域や高域の色域BT.2020と色域BT.709における輝度信号Ｙの値、色差信号Ｕの値、色差信号Ｖの値の関係を示すグラフである。なお、図９において、横軸は、色域BT.709の値を表し、縦軸は色域BT.2020値を表す。

　図９に示すように、低域や高域の色域BT.2020と色域BT.709における輝度信号および色差信号の関係は、線形近似することができない。従って、ビットシフト法、固定ゲインオフセット法、または適応ゲインオフセット法によって色域が変換された輝度信号および色差信号には誤差が発生する。

　よって、本開示では、ビットシフト法、固定ゲインオフセット法、または適応ゲインオフセット法による色域変換後のベース画像に対して、低域や高域にフィルタ処理を施すことにより、色域変換後のベース画像を補正する。

　＜第１実施の形態＞
　（符号化装置の一実施の形態の構成例）
　図１０は、本開示を適用した符号化装置の一実施の形態の構成例を示すブロック図である。

　図１０の符号化装置３０は、ベース符号化部３１、エンハンスメント符号化部３２、合成部３３、および伝送部３４により構成される。符号化装置３０は、HD画像とUHD画像を用いてHEVC方式に準ずる方式で色域スケーラブル符号化を行う。

　具体的には、符号化装置３０のベース符号化部３１には、外部からベース画像としてHD画像が入力される。ベース符号化部３１は、従来のHEVC方式の符号化装置と同様に構成され、ベース画像をHEVC方式で符号化する。ベース符号化部３１は、符号化の結果得られる符号化データ、VPS(Video Parameter Set),SPS（Sequence Parameter Set）,PPS（Picture Parameter Set）等を含む符号化ストリームを、ベースストリームとして合成部３３に供給する。また、ベース符号化部３１は、ベース画像の符号化時に参照画像として用いるために復号されたベース画像を、エンハンスメント符号化部３２に供給する。

　エンハンスメント符号化部３２には、外部からエンハンスメント画像としてUHD画像が入力される。エンハンスメント符号化部３２は、エンハンスメント画像をHEVC方式に準ずる方式で符号化する。このとき、エンハンスメント符号化部３２は、ベース符号化部３１からのベース画像を参照する。エンハンスメント符号化部３２は、符号化の結果得られる符号化データ、SPS,PPS,VPSの拡張領域等を含む符号化ストリームをエンハンスメントストリームとして合成部３３に供給する。

　合成部３３は、ベース符号化部３１から供給されるベースストリームとエンハンスメント符号化部３２から供給されるエンハンスメントストリームを合成し、全階層の符号化ストリームを生成する。合成部３３は、全階層の符号化ストリームを伝送部３４に供給する。

　伝送部３４は、合成部３３から供給される全階層の符号化ストリームを後述する復号装置に伝送する。

　なお、ここでは、符号化装置３０は、全階層の符号化ストリームを伝送するものとするが、必要に応じて、ベースストリームのみを伝送することもできる。

　（エンハンスメント符号化部の構成例）
　図１１は、図１０のエンハンスメント符号化部３２の構成例を示すブロック図である。

　図１１のエンハンスメント符号化部３２は、設定部５１と符号化部５２により構成される。

　エンハンスメント符号化部３２の設定部５１は、必要に応じて、SPS,PPS,VPSの拡張領域などのパラメータセットを設定する。設定部５１は、設定されたパラメータセットを符号化部５２に供給する。

　符号化部５２は、ベース符号化部３１からのベース画像を参照して、外部から入力されるエンハンスメント画像を、HEVC方式に準ずる方式で符号化する。符号化部５２は、その結果得られる符号化データと、設定部５１から供給されるパラメータセットからエンハンスメントストリームを生成し、図１０の合成部３３に供給する。

　（符号化部の構成例）
　図１２は、図１１の符号化部５２の構成例を示すブロック図である。

　図１２の符号化部５２は、A/D変換部７１、画面並べ替えバッファ７２、演算部７３、直交変換部７４、量子化部７５、可逆符号化部７６、蓄積バッファ７７、生成部７８、逆量子化部７９、逆直交変換部８０、加算部８１、デブロックフィルタ８２、適応オフセット部８３、適応ループフィルタ８４、フレームメモリ８５、スイッチ８６、イントラ予測部８７、動き予測・補償部８８、予測画像選択部８９、レート制御部９０、アップサンプル部９１、および色域変換部９２により構成される。

　符号化部５２のA/D変換部７１は、入力されたフレーム単位のエンハンスメント画像をA/D変換し、画面並べ替えバッファ７２に出力して記憶させる。画面並べ替えバッファ７２は、記憶した表示の順番のフレーム単位のエンハンスメント画像を、GOP構造に応じて、符号化のための順番に並べ替え、演算部７３、イントラ予測部８７、および動き予測・補償部８８に出力する。

　演算部７３は、符号化部として機能し、予測画像選択部８９から供給される予測画像と、画面並べ替えバッファ７２から出力された符号化対象のエンハンスメント画像の差分を演算することにより符号化を行う。具体的には、演算部７３は、画面並べ替えバッファ７２から出力された符号化対象のエンハンスメント画像から、予測画像選択部８９から供給される予測画像を減算することにより符号化を行う。

　演算部７３は、その結果得られる画像を、残差情報として直交変換部７４に出力する。なお、予測画像選択部８９から予測画像が供給されない場合、演算部７３は、画面並べ替えバッファ７２から読み出されたエンハンスメント画像をそのまま残差情報として直交変換部７４に出力する。

　直交変換部７４は、演算部７３からの残差情報を所定の方式で直交変換し、生成された直交変換係数を量子化部７５に供給する。

　量子化部７５は、直交変換部７４から供給される直交変換係数に対して量子化を行い、その結果得られる係数を、可逆符号化部７６に供給する。

　可逆符号化部７６は、最適イントラ予測モードを示すイントラ予測モード情報をイントラ予測部８７から取得する。また、可逆符号化部７６は、動き予測・補償部８８から最適インター予測モードを示すインター予測モード情報、動きベクトル、参照画像を特定する参照画像特定情報などを取得する。さらに、可逆符号化部７６は、適応オフセット部８３から適応オフセット処理のパラメータとしてのオフセット情報を取得し、適応ループフィルタ８４からフィルタ係数を取得する。

　可逆符号化部７６は、量子化部７５から供給される量子化された係数に対して、可変長符号化（例えば、CAVLC（Context-Adaptive Variable Length Coding）など）、算術符号化（例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）など）などの可逆符号化を行う。

　また、可逆符号化部７６は、イントラ予測モード情報、または、インター予測モード情報、動きベクトル、および参照画像特定情報、オフセット情報、並びにフィルタ係数を、符号化に関する符号化情報として可逆符号化する。可逆符号化部７６は、可逆符号化された符号化情報と可逆符号化された係数を符号化データとして蓄積バッファ７７に供給し、蓄積させる。なお、可逆符号化された符号化情報は、ヘッダ部として符号化データに付加されるようにしてもよい。

　蓄積バッファ７７は、可逆符号化部７６から供給される符号化データを、一時的に記憶する。また、蓄積バッファ７７は、記憶している符号化データを生成部７８に供給する。

　生成部７８は、図１１の設定部５１から供給されるパラメータセットと蓄積バッファ７７から供給される符号化データからエンハンスメントストリームを生成し、図１０の合成部３３に供給する。

　また、量子化部７５から出力された量子化された係数は、逆量子化部７９にも入力される。逆量子化部７９は、量子化部７５により量子化された係数に対して逆量子化を行い、その結果得られる直交変換係数を逆直交変換部８０に供給する。

　逆直交変換部８０は、逆量子化部７９から供給される直交変換係数に対して、直交変換部７４における直交変換の方式に対応する方式で4次の逆直交変換を行い、その結果得られる残差情報を加算部８１に供給する。

　加算部８１は、復号部として機能し、逆直交変換部８０から供給される残差情報と、予測画像選択部８９から供給される予測画像を加算して、局部的に復号されたエンハンスメント画像を得る。なお、予測画像選択部８９から予測画像が供給されない場合、加算部８１は、逆直交変換部８０から供給される残差情報を局部的に復号されたエンハンスメント画像とする。加算部８１は、局部的に復号されたエンハンスメント画像をデブロックフィルタ８２に供給するとともに、フレームメモリ８５に供給して蓄積させる。

　デブロックフィルタ８２は、加算部８１から供給される局部的に復号されたエンハンスメント画像に対して、ブロック歪を除去するデブロッキングフィルタ処理を行い、その結果得られるエンハンスメント画像を適応オフセット部８３に供給する。

　適応オフセット部８３は、デブロックフィルタ８２から供給されるデブロッキングフィルタ処理後のエンハンスメント画像に対して、主にリンギングを除去する適応オフセット(SAO（Sample adaptive offset)）処理を行う。

　具体的には、適応オフセット部８３は、最大の符号化単位であるLCU（Largest Coding Unit）ごとにエンハンスメント画像に施す適応オフセット処理の種類を、バンドオフセット処理またはエッジオフセット処理に決定する。

　バンドオフセット処理とは、所定の帯域に対してのみ設定されるオフセットを用いたフィルタ処理である。エッジオフセット処理とは、隣接画素との関係に応じたオフセットを用いたフィルタ処理である。

　また、適応オフセット処理の種類がバンドオフセット処理である場合、適応オフセット部８３は、LCUごとに、オフセットを設定する帯域を決定し、そのオフセットを演算する。一方、適応オフセット処理の種類がエッジオフセット処理である場合、適応オフセット部８３は、LCUごとに、隣接画素のパターンを決定し、そのパターンの隣接画素との関係に応じたオフセットを演算する。

　適応オフセット処理の種類および帯域の決定、並びにオフセットの演算は、例えば、適応オフセット処理後のエンハンスメント画像と画面並べ替えバッファ７２から出力されるエンハンスメント画像との差分が小さくなるように行われる。

　適応オフセット部８３は、演算されたオフセットと、決定された帯域または隣接画素のパターンとに基づいて、デブロッキングフィルタ処理後のエンハンスメント画像に対して、決定された種類の適応オフセット処理を行う。そして、適応オフセット部８３は、適応オフセット処理後のエンハンスメント画像を適応ループフィルタ８４に供給する。

　また、適応オフセット部８３は、色域変換部９２から供給されるベース画像の予め決められた帯域に対するオフセットをLCUごとに演算する。具体的には、適応オフセット部８３は、バンドオフセット処理後のベース画像と、画面並べ替えバッファ７２から出力されるエンハンスメント画像の差分が小さくなるように、オフセットを演算する。

　そして、適応オフセット部８３は、算出されたオフセットに基づいて、色域変換部９２からのベース画像の予め決められた帯域に対するオフセットを用いたフィルタ処理をバンドオフセット処理として行う。適応オフセット部８３は、バンドオフセット処理後のベース画像をフレームメモリ８５に供給する。

　また、適応オフセット部８３は、エンハンスメント画像の適応オフセット処理の種類を表す種類情報、オフセット、および、帯域を特定する帯域情報または隣接画素のパターンを特定するパターン情報、並びに、ベース画像のオフセットと種類情報を、オフセット情報として可逆符号化部７６に供給する。

　適応ループフィルタ８４は、例えば、２次元のウィナーフィルタ（Wiener Filter）により構成される。適応ループフィルタ８４は、適応オフセット部８３から供給される適応オフセット処理後のエンハンスメント画像に対して、例えば、LCUごとに、適応ループフィルタ（ALF(Adaptive Loop Filter)）処理を行う。

　具体的には、適応ループフィルタ８４は、LCUごとに、画面並べ替えバッファ７２からのエンハンスメント画像と適応ループフィルタ処理後のエンハンスメント画像の差分が最小となるように、適応ループフィルタ処理で用いられるフィルタ係数を算出する。そして、適応ループフィルタ８４は、適応オフセット処理後のエンハンスメント画像に対して、算出されたフィルタ係数を用いて、LCUごとに適応ループフィルタ処理を行う。

　適応ループフィルタ８４は、適応ループフィルタ処理後のエンハンスメント画像をフレームメモリ８５に供給する。また、適応ループフィルタ８４は、フィルタ係数を可逆符号化部７６に供給する。

　なお、ここでは、適応ループフィルタ処理は、LCUごとに行われるものとするが、適応ループフィルタ処理の処理単位は、LCUに限定されない。但し、適応オフセット部８３と適応ループフィルタ８４の処理単位を合わせることにより、処理を効率的に行うことができる。

　フレームメモリ８５は、適応ループフィルタ８４から供給されるエンハンスメント画像、加算部８１から供給されるエンハンスメント画像、および適応オフセット部８３から供給されるベース画像を蓄積する。フレームメモリ８５に蓄積されたベース画像またはエンハンスメント画像は、参照画像としてスイッチ８６を介してイントラ予測部８７または動き予測・補償部８８に出力される。

　イントラ予測部８７は、フレームメモリ８５からスイッチ８６を介して読み出された参照画像を用いて、候補となる全てのイントラ予測モードのイントラ予測を行う。

　イントラ予測部８７は、画面並べ替えバッファ７２から読み出されたエンハンスメント画像、イントラ予測の結果生成される予測画像、およびイントラ予測モードを示す情報等に基づいて、候補となる全てのイントラ予測モードに対してコスト関数値（詳細は後述する）を算出する。そして、イントラ予測部８７は、コスト関数値が最小となるイントラ予測モードを、最適イントラ予測モードに決定する。

　イントラ予測部８７は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、予測画像選択部８９に供給する。イントラ予測部８７は、予測画像選択部８９から最適イントラ予測モードで生成された予測画像の選択が通知された場合、イントラ予測モード情報を可逆符号化部７６に供給する。

　なお、コスト関数値は、RD(Rate Distortion)コストともいい、例えば、H．264/AVC方式における参照ソフトウエアであるJM(Joint Model)で定められているような、High Complexity モードか、Low Complexity モードのいずれかの手法に基づいて算出される。なお、H．264/AVC方式における参照ソフトウエアは、http://iphome.hhi.de/suehring/tml/index.htmにおいて公開されている。

　具体的には、コスト関数値の算出手法としてHigh Complexity モードが採用される場合、候補となる全ての予測モードに対して、仮に復号までが行われ、次の式（３）で表わされるコスト関数値Cost(Mode)が各予測モードに対して算出される。

　Dは、原画像と復号画像の差分（歪）、Rは、直交変換の係数まで含んだ発生符号量、λは、量子化パラメータQPの関数として与えられるラグランジュ未定乗数である。

　一方、コスト関数値の算出手法としてLow Complexity モードが採用される場合、候補となる全ての予測モードに対して、予測画像の生成、および、符号化情報の符号量の算出が行われ、次の式（４）で表わされるコスト関数Cost(Mode)が各予測モードに対して算出される。

　Dは、原画像と予測画像の差分（歪）、Header_Bitは、符号化情報の符号量、QPtoQuantは、量子化パラメータQPの関数として与えられる関数である。

　Low Complexity モードにおいては、全ての予測モードに対して、予測画像を生成するだけでよく、復号画像を生成する必要がないため、演算量が少なくて済む。

　動き予測・補償部８８は、候補となる全てのインター予測モードの動き予測・補償処理を行う。具体的には、動き予測・補償部８８は、画面並べ替えバッファ７２から供給されるエンハンスメント画像と、フレームメモリ８５からスイッチ８６を介して読み出される参照画像に基づいて、候補となる全てのインター予測モードの動きベクトルを検出する。そして、動き予測・補償部８８は、その動きベクトルに基づいて参照画像に補償処理を施し、予測画像を生成する。

　このとき、動き予測・補償部８８は、画面並べ替えバッファ７２から供給されるエンハンスメント画像と予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター予測モードに決定する。そして、動き予測・補償部８８は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部８９に供給する。

　また、動き予測・補償部８８は、予測画像選択部８９から最適インター予測モードで生成された予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトル、参照画像特定情報などを可逆符号化部７６に出力する。

　予測画像選択部８９は、イントラ予測部８７および動き予測・補償部８８から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちの、対応するコスト関数値が小さい方を、最適予測モードに決定する。そして、予測画像選択部８９は、最適予測モードの予測画像を、演算部７３および加算部８１に供給する。また、予測画像選択部８９は、最適予測モードの予測画像の選択をイントラ予測部８７または動き予測・補償部８８に通知する。

　レート制御部９０は、蓄積バッファ７７に蓄積された符号化データに基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部７５の量子化動作のレートを制御する。

　アップサンプル部９１は、図１０のベース符号化部３１から供給される、ベース画像の符号化時に参照画像として用いられる復号されたベース画像を取得する。アップサンプル部９１は、ベース画像の解像度をエンハンスメント画像の解像度に変換し、色域変換部９２に供給する。

　色域変換部９２は、ビットシフト法、固定ゲインオフセット法、または適応ゲインオフセット法により、アップサンプル部９１から供給されるベース画像の色域をエンハンスメント画像の色域に変換する。色域変換部９２は、色域変換後のベース画像を適応オフセット部８３に供給する。なお、色域変換部９２は、適応ゲインオフセット法により色域を変換する場合、ゲインｇ_１乃至ｇ_３とオフセットｏ_１乃至ｏ_３を可逆符号化部７６に供給し、符号化情報に含める。

　（符号化単位の説明）
　図１３は、HEVC方式における符号化単位であるCoding UNIT(CU)を説明する図である。

　HEVC方式では、4000画素×2000画素のUHD（Ultra High Definition）などのような大きな画枠の画像も対象としているため、符号化単位のサイズを16画素×16画素に固定することは最適ではない。従って、HEVC方式では、符号化単位としてCUが定義されている。

　CUは、AVC方式におけるマクロブロックと同様の役割を果たす。具体的には、CUは、イントラ予測またはインター予測の単位である予測ブロック(PU)に分割されたり、直交変換の単位である変換ブロック(TU)に分割されたりする。

　但し、CUのサイズは、シーケンスごとに可変の２のべき乗画素で表される正方形である。具体的には、CUは、最大のサイズのCUであるLCUを、最小のサイズのCUであるSCU(Smallest Coding Unit)より小さくならないように、任意の回数だけ水平方向および垂直方向に２分割することにより設定される。即ち、LCUを、SCUになるまで、上の階層のサイズが下の階層のサイズの1/4となるように階層化したときの任意の階層のサイズがCUのサイズである。

　例えば、図１３では、LCUのサイズが128であり、SCUのサイズが8である。従って、LCUの階層深度（Depth）は0乃至4となり、階層深度数は5となる。即ち、CUに対応する分割数は0乃至4のいずれかである。

　なお、LCUとSCUのサイズを指定する情報は、SPSに含められる。また、CUに対応する分割数は、各階層においてさらに分割するかどうかを表すsplit_flagにより指定される。CUの詳細については、非特許文献１に記載されている。

　また、本明細書において、CTU（Coding Tree Unit）は、LCUのCTB（Coding Tree Block）と、そのLCUベース（レベル）で処理するときのパラメータを含む単位であるとする。また、CTUを構成するCUは、CB(Coding Block)と、そのCUベース（レベル）で処理するときのパラメータを含む単位であるとする。

　（適応オフセット部の構成例）
　図１４は、図１２の適応オフセット部８３の構成例を示すブロック図である。

　図１４の適応オフセット部８３は、分離部１１１、エッジオフセット算出部１１２、バンドオフセット算出部１１３、およびフィルタ処理部１１４により構成される。

　適応オフセット部８３の分離部１１１は、図１２のデブロックフィルタ８２から供給されるエンハンスメント画像と、画面並べ替えバッファ７２から出力されるエンハンスメント画像とに基づいて、適応オフセット処理の種類をLCUごとに決定する。分離部１１１は、決定された種類の種類情報をオフセット情報として図１２の可逆符号化部７６に供給する。

　また、分離部１１１は、決定された種類がエッジオフセット処理である場合、デブロックフィルタ８２からのエンハンスメント画像をエッジオフセット算出部１１２に供給する。一方、決定された種類がバンドオフセット処理である場合、デブロックフィルタ８２からのエンハンスメント画像をバンドオフセット算出部１１３に供給する。

　エッジオフセット算出部１１２は、分離部１１１と画面並べ替えバッファ７２から出力されるエンハンスメント画像とに基づいて、エッジオフセット処理における隣接画素のパターンを決定し、画素のカテゴリごとのオフセットを算出する。エッジオフセット算出部１１２は、決定されたパターンのパターン情報およびオフセット、並びに、分離部１１１からのエンハンスメント画像をフィルタ処理部１１４に供給する。また、エッジオフセット算出部１１２は、オフセットとパターン情報をオフセット情報として可逆符号化部７６に供給する。

　バンドオフセット算出部１１３は、分離部１１１からのエンハンスメント画像と、画面並べ替えバッファ７２から出力されるエンハンスメント画像とに基づいて、バンドオフセット処理における帯域と、その帯域に対するオフセットを算出する。バンドオフセット算出部１１３は、決定された帯域の帯域情報およびオフセット、並びに、分離部１１１からのエンハンスメント画像をフィルタ処理部１１４に供給する。また、バンドオフセット算出部１１３は、エンハンスメント画像のオフセットと帯域情報をオフセット情報として可逆符号化部７６に供給する。

　また、バンドオフセット算出部１１３は、図１２の色域変換部９２からのベース画像と、画面並べ替えバッファ７２から出力されるエンハンスメント画像とに基づいて、バンドオフセット処理における予め決められた帯域に対するオフセットをLCU単位で算出する。バンドオフセット算出部１１３は、そのオフセットと色域変換部９２からのベース画像とをフィルタ処理部１１４に供給する。また、バンドオフセット算出部１１３は、ベース画像のオフセットと、ベース画像の種類情報としてのバンドオフセット処理を表す種類情報とを、オフセット情報として可逆符号化部７６に供給する。

　フィルタ処理部１１４は、エッジオフセット算出部１１２から供給される各カテゴリのオフセットとパターン情報とに基づいて、エンハンスメント画像に対してフィルタ処理を行う。

　具体的には、フィルタ処理部１１４は、パターン情報に基づいて、エンハンスメント画像の各画素の隣接画素を決定し、その隣接画素の画素値に基づいて各画素をカテゴリに分類する。そして、フィルタ処理部１１４は、エンハンスメント画像の各画素のオフセットを、その画素が分類されたカテゴリのオフセットに決定し、決定された各画素のオフセットを用いてエンハンスメント画像に対してフィルタ処理を行う。

　また、フィルタ処理部１１４は、バンドオフセット算出部１１３から供給されるエンハンスメント画像のオフセットと帯域情報に基づいて、その帯域情報で特定される帯域に対してオフセットを設定する。フィルタ処理部１１４は、エンハンスメント画像に対して、設定されたオフセットを用いたフィルタ処理を行う。

　さらに、フィルタ処理部１１４は、バンドオフセット算出部１１３から供給されるベース画像のオフセットを、予め決められた帯域に対するオフセットとして設定する。フィルタ処理部１１４は、ベース画像の予め決められた帯域に対して、設定されたオフセットを用いたフィルタ処理を行う。フィルタ処理部１１４は、フィルタ処理後のエンハンスメント画像を図１２の適応ループフィルタ８４に供給し、フィルタ処理後のベース画像をフレームメモリ８５に供給する。

　（バンドオフセット処理の説明）
　図１５は、バンドオフセット処理を説明する図である。

　図１５に示すように、バンドオフセット処理では、各画素値が、例えば、３２個の帯域（バンド）に等分される。そして、３２個の帯域のうちの所定の帯域に対してオフセットが設定され、オフセットを用いたフィルタ処理が行われる。なお、オフセットを設定する帯域の数は、予め決められており、例えば、その帯域のうちの最も低い帯域を特定することにより、オフセットを設定する帯域を特定することができる。

　図１５の例では、画素値のビット深度が8ビットであり、画素値は、0乃至255の値である。従って、各帯域は、8個の画素値からなる。また、本実施の形態では、オフセットを設定する帯域の数が４である。従って、最も低い帯域から１０番目の帯域を特定する情報を帯域情報とすることにより、最も低い帯域から１０乃至１３番目の帯域にフィルタ処理を施すことができる。即ち、80乃至112の値をとる画素値に対してフィルタ処理を施すことができる。

　以上のようなバンドオフセット処理により、空の画像などのように平坦な画像において疑似輪郭が生じるといった画質劣化を改善することができる。

　（ベース画像のバンドオフセット処理における帯域）
　図１６は、ベース画像のバンドオフセット処理における帯域を示す図である。

　上述したように、低域や高域では、色域BT.2020と色域BT.709における輝度信号および色差信号の関係は、式（１）や式（２）で近似することができない。従って、ベース画像のバンドオフセット処理では、最も低い４つの帯域と最も高い４つの帯域に対してフィルタ処理が施される。

　なお、最も低い４つの帯域と最も高い４つの帯域のいずれか一方にのみフィルタ処理が施されるようにしてもよい。また、フィルタ処理が施される帯域数は、エンハンスメント画像の場合と同一でなくてもよい。

　（エッジオフセット処理の説明）
　図１７は、エッジオフセット処理における隣接画素を説明する図である。

　図１７に示すように、エッジオフセット処理における隣接画素のパターンの数は、４種類である。具体的には、隣接画素の第１のパターンは、図１７のＡに示すように、処理対象の画素１３０の左に隣接する画素１３１と右に隣接する画素１３２を隣接画素とするパターンである。また、第２のパターンは、図１７のＢに示すように、画素１３０の上に隣接する画素１３３と下に隣接する画素１３４を隣接画素とするパターンである。

　第３のパターンは、図１７のＣに示すように、画素１３０の左上に隣接する画素１３５と右下に隣接する画素１３６を隣接画素とするパターンである。第４のパターンは、図１７のＤに示すように、画素１３０の右上に隣接する画素１３７と左下に隣接する画素１３８を隣接画素とするパターンである。

　エッジオフセット処理では、ＬＣＵごとに、第１乃至第４のパターンのいずれかが選択され、選択されたパターンの隣接画素の画素値に基づいて、そのＬＣＵ内の各画素がカテゴリに分類される。各ＬＣＵのパターン情報は、オフセット情報として復号装置に伝送される。

　図１８は、エッジオフセット処理におけるカテゴリを説明する図である。

　なお、図１８のグラフにおいて、横軸は、処理対象の画素と隣接画素を項目として表しており、縦軸は画素値（輝度値）を表している。

　図１８に示すように、処理対象の画素が分類されるカテゴリの数は５つである。具体的には、第１のカテゴリは、図１８のＡに示すように、処理対象の画素の画素値が隣接画素の画素値の両方に比べて小さいカテゴリであり、第２のカテゴリは、図１８のＢに示すように、処理対象の画素の画素値が隣接画素の画素値の一方と同一であり、他方に比べて小さいカテゴリである。

　第３のカテゴリは、図１８のＣに示すように、処理対象の画素の画素値が隣接画素の画素値の一方と同一であり、他方に比べて大きいカテゴリであり、第４のカテゴリは、図１８のＤに示すように、処理対象の画素の画素値が隣接画素の画素値の両方に比べて大きいカテゴリである。また、第５のカテゴリは、図１８のＥに示すように、処理対象の画素の画素値が隣接画素の画素値の一方に比べて大きく、他方に比べて小さいカテゴリである。

　第１乃至第４のカテゴリに分類された処理対象の画素に対してはオフセットが算出され、オフセット情報として復号装置に伝送される。但し、オフセットの正負は、カテゴリごとに固定されており、オフセットの正負に関する情報は伝送されない。また、第５のカテゴリに分類された処理対象の画素に対してはオフセットが算出されない。

　エッジオフセット処理では、算出されたオフセットを用いて第１乃至第４のカテゴリに分類された画素に対してフィルタ処理が施される。これにより、エッジ周りに生じるモスキートノイズを低減し、画質を向上させることができる。

　（オフセット情報のシンタックスの例）
　図１９は、オフセット情報のシンタックスの例を示す図である。

　図１９の２行目に示すように、オフセット情報には、このオフセット情報がベース画像に対するオフセット情報であるかどうかを示すベースフラグ（inter_layer_sao_flag）が設定される。ベースフラグは、ベース画像に対するオフセット情報であることを示す場合１であり、ベース画像に対するオフセット情報ではないことを示す場合０である。

　また、１９行目および２０行目に示すように、変換フラグが１であり、かつ、ベースフラグが１である場合、オフセット情報には、対応するＬＣＵの輝度値に対する適応オフセット処理の種類情報（sao_type_idx_luma）として１が設定される。

　即ち、ベース画像に対してはバンドオフセット処理が行われるので、オフセット情報がベース画像に対するオフセット情報である場合、適応オフセット処理の種類としてバンドオフセット処理を表す１が種類情報として設定される。

　なお、種類情報は、図２０に示すように、適応オフセット処理の種類としてバンドオフセット処理を表す場合１であるが、適応オフセット処理を行わないことを表す場合０である。また、適応オフセット処理の種類としてエッジオフセット処理を表す場合、種類情報は２である。また、変換フラグは、図８に示したようにPPSに設定されている。

　一方、２１行目および２２行目に示すように、変換フラグが１ではないか、または、ベースフラグが１ではない場合、オフセット情報には、対応するＬＣＵの輝度値に対する種類情報（sao_type_idx_luma）が設定される。

　輝度値の場合と同様に、２５行目および２６行目に示すように、変換フラグが１であり、かつ、ベースフラグが１である場合、オフセット情報には、対応するＬＣＵの色差値に対する種類情報（sao_type_idx_chroma）として１が設定される。

　また、２７行目および２８行目に示すように、変換フラグが１ではないか、または、ベースフラグが１ではない場合、オフセット情報には、対応するＬＣＵの色差値に対する種類情報（sao_type_idx_luma）が設定される。

　３０乃至３２行目に示すように、種類情報が０以外である場合、オフセット情報には、オフセットの絶対値(sao_offset_abs)が設定される。また、３３乃至３７行目に示すように、種類情報が１である場合、オフセットの符号(sao_offset_sign)が設定され、さらに、帯域情報（sao_band_position）が設定される。

　一方、３８乃至４２行目に示すように、種類情報が０以外であり、１ではない場合、即ち種類情報が２である場合、パターン情報（sao_eo_class_luma,sao_eo_class_chroma）が設定される。

　（符号化装置の処理の説明）
　図２１は、図１０の符号化装置３０の階層符号化処理を説明するフローチャートである。

　図２１のステップＳ１１において、符号化装置３０のベース符号化部３１は、外部から入力されたベース画像をHEVC方式で符号化し、パラメータセットを付加することによりベースストリームを生成する。そして、ベース符号化部３１は、ベースストリームを合成部３３に供給する。

　ステップＳ１２において、ベース符号化部３１は、参照画像として用いるために復号したベース画像をエンハンスメント符号化部３２に供給する。

　ステップＳ１３において、エンハンスメント符号化部３２の設定部５１（図１１）は、エンハンスメント画像のパラメータセットを設定する。ステップＳ１４において、符号化部５２のアップサンプル部９１（図１２）は、ベース符号化部３１から供給されるベース画像の解像度をエンハンスメント画像の解像度に変換し、色域変換部９２に供給する。

　ステップＳ１５において、色域変換部９２は、ビットシフト法、固定ゲインオフセット法、または適応ゲインオフセット法により、アップサンプル部９１から供給されるベース画像の色域をエンハンスメント画像の色域に変換する。色域変換部９２は、色域変換後のベース画像を適応オフセット部８３に供給する。

　ステップＳ１６において、符号化部５２は、色域変換後のベース画像を用いて外部から入力されたエンハンスメント画像を符号化するエンハンスメント符号化処理を行う。このエンハンスメント符号化処理の詳細は、後述する図２２および図２３を参照して説明する。

　ステップＳ１７において、符号化部５２の生成部７８（図１２）は、ステップＳ１６で生成された符号化データと、設定部５１から供給されるパラメータセットからエンハンスメントストリームを生成し、合成部３３に供給する。

　ステップＳ１８において、合成部３３は、ベース符号化部３１から供給されるベースストリームとエンハンスメント符号化部３２から供給されるエンハンスメントストリームを合成し、全階層の符号化ストリームを生成する。合成部３３は、全階層の符号化ストリームを伝送部３４に供給する。

　ステップＳ１９において、伝送部３４は、合成部３３から供給される全階層の符号化ストリームを後述する復号装置に伝送する。

　図２２および図２３は、図２１のステップＳ１６のエンハンスメント符号化処理の詳細を説明するフローチャートである。

　図２２のステップＳ３１において、符号化部５２のA/D変換部７１は、入力されたフレーム単位のエンハンスメント画像をA/D変換し、画面並べ替えバッファ７２に出力して記憶させる。

　ステップＳ３２において、画面並べ替えバッファ７２は、記憶した表示の順番のフレームのエンハンスメント画像を、GOP構造に応じて、符号化のための順番に並べ替える。画面並べ替えバッファ７２は、並べ替え後のフレーム単位のエンハンスメント画像を、演算部７３、イントラ予測部８７、および動き予測・補償部８８に供給する。

　ステップＳ３３において、イントラ予測部８７は、候補となる全てのイントラ予測モードのイントラ予測処理を行う。また、イントラ予測部８７は、画面並べ替えバッファ７２から読み出されたエンハンスメント画像と、イントラ予測処理の結果生成される予測画像とに基づいて、候補となる全てのイントラ予測モードに対してコスト関数値を算出する。そして、イントラ予測部８７は、コスト関数値が最小となるイントラ予測モードを、最適イントラ予測モードに決定する。イントラ予測部８７は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、予測画像選択部８９に供給する。

　また、動き予測・補償部８８は、候補となる全てのインター予測モードの動き予測・補償処理を行う。動き予測・補償部８８は、画面並べ替えバッファ７２から供給されるエンハンスメント画像と予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター予測モードに決定する。そして、動き予測・補償部８８は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部８９に供給する。

　ステップＳ３４において、予測画像選択部８９は、イントラ予測部８７および動き予測・補償部８８から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちのコスト関数値が最小となる方を、最適予測モードに決定する。そして、予測画像選択部８９は、最適予測モードの予測画像を、演算部７３および加算部８１に供給する。

　ステップＳ３５において、予測画像選択部８９は、最適予測モードが最適インター予測モードであるかどうかを判定する。ステップＳ３５で最適予測モードが最適インター予測モードであると判定された場合、予測画像選択部８９は、最適インター予測モードで生成された予測画像の選択を動き予測・補償部８８に通知する。

　そして、ステップＳ３６において、動き予測・補償部８８は、インター予測モード情報、対応する動きベクトル、および参照画像特定情報を可逆符号化部７６に供給し、処理をステップＳ３８に進める。

　一方、ステップＳ３５で最適予測モードが最適インター予測モードではないと判定された場合、即ち最適予測モードが最適イントラ予測モードである場合、予測画像選択部８９は、最適イントラ予測モードで生成された予測画像の選択をイントラ予測部８７に通知する。

　そして、ステップＳ３７において、イントラ予測部８７は、イントラ予測モード情報を可逆符号化部７６に供給し、処理をステップＳ３８に進める。

　ステップＳ３８において、演算部７３は、画面並べ替えバッファ７２から供給されるエンハンスメント画像から、予測画像選択部８９から供給される予測画像を減算することにより符号化を行う。演算部７３は、その結果得られる画像を、残差情報として直交変換部７４に出力する。

　ステップＳ３９において、直交変換部７４は、演算部７３からの残差情報に対して直交変換を施し、その結果得られる直交変換係数を量子化部７５に供給する。

　ステップＳ４０において、量子化部７５は、直交変換部７４から供給される係数を量子化し、その結果得られる係数を可逆符号化部７６と逆量子化部７９に供給する。

　図２３のステップＳ４１において、逆量子化部７９は、量子化部７５から供給される量子化された係数を逆量子化し、その結果得られる直交変換係数を逆直交変換部８０に供給する。

　ステップＳ４２において、逆直交変換部８０は、逆量子化部７９から供給される直交変換係数に対して逆直交変換を施し、その結果得られる残差情報を加算部８１に供給する。

　ステップＳ４３において、加算部８１は、逆直交変換部８０から供給される残差情報と、予測画像選択部８９から供給される予測画像を加算し、局部的に復号されたエンハンスメント画像を得る。加算部８１は、得られたエンハンスメント画像をデブロックフィルタ８２に供給するとともに、フレームメモリ８５に供給する。

　ステップＳ４４において、デブロックフィルタ８２は、加算部８１から供給される局部的に復号されたエンハンスメント画像に対して、デブロッキングフィルタ処理を行う。デブロックフィルタ８２は、その結果得られるエンハンスメント画像を適応オフセット部８３に供給する。

　ステップＳ４５において、適応オフセット部８３は、デブロックフィルタ８２から供給されるエンハンスメント画像と色域変換部９２から供給されるベース画像に対して、LCUごとに適応オフセット処理を行う。この適応オフセット処理の詳細は、後述する図２４を参照して説明する。

　ステップＳ４６において、適応ループフィルタ８４は、適応オフセット部８３から供給されるエンハンスメント画像に対して、LCUごとに適応ループフィルタ処理を行う。適応ループフィルタ８４は、その結果得られるエンハンスメント画像をフレームメモリ８５に供給する。また、適応ループフィルタ８４は、適応ループフィルタ処理で用いられたフィルタ係数を可逆符号化部７６に供給する。

　ステップＳ４７において、フレームメモリ８５は、適応ループフィルタ８４から供給されるエンハンスメント画像、加算部８１から供給されるエンハンスメント画像、および適応オフセット部８３から供給されるベース画像を蓄積する。フレームメモリ８５に蓄積された画像は、参照画像としてスイッチ８６を介してイントラ予測部８７または動き予測・補償部８８に出力される。

　ステップＳ４８において、可逆符号化部７６は、イントラ予測モード情報、または、インター予測モード情報、動きベクトル、および参照画像特定情報、オフセット情報、並びにフィルタ係数を、符号化情報として可逆符号化する。

　ステップＳ４９において、可逆符号化部７６は、量子化部７５から供給される量子化された係数を可逆符号化する。そして、可逆符号化部７６は、ステップＳ４８の処理で可逆符号化された符号化情報と可逆符号化された係数から、符号化データを生成し、蓄積バッファ７７に供給する。

　ステップＳ５０において、蓄積バッファ７７は、可逆符号化部７６から供給される符号化データを、一時的に蓄積する。

　ステップＳ５１において、レート制御部９０は、蓄積バッファ７７に蓄積された符号化データに基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部７５の量子化動作のレートを制御する。

　ステップＳ５２において、蓄積バッファ７７は、記憶している符号化データを、生成部７８に出力する。そして、処理は、図２１のステップＳ１６に戻り、ステップＳ１７に進む。

　なお、図２２および図２３の符号化処理では、説明を簡単化するため、常に、イントラ予測処理と動き予測・補償処理が行われるようにしたが、実際には、ピクチャタイプ等によっていずれか一方のみが行われる場合もある。

　図２４は、図２２のステップＳ４５の適応オフセット処理の詳細を説明するフローチャートである。

　図２４のステップＳ７１において、適応オフセット部８３の分離部１１１（図１４）は、デブロックフィルタ８２と画面並べ替えバッファ７２からのエンハンスメント画像に基づいて、エンハンスメント画像に対する適応オフセット処理の種類を決定する。分離部１１１は、決定された種類の種類情報をオフセット情報として可逆符号化部７６に供給する。

　ステップＳ７２において、分離部１１１は、ステップＳ７１で決定された適応オフセット処理の種類がエッジオフセット処理であるかどうかを判定する。ステップＳ７２でエッジオフセット処理であると判定された場合、分離部１１１は、デブロックフィルタ８２からのエンハンスメント画像をエッジオフセット算出部１１２に供給する。

　そして、ステップＳ７３において、エッジオフセット算出部１１２は、分離部１１１と画面並べ替えバッファ７２からのエンハンスメント画像に基づいて、エッジオフセット処理における隣接画素のパターンを決定し、各カテゴリのオフセットを算出する。エッジオフセット算出部１１２は、そのオフセットおよびパターン情報を、並びに、分離部１１１からのエンハンスメント画像をフィルタ処理部１１４に供給する。

　ステップＳ７４において、エッジオフセット算出部１１２は、パターン情報とオフセットをオフセット情報として可逆符号化部７６に出力する。

　ステップＳ７５において、フィルタ処理部１１４は、エッジオフセット算出部１１２から供給されるオフセットとパターン情報とに基づいて、エンハンスメント画像に対してフィルタ処理を行う。そして、フィルタ処理部１１４は、フィルタ処理後のエンハンスメント画像を図１２の適応ループフィルタ８４に供給し、処理はステップＳ７９に進む。

　一方、ステップＳ７５でエッジオフセット処理ではないと判定された場合、即ち、ステップＳ７１で決定された適応オフセット処理の種類がバンドオフセット処理である場合、分離部１１１は、デブロックフィルタ８２からのエンハンスメント画像をバンドオフセット算出部１１３に供給する。

　そして、ステップＳ７６において、バンドオフセット算出部１１３は、分離部１１１と画面並べ替えバッファ７２からのエンハンスメント画像に基づいて、バンドオフセット処理における帯域を決定し、その帯域に対するオフセットを算出する。バンドオフセット算出部１１３は、そのオフセットおよび帯域情報、並びに、分離部１１１からのエンハンスメント画像をフィルタ処理部１１４に供給する。

　ステップＳ７７において、バンドオフセット算出部１１３は、エンハンスメント画像の帯域情報とオフセットをオフセット情報として可逆符号化部７６に供給する。

　ステップＳ７８において、フィルタ処理部１１４は、バンドオフセット算出部１１３から供給されるエンハンスメント画像のオフセットと帯域情報に基づいて、エンハンスメント画像に対してフィルタ処理を行う。そして、フィルタ処理部１１４は、フィルタ処理後のエンハンスメント画像を図１２の適応ループフィルタ８４に供給し、処理はステップＳ７９に進む。

　ステップＳ７９において、バンドオフセット算出部１１３は、図１２の色域変換部９２からのベース画像と、画面並べ替えバッファ７２から出力されるエンハンスメント画像とに基づいて、バンドオフセット処理における予め決められた帯域に対するベース画像のオフセットを算出する。バンドオフセット算出部１１３は、そのオフセットと色域変換部９２からのベース画像とをフィルタ処理部１１４に供給する。また、バンドオフセット算出部１１３は、ベース画像のオフセットと、ベース画像の種類情報としてのバンドオフセット処理を表す種類情報とを、オフセット情報として可逆符号化部７６に供給する。

　ステップＳ８０において、フィルタ処理部１１４は、バンドオフセット算出部１１３から供給されるベース画像のオフセットに基づいて、ベース画像に対してフィルタ処理を行う。フィルタ処理部１１４は、フィルタ処理後のベース画像をフレームメモリ８５に供給する。

　以上のように、符号化装置３０は、エンハンスメント画像を符号化する際に参照するベース画像の色域をエンハンスメント画像の色域に変換し、色域変換後のベース画像の所定の帯域に対してフィルタ処理を行う。従って、色域変換の線形近似が成立しない低域や高域における色域変換後のベース画像の精度を向上させ、高精度の色域変換後のベース画像を用いてエンハンスメント画像を符号化することができる。その結果、符号化効率が向上する。

　また、符号化装置３０は、エンハンスメント画像に対して適応オフセット処理を行う適応オフセット部８３で、ベース画像に対するバンドオフセット処理も行うので、回路規模を増加させずに、符号化効率を向上させることができる。

　（復号装置の一実施の形態の構成例）
　図２５は、図１０の符号化装置３０から伝送される全階層の符号化ストリームを復号する、本開示を適用した復号装置の一実施の形態の構成例を示すブロック図である。

　図２５の復号装置１６０は、受け取り部１６１、分離部１６２、ベース復号部１６３、およびエンハンスメント復号部１６４により構成される。

　受け取り部１６１は、図１０の符号化装置３０から伝送されてくる全階層の符号化ストリームを受け取り、分離部１６２に供給する。

　分離部１６２は、受け取り部１６１から供給される全階層の符号化ストリームからベースストリームを分離してベース復号部１６３に供給し、エンハンスメントストリームを分離してエンハンスメント復号部１６４に供給する。

　ベース復号部１６３は、従来のHEVC方式の復号装置と同様に構成され、分離部１６２から供給されるベースストリームをHEVC方式で復号し、ベース画像を生成する。ベース復号部１６３は、ベース画像をエンハンスメント復号部１６４に供給するとともに、出力する。

　エンハンスメント復号部１６４は、分離部１６２から供給されるエンハンスメントストリームをHEVC方式に準ずる方式で復号し、エンハンスメント画像を生成する。このとき、エンハンスメント復号部１６４は、ベース復号部１６３から供給されるベース画像を必要に応じて参照する。エンハンスメント復号部１６４は、生成されたエンハンスメント画像を出力する。

　（エンハンスメント復号部の構成例）
　図２６は、図２５のエンハンスメント復号部１６４の構成例を示すブロック図である。

　図２６のエンハンスメント復号部１６４は、抽出部１８１と復号部１８２により構成される。

　エンハンスメント復号部１６４の抽出部１８１は、図２５の分離部１６２から供給されるエンハンスメントストリームから、パラメータセットと符号化データを抽出し、復号部１８２に供給する。

　復号部１８２は、図２５のベース復号部１６３から供給されるベース画像を参照して、抽出部１８１から供給される符号化データをHEVC方式に準ずる方式で復号する。このとき、復号部１８２は、必要に応じて、抽出部１８１から供給されるパラメータセットも参照する。復号部１８２は、復号の結果得られるエンハンスメント画像を出力する。

　（復号部の構成例）
　図２７は、図２６の復号部１８２の構成例を示すブロック図である。

　図２７の復号部１８２は、蓄積バッファ２０１、可逆復号部２０２、逆量子化部２０３、逆直交変換部２０４、加算部２０５、デブロックフィルタ２０６、適応オフセット部２０７、適応ループフィルタ２０８、画面並べ替えバッファ２０９、D/A変換部２１０、フレームメモリ２１１、スイッチ２１２、イントラ予測部２１３、動き補償部２１４、スイッチ２１５、アップサンプル部２１６、および色域変換部２１７により構成される。

　復号部１８２の蓄積バッファ２０１は、図２６の抽出部１８１から符号化データを受け取り、蓄積する。蓄積バッファ２０１は、蓄積されている符号化データを可逆復号部２０２に供給する。

　可逆復号部２０２は、蓄積バッファ２０１からの符号化データに対して、図１２の可逆符号化部７６の可逆符号化に対応する、可変長復号や、算術復号等の可逆復号を施すことで、量子化された係数と符号化情報を得る。可逆復号部２０２は、量子化された係数を逆量子化部２０３に供給する。また、可逆復号部２０２は、符号化情報としてのイントラ予測モード情報をイントラ予測部２１３に供給し、インター予測モード情報、動きベクトル、参照画像特定情報などを動き補償部２１４に供給する。

　また、可逆復号部２０２は、符号化情報にインター予測モード情報が含まれない場合、スイッチ２１５にイントラ予測部２１３の選択を指示し、インター予測モード情報が含まれる場合、スイッチ２１５に動き補償部２１４の選択を指示する。可逆復号部２０２は、符号化情報としてのオフセット情報を適応オフセット部２０７に供給し、フィルタ係数を適応ループフィルタ２０８に供給する。

　逆量子化部２０３、逆直交変換部２０４、加算部２０５、デブロックフィルタ２０６、適応オフセット部２０７、適応ループフィルタ２０８、フレームメモリ２１１、スイッチ２１２、イントラ予測部２１３、動き補償部２１４、アップサンプル部２１６、および色域変換部２１７は、図１２の逆量子化部７９、逆直交変換部８０、加算部８１、デブロックフィルタ８２、適応オフセット部８３、適応ループフィルタ８４、フレームメモリ８５、スイッチ８６、イントラ予測部８７、動き予測・補償部８８、アップサンプル部９１、および色域変換部９２とそれぞれ同様の処理を行い、これにより、画像が復号される。

　具体的には、逆量子化部２０３は、可逆復号部２０２からの量子化された係数を逆量子化し、その結果得られる直交変換係数を逆直交変換部２０４に供給する。

　逆直交変換部２０４は、逆量子化部２０３からの直交変換係数に対して逆直交変換を行う。逆直交変換部２０４は、逆直交変換の結果得られる残差情報を加算部２０５に供給する。

　加算部２０５は、復号部として機能し、逆直交変換部２０４から供給される復号対象の画像としての残差情報と、スイッチ２１５から供給される予測画像を加算することにより、復号を行う。加算部２０５は、復号の結果得られるエンハンスメント画像をデブロックフィルタ２０６に供給するとともに、フレームメモリ２１１に供給する。なお、スイッチ２１５から予測画像が供給されない場合、加算部２０５は、逆直交変換部２０４から供給される残差情報である画像を復号の結果得られるエンハンスメント画像として、デブロックフィルタ２０６に供給するとともに、フレームメモリ２１１に供給して蓄積させる。

　デブロックフィルタ２０６は、加算部２０５から供給されるエンハンスメント画像に対してデブロッキングフィルタ処理を行い、その結果得られるエンハンスメント画像を適応オフセット部２０７に供給する。

　適応オフセット部２０７は、可逆復号部２０２から供給されるエンハンスメント画像のオフセット情報を用いて、LCUごとに、デブロックフィルタ２０６からのエンハンスメント画像に対して適応オフセット処理を行う。適応オフセット部２０７は、適応オフセット処理後のエンハンスメント画像を、適応ループフィルタ２０８に供給する。

　また、適応オフセット部２０７は、ベース画像のオフセット情報を用いて、LCUごとに、色域変換部２１７から供給されるベース画像に対してバンドオフセット処理を行い、その結果得られるベース画像をフレームメモリ２１１に供給する。

　適応ループフィルタ２０８は、適応オフセット部２０７から供給されるエンハンスメント画像に対して、可逆復号部２０２から供給されるフィルタ係数を用いて、LCUごとに適応ループフィルタ処理を行う。適応ループフィルタ２０８は、その結果得られるエンハンスメント画像をフレームメモリ２１１および画面並べ替えバッファ２０９に供給する。

　画面並べ替えバッファ２０９は、適応ループフィルタ２０８から供給されるエンハンスメント画像をフレーム単位で記憶する。画面並べ替えバッファ２０９は、記憶した符号化のための順番のフレーム単位のエンハンスメント画像を、元の表示の順番に並び替え、D/A変換部２１０に供給する。

　D/A変換部２１０は、画面並べ替えバッファ２０９から供給されるフレーム単位のエンハンスメント画像をD/A変換し、出力する。

　フレームメモリ２１１は、適応ループフィルタ２０８から供給されるエンハンスメント画像、加算部２０５から供給されるエンハンスメント画像、および色域変換部２１７から供給されるベース画像を蓄積する。フレームメモリ２１１に蓄積されたベース画像やエンハンスメント画像は、参照画像として読み出され、スイッチ２１２を介してイントラ予測部２１３または動き補償部２１４に供給される。

　イントラ予測部２１３は、フレームメモリ２１１からスイッチ２１２を介して読み出された参照画像を用いて、可逆復号部２０２から供給されるイントラ予測モード情報が示す最適イントラ予測モードのイントラ予測を行う。イントラ予測部２１３は、その結果生成される予測画像をスイッチ２１５に供給する。

　動き補償部２１４は、フレームメモリ２１１からスイッチ２１２を介して、可逆復号部２０２から供給される参照画像特定情報により特定される参照画像を読み出す。動き補償部２１４は、可逆復号部２０２から供給される動きベクトルと参照画像を用いて、可逆復号部２０２から供給されるインター予測モード情報が示す最適インター予測モードの動き補償処理を行う。動き補償部２１４は、その結果生成される予測画像をスイッチ２１５に供給する。

　スイッチ２１５は、可逆復号部２０２からイントラ予測部２１３の選択が指示された場合、イントラ予測部２１３から供給される予測画像を加算部２０５に供給する。一方、可逆復号部２０２から動き補償部２１４の選択が指示された場合、スイッチ２１５は、動き補償部２１４から供給される予測画像を加算部２０５に供給する。

　アップサンプル部２１６は、図２５のベース復号部１６３から供給されるベース画像を取得する。アップサンプル部２１６は、図１２のアップサンプル部９１と同様に、ベース画像の解像度をエンハンスメント画像の解像度に変換し、色域変換部２１７に供給する。

　色域変換部２１７は、ビットシフト法、固定ゲインオフセット法、または適応ゲインオフセット法により、アップサンプル部２１６から供給されるベース画像の色域をエンハンスメント画像の色域に変換する。色域変換部２１７は、色域変換後のベース画像を適応オフセット部２０７に供給する。

　（適応オフセット部の構成例）
　図２８は、図２７の適応オフセット部２０７の構成例を示すブロック図である。

　図２８の適応オフセット部２０７は、分離部２３１、エッジオフセット取得部２３２、バンドオフセット取得部２３３、およびフィルタ処理部２３４により構成される。

　適応オフセット部２０７の分離部２３１は、図２７の可逆復号部２０２から供給されるエンハンスメント画像のオフセット情報の種類情報が２である場合、デブロックフィルタ２０６からのエンハンスメント画像をエッジオフセット取得部２３２に供給する。一方、エンハンスメント画像のオフセット情報の種類情報が１である場合、分離部２３１は、デブロックフィルタ８２からのエンハンスメント画像をバンドオフセット取得部２３３に供給する。

　また、エンハンスメント画像のオフセット情報の種類情報が０である場合、分離部２３１は、デブロックフィルタ２０６からのエンハンスメント画像をそのまま図２７の適応ループフィルタ２０８に供給する。

　エッジオフセット取得部２３２は、可逆復号部２０２からエンハンスメント画像のオフセット情報に含まれるパターン情報と各カテゴリのオフセットを取得し、フィルタ処理部２３４に供給する。また、エッジオフセット取得部２３２は、分離部２３１から供給されるエンハンスメント画像をフィルタ処理部２３４に供給する。

　バンドオフセット取得部２３３は、可逆復号部２０２からエンハンスメント画像のオフセット情報に含まれる帯域情報とオフセットを取得し、フィルタ処理部２３４に供給する。また、エッジオフセット取得部２３２は、分離部２３１から供給されるエンハンスメント画像をフィルタ処理部２３４に供給する。

　また、バンドオフセット取得部２３３は、可逆復号部２０２からベース画像のオフセット情報に含まれるオフセットを取得し、フィルタ処理部２３４に供給する。また、バンドオフセット取得部２３３は、図２５のベース復号部１６３から供給されるベース画像をフィルタ処理部２３４に供給する。

　フィルタ処理部２３４は、エッジオフセット取得部２３２から供給される各カテゴリのオフセットとパターン情報とに基づいて、図１４のフィルタ処理部１１４と同様に、エンハンスメント画像に対してフィルタ処理を行う。

　また、フィルタ処理部２３４は、バンドオフセット取得部２３３から供給されるエンハンスメント画像のオフセットと帯域情報に基づいて、フィルタ処理部１１４と同様に、エンハンスメント画像に対してフィルタ処理を行う。

　さらに、フィルタ処理部２３４は、バンドオフセット取得部２３３から供給されるベース画像のオフセットに基づいて、フィルタ処理部１１４と同様に、ベース画像の予め決められた帯域に対してオフセットを用いたフィルタ処理を行う。フィルタ処理部２３４は、フィルタ処理後のエンハンスメント画像を図２７の適応ループフィルタ２０８に供給し、フィルタ処理後のベース画像をフレームメモリ２１１に供給する。

　（復号装置の処理の説明）
　図２９は、図２５の復号装置１６０の階層復号処理を説明するフローチャートである。

　図２９のステップＳ１１１において、復号装置１６０の受け取り部１６１は、図１０の符号化装置３０から伝送されてくる全階層の符号化ストリームを受け取り、分離部１６２に供給する。

　ステップＳ１１２において、分離部１６２は、全階層の符号化ストリームからベースストリームとエンハンスメントストリームを分離する。分離部１６２は、ベースストリームをベース復号部１６３に供給し、エンハンスメントストリームをエンハンスメント復号部１６４に供給する。

　ステップＳ１１３において、ベース復号部１６３は、分離部１６２から供給されるベースストリームをHEVC方式で復号し、ベース画像を生成する。ベース復号部１６３は、生成されたベース画像をエンハンスメント復号部１６４に供給するとともに、出力する。

　ステップＳ１１４において、エンハンスメント復号部１６４の抽出部１８１（図２６）は、分離部１６２から供給されるエンハンスメントストリームからパラメータセットと符号化データを抽出する。

　ステップＳ１１５において、復号部１８２のアップサンプル部２１６（図２７）は、ベース復号部１６３から供給されるベース画像の解像度をエンハンスメント画像の解像度に変換し、色域変換部２１７に供給する。

　ステップＳ１１６において、色域変換部２１７は、ビットシフト法、固定ゲインオフセット法、または適応ゲインオフセット法により、アップサンプル部２１６から供給されるベース画像の色域をエンハンスメント画像の色域に変換する。色域変換部２１７は、色域変換後のベース画像を適応オフセット部２０７に供給する。

　ステップＳ１１７において、復号部１８２は、色域変換後のベース画像を参照して、抽出部１８１から供給される符号化データをHEVC方式に準ずる方式で復号するエンハンスメント復号処理を行う。このエンハンスメント復号処理の詳細は、後述する図３０を参照して説明する。そして、処理は終了する。

　図３０は、図２９のステップＳ１１７のエンハンスメント復号処理の詳細を説明するフローチャートである。

　図３０のステップＳ１３０において、エンハンスメント復号部１８２の蓄積バッファ２０１（図２７）は、図２６の抽出部１８１からフレーム単位の符号化データを受け取り、蓄積する。蓄積バッファ２０１は、蓄積されている符号化データを可逆復号部２０２に供給する。

　ステップＳ１３１において、可逆復号部２０２は、蓄積バッファ２０１からの符号化データを可逆復号し、量子化された係数と符号化情報を得る。可逆復号部２０２は、量子化された係数を逆量子化部２０３に供給する。また、可逆復号部２０２は、符号化情報としてのイントラ予測モード情報をイントラ予測部２１３に供給し、インター予測モード情報、動きベクトル、参照画像特定情報などを動き補償部２１４に供給する。

　ステップＳ１３２において、逆量子化部２０３は、可逆復号部２０２からの量子化された係数を逆量子化し、その結果得られる直交変換係数を逆直交変換部２０４に供給する。ステップＳ１３３において、逆直交変換部２０４は、逆量子化部２０３からの直交変換係数に対して逆直交変換を施し、その結果得られる残差情報を加算部２０５に供給する。

　ステップＳ１３４において、動き補償部２１４は、可逆復号部２０２からインター予測モード情報が供給されたかどうかを判定する。ステップＳ１３４でインター予測モード情報が供給されたと判定された場合、処理はステップＳ１３５に進む。

　ステップＳ１３５において、動き補償部２１４は、可逆復号部２０２から供給される参照画像特定情報に基づいて参照画像を読み出し、動きベクトルと参照画像を用いて、インター予測モード情報が示す最適インター予測モードの動き補償処理を行う。動き補償部２１４は、その結果生成される予測画像を、スイッチ２１５を介して加算部２０５に供給し、処理をステップＳ１３７に進める。

　一方、ステップＳ１３４でインター予測モード情報が供給されていないと判定された場合、即ちイントラ予測モード情報がイントラ予測部２１３に供給された場合、処理はステップＳ１３６に進む。

　ステップＳ１３６において、イントラ予測部２１３は、フレームメモリ２１１からスイッチ２１２を介して読み出された参照画像を用いてイントラ予測処理を行う。イントラ予測部２１３は、その結果生成される予測画像を、スイッチ２１５を介して加算部２０５に供給し、処理をステップＳ１３７に進める。

　ステップＳ１３７において、加算部２０５は、逆直交変換部２０４から供給される残差情報と、スイッチ２１５から供給される予測画像を加算する。加算部２０５は、その結果得られるエンハンスメント画像をデブロックフィルタ２０６に供給するとともに、フレームメモリ２１１に供給する。

　ステップＳ１３８において、デブロックフィルタ２０６は、加算部２０５から供給されるエンハンスメント画像に対してデブロッキングフィルタ処理を行い、ブロック歪を除去する。デブロックフィルタ２０６は、その結果得られるエンハンスメント画像を適応オフセット部２０７に供給する。

　ステップＳ１３９において、適応オフセット部２０７は、デブロックフィルタ２０６から供給されるエンハンスメント画像と色域変換部９２から供給されるベース画像に対して、LCUごとに適応オフセット処理を行う。この適応オフセット処理の詳細は、後述する図３１を参照して説明する。

　ステップＳ１４０において、適応ループフィルタ２０８は、適応オフセット部２０７から供給されるエンハンスメント画像に対して、可逆復号部２０２から供給されるフィルタ係数を用いて、LCUごとに適応ループフィルタ処理を行う。適応ループフィルタ２０８は、その結果得られるエンハンスメント画像をフレームメモリ２１１および画面並べ替えバッファ２０９に供給する。

　ステップＳ１４１において、フレームメモリ２１１は、加算部２０５から供給されるエンハンスメント画像、適応ループフィルタ２０８から供給されるエンハンスメント画像、および適応オフセット部２０７から供給されるベース画像を蓄積する。フレームメモリ２１１に蓄積されたベース画像やエンハンスメント画像は、参照画像としてスイッチ２１２を介してイントラ予測部２１３または動き補償部２１４に供給される。

　ステップＳ１４２において、画面並べ替えバッファ２０９は、適応ループフィルタ２０８から供給されるエンハンスメント画像をフレーム単位で記憶し、記憶した符号化のための順番のフレーム単位のエンハンスメント画像を、元の表示の順番に並び替え、D/A変換部２１０に供給する。

　ステップＳ１４３において、D/A変換部２１０は、画面並べ替えバッファ２０９から供給されるフレーム単位のエンハンスメント画像をD/A変換し、出力する。そして、処理は、図２９のステップＳ１１７に戻り、終了する。

　図３１は、図３０のステップＳ１３９の適応オフセット処理の詳細を説明するフローチャートである。

　図３１のステップＳ１６１において、適応オフセット部２０７の分離部２３１（図２８）は、図２７の可逆復号部２０２から供給されるエンハンスメント画像のオフセット情報に含まれる種類情報を取得する。

　ステップＳ１６２において種類情報が２である場合、分離部２３１は、デブロックフィルタ２０６からのエンハンスメント画像をエッジオフセット取得部２３２に供給し、処理をステップＳ１６３に進める。

　ステップＳ１６３において、エッジオフセット取得部２３２は、可逆復号部２０２からエンハンスメント画像のオフセット情報に含まれるパターン情報と各カテゴリのオフセットを取得し、フィルタ処理部２３４に供給する。また、エッジオフセット取得部２３２は、分離部２３１から供給されるエンハンスメント画像をフィルタ処理部２３４に供給する。

　ステップＳ１６４において、フィルタ処理部２３４は、エッジオフセット取得部２３２から供給される各カテゴリのオフセットとパターン情報とに基づいて、エンハンスメント画像に対してフィルタ処理を行う。フィルタ処理部２３４は、フィルタ処理後のエンハンスメント画像を図２７の適応ループフィルタ２０８に供給し、処理をステップＳ１６８に進める。

　一方、ステップＳ１６２で種類情報が２ではないと判定された場合、ステップＳ１６５において、分離部２３１は、種類情報が１であるかどうかを判定する。ステップＳ１６５で種類情報が１であると判定された場合、分離部２３１は、デブロックフィルタ８２からのエンハンスメント画像をバンドオフセット取得部２３３に供給する。

　ステップＳ１６６において、バンドオフセット取得部２３３は、可逆復号部２０２からエンハンスメント画像のオフセット情報に含まれる帯域情報とオフセットを取得し、フィルタ処理部２３４に供給する。また、エッジオフセット取得部２３２は、分離部２３１から供給されるエンハンスメント画像をフィルタ処理部２３４に供給する。

　ステップＳ１６７において、フィルタ処理部２３４は、バンドオフセット取得部２３３から供給されるエンハンスメント画像のオフセットと帯域情報に基づいて、エンハンスメント画像に対してフィルタ処理を行う。フィルタ処理部２３４は、フィルタ処理後のエンハンスメント画像を適応ループフィルタ２０８に供給し、処理をステップＳ１６８に進める。

　また、ステップＳ１６５で種類情報が１ではないと判定された場合、即ち種類情報が０である場合、分離部２３１は、デブロックフィルタ２０６からのエンハンスメント画像をそのまま図２７の適応ループフィルタ２０８に供給し、処理をステップＳ１６８に進める。

　ステップＳ１６８において、バンドオフセット取得部２３３は、可逆復号部２０２からベース画像のオフセット情報に含まれるオフセットを取得し、フィルタ処理部２３４に供給する。また、バンドオフセット取得部２３３は、図２５のベース復号部１６３から供給されるベース画像をフィルタ処理部２３４に供給する。

　ステップＳ１６９において、フィルタ処理部２３４は、バンドオフセット取得部２３３から供給されるベース画像のオフセットに基づいて、ベース画像の予め決められた帯域に対してオフセットを用いたフィルタ処理を行う。フィルタ処理部２３４は、フィルタ処理後のベース画像をフレームメモリ２１１に供給する。そして、処理は、図３０のステップＳ１３９に戻り、ステップＳ１４０に進む。

　以上のように、復号装置１６０は、エンハンスメント画像を復号する際に参照するベース画像の色域をエンハンスメント画像の色域に変換し、色域変換後のベース画像の所定の帯域に対してフィルタ処理を行う。従って、色域変換の線形近似が成立しない低域や高域における色域変換後のベース画像の精度を向上させ、高精度の色域変換後のベース画像を用いてエンハンスメント画像を復号することができる。その結果、符号化装置３０により生成される符号化効率が向上されたエンハンスメントストリームを復号することができる。

　なお、第１実施の形態では、レイヤ数は2であるものとしたが、レイヤ数は2以上であってもよい。

　また、第１実施の形態では、ベース画像がHEVC方式で符号化されたが、AVC方式で符号化されるようにしてもよい。

　さらに、第１実施の形態では、色域変換後のベース画像に対して必ず適応オフセット処理が行われたが、必要に応じて行われるようにしてもよい。この場合、適応オフセット処理が行われないとき、ベース画像に対するオフセット情報の種類情報が０とされる。

　また、第１実施の形態では、ベース画像に対してバンドオフセット処理を行ったが、他のフィルタ処理を行うようにしてもよい。

　さらに、第１実施の形態では、ベース画像のバンドオフセット処理における帯域が固定されていたが、その帯域は可変であってもよい。この場合、エンハンスメント画像の場合と同様に、帯域情報が、符号化装置３０から復号装置１６０に伝送される。

　また、第１実施の形態では、ベース画像の種類情報がオフセット情報に含まれたが、ベース画像の種類情報はオフセット情報に含まれず、ベース画像の種類情報は１であるものとして適応オフセット処理が行われるようにしてもよい。

　＜Scalable機能による符号化の他の例＞
　図３２は、Scalable機能による符号化の他の例を示す。

　図３２に示されるように、Scalable機能による符号化では、各レイヤ(同一レイヤ)において、量子化パラメータの差分をとることもできる：
　(1)base-layer：
　　(1-1)dQP(base layer)＝Current_CU_QP(base layer)－LCU_QP(base layer)
　　(1-2)dQP(base layer)＝Current_CU_QP(base layer)－Previsous_CU_QP(base layer)
　　(1-3)dQP(base layer)＝Current_CU_QP(base layer)－Slice_QP(base layer)
　(2)non-base-layer：
　　(2-1)dQP(non-base layer)＝Current_CU_QP(non-base layer)－LCU_QP(non-base layer)
　　(2-2)dQP(non-base layer)＝CurrentQP(non-base layer)－PrevisousQP(non-base layer)
　　(2-3)dQP(non-base layer)＝Current_CU_QP(non-base layer)－Slice_QP(non-base layer)

　また、各レイヤ(異なるレイヤ)において、量子化パラメータの差分をとることもできる：
　(3)base-layer/ non-base layer：
　　(3-1)dQP(inter-layer)＝Slice_QP(base layer)－Slice_QP(non-base layer)
　　(3-2)dQP(inter-layer)＝LCU_QP(base layer)－LCU_QP(non-base layer)
　(4)non-base layer / non-base layer ：
　　(4-1)dQP(inter-layer)＝Slice_QP(non-base layer i)－Slice_QP(non-base layer j)
　　(4-2)dQP(inter-layer)＝LCU_QP(non-base layer i)－LCU_QP(non-base layer j)

　この場合、上記(1)乃至(4)を組み合わせて用いることもできる。たとえば、ノンベースレイヤでは、ベースレイヤとノンベースレイヤとの間においてスライスレベルで量子化パラメータの差分をとる手法(3-1と2-3とを組み合わせる)、ベースレイヤとノンベースレイヤとの間においてLCUレベルで量子化パラメータの差分をとる手法(3-2と2-1とを組み合わせる)、が考えられる。このように、差分を繰り返して適用することにより、階層符号化を行った場合においても、符号化効率を向上させることができる。

　上述した手法と同様に、上記の各dQPに対して、値が0でないdQPが存在するか否かを識別するフラグをセットすることもできる。

　＜第２実施の形態＞
　（本開示を適用したコンピュータの説明）
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図３３は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）５０１，ROM（Read Only Memory）５０２，RAM（Random Access Memory）５０３は、バス５０４により相互に接続されている。

　バス５０４には、さらに、入出力インタフェース５０５が接続されている。入出力インタフェース５０５には、入力部５０６、出力部５０７、記憶部５０８、通信部５０９、及びドライブ５１０が接続されている。

　入力部５０６は、キーボード、マウス、マイクロホンなどよりなる。出力部５０７は、ディスプレイ、スピーカなどよりなる。記憶部５０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部５０９は、ネットワークインタフェースなどよりなる。ドライブ５１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア５１１を駆動する。

　以上のように構成されるコンピュータでは、CPU５０１が、例えば、記憶部５０８に記憶されているプログラムを、入出力インタフェース５０５及びバス５０４を介して、RAM５０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU５０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア５１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブルメディア５１１をドライブ５１０に装着することにより、入出力インタフェース５０５を介して、記憶部５０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部５０９で受信し、記憶部５０８にインストールすることができる。その他、プログラムは、ROM５０２や記憶部５０８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　＜第３実施の形態＞
　（多視画像点符号化・多視点画像復号への適用）
　上述した一連の処理は、多視点画像符号化・多視点画像復号に適用することができる。図３４は、多視点画像符号化方式の一例を示す。

図３４に示されるように、多視点画像は、複数の視点（ビュー（view））の画像を含む。この多視点画像の複数のビューは、他のビューの画像を利用せずに自身のビューの画像のみを用いて符号化・復号を行うベースビューと、他のビューの画像を利用して符号化・復号を行うノンベースビューとによりなる。ノンベースビューは、ベースビューの画像を利用するようにしても良いし、他のノンベースビューの画像を利用するようにしてもよい。

図３４のような多視点画像を符号化・復号する場合、各ビューの画像を符号化・復号するが、この各ビューの符号化・復号に対して、上述した第１実施の形態の方法を適用するようにしてもよい。このようにすることにより、色域ごとに階層化された画像の符号化効率を向上させることができる。

さらに、各ビューの符号化・復号において、上述した第１実施の形態の方法で使用されるフラグやパラメータを共有するようにしてもよい。より具体的には、例えば、オフセット情報のシンタクス要素等を、各ビューの符号化・復号において共有するようにしてもよい。もちろん、これら以外の必要な情報も、各ビューの符号化・復号において共有するようにしてもよい。

　このようにすることにより、冗長な情報の伝送を抑制し、伝送する情報量（符号量）を低減することができる（つまり、符号化効率の低減を抑制することができる）。

（多視点画像符号化装置）
図３５は、上述した多視点画像符号化を行う多視点画像符号化装置を示す図である。図３５に示されるように、多視点画像符号化装置６００は、符号化部６０１、符号化部６０２、および多重化部６０３を有する。

符号化部６０１は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部６０２は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部６０３は、符号化部６０１において生成されたベースビュー画像符号化ストリームと、符号化部６０２において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。

この多視点画像符号化装置６００の符号化部６０１および符号化部６０２に対して、符号化装置３０（図１０）を適用することができる。つまり、各ビューに対する符号化において、色域ごとに階層化された画像の符号化効率を向上させることができる。また、符号化部６０１および符号化部６０２は、互いに同一のフラグやパラメータ（例えば、画像間の処理に関するシンタクス要素等）を用いて、符号化を行うことができる（すなわち、フラグやパラメータを共有することができる）ので、符号化効率の低減を抑制することができる。

（多視点画像復号装置）
図３６は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。図３６に示されるように、多視点画像復号装置６１０は、逆多重化部６１１、復号部６１２、および復号部６１３を有する。

逆多重化部６１１は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部６１２は、逆多重化部６１１により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部６１３は、逆多重化部６１１により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。

この多視点画像復号装置６１０の復号部６１２および復号部６１３に対して、復号装置１６０（図２５）を適用することができる。つまり、各ビューに対する復号において、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。また、復号部６１２および復号部６１３は、互いに同一のフラグやパラメータ（例えば、画像間の処理に関するシンタクス要素等）を用いて、復号を行うことができる（すなわち、フラグやパラメータを共有することができる）ので、符号化効率の低減を抑制することができる。

　＜第４実施の形態＞
　（テレビジョン装置の構成例）
　図３７は、本開示を適用したテレビジョン装置の概略構成を例示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース部９０９を有している。さらに、テレビジョン装置９００は、制御部９１０、ユーザインタフェース部９１１等を有している。

　チューナ９０２は、アンテナ９０１で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ビットストリームをデマルチプレクサ９０３に出力する。

　デマルチプレクサ９０３は、符号化ビットストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ９０４に出力する。また、デマルチプレクサ９０３は、ＥＰＧ（Electronic Program Guide）等のデータのパケットを制御部９１０に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。

　デコーダ９０４は、パケットの復号化処理を行い、復号処理化によって生成された映像データを映像信号処理部９０５、音声データを音声信号処理部９０７に出力する。

　映像信号処理部９０５は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部９０５は、表示部９０６に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部９０５は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部９０５は、このようにして生成した映像データに基づいて駆動信号を生成して表示部９０６を駆動する。

　表示部９０６は、映像信号処理部９０５からの駆動信号に基づき表示デバイス（例えば液晶表示素子等）を駆動して、番組の映像などを表示させる。

　音声信号処理部９０７は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのＤ／Ａ変換処理や増幅処理を行いスピーカ９０８に供給することで音声出力を行う。

　外部インタフェース部９０９は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。

　制御部９１０にはユーザインタフェース部９１１が接続されている。ユーザインタフェース部９１１は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９１０に供給する。

　制御部９１０は、ＣＰＵ(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータ、ＥＰＧデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置９００の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、テレビジョン装置９００がユーザ操作に応じた動作となるように各部を制御する。

　なお、テレビジョン装置９００では、チューナ９０２、デマルチプレクサ９０３、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース部９０９等と制御部９１０を接続するためバス９１２が設けられている。

　このように構成されたテレビジョン装置では、デコーダ９０４に本願の復号装置（復号方法）の機能が設けられる。このため、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。

　＜第５実施の形態＞
　（携帯電話機の構成例）
　図３８は、本開示を適用した携帯電話機の概略構成を例示している。携帯電話機９２０は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１を有している。これらは、バス９３３を介して互いに接続されている。

　また、通信部９２２にはアンテナ９２１が接続されており、音声コーデック９２３には、スピーカ９２４とマイクロホン９２５が接続されている。さらに制御部９３１には、操作部９３２が接続されている。

　携帯電話機９２０は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

　音声通話モードにおいて、マイクロホン９２５で生成された音声信号は、音声コーデック９２３で音声データへの変換やデータ圧縮が行われて通信部９２２に供給される。通信部９２２は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部９２２は、送信信号をアンテナ９２１に供給して図示しない基地局へ送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック９２３に供給する。音声コーデック９２３は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ９２４に出力する。

　また、データ通信モードにおいて、メール送信を行う場合、制御部９３１は、操作部９３２の操作によって入力された文字データを受け付けて、入力された文字を表示部９３０に表示する。また、制御部９３１は、操作部９３２におけるユーザ指示等に基づいてメールデータを生成して通信部９２２に供給する。通信部９２２は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部９３０に供給して、メール内容の表示を行う。

　なお、携帯電話機９２０は、受信したメールデータを、記録再生部９２９で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、ＲＡＭや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、またはメモリカード等のリムーバブルメディアである。

　データ通信モードにおいて画像データを送信する場合、カメラ部９２６で生成された画像データを、画像処理部９２７に供給する。画像処理部９２７は、画像データの符号化処理を行い、符号化データを生成する。

　多重分離部９２８は、画像処理部９２７で生成された符号化データと、音声コーデック９２３から供給された音声データを所定の方式で多重化して通信部９２２に供給する。通信部９２２は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部９２８に供給する。多重分離部９２８は、多重化データの分離を行い、符号化データを画像処理部９２７、音声データを音声コーデック９２３に供給する。画像処理部９２７は、符号化データの復号化処理を行い、画像データを生成する。この画像データを表示部９３０に供給して、受信した画像の表示を行う。音声コーデック９２３は、音声データをアナログ音声信号に変換してスピーカ９２４に供給して、受信した音声を出力する。

　このように構成された携帯電話装置では、画像処理部９２７に本願の符号化装置および復号装置（符号化方法および復号方法）の機能が設けられる。このため、色域ごとに階層化された画像の符号化効率を向上させることができる。また、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。

　＜第６実施の形態＞
　（記録再生装置の構成例）
　図３９は、本開示を適用した記録再生装置の概略構成を例示している。記録再生装置９４０は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置９４０は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置９４０は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。

　記録再生装置９４０は、チューナ９４１、外部インタフェース部９４２、エンコーダ９４３、ＨＤＤ（Hard Disk Drive）部９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen Display）部９４８、制御部９４９、ユーザインタフェース部９５０を有している。

　チューナ９４１は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ９４１は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ９４６に出力する。

　外部インタフェース部９４２は、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース部、ＵＳＢインタフェース、フラッシュメモリインタフェース等の少なくともいずれかで構成されている。外部インタフェース部９４２は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。

　エンコーダ９４３は、外部インタフェース部９４２から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームをセレクタ９４６に出力する。

　ＨＤＤ部９４４は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。

　ディスクドライブ９４５は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばＤＶＤディスク（ＤＶＤ－Ｖｉｄｅｏ、ＤＶＤ－ＲＡＭ、ＤＶＤ－Ｒ、ＤＶＤ－ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）やＢｌｕ－ｒａｙ（登録商標）ディスク等である。

　セレクタ９４６は、映像や音声の記録時には、チューナ９４１またはエンコーダ９４３からのいずれかの符号化ビットストリームを選択して、ＨＤＤ部９４４やディスクドライブ９４５のいずれかに供給する。また、セレクタ９４６は、映像や音声の再生時に、ＨＤＤ部９４４またはディスクドライブ９４５から出力された符号化ビットストリームをデコーダ９４７に供給する。

　デコーダ９４７は、符号化ビットストリームの復号化処理を行う。デコーダ９４７は、復号処理化を行うことにより生成された映像データをＯＳＤ部９４８に供給する。また、デコーダ９４７は、復号処理化を行うことにより生成された音声データを出力する。

　ＯＳＤ部９４８は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ９４７から出力された映像データに重畳して出力する。

　制御部９４９には、ユーザインタフェース部９５０が接続されている。ユーザインタフェース部９５０は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９４９に供給する。

　制御部９４９は、ＣＰＵやメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置９４０の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、記録再生装置９４０がユーザ操作に応じた動作となるように各部を制御する。

　このように構成された記録再生装置では、デコーダ９４７に本願の復号装置（復号方法）の機能が設けられる。このため、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。

　＜第７実施の形態＞
　（撮像装置の構成例）
　図４０は、本開示を適用した撮像装置の概略構成を例示している。撮像装置９６０は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。

　撮像装置９６０は、光学ブロック９６１、撮像部９６２、カメラ信号処理部９６３、画像データ処理部９６４、表示部９６５、外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０を有している。また、制御部９７０には、ユーザインタフェース部９７１が接続されている。さらに、画像データ処理部９６４や外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０等は、バス９７２を介して接続されている。

　光学ブロック９６１は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤまたはＣＭＯＳイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部９６３に供給する。

　カメラ信号処理部９６３は、撮像部９６２から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部９６３は、カメラ信号処理後の画像データを画像データ処理部９６４に供給する。

　画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データの符号化処理を行う。画像データ処理部９６４は、符号化処理を行うことにより生成された符号化データを外部インタフェース部９６６やメディアドライブ９６８に供給する。また、画像データ処理部９６４は、外部インタフェース部９６６やメディアドライブ９６８から供給された符号化データの復号化処理を行う。画像データ処理部９６４は、復号化処理を行うことにより生成された画像データを表示部９６５に供給する。また、画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データを表示部９６５に供給する処理や、ＯＳＤ部９６９から取得した表示用データを、画像データに重畳させて表示部９６５に供給する。

　ＯＳＤ部９６９は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部９６４に出力する。

　外部インタフェース部９６６は、例えば、ＵＳＢ入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部９６６には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部９６６は、ＬＡＮやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部９７０は、例えば、ユーザインタフェース部９７１からの指示にしたがって、メディアドライブ９６８から符号化データを読み出し、それを外部インタフェース部９６６から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部９７０は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部９６６を介して取得し、それを画像データ処理部９６４に供給したりすることができる。

　メディアドライブ９６８で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触IC（Integrated Circuit）カード等であってもよい。

　また、メディアドライブ９６８と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやＳＳＤ（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

　制御部９７０は、ＣＰＵを用いて構成されている。メモリ部９６７は、制御部９７０により実行されるプログラムや制御部９７０が処理を行う上で必要な各種のデータ等を記憶する。メモリ部９６７に記憶されているプログラムは、撮像装置９６０の起動時などの所定タイミングで制御部９７０により読み出されて実行される。制御部９７０は、プログラムを実行することで、撮像装置９６０がユーザ操作に応じた動作となるように各部を制御する。

　このように構成された撮像装置では、画像データ処理部９６４に本願の符号化装置および復号装置（符号化方法および復号方法）の機能が設けられる。このため、色域ごとに階層化された画像の符号化効率を向上させることができる。また、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。

　＜スケーラブル符号化の応用例＞
　（第１のシステム）
　次に、scalable機能による符号化であるスケーラブル符号化（階層符号化）されたスケーラブル符号化データの具体的な利用例について説明する。スケーラブル符号化は、例えば、図４１に示される例のように、伝送するデータの選択のために利用される。

　図４１に示されるデータ伝送システム１０００において、配信サーバ１００２は、スケーラブル符号化データ記憶部１００１に記憶されているスケーラブル符号化データを読み出し、ネットワーク１００３を介して、パーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置に配信する。

　その際、配信サーバ１００２は、端末装置の能力や通信環境等に応じて、適切な品質の符号化データを選択して伝送する。配信サーバ１００２が不要に高品質なデータを伝送しても、端末装置において高画質な画像を得られるとは限らず、遅延やオーバーフローの発生要因となる恐れがある。また、不要に通信帯域を占有したり、端末装置の負荷を不要に増大させたりしてしまう恐れもある。逆に、配信サーバ１００２が不要に低品質なデータを伝送しても、端末装置において十分な画質の画像を得ることができない恐れがある。そのため、配信サーバ１００２は、スケーラブル符号化データ記憶部１００１に記憶されているスケーラブル符号化データを、適宜、端末装置の能力や通信環境等に対して適切な品質の符号化データとして読み出し、伝送する。

　例えば、スケーラブル符号化データ記憶部１００１は、スケーラブルに符号化されたスケーラブル符号化データ（BL+EL）１０１１を記憶するとする。このスケーラブル符号化データ（BL+EL）１０１１は、ベースレイヤとエンハンスメントレイヤの両方を含む符号化データであり、復号することにより、ベースレイヤの画像およびエンハンスメントレイヤの画像の両方を得ることができるデータである。

　配信サーバ１００２は、データを伝送する端末装置の能力や通信環境等に応じて、適切なレイヤを選択し、そのレイヤのデータを読み出す。例えば、配信サーバ１００２は、処理能力の高いパーソナルコンピュータ１００４やタブレットデバイス１００６に対しては、高品質なスケーラブル符号化データ（BL+EL）１０１１をスケーラブル符号化データ記憶部１００１から読み出し、そのまま伝送する。これに対して、例えば、配信サーバ１００２は、処理能力の低いAV機器１００５や携帯電話機１００７に対しては、スケーラブル符号化データ（BL+EL）１０１１からベースレイヤのデータを抽出し、スケーラブル符号化データ（BL+EL）１０１１と同じコンテンツのデータであるが、スケーラブル符号化データ（BL+EL）１０１１よりも低品質なスケーラブル符号化データ（BL）１０１２として伝送する。

　このようにスケーラブル符号化データを用いることにより、データ量を容易に調整することができるので、遅延やオーバーフローの発生を抑制したり、端末装置や通信媒体の負荷の不要な増大を抑制したりすることができる。また、スケーラブル符号化データ（BL+EL）１０１１は、レイヤ間の冗長性が低減されているので、各レイヤの符号化データを個別のデータとする場合よりもそのデータ量を低減させることができる。したがって、スケーラブル符号化データ記憶部１００１の記憶領域をより効率よく使用することができる。

　なお、パーソナルコンピュータ１００４乃至携帯電話機１００７のように、端末装置には様々な装置を適用することができるので、端末装置のハードウエアの性能は、装置によって異なる。また、端末装置が実行するアプリケーションも様々であるので、そのソフトウエアの能力も様々である。さらに、通信媒体となるネットワーク１００３も、例えばインターネットやLAN（Local Area Network）等、有線若しくは無線、またはその両方を含むあらゆる通信回線網を適用することができ、そのデータ伝送能力は様々である。さらに、他の通信等によっても変化する恐れがある。

　そこで、配信サーバ１００２は、データ伝送を開始する前に、データの伝送先となる端末装置と通信を行い、端末装置のハードウエア性能や、端末装置が実行するアプリケーション（ソフトウエア）の性能等といった端末装置の能力に関する情報、並びに、ネットワーク１００３の利用可能帯域幅等の通信環境に関する情報を得るようにしてもよい。そして、配信サーバ１００２が、ここで得た情報を基に、適切なレイヤを選択するようにしてもよい。

　なお、レイヤの抽出は、端末装置において行うようにしてもよい。例えば、パーソナルコンピュータ１００４が、伝送されたスケーラブル符号化データ（BL+EL）１０１１を復号し、ベースレイヤの画像を表示しても良いし、エンハンスメントレイヤの画像を表示しても良い。また、例えば、パーソナルコンピュータ１００４が、伝送されたスケーラブル符号化データ（BL+EL）１０１１から、ベースレイヤのスケーラブル符号化データ（BL）１０１２を抽出し、記憶したり、他の装置に転送したり、復号してベースレイヤの画像を表示したりするようにしてもよい。

　もちろん、スケーラブル符号化データ記憶部１００１、配信サーバ１００２、ネットワーク１００３、および端末装置の数はいずれも任意である。また、以上においては、配信サーバ１００２がデータを端末装置に伝送する例について説明したが、利用例はこれに限定されない。データ伝送システム１０００は、スケーラブル符号化された符号化データを端末装置に伝送する際、端末装置の能力や通信環境等に応じて、適切なレイヤを選択して伝送するシステムであれば、任意のシステムに適用することができる。

　（第２のシステム）
　また、スケーラブル符号化は、例えば、図４２に示される例のように、複数の通信媒体を介する伝送のために利用される。

　図４２に示されるデータ伝送システム１１００において、放送局１１０１は、地上波放送１１１１により、ベースレイヤのスケーラブル符号化データ（BL）１１２１を伝送する。また、放送局１１０１は、有線若しくは無線またはその両方の通信網よりなる任意のネットワーク１１１２を介して、エンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を伝送する（例えばパケット化して伝送する）。

　端末装置１１０２は、放送局１１０１が放送する地上波放送１１１１の受信機能を有し、この地上波放送１１１１を介して伝送されるベースレイヤのスケーラブル符号化データ（BL）１１２１を受け取る。また、端末装置１１０２は、ネットワーク１１１２を介した通信を行う通信機能をさらに有し、このネットワーク１１１２を介して伝送されるエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を受け取る。

　端末装置１１０２は、例えばユーザ指示等に応じて、地上波放送１１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）１１２１を、復号してベースレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

　また、端末装置１１０２は、例えばユーザ指示等に応じて、地上波放送１１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）１１２１と、ネットワーク１１１２を介して取得したエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２とを合成して、スケーラブル符号化データ（BL+EL）を得たり、それを復号してエンハンスメントレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

　以上のように、スケーラブル符号化データは、例えばレイヤ毎に異なる通信媒体を介して伝送させることができる。したがって、負荷を分散させることができ、遅延やオーバーフローの発生を抑制することができる。

　また、状況に応じて、伝送に使用する通信媒体を、レイヤ毎に選択することができるようにしてもよい。例えば、データ量が比較的多いベースレイヤのスケーラブル符号化データ（BL）１１２１を帯域幅の広い通信媒体を介して伝送させ、データ量が比較的少ないエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を帯域幅の狭い通信媒体を介して伝送させるようにしてもよい。また、例えば、エンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を伝送する通信媒体を、ネットワーク１１１２とするか、地上波放送１１１１とするかを、ネットワーク１１１２の利用可能帯域幅に応じて切り替えるようにしてもよい。もちろん、任意のレイヤのデータについて同様である。

　このように制御することにより、データ伝送における負荷の増大を、より抑制することができる。

　もちろん、レイヤ数は任意であり、伝送に利用する通信媒体の数も任意である。また、データ配信先となる端末装置１１０２の数も任意である。さらに、以上においては、放送局１１０１からの放送を例に説明したが、利用例はこれに限定されない。データ伝送システム１１００は、スケーラブル符号化された符号化データを、レイヤを単位として複数に分割し、複数の回線を介して伝送するシステムであれば、任意のシステムに適用することができる。

　（第３のシステム）
　また、スケーラブル符号化は、例えば、図４３に示される例のように、符号化データの記憶に利用される。

　図４３に示される撮像システム１２００において、撮像装置１２０１は、被写体１２１１を撮像して得られた画像データをスケーラブル符号化し、スケーラブル符号化データ（BL+EL）１２２１として、スケーラブル符号化データ記憶装置１２０２に供給する。

　スケーラブル符号化データ記憶装置１２０２は、撮像装置１２０１から供給されるスケーラブル符号化データ（BL+EL）１２２１を、状況に応じた品質で記憶する。例えば、通常時の場合、スケーラブル符号化データ記憶装置１２０２は、スケーラブル符号化データ（BL+EL）１２２１からベースレイヤのデータを抽出し、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）１２２２として記憶する。これに対して、例えば、注目時の場合、スケーラブル符号化データ記憶装置１２０２は、高品質でデータ量の多いスケーラブル符号化データ（BL+EL）１２２１のまま記憶する。

　このようにすることにより、スケーラブル符号化データ記憶装置１２０２は、必要な場合のみ、画像を高画質に保存することができるので、画質劣化による画像の価値の低減を抑制しながら、データ量の増大を抑制することができ、記憶領域の利用効率を向上させることができる。

　例えば、撮像装置１２０１が監視カメラであるとする。撮像画像に監視対象（例えば侵入者）が写っていない場合（通常時の場合）、撮像画像の内容は重要でない可能性が高いので、データ量の低減が優先され、その画像データ（スケーラブル符号化データ）は、低品質に記憶される。これに対して、撮像画像に監視対象が被写体１２１１として写っている場合（注目時の場合）、その撮像画像の内容は重要である可能性が高いので、画質が優先され、その画像データ（スケーラブル符号化データ）は、高品質に記憶される。

　なお、通常時であるか注目時であるかは、例えば、スケーラブル符号化データ記憶装置１２０２が、画像を解析することにより判定しても良い。また、撮像装置１２０１が判定し、その判定結果をスケーラブル符号化データ記憶装置１２０２に伝送するようにしてもよい。

　なお、通常時であるか注目時であるかの判定基準は任意であり、判定基準とする画像の内容は任意である。もちろん、画像の内容以外の条件を判定基準とすることもできる。例えば、収録した音声の大きさや波形等に応じて切り替えるようにしてもよいし、所定の時間毎に切り替えるようにしてもよいし、ユーザ指示等の外部からの指示によって切り替えるようにしてもよい。

　また、以上においては、通常時と注目時の２つの状態を切り替える例を説明したが、状態の数は任意であり、例えば、通常時、やや注目時、注目時、非常に注目時等のように、３つ以上の状態を切り替えるようにしてもよい。ただし、この切り替える状態の上限数は、スケーラブル符号化データのレイヤ数に依存する。

　また、撮像装置１２０１が、スケーラブル符号化のレイヤ数を、状態に応じて決定するようにしてもよい。例えば、通常時の場合、撮像装置１２０１が、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）１２２２を生成し、スケーラブル符号化データ記憶装置１２０２に供給するようにしてもよい。また、例えば、注目時の場合、撮像装置１２０１が、高品質でデータ量の多いベースレイヤのスケーラブル符号化データ（BL+EL）１２２１を生成し、スケーラブル符号化データ記憶装置１２０２に供給するようにしてもよい。

　以上においては、監視カメラを例に説明したが、この撮像システム１２００の用途は任意であり、監視カメラに限定されない。

　＜第８実施の形態＞
　（実施のその他の例）
以上において本技術を適用する装置やシステム等の例を説明したが、本技術は、これに限らず、このような装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。

　（ビデオセットの構成例）
本技術をセットとして実施する場合の例について、図４４を参照して説明する。図４４は、本技術を適用したビデオセットの概略的な構成の一例を示している。

近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

図４４に示されるビデオセット１３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

図４４に示されるように、ビデオセット１３００は、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４等のモジュール群と、コネクティビティ１３２１、カメラ１３２２、およびセンサ１３２３等の関連する機能を有するデバイスとを有する。

モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

図４４の例の場合、ビデオモジュール１３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ、ビデオプロセッサ、ブロードバンドモデム１３３３、およびRFモジュール１３３４を有する。

プロセッサは、所定の機能を有する構成をSoC（System On a Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large Scale Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

図４４のアプリケーションプロセッサ１３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ１３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ１３３２等、ビデオモジュール１３１１内外の構成を必要に応じて制御することもできる。

ビデオプロセッサ１３３２は、画像の符号化・復号（その一方若しくは両方）に関する機能を有するプロセッサである。

ブロードバンドモデム１３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（またはその両方）の広帯域通信に関する処理を行うプロセッサ（若しくはモジュール）である。例えば、ブロードバンドモデム１３３３は、送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。例えば、ブロードバンドモデム１３３３は、ビデオプロセッサ１３３２が処理する画像データや画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報をデジタル変調・復調することができる。

RFモジュール１３３４は、アンテナを介して送受信されるRF（Radio Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール１３３４は、ブロードバンドモデム１３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール１３３４は、フロントエンドモジュール１３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

なお、図４４において点線１３４１に示されるように、アプリケーションプロセッサ１３３１とビデオプロセッサ１３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

外部メモリ１３１２は、ビデオモジュール１３１１の外部に設けられた、ビデオモジュール１３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ１３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic Random Access Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

パワーマネージメントモジュール１３１３は、ビデオモジュール１３１１（ビデオモジュール１３１１内の各構成）への電力供給を管理し、制御する。

フロントエンドモジュール１３１４は、RFモジュール１３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図４４に示されるように、フロントエンドモジュール１３１４は、例えば、アンテナ部１３５１、フィルタ１３５２、および増幅部１３５３を有する。

アンテナ部１３５１は、無線信号を送受信するアンテナおよびその周辺の構成を有する。アンテナ部１３５１は、増幅部１３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ１３５２に供給する。フィルタ１３５２は、アンテナ部１３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール１３３４に供給する。増幅部１３５３は、RFモジュール１３３４から供給されるRF信号を増幅し、アンテナ部１３５１に供給する。

コネクティビティ１３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ１３２１の物理構成は、任意である。例えば、コネクティビティ１３２１は、ブロードバンドモデム１３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

例えば、コネクティビティ１３２１が、Bluetooth（登録商標）、IEEE 802.11（例えばWi-Fi（Wireless Fidelity、登録商標））、NFC（Near Field Communication）、IrDA（InfraRed Data Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ１３２１が、USB（Universal Serial Bus）、HDMI（登録商標）（High-Definition Multimedia Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ１３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

なお、コネクティビティ１３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ１３２１が、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid State Drive）、NAS（Network Attached Storage）等も含む）を有するようにしてもよい。また、コネクティビティ１３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

カメラ１３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ１３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ１３３２に供給されて符号化される。

センサ１３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ１３２３により検出されたデータは、例えば、アプリケーションプロセッサ１３３１に供給されてアプリケーション等により利用される。

以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

以上のような構成のビデオセット１３００において、後述するようにビデオプロセッサ１３３２に本技術を適用することができる。したがって、ビデオセット１３００は、本技術を適用したセットとして実施することができる。

　（ビデオプロセッサの構成例）
図４５は、本技術を適用したビデオプロセッサ１３３２（図４４）の概略的な構成の一例を示している。

図４５の例の場合、ビデオプロセッサ１３３２は、ビデオ信号およびオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータおよびオーディオデータを復号し、ビデオ信号およびオーディオ信号を再生出力する機能とを有する。

図４５に示されるように、ビデオプロセッサ１３３２は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、フレームメモリ１４０５、およびメモリ制御部１４０６を有する。また、ビデオプロセッサ１３３２は、エンコード・デコードエンジン１４０７、ビデオES（Elementary Stream）バッファ１４０８Ａおよび１４０８Ｂ、並びに、オーディオESバッファ１４０９Ａおよび１４０９Ｂを有する。さらに、ビデオプロセッサ１３３２は、オーディオエンコーダ１４１０、オーディオデコーダ１４１１、多重化部（MUX（Multiplexer））１４１２、逆多重化部（DMUX（Demultiplexer））１４１３、およびストリームバッファ１４１４を有する。

ビデオ入力処理部１４０１は、例えばコネクティビティ１３２１（図４４）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部１４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部１４０３は、画像データに対して、ビデオ出力処理部１４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部１４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部１４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ１３２１（図４４）等に出力する。

フレームメモリ１４０５は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、およびエンコード・デコードエンジン１４０７によって共用される画像データ用のメモリである。フレームメモリ１４０５は、例えばDRAM等の半導体メモリとして実現される。

メモリ制御部１４０６は、エンコード・デコードエンジン１４０７からの同期信号を受けて、アクセス管理テーブル１４０６Ａに書き込まれたフレームメモリ１４０５へのアクセススケジュールに従ってフレームメモリ１４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル１４０６Ａは、エンコード・デコードエンジン１４０７、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３等で実行される処理に応じて、メモリ制御部１４０６により更新される。

エンコード・デコードエンジン１４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン１４０７は、フレームメモリ１４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ１４０８Ａに順次書き込む。また、例えば、ビデオESバッファ１４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ１４０５に順次書き込む。エンコード・デコードエンジン１４０７は、これらの符号化や復号において、フレームメモリ１４０５を作業領域として使用する。また、エンコード・デコードエンジン１４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部１４０６に対して同期信号を出力する。

ビデオESバッファ１４０８Ａは、エンコード・デコードエンジン１４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。ビデオESバッファ１４０８Ｂは、逆多重化部（DMUX）１４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン１４０７に供給する。

オーディオESバッファ１４０９Ａは、オーディオエンコーダ１４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。オーディオESバッファ１４０９Ｂは、逆多重化部（DMUX）１４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ１４１１に供給する。

オーディオエンコーダ１４１０は、例えばコネクティビティ１３２１（図４４）等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode number 3）方式等の所定の方式で符号化する。オーディオエンコーダ１４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ１４０９Ａに順次書き込む。オーディオデコーダ１４１１は、オーディオESバッファ１４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ１３２１（図４４）等に供給する。

多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）１４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）１４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

逆多重化部（DMUX）１４１３は、多重化部（MUX）１４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）１４１３は、ストリームバッファ１４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）１４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）１４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等（いずれも図４４）から供給されたトランスポートストリームを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１により（図４４）各種記録媒体から読み出されたファイルデータを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

ストリームバッファ１４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図４４）等に供給する。

また、例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１（図４４）等に供給し、各種記録媒体に記録させる。

さらに、ストリームバッファ１４１４は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等（いずれも図４４）を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

また、ストリームバッファ１４１４は、例えばコネクティビティ１３２１（図４４）等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

次に、このような構成のビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１（図４４）等からビデオプロセッサ１３３２に入力されたビデオ信号は、ビデオ入力処理部１４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ１４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部１４０２または第２画像拡大縮小部１４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換および拡大縮小処理が行われ、再びフレームメモリ１４０５に書き込まれる。この画像データは、エンコード・デコードエンジン１４０７によって符号化され、ビデオストリームとしてビデオESバッファ１４０８Ａに書き込まれる。

また、コネクティビティ１３２１（図４４）等からビデオプロセッサ１３３２に入力されたオーディオ信号は、オーディオエンコーダ１４１０によって符号化され、オーディオストリームとして、オーディオESバッファ１４０９Ａに書き込まれる。

ビデオESバッファ１４０８Ａのビデオストリームと、オーディオESバッファ１４０９Ａのオーディオストリームは、多重化部（MUX）１４１２に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部（MUX）１４１２により生成されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図４４）等を介して外部ネットワークに出力される。また、多重化部（MUX）１４１２により生成されたファイルデータは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１（図４４）等に出力され、各種記録媒体に記録される。

また、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図４４）等を介して外部ネットワークからビデオプロセッサ１３３２に入力されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。また、例えばコネクティビティ１３２１（図４４）等において各種記録媒体から読み出され、ビデオプロセッサ１３３２に入力されたファイルデータは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。つまり、ビデオプロセッサ１３３２に入力されたトランスポートストリームまたはファイルデータは、逆多重化部（DMUX）１４１３によりビデオストリームとオーディオストリームとに分離される。

オーディオストリームは、オーディオESバッファ１４０９Ｂを介してオーディオデコーダ１４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ１４０８Ｂに書き込まれた後、エンコード・デコードエンジン１４０７により順次読み出されて復号されてフレームメモリ１４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部１４０３によって拡大縮小処理されて、フレームメモリ１４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部１４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、エンコード・デコードエンジン１４０７に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン１４０７が、符号化装置３０や復号装置１６０の機能を有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図３２を参照して上述した効果と同様の効果を得ることができる。

なお、エンコード・デコードエンジン１４０７において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

　（ビデオプロセッサの他の構成例）
図４６は、本技術を適用したビデオプロセッサ１３３２（図４４）の概略的な構成の他の例を示している。図４６の例の場合、ビデオプロセッサ１３３２は、ビデオデータを所定の方式で符号化・復号する機能とを有する。

より具体的には、図４６に示されるように、ビデオプロセッサ１３３２は、制御部１５１１、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、および内部メモリ１５１５を有する。また、ビデオプロセッサ１３３２は、コーデックエンジン１５１６、メモリインタフェース１５１７、多重化・逆多重化部（MUX DMUX）１５１８、ネットワークインタフェース１５１９、およびビデオインタフェース１５２０を有する。

制御部１５１１は、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６等、ビデオプロセッサ１３３２内の各処理部の動作を制御する。

図４６に示されるように、制御部１５１１は、例えば、メインCPU１５３１、サブCPU１５３２、およびシステムコントローラ１５３３を有する。メインCPU１５３１は、ビデオプロセッサ１３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU１５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU１５３２は、メインCPU１５３１の補助的な役割を果たす。例えば、サブCPU１５３２は、メインCPU１５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ１５３３は、メインCPU１５３１およびサブCPU１５３２が実行するプログラムを指定する等、メインCPU１５３１およびサブCPU１５３２の動作を制御する。

ディスプレイインタフェース１５１２は、制御部１５１１の制御の下、画像データを例えばコネクティビティ１３２１（図４４）等に出力する。例えば、ディスプレイインタフェース１５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、またはデジタルデータの画像データのまま、コネクティビティ１３２１（図４４）のモニタ装置等に出力する。

ディスプレイエンジン１５１３は、制御部１５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

画像処理エンジン１５１４は、制御部１５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６により共用される、ビデオプロセッサ１３３２の内部に設けられたメモリである。内部メモリ１５１５は、例えば、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６の間で行われるデータの授受に利用される。例えば、内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６に供給する。この内部メモリ１５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static Random Access Memory）のような比較的（例えば外部メモリ１３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

コーデックエンジン１５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン１５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン１５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化若しくは符号化データの復号を行うようにしてもよい。

図４６に示される例において、コーデックエンジン１５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video１５４１、AVC/H.264１５４２、HEVC/H.265１５４３、HEVC/H.265(Scalable)１５４４、HEVC/H.265(Multi-view)１５４５、およびMPEG-DASH１５５１を有する。

MPEG-2 Video１５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264１５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265１５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)１５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)１５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

MPEG-DASH１５５１は、画像データをMPEG-DASH（MPEG-Dynamic Adaptive Streaming over HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（Hyper Text Transfer Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH１５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video１５４１乃至HEVC/H.265(Multi-view)１５４５を利用する。

メモリインタフェース１５１７は、外部メモリ１３１２用のインタフェースである。画像処理エンジン１５１４やコーデックエンジン１５１６から供給されるデータは、メモリインタフェース１５１７を介して外部メモリ１３１２に供給される。また、外部メモリ１３１２から読み出されたデータは、メモリインタフェース１５１７を介してビデオプロセッサ１３３２（画像処理エンジン１５１４若しくはコーデックエンジン１５１６）に供給される。

多重化・逆多重化部（MUX DMUX）１５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX DMUX）１５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX DMUX）１５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

ネットワークインタフェース１５１９は、例えばブロードバンドモデム１３３３やコネクティビティ１３２１（いずれも図４４）等向けのインタフェースである。ビデオインタフェース１５２０は、例えばコネクティビティ１３２１やカメラ１３２２（いずれも図４４）等向けのインタフェースである。

次に、このようなビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図４４）等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース１５１９を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、例えば、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１（図４４）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてファイルデータに変換され、ビデオインタフェース１５２０を介して例えばコネクティビティ１３２１（図４４）等に出力され、各種記録媒体に記録される。

さらに、例えば、コネクティビティ１３２１（図４４）等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース１５２０を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１（図４４）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース１５１９を介して例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図４４）等に供給され図示せぬ他の装置に伝送される。

なお、ビデオプロセッサ１３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ１５１５や外部メモリ１３１２を利用して行われる。また、パワーマネージメントモジュール１３１３は、例えば制御部１５１１への電力供給を制御する。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、コーデックエンジン１５１６に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン１５１６が、符号化装置３０や復号装置１６０を実現する機能ブロックを有するようにすればよい。例えば、コーデックエンジン１５１６が、このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図３２を参照して上述した効果と同様の効果を得ることができる。

なお、コーデックエンジン１５１６において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

以上にビデオプロセッサ１３３２の構成を２例示したが、ビデオプロセッサ１３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ１３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

　（装置への適用例）

ビデオセット１３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット１３００は、テレビジョン装置９００（図３７）、携帯電話機９２０（図３８）、記録再生装置９４０（図３９）、撮像装置９６０（図４０）等に組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、図１乃至図３２を参照して上述した効果と同様の効果を得ることができる。

また、ビデオセット１３００は、例えば、図４１のデータ伝送システム１０００におけるパーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置、図４２のデータ伝送システム１１００における放送局１１０１および端末装置１１０２、並びに、図４３の撮像システム１２００における撮像装置１２０１およびスケーラブル符号化データ記憶装置１２０２等にも組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、図１乃至図３２を参照して上述した効果と同様の効果を得ることができる。

なお、上述したビデオセット１３００の各構成の一部であっても、ビデオプロセッサ１３３２を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ１３３２のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線１３４１により示されるプロセッサやビデオモジュール１３１１等を本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４を組み合わせ、本技術を適用したビデオユニット１３６１として実施することもできる。いずれの構成の場合であっても、図１乃至図３２を参照して上述した効果と同様の効果を得ることができる。

つまり、ビデオプロセッサ１３３２を含むものであればどのような構成であっても、ビデオセット１３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ１３３２、点線１３４１により示されるプロセッサ、ビデオモジュール１３１１、または、ビデオユニット１３６１を、テレビジョン装置９００（図３７）、携帯電話機９２０（図３８）、記録再生装置９４０（図３９）、撮像装置９６０（図４０）、図４１のデータ伝送システム１０００におけるパーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置、図４２のデータ伝送システム１１００における放送局１１０１および端末装置１１０２、並びに、図４３の撮像システム１２００における撮像装置１２０１およびスケーラブル符号化データ記憶装置１２０２等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット１３００の場合と同様に、図１乃至図３２を参照して上述した効果と同様の効果を得ることができる。

　＜第９実施の形態＞
　（MPEG-DASHの応用例）
　なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化ストリームの中から適切なものをセグメント単位で選択して使用する、例えば、後述するMPEG DASH等のようなHTTPストリーミングのコンテンツ再生システムやWi-Fi規格の無線通信システムにも適用することができる。

　　＜コンテンツ再生システムの概要＞
　まず、図４７乃至図４９を参照し、本技術を適用可能なコンテンツ再生システムについて概略的に説明する。

　以下では、まず、このような各実施形態において共通する基本構成について図４７および図４８を参照して説明する。

　図４７は、コンテンツ再生システムの構成を示した説明図である。図４７に示したように、コンテンツ再生システムは、コンテンツサーバ１６１０、１６１１と、ネットワーク１６１２と、コンテンツ再生装置１６２０（クライアント装置）とを備える。

　コンテンツサーバ１６１０、１６１１とコンテンツ再生装置１６２０は、ネットワーク１６１２を介して接続されている。このネットワーク１６１２は、ネットワーク１６１２に接続されている装置から送信される情報の有線、または無線の伝送路である。

　例えば、ネットワーク１６１２は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet（登録商標）を含む各種のLAN（Local Area Network）、WAN（Wide Area Network）などを含んでもよい。また、ネットワーク１６１２は、IP-VPN（Internet Protocol-Virtual Private Network）などの専用回線網を含んでもよい。

　コンテンツサーバ１６１０は、コンテンツデータを符号化し、符号化ストリームおよび符号化ストリームのメタ情報を含むデータファイルを生成して記憶する。なお、コンテンツサーバ１６１０がMP4形式のデータファイルを生成する場合、符号化ストリームは「mdat」に該当し、メタ情報は「moov」に該当する。

　また、コンテンツデータは、音楽、講演およびラジオ番組などの音楽データや、映画、テレビジョン番組、ビデオプログラム、写真、文書、絵画および図表などの映像データや、ゲームおよびソフトウエアなどであってもよい。

　ここで、コンテンツサーバ１６１０は、同一コンテンツに関し、異なるビットレートで複数のデータファイルを生成する。またコンテンツサーバ１６１１は、コンテンツ再生装置１６２０からのコンテンツの再生要求に対して、コンテンツサーバ１６１０のURLの情報に、コンテンツ再生装置１６２０で当該URLに付加させるパラメータの情報を含めてコンテンツ再生装置１６２０に送信する。以下、図４８を参照して当該事項について具体的に説明する。

　図４８は、図４７のコンテンツ再生システムにおけるデータの流れを示した説明図である。コンテンツサーバ１６１０は、同一のコンテンツデータを異なるビットレートで符号化し、図４８に示したように例えば２MbpsのファイルＡ、１．５MbpsのファイルＢ、１MbpsのファイルＣを生成する。相対的に、ファイルＡはハイビットレートであり、ファイルＢは標準ビットレートであり、ファイルＣはロービットレートである。

　また、図４８に示したように、各ファイルの符号化ストリームは複数のセグメントに区分されている。例えば、ファイルＡの符号化ストリームは「Ａ１」、「Ａ２」、「Ａ３」、・・・「Ａｎ」というセグメントに区分されており、ファイルＢの符号化ストリームは「Ｂ１」、「Ｂ２」、「Ｂ３」、・・・「Ｂｎ」というセグメントに区分されており、ファイルＣの符号化ストリームは「Ｃ１」、「Ｃ２」、「Ｃ３」、・・・「Ｃｎ」というセグメントに区分されている。

　なお、各セグメントはMP4のシンクサンプル（たとえば、AVC/H．264の映像符号化ではIDR－ピクチャ）で始まる単独で再生可能な１または２以上の映像符号化ストリームおよび音声符号化ストリームより構成サンプルで構成されてもよい。例えば、一秒３０フレームのビデオデータが１５フレーム固定長のGOP（Group of Picture）にて符号化されていた場合、各セグメントは、４GOPに相当する２秒分の映像ならびに音声符号化ストリームであっても、２０GOPに相当する１０秒分の映像ならびに音声符号化ストリームであってもよい。

　また、各ファイルにおける配置順番が同一のセグメントによる再生範囲（コンテンツの先頭からの時間位置の範囲）は同一である。例えば、セグメント「Ａ２」、セグメント「Ｂ２」、およびセグメント「Ｃ２」の再生範囲は同一であり、各セグメントが２秒分の符号化ストリームである場合、セグメント「Ａ２」、セグメント「Ｂ２」、およびセグメント「Ｃ２」の再生範囲は、いずれもコンテンツの２秒乃至４秒である。

　コンテンツサーバ１６１０は、このような複数のセグメントから構成されるファイルＡ乃至ファイルＣを生成すると、ファイルＡ乃至ファイルＣを記憶する。そして、コンテンツサーバ１６１０は、図４８に示したように、異なるファイルを構成するセグメントをコンテンツ再生装置１６２０に順次に送信し、コンテンツ再生装置１６２０は、受信したセグメントをストリーミング再生する。

　ここで、本実施形態によるコンテンツサーバ１６１０は、各符号化ストリームのビットレート情報およびアクセス情報を含むプレイリストファイル（以下、MPD：Media Presentation Description）をコンテンツ再生装置１６２０に送信し、コンテンツ再生装置１６２０は、MPDに基づき、複数のビットレートのうちのいずれかのビットレートを選択し、選択したビットレートに対応するセグメントの送信をコンテンツサーバ１６１０に要求する。

　図４７では、１つのコンテンツサーバ１６１０のみが図示されているが、本開示は係る例に限定されないことは言うまでもない。

　図４９は、MPDの具体例を示した説明図である。図４９に示したように、MPDには、異なるビットレート（BANDWIDTH）を有する複数の符号化ストリームに関するアクセス情報が含まれる。例えば、図４９に示したMPDは、２５６Kbps、１．０２４Mbps、１．３８４Mbps、１．５３６Mbps、２．０４８Mbpsの各々の符号化ストリームが存在することを示す共に、各符号化ストリームに関するアクセス情報を含む。コンテンツ再生装置１６２０は、かかるMPDに基づき、ストリーミング再生する符号化ストリームのビットレートを動的に変更することが可能である。

　なお、図４７にはコンテンツ再生装置１６２０の一例として携帯端末を示しているが、コンテンツ再生装置１６２０はかかる例に限定されない。例えば、コンテンツ再生装置１６２０は、PC（Personal Computer）、家庭用映像処理装置（DVDレコーダ、ビデオデッキなど）、PDA（Personal Digital Assistants）、家庭用ゲーム機器、家電機器などの情報処理装置であってもよい。また、コンテンツ再生装置１６２０は、携帯電話、PHS（Personal Handyphone System）、携帯用音楽再生装置、携帯用映像処理装置、携帯用ゲーム機器などの情報処理装置であってもよい。

　　＜コンテンツサーバ１６１０の構成＞
　以上、図４７乃至図４９を参照し、コンテンツ再生システムの概要を説明した。続いて、図５０を参照し、コンテンツサーバ１６１０の構成を説明する。

　図５０は、コンテンツサーバ１６１０の構成を示した機能ブロック図である。図５０に示したように、コンテンツサーバ１６１０は、ファイル生成部１６３１と、記憶部１６３２と、通信部１６３３とを備える。

　ファイル生成部１６３１は、コンテンツデータを符号化するエンコーダ１６４１を備え、同一のコンテンツでビットレートが異なる複数の符号化ストリーム、および上述したMPDを生成する。例えば、ファイル生成部１６３１は、２５６Kbps、１．０２４Mbps、１．３８４Mbps、１．５３６Mbps、２．０４８Mbpsの各々の符号化ストリームを生成した場合、図４９に示したようなMPDを生成する。

　記憶部１６３２は、ファイル生成部１６３１により生成されたビットレートが異なる複数の符号化ストリームおよびMPDを記憶する。この記憶部１６３２は、不揮発性メモリ、磁気ディスク、光ディスク、およびMO（Magneto Optical）ディスクなどの記憶媒体であってもよい。不揮発性メモリとしては、例えば、EEPROM（Electrically Erasable Programmable Read-Only Memory）、EPROM（Erasable Programmable ROM）があげられる。また、磁気ディスクとしては、ハードディスクおよび円盤型磁性体ディスクなどがあげられる。また、光ディスクとしては、CD（Compact Disc）、DVD-R（Digital Versatile Disc Recordable）およびBD（Blu-Ray Disc（登録商標））などがあげられる。

　通信部１６３３は、コンテンツ再生装置１６２０とのインタフェースであって、ネットワーク１６１２を介してコンテンツ再生装置１６２０と通信する。より詳細には、通信部１６３３は、HTTPに従ってコンテンツ再生装置１６２０と通信するHTTPサーバとしての機能を有する。例えば、通信部１６３３は、MPDをコンテンツ再生装置１６２０に送信し、HTTPに従ってコンテンツ再生装置１６２０からMPDに基づいて要求された符号化ストリームを記憶部１６３２から抽出し、HTTPレスポンスとしてコンテンツ再生装置１６２０に符号化ストリームを送信する。

　　＜コンテンツ再生装置１６２０の構成＞
　以上、本実施形態によるコンテンツサーバ１６１０の構成を説明した。続いて、図５１を参照し、コンテンツ再生装置１６２０の構成を説明する。

　図５１は、コンテンツ再生装置１６２０の構成を示した機能ブロック図である。図５１に示したように、コンテンツ再生装置１６２０は、通信部１６５１と、記憶部１６５２と、再生部１６５３と、選択部１６５４と、現在地取得部１６５６とを備える。

　通信部１６５１は、コンテンツサーバ１６１０とのインタフェースであって、コンテンツサーバ１６１０に対してデータを要求し、コンテンツサーバ１６１０からデータを取得する。より詳細には、通信部１６５１は、HTTPに従ってコンテンツ再生装置１６２０と通信するHTTPクライアントとしての機能を有する。例えば、通信部１６５１は、HTTP Rangeを利用することにより、コンテンツサーバ１６１０からMPDや符号化ストリームのセグメントを選択的に取得することができる。

　記憶部１６５２は、コンテンツの再生に関する種々の情報を記憶する。例えば、通信部１６５１によりコンテンツサーバ１６１０から取得されるセグメントを順次にバッファリングする。記憶部１６５２にバッファリングされた符号化ストリームのセグメントは、FIFO（First In First Out）で再生部１６５３へ順次に供給される。

　また記憶部１６５２は、後述のコンテンツサーバ１６１１から要求された、MPDに記述されているコンテンツのURLへのパラメータの付加指示に基づき、通信部１６５１でURLにパラメータを付加して、そのURLへアクセスするための定義を記憶する。

　再生部１６５３は、記憶部１６５２から供給されるセグメントを順次に再生する。具体的には、再生部１６５３は、セグメントのデコード、DA変換、およびレンダリングなどを行う。

　選択部１６５４は、MPDに含まれるいずれのビットレートに対応する符号化ストリームのセグメントを取得するかを同一コンテンツ内で順次に選択する。例えば、選択部１６５４がネットワーク１６１２の帯域に応じてセグメント「Ａ１」、「Ｂ２」、「Ａ３」を順次に選択すると、図４８に示したように、通信部１６５１がコンテンツサーバ１６１０からセグメント「Ａ１」、「Ｂ２」、「Ａ３」を順次に取得する。

　現在地取得部１６５６は、コンテンツ再生装置１６２０の現在の位置を取得するものであり、例えばGPS（Global Positioning System）受信機などの現在地を取得するモジュールで構成されていても良い。また現在地取得部１６５６は、無線ネットワークを使用してコンテンツ再生装置１６２０の現在の位置を取得するものであってもよい。

　　＜コンテンツサーバ１６１１の構成＞
　図５２は、コンテンツサーバ１６１１の構成例を示す説明図である。図５２に示したように、コンテンツサーバ１６１１は、記憶部１６７１と、通信部１６７２とを備える。

　記憶部１６７１は、MPDのURLの情報を記憶する。MPDのURLの情報は、コンテンツの再生を要求するコンテンツ再生装置１６２０からの求めに応じ、コンテンツサーバ１６１１からコンテンツ再生装置１６２０へ送信される。また記憶部１６７１は、コンテンツ再生装置１６２０へのMPDのURLの情報を提供する際に、当該MPDに記述されているURLにコンテンツ再生装置１６２０でパラメータを付加させる際の定義情報を記憶する。

　通信部１６７２は、コンテンツ再生装置１６２０とのインタフェースであって、ネットワーク１６１２を介してコンテンツ再生装置１６２０と通信する。すなわち通信部１６７２は、コンテンツの再生を要求するコンテンツ再生装置１６２０から、MPDのURLの情報の要求を受信し、コンテンツ再生装置１６２０へMPDのURLの情報を送信する。通信部１６７２から送信されるMPDのURLには、コンテンツ再生装置１６２０でパラメータを付加させるための情報が含まれる。

　コンテンツ再生装置１６２０でMPDのURLに付加させるパラメータについては、コンテンツサーバ１６１１およびコンテンツ再生装置１６２０で共有する定義情報で様々に設定することが出来る。一例を挙げれば、コンテンツ再生装置１６２０の現在位置、コンテンツ再生装置１６２０を使用するユーザのユーザID、コンテンツ再生装置１６２０のメモリサイズ、コンテンツ再生装置１６２０のストレージの容量などの情報を、コンテンツ再生装置１６２０でMPDのURLに付加させることが出来る。

　以上のような構成のコンテンツ再生システムにおいて、図１乃至図３２を参照して上述したような本技術を適用することにより、図１乃至図３２を参照して上述した効果と同様の効果を得ることができる。

　すなわち、コンテンツサーバ１６１０のエンコーダ１６４１は、上述した実施形態に係る符号化装置（例えば、符号化装置１０）の機能を有する。また、コンテンツ再生装置１６２０の再生部１６５３は、上述した実施形態に係る復号装置（例えば、復号装置１６０）の機能を有する。それにより、色域ごとに階層化された画像の符号化効率を向上させることができる。また、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。

　また、コンテンツ再生システムにおいて、本技術により生成された符号化ストリームを送受信することにより、色域ごとに階層化された画像の符号化効率を向上させることができる。また、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。

　＜第１０実施の形態＞
　　＜Wi-Fi規格の無線通信システムの応用例＞
　本技術を適用可能な無線通信システムにおける無線通信装置の基本動作例について説明する。

　　＜無線通信装置の基本動作例＞
　最初に、P2P（Peer to Peer）接続を確立して特定のアプリケーションを動作させるまでの無線パケット送受信がなされる。

　次に、第２層で接続する前に、使用する特定のアプリケーションを指定してからP2P接続を確立して特定のアプリケーションを動作させるまでの無線パケット送受信がなされる。その後、第２層での接続後に、特定のアプリケーションを起動する場合の無線パケット送受信がなされる。

　　＜特定のアプリケーション動作開始時における通信例＞
　図５３および図５４は、上述したP2P（Peer to Peer）接続を確立して特定のアプリケーションを動作させるまでの無線パケット送受信の例であり、無線通信の基礎となる各装置による通信処理例を示すシーケンスチャートである。具体的には、Wi-Fi Allianceにおいて標準化されているWi-Fiダイレクト（Direct）規格（Wi-Fi P2Pと呼ばれることもある）での接続に至るダイレクト接続の確立手順の一例を示す。

　ここで、Wi-Fiダイレクトでは、複数の無線通信装置が互いの存在を検出する（Device Discovery、Service Discovery）。そして、接続機器選択を行うとその選択された機器間において、WPS（Wi-Fi Protected Setup）で機器認証を行うことによりダイレクト接続を確立する。また、Wi-Fiダイレクトでは、複数の無線通信装置が親機（Group Owner）または子機（Client）の何れとしての役割を担うかを決定して通信グループを形成する。

　ただし、この通信処理例では、一部のパケット送受信については省略して示す。例えば、初回接続時には、上述したように、WPSを使うためのパケット交換が必要であり、AuthenticationRequest／Responseのやり取り等においてもパケット交換が必要となる。しかしながら、図５３および図５４では、これらのパケット交換についての図示を省略し、２回目以降の接続についてのみを示す。

　なお、図５３および図５４では、第１無線通信装置１７０１および第２無線通信装置１７０２間における通信処理例を示すが、他の無線通信装置間における通信処理についても同様である。

　最初に、第１無線通信装置１７０１および第２無線通信装置１７０２間においてDevice Discoveryが行われる（１７１１）。例えば、第１無線通信装置１７０１は、Probe request（応答要求信号）を送信し、このProbe requestに対するProbe response（応答信号）を第２無線通信装置１７０２から受信する。これにより、第１無線通信装置１７０１および第２無線通信装置１７０２は、互いの存在を発見することができる。また、Device Discoveryにより、相手のデバイス名や種類（TV、PC、スマートフォン等）を取得することができる。

　続いて、第１無線通信装置１７０１および第２無線通信装置１７０２間においてService Discoveryが行われる（１７１２）。例えば、第１無線通信装置１７０１は、Device Discoveryで発見した第２無線通信装置１７０２が対応しているサービスを問い合わせるService Discovery Queryを送信する。そして、第１無線通信装置１７０１は、Service Discovery Responseを第２無線通信装置１７０２から受信することにより、第２無線通信装置１７０２が対応しているサービスを取得する。すなわち、Service Discoveryにより、相手が実行可能なサービス等を取得することができる。相手が実行可能なサービスは、例えば、service、protocol（DLNA（Digital Living Network Alliance） DMR（Digital Media Renderer）等）である。

　続いて、ユーザにより接続相手の選択操作（接続相手選択操作）が行われる（１７１３）。この接続相手選択操作は、第１無線通信装置１７０１および第２無線通信装置１７０２の何れか一方のみに発生することもある。例えば、第１無線通信装置１７０１の表示部に接続相手選択画面が表示され、この接続相手選択画面において接続相手として第２無線通信装置１７０２がユーザ操作により選択される。

　ユーザにより接続相手選択操作が行われると（１７１３）、第１無線通信装置１７０１および第２無線通信装置１７０２間においてGroup Owner Negotiationが行われる（１７１４）。図５３および図５４では、Group Owner Negotiationの結果により、第１無線通信装置１７０１がグループオーナー（Group Owner）１７１５になり、第２無線通信装置１７０２がクライアント（Client）１７１６になる例を示す。

　続いて、第１無線通信装置１７０１および第２無線通信装置１７０２間において、各処理（１７１７乃至１７２０）が行われることにより、ダイレクト接続が確立される。すなわち、Association（Ｌ２（第２層） link確立）（１７１７）、Secure link確立（１７１８）が順次行われる。また、IP Address Assignment（１７１９）、SSDP（Simple Service Discovery Protocol）等によるＬ３上でのＬ４ setup（１７２０）が順次行われる。なお、Ｌ２（layer2）は、第２層（データリンク層）を意味し、Ｌ３（layer3）は、第３層（ネットワーク層）を意味し、Ｌ４（layer4）は、第４層（トランスポート層）を意味する。

　続いて、ユーザにより特定のアプリケーションの指定または起動操作（アプリ指定・起動操作）が行われる（１７２１）。このアプリ指定・起動操作は、第１無線通信装置１７０１および第２無線通信装置１７０２の何れか一方のみに発生することもある。例えば、第１無線通信装置１７０１の表示部にアプリ指定・起動操作画面が表示され、このアプリ指定・起動操作画面において特定のアプリケーションがユーザ操作により選択される。

　ユーザによりアプリ指定・起動操作が行われると（１７２１）、このアプリ指定・起動操作に対応する特定のアプリケーションが第１無線通信装置１７０１および第２無線通信装置１７０２間において実行される（１７２２）。

　ここで、Wi-Fi Direct規格以前の仕様（IEEE802.11で標準化された仕様）の範囲内で、AP（Access Point）－STA（Station）間の接続を行う場合を想定する。この場合には、第２層で接続する前（IEEE802.11用語ではassociation前）には、どのようなデバイスと繋ごうとしているのかを事前に知ることができなかった。

　これに対して、図５３および図５４に示すように、Wi-Fi Directでは、Device discoveryやService Discovery（option）において、接続候補相手を探す際に、接続相手の情報を取得することができる。この接続相手の情報は、例えば、基本的なデバイスのタイプや、対応している特定のアプリケーション等である。そして、その取得された接続相手の情報に基づいて、ユーザに接続相手を選択させることができる。

　この仕組みを拡張して、第２層で接続する前に特定のアプリケーションを指定して、接続相手を選択し、この選択後に、自動的に特定のアプリケーションを起動させる無線通信システムを実現することも可能である。このような場合の接続に至るシーケンスの一例を、図５６に示す。また、この通信処理において送受信されるフレームフォーマット（frame format）の構成例を図５５に示す。

　　＜フレームフォーマットの構成例＞
　図５５は、本技術の基礎となる各装置による通信処理において送受信されるフレームフォーマット（frame format）の構成例を模式的に示す図である。すなわち、図５５には、第２層での接続を確立するためのMAC frameの構成例を示す。具体的には、図５６に示すシーケンスを実現するためのAssociation Request/Response（１７８７）のフレームフォーマットの一例である。

　なお、Frame Control（１７５１）からSequence Control（１７５６）までは、MACヘッダである。また、Association Requestを送信する際には、Frame Control（１７５１）において、Ｂ３Ｂ２＝"０ｂ００"、かつ、Ｂ７Ｂ６Ｂ５Ｂ４＝"０ｂ００００"が設定される。また、Association Responseをencapsulateする際には、Frame Control（１７５１）において、Ｂ３Ｂ２＝"０ｂ００"、かつ、Ｂ７Ｂ６Ｂ５Ｂ４＝"０ｂ０００１"が設定される。なお、「０ｂ００」は、２進法で「００」であることを示し、「０ｂ００００」は、２進法で「００００」であることを示し、「０ｂ０００１」は、２進法で「０００１」であることを示す。

　ここで、図５５に示すMAC frameは、基本的には、IEEE802.11-2007仕様書section7.2．3.4節と7.2．3.5節に記載のAssociation Request/Responseframe formatである。ただし、IEEE802.11仕様書内で定義されているInformation Element（以下、IEと省略）だけでなく、独自に拡張したIEを含めている点が異なる。

　また、Vendor Specific IE（１７６０）であることを示すため、IE Type（Information Element ID（１７６１））には、１０進数で１２７がセットされる。この場合、IEEE802.11－2007仕様7.3．2.26節により、Lengthフィールド（１７６２）と、OUIフィールド（１７６３）が続き、この後にvendor specific content（１７６４）が配置される。

　Vendor specific content（１７６４）の内容としては、最初にvendor specific IEのtypeを示すフィールド（IE type（１７６５））を設ける。そして、この後に、複数のsubelement（１７６６）を格納することができる構成とすることが考えられる。

　subelement（１７６６）の内容として、使われるべき特定のアプリケーションの名称（１７６７）や、その特定のアプリケーション動作時のデバイスの役割（１７６８）を含めることが考えられる。また、特定のアプリケーション、または、その制御のために使われるポート番号等の情報（Ｌ４セットアップのための情報）（１７６９）や、特定のアプリケーション内でのCapabilityに関する情報（Capability情報）を含めることが考えられる。ここで、Capability情報は、例えば、指定する特定のアプリケーションがDLNAの場合に、音声送出／再生に対応している、映像送出／再生に対応している等を特定するための情報である。

　以上のような構成の無線通信システムにおいて、図１乃至図３２を参照して上述したような本技術を適用することにより、図１乃至図３２を参照して上述した効果と同様の効果を得ることができる。すなわち、上述した実施形態に係る符号化装置（例えば、符号化装置１０）と復号装置（例えば、復号装置１６０）の機能を有し、符号化ストリームを送受信することができる。その結果、色域ごとに階層化された画像の符号化効率を向上させることができる。また、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。また、上述した無線通信システムにおいて、本技術により生成された符号化ストリームを送受信することにより、色域ごとに階層化された画像の符号化効率を向上させることができる。また、色域ごとに階層化された画像の符号化効率を向上させた符号化ストリームを復号することができる。

　なお、本明細書では、オフセット情報などの各種情報が、符号化ストリームに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

　本開示は、MPEG,H.26ｘ等のように、離散コサイン変換等の直交変換と動き補償によって圧縮されたビットストリームを、衛星放送、ケーブルＴＶ、インターネット、携帯電話などのネットワークメディアを介して受信する際、または光、磁気ディスク、フラッシュメモリのような記憶メディア上で処理する際に用いられる符号化装置や復号装置に適用することができる。

　また、本明細書では、HEVC方式に準ずる方式で符号化および復号する場合を例にして説明したが、本開示の適用範囲はこれに限らない。色域スケーラブル符号化を行う符号化装置、および、対応する復号装置であれば、他の方式の符号化装置および復号装置に適用することもできる。

　なお、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本開示は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　なお、本開示は、以下のような構成もとることができる。

　（１）
　色域ごとに階層化された画像の第１の階層の符号化画像を受け取る受け取り部と、
　第２の階層の復号画像の色域を前記第１の階層の色域に変換する色域変換部と、
　前記色域変換部により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理部と、
　前記フィルタ処理部によりフィルタ処理された前記第２の階層の復号画像を用いて、前記受け取り部により受け取られた前記第１の階層の符号化画像を復号し、前記第１の階層の復号画像を生成する復号部と
　を備える復号装置。
　（２）
　前記フィルタ処理部は、前記復号部により復号された前記第１の階層の復号画像に対してフィルタ処理を行い、
　前記復号部は、前記フィルタ処理によりフィルタ処理された前記第１の階層の復号画像と前記第２の階層の復号画像を用いて、前記第１の階層の符号化画像を復号する
　前記（１）に記載の復号装置。
　（３）
　前記フィルタ処理部は、前記第２の階層の復号画像の前記所定の帯域と前記第１の階層の復号画像に対してSAO(Sample adaptive offset)処理を行う
　前記（２）に記載の復号装置。
　（４）
　前記フィルタ処理部は、前記第２の階層の復号画像の前記所定の帯域に対してバンドオフセット処理を行う
　前記（３）に記載の復号装置。
　（５）
　前記フィルタ処理部は、前記第２の階層の復号画像の低輝度の帯域に対してバンドオフセット処理を行う
　前記（４）に記載の復号装置。
　（６）
　前記フィルタ処理部は、前記第２の階層の復号画像の高輝度の帯域に対してバンドオフセット処理を行う
　前記（４）または（５）に記載の復号装置。
　（７）
　前記受け取り部は、前記フィルタ処理のパラメータを受け取り、
　前記フィルタ処理部は、前記受け取り部により受け取られた前記パラメータを用いて、前記第２の階層の復号画像の前記所定の帯域に対してフィルタ処理を行う
　前記（１）乃至（６）のいずれかに記載の復号装置。
　（８）
　前記受け取り部は、LCU（Largest Coding Unit）単位の前記パラメータを受け取る
　前記（７）に記載の復号装置。
　（９）
　復号装置が、
　色域ごとに階層化された画像の第１の階層の符号化画像を受け取る受け取りステップと、
　第２の階層の復号画像の色域を前記第１の階層の色域に変換する色域変換ステップと、
　前記色域変換ステップの処理により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理ステップと、
　前記フィルタ処理ステップの処理によりフィルタ処理された前記第２の階層の復号画像を用いて、前記受け取りステップの処理により受け取られた前記第１の階層の符号化画像を復号し、前記第１の階層の復号画像を生成する復号ステップと
　を含む復号方法。
　（１０）
　色域ごとに階層化された画像の第１の階層の画像の符号化に用いる第２の階層の復号画像の色域を、前記第１の階層の色域に変換する色域変換部と、
　前記色域変換部により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理部と、
　前記フィルタ処理によりフィルタ処理された前記第２の階層の復号画像を用いて、前記第１の階層の画像を符号化し、前記第１の階層の符号化画像を生成する符号化部と、
　前記符号化部により生成された前記第１の階層の符号化画像を伝送する伝送部と
　を備える符号化装置。
　（１１）
　前記第１の階層の符号化画像を復号し、前記第１の階層の復号画像を生成する復号部
　をさらに備え、
　前記フィルタ処理は、前記復号部により復号された前記第１の階層の復号画像に対してフィルタ処理を行い、
　前記符号化部は、前記フィルタ処理によりフィルタ処理された前記第１の階層の復号画像と前記第２の階層の復号画像を用いて、前記第１の階層の画像を符号化する
　前記（１０）に記載の符号化装置。
　（１２）
　前記フィルタ処理部は、前記第２の階層の復号画像の前記所定の帯域と前記第１の階層の復号画像に対してSAO(Sample adaptive offset)処理を行う
　前記（１１）に記載の符号化装置。
　（１３）
　前記フィルタ処理部は、前記第２の階層の復号画像の前記所定の帯域に対してバンドオフセット処理を行う
　前記（１２）に記載の符号化装置。
　（１４）
　前記フィルタ処理部は、前記第２の階層の復号画像の低輝度の帯域に対してバンドオフセット処理を行う
　前記（１３）に記載の符号化装置。
　（１５）
　前記フィルタ処理部は、前記第２の階層の復号画像の高輝度の帯域に対してバンドオフセット処理を行う
　前記（１３）または（１４）に記載の符号化装置。
　（１６）
　前記フィルタ処理のパラメータを算出する算出部
　をさらに備え、
　前記フィルタ処理部は、前記算出部により算出された前記パラメータを用いて、前記第２の階層の復号画像の前記所定の帯域に対してフィルタ処理を行い、
　前記伝送部は、前記パラメータを伝送する
　前記（１０）乃至（１５）のいずれかに記載の符号化装置。
　（１７）
　前記算出部は、LCU（Largest Coding Unit）単位で前記パラメータを算出する
　前記（１６）に記載の符号化装置。
　（１８）
　符号化装置が、
　色域ごとに階層化された画像の第１の階層の画像の符号化に用いる第２の階層の復号画像の色域を、前記第１の階層の色域に変換する色域変換ステップと、
　前記色域変換ステップの処理により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理ステップと、
　前記フィルタ処理によりフィルタ処理された前記第２の階層の復号画像を用いて、前記第１の階層の画像を符号化し、前記第１の階層の符号化画像を生成する符号化ステップと、
　前記符号化ステップの処理により生成された前記第１の階層の符号化画像を伝送する伝送ステップと
　を含む符号化方法。

　３０　符号化装置，　３４　伝送部，　７３　演算部，　８１　加算部，　９２　色域変換部，　１１３　バンドオフセット算出部，　１１４　フィルタ処理部，　１６０　復号装置，　１６１　受け取り部，　２０５　加算部，　２１７　色域変換部，　２３４フィルタ処理部

Claims

　色域ごとに階層化された画像の第１の階層の符号化画像を受け取る受け取り部と、
　第２の階層の復号画像の色域を前記第１の階層の色域に変換する色域変換部と、
　前記色域変換部により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理部と、
　前記フィルタ処理部によりフィルタ処理された前記第２の階層の復号画像を用いて、前記受け取り部により受け取られた前記第１の階層の符号化画像を復号し、前記第１の階層の復号画像を生成する復号部と
　を備える復号装置。
　前記フィルタ処理部は、前記復号部により復号された前記第１の階層の復号画像に対してフィルタ処理を行い、
　前記復号部は、前記フィルタ処理によりフィルタ処理された前記第１の階層の復号画像と前記第２の階層の復号画像を用いて、前記第１の階層の符号化画像を復号する
　請求項１に記載の復号装置。
　前記フィルタ処理部は、前記第２の階層の復号画像の前記所定の帯域と前記第１の階層の復号画像に対してSAO(Sample adaptive offset)処理を行う
　請求項２に記載の復号装置。
　前記フィルタ処理部は、前記第２の階層の復号画像の前記所定の帯域に対してバンドオフセット処理を行う
　請求項３に記載の復号装置。
　前記フィルタ処理部は、前記第２の階層の復号画像の低輝度の帯域に対してバンドオフセット処理を行う
　請求項４に記載の復号装置。
　前記フィルタ処理部は、前記第２の階層の復号画像の高輝度の帯域に対してバンドオフセット処理を行う
　請求項４に記載の復号装置。
　前記受け取り部は、前記フィルタ処理のパラメータを受け取り、
　前記フィルタ処理部は、前記受け取り部により受け取られた前記パラメータを用いて、前記第２の階層の復号画像の前記所定の帯域に対してフィルタ処理を行う
　請求項１に記載の復号装置。
　前記受け取り部は、LCU（Largest Coding Unit）単位の前記パラメータを受け取る
　請求項７に記載の復号装置。
　復号装置が、
　色域ごとに階層化された画像の第１の階層の符号化画像を受け取る受け取りステップと、
　第２の階層の復号画像の色域を前記第１の階層の色域に変換する色域変換ステップと、
　前記色域変換ステップの処理により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理ステップと、
　前記フィルタ処理ステップの処理によりフィルタ処理された前記第２の階層の復号画像を用いて、前記受け取りステップの処理により受け取られた前記第１の階層の符号化画像を復号し、前記第１の階層の復号画像を生成する復号ステップと
　を含む復号方法。
　色域ごとに階層化された画像の第１の階層の画像の符号化に用いる第２の階層の復号画像の色域を、前記第１の階層の色域に変換する色域変換部と、
　前記色域変換部により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理部と、
　前記フィルタ処理によりフィルタ処理された前記第２の階層の復号画像を用いて、前記第１の階層の画像を符号化し、前記第１の階層の符号化画像を生成する符号化部と、
　前記符号化部により生成された前記第１の階層の符号化画像を伝送する伝送部と
　を備える符号化装置。
　前記第１の階層の符号化画像を復号し、前記第１の階層の復号画像を生成する復号部
　をさらに備え、
　前記フィルタ処理は、前記復号部により復号された前記第１の階層の復号画像に対してフィルタ処理を行い、
　前記符号化部は、前記フィルタ処理によりフィルタ処理された前記第１の階層の復号画像と前記第２の階層の復号画像を用いて、前記第１の階層の画像を符号化する
　請求項１０に記載の符号化装置。
　前記フィルタ処理部は、前記第２の階層の復号画像の前記所定の帯域と前記第１の階層の復号画像に対してSAO(Sample adaptive offset)処理を行う
　請求項１１に記載の符号化装置。
　前記フィルタ処理部は、前記第２の階層の復号画像の前記所定の帯域に対してバンドオフセット処理を行う
　請求項１２に記載の符号化装置。
　前記フィルタ処理部は、前記第２の階層の復号画像の低輝度の帯域に対してバンドオフセット処理を行う
　請求項１３に記載の符号化装置。
　前記フィルタ処理部は、前記第２の階層の復号画像の高輝度の帯域に対してバンドオフセット処理を行う
　請求項１３に記載の符号化装置。
　前記フィルタ処理のパラメータを算出する算出部
　をさらに備え、
　前記フィルタ処理部は、前記算出部により算出された前記パラメータを用いて、前記第２の階層の復号画像の前記所定の帯域に対してフィルタ処理を行い、
　前記伝送部は、前記パラメータを伝送する
　請求項１０に記載の符号化装置。
　前記算出部は、LCU（Largest Coding Unit）単位で前記パラメータを算出する
　請求項１６に記載の符号化装置。
　符号化装置が、
　色域ごとに階層化された画像の第１の階層の画像の符号化に用いる第２の階層の復号画像の色域を、前記第１の階層の色域に変換する色域変換ステップと、
　前記色域変換ステップの処理により変換された前記第２の階層の復号画像の所定の帯域に対してフィルタ処理を行うフィルタ処理ステップと、
　前記フィルタ処理によりフィルタ処理された前記第２の階層の復号画像を用いて、前記第１の階層の画像を符号化し、前記第１の階層の符号化画像を生成する符号化ステップと、
　前記符号化ステップの処理により生成された前記第１の階層の符号化画像を伝送する伝送ステップと
　を含む符号化方法。