WO2014156707A1

WO2014156707A1 - 画像符号化装置および方法、並びに、画像復号装置および方法

Info

Publication number: WO2014156707A1
Application number: PCT/JP2014/056830
Authority: WO
Inventors: 佐藤　数史
Original assignee: ソニー株式会社
Priority date: 2013-03-29
Filing date: 2014-03-14
Publication date: 2014-10-02

Abstract

本開示は、符号化または復号に必要な記憶容量の増大を抑制することができるようにする画像符号化装置および方法、並びに、画像復号装置および方法に関する。複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データを、精度を落とすことにより情報量を低減してから記憶する。本開示は、例えば、画像データをスケーラブルに符号化する画像符号化装置、または、画像データがスケーラブルに符号化された符号化データを復号する画像復号装置等の画像処理装置に適用することができる。

Description

画像符号化装置および方法、並びに、画像復号装置および方法

本開示は画像符号化装置および方法、並びに、画像復号装置および方法に関し、特に、符号化または復号に必要な記憶容量の増大を抑制することができるようにした画像符号化装置および方法、並びに、画像復号装置および方法に関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮する符号化方式を採用して画像を圧縮符号する装置が普及しつつある。この符号化方式には、例えば、MPEG（Moving Picture Experts Group）などがある。

特に、MPEG2(ISO/IEC 13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準である。例えば、MPEG2は、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4乃至8Mbpsの符号量（ビットレート）が割り当てられる。また、MPEG2圧縮方式を用いることにより、例えば1920×1088画素を持つ高解像度の飛び越し走査画像であれば18乃至22 Mbpsの符号量（ビットレート）が割り当てられる。これにより、高い圧縮率と良好な画質の実現が可能である。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。

更に、近年、当初テレビ会議用の画像符号化を目的として、H.26L （ITU-T（International Telecommunication Union Telecommunication Standardization Sector） Q6/16 VCEG（Video Coding Expert Group））という標準の規格化が進められた。H.26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.26Lをベースに、H.26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われた。

標準化のスケジュールとしては、２００３年３月にはH.264及びMPEG-4 Part10 （Advanced Video Coding、以下AVCと記す）という名の元に国際標準となった。

さらに、このH．264/AVCの拡張として、RGBや4:2:2、4:4:4といった、業務用に必要な符号化ツールや、MPEG-2で規定されていた8x8DCTや量子化マトリクスをも含んだFRExt (Fidelity Range Extension) の標準化が２００５年２月に完了した。これにより、H．264/AVCを用いて、映画に含まれるフィルムノイズをも良好に表現することが可能な符号化方式となって、Blu-Ray Disc（商標）等の幅広いアプリケーションに用いられる運びとなった。

しかしながら、昨今、ハイビジョン画像の4倍の、4000×2000画素程度の画像を圧縮したい、あるいは、インターネットのような、限られた伝送容量の環境において、ハイビジョン画像を配信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、先述の、ITU-T傘下のVCEGにおいて、符号化効率の改善に関する検討が継続され行なわれている。

そこで、現在、AVCより更なる符号化効率の向上を目的として、ITU-Tと、ISO/IECの共同の標準化団体であるJCTVC（Joint Collaboration Team - Video Coding）により、HEVC（High Efficiency Video Coding）と呼ばれる符号化方式の標準化が進められている。HEVC規格については、2013年1月にドラフト版仕様であるCommittee draftが発行されている（例えば、非特許文献１参照）。

HEVCにおいては、動き補償のための内挿フィルタが定められている。例えば、輝度信号は、8タップ（tap）フィルタを用いて、1/4画素精度の動き補償を行う。また、色差信号は、4タップ（tap）フィルタを用いて、1/8画素精度の動き補償を行う。いずれも、処理が16ビット（bit）精度に収まるよう規定されている。これらの係数は、DCT-IFと呼ばれる手法により設計されたものである（例えば、非特許文献２参照）。

ところで、これまでの、MPEG-2やAVCといった画像符号化方式は、画像を複数のレイヤに階層化して符号化するスケーラビリティ（scalability）機能を有していた。HEVCにおいても同様の階層符号化・階層復号（スケーラブル符号化・スケーラブル復号とも称する）が提案されている。

このようなスケーラブル符号化・スケーラブル復号においては、処理対象の画像データは、階層化され、他のレイヤを参照せずに符号化・復号を行うベースレイヤ（Base layer）と、他のレイヤ（ベースレイヤ若しくは他のエンハンスメントレイヤ）を参照して符号化・復号を行うエンハンスメントレイヤ（Enhancement layer）を有する。

例えば、空間解像度がスケーラブルな（レイヤ間で空間解像度が異なる）スペーシャルスケーラビリティ（Spatial Scalability）の場合、ベースレイヤ（Baselayer）の画像をエンハンスメントレイヤの処理に利用するためには、そのベースレイヤの画像をアップサンプル処理する必要がある。このアップサンプル処理において、上述した動き補償のための内挿フィルタと同様の、DCT-IFにより設計されたフィルタを用いることが提案されている（例えば、非特許文献３参照）。

ところで、AVC符号化処理に基づくスケーラブル（Scalable）符号化処理においては、フレーム間予測符号化で符号化されたマクロブロックであるインターブロックの予測誤差信号（残差信号とも称する）に対して、階層間予測を行うことが可能である。HEVC符号化処理に基づくスケーラブル（Scalable）符号化処理においても、これと同様の処理を行うことが提案されている（例えば、非特許文献４参照）。そして、この非特許文献４においても、残差信号のアップサンプル処理に、動き補償のための内挿フィルタを用いることが提案されている。

このようにベースレイヤの残差信号をエンハンスメントレイヤの処理に利用するために、ベースレイヤの残差信号を保持する必要がある。

Benjamin Bross, Woo-Jin Han, Gary J. Sullivan, Jens-Rainer Ohm, Gary J. Sullivan, Ye-Kui Wang, Thomas Wiegand, " High Efficiency Video Coding (HEVC) text specification draft 10 (for FDIS & Consent)", JCTVC-L1003_v4, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 12th Meeting: Geneva, CH, 14-23 Jan. 2013 Ken McCann, Woo-Jin Han, Il-Koo Kim, Jung-Hye Min, Elena Alshina, Alexander Alshin, Tammy Lee, Jianle Chen, Vadim Seregin, Sunil Lee, Yoon-Mi Hong, Min-Su Cheon, Nikolay Shlyakhov, "Samsung's Response to the Call for Proposals on Video Compression Technology", JCTVC-A124, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG111st Meeting: Dresden, DE, 15-23 April, 2010 Jianle Chen, Jill Boyce, Yan Ye, Miska M. Hannuksela, "SHVC Test Model 1 (SHM 1)", JCTVC-L1007, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG1112th Meeting: Geneva, CH, 14-23 Jan. 2013 Jianle Chen, Krishna Rapaka, Xiang Li, Vadim Seregin, Liwei Guo, Marta Karczewicz, Geert Van der Auwera, Joel Sole, Xianglin Wang, Chengjie Tu, Ying Chen, "Description of scalable video coding technology proposal by Qualcomm", JCTVC-K0036, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG1111th Meeting: Shanghai, CN, 10-19 Oct., 2012

しかしながら、入力信号が8ビット（bit）である場合、残差信号は符号付きの9bitとなる。そのため、この残差信号を保持しておくためのレジスタ若しくはバッファの記憶容量が増大する恐れがあった。

本開示は、このような状況に鑑みてなされたものであり、符号化または復号に必要な記憶容量の増大を抑制することができるようにするものである。

本技術の一側面は、複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理を行う情報量低減部と、前記情報量低減部により情報量が低減された前記残差データを記憶する記憶部と、前記記憶部から前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの前記カレントレイヤの符号化を行う符号化部とを備える画像符号化装置である。

前記情報量低減部は、前記残差データを量子化することができる。

前記情報量低減部は、前記残差データに対して、ビット深度を減らす方向にビットシフトすることにより前記残差データを量子化することができる。

前記情報量低減部は、前記残差データの下位ビットを四捨五入してから、前記ビットシフトを行うことができる。

前記符号化部により生成された前記画像データの符号化データと、前記ビットシフトのシフト量を示す情報とを伝送する伝送部をさらに備えることができる。

前記伝送部は、前記ビットシフトのシフト量を示す情報を、輝度信号と色差信号のそれぞれについて伝送することができる。

前記伝送部は、前記他のレイヤの前記残差データを用いて符号化を行うかを示す情報を伝送し、前記情報が前記他のレイヤの前記残差データを用いて符号化を行うことを示す場合のみ、前記ビットシフトのシフト量を示す情報をさらに伝送することができる。

前記画像データのビット深度に応じて、前記ビットシフトのシフト量を設定する設定部をさらに備えるようにすることができる。

前記残差データを逆量子化する逆量子化部と、前記カレントレイヤと前記他のレイヤとの間の解像度比に応じて、前記残差データをアップサンプルするアップサンプル部とをさらに備え、前記逆量子化部および前記アップサンプル部は、前記記憶部から読み出された前記残差データを、逆量子化してからアップサンプリングするか、若しくは、アップサンプリングしてから逆量子化し、前記符号化部は、前記逆量子化および前記アップサンプリングの両方が行われた前記残差データを用いて予測処理を行い、前記画像データの前記カレントレイヤの符号化を行うことができる。

本技術の一側面は、また、複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減し、情報量が低減された前記残差データを記憶し、記憶した前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの前記カレントレイヤの符号化を行う画像符号化方法である。

本技術の他の側面は、複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理を行う情報量低減部と、前記情報量低減部により情報量が低減された前記残差データを記憶する記憶部と、前記記憶部から前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの符号化データの前記カレントレイヤの復号を行う復号部とを備える画像復号装置である。

前記符号化データと、前記ビットシフトのシフト量を示す情報とを受け取る受け取り部をさらに備え、前記情報量低減部は、前記受け取り部により受け取られた前記情報に示されるシフト量だけ、前記残差データをビットシフトし、前記復号部は、前記記憶部から前記残差データを読み出し、読み出した前記残差データを用いて、前記受け取り部により受け取られた前記符号化データの前記カレントレイヤの復号を行うことができる。

前記受け取り部は、輝度信号と色差信号のそれぞれについての前記ビットシフトのシフト量を示す情報を受け取ることができる。

前記受け取り部は、前記他のレイヤの前記残差データを用いて符号化を行うかを示す情報を受け取り、受け取られた前記情報が前記他のレイヤの前記残差データを用いて符号化を行うことを示す場合のみ、前記ビットシフトのシフト量を示す情報をさらに受け取ることができる。

前記符号化部は、前記残差データを用いて予測処理を行い、予測画像を生成し、生成した前記予測画像を用いて前記画像データの前記カレントレイヤの符号化を行うことができる。

前記残差データを逆量子化する逆量子化部と、前記カレントレイヤと前記他のレイヤとの間の解像度比に応じて、前記残差データをアップサンプルするアップサンプル部とをさらに備え、前記逆量子化部および前記アップサンプル部は、前記記憶部から読み出された前記残差データを、逆量子化してからアップサンプリングするか、若しくは、アップサンプリングしてから逆量子化し、前記符号化部は、前記逆量子化および前記アップサンプリングの両方が行われた前記残差データを用いて、前記画像データの前記カレントレイヤの符号化を行うことができる。

本技術の他の側面は、また、複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理を行い、情報量が低減された前記残差データを記憶し、記憶された前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの符号化データの前記カレントレイヤの復号を行う画像復号方法である。

本技術の一側面においては、複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量が低減され、情報量が低減された前記残差データが記憶され、記憶した前記残差データが読み出され、読み出した前記残差データを用いて前記画像データの前記カレントレイヤの符号化が行われる。

本技術の他の側面は、また、複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理が行われ、情報量が低減された前記残差データが記憶され、記憶された前記残差データが読み出され、読み出した前記残差データを用いて前記画像データの符号化データの前記カレントレイヤの復号が行われる。

本開示によれば、画像を符号化・復号することができる。特に、符号化または復号に必要な記憶容量の増大を抑制することができる。

コーディングユニットの構成例を説明する図である。階層画像符号化方式の例を示す図である。スペーシャルなスケーラブル符号化の例を説明する図である。テンポラルなスケーラブル符号化の例を説明する図である。信号雑音比のスケーラブル符号化の例を説明する図である。動き補償のための内挿フィルタの例を示す図である。スケーラブル符号化における残差信号の予測について説明する図である。シーケンスパラメータセットのシンタクスの例を説明する図である。シーケンスパラメータセットのシンタクスの例を説明する、図８に続く図である。画像符号化装置の主な構成例を示すブロック図である。ベースレイヤ画像符号化部の主な構成例を示すブロック図である。エンハンスメントレイヤ画像符号化部の主な構成例を示すブロック図である。残差信号取得部の主な構成例を示すブロック図である。画像符号化処理の流れの例を説明するフローチャートである。ベースレイヤ符号化処理の流れの例を説明するフローチャートである。エンハンスメントレイヤ符号化処理の流れの例を説明するフローチャートである。画像復号装置の主な構成例を示すブロック図である。ベースレイヤ画像復号部の主な構成例を示すブロック図である。エンハンスメントレイヤ画像復号部の主な構成例を示すブロック図である。残差信号取得部の他の構成例を示すブロック図である。画像復号処理の流れの例を説明するフローチャートである。ベースレイヤ復号処理の流れの例を説明するフローチャートである。エンハンスメントレイヤ復号処理の流れの例を説明するフローチャートである。多視点画像符号化方式の例を示す図である。本技術を適用した多視点画像符号化装置の主な構成例を示す図である。本技術を適用した多視点画像復号装置の主な構成例を示す図である。コンピュータの主な構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。スケーラブル符号化利用の一例を示すブロック図である。スケーラブル符号化利用の他の例を示すブロック図である。スケーラブル符号化利用のさらに他の例を示すブロック図である。

  以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
  １．概要
  ２．第１の実施の形態（画像符号化装置）
  ３．第２の実施の形態（画像復号装置）
  ４．第３の実施の形態（多視点画像符号化・多視点画像復号装置）
  ５．第４の実施の形態（コンピュータ）
  ６．応用例
  ７．スケーラブル符号化の応用例

  ＜１．概要＞
    ＜符号化方式＞
  以下においては、HEVC（High Efficiency Video Coding）方式の画像符号化・復号に適用する場合を例に、本技術を説明する。

＜コーディングユニット＞
AVC（Advanced Video Coding）方式においては、マクロブロックとサブマクロブロックによる階層構造が規定されている。しかしながら、１６画素×１６画素のマクロブロックでは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；４０００画素×２０００画素）といった大きな画枠に対して最適ではない。

これに対して、HEVC方式においては、図１に示されるように、コーディングユニット（CU（Coding Unit））が規定されている。

CUは、Coding Tree Block（CTB）とも呼ばれ、AVC方式におけるマクロブロックと同様の役割を果たす、ピクチャ単位の画像の部分領域である。後者は、１６×１６画素の大きさに固定されているのに対し、前者の大きさは固定されておらず、それぞれのシーケンスにおいて、画像圧縮情報中において指定されることになる。

例えば、出力となる符号化データに含まれるシーケンスパラメータセット（SPS（Sequence Parameter Set））において、CUの最大サイズ（LCU（Largest Coding Unit））と最小サイズ（SCU（Smallest Coding Unit））が規定される。

それぞれのLCU内においては、SCUのサイズを下回らない範囲で、split-flag=1とすることにより、より小さなサイズのCUに分割することができる。図１の例では、LCUの大きさが１２８であり、最大階層深度が５となる。２Ｎ×２Ｎの大きさのCUは、split_flagの値が「１」である時、１つ下の階層となる、Ｎ×Ｎの大きさのCUに分割される。

更に、CUは、イントラ若しくはインター予測の処理単位となる領域（ピクチャ単位の画像の部分領域）であるプレディクションユニット（Prediction Unit（PU））に分割され、また、直交変換の処理単位となる領域（ピクチャ単位の画像の部分領域）である、トランスフォームユニット（Transform Unit（TU））に分割される。現在、HEVC方式においては、４×４及び８×８に加え、１６×１６及び３２×３２直交変換を用いることが可能である。

以上のHEVC方式のように、CUを定義し、そのCUを単位として各種処理を行うような符号化方式の場合、AVC方式におけるマクロブロックはLCUに相当し、ブロック（サブブロック）はCUに相当すると考えることができる。また、AVC方式における動き補償ブロックは、PUに相当すると考えることができる。ただし、CUは、階層構造を有するので、その最上位階層のLCUのサイズは、例えば128×128画素のように、AVC方式のマクロブロックより大きく設定されることが一般的である。

よって、以下、LCUは、AVC方式におけるマクロブロックをも含むものとし、CUは、AVC方式におけるブロック（サブブロック）をも含むものとする。つまり、以下の説明に用いる「ブロック」は、ピクチャ内の任意の部分領域を示し、その大きさ、形状、および特性等は限定されない。つまり、「ブロック」には、例えば、TU、PU、SCU、CU、LCU、サブブロック、マクロブロック、またはスライス等任意の領域（処理単位）が含まれる。もちろん、これら以外の部分領域（処理単位）も含まれる。サイズや処理単位等を限定する必要がある場合は、適宜説明する。

また、本明細書において、CTU（Coding Tree Unit）は、LCU(最大数のCU)のCTB（Coding Tree Block）と、そのLCUベース（レベル）で処理するときのパラメータを含む単位であるとする。また、CTUを構成するCU（Coding Unit）は、CB(Coding Block)と、そのCUベース（レベル）で処理するときのパラメータを含む単位であるとする。

＜モード選択＞
ところで、AVCそしてHEVC符号化方式において、より高い符号化効率を達成するには、適切な予測モードの選択が重要である。

かかる選択方式の例として、JM (Joint Model) と呼ばれるH.264/MPEG-4 AVCの参照ソフトウエア (http://iphome.hhi.de/suehring/tml/index.htm において公開されている) に実装されている方法を挙げることが出来る。

JMにおいては、以下に述べる、High Complexity Modeと、Low Complexity Modeの2通りのモード判定方法を選択することが可能である。どちらも、それぞれの予測モードModeに関するコスト関数値を算出し、これを最小にする予測モードを当該ブロック乃至マクロブロックに対する最適モードとして選択する。

High Complexity Modeにおけるコスト関数は、以下の式（１）のように示される。

ここで、Ωは、当該ブロック乃至マクロブロックを符号化するための候補モードの全体集合、Dは、当該予測モードで符号化した場合の、復号画像と入力画像の差分エネルギーである。λは、量子化パラメータの関数として与えられるLagrange未定乗数である。Ｒは、直交変換係数を含んだ、当該モードで符号化した場合の総符号量である。

つまり、High Complexity Modeでの符号化を行うには、上記パラメータＤ及びＲを算出するため、全ての候補モードにより、一度、仮エンコード処理を行う必要があり、より高い演算量を要する。

Low Complexity Modeにおけるコスト関数は、以下の式（２）のように示される。

ここで、Dは、High Complexity Modeの場合と異なり、予測画像と入力画像の差分エネルギーとなる。QP2Quant(QP)は、量子化パラメータQPの関数として与えられ、HeaderBitは、直交変換係数を含まない、動きベクトルや、モードといった、Headerに属する情報に関する符号量である。

すなわち、Low Complexity Modeにおいては、それぞれの候補モードに関して、予測処理を行う必要があるが、復号画像までは必要ないため、符号化処理まで行う必要はない。このため、High Complexity Modeより低い演算量での実現が可能である。

＜階層符号化＞
ところで、これまでの、MPEG2、AVCといった画像符号化方式は、スケーラビリティ（scalability）機能を有していた。スケーラブル符号化（階層符号化）とは、画像を複数レイヤ化（階層化）し、レイヤ毎に符号化する方式である。図２は、階層画像符号化方式の一例を示す図である。

図２に示されるように、画像の階層化においては、スケーラビリティ機能を有する所定のパラメータを基準として１の画像が複数の階層（レイヤ）に分割される。つまり、階層化された画像（階層画像）は、その所定のパラメータの値が互いに異なる複数の階層（レイヤ）の画像を含む。この階層画像の複数のレイヤは、他のレイヤの画像を利用せずに自身のレイヤの画像のみを用いて符号化・復号を行うベースレイヤと、他のレイヤの画像を利用して符号化・復号を行うノンベースレイヤ（エンハンスメントレイヤとも称する）とによりなる。ノンベースレイヤは、ベースレイヤの画像を利用するようにしても良いし、他のノンベースレイヤの画像を利用するようにしてもよい。

一般的に、ノンベースレイヤは、冗長性が低減されるように、自身の画像と、他のレイヤの画像との差分画像のデータ（差分データ）により構成される。例えば、１の画像をベースレイヤとノンベースレイヤ（エンハンスメントレイヤとも称する）に２階層化した場合、ベースレイヤのデータのみで元の画像よりも低品質な画像が得られ、ベースレイヤのデータとノンベースレイヤのデータを合成することで、元の画像（すなわち高品質な画像）が得られる。

このように画像を階層化することにより、状況に応じて多様な品質の画像を容易に得ることができる。例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ（base layer）のみの画像圧縮情報を伝送し、空間時間解像度の低い、或いは、画質の良くない動画像を再生し、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ（base layer）に加えて、エンハンスメントレイヤ（enhancement layer）の画像圧縮情報を伝送し、空間時間解像度の高い、或いは、画質の高い動画像を再生するといったように、トランスコード処理を行うことなく、端末やネットワークの能力に応じた画像圧縮情報を、サーバから送信することが可能となる。

＜スケーラブルなパラメータ＞
このような階層画像符号化・階層画像復号（スケーラブル符号化・スケーラブル復号）において、スケーラビリティ（scalability）機能を有するパラメータは、任意である。例えば、図３に示されるような空間解像度をそのパラメータとしてもよい（spatial scalability）。このスペーシャルスケーラビリティ（spatial scalability）の場合、レイヤ毎に画像の解像度が異なる。つまり、図３に示されるように、各ピクチャが、元の画像より空間的に低解像度のベースレイヤと、ベースレイヤの画像と合成することにより元の画像（元の空間解像度）が得られるエンハンスメントレイヤの２階層に階層化される。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。

また、このようなスケーラビリティ性を持たせるパラメータとして、他には、例えば、図４に示されるような、時間解像度を適用しても良い（temporal scalability）。このテンポラルスケーラビリティ（temporal scalability）の場合、レイヤ毎にフレームレートが異なる。つまり、この場合、図４に示されるように、互いに異なるフレームレートのレイヤに階層化されており、低フレームレートのレイヤに、高フレームレートのレイヤを加えることで、より高フレームレートの動画像を得ることができ、全てのレイヤを加えることで、元の動画像（元のフレームレート）を得ることができる。この階層数は一例であり、任意の階層数に階層化することができる。

さらに、このようなスケーラビリティ性を持たせるパラメータとして、例えば、信号雑音比（SNR（Signal to Noise ratio））を適用しても良い（SNR scalability）。このSNRスケーラビリティ（SNR scalability）の場合、レイヤ毎にSN比が異なる。つまり、図５に示されるように、各ピクチャが、元の画像よりSNRの低いベースレイヤと、ベースレイヤの画像と合成することにより元の画像（元のSNR）が得られるエンハンスメントレイヤの２階層に階層化される。すなわち、ベースレイヤ（base layer）画像圧縮情報においては、低PSNRの画像に関する情報が伝送されており、これに、エンハンスメントレイヤ（enhancement layer）画像圧縮情報を加えることで、高PSNR画像を再構築することが可能である。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。

スケーラビリティ性を持たせるパラメータは、上述した例以外であっても、もちろんよい。例えば、ベースレイヤ（base layer）が８ビット（bit）画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、10ビット（bit）画像が得られるビット深度スケーラビリティ（bit-depth scalability）がある。

また、ベースレイヤ（base layer）が4:2:0フォーマットのコンポーネント画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、4:2:2フォーマットのコンポーネント画像が得られるクロマスケーラビリティ（chroma scalability）がある。

＜動き補償のための内挿フィルタ＞
HEVCにおいては、図６に示されるような動き補償のための内挿フィルタが定められている。例えば、輝度信号は、8タップ（tap）フィルタを用いて、1/4画素精度の動き補償を行う。また、色差信号は、4タップ（tap）フィルタを用いて、1/8画素精度の動き補償を行う。いずれも、処理が16ビット（bit）精度に収まるよう規定されている。これらの係数は、非特許文献２に記載されているようにDCT-IFと呼ばれる手法により設計されたものである。

＜階層間予測＞
ところで、AVC符号化処理に基づくスケーラブル（Scalable）符号化処理においては、フレーム間予測符号化で符号化されたマクロブロックであるインターブロックの予測誤差信号（残差信号とも称する）に対して、階層間予測を行うことが可能である。HEVC符号化処理に基づくスケーラブル（Scalable）符号化処理においても、これと同様の処理を行うことが非特許文献４において提案されている。

例えば、図７において、エンハンスメントレイヤ（Enhancement layer）における残差信号[Res_E]は、エンハンスメントレイヤのカレントブロックの画像データ[Cur_E]と、エンハンスメントレイヤの参照ブロックの画像データ[Ref_E]とを用いて、以下の式（３）のように算出される。

同様に、ベースレイヤにおける残差信号[Res_B]は、ベースレイヤのカレントブロックの画像データ[Cur_B]と、ベースレイヤの参照ブロックの画像データ[Ref_B]とを用いて、以下の式（４）のように算出される。

スケーラブル符号化においては、エンハンスメントレイヤにおける予測効率と、ベースレイヤにおける予測効率には相関があると考えられる。すなわち、上記において、エンハンスメントレイヤにおける残差信号[Res_E]が大きい値を取る時、ベースレイヤにおける残差信号[Res_B]の値も大きいと考えられる。したがって、ベースレイヤにおける残差信号を用いてエンハンスメントレイヤにおける残差信号の情報量を低減させることができる。

しかしながら、スペーシャルスケーラビリティ（Spatial Scalability）による処理がなされる時、ベースレイヤとエンハンスメントレイヤでは解像度が異なる。そこで、ベースレイヤにおける残差信号[Res_B]をエンハンスメントレイヤの解像度にアップサンプルするようにし、そのアップサンプルされたベースレイヤにおける残差信号を用いてエンハンスメントレイヤにおける残差信号の情報量を低減させるようにする。

つまり、演算後のエンハンスメントレイヤにおける残差信号[Res_E']は、演算前のエンハンスメントレイヤにおける残差信号[Res_E]と、アップサンプルされたベースレイヤにおける残差信号UP[Res_B]とを用いて、以下の式（５）のように算出される。

このようにエンハンスメントレイヤにおける残差信号を算出することにより、エンハンスメントレイヤにおける符号化効率を向上させることができる。

ところが、このようにベースレイヤにおける残差信号（残差データとも称する）をエンハンスメントレイヤの処理に利用するためには、ベースレイヤの残差信号を保持する必要がある。しかしながら、入力信号が8ビット（bit）である場合、残差信号は符号付きの9bitとなる。そのため、この残差信号を保持しておくためのレジスタ若しくはバッファの記憶容量が増大する恐れがあった。

＜残差データの情報量低減＞
そこで、複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データ（残差信号とも称する）に対して、精度を落とすことにより情報量を低減する処理を行い、その処理結果をレジスタ若しくはバッファ等の記憶部に記憶するようにする。カレントレイヤの符号化・復号には、その記憶部に記憶された、情報量を低減させた残差データを用いるようにする。

このようにすることにより、記憶部に記憶する残差データの情報量の増大を抑制することができる。つまり、記憶部の記憶容量の増大を抑制することができる。すなわち、符号化・復号に必要な記憶容量の増大を抑制することができる。

なお、「カレントレイヤ」とは、符号化・復号の処理対象のレイヤであり、例えばエンハンスメントレイヤを示す。また、「他のレイヤ」とは、カレントレイヤの処理において利用する残差データを取得するカレントレイヤ以外のレイヤのことであり、例えばベースレイヤ若しくは他のエンハンスメントレイヤを示す。

この「精度を落とすことにより情報量を低減する処理」は、例えば、量子化処理であってもよい。つまり、例えば、ベースレイヤにおける残差データが、量子化され、その量子化されたベースレイヤにおける残差データが記憶部（例えばレジスタやバッファ等）に記憶されるようにしてもよい。その場合、エンハンスメントレイヤにおける符号化・復号の処理においては、その量子化されたベースレイヤにおける残差データが記憶部から読み出され、利用される。

また、この「量子化処理」は、例えば、残差データに対する、ビット深度を低減させる方向へのビットシフトであってもよい。より具体的には、例えば、以下の式（６）若しくは式（７）のように、ベースレイヤにおける残差データのビットシフトを行う（すなわち、量子化する）ようにしてもよい。なお、式（６）および式（７）において、ベースレイヤにおける残差データをRes_Baseとし、量子化されたベースレイヤにおける残差データを、Q(Res_Base)とし、ビットシフトのシフト量をnビットとする。

なお、このビットシフト（量子化処理）により、ベースレイヤにおける残差データRes_Baseの下位nビットは除去される。その下位nビットを四捨五入する場合、ビットシフトは、式（６）のように行われる。また、下位nビットを切り捨てる場合、ビットシフトは、式（７）のように行われる。

以上のようなビットシフト（量子化処理）により、ベースレイヤにおける残差データRes_Baseのビット深度を低減させることができる（すなわち、情報量を低減させることができる）。

なお、このシフト量nは、任意の自然数である。例えば、ベースレイヤの入力信号が8ビット（bit）である場合、ベースレイヤにおける残差データRes_Baseは9ビットとなるが、上述した式（６）若しくは式（７）においてn=1であるとすると、この量子化処理により、ベースレイヤにおける残差データを8ビットとして記憶部に記憶させることができる。

また、ベースレイヤの入力信号が10ビットである場合、ベースレイヤにおける残差データRes_Baseは11ビットとなるが、上述した式（６）若しくは式（７）においてn=3であるとすると、この量子化処理により、ベースレイヤにおける残差データを8ビットとして記憶部に記憶させることができる。つまり、シフト量nの値をより大きくすることにより、ベースレイヤにおける残差データを記憶する記憶部として必要な記憶容量をさらに低減させることができる。

なお、このシフト量nは、予め定められた所定の値としてもよいが、符号化の際に、このシフト量を設定することができるようにしてもよい。例えば、ユーザや他の装置等の外部からの指示若しくは要求、外部から取得した情報、または、それらの情報に基づいて算出された情報等、任意の情報に基づいて、このシフト量を設定することができるようにしてもよい。例えば、入力信号のビット深度に応じて設定されるようにしてもよい。例えば、常に残差データのビット深度が8ビットになるように、入力信号のビット深度に応じて設定されるようにしてもよい。その場合、例えば、入力信号のビット深度が8ビットの場合、n=1とされ、入力信号のビット深度が10ビットの場合、n=3とされる。

以上のようなビットシフト（量子化処理）は、特に、データがバイトアライメント（byte allignment）され、バイト（8ビット）単位で処理される場合に、符号化・復号に必要な記憶容量の増大をより大幅に抑制することができる。

例えば、以上のような符号化・復号が、ソフトウェアにより実装される場合、データは、バイトアライメントされている必要がある。つまり、ベースレイヤにおける残差データは、バイト（8ビット）単位のデータとして扱われる。

この場合、記憶部は、9ビットのベースレイヤにおける残差データを記憶するのに、16ビット（2バイト）のビット幅を確保する必要がある。そのため、符号化・復号に必要な記憶容量がより大幅に増大する恐れがあった。

このような場合に、本技術を適用すると、上述したようにベースレイヤにおける残差データは8ビットになる。したがって、記憶部は、ベースレイヤにおける残差データを記憶するのに、8ビット（1バイト）のビット幅を確保すればよい。つまり、符号化・復号に必要な記憶容量の増大をより大幅に抑制することができる。

＜残差データの利用＞
記憶部に格納された、量子化されたベースレイヤにおける残差データは、記憶部から読みだされ、エンハンスメントレイヤの符号化・復号のイントラ予測やインター予測において利用される。その際、記憶部から読み出された、量子化されたベースレイヤにおける残差データを、逆量子化するようにしてもよい。

この「逆量子化処理」は、例えば、残差データに対する、ビット深度を増大させる方向へのビットシフトであってもよい。より具体的には、例えば、以下の式（８）のように、量子化されたベースレイヤにおける残差データのビットシフトを行う（すなわち、逆量子化する）ようにしてもよい。なお、式（８）において、逆量子化されたベースレイヤにおける残差データをRes_Base'とし、量子化されたベースレイヤにおける残差データをQ(Res_Base)とし、ビットシフトのシフト量をnビットとする。

つまり、この場合、逆量子化処理は、量子化処理の場合と逆方向へのビットシフトである。このようにすることにより、ベースレイヤにおける残差データのビット深度を元に戻すことができる。つまり、エンハンスメントレイヤの符号化・復号において、ベースレイヤにおける残差データをより容易に利用することができる。

また、スケーラブル符号化におけるスケーラブルなパラメータのレイヤ間（例えばベースレイヤとエンハンスメントレイヤとの間）の比に応じて、記憶部から読み出されたベースレイヤにおける残差データをアップサンプルするようにしてもよい。例えば、スペーシャルスケーラビリティ（Spatial Scalability）の場合、ベースレイヤとエンハンスメントレイヤとの間の解像度比に応じて、ベースレイヤにおける残差データをアップサンプルするようにしてもよい。このようにすることにより、ベースレイヤにおける残差データRes_Base'を、エンハンスメントレイヤ基準のスケールにすることができる。つまり、エンハンスメントレイヤの符号化・復号において、ベースレイヤにおける残差データをより容易に利用することができる。

なお、ベースレイヤにおける残差データを記憶する際に、その精度を落とすことにより情報量を低減する処理を行うことにより、当然、ベースレイヤにおける残差データの精度は低減するが、実際上、この残差データの精度低減による画質への影響（画質劣化）は、非常に小さい。特に、ベースレイヤにおける残差データの精度は、アップサンプルによっても低減する。つまり、ベースレイヤにおける残差データがアップサンプルされて利用される場合、本技術を適用することによる画質への影響（画質劣化）は、さらに小さいものとなる。換言するに、本技術を適用することにより、符号化効率の低減を抑制しながら、符号化・復号に必要な記憶容量を低減させることができる。

なお、記憶部から読み出したベースレイヤにおける残差データに対して、上述した逆量子化処理およびアップサンプル処理の両方を行うようにしてもよい。その場合、逆量子化処理を行ってからアップサンプル処理を行うようにしてもよいし、アップサンプル処理を行ってから逆量子化処理を行うようにしても良い。

逆量子化処理を先に行う場合の方が、アップサンプル処理を先に行う場合に比べて、より高精度に演算を行うことができる。アップサンプル処理を先に行う場合の方が、逆量子化処理を先に行う場合に比べて、演算精度を低くし、回路規模を縮小することができる。

＜輝度信号・色差信号＞
また、以上に説明したような、ベースレイヤにおける残差データの情報量を低減させる処理は、輝度信号及び色差信号のそれぞれに適用することができる。つまり、ベースレイヤにおける残差データの情報量を低減させる処理を、輝度信号の符号化・復号においてのみ行うようにしてもよいし、色差信号の符号化・復号においてのみ行うようにしてもよいし、輝度信号の符号化・復号および色差信号の符号化・復号の両方において行うようにしてもよい。

また、輝度信号の符号化・復号および色差信号の符号化・復号の両方において本技術を適用する場合、ビットシフトのシフト量（nビット）は、輝度信号と色差信号の両方において共通化する（同じ値とする）ようにしてもよいし、互いに独立に設定される（異なる値とすることができる）ようにしてもよい。

＜情報の伝送＞
さらに、ビットシフトのシフト量nを示す情報を復号側に伝送するようにしてもよい。このようにすることにより、復号の際には、この情報に基づいて、符号化の場合と同様に、ベースレイヤにおける残差データに対して、精度を落とすことにより情報量を低減する処理を行うことができるようになる。つまり、復号に必要な記憶容量の増大を抑制することができる。

なお、復号の際に新たにシフト量を設定することもできるが、ベースレイヤにおける残差データの精度を不要に低減させずに、かつ、最大限、復号に必要な記憶容量の増大を抑制することができるようにするためには、符号化の際と同一のシフト量でビットシフトを行うのが望ましい。

上述したように、符号化側からビットシフトのシフト量nを示す情報を復号側に伝送し、復号の際にその情報に基づいて、符号化の際と同一のシフト量でビットシフトを行うようにすることにより、より容易に、ベースレイヤにおける残差データの精度低減を抑制しながら、復号に必要な記憶容量の増大を抑制することができる。

また、ベースレイヤにおける残差データを用いてエンハンスメントレイヤの符号化・復号を行うかを示す情報も、符号化側から復号側に伝送するようにしてもよい。また、例えば、その情報が、ベースレイヤにおける残差データを用いてエンハンスメントレイヤの符号化・復号を行うことを示す場合のみ、ビットシフトのシフト量を示す情報をさらに伝送するようにしてもよい。このようにすることにより、必要な場合にのみ、ビットシフトのシフト量を示す情報を伝送させるようにすることができ、符号化効率の低減を抑制することができる。

さらに、ビットシフトのシフト量を示す情報は、輝度信号用の情報と、色差信号用の情報とのそれぞれを伝送するようにしてもよい。なお、ベースレイヤにおける残差データを用いてエンハンスメントレイヤの符号化・復号を行うかを示す情報も、輝度信号用の情報と、色差信号用の情報とのそれぞれを伝送するようにしてもよい。

これらの情報は、任意のデータ単位で伝送することができる。例えば、シーケンスパラメータセット（SPS（Sequence Parameter Set））において伝送されるようにしてもよいし、ピクチャパラメータセット（PPS（Picture Parameter Set））において伝送されるようにしても良い。

これらの情報を伝送する場合の、シーケンスパラメータセットのシンタクスの例を図８および図９に示す。

図８に示されるように、この場合、ベースレイヤにおける残差データを用いてエンハンスメントレイヤの符号化・復号を行うかを示す情報として、residual_prediction_enable_flagが伝送される。この値が「１（真）」の場合、エンハンスメントレイヤの符号化・復号において、ベースレイヤにおける残差データが利用される。

また、この値が「１（真）」の場合、ビットシフトのシフト量を示す情報として、bit_shift_luma_minus8およびbit_shift_chroma_minus8が伝送される。bit_shift_luma_minus8は、輝度信号についてのビットシフトのシフト量を示す情報であり、シフト量から８を減算した値がセットされる。また、bit_shift_chroma_minus8は、色差信号についてのビットシフトのシフト量を示す情報であり、シフト量から８を減算した値がセットされる。この場合、輝度信号と色差信号のそれぞれに対してシフト量を互いに独立に設定することができる。なお、シフト量は、輝度信号と色差信号で共通とし、その共通のシフト量を示す情報を伝送するようにしてもよい。

なお、入力信号のビット深度を示す情報を符号化側から復号側に伝送するようにしてもよい。例えば、図８の場合、入力信号のビット深度を示す情報として、bit_depth_luma_minus8およびbit_depth_chroma_minus8が伝送される。bit_depth_luma_minus8は、輝度信号についての入力信号のビット深度を示す情報であり、ビット深度から８を減算した値がセットされる。また、bit_depth_chroma_minus8は、色差信号についての入力信号のビット深度を示す情報であり、ビット深度から８を減算した値がセットされる。このような情報を伝送することにより、復号側においても入力信号のビット深度をより容易に把握することができ、その入力信号のビット深度に応じた処理を容易に行うことができる。

  ＜２．第１の実施の形態＞
    ＜画像符号化装置＞
  次に、以上のような本技術を実現する装置とその方法について説明する。図１０は、本技術を適用した画像処理装置の一態様である、画像符号化装置を示す図である。図１０に示される画像符号化装置１００は、階層画像符号化を行う装置である。図１０に示されるように、画像符号化装置１００は、ベースレイヤ画像符号化部１０１、エンハンスメントレイヤ画像符号化部１０２、および多重化部１０３を有する。

ベースレイヤ画像符号化部１０１は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。エンハンスメントレイヤ画像符号化部１０２は、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤ画像符号化ストリームを生成する。多重化部１０３は、ベースレイヤ画像符号化部１０１において生成されたベースレイヤ画像符号化ストリームと、エンハンスメントレイヤ画像符号化部１０２において生成されたエンハンスメントレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。多重化部１０３は、生成した階層画像符号化ストリームを復号側に伝送する。

ベースレイヤ画像符号化部１０１は、＜１．概要＞において上述したように、インター予測を行ったブロックについて、ベースレイヤにおける残差データを、エンハンスメントレイヤ画像符号化部１０２に供給する。

エンハンスメントレイヤ画像符号化部１０２は、＜１．概要＞において上述したように、ベースレイヤにおける残差データを、ベースレイヤ画像符号化部１０１から取得し、そのベースレイヤにおける残差データに対して、精度を落とすことにより情報量を低減する処理を行い、その処理結果を記憶する。エンハンスメントレイヤ画像符号化部１０２は、その記憶したベースレイヤにおける残差データを用いて、エンハンスメントレイヤの符号化における予測処理を行う。

また、エンハンスメントレイヤ画像符号化部１０２は、その情報量を低減する処理に関する情報を、多重化部１０３を介して（階層画像符号化ストリームとして）、復号側に伝送する。

＜ベースレイヤ画像符号化部＞
図１１は、図１０のベースレイヤ画像符号化部１０１の主な構成例を示すブロック図である。図１１に示されるように、ベースレイヤ画像符号化部１０１は、A/D変換部１１１、画面並べ替えバッファ１１２、演算部１１３、直交変換部１１４、量子化部１１５、可逆符号化部１１６、蓄積バッファ１１７、逆量子化部１１８、および逆直交変換部１１９を有する。また、ベースレイヤ画像符号化部１０１は、演算部１２０、ループフィルタ１２１、フレームメモリ１２２、選択部１２３、イントラ予測部１２４、インター予測部１２５、予測画像選択部１２６、およびレート制御部１２７を有する。

A/D変換部１１１は、入力された画像データ（ベースレイヤ画像情報）をA/D変換し、変換後の画像データ（デジタルデータ）を、画面並べ替えバッファ１１２に供給し、記憶させる。画面並べ替えバッファ１１２は、記憶した表示の順番のフレームの画像を、GOP（Group Of Picture）に応じて、符号化のためのフレームの順番に並べ替え、フレームの順番を並び替えた画像を、演算部１１３に供給する。また、画面並べ替えバッファ１１２は、フレームの順番を並び替えた画像を、イントラ予測部１２４およびインター予測部１２５にも供給する。

演算部１１３は、画面並べ替えバッファ１１２から読み出された画像から、予測画像選択部１２６を介してイントラ予測部１２４若しくはインター予測部１２５から供給される予測画像を減算し、その差分情報を直交変換部１１４に出力する。例えば、イントラ符号化が行われる画像の場合、演算部１１３は、画面並べ替えバッファ１１２から読み出された画像から、イントラ予測部１２４から供給される予測画像を減算する。また、例えば、インター符号化が行われる画像の場合、演算部１１３は、画面並べ替えバッファ１１２から読み出された画像から、インター予測部１２５から供給される予測画像を減算する。

直交変換部１１４は、演算部１１３から供給される差分情報に対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。直交変換部１１４は、その変換係数を量子化部１１５に供給する。

量子化部１１５は、直交変換部１１４から供給される変換係数を量子化する。量子化部１１５は、レート制御部１２７から供給される符号量の目標値に関する情報に基づいて量子化パラメータを設定し、その量子化を行う。量子化部１１５は、量子化された変換係数を可逆符号化部１１６に供給する。

可逆符号化部１１６は、量子化部１１５において量子化された変換係数を任意の符号化方式で符号化する。係数データは、レート制御部１２７の制御の下で量子化されているので、この符号量は、レート制御部１２７が設定した目標値となる（若しくは目標値に近似する）。

また、可逆符号化部１１６は、イントラ予測のモードを示す情報などをイントラ予測部１２４から取得し、インター予測のモードを示す情報や差分動きベクトル情報などをインター予測部１２５から取得する。さらに、可逆符号化部１１６は、シーケンスパラメータセット（SPS）、およびピクチャパラメータセット（PPS）等を含むベースレイヤのNALユニットを適宜生成する。

可逆符号化部１１６は、これらの各種情報を任意の符号化方式で符号化し、符号化データ（符号化ストリームとも称する）の一部とする（多重化する）。可逆符号化部１１６は、符号化して得られた符号化データを蓄積バッファ１１７に供給して蓄積させる。

可逆符号化部１１６の符号化方式としては、例えば、可変長符号化または算術符号化等が挙げられる。可変長符号化としては、例えば、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などが挙げられる。算術符号化としては、例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）などが挙げられる。

蓄積バッファ１１７は、可逆符号化部１１６から供給された符号化データ（ベースレイヤ符号化データ）を、一時的に保持する。蓄積バッファ１１７は、所定のタイミングにおいて、保持しているベースレイヤ符号化データを、例えば、後段の図示せぬ記録装置（記録媒体）や伝送路などに出力する。すなわち、蓄積バッファ１１７は、符号化データを伝送する伝送部でもある。

また、量子化部１１５において量子化された変換係数は、逆量子化部１１８にも供給される。逆量子化部１１８は、その量子化された変換係数を、量子化部１１５による量子化に対応する方法で逆量子化する。逆量子化部１１８は、得られた変換係数を、逆直交変換部１１９に供給する。

逆直交変換部１１９は、逆量子化部１１８から供給された変換係数を、直交変換部１１４による直交変換処理に対応する方法で逆直交変換する。逆直交変換された出力（復元された差分情報）は、演算部１２０に供給される。

演算部１２０は、逆直交変換部１１９から供給された逆直交変換結果である、復元された差分情報に、予測画像選択部１２６を介してイントラ予測部１２４若しくはインター予測部１２５からの予測画像を加算し、局部的に復号された画像（復号画像）を得る。その復号画像は、ループフィルタ１２１またはフレームメモリ１２２に供給される。

ループフィルタ１２１は、デブロックフィルタや適応ループフィルタ等を含み、演算部１２０から供給される再構成画像に対して適宜フィルタ処理を行う。例えば、ループフィルタ１２１は、再構成画像に対してデブロックフィルタ処理を行うことにより再構成画像のブロック歪を除去する。また、例えば、ループフィルタ１２１は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた再構成画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。ループフィルタ１２１は、フィルタ処理結果（以下、復号画像と称する）をフレームメモリ１２２に供給する。

なお、ループフィルタ１２１が、再構成画像に対してさらに、他の任意のフィルタ処理を行うようにしてもよい。また、ループフィルタ１２１は、必要に応じて、フィルタ処理に用いたフィルタ係数等の情報を可逆符号化部１１６に供給し、それを符号化させるようにすることもできる。

フレームメモリ１２２は、供給される復号画像を記憶し、所定のタイミングにおいて、記憶している復号画像を参照画像として、選択部１２３に供給する。

より具体的には、フレームメモリ１２２は、演算部１２０から供給される再構成画像と、ループフィルタ１２１から供給される復号画像とをそれぞれ記憶する。フレームメモリ１２２は、所定のタイミングにおいて、若しくは、イントラ予測部１２４等の外部からの要求に基づいて、記憶している再構成画像を、選択部１２３を介してイントラ予測部１２４に供給する。また、フレームメモリ１２２は、所定のタイミングにおいて、若しくは、インター予測部１２５等の外部からの要求に基づいて、記憶している復号画像を、選択部１２３を介して、インター予測部１２５に供給する。

選択部１２３は、フレームメモリ１２２から供給される参照画像の供給先を選択する。例えば、イントラ予測の場合、選択部１２３は、フレームメモリ１２２から供給される参照画像（カレントピクチャ内の画素値）をイントラ予測部１２４に供給する。また、例えば、インター予測の場合、選択部１２３は、フレームメモリ１２２から供給される参照画像（カレントピクチャ外の画素値）をインター予測部１２５に供給する。

イントラ予測部１２４は、処理対象のフレームの画像であるカレントピクチャについて、予測処理を行い、予測画像を生成する。イントラ予測部１２４は、この予測処理を、所定のブロック毎に（ブロックを処理単位として）行う。つまり、イントラ予測部１２４は、カレントピクチャの、処理対象であるカレントブロックの予測画像を生成する。その際、イントラ予測部１２４は、選択部１２３を介してフレームメモリ１２２から参照画像として供給される再構成画像を用いて予測処理（画面内予測（イントラ予測とも称する））を行う。つまり、イントラ予測部１２４は、再構成画像に含まれる、カレントブロックの周辺の画素値を用いて予測画像を生成する。このイントラ予測に利用される周辺画素値は、カレントピクチャの、過去に処理された画素の画素値である。このイントラ予測には（すなわち、予測画像の生成の仕方には）、複数の方法（イントラ予測モードとも称する）が、候補として予め用意されている。イントラ予測部１２４は、この予め用意された複数のイントラ予測モードでこのイントラ予測を行う。

イントラ予測部１２４は、候補となる全てのイントラ予測モードで予測画像を生成し、画面並べ替えバッファ１１２から供給される入力画像を用いて各予測画像のコスト関数値を評価し、最適なモードを選択する。イントラ予測部１２４は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１２６に供給する。

また、上述したように、イントラ予測部１２４は、採用されたイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部１１６に供給し、符号化させる。

インター予測部１２５は、カレントピクチャについて、予測処理を行い、予測画像を生成する。インター予測部１２５は、この予測処理を、所定のブロック毎に（ブロックを処理単位として）行う。つまり、インター予測部１２５は、カレントピクチャの、処理対象であるカレントブロックの予測画像を生成する。その際、インター予測部１２５は、画面並べ替えバッファ１１２から供給される入力画像の画像データと、フレームメモリ１２２から参照画像として供給される復号画像の画像データとを用いて、予測処理を行う。この復号画像は、カレントピクチャより前に処理されたフレームの画像（カレントピクチャでない他のピクチャ）である。つまり、インター予測部１２５は、他のピクチャの画像を用いて予測画像を生成する予測処理（画面間予測（インター予測とも称する））を行う。

このインター予測は、動き予測と動き補償よりなる。より具体的には、インター予測部１２５は、入力画像と参照画像を用いて、カレントブロックについて動き予測を行い、動きベクトルを検出する。そして、インター予測部１２５は、参照画像を用いて、検出された動きベクトルに応じて動き補償処理を行い、カレントブロックの予測画像（インター予測画像情報）を生成する。このインター予測には（すなわち、予測画像の生成の仕方には）、複数の方法（インター予測モードとも称する）が、候補として予め用意されている。インター予測部１２５は、この予め用意された複数のインター予測モードでこのようなインター予測を行う。

インター予測部１２５は、候補となる全てのインター予測モードで予測画像を生成する。インター予測部１２５は、画面並べ替えバッファ１１２から供給される入力画像と、生成した差分動きベクトルの情報などを用いて、各予測画像のコスト関数値を評価し、最適なモードを選択する。インター予測部１２５は、最適なインター予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１２６に供給する。

インター予測部１２５は、採用されたインター予測モードを示す情報や、符号化データを復号する際に、そのインター予測モードで処理を行うために必要な情報等を可逆符号化部１１６に供給し、符号化させる。必要な情報としては、例えば、生成された差分動きベクトルの情報や、予測動きベクトル情報として予測動きベクトルのインデックスを示すフラグなどがある。

予測画像選択部１２６は、演算部１１３や演算部１２０に供給する予測画像の供給元を選択する。例えば、イントラ符号化の場合、予測画像選択部１２６は、予測画像の供給元としてイントラ予測部１２４を選択し、そのイントラ予測部１２４から供給される予測画像を演算部１１３や演算部１２０に供給する。また、例えば、インター符号化の場合、予測画像選択部１２６は、予測画像の供給元としてインター予測部１２５を選択し、そのインター予測部１２５から供給される予測画像を演算部１１３や演算部１２０に供給する。

レート制御部１２７は、蓄積バッファ１１７に蓄積された符号化データの符号量に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部１１５の量子化動作のレートを制御する。

なお、ベースレイヤ画像符号化部１０１は、他のレイヤを参照せずに符号化を行う。つまり、イントラ予測部１２４およびインター予測部１２５は、他のレイヤの符号化に関する情報を参照しない。

また、ベースレイヤ画像符号化部１０１は、＜１．概要＞において上述した処理を行う。すなわち、インター予測部１２５は、ベースレイヤにおける、フレーム間予測符号化で符号化されたインターブロックの残差データを、エンハンスメントレイヤ画像符号化部１０２に供給する。

＜エンハンスメントレイヤ画像符号化部＞
図１２は、図１０のエンハンスメントレイヤ画像符号化部１０２の主な構成例を示すブロック図である。図１２に示されるように、エンハンスメントレイヤ画像符号化部１０２は、図１１のベースレイヤ画像符号化部１０１と基本的に同様の構成を有する。

つまり、エンハンスメントレイヤ画像符号化部１０２は、図１２に示されるように、A/D変換部１３１、画面並べ替えバッファ１３２、演算部１３３、直交変換部１３４、量子化部１３５、可逆符号化部１３６、蓄積バッファ１３７、逆量子化部１３８、および逆直交変換部１３９を有する。また、エンハンスメントレイヤ画像符号化部１０２は、演算部１４０、ループフィルタ１４１、フレームメモリ１４２、選択部１４３、イントラ予測部１４４、インター予測部１４５、予測画像選択部１４６、およびレート制御部１４７を有する。

これらのA/D変換部１３１乃至レート制御部１４７は、図１１のA/D変換部１１１乃至レート制御部１２７に対応し、それぞれ、対応する処理部と同様の処理を行う。ただし、エンハンスメントレイヤ画像符号化部１０２の各部は、ベースレイヤではなく、エンハンスメントレイヤ画像情報の符号化についての処理を行う。したがって、A/D変換部１３１乃至レート制御部１４７の処理の説明として、上述した図１１のA/D変換部１１１乃至レート制御部１２７についての説明を適用することができるが、その場合、処理するデータは、ベースレイヤのデータではなく、エンハンスメントレイヤのデータであるものとする必要がある。また、データの入力元や出力先の処理部は、適宜、A/D変換部１３１乃至レート制御部１４７の中の対応する処理部に置き換えて読む必要がある。

なお、エンハンスメントレイヤ画像符号化部１０２は、他のレイヤ（例えばベースレイヤ）の情報を参照して符号化を行う。そして、エンハンスメントレイヤ画像符号化部１０２は、＜１．概要＞において上述した処理を行う。

エンハンスメントレイヤ画像符号化部１０２は、残差信号取得部１４８を有する。残差信号取得部１４８は、ベースレイヤ画像符号化部１０１から、ベースレイヤにおける、フレーム間予測符号化で符号化されたインターブロックの残差データを取得する。残差信号取得部１４８は、取得したベースレイヤにおける残差データに対して、精度を落とすことにより情報量を低減する処理を行い、その処理結果、すなわち、情報量が低減された残差データを内蔵する記憶部（レジスタ若しくはバッファ等）に記憶する。残差信号取得部１４８は、その記憶部に記憶した残差データを、適宜、イントラ予測部１４４若しくはインター予測部１４５に供給する。このように残差信号取得部１４８が実行する処理の詳細は、＜１．概要＞において上述した通りである。

また、残差信号取得部１４８は、残差データの情報量を低減する処理に関する情報（例えば、ビットシフトのシフト量を示す情報や、ベースレイヤにおける残差データを用いて符号化を行うかを示す情報等）を、可逆符号化部１３６に供給し、符号化させ、復号側に伝送させる。このように伝送される情報の詳細は、＜１．概要＞において上述した通りである。

＜残差信号取得部＞
図１３は、図１２の残差信号取得部１４８の主な構成例を示すブロック図である。

図１３に示されるように、残差信号取得部１４８は、設定部１７１、残差信号量子化部１７２、ベースレイヤ残差信号バッファ１７３、残差信号逆量子化部１７４、およびアップサンプル部１７５を有する。

設定部１７１は、残差データの情報量を低減する処理に関する設定を行う。例えば、設定部１７１は、残差データの情報量を低減する処理の一例として行われる量子化処理（ビットシフト）のシフト量nビットの値を設定する。また、例えば、設定部１７１は、ベースレイヤにおける残差データを用いて符号化を行うか否かを決定する。このような設定方法の詳細は、＜１．概要＞において上述した通りである。

設定部１７１は、設定内容を示す制御情報を、残差信号量子化部１７２乃至アップサンプル部１７５の各処理部に対して供給する。また、設定部１７１は、この制御情報、すなわち、例えば、ビットシフトのシフト量を示す情報や、ベースレイヤにおける残差データを用いてエンハンスメントレイヤの符号化・復号を行うかを示す情報等といった、残差データの情報量を低減する処理に関する情報を可逆符号化部１３６に供給し、符号化させ、復号側に伝送させる。この情報の詳細は、＜１．概要＞において上述した通りである。

残差信号量子化部１７２は、ベースレイヤ画像符号化部１０１からベースレイヤにおける残差データ（ベースレイヤ残差信号とも称する）を取得し、そのベースレイヤ残差信号に対して、精度を落とすことにより情報量を低減する処理の一例として量子化処理（例えばビットシフト）を行う。この量子化処理（ビットシフト）は、設定部１７１から供給される制御情報に従って行われる。つまり、例えば、残差信号量子化部１７２は、ベースレイヤ画像符号化部１０１から取得したベースレイヤ残差信号を、設定部１７１から供給される制御情報に示されるシフト量分、ビット深度を低減させる方向にビットシフトする。この処理の詳細は、＜１．概要＞において上述した通りである。残差信号量子化部１７２は、その処理結果、すなわち、量子化されたベースレイヤ残差信号をベースレイヤ残差信号バッファ１７３に供給する。

ベースレイヤ残差信号バッファ１７３は、残差信号量子化部１７２から供給された、量子化されたベースレイヤ残差信号を記憶する。また、ベースレイヤ残差信号バッファ１７３は、必要に応じて、記憶している、量子化されたベースレイヤ残差信号を残差信号逆量子化部１７４に供給する。

残差信号逆量子化部１７４は、ベースレイヤ残差信号バッファ１７３から量子化されたベースレイヤ残差信号を読み出し、その読み出した、量子化されたベースレイヤ残差信号に対して、逆量子化処理（例えばビットシフト）を行う。この逆量子化処理（ビットシフト）は、設定部１７１から供給される制御情報に従って行われる。つまり、例えば、残差信号逆量子化部１７４は、ベースレイヤ残差信号バッファ１７３から読み出した、量子化されたベースレイヤ残差信号を、設定部１７１から供給される制御情報に示されるシフト量分、ビット深度を増大させる方向にビットシフトする。この処理の詳細は、＜１．概要＞において上述した通りである。残差信号逆量子化部１７４は、その処理結果、すなわち、逆量子化されたベースレイヤ残差信号をアップサンプル部１７５に供給する。

アップサンプル部１７５は、残差信号逆量子化部１７４から供給された、逆量子化されたベースレイヤ残差信号を、エンハンスメントレイヤ基準となるようにアップサンプルする。このアップサンプルは、設定部１７１から供給される制御情報に従って行われる。例えば、アップサンプル部１７５は、残差信号逆量子化部１７４から供給された、逆量子化されたベースレイヤ残差信号を、設定部１７１から供給される制御情報に示されるレイヤ間の解像度比分、アップサンプルする。この処理の詳細は、＜１．概要＞において上述した通りである。アップサンプル部１７５は、その処理結果、すなわち、アップサンプルされたベースレイヤ残差信号をイントラ予測部１４４およびインター予測部１４５に供給する。

以上のように残差信号取得部１４８が残差信号を処理することにより、ベースレイヤ残差信号バッファ１７３の記憶容量を低減させることができる。つまり、画像符号化装置１００（エンハンスメントレイヤ画像符号化部１０２）は、符号化や復号に必要な記憶容量の増大を抑制することができる。

＜画像符号化処理の流れ＞
次に、以上のような画像符号化装置１００により実行される各処理の流れについて説明する。最初に、図１４のフローチャートを参照して、画像符号化処理の流れの例を説明する。

画像符号化処理が開始されると、ステップＳ１０１において、画像符号化装置１００のベースレイヤ画像符号化部１０１は、ベースレイヤの画像データを符号化する。

ステップＳ１０２において、エンハンスメントレイヤ画像符号化部１０２は、エンハンスメントレイヤの画像データを符号化する。

ステップＳ１０３において、多重化部１０３は、ステップＳ１０１の処理により生成されたベースレイヤ画像符号化ストリームと、ステップＳ１０２の処理により生成されたエンハンスメントレイヤ画像符号化ストリームとを（すなわち、各レイヤのビットストリームを）多重化し、１系統の階層画像符号化ストリームを生成する。

ステップＳ１０３の処理が終了すると、画像符号化装置１００は、画像符号化処理を終了する。このような画像符号化処理により１ピクチャが処理される。したがって、画像符号化装置１００は、このような画像符号化処理を階層化された動画像データの各ピクチャについて繰り返し実行する。

＜ベースレイヤ符号化処理の流れ＞
次に、図１４のステップＳ１０１において、ベースレイヤ画像符号化部１０１により実行されるベースレイヤ符号化処理の流れの例を、図１５のフローチャートを参照して説明する。

ベースレイヤ符号化処理が開始されると、ベースレイヤ画像符号化部１０１のA/D変換部１１１は、ステップＳ１２１において、入力された動画像の各フレーム（ピクチャ）の画像をA/D変換する。

ステップＳ１２２において、画面並べ替えバッファ１１２は、ステップＳ１２１においてA/D変換された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

ステップＳ１２３において、イントラ予測部１２４は、イントラ予測モードのイントラ予測処理を行う。

ステップＳ１２４において、インター予測部１２５は、インター予測モードでの動き予測や動き補償等を行うインター予測処理を行う。

ステップＳ１２５において、予測画像選択部１２６は、コスト関数値等に基づいて、予測画像を選択する。つまり、予測画像選択部１２６は、ステップＳ１２３のイントラ予測により生成された予測画像と、ステップＳ１２４のインター予測により生成された予測画像のいずれか一方を選択する。

ステップＳ１２６において、演算部１１３は、ステップＳ１２２の処理によりフレーム順を並び替えられた入力画像と、ステップＳ１２５の処理により選択された予測画像との差分を演算する。つまり、演算部１１３は、入力画像と予測画像との差分画像の画像データを生成する。このようにして求められた差分画像の画像データは、元の画像データに比べてデータ量が低減される。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ１２７において、直交変換部１１４は、ステップＳ１２６の処理により生成された差分画像の画像データを直交変換する。

ステップＳ１２８において、量子化部１１５は、レート制御部１２７により算出された量子化パラメータを用いて、ステップＳ１２７の処理により得られた直交変換係数を量子化する。

ステップＳ１２９において、逆量子化部１１８は、ステップＳ１２８の処理により生成された量子化された係数（量子化係数とも称する）を、量子化部１１５の特性に対応する特性で逆量子化する。

ステップＳ１３０において、逆直交変換部１１９は、ステップＳ１２９の処理により得られた直交変換係数を逆直交変換する。

ステップＳ１３１において、演算部１２０は、ステップＳ１３０の処理により復元された差分画像に、ステップＳ１２５の処理により選択された予測画像を加算することにより、再構成画像の画像データを生成する。

ステップＳ１３２においてループフィルタ１２１は、ステップＳ１３１の処理により生成された再構成画像の画像データにループフィルタ処理を行う。これにより、再構成画像のブロック歪み等が除去される。

ステップＳ１３３において、フレームメモリ１２２は、ステップＳ１３２の処理により得られた復号画像やステップＳ１３１の処理により得られた再構成画像等のデータを記憶する。

ステップＳ１３４において、可逆符号化部１１６は、ステップＳ１２８の処理により得られた、量子化された係数を符号化する。すなわち、差分画像に対応するデータに対して、可変長符号化や算術符号化等の可逆符号化が行われる。

また、このとき、可逆符号化部１１６は、ステップＳ１２５の処理により選択された予測画像の予測モードに関する情報を符号化し、差分画像を符号化して得られる符号化データに付加する。つまり、可逆符号化部１１６は、イントラ予測部１２４から供給される最適イントラ予測モード情報、または、インター予測部１２５から供給される最適インター予測モードに応じた情報なども符号化し、符号化データに付加する。

さらに、可逆符号化部１１６は、各種ナルユニット等のシンタクス要素も設定し、符号化し、符号化データに付加する。

ステップＳ１３５において蓄積バッファ１１７は、ステップＳ１３４の処理により得られた符号化データを蓄積する。蓄積バッファ１１７に蓄積された符号化データは、適宜読み出され、伝送路や記録媒体を介して復号側に伝送される。

ステップＳ１３６においてレート制御部１２７は、ステップＳ１３５の処理により蓄積バッファ１１７に蓄積された符号化データの符号量（発生符号量）に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部１１５の量子化動作のレートを制御する。また、レート制御部１２７は、量子化パラメータに関する情報を、量子化部１１５に供給する。

ステップＳ１３７において、インター予測部１２５は、以上のようなベースレイヤ符号化処理において得られたベースレイヤにおける残差信号を、エンハンスメントレイヤの符号化処理に供給する。

ステップＳ１３７の処理が終了すると、ベースレイヤ符号化処理が終了し、処理は図１４に戻る。

＜エンハンスメントレイヤ符号化処理の流れ＞
次に、図１４のステップＳ１０２において、エンハンスメントレイヤ画像符号化部１０２により実行されるエンハンスメントレイヤ符号化処理の流れの例を、図１５のフローチャートを参照して説明する。

エンハンスメントレイヤ符号化処理が開始されると、エンハンスメントレイヤ画像符号化部１０２の設定部１７１は、ステップＳ１５１において、ベースレイヤの残差信号を用いた予測に関する設定を行う。

ステップＳ１５２において、設定部１７１は、ステップＳ１５１において行った設定の内容を示す制御情報、すなわち、ベースレイヤの残差信号を用いた予測に関する制御情報を復号側に伝送させる。

ステップＳ１５３において、残差信号量子化部１７２は、ベースレイヤ画像符号化部１０１からベースレイヤ残差信号を取得する。

ステップＳ１５４において、残差信号量子化部１７２は、ステップＳ１５３において取得したベースレイヤ残差信号を量子化する。

ステップＳ１５５において、ベースレイヤ残差信号バッファ１７３は、ステップＳ１５４の処理により得られた、量子化されたベースレイヤ残差信号を記憶する。

ステップＳ１５６において、A/D変換部１１１は、入力されたエンハンスメントレイヤの動画像の各フレーム（ピクチャ）の画像をA/D変換する。

ステップＳ１５７において、画面並べ替えバッファ１１２は、ステップＳ１５６においてA/D変換された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

ステップＳ１５８において、残差信号逆量子化部１７４は、ベースレイヤ残差信号バッファ１７３から、処理対象であるカレントブロックに対応する量子化されたベースレイヤ残差信号を読み出す。

ステップＳ１５９において、残差信号逆量子化部１７４は、ステップＳ１５８において読み出された、量子化されたベースレイヤ残差信号を逆量子化する。

ステップＳ１６０において、アップサンプル部１７５は、逆量子化されたベースレイヤ残差信号をアップサンプルする。

ステップＳ１６１において、イントラ予測部１４４は、イントラ予測処理を行う。その際、イントラ予測部１４４は、イントラ予測モードの候補として、ステップＳ１６０においてアップサンプルされたベースレイヤ残差信号を用いて階層間予測を行う。

ステップＳ１６２において、インター予測部１４５は、インター予測処理を行う。インター予測部１４５は、インター予測モードの候補として、ステップＳ１６０においてアップサンプルされたベースレイヤ残差信号を用いて階層間予測を行う。

ステップＳ１６３乃至ステップＳ１７４の各処理は、図１５のステップＳ１２５乃至ステップＳ１３６の各処理に対応し、それらの処理と同様に実行される。

ステップＳ１７４の処理が終了すると、エンハンスメントレイヤ符号化処理が終了し、処理は、図１４に戻る。

以上のように各処理を実行することにより、画像符号化装置１００は、ベースレイヤにおける残差信号の記憶に用いられる記憶部の記憶容量の増大を抑制し、符号化・復号に必要な記憶容量の増大を抑制することができる。

  ＜３．第２の実施の形態＞
    ＜画像復号装置＞
  次に、以上のように符号化された符号化データの復号について説明する。図１７は、本技術を適用した画像処理装置の一態様である、図１０の画像符号化装置１００に対応する画像復号装置の主な構成例を示すブロック図である。

図１７に示される画像復号装置２００は、画像符号化装置１００が生成した符号化データを、その符号化方法に対応する復号方法で復号する（すなわち、階層符号化された符号化データを階層復号する）。

図１７に示されるように、画像復号装置２００は、逆多重化部２０１、ベースレイヤ画像復号部２０２、およびエンハンスメントレイヤ画像復号部２０３を有する。

逆多重化部２０１は、符号化側から伝送された、ベースレイヤ画像符号化ストリームとエンハンスメントレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを受け取り、それを逆多重化し、ベースレイヤ画像符号化ストリームと、エンハンスメントレイヤ画像符号化ストリームとを抽出する。

ベースレイヤ画像復号部２０２は、逆多重化部２０１により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。エンハンスメントレイヤ画像復号部２０３は、逆多重化部２０１により抽出されたエンハンスメントレイヤ画像符号化ストリームを復号し、エンハンスメントレイヤ画像を得る。

ベースレイヤ画像復号部２０２は、＜１．概要＞において上述したように、インター予測を行ったブロックについて、ベースレイヤにおける残差データを、エンハンスメントレイヤ画像復号部２０３に供給する。

エンハンスメントレイヤ画像復号部２０３は、＜１．概要＞において上述したように、ベースレイヤにおける残差データを、ベースレイヤ画像復号部２０２から取得し、そのベースレイヤにおける残差データに対して、精度を落とすことにより情報量を低減する処理を行い、その処理結果を記憶する。エンハンスメントレイヤ画像復号部２０３は、その記憶したベースレイヤにおける残差データを用いて、エンハンスメントレイヤの復号における予測処理を行う。

＜ベースレイヤ画像復号部＞
図１８は、図１７のベースレイヤ画像復号部２０２の主な構成例を示すブロック図である。図１８に示されるようにベースレイヤ画像復号部２０２は、蓄積バッファ２１１、可逆復号部２１２、逆量子化部２１３、逆直交変換部２１４、演算部２１５、ループフィルタ２１６、画面並べ替えバッファ２１７、およびD/A変換部２１８を有する。また、ベースレイヤ画像復号部２０２は、フレームメモリ２１９、選択部２２０、イントラ予測部２２１、インター予測部２２２、および予測画像選択部２２３を有する。

蓄積バッファ２１１は、伝送されてきた符号化データを受け取る受け取り部でもある。蓄積バッファ２１１は、伝送されてきた符号化データを受け取って、蓄積し、所定のタイミングにおいてその符号化データを可逆復号部２１２に供給する。この符号化データには、予測モード情報などの復号に必要な情報が付加されている。

可逆復号部２１２は、蓄積バッファ２１１より供給された、可逆符号化部１１６により符号化された情報を、その符号化方式に対応する復号方式で復号する。可逆復号部２１２は、復号して得られた差分画像の量子化された係数データを、逆量子化部２１３に供給する。

また、可逆復号部２１２は、最適な予測モードにイントラ予測モードが選択されたかインター予測モードが選択されたかを判定し、その最適な予測モードに関する情報を、イントラ予測部２２１およびインター予測部２２２の内、選択されたと判定したモードの方に供給する。つまり、例えば、符号化側において最適な予測モードとしてイントラ予測モードが選択された場合、その最適な予測モードに関する情報がイントラ予測部２２１に供給される。また、例えば、符号化側において最適な予測モードとしてインター予測モードが選択された場合、その最適な予測モードに関する情報がインター予測部２２２に供給される。

さらに、可逆復号部２１２は、例えば、量子化行列や量子化パラメータ等の、逆量子化に必要な情報を逆量子化部２１３に供給する。

逆量子化部２１３は、可逆復号部２１２により復号されて得られた量子化された係数データを、量子化部１１５の量子化方式に対応する方式で逆量子化する。なお、この逆量子化部２１３は、逆量子化部１１８と同様の処理部である。

逆量子化部２１３は、得られた係数データを逆直交変換部２１４に供給する。

逆直交変換部２１４は、逆量子化部２１３から供給される直交変換係数を、必要に応じて、直交変換部１１４の直交変換方式に対応する方式で逆直交変換する。なお、この逆直交変換部２１４は、逆直交変換部１１９と同様の処理部である。

この逆直交変換処理により差分画像の画像データが復元される。この復元された差分画像の画像データは、画像符号化装置において直交変換される前の差分画像の画像データに対応する。以下においては、この、逆直交変換部２１４の逆直交変換処理により得られた、復元された差分画像の画像データを、復号残差データとも称する。逆直交変換部２１４は、この復号残差データを、演算部２１５に供給する。また、演算部２１５には、予測画像選択部２２３を介して、イントラ予測部２２１若しくはインター予測部２２２から予測画像の画像データが供給される。

演算部２１５は、この復号残差データと予測画像の画像データとを用いて、差分画像と予測画像とを加算した再構成画像の画像データを得る。この再構成画像は、演算部１１３により予測画像が減算される前の入力画像に対応する。演算部２１５は、その再構成画像をループフィルタ２１６に供給する。

ループフィルタ２１６は、供給された再構成画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜施して復号画像を生成する。例えば、ループフィルタ２１６は、再構成画像に対してデブロックフィルタ処理を行うことにより、ブロック歪を除去する。また、例えば、ループフィルタ２１６は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた再構成画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。

なお、ループフィルタ２１６が行うフィルタ処理の種類は任意であり、上述した以外のフィルタ処理を行ってもよい。また、ループフィルタ２１６が、画像符号化装置から供給されたフィルタ係数を用いてフィルタ処理を行うようにしてもよい。さらに、ループフィルタ２１６が、このようなフィルタ処理を省略し、入力されたデータをフィルタ処理せずに出力することもできる。

ループフィルタ２１６は、フィルタ処理結果である復号画像（若しくは再構成画像）を画面並べ替えバッファ２１７およびフレームメモリ２１９に供給する。

画面並べ替えバッファ２１７は、復号画像についてフレームの順番の並べ替えを行う。すなわち、画面並べ替えバッファ２１７は、画面並べ替えバッファ１１２により符号化順に並べ替えられた各フレームの画像を、元の表示順に並べ替える。つまり、画面並べ替えバッファ２１７は、符号化順に供給される各フレームの復号画像の画像データを、その順に記憶し、符号化順に記憶した各フレームの復号画像の画像データを、表示順に読み出してD/A変換部２１８に供給する。D/A変換部２１８は、画面並べ替えバッファ２１７から供給された各フレームの復号画像（デジタルデータ）をD/A変換し、アナログデータとして、図示せぬディスプレイに出力し、表示させる。

フレームメモリ２１９は、供給される復号画像を記憶し、所定のタイミングにおいて、若しくは、イントラ予測部２２１やインター予測部２２２等の外部の要求に基づいて、記憶している復号画像を参照画像として、選択部２２０を介してイントラ予測部２２１やインター予測部２２２に供給する。

イントラ予測部２２１には、イントラ予測モード情報等が可逆復号部２１２から適宜供給される。イントラ予測部２２１は、イントラ予測部１２４において用いられたイントラ予測モード（最適イントラ予測モード）でイントラ予測を行い、予測画像を生成する。その際、イントラ予測部２２１は、選択部２２０を介してフレームメモリ２１９から供給される再構成画像の画像データを用いてイントラ予測を行う。すなわち、イントラ予測部２２１は、この再構成画像を参照画像（周辺画素）として利用する。イントラ予測部２２１は、生成した予測画像を予測画像選択部２２３に供給する。

インター予測部２２２には、最適予測モード情報や動き情報等が可逆復号部２１２から適宜供給される。インター予測部２２２は、可逆復号部２１２から取得された最適予測モード情報が示すインター予測モード（最適インター予測モード）で、フレームメモリ２１９から取得した復号画像（参照画像）を用いてインター予測を行い、予測画像を生成する。

予測画像選択部２２３は、イントラ予測部２２１から供給される予測画像またはインター予測部２２２から供給される予測画像を、演算部２１５に供給する。そして、演算部２１５においては、その予測画像と逆直交変換部２１４からの復号残差データ（差分画像情報）とが加算されて再構成画像が得られる。

なお、ベースレイヤ画像復号部２０２は、他のレイヤを参照せずに復号を行う。つまり、イントラ予測部２２１およびインター予測部２２２は、他のレイヤの符号化に関する情報を参照しない。

また、ベースレイヤ画像復号部２０２は、＜１．概要＞において上述した処理を行う。すなわち、インター予測部２２２は、ベースレイヤにおける、フレーム間予測符号化で符号化されたインターブロックの残差データを、エンハンスメントレイヤ画像復号部２０３に供給する。

＜エンハンスメントレイヤ画像復号部＞
図１９は、図１７のエンハンスメントレイヤ画像復号部２０３の主な構成例を示すブロック図である。図１９に示されるように、エンハンスメントレイヤ画像復号部２０３は、図１８のベースレイヤ画像復号部２０２と基本的に同様の構成を有する。

つまり、エンハンスメントレイヤ画像復号部２０３は、図１９に示されるように、蓄積バッファ２３１、可逆復号部２３２、逆量子化部２３３、逆直交変換部２３４、演算部２３５、ループフィルタ２３６、画面並べ替えバッファ２３７、およびD/A変換部２３８を有する。また、エンハンスメントレイヤ画像復号部２０３は、フレームメモリ２３９、選択部２４０、イントラ予測部２４１、インター予測部２４２、および予測画像選択部２４３を有する。

これらの蓄積バッファ２３１乃至予測画像選択部２４３は、図１８の蓄積バッファ２１１乃至予測画像選択部２２３に対応し、それぞれ、対応する処理部と同様の処理を行う。ただし、エンハンスメントレイヤ画像復号部２０３の各部は、ベースレイヤではなく、エンハンスメントレイヤ画像情報の符号化についての処理を行う。したがって、蓄積バッファ２３１乃至予測画像選択部２４３の処理の説明として、上述した図１８の蓄積バッファ２１１乃至予測画像選択部２２３についての説明を適用することができるが、その場合、処理するデータは、ベースレイヤのデータではなく、エンハンスメントレイヤのデータであるものとする必要がある。また、データの入力元や出力先の処理部は、適宜、エンハンスメントレイヤ画像復号部２０３の、対応する処理部に置き換えて読む必要がある。

なお、エンハンスメントレイヤ画像復号部２０３は、他のレイヤ（例えばベースレイヤ）の情報を参照して符号化を行う。そして、エンハンスメントレイヤ画像復号部２０３は、＜１．概要＞において上述した処理を行う。

エンハンスメントレイヤ画像復号部２０３は、残差信号取得部２４４を有する。エンハンスメントレイヤの符号化の際に、ベースレイヤにおける残差データを利用して予測処理が行われた場合、すなわち、イントラ予測部２４１若しくはインター予測部２４２が、エンハンスメントレイヤの復号において、ベースレイヤにおける残差データを利用して予測画像を生成する場合、残差信号取得部２４４は、ベースレイヤ画像復号部２０２から、ベースレイヤにおける、フレーム間予測符号化で符号化されたインターブロックの残差データを取得する。残差信号取得部２４４は、取得したベースレイヤにおける残差データに対して、精度を落とすことにより情報量を低減する処理を行い、その処理結果、すなわち、情報量が低減された残差データを内蔵する記憶部（レジスタ若しくはバッファ等）に記憶する。残差信号取得部２４４は、その記憶部に記憶した残差データを、適宜、イントラ予測部２４１若しくはインター予測部２４２（最適な（採用された）予測モードに対応する方）に供給する。このように残差信号取得部２４４が実行する処理の詳細は、＜１．概要＞において上述した通りである。

なお、符号化側からは、残差データの情報量を低減する処理に関する制御情報（例えば、ビットシフトのシフト量を示す情報や、ベースレイヤにおける残差データを用いて符号化を行うかを示す情報等）が伝送される。可逆復号部２３２は、符号化データを復号してこの制御情報を抽出し、残差信号取得部２４４に供給する。残差信号取得部２４４は、この制御情報に基づいて、上述した処理を行う。このように伝送される制御情報の詳細は、＜１．概要＞において上述した通りである。

＜残差信号取得部＞
図２０は、図１９の残差信号取得部２４４の主な構成例を示すブロック図である。

図２０に示されるように、残差信号取得部２４４は、制御情報取得部２７１、残差信号量子化部２７２、ベースレイヤ残差信号バッファ２７３、残差信号逆量子化部２７４、およびアップサンプル部２７５を有する。

制御信号取得部２７１は、可逆復号部２３２から供給される制御情報を取得する。制御信号取得部２７１は、適宜、その制御情報を残差信号量子化部２７２乃至アップサンプル部２７５に供給する。このように制御信号取得部２７１が符号化側から伝送された制御情報を供給することにより、残差信号量子化部２７２乃至アップサンプル部２７５の各処理部は、符号化側において採用された設定を把握することができ、符号化の際と同様の設定で各処理を行うことができる。

残差信号量子化部２７２は、ベースレイヤ画像復号部２０２からベースレイヤ残差信号を取得し、そのベースレイヤ残差信号に対して、精度を落とすことにより情報量を低減する処理の一例として量子化処理（例えばビットシフト）を行う。この量子化処理（ビットシフト）は、制御情報取得部２７１から供給される制御情報に従って行われる。つまり、例えば、残差信号量子化部２７２は、ベースレイヤ画像復号部２０２から取得したベースレイヤ残差信号を、符号化側から供給される制御情報に示されるシフト量分、ビット深度を低減させる方向にビットシフトする。この処理の詳細は、＜１．概要＞において上述した通りである。残差信号量子化部２７２は、その処理結果、すなわち、量子化されたベースレイヤ残差信号をベースレイヤ残差信号バッファ２７３に供給する。

ベースレイヤ残差信号バッファ２７３は、残差信号量子化部２７２から供給された、量子化されたベースレイヤ残差信号を記憶する。また、ベースレイヤ残差信号バッファ２７３は、必要に応じて、記憶している、量子化されたベースレイヤ残差信号を残差信号逆量子化部２７４に供給する。

残差信号逆量子化部２７４は、イントラ予測部２４１若しくはインター予測部２４２が、エンハンスメントレイヤの復号において、ベースレイヤにおける残差データを利用して予測画像を生成する場合、ベースレイヤ残差信号バッファ２７３から量子化されたベースレイヤ残差信号を読み出す。残差信号逆量子化部２７４は、その読み出した、量子化されたベースレイヤ残差信号に対して、逆量子化処理（例えばビットシフト）を行う。この逆量子化処理（ビットシフト）は、制御情報取得部２７１から供給される制御情報に従って行われる。つまり、例えば、残差信号逆量子化部２７４は、ベースレイヤ残差信号バッファ２７３から読み出した、量子化されたベースレイヤ残差信号を、符号化側から供給される制御情報に示されるシフト量分、ビット深度を増大させる方向にビットシフトする。この処理の詳細は、＜１．概要＞において上述した通りである。残差信号逆量子化部２７４は、その処理結果、すなわち、逆量子化されたベースレイヤ残差信号をアップサンプル部２７５に供給する。

アップサンプル部２７５は、残差信号逆量子化部２７４から供給された、逆量子化されたベースレイヤ残差信号を、エンハンスメントレイヤ基準となるようにアップサンプルする。このアップサンプルは、制御情報取得部２７１から供給される制御情報に従って行われる。例えば、アップサンプル部２７５は、残差信号逆量子化部２７４から供給された、逆量子化されたベースレイヤ残差信号を、符号化側から供給される制御情報に示されるレイヤ間の解像度比分、アップサンプルする。この処理の詳細は、＜１．概要＞において上述した通りである。アップサンプル部２７５は、その処理結果、すなわち、アップサンプルされたベースレイヤ残差信号をイントラ予測部２４１若しくはインター予測部２４２（最適な（採用された）予測モードに対応する方）に供給する。

以上のように残差信号取得部２４４が残差信号を処理することにより、ベースレイヤ残差信号バッファ２７３の記憶容量を低減させることができる。つまり、画像復号装置２００（エンハンスメントレイヤ画像復号部２０３）は、復号に必要な記憶容量の増大を抑制することができる。

＜画像復号処理の流れ＞
次に、以上のような画像復号装置２００により実行される各処理の流れについて説明する。最初に、図２１のフローチャートを参照して、画像復号処理の流れの例を説明する。

画像復号処理が開始されると、ステップＳ２０１において、画像復号装置２００の逆多重化部２０１は、符号化側から伝送される階層画像符号化ストリームをレイヤ毎に逆多重化する。

ステップＳ２０２において、ベースレイヤ画像復号部２０２は、ステップＳ２０１の処理により抽出されたベースレイヤ画像符号化ストリームを復号する。ベースレイヤ画像復号部２０２は、この復号により生成されたベースレイヤ画像のデータを出力する。

ステップＳ２０３において、エンハンスメントレイヤ画像復号部２０３は、ステップＳ２０１の処理により抽出されたエンハンスメントレイヤ画像符号化ストリームを復号する。エンハンスメントレイヤ画像復号部２０３は、この復号により生成されたエンハンスメントレイヤ画像のデータを出力する。

ステップＳ２０３の処理が終了すると、画像復号装置２００は、画像復号処理を終了する。このような画像復号処理により１ピクチャが処理される。したがって、画像復号装置２００は、このような画像復号処理を階層化された動画像データの各ピクチャについて繰り返し実行する。

＜ベースレイヤ復号処理の流れ＞
次に、図２１のステップＳ２０２において、ベースレイヤ画像復号部２０２により実行されるベースレイヤ復号処理の流れの例を、図２２のフローチャートを参照して説明する。

ベースレイヤ復号処理が開始されると、ステップＳ２２１において、蓄積バッファ２１１は、伝送されてきたビットストリーム（符号化データ）を蓄積する。ステップＳ２２２において、可逆復号部２１２は、蓄積バッファ２１１から供給されるビットストリーム（符号化データ）を復号する。すなわち、可逆符号化部１１６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャ等の画像データが復号される。このとき、ヘッダ情報などのビットストリームに含められた画像データ以外の各種情報も復号される。

ステップＳ２２３において、逆量子化部２１３は、ステップＳ２２２の処理により得られた、量子化された係数を逆量子化する。

ステップＳ２２４において、逆直交変換部２１４は、ステップＳ２２３において逆量子化された係数を逆直交変換する。

ステップＳ２２５において、イントラ予測部２２１若しくはインター予測部２２２は、予測処理を行い、予測画像を生成する。つまり、可逆復号部２１２において判定された、符号化の際に適用された予測モードで予測処理が行われる。より具体的には、例えば、符号化の際にイントラ予測が適用された場合、イントラ予測部２２１が、符号化の際に最適とされたイントラ予測モードで予測画像を生成する。また、例えば、符号化の際にインター予測が適用された場合、インター予測部２２２が、符号化の際に最適とされたインター予測モードで予測画像を生成する。

ステップＳ２２７において、演算部２１５は、ステップＳ２２５において逆直交変換されて得られた差分画像に、ステップＳ２２６において生成された予測画像を加算する。これにより再構成画像の画像データが得られる。

ステップＳ２２８において、ループフィルタ２１６は、ステップＳ２２７の処理により得られた再構成画像の画像データに対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜行う。

ステップＳ２２９において、画面並べ替えバッファ２１７は、ステップＳ２２８においてフィルタ処理された再構成画像の各フレームの並べ替えを行う。すなわち、符号化の際に並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。

ステップＳ２３０において、D/A変換部２１８は、ステップＳ２２９においてフレームの順序が並べ替えられた画像をD/A変換する。この画像が図示せぬディスプレイに出力され、画像が表示される。

ステップＳ２３１において、フレームメモリ２１９は、ステップＳ２２８の処理により得られた復号画像やステップＳ２２７の処理により得られた再構成画像等のデータを記憶する。

ステップＳ２３２において、インター予測部２２２は、以上のようなベースレイヤの復号処理において得られたベースレイヤにおける残差信号を、エンハンスメントレイヤの復号処理に供給する。

ステップＳ２３２の処理が終了すると、ベースレイヤ復号処理が終了し、処理は図２１に戻る。

＜エンハンスメントレイヤ復号処理の流れ＞
次に、図２１のステップＳ２０３において、エンハンスメントレイヤ画像復号部２０３により実行されるエンハンスメントレイヤ復号処理の流れの例を、図２３のフローチャートを参照して説明する。

エンハンスメントレイヤ復号処理が開始されると、エンハンスメントレイヤ画像復号部２０３の制御情報取得部２７１は、ステップＳ２５１において、符号化側から伝送されるベースレイヤ残差信号を用いた予測に関する制御情報を取得する。

ステップＳ２５２において、残差信号量子化部２７２は、ベースレイヤの復号処理において得られるベースレイヤ残差信号を取得する。

ステップＳ２５３において、残差信号量子化部２７２は、ステップＳ２５１において取得した制御情報に示される設定を用いて、ステップＳ２５２において取得したベースレイヤ残差信号を量子化する。例えば、残差信号量子化部２７２は、制御情報に示されるシフト量（nビット）分、ベースレイヤ残差信号をビットシフトする。

ステップＳ２５４において、ベースレイヤ残差信号バッファ２７３は、ステップＳ２５３において量子化されたベースレイヤ残差信号を記憶する。

ステップＳ２５５乃至ステップＳ２５８の各処理は、図２２のステップＳ２２１乃至ステップＳ２２４の各処理に対応し、それらの処理と同様に実行される。

ステップＳ２５９において、残差信号逆量子化部２７４は、最適予測モード（符号化の際に採用された予測モード）が、ベースレイヤ残差信号を用いた予測処理を行うモードであるか否かを判定する。ベースレイヤ残差信号を用いるモードであると判定された場合、処理は、ステップＳ２６０に進む。

ステップＳ２６０において、残差信号逆量子化部２７４は、ベースレイヤ残差信号バッファ２７３から、ベースレイヤにおける、カレントブロックに対応するブロックであるコロケーテッドブロックの、量子化されたベースレイヤ残差信号を読み出す。

ステップＳ２６１において、残差信号逆量子化部２７４は、ステップＳ２６０において読みだした、量子化されたベースレイヤ残差信号を逆量子化する。残差信号逆量子化部２７４は、ステップＳ２５１において取得した制御情報に示される設定を用いて、この量子化されたベースレイヤ残差信号を逆量子化する。例えば、残差信号逆量子化部２７４は、制御情報に示されるシフト量（nビット）分、量子化の場合と逆方向に、ベースレイヤ残差信号をビットシフトする。

ステップＳ２６２において、アップサンプル部２７５は、ステップＳ２６１において逆量子化されたベースレイヤ残差信号をアップサンプルする。アップサンプル部２７５は、ステップＳ２５１において取得した制御情報に示される設定を用いて、この逆量子化されたベースレイヤ残差信号をアップサンプルする。例えば、アップサンプル部２７５は、ベースレイヤとエンハンスメントレイヤの間の解像度比に応じて逆量子化されたベースレイヤ残差信号をアップサンプルし、ベースレイヤ残差信号をエンハンスメントレイヤ基準のスケールに変換する。

ステップＳ２６２の処理が終了すると、処理は、ステップＳ２６３に進む。また、ステップＳ２５９において、ベースレイヤ残差信号を用いるモードではないと判定された場合、処理は、ステップＳ２６３に進む。

ステップＳ２６３乃至ステップＳ２６８の各処理は、図２２のステップＳ２２５乃至ステップＳ２３０の各処理に対応し、それらの処理と同様に実行される。

以上のように各処理を実行することにより、画像復号装置２００は、ベースレイヤにおける残差信号の記憶に用いられる記憶部の記憶容量の増大を抑制し、復号に必要な記憶容量の増大を抑制することができる。

以上においては、スケーラブル符号化により画像データが階層化されて複数レイヤ化されるように説明したが、そのレイヤ数は任意である。また、以上においては、符号化・復号において、エンハンスメントレイヤは、ベースレイヤ残差信号を用いて処理されるように説明したが、これに限らず、エンハンスメントレイヤが、処理済の他のエンハンスメントレイヤの残差信号を用いて処理されるようにしてもよい。

例えば、図１０の画像符号化装置１００の場合、エンハンスメントレイヤ画像符号化部１０２のインター予測部１４５（図１２）が、インター予測部１２５（図１１）と同様に、そのエンハンスメントレイヤのインターブロックの残差信号を、他のエンハンスメントレイヤのエンハンスメントレイヤ画像符号化部１０２に供給するようにすればよい。

また、例えば、図１７の画像復号装置２００の場合、エンハンスメントレイヤ画像復号部２０３のインター予測部２４２（図１９）が、インター予測部２２２（図１８）と同様に、そのエンハンスメントレイヤのインターブロックの残差信号を、他のエンハンスメントレイヤのエンハンスメントレイヤ画像復号部２０３に供給するようにすればよい。

本技術の適用範囲は、スケーラブルな符号化・復号方式に基づくあらゆる画像符号化装置及び画像復号装置に適用することができる。

また、本技術は、例えば、MPEG、H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本技術は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。

  ＜４．第３の実施の形態＞
    ＜多視点画像符号化・多視点画像復号への適用＞
  上述した一連の処理は、多視点画像符号化・多視点画像復号に適用することができる。図２４は、多視点画像符号化方式の一例を示す。

図２４に示されるように、多視点画像は、複数の視点（ビュー（view））の画像を含む。この多視点画像の複数のビューは、他のビューの情報を利用せずに自身のビューの画像のみを用いて符号化・復号を行うベースビューと、他のビューの情報を利用して符号化・復号を行うノンベースビューとによりなる。ノンベースビューの符号化・復号は、ベースビューの情報を利用するようにしても良いし、他のノンベースビューの情報を利用するようにしてもよい。

つまり、多視点画像符号化・復号におけるビュー間の参照関係は、階層画像符号化・復号におけるレイヤ間の参照関係と同様である。したがって、図２４のような多視点画像の符号化・復号において、上述した方法を適用するようにしてもよい。つまり、ノンベースビューの符号化・復号において利用するベースビュー（若しくは他のノンベースビュー）の残差信号を、その精度を落とすことにより情報量を低減させて記憶するようにしてもよい。例えば、ベースビュー（若しくは他のノンベースビュー）の残差信号を量子化して記憶するようにしてもよい。このようにすることにより、多視点画像の場合も同様に、符号化若しくは復号に必要な記憶容量の増大を抑制することができる。

＜多視点画像符号化装置＞
図２５は、上述した多視点画像符号化を行う多視点画像符号化装置を示す図である。図２５に示されるように、多視点画像符号化装置６００は、符号化部６０１、符号化部６０２、および多重化部６０３を有する。

符号化部６０１は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部６０２は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部６０３は、符号化部６０１において生成されたベースビュー画像符号化ストリームと、符号化部６０２において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。

この多視点画像符号化装置６００の符号化部６０１としてベースレイヤ画像符号化部１０１（図１１）を適用し、符号化部６０２としてエンハンスメントレイヤ画像符号化部１０２（図１２）を適用してもよい。つまり、ノンベースビューの符号化において利用するベースビュー（若しくは他のノンベースビュー）の残差信号を、その精度を落とすことにより情報量を低減させて記憶するようにしてもよい。例えば、ベースビュー（若しくは他のノンベースビュー）の残差信号を量子化して記憶するようにしてもよい。このようにすることにより、符号化に必要な記憶容量の増大を抑制することができる。なお、この多視点画像符号化の場合も、この情報量の低減に関する情報を復号側に伝送することにより、復号に必要な記憶容量の増大も、符号化の際と同様に抑制することができる。

＜多視点画像復号装置＞
図２６は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。図２６に示されるように、多視点画像復号装置６１０は、逆多重化部６１１、復号部６１２、および復号部６１３を有する。

逆多重化部６１１は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部６１２は、逆多重化部６１１により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部６１３は、逆多重化部６１１により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。

この多視点画像復号装置６１０の復号部６１２としてベースレイヤ画像復号部２０２（図１８）を適用し、復号部６１３としてエンハンスメントレイヤ画像復号部２０３（図１９）を適用してもよい。つまり、ノンベースビューの復号において利用するベースビュー（若しくは他のノンベースビュー）の残差信号を、その精度を落とすことにより情報量を低減させて記憶するようにしてもよい。例えば、ベースビュー（若しくは他のノンベースビュー）の残差信号を量子化して記憶するようにしてもよい。このようにすることにより、復号に必要な記憶容量の増大を抑制することができる。

  ＜５．第４の実施の形態＞
    ＜コンピュータ＞
  上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

図２７は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

図２７に示されるコンピュータ８００において、CPU（Central Processing Unit）８０１、ROM（Read Only Memory）８０２、RAM（Random Access Memory）８０３は、バス８０４を介して相互に接続されている。

バス８０４にはまた、入出力インタフェース８１０も接続されている。入出力インタフェース８１０には、入力部８１１、出力部８１２、記憶部８１３、通信部８１４、およびドライブ８１５が接続されている。

入力部８１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部８１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部８１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部８１４は、例えば、ネットワークインタフェースよりなる。ドライブ８１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア８２１を駆動する。

以上のように構成されるコンピュータでは、CPU８０１が、例えば、記憶部８１３に記憶されているプログラムを、入出力インタフェース８１０およびバス８０４を介して、RAM８０３にロードして実行することにより、上述した一連の処理が行われる。RAM８０３にはまた、CPU８０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

コンピュータ（CPU８０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア８２１をドライブ８１５に装着することにより、入出力インタフェース８１０を介して、記憶部８１３にインストールすることができる。

また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、有線または無線の伝送媒体を介して、通信部８１４で受信し、記憶部８１３にインストールすることができる。

その他、このプログラムは、ROM８０２や記憶部８１３に、あらかじめインストールしておくこともできる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

また、以上において、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

上述した実施形態に係る画像符号化装置及び画像復号装置は、例えば、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

  ＜６．応用例＞
    ＜第１の応用例：テレビジョン受像機＞
  図２８は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース（I/F）部９０９、制御部９１０、ユーザインタフェース（I/F）部９１１、及びバス９１２を備える。

チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからEPG（Electronic Program Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのGUI（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic ElectroLuminescence Display）（有機ELディスプレイ）など）の映像面上に映像又は画像を表示する。

音声信号処理部９０７は、デコーダ９０４から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

外部インタフェース部９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース部９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース部９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

制御部９１０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

ユーザインタフェース部９１１は、制御部９１０と接続される。ユーザインタフェース部９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース部９０９及び制御部９１０を相互に接続する。

このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施形態に係る画像復号装置２００（図１７）の機能を有する。それにより、テレビジョン装置９００での画像の復号に必要な記憶容量の増大を抑制することができる。

＜第２の応用例：携帯電話機＞
図２９は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Universal Serial Bus）メモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９の記憶媒体に記憶させる。

また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施形態に係る画像符号化装置１００（図１０）や画像復号装置２００（図１７）の機能を有する。それにより、携帯電話機９２０での画像の符号化および復号に必要な記憶容量の増大を抑制することができる。

＜第３の応用例：記録再生装置＞
図３０は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データおよび映像データを復号する。

記録再生装置９４０は、チューナ９４１、外部インタフェース（I/F）部９４２、エンコーダ９４３、HDD（Hard Disk Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、OSD（On-Screen Display）９４８、制御部９４９、およびユーザインタフェース（I/F）部９５０を備える。

チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送部としての役割を有する。

外部インタフェース部９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース部９４２は、例えば、IEEE1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース部９４２を介して受信される映像データおよび音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース部９４２は、記録再生装置９４０における伝送部としての役割を有する。

エンコーダ９４３は、外部インタフェース部９４２から入力される映像データおよび音声データが符号化されていない場合に、映像データおよび音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

HDD９４４は、映像および音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラムおよびその他のデータを内部のハードディスクに記録する。また、HDD９４４は、映像および音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ９４５は、装着されている記録媒体へのデータの記録および読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばDVDディスク（DVD-Video、DVD-RAM、DVD-R、DVD-RW、DVD+R、DVD+RW等）又はBlu-ray（登録商標）ディスクなどであってよい。

セレクタ９４６は、映像および音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、HDD９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをOSD９４８へ出力する。また、デコーダ９４７は、生成した音声データを外部のスピーカへ出力する。

OSD９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、OSD９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。

制御部９４９は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

ユーザインタフェース部９５０は、制御部９４９と接続される。ユーザインタフェース部９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタンおよびスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施形態に係る画像符号化装置１００（図１０）の機能を有する。また、デコーダ９４７は、上述した実施形態に係る画像復号装置２００（図１７）の機能を有する。それにより、記録再生装置９４０での画像の符号化および復号に必要な記憶容量の増大を抑制することができる。

＜第４の応用例：撮像装置＞
図３１は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース（I/F）部９６６、メモリ９６７、メディアドライブ９６８、OSD９６９、制御部９７０、ユーザインタフェース（I/F）部９７１、およびバス９７２を備える。

光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース部９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース部９６６、メモリ９６７、メディアドライブ９６８、OSD９６９、および制御部９７０を相互に接続する。

光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、CCD（Charge Coupled Device）又はCMOS（Complementary Metal Oxide Semiconductor）などのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース部９６６またはメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース部９６６またはメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、OSD９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

OSD９６９は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部９６４へ出力する。

外部インタフェース部９６６は、例えばUSB入出力端子として構成される。外部インタフェース部９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース部９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース部９６６は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース部９６６は、撮像装置９６０における伝送部としての役割を有する。

メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部９７０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

ユーザインタフェース部９７１は、制御部９７０と接続される。ユーザインタフェース部９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース部９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施形態に係る画像符号化装置１００（図１０）や画像復号装置２００（図１７）の機能を有する。それにより、撮像装置９６０での画像の符号化および復号に必要な記憶容量の増大を抑制することができる。

  ＜７．スケーラブル符号化の応用例＞
    ＜第１のシステム＞
  次に、スケーラブル符号化（階層（画像）符号化）されたスケーラブル符号化データの具体的な利用例について説明する。スケーラブル符号化は、例えば、図３２に示される例のように、伝送するデータの選択のために利用される。

図３２に示されるデータ伝送システム１０００において、配信サーバ１００２は、スケーラブル符号化データ記憶部１００１に記憶されているスケーラブル符号化データを読み出し、ネットワーク１００３を介して、パーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置に配信する。

その際、配信サーバ１００２は、端末装置の能力や通信環境等に応じて、適切な品質の符号化データを選択して伝送する。配信サーバ１００２が不要に高品質なデータを伝送しても、端末装置において高画質な画像を得られるとは限らず、遅延やオーバフローの発生要因となる恐れがある。また、不要に通信帯域を占有したり、端末装置の負荷を不要に増大させたりしてしまう恐れもある。逆に、配信サーバ１００２が不要に低品質なデータを伝送しても、端末装置において十分な画質の画像を得ることができない恐れがある。そのため、配信サーバ１００２は、スケーラブル符号化データ記憶部１００１に記憶されているスケーラブル符号化データを、適宜、端末装置の能力や通信環境等に対して適切な品質の符号化データとして読み出し、伝送する。

例えば、スケーラブル符号化データ記憶部１００１は、スケーラブルに符号化されたスケーラブル符号化データ（BL+EL）１０１１を記憶するとする。このスケーラブル符号化データ（BL+EL）１０１１は、ベースレイヤとエンハンスメントレイヤの両方を含む符号化データであり、復号することにより、ベースレイヤの画像およびエンハンスメントレイヤの画像の両方を得ることができるデータである。

配信サーバ１００２は、データを伝送する端末装置の能力や通信環境等に応じて、適切なレイヤを選択し、そのレイヤのデータを読み出す。例えば、配信サーバ１００２は、処理能力の高いパーソナルコンピュータ１００４やタブレットデバイス１００６に対しては、高品質なスケーラブル符号化データ（BL+EL）１０１１をスケーラブル符号化データ記憶部１００１から読み出し、そのまま伝送する。これに対して、例えば、配信サーバ１００２は、処理能力の低いAV機器１００５や携帯電話機１００７に対しては、スケーラブル符号化データ（BL+EL）１０１１からベースレイヤのデータを抽出し、スケーラブル符号化データ（BL+EL）１０１１と同じコンテンツのデータであるが、スケーラブル符号化データ（BL+EL）１０１１よりも低品質なスケーラブル符号化データ（BL）１０１２として伝送する。

このようにスケーラブル符号化データを用いることにより、データ量を容易に調整することができるので、遅延やオーバフローの発生を抑制したり、端末装置や通信媒体の負荷の不要な増大を抑制したりすることができる。また、スケーラブル符号化データ（BL+EL）１０１１は、レイヤ間の冗長性が低減されているので、各レイヤの符号化データを個別のデータとする場合よりもそのデータ量を低減させることができる。したがって、スケーラブル符号化データ記憶部１００１の記憶領域をより効率よく使用することができる。

なお、パーソナルコンピュータ１００４乃至携帯電話機１００７のように、端末装置には様々な装置を適用することができるので、端末装置のハードウエアの性能は、装置によって異なる。また、端末装置が実行するアプリケーションも様々であるので、そのソフトウエアの能力も様々である。さらに、通信媒体となるネットワーク１００３も、例えばインターネットやLAN（Local Area Network）等、有線若しくは無線、またはその両方を含むあらゆる通信回線網を適用することができ、そのデータ伝送能力は様々である。さらに、他の通信等によっても変化する恐れがある。

そこで、配信サーバ１００２は、データ伝送を開始する前に、データの伝送先となる端末装置と通信を行い、端末装置のハードウエア性能や、端末装置が実行するアプリケーション（ソフトウエア）の性能等といった端末装置の能力に関する情報、並びに、ネットワーク１００３の利用可能帯域幅等の通信環境に関する情報を得るようにしてもよい。そして、配信サーバ１００２が、ここで得た情報を基に、適切なレイヤを選択するようにしてもよい。

なお、レイヤの抽出は、端末装置において行うようにしてもよい。例えば、パーソナルコンピュータ１００４が、伝送されたスケーラブル符号化データ（BL+EL）１０１１を復号し、ベースレイヤの画像を表示しても良いし、エンハンスメントレイヤの画像を表示しても良い。また、例えば、パーソナルコンピュータ１００４が、伝送されたスケーラブル符号化データ（BL+EL）１０１１から、ベースレイヤのスケーラブル符号化データ（BL）１０１２を抽出し、記憶したり、他の装置に転送したり、復号してベースレイヤの画像を表示したりするようにしてもよい。

もちろん、スケーラブル符号化データ記憶部１００１、配信サーバ１００２、ネットワーク１００３、および端末装置の数はいずれも任意である。また、以上においては、配信サーバ１００２がデータを端末装置に伝送する例について説明したが、利用例はこれに限定されない。データ伝送システム１０００は、スケーラブル符号化された符号化データを端末装置に伝送する際、端末装置の能力や通信環境等に応じて、適切なレイヤを選択して伝送するシステムであれば、任意のシステムに適用することができる。

そして、図３２のようなデータ伝送システム１０００においても、図１乃至図２３を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図１乃至図２３を参照して上述した効果と同様の効果を得ることができる。

＜第２のシステム＞
また、スケーラブル符号化は、例えば、図３３に示される例のように、複数の通信媒体を介する伝送のために利用される。

図３３に示されるデータ伝送システム１１００において、放送局１１０１は、地上波放送１１１１により、ベースレイヤのスケーラブル符号化データ（BL）１１２１を伝送する。また、放送局１１０１は、有線若しくは無線またはその両方の通信網よりなる任意のネットワーク１１１２を介して、エンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を伝送する（例えばパケット化して伝送する）。

端末装置１１０２は、放送局１１０１が放送する地上波放送１１１１の受信機能を有し、この地上波放送１１１１を介して伝送されるベースレイヤのスケーラブル符号化データ（BL）１１２１を受け取る。また、端末装置１１０２は、ネットワーク１１１２を介した通信を行う通信機能をさらに有し、このネットワーク１１１２を介して伝送されるエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を受け取る。

端末装置１１０２は、例えばユーザ指示等に応じて、地上波放送１１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）１１２１を、復号してベースレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

また、端末装置１１０２は、例えばユーザ指示等に応じて、地上波放送１１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）１１２１と、ネットワーク１１１２を介して取得したエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２とを合成して、スケーラブル符号化データ（BL+EL）を得たり、それを復号してエンハンスメントレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

以上のように、スケーラブル符号化データは、例えばレイヤ毎に異なる通信媒体を介して伝送させることができる。したがって、負荷を分散させることができ、遅延やオーバフローの発生を抑制することができる。

また、状況に応じて、伝送に使用する通信媒体を、レイヤ毎に選択することができるようにしてもよい。例えば、データ量が比較的多いベースレイヤのスケーラブル符号化データ（BL）１１２１を帯域幅の広い通信媒体を介して伝送させ、データ量が比較的少ないエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を帯域幅の狭い通信媒体を介して伝送させるようにしてもよい。また、例えば、エンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を伝送する通信媒体を、ネットワーク１１１２とするか、地上波放送１１１１とするかを、ネットワーク１１１２の利用可能帯域幅に応じて切り替えるようにしてもよい。もちろん、任意のレイヤのデータについて同様である。

このように制御することにより、データ伝送における負荷の増大を、より抑制することができる。

もちろん、レイヤ数は任意であり、伝送に利用する通信媒体の数も任意である。また、データ配信先となる端末装置１１０２の数も任意である。さらに、以上においては、放送局１１０１からの放送を例に説明したが、利用例はこれに限定されない。データ伝送システム１１００は、スケーラブル符号化された符号化データを、レイヤを単位として複数に分割し、複数の回線を介して伝送するシステムであれば、任意のシステムに適用することができる。

そして、以上のような図３３のようなデータ伝送システム１１００においても、図１乃至図２３を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図１乃至図２３を参照して上述した効果と同様の効果を得ることができる。

＜第３のシステム＞
また、スケーラブル符号化は、例えば、図３４に示される例のように、符号化データの記憶に利用される。

図３４に示される撮像システム１２００において、撮像装置１２０１は、被写体１２１１を撮像して得られた画像データをスケーラブル符号化し、スケーラブル符号化データ（BL+EL）１２２１として、スケーラブル符号化データ記憶装置１２０２に供給する。

スケーラブル符号化データ記憶装置１２０２は、撮像装置１２０１から供給されるスケーラブル符号化データ（BL+EL）１２２１を、状況に応じた品質で記憶する。例えば、通常時の場合、スケーラブル符号化データ記憶装置１２０２は、スケーラブル符号化データ（BL+EL）１２２１からベースレイヤのデータを抽出し、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）１２２２として記憶する。これに対して、例えば、注目時の場合、スケーラブル符号化データ記憶装置１２０２は、高品質でデータ量の多いスケーラブル符号化データ（BL+EL）１２２１のまま記憶する。

このようにすることにより、スケーラブル符号化データ記憶装置１２０２は、必要な場合のみ、画像を高画質に保存することができるので、画質劣化による画像の価値の低減を抑制しながら、データ量の増大を抑制することができ、記憶領域の利用効率を向上させることができる。

例えば、撮像装置１２０１が監視カメラであるとする。撮像画像に監視対象（例えば侵入者）が写っていない場合（通常時の場合）、撮像画像の内容は重要でない可能性が高いので、データ量の低減が優先され、その画像データ（スケーラブル符号化データ）は、低品質に記憶される。これに対して、撮像画像に監視対象が被写体１２１１として写っている場合（注目時の場合）、その撮像画像の内容は重要である可能性が高いので、画質が優先され、その画像データ（スケーラブル符号化データ）は、高品質に記憶される。

なお、通常時であるか注目時であるかは、例えば、スケーラブル符号化データ記憶装置１２０２が、画像を解析することにより判定しても良い。また、撮像装置１２０１が判定し、その判定結果をスケーラブル符号化データ記憶装置１２０２に伝送するようにしてもよい。

なお、通常時であるか注目時であるかの判定基準は任意であり、判定基準とする画像の内容は任意である。もちろん、画像の内容以外の条件を判定基準とすることもできる。例えば、収録した音声の大きさや波形等に応じて切り替えるようにしてもよいし、所定の時間毎に切り替えるようにしてもよいし、ユーザ指示等の外部からの指示によって切り替えるようにしてもよい。

また、以上においては、通常時と注目時の２つの状態を切り替える例を説明したが、状態の数は任意であり、例えば、通常時、やや注目時、注目時、非常に注目時等のように、３つ以上の状態を切り替えるようにしてもよい。ただし、この切り替える状態の上限数は、スケーラブル符号化データのレイヤ数に依存する。

また、撮像装置１２０１が、スケーラブル符号化のレイヤ数を、状態に応じて決定するようにしてもよい。例えば、通常時の場合、撮像装置１２０１が、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）１２２２を生成し、スケーラブル符号化データ記憶装置１２０２に供給するようにしてもよい。また、例えば、注目時の場合、撮像装置１２０１が、高品質でデータ量の多いベースレイヤのスケーラブル符号化データ（BL+EL）１２２１を生成し、スケーラブル符号化データ記憶装置１２０２に供給するようにしてもよい。

以上においては、監視カメラを例に説明したが、この撮像システム１２００の用途は任意であり、監視カメラに限定されない。

そして、図３４のような撮像システム１２００においても、図１乃至図２３を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図１乃至図２３を参照して上述した効果と同様の効果を得ることができる。

なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えばMPEG DASH等のようなHTTPストリーミングにも適用することができる。つまり、このような複数の符号化データ間で、符号化や復号に関する情報を共有することもできる。

また、本明細書では、各種情報が、符号化ストリームに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

  なお、本技術は以下のような構成も取ることができる。
  （１）  複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理を行う情報量低減部と、
  前記情報量低減部により情報量が低減された前記残差データを記憶する記憶部と、
  前記記憶部から前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの前記カレントレイヤの符号化を行う符号化部と
  を備える画像符号化装置。
  （２）  前記情報量低減部は、前記残差データを量子化する
  （１）、（３）乃至（９）のいずれかに記載の画像符号化装置。
  （３）  前記情報量低減部は、前記残差データに対して、ビット深度を減らす方向にビットシフトすることにより前記残差データを量子化する
  （１）、（２）、（４）乃至（９）のいずれかに記載の画像符号化装置。
  （４）  前記情報量低減部は、前記残差データの下位ビットを四捨五入してから、前記ビットシフトを行う
  （１）乃至（３）、（５）乃至（９）のいずれかに記載の画像符号化装置。
  （５）  前記符号化部により生成された前記画像データの符号化データと、前記ビットシフトのシフト量を示す情報とを伝送する伝送部をさらに備える
  （１）乃至（４）、（６）乃至（９）のいずれかに記載の画像符号化装置。
  （６）  前記伝送部は、前記ビットシフトのシフト量を示す情報を、輝度信号と色差信号のそれぞれについて伝送する
  （１）乃至（５）、（７）乃至（９）のいずれかに記載の画像符号化装置。
  （７）  前記伝送部は、前記他のレイヤの前記残差データを用いて符号化を行うかを示す情報を伝送し、前記情報が前記他のレイヤの前記残差データを用いて符号化を行うことを示す場合のみ、前記ビットシフトのシフト量を示す情報をさらに伝送する
  （１）乃至（６）、（８）、（９）のいずれかに記載の画像符号化装置。
  （８）  前記画像データのビット深度に応じて、前記ビットシフトのシフト量を設定する設定部をさらに備える
  （１）乃至（７）、（９）のいずれかに記載の画像符号化装置。
  （９）  前記残差データを逆量子化する逆量子化部と、
  前記カレントレイヤと前記他のレイヤとの間の解像度比に応じて、前記残差データをアップサンプルするアップサンプル部とをさらに備え、
  前記逆量子化部および前記アップサンプル部は、前記記憶部から読み出された前記残差データを、逆量子化してからアップサンプリングするか、若しくは、アップサンプリングしてから逆量子化し、
  前記符号化部は、前記逆量子化および前記アップサンプリングの両方が行われた前記残差データを用いて予測処理を行い、前記画像データの前記カレントレイヤの符号化を行う
  （１）乃至（８）のいずれかに記載の画像符号化装置。
  （１０）  複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減し、
  情報量が低減された前記残差データを記憶し、
  記憶した前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの前記カレントレイヤの符号化を行う
  画像符号化方法。
  （１１）  複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理を行う情報量低減部と、
  前記情報量低減部により情報量が低減された前記残差データを記憶する記憶部と、
  前記記憶部から前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの符号化データの前記カレントレイヤの復号を行う復号部と
  を備える画像復号装置。
  （１２）  前記情報量低減部は、前記残差データを量子化する
  （１１）、（１３）乃至（１９）のいずれかに記載の画像復号装置。
  （１３）  前記情報量低減部は、前記残差データに対して、ビット深度を減らす方向にビットシフトすることにより前記残差データを量子化する
  （１１）、（１２）、（１４）乃至（１９）のいずれかに記載の画像復号装置。
  （１４）  前記情報量低減部は、前記残差データの下位ビットを四捨五入してから、前記ビットシフトを行う
  （１１）乃至（１３）、（１５）乃至（１９）のいずれかに記載の画像復号装置。
  （１５）  前記符号化データと、前記ビットシフトのシフト量を示す情報とを受け取る受け取り部をさらに備え、
  前記情報量低減部は、前記受け取り部により受け取られた前記情報に示されるシフト量だけ、前記残差データをビットシフトし、
  前記復号部は、前記記憶部から前記残差データを読み出し、読み出した前記残差データを用いて、前記受け取り部により受け取られた前記符号化データの前記カレントレイヤの復号を行う
  （１１）乃至（１４）、（１６）乃至（１９）のいずれかに記載の画像復号装置。
  （１６）  前記受け取り部は、輝度信号と色差信号のそれぞれについての前記ビットシフトのシフト量を示す情報を受け取る
  （１１）乃至（１５）、（１７）乃至（１９）のいずれかに記載の画像復号装置。
  （１７）  前記受け取り部は、前記他のレイヤの前記残差データを用いて符号化を行うかを示す情報を受け取り、受け取られた前記情報が前記他のレイヤの前記残差データを用いて符号化を行うことを示す場合のみ、前記ビットシフトのシフト量を示す情報をさらに受け取る
  （１１）乃至（１６）、（１８）、（１９）のいずれかに記載の画像復号装置。
  （１８）  前記符号化部は、前記残差データを用いて予測処理を行い、予測画像を生成し、生成した前記予測画像を用いて前記画像データの前記カレントレイヤの符号化を行う
  （１１）乃至（１７）、（１９）のいずれかに記載の画像復号装置。
  （１９）  前記残差データを逆量子化する逆量子化部と、
  前記カレントレイヤと前記他のレイヤとの間の解像度比に応じて、前記残差データをアップサンプルするアップサンプル部とをさらに備え、
  前記逆量子化部および前記アップサンプル部は、前記記憶部から読み出された前記残差データを、逆量子化してからアップサンプリングするか、若しくは、アップサンプリングしてから逆量子化し、
  前記符号化部は、前記逆量子化および前記アップサンプリングの両方が行われた前記残差データを用いて、前記画像データの前記カレントレイヤの符号化を行う
  （１１）乃至（１８）のいずれかに記載の画像復号装置。
  （２０）  複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理を行い、
  情報量が低減された前記残差データを記憶し、
  記憶された前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの符号化データの前記カレントレイヤの復号を行う
  画像復号方法。

１００画像符号化装置，１０１ベースレイヤ画像符号化部，１０２エンハンスメントレイヤ画像符号化部，１０３多重化部，１４８残差信号取得部，１７１設定部，１７２残差信号量子化部，１７３ベースレイヤ残差信号バッファ，１７４残差信号逆量子化部，１７５アップサンプル部，２００画像復号装置，２０１逆多重化部，２０２ベースレイヤ画像復号部，２０３エンハンスメントレイヤ画像復号部，２４４残差信号取得部，２７１制御情報取得部，２７２残差信号量子化部，２７３ベースレイヤ残差信号バッファ，２７４残差信号逆量子化部，２７５アップサンプル部

Claims

  複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理を行う情報量低減部と、
  前記情報量低減部により情報量が低減された前記残差データを記憶する記憶部と、
  前記記憶部から前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの前記カレントレイヤの符号化を行う符号化部と
  を備える画像符号化装置。
前記情報量低減部は、前記残差データを量子化する
請求項１に記載の画像符号化装置。
前記情報量低減部は、前記残差データに対して、ビット深度を減らす方向にビットシフトすることにより前記残差データを量子化する
請求項２に記載の画像符号化装置。
前記情報量低減部は、前記残差データの下位ビットを四捨五入してから、前記ビットシフトを行う
請求項３に記載の画像符号化装置。
前記符号化部により生成された前記画像データの符号化データと、前記ビットシフトのシフト量を示す情報とを伝送する伝送部をさらに備える
請求項３に記載の画像符号化装置。
前記伝送部は、前記ビットシフトのシフト量を示す情報を、輝度信号と色差信号のそれぞれについて伝送する
請求項５に記載の画像符号化装置。
前記伝送部は、前記他のレイヤの前記残差データを用いて符号化を行うかを示す情報を伝送し、前記情報が前記他のレイヤの前記残差データを用いて符号化を行うことを示す場合のみ、前記ビットシフトのシフト量を示す情報をさらに伝送する
請求項５に記載の画像符号化装置。
前記画像データのビット深度に応じて、前記ビットシフトのシフト量を設定する設定部をさらに備える
請求項３に記載の画像符号化装置。
  前記残差データを逆量子化する逆量子化部と、
  前記カレントレイヤと前記他のレイヤとの間の解像度比に応じて、前記残差データをアップサンプルするアップサンプル部とをさらに備え、
  前記逆量子化部および前記アップサンプル部は、前記記憶部から読み出された前記残差データを、逆量子化してからアップサンプリングするか、若しくは、アップサンプリングしてから逆量子化し、
  前記符号化部は、前記逆量子化および前記アップサンプリングの両方が行われた前記残差データを用いて予測処理を行い、前記画像データの前記カレントレイヤの符号化を行う
  請求項１に記載の画像符号化装置。
  複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減し、
  情報量が低減された前記残差データを記憶し、
  記憶した前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの前記カレントレイヤの符号化を行う
  画像符号化方法。
  複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理を行う情報量低減部と、
  前記情報量低減部により情報量が低減された前記残差データを記憶する記憶部と、
  前記記憶部から前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの符号化データの前記カレントレイヤの復号を行う復号部と
  を備える画像復号装置。
前記情報量低減部は、前記残差データを量子化する
請求項１１に記載の画像復号装置。
前記情報量低減部は、前記残差データに対して、ビット深度を減らす方向にビットシフトすることにより前記残差データを量子化する
請求項１２に記載の画像復号装置。
前記情報量低減部は、前記残差データの下位ビットを四捨五入してから、前記ビットシフトを行う
請求項１３に記載の画像復号装置。
  前記符号化データと、前記ビットシフトのシフト量を示す情報とを受け取る受け取り部をさらに備え、
  前記情報量低減部は、前記受け取り部により受け取られた前記情報に示されるシフト量だけ、前記残差データをビットシフトし、
  前記復号部は、前記記憶部から前記残差データを読み出し、読み出した前記残差データを用いて、前記受け取り部により受け取られた前記符号化データの前記カレントレイヤの復号を行う
  請求項１３に記載の画像復号装置。
前記受け取り部は、輝度信号と色差信号のそれぞれについての前記ビットシフトのシフト量を示す情報を受け取る
請求項１５に記載の画像復号装置。
前記受け取り部は、前記他のレイヤの前記残差データを用いて符号化を行うかを示す情報を受け取り、受け取られた前記情報が前記他のレイヤの前記残差データを用いて符号化を行うことを示す場合のみ、前記ビットシフトのシフト量を示す情報をさらに受け取る
請求項１５に記載の画像復号装置。
前記符号化部は、前記残差データを用いて予測処理を行い、予測画像を生成し、生成した前記予測画像を用いて前記画像データの前記カレントレイヤの符号化を行う
請求項１１に記載の画像復号装置。
  前記残差データを逆量子化する逆量子化部と、
  前記カレントレイヤと前記他のレイヤとの間の解像度比に応じて、前記残差データをアップサンプルするアップサンプル部とをさらに備え、
  前記逆量子化部および前記アップサンプル部は、前記記憶部から読み出された前記残差データを、逆量子化してからアップサンプリングするか、若しくは、アップサンプリングしてから逆量子化し、
  前記符号化部は、前記逆量子化および前記アップサンプリングの両方が行われた前記残差データを用いて、前記画像データの前記カレントレイヤの符号化を行う
  請求項１１に記載の画像復号装置。
  複数レイヤよりなる画像データのカレントレイヤと異なる他のレイヤにおけるフレーム間予測の予測誤差である残差データに対して、精度を落とすことにより情報量を低減する処理を行い、
  情報量が低減された前記残差データを記憶し、
  記憶された前記残差データを読み出し、読み出した前記残差データを用いて前記画像データの符号化データの前記カレントレイヤの復号を行う
  画像復号方法。