JPWO2015098562A1

JPWO2015098562A1 - 画像処理装置および方法

Info

Publication number: JPWO2015098562A1
Application number: JP2015554739A
Authority: JP
Inventors: 央二中神
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2013-12-27
Filing date: 2014-12-12
Publication date: 2017-03-23
Anticipated expiration: 2034-12-12
Also published as: MX364028B; RU2016124469A; JP6451999B2; US20160261876A1; CA2933563C; US20200177894A1; MY178498A; BR112016014478A2; KR102336932B1; CA2933563A1; CN111314694A; CN111314694B; CN105850134B; CN105850134A; KR20160102987A; EP3041235A1; RU2663359C1; WO2015098562A1; MX2016008171A; US10623752B2

Abstract

本開示は、符号化効率の低減を抑制することができるようにする画像処理装置および方法に関する。複数コンポーネントからなる入力画像と予測画像との残差データに対して前記コンポーネント間で予測を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記予測を行う残差予測部と、前記残差予測部による前記予測により生成された予測残差データを符号化する符号化部とを備える。本開示は、例えば、画像データを符号化する画像符号化装置、または、画像データが符号化された符号化データを復号する画像復号装置等の画像処理装置に適用することができる。

Description

本開示は画像処理装置および方法に関し、特に、符号化効率の低減を抑制することができるようにした画像処理装置および方法に関する。

近年、イメージセンサ等において生成され、デモザイク処理等が行われる前の画像データであるRAWデータの圧縮の要求が高まっている。

また、画像データの符号化方式としてMPEG-4 Part10 （Advanced Video Coding、以下AVCと記す）がある。近年、更なる符号化効率の向上を目的として、ITU-T（International Telecommunication Union Telecommunication Standardization Sector）と、ISO/IEC（International Organization for Standardization / International Electrotechnical Commission）の共同の標準化団体であるJCTVC（Joint Collaboration Team - Video Coding）により、HEVC（High Efficiency Video Coding）と呼ばれる符号化方式の標準化が進められている（例えば、非特許文献１参照）。

このような符号化方式において、残差信号に対してコンポーネント間で予測を行う方法が考えられた（例えば、非特許文献２参照）。

Benjamin Bross, Woo-Jin Han, Jens-Rainer Ohm, Gary J. Sullivan, Ye-Kui Wang, Thomas Wiegand, " High Efficiency Video Coding (HEVC) text specification draft 10 (for FDIS & Last Call)", JCTVC-L1003_version 34, 2013-03-19 Wei Pu, Woo-Shik Kim, Jianle Chen, Joel Sole, Marta Karczewicz, "RCE1: Descriptions and Results for Experiments 1, 2, 3, and 4", JCTVC-O0202,2013-11-11

ところで、各コンポーネントのデータのビット深度は、一般的に互いに独立であるため、互いに異なる値が設定される可能性がある。しかしながら、非特許文献２に記載の方法では、そのようにビット深度が異なるコンポーネント間での予測は想定されておらず、予測を正しく行うことができずに符号化効率が低減するおそれがあった。

本開示は、このような状況に鑑みてなされたものであり、符号化効率の低減を抑制することができるようにするものである。

本技術の一側面の画像処理装置は、複数コンポーネントからなる入力画像と予測画像との残差データに対して前記コンポーネント間で予測を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記予測を行う残差予測部と、前記残差予測部による前記予測により生成された予測残差データを符号化する符号化部とを備える画像処理装置である。

前記残差予測部は、ビットシフトによって前記残差データの前記ビット深度を揃えることができる。

前記残差予測部は、前記予測を行う前記２つのコンポーネント間の前記ビット深度の差が０でない場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記予測を行うことができる。

前記残差予測部は、前記ビット深度の差が正の場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記予測を行い、前記ビット深度の差が負の場合、前記予測を省略することができる。

前記残差予測部は、前記入力画像の色空間がRGB空間でない場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記予測を行い、前記入力画像の色空間がRGB空間の場合、前記予測を省略することができる。

前記入力画像の色空間がYUV空間であり、前記残差予測部は、輝度成分と色差成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記予測を行うことができる。

前記入力画像の色空間がRGB空間であり、前記残差予測部は、G成分とR成分若しくはB成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記予測を行うことができる。

前記残差予測部は、前記予測を行う２つのコンポーネント間の前記ビット深度の差を求め、前記２つのコンポーネントの内の一方のコンポーネントの前記残差データに対して前記ビット深度の差に応じた前記ビットシフトを行い、前記ビットシフトされた前記残差データに所定の重み係数を乗算し、その乗算結果に対して所定のビット数分のビットシフトを行い、他方のコンポーネントの前記残差データと前記ビットシフトされた前記乗算結果との差分を求めることにより、前記予測を行うことができる。

前記残差予測部は、複数のコンポーネントで共通の前記重み係数を設定することができる。

本技術の一側面の画像処理方法は、複数コンポーネントからなる入力画像と予測画像との残差データに対して前記コンポーネント間で予測を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記予測を行い、前記予測により生成された予測残差データを符号化する画像処理方法である。

本技術の他の側面の画像処理装置は、複数コンポーネントからなる画像とその予測画像との残差データの前記コンポーネント間の予測結果である予測残差データが符号化された符号化データを復号する復号部と、前記復号部により前記符号化データが復号されて得られた前記予測残差データを用いて前記残差データの復元を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記復元を行う残差復元部とを備える画像処理装置である。

前記残差復元部は、ビットシフトによって前記残差データの前記ビット深度を揃えることができる。

前記ビット深度に関する情報を受け取る受け取り部をさらに備え、前記残差復元部は、前記受け取り部により受け取られた前記ビット深度に関する情報に基づいて、前記予測を行う前記２つのコンポーネント間の前記ビット深度の差を求め、求めた前記ビット深度の差に基づいて前記ビットシフトを行うことにより、前記残差データの前記ビット深度を揃えることができる。

前記残差復元部は、求めた前記ビット深度の差が０でない場合、前記ビットシフトによって前記残差データの前記ビット深度を揃えることができる。

前記残差復元部は、求めた前記ビット深度の差が正の場合、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記復元を行い、求めた前記ビット深度の差が負の場合、前記復元を省略することができる。

前記受け取り部は、前記画像の色空間に関する情報をさらに受け取り、前記残差復元部は、前記受け取り部により受け取られた前記画像の色空間に関する情報に基づいて、前記画像の色空間がRGB空間でない場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記復元を行い、前記画像の色空間がRGB空間の場合、前記復元を省略することができる。

前記画像の色空間がYUV空間であり、前記残差復元部は、輝度成分と色差成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記復元を行うことができる。

前記画像の色空間がRGB空間であり、前記残差復元部は、G成分とR成分若しくはB成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記復元を行うことができる。

前記残差復元部は、前記復元を行う２つのコンポーネント間の前記ビット深度の差を求め、前記２つのコンポーネントの内の一方のコンポーネントの復元済みの前記残差データに対して前記ビット深度の差に応じた前記ビットシフトを行い、前記ビットシフトされた前記残差データに所定の重み係数を乗算し、その乗算結果に対して所定のビット数分のビットシフトを行い、前記ビットシフトされた前記乗算結果と前記予測残差データとを加算することにより、他方のコンポーネントの前記残差データの前記復元を行うことができる。

本技術の他の側面の画像処理方法は、複数コンポーネントからなる画像とその予測画像との残差データの前記コンポーネント間の予測結果である予測残差データが符号化された符号化データを復号し、前記符号化データが復号されて得られた前記予測残差データを用いて前記残差データの復元を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記復元を行う画像処理方法である。

本技術の一側面においては、複数コンポーネントからなる入力画像と予測画像との残差データに対してコンポーネント間で予測を行う際に、残差データのビット深度がコンポーネント間で揃えられて予測が行われ、予測により生成された予測残差データが符号化される。

本技術の他の側面においては、複数コンポーネントからなる画像とその予測画像との残差データのコンポーネント間の予測結果である予測残差データが符号化された符号化データが復号され、符号化データが復号されて得られた予測残差データを用いて残差データの復元を行う際に、残差データのビット深度がコンポーネント間で揃えられて復元が行われる。

本開示によれば、画像を符号化・復号することができる。特に、符号化効率の低減を抑制することができる。

コーディングユニットの構成例を説明する図である。セマンティクスの例を示す図である。画像符号化装置の主な構成例を示すブロック図である。ヘッダ処理部および残差予測部の主な構成例を示すブロック図である。符号化処理の流れの例を説明するフローチャートである。残差予測処理の流れの例を説明するフローチャートである。予測残差データ生成処理の流れの例を説明するフローチャートである。予測残差データ生成処理の流れの例を説明するフローチャートである。予測残差データ生成処理の流れの例を説明するフローチャートである。画像復号装置の主な構成例を示すブロック図である。ヘッダ取得部および残差復元部の主な構成例を示すブロック図である。復号処理の流れの例を説明するフローチャートである。残差復元処理の流れの例を説明するフローチャートである。残差データ復元処理の流れの例を説明するフローチャートである。残差データ復元処理の流れの例を説明するフローチャートである。残差データ復元処理の流れの例を説明するフローチャートである。セマンティクスの例を示す図である。ヘッダ処理部および残差予測部の主な構成例を示すブロック図である。残差予測処理の流れの例を説明するフローチャートである。ヘッダ取得部および残差復元部の主な構成例を示すブロック図である。残差復元処理の流れの例を説明するフローチャートである。セマンティクスの例を示す図である。ヘッダ処理部および残差予測部の主な構成例を示すブロック図である。残差予測処理の流れの例を説明するフローチャートである。ヘッダ取得部および残差復元部の主な構成例を示すブロック図である。残差復元処理の流れの例を説明するフローチャートである。セマンティクスの例を示す図である。ヘッダ処理部および残差予測部の主な構成例を示すブロック図である。残差予測処理の流れの例を説明するフローチャートである。ヘッダ取得部および残差復元部の主な構成例を示すブロック図である。残差復元処理の流れの例を説明するフローチャートである。シンタクスの例を示す図である。セマンティクスの例を示す図である。セマンティクスの例を示す図である。セマンティクスの例を示す図である。シンタクスの例を示す図である。セマンティクスの例を示す図である。セマンティクスの例を示す図である。セマンティクスの例を示す図である。多視点画像符号化方式の例を示す図である。本技術を適用した多視点画像符号化装置の主な構成例を示す図である。本技術を適用した多視点画像復号装置の主な構成例を示す図である。階層画像符号化方式の例を示す図である。スペーシャルなスケーラブル符号化の例を説明する図である。テンポラルなスケーラブル符号化の例を説明する図である。信号雑音比のスケーラブル符号化の例を説明する図である。本技術を適用した階層画像符号化装置の主な構成例を示す図である。本技術を適用した階層画像復号装置の主な構成例を示す図である。コンピュータの主な構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。ビデオセットの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の他の例を示すブロック図である。

以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
１．第１の実施の形態（画像符号化装置・画像復号装置）
２．第２の実施の形態（画像符号化装置・画像復号装置）
３．第３の実施の形態（画像符号化装置・画像復号装置）
４．第４の実施の形態（画像符号化装置・画像復号装置）
５．第５の実施の形態（重み係数の共通化）
６．第６の実施の形態（多視点画像符号化装置・多視点画像復号装置）
７．第７の実施の形態（階層画像符号化装置・階層画像復号装置）
８．第８の実施の形態（コンピュータ）
９．第９の実施の形態（応用例）
１０．第１０の実施の形態（セット・ユニット・モジュール・プロセッサ）

＜１．第１の実施の形態＞
＜画像符号化の標準化の流れ＞
近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮する符号化方式を採用して画像を圧縮符号する装置が普及しつつある。この符号化方式には、例えば、MPEG（Moving Picture Experts Group）などがある。

特に、MPEG2(ISO/IEC 13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準である。例えば、MPEG2は、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720x480画素を持つ標準解像度の飛び越し走査画像であれば4乃至8Mbpsの符号量（ビットレート）を割り当てることができる。また、MPEG2圧縮方式を用いることにより、例えば1920x1088画素を持つ高解像度の飛び越し走査画像であれば18乃至22 Mbpsの符号量（ビットレート）を割り当てることができる。これにより、高い圧縮率と良好な画質の実現が可能である。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。

更に、近年、当初テレビ会議用の画像符号化を目的として、H.26L （ITU-T（International Telecommunication Union Telecommunication Standardization Sector） Q6/16 VCEG（Video Coding Expert Group））という標準の規格化が進められた。H.26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.26Lをベースに、H.26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われた。

標準化のスケジュールとしては、２００３年３月にはH.264及びMPEG-4 Part10 （Advanced Video Coding、以下AVCと記す）という名の元に国際標準となった。

さらに、このH．264/AVCの拡張として、RGBや4:2:2、4:4:4といった、業務用に必要な符号化ツールや、MPEG-2で規定されていた8x8DCTや量子化マトリクスをも含んだFRExt (Fidelity Range Extension) の標準化が２００５年２月に完了した。これにより、H．264/AVCを用いて、映画に含まれるフィルムノイズをも良好に表現することが可能な符号化方式となって、Blu-Ray Disc（商標）等の幅広いアプリケーションに用いられる運びとなった。

しかしながら、昨今、ハイビジョン画像の4倍の、4000x2000画素程度の画像を圧縮したい、あるいは、インターネットのような、限られた伝送容量の環境において、ハイビジョン画像を配信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、先述の、ITU-T傘下のVCEGにおいて、符号化効率の改善に関する検討が継続され行なわれている。

そこで、現在、AVCより更なる符号化効率の向上を目的として、ITU-Tと、ISO/IEC（International Organization for Standardization / International Electrotechnical Commission）の共同の標準化団体であるJCTVC（Joint Collaboration Team - Video Coding）により、HEVC（High Efficiency Video Coding）と呼ばれる符号化方式の標準化が進められている。HEVC規格については、2013年1月にドラフト版仕様であるCommittee draftが発行されている（例えば、非特許文献１参照）。

＜符号化方式＞
以下においては、HEVC（High Efficiency Video Coding）方式の画像符号化・復号に適用する場合を例に、本技術を説明する。

＜コーディングユニット＞
AVC（Advanced Video Coding）方式においては、マクロブロックとサブマクロブロックによる階層構造が規定されている。しかしながら、16x16画素のマクロブロックでは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；４０００画素x２０００画素）といった大きな画枠に対して最適ではない。

これに対して、HEVC方式においては、図１に示されるように、コーディングユニット（CU（Coding Unit））が規定されている。

CUは、Coding Tree Block（CTB）とも呼ばれ、AVC方式におけるマクロブロックと同様の役割を果たす、ピクチャ単位の画像の部分領域である。後者は、16x16画素の大きさに固定されているのに対し、前者の大きさは固定されておらず、それぞれのシーケンスにおいて、画像圧縮情報中において指定されることになる。

例えば、出力となる符号化データに含まれるシーケンスパラメータセット（SPS（Sequence Parameter Set））において、CUの最大サイズ（LCU（Largest Coding Unit））と最小サイズ（（SCU（Smallest Coding Unit））が規定される。

それぞれのLCU内においては、SCUのサイズを下回らない範囲で、split-flag=1とすることにより、より小さなサイズのCUに分割することができる。図１の例では、LCUの大きさが１２８であり、最大階層深度が５となる。2Nx2Nの大きさのCUは、split_flagの値が「１」である時、１つ下の階層となる、NxNの大きさのCUに分割される。

更に、CUは、イントラ若しくはインター予測の処理単位となる領域（ピクチャ単位の画像の部分領域）であるプレディクションユニット（Prediction Unit（PU））に分割され、また、直交変換の処理単位となる領域（ピクチャ単位の画像の部分領域）である、トランスフォームユニット（Transform Unit（TU））に分割される。現在、HEVC方式においては、4x4及び8x8に加え、16x16及び32x32直交変換を用いることが可能である。

以上のHEVC方式のように、CUを定義し、そのCUを単位として各種処理を行うような符号化方式の場合、AVC方式におけるマクロブロックはLCUに相当し、ブロック（サブブロック）はCUに相当すると考えることができる。また、AVC方式における動き補償ブロックは、PUに相当すると考えることができる。ただし、CUは、階層構造を有するので、その最上位階層のLCUのサイズは、例えば128x128画素のように、AVC方式のマクロブロックより大きく設定されることが一般的である。

よって、以下、LCUは、AVC方式におけるマクロブロックをも含むものとし、CUは、AVC方式におけるブロック（サブブロック）をも含むものとする。つまり、以下の説明に用いる「ブロック」は、ピクチャ内の任意の部分領域を示し、その大きさ、形状、および特性等は限定されない。つまり、「ブロック」には、例えば、TU、PU、SCU、CU、LCU、サブブロック、マクロブロック、またはスライス等任意の領域（処理単位）が含まれる。もちろん、これら以外の部分領域（処理単位）も含まれる。サイズや処理単位等を限定する必要がある場合は、適宜説明する。

また、本明細書において、CTU（Coding Tree Unit）は、LCU(最大数のCU)のCTB（Coding Tree Block）と、そのLCUベース（レベル）で処理するときのパラメータを含む単位であるとする。また、CTUを構成するCU（Coding Unit）は、CB(Coding Block)と、そのCUベース（レベル）で処理するときのパラメータを含む単位であるとする。

＜モード選択＞
ところで、AVCそしてHEVC符号化方式において、より高い符号化効率を達成するには、適切な予測モードの選択が重要である。

かかる選択方式の例として、JM (Joint Model) と呼ばれるH.264/MPEG-4 AVCの参照ソフトウエア (http://iphome.hhi.de/suehring/tml/index.htm において公開されている) に実装されている方法を挙げることが出来る。

JMにおいては、以下に述べる、High Complexity Modeと、Low Complexity Modeの2通りのモード判定方法を選択することが可能である。どちらも、それぞれの予測モードModeに関するコスト関数値を算出し、これを最小にする予測モードを当該ブロック乃至マクロブロックに対する最適モードとして選択する。

High Complexity Modeにおけるコスト関数は、以下の式（１）のように示される。

ここで、Ωは、当該ブロック乃至マクロブロックを符号化するための候補モードの全体集合Ｄは、当該予測モードで符号化した場合の、復号画像と入力画像の差分エネルギーである。λは、量子化パラメータの関数として与えられるLagrange未定乗数である。Ｒは、直交変換係数を含んだ、当該モードで符号化した場合の総符号量である。

つまり、High Complexity Modeでの符号化を行うには、上記パラメータＤ及びＲを算出するため、全ての候補モードにより、一度、仮エンコード処理を行う必要があり、より高い演算量を要する。

Low Complexity Modeにおけるコスト関数は、以下の式（２）のように示される。

ここで、Dは、High Complexity Modeの場合と異なり、予測画像と入力画像の差分エネルギーとなる。QP2Quant(QP)は、量子化パラメータQPの関数として与えられ、HeaderBitは、直交変換係数を含まない、動きベクトルや、モードといった、Headerに属する情報に関する符号量である。

すなわち、Low Complexity Modeにおいては、それぞれの候補モードに関して、予測処理を行う必要があるが、復号画像までは必要ないため、符号化処理まで行う必要はない。このため、High Complexity Modeより低い演算量での実現が可能である。

＜残差予測＞
ところで、HEVCにおいて、４４４符号化の際に、残差信号に対してコンポーネント間で予測（残差予測とも称する）を行う方法が考えられた（例えば、非特許文献２参照）。

この非特許文献２に記載の方法では、色差成分（Cb/Cr）（または、R成分やB成分）に対して、輝度成分（Y）（またはG成分）を用いて以下の式（３）ように予測が行われる。

ここで、r_c(x,y)は、色差成分（CbまたはCr）の残差データ（入力画像と予測画像の差分）を示す。また、r_L(x,y)は、輝度成分（Y）の残差データ（入力画像と予測画像の差分）を示す。さらに、Δr_c(x,y)は、残差予測の予測結果（色差成分（CbまたはCr）の残差データを輝度成分（Y）の残差データで予測したもの）（予測残差データとも称する）を示す。なお、これらにおいて、x,yは、画像内の位置（座標）を示す。

また、αは、重み係数を示し、±（0,1,2,4,8）のいずれかの値をとる。この値は、TU単位で設定される（すなわち、TU単位で復号側に伝送される）。さらに、＞＞は、右方向へのビットシフト（右シフト）を示す。例えば、＞＞ｎは、ｎビット分の右シフトを示す。

なお、このような残差予測を行うか否かがピクチャパラメータセット（PPS（Picture Parameter Set））単位で制御される。つまり、このような残差予測を行うか否かを制御するOn/OffフラグがPPSにおいて復号側に伝送される。

ところで、各コンポーネントのデータのビット深度は、一般的に互いに独立であるため、互いに異なる値が設定される可能性がある。しかしながら、上述した式（３）に示されるように、非特許文献２に記載の予測方法では、各コンポーネントの残差データ（輝度成分や色差成分）のビット深度は互いに同一であることが前提であり、コンポーネント間で残差データのビット深度が異なるケースについては想定されていなかった。つまり、式（３）のような予測では、コンポーネント間で残差データのビット深度が異なる場合には正しい予測を行うことができず、符号化効率が低減するおそれがあった。

＜ビット深度のスケーリング＞
そこで、複数コンポーネントからなる入力画像と予測画像との残差データに対してコンポーネント間で予測（残差予測）を行う際に、その残差データのビット深度をコンポーネント間で揃える（スケーリングを行う）ようにする。このようにすることにより、残差データのビット深度がコンポーネント間で異なる場合であっても、各コンポーネントの残差データのビット深度を揃えて予測を行うことができるので、残差予測を正しく行うことができる。したがって、符号化効率の低減を抑制することができる。

コンポーネント間で残差データのビット深度を揃える方法は任意であるが、例えば、残差データをビットシフトすることにより、コンポーネント間で残差データのビット深度を揃えるようにしてもよい。このようにすることにより、容易にコンポーネント間で残差データのビット深度を揃えることができる。すなわち、処理の負荷や処理時間を低減させることができる。

また、このように残差データのビット深度を揃える入力画像の色空間は任意である。例えば、YUV空間（YUV444等）であってもよいし、RGB空間（RGB444等）であってもよい。例えば、入力画像がYUV空間の場合、輝度成分と色差成分との間で、ビットシフトによって残差データのビット深度を揃えて予測を行うようにしてもよい。より具体的には、例えば、輝度成分のビット深度をビットシフトによって色差成分のビット深度に揃えてから予測を行うようにしてもよい。また例えば、入力画像がRGB空間の場合、G成分とR成分またはB成分との間で、ビットシフトによって残差データのビット深度を揃えて予測を行うようにしてもよい。より具体的には、例えば、G成分のビット深度をビットシフトによってR成分やB成分のビット深度に揃えてから予測を行うようにしてもよい。

＜シフト演算＞
以上のようなビット深度を揃えるビットシフト（シフト演算）の具体例について説明する。このシフト演算方法は任意である。例えば、予測を行う２つのコンポーネント間のビット深度の差が０でない場合、ビットシフトによって残差データのビット深度をコンポーネント間で揃えて予測を行うようにしてもよい。例えば、以下の式（４）のように、コンポーネント間の残差データのビット深度の差分（ビット深度差）を求め、式（５）乃至式（８）のように、そのビット深度差の分だけビットシフトを行うようにしてもよい。その際、ビットシフトは、式（６）や式（８）のように、ビット深度差の絶対値の分だけ行われるようにしてもよい。その場合、例えば、式（５）や式（７）の条件を満たすか否かに応じて、式（６）や式（８）のようにシフト方向が決定されるようにしてもよい。

式（４）乃至式（８）において、BitDepth_Yは、輝度成分（Y）の残差データのビット深度を示す。BitDepth_Cは、色差成分（CbまたはCr）の残差データのビット深度を示す。Δbitdepthは、コンポーネント間のビット深度差（輝度成分（Y）の残差データのビット深度（BitDepth_Y）と色差成分（CbまたはCr）の残差データのビット深度（BitDepth_C）との差）を示す。

また、r_c(x,y)は、色差成分（CbまたはCr）の残差データを示す。また、r_L(x,y)は、輝度成分（Y）の残差データを示す。さらに、Δr_c(x,y)は、コンポーネント間の予測残差データ（色差成分（CbまたはCr）の残差データを輝度成分（Y）の残差データで予測したもの）を示す。なお、これらにおいて、x,yは、画像内の位置（座標）を示す。

また、αは、重み係数を示す。このαの値は任意であるが、例えば±（0,1,2,4,8）のいずれかの値に設定される。この値は、TU単位で設定される（すなわち、TU単位で復号側に伝送される）。さらに、＞＞は、右方向へのビットシフト（右シフト）を示し、＜＜は、左方向へのビットシフト（左シフト）を示す。例えば、＞＞ｎは、ｎビット分の右シフトを示し、＜＜ｍは、ｍビット分の左シフトを示す。

この例の場合、式（４）乃至式（８）に示されるように、式（４）により、コンポーネント間のビット深度差（Δbitdepth）が算出される。そして、この値が式（５）の条件を満たす場合、すなわち、Δbitdepthが０以上の場合、予測残差データ（Δr_c(x,y)）が、式（６）のように算出される。式（６）に示されるように、この場合の算出方法は、基本的に式（３）と同様であるが、輝度成分（Y）の残差データ（r_L(x,y)）がビット深度差（Δbitdepth）分右シフトされて予測残差データ（Δr_c(x,y)）が算出される。

これに対して、コンポーネント間のビット深度差（Δbitdepth）が負の値（０より小さい値）であり、式（５）の条件を満たさない場合（式（７）の条件を満たす場合）、予測残差データ（Δr_c(x,y)）が、式（８）のように算出される。式（８）に示されるように、この場合の算出方法も、基本的に式（３）と同様であるが、輝度成分（Y）の残差データ（r_L(x,y)）がビット深度差（-Δbitdepth）分左シフトされて予測残差データ（Δr_c(x,y)）が算出される。

つまり、これらの場合、輝度成分（Y）の残差データ（r_L(x,y)）のビット深度（BitDepth_Y）が、色差成分（CbまたはCr）の残差データ（r_c(x,y)）のビット深度（BitDepth_C）に揃えられて予測残差データ（Δr_c(x,y)）が算出される。より具体的には、残差予測に用いる２つのコンポーネント間のビット深度の差が求められ、２つのコンポーネントの内の一方のコンポーネントの残差データに対してビット深度の差に応じたビットシフト（スケーリング）が行われ、ビットシフトされた残差データに所定の重み係数が乗算され、その乗算結果に対して所定のビット数分のビットシフトが行われ、他方のコンポーネントの残差データとビットシフトされた乗算結果との差分が求められる。以上のように予測を行うようにしてもよい。

なお、Δbitdepthが０の場合、輝度成分（Y）の残差データ（r_L(x,y)）のビットシフト量が０であるので、予測残差データ（Δr_c(x,y)）は、式（３）のように算出されるとも言える。

以上のように算出することにより、残差データのビット深度がコンポーネント間で異なる場合であっても、予測残差データ（Δr_c(x,y)）を正しく算出することができる。したがって、符号化効率の低減を抑制することができる。

＜セマンティクス＞
以上のようなビット深度のスケーリングを行うためには、セマンティクスを図２の例のような記述にすればよい。図２に示されるセマンティクスの下線を付した部分が、上述したスケーリング（例えば、式（５）乃至式（８））に相当する記述である。

＜画像符号化装置＞
図３は、本技術を適用した画像処理装置の一態様である画像符号化装置の構成の一例を示すブロック図である。図３に示される画像符号化装置１００は、例えば、HEVCの予測処理、またはそれに準ずる方式の予測処理を用いて動画像の画像データを符号化する。なお、以下においては、入力画像の色空間がYUV444である場合を例に説明する。

図３に示されるように画像符号化装置１００は、画面並べ替えバッファ１０２、演算部１０３、直交変換部１０４、量子化部１０５、可逆符号化部１０６、蓄積バッファ１０７、逆量子化部１０８、および逆直交変換部１０９を有する。また、画像符号化装置１００は、演算部１１０、ループフィルタ１１１、フレームメモリ１１２、イントラ予測部１１３、インター予測部１１４、予測画像選択部１１５、およびレート制御部１１６を有する。さらに、画像符号化装置１００は、ヘッダ処理部１２１、残差予測部１２２、および残差復元部１２３を有する。

画面並べ替えバッファ１０２は、入力された画像データの各フレームの画像をその表示順に記憶し、記憶した表示の順番のフレームの画像を、GOP（Group Of Picture）に応じて、符号化のためのフレームの順番に並べ替え、フレームの順番を並び替えた画像を、演算部１０３に供給する。また、画面並べ替えバッファ１０２は、フレームの順番を並び替えた画像を、イントラ予測部１１３およびインター予測部１１４にも供給する。

演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、予測画像選択部１１５を介してイントラ予測部１１３若しくはインター予測部１１４から供給される予測画像を減算し、その差分情報（残差データ）を残差予測部１２２に供給する。例えば、イントラ符号化が行われる画像の場合、演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、イントラ予測部１１３から供給される予測画像を減算する。また、例えば、インター符号化が行われる画像の場合、演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、インター予測部１１４から供給される予測画像を減算する。

直交変換部１０４は、残差予測部１２２から供給される輝度成分の残差データや色差成分の予測残差データに対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。直交変換部１０４は、その直交変換により得られた変換係数を量子化部１０５に供給する。

量子化部１０５は、直交変換部１０４から供給される変換係数を量子化する。量子化部１０５は、レート制御部１１６から供給される符号量の目標値に関する情報に基づいて量子化パラメータを設定し、その量子化を行う。量子化部１０５は、量子化された変換係数を可逆符号化部１０６に供給する。

可逆符号化部１０６は、量子化部１０５において量子化された変換係数を任意の符号化方式で符号化する。係数データは、レート制御部１１６の制御の下で量子化されているので、この符号量は、レート制御部１１６が設定した目標値となる（若しくは目標値に近似する）。

また、可逆符号化部１０６は、イントラ予測のモードを示す情報などをイントラ予測部１１３から取得し、インター予測のモードを示す情報や差分動きベクトル情報などをインター予測部１１４から取得する。

可逆符号化部１０６は、これらの各種情報を任意の符号化方式で符号化し、符号化データ（符号化ストリームとも称する）のヘッダ情報の一部とする（多重化する）。可逆符号化部１０６は、符号化して得られた符号化データを蓄積バッファ１０７に供給して蓄積させる。

可逆符号化部１０６の符号化方式としては、例えば、可変長符号化または算術符号化等が挙げられる。可変長符号化としては、例えば、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などが挙げられる。算術符号化としては、例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）などが挙げられる。

蓄積バッファ１０７は、可逆符号化部１０６から供給された符号化データを、一時的に保持する。蓄積バッファ１０７は、所定のタイミングにおいて、保持している符号化データを、画像符号化装置１００の外部に出力する。すなわち、蓄積バッファ１０７は、符号化データを伝送する伝送部でもある。

また、量子化部１０５において量子化された変換係数は、逆量子化部１０８にも供給される。逆量子化部１０８は、その量子化された変換係数を、量子化部１０５による量子化に対応する方法で逆量子化する。逆量子化部１０８は、その逆量子化により得られた変換係数を、逆直交変換部１０９に供給する。

逆直交変換部１０９は、逆量子化部１０８から供給された変換係数を、直交変換部１０４による直交変換処理に対応する方法で逆直交変換する。逆直交変換部１０９は、逆直交変換された出力（復元された輝度成分の残差データや色差成分の予測残差データ）を残差復元部１２３に供給する。また、逆直交変換部１０９は、復元された輝度成分の残差データを残差予測部１２２にも供給する。

演算部１１０は、残差復元部１２３から供給された、復元された各コンポーネントの残差データに、予測画像選択部１１５を介してイントラ予測部１１３若しくはインター予測部１１４からの予測画像を加算し、局所的に再構成された画像（以下、再構成画像と称する）を得る。その再構成画像は、ループフィルタ１１１またはイントラ予測部１１３に供給される。

ループフィルタ１１１は、デブロックフィルタや適応ループフィルタ等を含み、演算部１１０から供給される再構成画像に対して適宜フィルタ処理を行う。例えば、ループフィルタ１１１は、再構成画像に対してデブロックフィルタ処理を行うことにより再構成画像のブロック歪を除去する。また、例えば、ループフィルタ１１１は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた再構成画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。

なお、ループフィルタ１１１が、再構成画像に対してさらに、他の任意のフィルタ処理を行うようにしてもよい。また、ループフィルタ１１１は、必要に応じて、フィルタ処理に用いたフィルタ係数等の情報を可逆符号化部１０６に供給し、それを符号化させるようにすることもできる。

ループフィルタ１１１は、フィルタ処理結果（以下、復号画像と称する）をフレームメモリ１１２に供給する。

フレームメモリ１１２は、供給される復号画像を記憶し、所定のタイミングにおいて、記憶している復号画像を参照画像としてインター予測部１１４に供給する。

イントラ予測部１１３は、演算部１１０から参照画像として供給される再構成画像である処理対象ピクチャ内の画素値を用いて予測画像を生成するイントラ予測（画面内予測）を行う。イントラ予測部１１３は、予め用意された複数のイントラ予測モードでこのイントラ予測を行う。

イントラ予測部１１３は、候補となる全てのイントラ予測モードで予測画像を生成し、画面並べ替えバッファ１０２から供給される入力画像を用いて各予測画像のコスト関数値を評価し、最適なモードを選択する。イントラ予測部１１３は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１１５に供給する。

また、上述したように、イントラ予測部１１３は、採用されたイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部１０６に供給し、符号化させる。

インター予測部１１４は、画面並べ替えバッファ１０２から供給される入力画像と、フレームメモリ１１２から供給される参照画像とを用いてインター予測処理（動き予測処理および補償処理）を行う。より具体的には、インター予測部１１４は、インター予測処理として、動き予測を行って検出された動きベクトルに応じて動き補償処理を行い、予測画像（インター予測画像情報）を生成する。インター予測部１１４は、予め用意された複数のインター予測モードでこのようなインター予測を行う。

インター予測部１１４は、候補となる全てのインター予測モードで予測画像を生成する。インター予測部１１４は、画面並べ替えバッファ１０２から供給される入力画像と、生成した差分動きベクトルの情報などを用いて、各予測画像のコスト関数値を評価し、最適なモードを選択する。インター予測部１１４は、最適なインター予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１１５に供給する。

インター予測部１１４は、採用されたインター予測モードを示す情報や、符号化データを復号する際に、そのインター予測モードで処理を行うために必要な情報等を可逆符号化部１０６に供給し、符号化させる。必要な情報としては、例えば、生成された差分動きベクトルの情報や、予測動きベクトル情報として、予測動きベクトルのインデックスを示すフラグなどがある。

予測画像選択部１１５は、演算部１０３や演算部１１０に供給する予測画像の供給元を選択する。例えば、イントラ符号化の場合、予測画像選択部１１５は、予測画像の供給元としてイントラ予測部１１３を選択し、そのイントラ予測部１１３から供給される予測画像を演算部１０３や演算部１１０に供給する。また、例えば、インター符号化の場合、予測画像選択部１１５は、予測画像の供給元としてインター予測部１１４を選択し、そのインター予測部１１４から供給される予測画像を演算部１０３や演算部１１０に供給する。

レート制御部１１６は、蓄積バッファ１０７に蓄積された符号化データの符号量に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

ヘッダ処理部１２１は、例えば、ビデオパラメータセット（VPS（Video Parameter Set））、シーケンスパラメータセット（SPS（Sequence Parameter Set））、ピクチャパラメータセット（PPS）、SEI（Supplemental Enhancement Information）、スライスヘッダ等の画像情報以外の付加情報（ヘッダ情報とも称する）を生成する。ヘッダ処理部１２１は、生成したヘッダ情報を可逆符号化部１０６に供給し、ビットストリームに含めて復号側に伝送させる。また、ヘッダ処理部１２１は、生成したヘッダ情報の中から必要な情報を残差予測部１２２に供給する。詳細については後述する。

残差予測部１２２は、演算部１０３から供給される色差成分の残差データと、逆直交変換部１０９から供給される、復元された輝度成分の残差データとを用いて残差予測を行う。より具体的には、残差予測部１２２は、復元された輝度成分の残差データを用いて、色差成分の残差データの予測を行い、予測残差データを生成する。その際、残差予測部１２２は、残差データのビット深度をコンポーネント間で揃えて予測を行う。詳細については後述する。残差予測部１２２は、このような残差予測により得られた色差成分の予測残差データや演算部１０３から供給される輝度成分の残差データを直交変換部１０４に供給する。なお、残差予測が行われない場合、残差予測部１２２は、演算部１０３から供給される各コンポーネントの残差データを直交変換部１０４に供給する。

残差復元部１２３は、逆直交変換部１０９から供給される輝度成分の残差データと色差成分の予測残差データとを用いて、色差成分の残差データを復元する（残差復元とも称する）。その際、残差復元部１２３は、残差データのビット深度をコンポーネント間で揃えて復元を行う。なお、この残差復元の処理は、復号側において行われる残差復元の処理と基本的に同様であるので、復号側を説明する際に、その復号側の説明を利用してこの残差復元の処理についての説明を行う。残差復元部１２３は、復元された各コンポーネントの残差データを演算部１１０に供給する。

＜ヘッダ処理部および残差予測部＞
図４は、図３のヘッダ処理部１２１および残差予測部１２２の主な構成例を示すブロック図である。図４に示されるようにヘッダ処理部１２１は、SPS処理部１３１およびPPS処理部１３２を有する。

SPS処理部１３１は、例えば、シーケンスパラメータセット（SPS）の生成に関する処理を行う。また、SPS処理部１３１は、例えば、シーケンスパラメータセット（SPS）に含まれる、輝度成分のビット深度を示す情報（例えばbit_depth_luma_minus8）若しくは輝度成分のビット深度を示す情報を含む情報と、色差成分（Cb/Cr）のビット深度を示す情報（例えばbit_depth_chroma_minus8）若しくは色差成分のビット深度を示す情報を含む情報とを残差予測部１２２（後述するビット深度差算出部１５１）に供給する。

PPS処理部１３２は、例えば、ピクチャパラメータセット（PPS）の生成に関する処理を行う。また、PPS処理部１３２は、例えば、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）を残差予測部１２２（後述するビットシフト制御部１５２）に供給する。

残差予測部１２２は、演算部１０３から供給される輝度成分の残差データ（r_Y(x,y)）を、直交変換部１０４に供給する。また、残差予測部１２２は、制御部１４１および予測部１４２を有する。制御部１４１は、残差予測の演算の制御に関する処理を行う。予測部１４２は、制御部１４１に制御されて、その予測に関する演算を行う。例えば、予測部１４２は、制御部１４１の制御に基づいて、逆直交変換部１０９から取得した、復元された輝度成分の残差データ（r'_Y(x,y)）を用いて、演算部１０３から取得した色差成分の残差データ（r_Cr(x,y)とr_Cb(x,y)）の予測（残差予測）を行い、予測残差データ（Δr_Cr(x,y)とΔr_Cb(x,y)）を生成し、直交変換部１０４に供給する。また、予測部１４２は、制御部１４１に制御されて、残差予測を行わずに、演算部１０３から取得した色差成分の残差データ（r_Cr(x,y)とr_Cb(x,y)）を、直交変換部１０４に供給する。

制御部１４１は、ビット深度差算出部１５１、ビットシフト制御部１５２、および重み係数設定部１５３を有する。

ビット深度差算出部１５１は、残差予測に用いる各コンポーネントの残差データのビット深度の差を算出する。例えば、ビット深度差算出部１５１は、SPS処理部１３１から、輝度成分のビット深度を示す情報（例えばbit_depth_luma_minus8）若しくは輝度成分のビット深度を示す情報を含む情報と、色差成分（Cb/Cr）のビット深度を示す情報（例えばbit_depth_chroma_minus8）若しくは色差成分のビット深度を示す情報を含む情報とを取得し、それらの情報を用いて、式（４）に示される演算を行い、コンポーネント間のビット深度差（delta_bitdepth）を算出する。ビット深度差算出部１５１は、算出したビット深度差（delta_bitdepth）をビットシフト制御部１５２に供給する。

また、ビット深度差算出部１５１は、ビットシフト制御部１５２の制御に基づいて、算出したビット深度差（delta_bitdepth）を予測部１４２に供給する。例えば、ビット深度のスケーリングの際に残差データの右シフトを行う場合、ビット深度差算出部１５１は、算出したビット深度差（delta_bitdepth）を右シフト部１６２に供給する。また、ビット深度のスケーリングの際に残差データの左シフトを行う場合、ビット深度差算出部１５１は、算出したビット深度差（−delta_bitdepth）を左シフト部１６３に供給する。

ビットシフト制御部１５２は、ビット深度差算出部１５１から供給されるコンポーネント間のビット深度差（delta_bitdepth）の値に基づいて、予測部１４２による演算を制御する。例えば、ビットシフト制御部１５２は、ビット深度差（delta_bitdepth）が０の場合、残差データのビットシフト（ビット深度のスケーリング）を行わないように、予測部１４２（の選択部１６１）を制御する。また、その際、ビットシフト制御部１５２は、ビット深度差算出部１５１も制御し、ビット深度差（delta_bitdepth）を予測部１４２に供給させないようにする。

また、例えば、ビットシフト制御部１５２は、ビット深度差（delta_bitdepth）が正の値（＞０）の場合、残差データを右シフトする（ビット深度のスケーリングを行う）ように、予測部１４２（の選択部１６１）を制御する。また、その際、ビットシフト制御部１５２は、ビット深度差算出部１５１も制御し、ビット深度差（delta_bitdepth）を予測部１４２（右シフト部１６２）に供給させる。

さらに、例えば、ビットシフト制御部１５２は、ビット深度差（delta_bitdepth）が負の値（＜０）の場合、残差データを左シフトする（ビット深度のスケーリングを行う）ように、予測部１４２（の選択部１６１）を制御する。また、その際、ビットシフト制御部１５２は、ビット深度差算出部１５１も制御し、ビット深度差（−delta_bitdepth）を予測部１４２（左シフト部１６３）に供給させる。

また、ビットシフト制御部１５２は、例えば、PPS処理部１３２から、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）を取得し、その値に基づいて、残差予測を行うか否かを制御する。例えば、残差予測を行うか否かを制御する情報により残差予測を行わないことが示されている場合、ビットシフト制御部１５２は、予測部１４２を制御し、予測に関する演算を行わせないようにする。また、その場合、ビットシフト制御部１５２は、ビット深度差算出部１５１を制御し、ビット深度差（delta_bitdepthまたは-delta_bitdepth）の供給を停止させる。さらに、ビットシフト制御部１５２は、その場合、重み係数設定部１５３を制御し、重み係数αを設定させないようにする。

逆に、例えば、残差予測を行うか否かを制御する情報により残差予測を行うことが示されている場合、ビットシフト制御部１５２は、予測部１４２を制御し、予測に関する演算を行わせるようにする。また、その場合、ビットシフト制御部１５２は、ビット深度差算出部１５１を制御し、ビット深度差（delta_bitdepthまたは-delta_bitdepth）を予測部１４２に供給させる。さらに、その場合、ビットシフト制御部１５２は、重み係数設定部１５３を制御し、重み係数αを設定させ、予測部１４２（重み係数乗算部１６４）に供給させる。

重み係数設定部１５３は、ビットシフト制御部１５２の制御に従って、重み係数αを設定する。この重み係数αの設定方法や値は任意である。例えば、重み係数設定部１５３が、コンポーネント毎に独立に重み係数αを設定するようにしてもよい。また、重み係数設定部１５３は、重み係数αを設定した場合、その重み係数αを、予測部１４２（重み係数乗算部１６４）に供給する。また、この重み係数αは、残差復元においても用いられるため、ビットストリームに含められて復号側に提供される。

予測部１４２は、選択部１６１、右シフト部１６２、左シフト部１６３、重み係数乗算部１６４、右シフト部１６５、演算部１６６、および演算部１６７を有する。

選択部１６１は、ビットシフト制御部１５２の制御に従って、逆直交変換部１０９から供給される、復元された輝度成分の残差データ（r'_Y(x,y)）の供給先を選択する。例えば、ビット深度のスケーリング（右シフト）が行われる場合、選択部１６１は、復元された輝度成分の残差データ（r'_Y(x,y)）を右シフト部１６２に供給する。この場合、式（６）の演算が行われる。また、例えば、ビット深度のスケーリング（左シフト）が行われる場合、選択部１６１は、復元された輝度成分の残差データ（r'_Y(x,y)）を左シフト部１６３に供給する。この場合、式（８）の演算が行われる。さらに、例えば、ビット深度のスケーリングが行われない場合、選択部１６１は、復元された輝度成分の残差データ（r'_Y(x,y)）を重み係数乗算部１６４に供給する。この場合、式（３）の演算が行われる。

右シフト部１６２は、選択部１６１から取得した、復元された輝度成分の残差データ（r'_Y(x,y)）を、ビット深度差算出部１５１から取得したビット深度差（delta_bitdepth）分、右シフトすることにより、ビット深度のスケーリングを行う。右シフト部１６２は、輝度成分の残差データの右シフト結果（r'_Y(x,y)＞＞delta_bitdepth）を、重み係数乗算部１６４に供給する。

左シフト部１６３は、選択部１６１から取得した、復元された輝度成分の残差データ（r'_Y(x,y)）を、ビット深度差算出部１５１から取得したビット深度差（-delta_bitdepth）分、左シフトすることにより、ビット深度のスケーリングを行う。左シフト部１６３は、輝度成分の残差データの左シフト結果（r'_Y(x,y)＜＜-delta_bitdepth）を、重み係数乗算部１６４に供給する。

重み係数乗算部１６４は、選択部１６１乃至左シフト部１６３のいずれかから、復元された輝度成分の残差データを取得する。例えば、重み係数乗算部１６４は、ビットシフトされていない、復元された輝度成分の残差データ（r'_Y(x,y)）を選択部１６１から取得する。また、例えば、重み係数乗算部１６４は、右シフトされた、復元された輝度成分の残差データ（r'_Y(x,y)＞＞delta_bitdepth）を右シフト部１６２から取得する。さらに、例えば、重み係数乗算部１６４は、左シフトされた、復元された輝度成分の残差データ（r'_Y(x,y)＜＜-delta_bitdepth）を左シフト部１６３から取得する。

また、重み係数乗算部１６４は、重み係数設定部１５３から重み係数αを取得する。重み係数乗算部１６４は、取得した復元された輝度成分の残差データにその重み係数αを乗算し、その乗算結果（α×（r'_Y(x,y)）、α×（r'_Y(x,y)＞＞delta_bitdepth）、または、α×（r'_Y(x,y)＜＜-delta_bitdepth））を右シフト部１６５に供給する。

右シフト部１６５は、重み係数乗算部１６４から供給された、復元された輝度成分の残差データ（α×（r'_Y(x,y)）、α×（r'_Y(x,y)＞＞delta_bitdepth）、または、α×（r'_Y(x,y)＜＜-delta_bitdepth））を、所定のビット数分、右シフトする。このビットシフト量は任意であるが、例えば、式（３）、式（６）、式（８）の場合、右シフト部１６５は、残差データを３ビット右シフトする。右シフト部１６５は、その右シフト結果（α×（r'_Y(x,y)）＞＞３、α×（r'_Y(x,y)＞＞delta_bitdepth）＞＞３、または、α×（r'_Y(x,y)＜＜-delta_bitdepth）＞＞３）を、演算部１６６若しくは演算部１６７に供給する。

演算部１６６は、演算部１０３から供給される色差成分（Cr）の残差データ（r_Cr(x,y)）から、右シフト部１６５から供給される、復元された輝度成分の残差データ（α×（r'_Y(x,y)）＞＞３、α×（r'_Y(x,y)＞＞delta_bitdepth）＞＞３、または、α×（r'_Y(x,y)＜＜-delta_bitdepth）＞＞３）を減算することにより、色差成分（Cr）の予測残差データ（Δr_Cr(x,y)）を生成し、それを直交変換部１０４に供給する。また、このような演算を行わない場合、演算部１６６は、演算部１０３から供給される色差成分（Cr）の残差データ（r_Cr(x,y)）を、直交変換部１０４に供給する。

さらに、演算部１６７は、演算部１０３から供給される色差成分（Cb）の残差データ（r_Cb(x,y)）から、右シフト部１６５から供給される、復元された輝度成分の残差データ（α×（r'_Y(x,y)）＞＞３、α×（r'_Y(x,y)＞＞delta_bitdepth）＞＞３、または、α×（r'_Y(x,y)＜＜-delta_bitdepth）＞＞３）を減算することにより、色差成分（Cb）の予測残差データ（Δr_Cb(x,y)）を生成し、それを直交変換部１０４に供給する。また、このような演算を行わない場合、演算部１６７は、演算部１０３から供給される色差成分（Cb）の残差データ（r_Cb(x,y)）を、直交変換部１０４に供給する。

残差予測部１２２は、以上のように、残差予測において、復元された輝度成分の残差データのビット深度のスケーリングを行って予測を行う。したがって、残差予測部１２２は、残差データのビット深度がコンポーネント間で異なる場合であっても、予測残差データを正しく算出することができる。したがって、画像符号化装置１００は、符号化効率の低減を抑制することができる。

＜符号化処理の流れ＞
次に、画像符号化装置１００により実行される各処理の流れの例を説明する。最初に、符号化処理の流れの例を、図５のフローチャートを参照して説明する。

符号化処理が開始されると、ヘッダ処理部１２１は、ステップＳ１０１において、例えばシーケンスパラメータセット（SPS）やピクチャパラメータセット（PPS）等のヘッダ情報を生成する。

ステップＳ１０２において、画面並べ替えバッファ１０２は、入力された動画像の各フレーム（ピクチャ）の画像をその表示する順番に記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

ステップＳ１０３において、イントラ予測部１１３は、イントラ予測モードのイントラ予測処理を行う。

ステップＳ１０４において、インター予測部１１４は、インター予測モードでの動き予測や動き補償等を行うインター予測処理を行う。

ステップＳ１０５において、予測画像選択部１１５は、コスト関数値等に基づいて、ステップＳ１０３のイントラ予測により生成された予測画像と、ステップＳ１０４のインター予測により生成された予測画像のいずれか一方を選択する。

ステップＳ１０６において、演算部１０３は、ステップＳ１０２の処理によりフレーム順を並び替えられた入力画像と、ステップＳ１０５の処理により選択された予測画像との差分を演算する。つまり、演算部１０３は、入力画像と予測画像との残差データを生成する。このようにして求められた残差データは、元の画像データに比べてデータ量が低減される。したがって、画像をそのまま符号化する場合に比べて、データ量を圧縮することができる。これらの処理が各コンポーネント（Y,Cr,Cb）のそれぞれについて行われる。

ステップＳ１０７において、残差予測部１２２は、ステップＳ１０６の処理により得られた色差成分の残差データに対して、輝度成分の残差データを用いて残差予測を行う。その際、残差予測部１２２は、残差データのビット深度をコンポーネント間で揃えて予測を行う。この処理の詳細については後述する。

ステップＳ１０８において、直交変換部１０４は、ステップＳ１０６の処理により生成された輝度成分の残差データ、並びに、ステップＳ１０７の処理により生成された色差成分の予測残差データを直交変換する。

ステップＳ１０９において、量子化部１０５は、レート制御部１１６により算出された量子化パラメータを用いて、ステップＳ１０８の処理により得られた直交変換係数を量子化する。

ステップＳ１１０において、逆量子化部１０８は、ステップＳ１０９の処理により生成された量子化された係数（量子化係数とも称する）を、その量子化の特性に対応する特性で逆量子化する。

ステップＳ１１１において、逆直交変換部１０９は、ステップＳ１０８の処理により得られた直交変換係数を逆直交変換する。

ステップＳ１１２において、残差復元部１２３は、ステップＳ１１１の処理により復元された輝度成分の残差データと色差成分の予測残差データとを用いて、色差成分の残差データを復元する。その際、残差復元部１２３は、残差データのビット深度をコンポーネント間で揃えて復元を行う。この処理の詳細については後述する。

ステップＳ１１３において、演算部１１０は、ステップＳ１１１およびステップＳ１１２の処理により復元された各コンポーネントの残差データに、ステップＳ１０５の処理により選択された予測画像を加算することにより、再構成画像の画像データを生成する。

ステップＳ１１４においてループフィルタ１１１は、ステップＳ１１３の処理により生成された再構成画像の画像データにループフィルタ処理を行う。これにより、再構成画像のブロック歪み等が除去される。

ステップＳ１１５において、フレームメモリ１１２は、ステップＳ１１４の処理により得られた、局所的に復号された復号画像を記憶する。

ステップＳ１１６において、可逆符号化部１０６は、ステップＳ１０９の処理により得られた、量子化された係数を符号化する。すなわち、残差データに対応するデータに対して、可変長符号化や算術符号化等の可逆符号化が行われる。

また、このとき、可逆符号化部１０６は、ステップＳ１０５の処理により選択された予測画像の予測モードに関する情報を符号化し、差分画像を符号化して得られる符号化データに付加する。つまり、可逆符号化部１０６は、イントラ予測部１１３から供給される最適イントラ予測モード情報、または、インター予測部１１４から供給される最適インター予測モードに応じた情報なども符号化し、符号化データに付加する。

ステップＳ１１７において蓄積バッファ１０７は、ステップＳ１１６の処理により得られた符号化データ等を蓄積する。蓄積バッファ１０７に蓄積された符号化データ等は、ビットストリームとして適宜読み出され、伝送路や記録媒体を介して復号側に伝送される。

ステップＳ１１８においてレート制御部１１６は、ステップＳ１１７の処理により蓄積バッファ１０７に蓄積された符号化データ等の符号量（発生符号量）に基づいて、オーバフローあるいはアンダーフローが発生しないように、ステップＳ１０９の量子化処理のレートを制御する。

ステップＳ１１８の処理が終了すると、符号化処理が終了する。

＜残差予測処理の流れ＞
次に、このような符号化処理のステップＳ１０７において実行される残差予測処理の流れの例を、図６のフローチャートを参照して説明する。

残差予測処理が開始されると、ステップＳ１２１において、ビット深度差算出部１５１は、残差予測を行うコンポーネント間のビット深度の差分を算出する。すなわち、ビット深度差算出部１５１は、式（４）の演算を行い、輝度成分（Y）と色差成分（CrまたはCb）のビット深度差（delta_bitdepth）を算出する。色差成分（Cr）と色差成分（Cb）とでビット深度差が異なる場合は、それぞれビット深度差（delta_bitdepth）を算出する。

ステップＳ１２２において、ビットシフト制御部１５２は、ステップＳ１２１において算出されたビット深度差（delta_bitdepth）が０であるか否かを判定する。０であると判定された場合、処理は、ステップＳ１２３に進む。この場合、ビットシフトは行われず、残差予測は、式（３）のように行われる。

ステップＳ１２３において、ビットシフト制御部１５２は、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）等に基づいて残差予測を行うか否かを判定する。例えば、luma_chroma_prediction_enabled_flagの値が１であり、残差予測を行うと判定された場合、処理はステップＳ１２４に進む。

ステップＳ１２４において、重み係数設定部１５３は、TU毎に重み係数αを設定する。

ステップＳ１２５において、予測部１４２は、ビット深度のスケーリングを行わずに、残差データのコンポーネント間の予測（残差予測）を行う。この処理の詳細は後述する。

ステップＳ１２５における残差予測が終了すると、残差予測処理が終了し、処理は図５に戻る。

また、例えば、ステップＳ１２３において、luma_chroma_prediction_enabled_flagの値が０であり、残差予測を行わないと判定された場合、ステップＳ１２４およびステップＳ１２５の処理が省略され、残差予測処理が終了し、処理は図５に戻る。

また、ステップＳ１２２において、ビット深度差（delta_bitdepth）が０でないと判定された場合、処理は、ステップＳ１２６に進む。

ステップＳ１２６において、ビットシフト制御部１５２は、ステップＳ１２１において算出されたビット深度差（delta_bitdepth）が正であるか否かを判定する。正であると判定された場合、処理はステップＳ１２７に進む。この場合、残差予測は、式（６）のように行われる（右シフトによるスケーリングが行われる）。

ステップＳ１２７において、ビットシフト制御部１５２は、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）等に基づいて残差予測を行うか否かを判定する。例えば、luma_chroma_prediction_enabled_flagの値が１であり、残差予測を行うと判定された場合、処理はステップＳ１２８に進む。

ステップＳ１２８において、重み係数設定部１５３は、TU毎に重み係数αを設定する。

ステップＳ１２９において、予測部１４２は、右シフトによりビット深度のスケーリングを行って、残差データのコンポーネント間の予測（残差予測）を行う。この処理の詳細は後述する。

ステップＳ１２９における残差予測が終了すると、残差予測処理が終了し、処理は図５に戻る。

また、例えば、ステップＳ１２７において、luma_chroma_prediction_enabled_flagの値が０であり、残差予測を行わないと判定された場合、ステップＳ１２８およびステップＳ１２９の処理が省略され、残差予測処理が終了し、処理は図５に戻る。

また、ステップＳ１２６において、ビット深度差（delta_bitdepth）が正でない（負である）と判定された場合、処理はステップＳ１３０に進む。この場合、残差予測は、式（８）のように行われる（左シフトによるスケーリングが行われる）。

ステップＳ１３０において、ビットシフト制御部１５２は、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）等に基づいて残差予測を行うか否かを判定する。例えば、luma_chroma_prediction_enabled_flagの値が１であり、残差予測を行うと判定された場合、処理はステップＳ１３１に進む。

ステップＳ１３１において、重み係数設定部１５３は、TU毎に重み係数αを設定する。

ステップＳ１３２において、予測部１４２は、左シフトによりビット深度のスケーリングを行って、残差データのコンポーネント間の予測（残差予測）を行う。この処理の詳細は後述する。

ステップＳ１３２における残差予測が終了すると、残差予測処理が終了し、処理は図５に戻る。

また、例えば、ステップＳ１３０において、luma_chroma_prediction_enabled_flagの値が０であり、残差予測を行わないと判定された場合、ステップＳ１３１およびステップＳ１３２の処理が省略され、残差予測処理が終了し、処理は図５に戻る。

＜予測残差データ生成処理の流れ＞
次に、このような残差予測処理のステップＳ１２５において実行される予測残差データ生成処理の流れの例を、図７のフローチャートを参照して説明する。

予測残差データ生成処理が開始されると、ステップＳ１４１において、予測部１４２の重み係数乗算部１６４は、復元された輝度成分の残差データ（r'_Y(x,y)）に、図６のステップＳ１２４の処理により設定された重み係数αを乗算する（α×r'_Y(x,y)）。

ステップＳ１４２において、右シフト部１６５は、ステップＳ１４１において算出された乗算結果（α×r'_Y(x,y））を３ビット右シフトする（(α×r'_Y(x,y))＞＞3）。

ステップＳ１４３において、演算部１６６は、輝度成分Crの残差データ（r_Cr(x,y)）から、ステップＳ１４２において算出された右シフト結果（(α×r'_Y(x,y))＞＞3）を減算することにより（r_Cr(x,y)-(α×r'_Y(x,y))＞＞3）、予測残差データ（Δr_Cr(x,y)）を生成する。また、演算部１６７は、輝度成分Cbの残差データ（r_Cb(x,y)）から、ステップＳ１４２において算出された右シフト結果（(α×r'_Y(x,y))＞＞3）を減算することにより（r_Cb(x,y)-(α×r'_Y(x,y))＞＞3）、予測残差データ（Δr_Cb(x,y)）を生成する。

以上のように予測残差データ（Δr_Cr(x,y)およびΔr_Cb(x,y)）が生成されると、予測残差データ生成処理が終了し、処理は図６に戻る。

＜予測残差データ生成処理の流れ＞
次に、残差予測処理のステップＳ１２９において実行される予測残差データ生成処理の流れの例を、図８のフローチャートを参照して説明する。

予測残差データ生成処理が開始されると、ステップＳ１５１において、予測部１４２の右シフト部１６２は、復元された輝度成分の残差データ（r'_Y(x,y)）を、図６のステップＳ１２１の処理により算出された残差データのビット深度差（delta_bitdepth）の分、右シフトする（r'_Y(x,y)＞＞delta_bitdepth）。

ステップＳ１５２において、重み係数乗算部１６４は、ステップＳ１５１において算出された右シフト結果（r'_Y(x,y)＞＞delta_bitdepth）に、図６のステップＳ１２８の処理により設定された重み係数αを乗算する（α×(r'_Y(x,y)＞＞delta_bitdepth)）。

ステップＳ１５３において、右シフト部１６５は、ステップＳ１５２において算出された乗算結果（α×(r'_Y(x,y)＞＞delta_bitdepth)）を３ビット右シフトする（α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）。

ステップＳ１５４において、演算部１６６は、輝度成分Crの残差データ（r_Cr(x,y)）から、ステップＳ１５３において算出された右シフト結果（α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）を減算することにより（r_Cr(x,y)-α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）、予測残差データ（Δr_Cr(x,y)）を生成する。また、演算部１６７は、輝度成分Cbの残差データ（r_Cb(x,y)）から、ステップＳ１５３において算出された右シフト結果（α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）を減算することにより（r_Cb(x,y)-α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）、予測残差データ（Δr_Cb(x,y)）を生成する。

＜予測残差データ生成処理の流れ＞
次に、残差予測処理のステップＳ１３２において実行される予測残差データ生成処理の流れの例を、図９のフローチャートを参照して説明する。

予測残差データ生成処理が開始されると、ステップＳ１６１において、予測部１４２の左シフト部１６３は、復元された輝度成分の残差データ（r'_Y(x,y)）を、図６のステップＳ１２１の処理により算出された残差データのビット深度差（-delta_bitdepth）の分、左シフトする（r'_Y(x,y)＜＜-delta_bitdepth）。

ステップＳ１６２において、重み係数乗算部１６４は、ステップＳ１６１において算出された左シフト結果（r'_Y(x,y)＜＜-delta_bitdepth）に、図６のステップＳ１３１の処理により設定された重み係数αを乗算する（α×(r'_Y(x,y)＜＜-delta_bitdepth)）。

ステップＳ１６３において、右シフト部１６５は、ステップＳ１６２において算出された乗算結果（α×(r'_Y(x,y)＜＜-delta_bitdepth)）を３ビット右シフトする（α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）。

ステップＳ１６４において、演算部１６６は、輝度成分Crの残差データ（r_Cr(x,y)）から、ステップＳ１５３において算出された右シフト結果（α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）を減算することにより（r_Cr(x,y)-α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）、予測残差データ（Δr_Cr(x,y)）を生成する。また、演算部１６７は、輝度成分Cbの残差データ（r_Cb(x,y)）から、ステップＳ１６３において算出された右シフト結果（α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）を減算することにより（r_Cb(x,y)-α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）、予測残差データ（Δr_Cb(x,y)）を生成する。

以上のように各処理を実行することにより、残差予測部１２２は、残差データのビット深度がコンポーネント間で異なる場合であっても、予測残差データを正しく算出することができる。したがって、画像符号化装置１００は、符号化効率の低減を抑制することができる。

＜残差復元＞
次に、以上のように符号化された符号化データ（ビットストリーム）の復号について説明する。残差予測に対応する残差復元を実現する（すなわち、色差成分の残差データを復元する）ためには、式（３）乃至式（８）から明らかなように、残差復元において、残差予測により生成された色差成分の予測残差データに、残差予測に用いられた復元された輝度成分の残差データを加算すればよい。

つまり、式（６）や式（８）に示される例のように、残差予測の際にビット深度をコンポーネント間で揃える場合、その残差予測に対応する残差復元においても、ビット深度をコンポーネント間で揃えて色差成分の残差データを復元するようにすればよい。このようにすることにより、残差データのビット深度がコンポーネント間で異なる場合であっても、各コンポーネントの残差データのビット深度を揃えて復元を行うことができるので、残差復元を正しく行うことができる。したがって、符号化効率の低減を抑制することができる。

コンポーネント間で残差データのビット深度を揃える方法は任意であるが、残差予測の際と同様に行えばよい。例えば、残差データをビットシフトすることにより、コンポーネント間で残差データのビット深度を揃えるようにしてもよい。このようにすることにより、容易にコンポーネント間で残差データのビット深度を揃えることができる。すなわち、処理の負荷や処理時間を低減させることができる。

当然、残差復元の場合も、残差復号の場合と同様に、残差データのビット深度を揃える画像の色空間は任意である。例えば、YUV空間（YUV444等）であってもよいし、RGB空間（RGB444等）であってもよい。例えば、画像がYUV空間の場合、輝度成分と色差成分との間で、ビットシフトによって残差データのビット深度を揃えて復元を行うようにしてもよい。より具体的には、例えば、輝度成分のビット深度をビットシフトによって色差成分のビット深度に揃えてから復元を行うようにしてもよい。また例えば、画像がRGB空間の場合、G成分とR成分またはB成分との間で、ビットシフトによって残差データのビット深度を揃えて復元を行うようにしてもよい。より具体的には、例えば、G成分のビット深度をビットシフトによってR成分やB成分のビット深度に揃えてから復元を行うようにしてもよい。

＜残差復元演算＞
以上のような残差復元の演算の具体例について説明する。例えば、式（３）のように、残差予測においてビット深度のスケーリングを行わない場合、残差復元においても、以下の式（９）のように、ビット深度のスケーリングを行わないようにすればよい。同様に、残差予測において、例えば式（４）乃至式（８）のように、ビット深度のスケーリングを行う場合、残差復元においても、以下の式（１０）乃至式（１４）のように、ビット深度のスケーリングを行うようにすればよい。

以上のようなビット深度を揃えるシフト演算方法は任意である。各コンポーネントの残差データのビット深度に関する情報が符号化側から伝送され、この符号化側から伝送されてきた各コンポーネントの残差データのビット深度に関する情報に基づいて、予測を行う２つのコンポーネント間のビット深度の差を求め、求めたビット深度の差に基づいてビットシフトを行うことにより、残差データのビット深度を揃えるようにしてもよい。そして、その２つのコンポーネント間のビット深度の差が０でない場合、ビットシフトによって残差データのビット深度をコンポーネント間で揃えて復元を行うようにしてもよい。例えば、上述した式（１０）のように、コンポーネント間の残差データのビット深度の差分（ビット深度差）を求め、式（１１）乃至式（１４）のように、そのビット深度差の分だけビットシフトを行うようにしてもよい。その際、ビットシフトは、式（１２）や式（１４）のように、ビット深度差の絶対値の分だけ行われるようにしてもよい。その場合、例えば、式（１１）や式（１３）の条件を満たすか否かに応じて、式（１２）や式（１４）のようにシフト方向が決定されるようにしてもよい。

つまり、これらの場合、輝度成分（Y）の残差データ（r_L(x,y)）のビット深度（BitDepthY）が、色差成分（CbまたはCr）の残差データ（r_c(x,y)）のビット深度（BitDepthC）に揃えられて復元が行われる。より具体的には、復元を行う２つのコンポーネント間のビット深度の差が求められ、２つのコンポーネントの内の一方のコンポーネントの復元済みの残差データに対してビット深度の差に応じたビットシフトが行われ、ビットシフトされた残差データに所定の重み係数が乗算され、その乗算結果に対して所定のビット数分のビットシフトが行われ、ビットシフトされた乗算結果と予測残差データとを加算することにより、他方のコンポーネントの残差データの復元が行われる。以上のように復元を行うようにしてもよい。

なお、Δbitdepthが０の場合、輝度成分（Y）の残差データ（r_L(x,y)）のビットシフト量が０であるので、残差データ（r'_c(x,y)）は、式（９）のように算出されるとも言える。

以上のように算出することにより、残差データのビット深度がコンポーネント間で異なる場合であっても、残差データ（r'_c(x,y)）を正しく復元することができる。したがって、符号化効率の低減を抑制することができる。

＜画像復号装置＞
図１０は、本技術を適用した画像処理装置の一態様である、図３の画像符号化装置１００に対応する画像復号装置の主な構成例を示すブロック図である。

図１０に示される画像復号装置２００は、画像符号化装置１００が生成した符号化データを、その符号化方法に対応する復号方法で復号する。

図１０に示されるように画像復号装置２００は、蓄積バッファ２０１、可逆復号部２０２、逆量子化部２０３、逆直交変換部２０４、演算部２０５、ループフィルタ２０６、および画面並べ替えバッファ２０７を有する。また、画像復号装置２００は、フレームメモリ２０９、イントラ予測部２１０、インター予測部２１１、および予測画像選択部２１２を有する。さらに、画像復号装置２００は、ヘッダ取得部２２１および残差復元部２２２を有する。

蓄積バッファ２０１は、符号化側（例えば画像符号化装置１００）から伝送されてきた符号化データを受け取る受け取り部でもある。蓄積バッファ２０１は、その伝送されてきた符号化データを受け取って、蓄積し、所定のタイミングにおいてその符号化データを可逆復号部２０２に供給する。符号化データには、予測モード情報などの復号に必要な情報が付加されている。可逆復号部２０２は、蓄積バッファ２０１より供給された、可逆符号化部１０６により符号化された情報を、その符号化方式に対応する復号方式で復号する。可逆復号部２０２は、復号して得られた量子化された係数データを、逆量子化部２０３に供給する。

また、可逆復号部２０２は、最適な予測モードにイントラ予測モードが選択されたかインター予測モードが選択されたかを判定し、その最適な予測モードに関する情報を、イントラ予測部２１０およびインター予測部２１１の内、選択されたと判定したモードの方に供給する。つまり、例えば画像符号化装置１００において最適な予測モードとしてイントラ予測モードが選択された場合、その最適な予測モードに関する情報がイントラ予測部２１０に供給される。また、例えば画像符号化装置１００において最適な予測モードとしてインター予測モードが選択された場合、その最適な予測モードに関する情報がインター予測部２１１に供給される。

さらに、可逆復号部２０２は、例えば、量子化行列や量子化パラメータ等の、逆量子化に必要な情報を逆量子化部２０３に供給する。

また、可逆復号部２０２は、シーケンスパラメータセット（SPS）、ピクチャパラメータセット（PPS）、スライスヘッダ等のヘッダ情報を、ヘッダ取得部２２１に供給する。

逆量子化部２０３は、可逆復号部２０２により復号されて得られた量子化された係数データを、量子化部１０５の量子化方式に対応する方式で逆量子化する。なお、この逆量子化部２０３は、逆量子化部１０８と同様の処理部である。つまり、逆量子化部２０３の説明は、逆量子化部１０８にも準用することができる。ただし、データの入出力先等は、装置に応じて適宜、変えて読む必要がある。

逆量子化部２０３は、得られた係数データを逆直交変換部２０４に供給する。

逆直交変換部２０４は、逆量子化部２０３から供給される直交変換係数を、必要に応じて、直交変換部１０４の直交変換方式に対応する方式で逆直交変換する。なお、この逆直交変換部２０４は、逆直交変換部１０９と同様の処理部である。つまり、逆直交変換部２０４の説明は、逆直交変換部１０９にも準用することができる。ただし、データの入出力先等は、装置に応じて適宜、変えて読む必要がある。

逆直交変換部２０４は、この逆直交変換処理により、画像符号化装置１００において直交変換される前の状態に対応する残差データや予測残差データを得る。逆直交変換されて得られた残差データおよび予測残差データは、残差復元部２２２に供給される。

演算部２０５は、残差復元部２２２から復元された各コンポーネントの残差データを取得する。また、演算部２０５は、予測画像選択部２１２を介して、イントラ予測部２１０若しくはインター予測部２１１から予測画像を取得する。演算部２０５は、差分画像と予測画像とを加算し、演算部１０３により予測画像が減算される前の画像に対応する再構成画像を得る。演算部２０５は、その再構成画像をループフィルタ２０６およびイントラ予測部２１０に供給する。

ループフィルタ２０６は、供給された再構成画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜施して復号画像を生成する。例えば、ループフィルタ２０６は、再構成画像に対してデブロックフィルタ処理を行うことにより、ブロック歪を除去する。また、例えば、ループフィルタ２０６は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた再構成画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。

なお、ループフィルタ２０６が行うフィルタ処理の種類は任意であり、上述した以外のフィルタ処理を行ってもよい。また、ループフィルタ２０６が、画像符号化装置１００から供給されたフィルタ係数を用いてフィルタ処理を行うようにしてもよい。

ループフィルタ２０６は、フィルタ処理結果である復号画像を画面並べ替えバッファ２０７およびフレームメモリ２０９に供給する。

画面並べ替えバッファ２０７は、画像の並べ替えを行う。すなわち、画面並べ替えバッファ１０２により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。画面並べ替えバッファ２０７は、フレームの順番を並べ替えた復号画像データを画像復号装置２００の外部に出力する。

フレームメモリ２０９は、供給される復号画像を記憶し、所定のタイミングにおいて、若しくは、インター予測部２１１等の外部の要求に基づいて、記憶している復号画像を参照画像として、インター予測部２１１に供給する。

イントラ予測部２１０には、ヘッダ情報を復号して得られたイントラ予測モードを示す情報等が可逆復号部２０２から適宜供給される。イントラ予測部２１０は、イントラ予測部１１３において用いられたイントラ予測モードで、フレームメモリ２０９から取得した参照画像を用いてイントラ予測を行い、予測画像を生成する。イントラ予測部２１０は、生成した予測画像を予測画像選択部２１２に供給する。

インター予測部２１１は、ヘッダ情報を復号して得られた情報（最適予測モード情報、参照画像情報等）を可逆復号部２０２から取得する。

インター予測部２１１は、可逆復号部２０２から取得された最適予測モード情報が示すインター予測モードで、フレームメモリ２０９から取得した参照画像を用いてインター予測を行い、予測画像を生成する。

予測画像選択部２１２は、イントラ予測部２１０からの予測画像またはインター予測部２１１からの予測画像を、演算部２０５に供給する。そして、演算部２０５においては、動きベクトルが用いられて生成された予測画像と残差復元部２２２からの復号残差データ（差分画像情報）とが加算されて元の画像が復号される。

ヘッダ取得部２２１は、例えば、ビデオパラメータセット（VPS）、シーケンスパラメータセット（SPS）、ピクチャパラメータセット（PPS）、SEI、スライスヘッダ等の、符号化側から伝送されたヘッダ情報を可逆復号部２０２を介して取得する。ヘッダ取得部２２１は、取得したヘッダ情報の中から必要な情報を残差復元部２２２に供給する。詳細については後述する。

残差復元部２２２は、逆直交変換部２０４から供給される輝度成分の残差データと色差成分の予測残差データとを用いて、色差成分の残差データを復元する（残差復元とも称する）。その際、残差復元部２２２は、残差データのビット深度をコンポーネント間で揃えて復元を行う。なお、この残差復元部２２２は、残差復元部１２３と同様の処理部である。つまり、残差復元部２２２の説明は、残差復元部１２３にも準用することができる。ただし、データの入出力先等は、装置に応じて適宜、変えて読む必要がある。

＜ヘッダ取得部および残差復元部＞
図１１は、図１０のヘッダ取得部２２１および残差復元部２２２の主な構成例を示すブロック図である。図１１に示されるようにヘッダ取得部２２１は、SPS取得部２３１、PPS取得部２３２、および重み係数取得部２３３を有する。

SPS取得部２３１は、符号化側から供給されたシーケンスパラメータセット（SPS）に含まれる、輝度成分のビット深度を示す情報（例えばbit_depth_luma_minus8）若しくは輝度成分のビット深度を示す情報を含む情報と、色差成分（Cb/Cr）のビット深度を示す情報（例えばbit_depth_chroma_minus8）若しくは色差成分のビット深度を示す情報を含む情報とを取得し、残差復元部２２２（後述するビット深度差算出部２５１）に供給する。

PPS取得部２３２は、符号化側から供給されたピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）を残差復元部２２２（後述するビットシフト制御部２５２）に供給する。

重み係数取得部２３３は、符号化側から供給された重み係数α、若しくはその重み係数αを含む情報を残差復元部２２２（後述する重み係数乗算部２６４）に供給する。

残差復元部２２２は、逆直交変換部２０４から供給される復元された輝度成分の残差データ（r'_Y(x,y)）を演算部２０５に供給する。また、残差復元部２２２は、制御部２４１および復元部２４２を有する。制御部２４１は、残差復元に関する演算の制御に関する処理を行う。復元部２４２は、制御部２４１に制御されて、その残差復元に関する演算を行う。例えば、復元部２４２は、制御部２４１の制御に基づいて、逆直交変換部２０４から取得した、復元された輝度成分の残差データ（r'_Y(x,y)）を用いて、逆直交変換部２０４から取得した、復元された色差成分の予測残差データ（Δr'_Cr(x,y)とΔr'_Cb(x,y)）から、色差成分の残差データ（r'_Cr(x,y)とr'_Cb(x,y)）を復元する。復元部２４２は、復元された色差成分の残差データ（r'_Cr(x,y)とr'_Cb(x,y)）を演算部２０５に供給する。また、残差復元部２２２は、制御部２４１に制御されて、残差復元を行わずに、逆直交変換部２０４から取得した、復元された色差成分の残差データ（r'_Cr(x,y)とr'_Cb(x,y)）を、演算部２０５に供給する。

制御部２４１は、ビット深度差算出部２５１およびビットシフト制御部２５２を有する。

ビット深度差算出部２５１は、残差予測に用いる各コンポーネントの残差データのビット深度の差を算出する。例えば、ビット深度差算出部２５１は、SPS取得部２３１から、輝度成分のビット深度を示す情報（例えばbit_depth_luma_minus8）若しくは輝度成分のビット深度を示す情報を含む情報と、色差成分（Cb/Cr）のビット深度を示す情報（例えばbit_depth_chroma_minus8）若しくは色差成分のビット深度を示す情報を含む情報とを取得し、それらの情報を用いて、式（４）に示される演算を行い、コンポーネント間のビット深度差（delta_bitdepth）を算出する。ビット深度差算出部２５１は、算出したビット深度差（delta_bitdepth）をビットシフト制御部２５２に供給する。

また、ビット深度差算出部２５１は、ビットシフト制御部２５２の制御に基づいて、算出したビット深度差（delta_bitdepth）を復元部２４２に供給する。例えば、ビット深度のスケーリングの際に残差データの右シフトを行う場合、ビット深度差算出部２５１は、算出したビット深度差（delta_bitdepth）を右シフト部２６２に供給する。また、ビット深度のスケーリングの際に残差データの左シフトを行う場合、ビット深度差算出部２５１は、算出したビット深度差（−delta_bitdepth）を左シフト部２６３に供給する。

ビットシフト制御部２５２は、ビット深度差算出部２５１から供給されるコンポーネント間のビット深度差（delta_bitdepth）の値に基づいて、復元部２４２による演算を制御する。例えば、ビットシフト制御部２５２は、ビット深度差（delta_bitdepth）が０の場合、残差データのビットシフト（ビット深度のスケーリング）を行わないように、復元部２４２（の選択部２６１）を制御する。また、その際、ビットシフト制御部２５２は、ビット深度差算出部２５１も制御し、ビット深度差（delta_bitdepth）を復元部２４２に供給させないようにする。

また、例えば、ビットシフト制御部２５２は、ビット深度差（delta_bitdepth）が正の値（＞０）の場合、残差データを右シフトする（ビット深度のスケーリングを行う）ように、復元部２４２（の選択部２６１）を制御する。また、その際、ビットシフト制御部２５２は、ビット深度差算出部２５１も制御し、ビット深度差（delta_bitdepth）を復元部２４２（右シフト部２６２）に供給させる。

さらに、例えば、ビットシフト制御部２５２は、ビット深度差（delta_bitdepth）が負の値（＜０）の場合、残差データを左シフトする（ビット深度のスケーリングを行う）ように、復元部２４２（の選択部２６１）を制御する。また、その際、ビットシフト制御部２５２は、ビット深度差算出部２５１も制御し、ビット深度差（−delta_bitdepth）を復元部２４２（左シフト部２６３）に供給させる。

また、ビットシフト制御部２５２は、例えば、PPS取得部２３２から、符号化側から供給された、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）を取得し、その値に基づいて、残差復元を行うか否かを制御する。例えば、残差予測を行うか否かを制御する情報により残差予測を行わないことが示されている（すなわち、残差復元を行わないことも示されている）場合、ビットシフト制御部２５２は、復元部２４２を制御し、復元に関する演算を行わせないようにする。また、その場合、ビットシフト制御部２５２は、ビット深度差算出部２５１を制御し、ビット深度差（delta_bitdepthまたは-delta_bitdepth）の供給を停止させる。さらに、ビットシフト制御部２５２は、その場合、重み係数取得部２３３を制御し、重み係数αを取得させないようにする。

逆に、例えば、残差予測を行うか否かを制御する情報により残差予測を（すなわち、残差復元も）行うことが示されている場合、ビットシフト制御部２５２は、復元部２４２を制御し、復元に関する演算を行わせるようにする。また、その場合、ビットシフト制御部２５２は、ビット深度差算出部２５１を制御し、ビット深度差（delta_bitdepthまたは-delta_bitdepth）を復元部２４２に供給させる。さらに、その場合、ビットシフト制御部２５２は、重み係数取得部２３３を制御し、重み係数αを取得させ、復元部２４２（重み係数乗算部２６４）に供給させる。

復元部２４２は、予測部１４２による演算と基本的に同様の演算を行うために、予測部１４２と基本的に同様の構成を有する。すなわち、復元部２４２は、選択部２６１、右シフト部２６２、左シフト部２６３、重み係数乗算部２６４、右シフト部２６５、演算部２６６、および演算部２６７を有する。

選択部２６１は、ビットシフト制御部２５２の制御に従って、選択部１６１と同様に、逆直交変換部２０４から供給される、復元された輝度成分の残差データ（r'_Y(x,y)）の供給先を選択する。例えば、ビット深度のスケーリング（右シフト）が行われる場合、選択部２６１は、復元された輝度成分の残差データ（r'_Y(x,y)）を右シフト部２６２に供給する。この場合、式（６）に対応する演算が行われる。また、例えば、ビット深度のスケーリング（左シフト）が行われる場合、選択部２６１は、復元された輝度成分の残差データ（r'_Y(x,y)）を左シフト部２６３に供給する。この場合、式（８）に対応する演算が行われる。さらに、例えば、ビット深度のスケーリングが行われない場合、選択部２６１は、復元された輝度成分の残差データ（r'_Y(x,y)）を重み係数乗算部２６４に供給する。この場合、式（３）に対応する演算が行われる。

右シフト部２６２は、選択部２６１から取得した、復元された輝度成分の残差データ（r'_Y(x,y)）を、ビット深度差算出部２５１から取得したビット深度差（delta_bitdepth）分、右シフトすることにより、ビット深度のスケーリングを行う。右シフト部２６２は、輝度成分の残差データの右シフト結果（r'_Y(x,y)＞＞delta_bitdepth）を、重み係数乗算部２６４に供給する。

左シフト部２６３は、選択部２６１から取得した、復元された輝度成分の残差データ（r'_Y(x,y)）を、ビット深度差算出部２５１から取得したビット深度差（-delta_bitdepth）分、左シフトすることにより、ビット深度のスケーリングを行う。左シフト部２６３は、輝度成分の残差データの左シフト結果（r'_Y(x,y)＜＜-delta_bitdepth）を、重み係数乗算部２６４に供給する。

重み係数乗算部２６４は、選択部２６１乃至左シフト部２６３のいずれかから、復元された輝度成分の残差データを取得する。例えば、重み係数乗算部２６４は、ビットシフトされていない、復元された輝度成分の残差データ（r'_Y(x,y)）を選択部２６１から取得する。また、例えば、重み係数乗算部２６４は、右シフトされた、復元された輝度成分の残差データ（r'_Y(x,y)＞＞delta_bitdepth）を右シフト部２６２から取得する。さらに、例えば、重み係数乗算部２６４は、左シフトされた、復元された輝度成分の残差データ（r'_Y(x,y)＜＜-delta_bitdepth）を左シフト部２６３から取得する。

また、重み係数乗算部２６４は、重み係数取得部２３３を介して重み係数αを取得する。重み係数乗算部２６４は、取得した復元された輝度成分の残差データにその重み係数αを乗算し、その乗算結果（α×（r'_Y(x,y)）、α×（r'_Y(x,y)＞＞delta_bitdepth）、または、α×（r'_Y(x,y)＜＜-delta_bitdepth））を右シフト部２６５に供給する。

右シフト部２６５は、重み係数乗算部２６４から供給された、復元された輝度成分の残差データ（α×（r'_Y(x,y)）、α×（r'_Y(x,y)＞＞delta_bitdepth）、または、α×（r'_Y(x,y)＜＜-delta_bitdepth））を、所定のビット数分、右シフトする。このビットシフト量は符号化側と同一である限り任意であるが、例えば、式（３）、式（６）、式（８）の場合、右シフト部２６５は、残差データを３ビット右シフトする。右シフト部２６５は、その右シフト結果（α×（r'_Y(x,y)）＞＞３、α×（r'_Y(x,y)＞＞delta_bitdepth）＞＞３、または、α×（r'_Y(x,y)＜＜-delta_bitdepth）＞＞３）を、演算部２６６若しくは演算部２６７に供給する。

演算部２６６は、逆直交変換部２０４から供給される色差成分（Cr）の復元された予測残差データ（Δr'_Cr(x,y)）に、右シフト部２６５から供給される、復元された輝度成分の残差データ（α×（r'_Y(x,y)）＞＞３、α×（r'_Y(x,y)＞＞delta_bitdepth）＞＞３、または、α×（r'_Y(x,y)＜＜-delta_bitdepth）＞＞３）を加算することにより、色差成分（Cr）の残差データを復元し（r'_Cr(x,y)）、それを演算部２０５に供給する。また、このような残差復元を行わない場合、演算部２６６は、逆直交変換部２０４から供給される色差成分（Cr）の復元された残差データ（r'_Cr(x,y)）を演算部２０５に供給する。

さらに、演算部２６７は、逆直交変換部２０４から供給される色差成分（Cb）の復元された予測残差データ（Δr'_Cb(x,y)）に、右シフト部２６５から供給される、復元された輝度成分の残差データ（α×（r'_Y(x,y)）＞＞３、α×（r'_Y(x,y)＞＞delta_bitdepth）＞＞３、または、α×（r'_Y(x,y)＜＜-delta_bitdepth）＞＞３）を加算することにより、色差成分（Cb）の残差データを復元し（r'_Cb(x,y)）、それを演算部２０５に供給する。また、このような残差復元を行わない場合、演算部２６７は、逆直交変換部２０４から供給される色差成分（Cb）の復元された残差データ（r'_Cb(x,y)）を演算部２０５に供給する。

残差復元部２２２は、以上のように、残差復元において、復元された輝度成分の残差データのビット深度のスケーリングを行って復元を行う。したがって、残差復元部２２２は、残差データのビット深度がコンポーネント間で異なる場合であっても、残差データを正しく復元することができる。したがって、画像復号装置２００は、符号化効率の低減を抑制することができる。

＜復号処理の流れ＞
次に、画像復号装置２００により実行される各処理の流れの例を説明する。最初に、復号処理の流れの例を、図１２のフローチャートを参照して説明する。

復号処理が開始されると、ステップＳ２０１において、蓄積バッファ２０１は、伝送されてきたビットストリームを蓄積する。ステップＳ２０２において、可逆復号部２０２は、蓄積バッファ２０１から供給されるビットストリームを復号する。すなわち、可逆符号化部１０６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャが復号される。このとき、ヘッダ情報などのビットストリームに含められた画像情報以外の各種情報も復号される。

ステップＳ２０３において、逆量子化部２０３は、ステップＳ２０２の処理により得られた、量子化された係数を逆量子化する。

ステップＳ２０４において、逆直交変換部２０４は、ステップＳ２０３の処理により得られた直交変換係数を逆直交変換する。この処理により、輝度成分の残差データと色差成分の予測残差データが復元される。

ステップＳ２０５において、残差復元部２２２は、復元された輝度成分の残差データと、復元された色差成分の予測残差データを用いて、色差成分の残差データを復元する残差復元処理を行う。この処理の詳細については後述する。

ステップＳ２０６において、イントラ予測部２１０若しくはインター予測部２１１は、予測処理を行い、予測画像を生成する。つまり、可逆復号部２０２において判定された、符号化の際に適用された予測モードで予測処理が行われる。より具体的には、例えば、符号化の際にイントラ予測が適用された場合、イントラ予測部２１０が、符号化の際に最適とされたイントラ予測モードで予測画像を生成する。また、例えば、符号化の際にインター予測が適用された場合、インター予測部２１１が、符号化の際に最適とされたインター予測モードで予測画像を生成する。

ステップＳ２０７において、演算部２０５は、ステップＳ２０４およびステップＳ２０５の処理により復元された残差データに、ステップＳ２０６において生成された予測画像を加算する。これにより再構成画像が得られる。

ステップＳ２０８において、ループフィルタ２０６は、ステップＳ２０７の処理により得られた再構成画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜行う。

ステップＳ２０９において、画面並べ替えバッファ２０７は、ステップＳ２０８の処理により得られた復号画像のフレームの並べ替えを行う。すなわち、符号化の際に並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。フレームが並べ替えられた復号画像は、画像復号装置２００の外部に出力される。

ステップＳ２１０において、フレームメモリ２０９は、ステップＳ２０８の処理により得られた復号画像を記憶する。

ステップＳ２１０の処理が終了すると、復号処理が終了する。

＜残差復元処理の流れ＞
次に、このような復号処理のステップＳ２０５において実行される残差復元処理の流れの例を、図１３のフローチャートを参照して説明する。

残差復元処理が開始されると、ステップＳ２２１において、ビット深度差算出部２５１は、符号化側から伝送されたシーケンスパラメータセットに含まれる、輝度成分のビット深度を示す情報（例えばbit_depth_luma_minus8）と、色差成分（Cb/Cr）のビット深度を示す情報（例えばbit_depth_chroma_minus8）とを、SPS取得部２３１を介して取得し、それらを用いて、残差予測が行われるコンポーネント間のビット深度の差分を算出する。すなわち、ビット深度差算出部１５１は、式（１０）の演算を行い、輝度成分（Y）と色差成分（CrまたはCb）のビット深度差（delta_bitdepth）を算出する。色差成分（Cr）と色差成分（Cb）とでビット深度差が異なる場合は、それぞれビット深度差（delta_bitdepth）を算出する。

ステップＳ２２２において、ビットシフト制御部２５２は、ステップＳ２２１において算出されたビット深度差（delta_bitdepth）が０であるか否かを判定する。０であると判定された場合、処理は、ステップＳ２２３に進む。この場合、ビットシフトは行われず、残差復元は、式（９）のように行われる。

ステップＳ２２３において、ビットシフト制御部２５２は、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）等に基づいて、符号化側において残差予測が行われたか否かを判定する。例えば、luma_chroma_prediction_enabled_flagの値が１であり、残差予測が行われたと判定された場合、処理はステップＳ２２４に進む。

ステップＳ２２４において、重み係数取得部２３３は、TU毎に重み係数αを取得する。

ステップＳ２２５において、復元部２４２は、ビット深度のスケーリングを行わずに、色差成分の残差データの復元（残差復元）を行う。この処理の詳細は後述する。

ステップＳ２２５における残差復元が終了すると、残差復元処理が終了し、処理は図１２に戻る。

また、例えば、ステップＳ２２３において、luma_chroma_prediction_enabled_flagの値が０であり、符号化側において残差予測が行われていないと判定された場合、ステップＳ２２４およびステップＳ２２５の処理が省略され、残差復元処理が終了し、処理は図１２に戻る。

また、ステップＳ２２２において、ビット深度差（delta_bitdepth）が０でないと判定された場合、処理は、ステップＳ２２６に進む。

ステップＳ２２６において、ビットシフト制御部２５２は、ステップＳ２２１において算出されたビット深度差（delta_bitdepth）が正であるか否かを判定する。正であると判定された場合、処理はステップＳ２２７に進む。この場合、残差復元は、式（１２）のように行われる（右シフトによるスケーリングが行われる）。

ステップＳ２２７において、ビットシフト制御部２５２は、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）等に基づいて、符号化側において残差予測が行われたか否かを判定する。例えば、luma_chroma_prediction_enabled_flagの値が１であり、残差予測が行われたと判定された場合、処理はステップＳ２２８に進む。

ステップＳ２２８において、重み係数取得部２３３は、TU毎に重み係数αを取得する。

ステップＳ２２９において、復元部２４２は、右シフトによりビット深度のスケーリングを行って、色差成分の残差データの復元（残差復元）を行う。この処理の詳細は後述する。

ステップＳ２２９における残差復元が終了すると、残差復元処理が終了し、処理は図１２に戻る。

また、例えば、ステップＳ２２７において、luma_chroma_prediction_enabled_flagの値が０であり、符号化側において残差予測が行われていないと判定された場合、ステップＳ２２８およびステップＳ２２９の処理が省略され、残差復元処理が終了し、処理は図１２に戻る。

また、ステップＳ２２６において、ビット深度差（delta_bitdepth）が正でない（負である）と判定された場合、処理はステップＳ２３０に進む。この場合、残差予測は、式（１４）のように行われる（左シフトによるスケーリングが行われる）。

ステップＳ２３０において、ビットシフト制御部２５２は、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）等に基づいて、符号化側において残差予測が行われたか否かを判定する。例えば、luma_chroma_prediction_enabled_flagの値が１であり、残差予測が行われたと判定された場合、処理はステップＳ２３１に進む。

ステップＳ２３１において、重み係数取得部２３３は、TU毎に重み係数αを取得する。

ステップＳ２３２において、復元部２４２は、左シフトによりビット深度のスケーリングを行って、色差信号の残差データの復元（残差復元）を行う。この処理の詳細は後述する。

ステップＳ２３２における残差復元が終了すると、残差復元処理が終了し、処理は図１２に戻る。

また、例えば、ステップＳ２３０において、luma_chroma_prediction_enabled_flagの値が０であり、符号化側において残差予測が行われていないと判定された場合、ステップＳ２３１およびステップＳ２３２の処理が省略され、残差復元処理が終了し、処理は図１２に戻る。

＜残差データ復元処理の流れ＞
次に、このような残差復元処理のステップＳ２２５において実行される残差データ復元処理の流れの例を、図１４のフローチャートを参照して説明する。

残差データ復元処理が開始されると、ステップＳ２４１において、復元部２４２の重み係数乗算部２６４は、復元された輝度成分の残差データ（r'_Y(x,y)）に、図１３のステップＳ２２４の処理により取得された重み係数αを乗算する（α×r'_Y(x,y)）。

ステップＳ２４２において、右シフト部２６５は、ステップＳ２４１において算出された乗算結果（α×r'_Y(x,y））を３ビット右シフトする（(α×r'_Y(x,y))＞＞3）。

ステップＳ２４３において、演算部２６６は、復元された色差成分Crの予測残差データ（Δr'_Cr(x,y)）に、ステップＳ２４２において算出された右シフト結果（(α×r'_Y(x,y))＞＞3）を加算することにより（Δr'_Cr(x,y) + (α×r'_Y(x,y))＞＞3）、色差成分Crの残差データを復元する（r'_Cr(x,y)）。また、演算部２６７は、色差成分Cbの予測残差データ（Δr'_Cb(x,y)）に、ステップＳ２４２において算出された右シフト結果（(α×r'_Y(x,y))＞＞3）を加算することにより（Δr'_Cb(x,y) + (α×r'_Y(x,y))＞＞3）、色差成分Cbの残差データを復元する（r'_Cb(x,y)）。

以上のように色差成分の残差データが復元されると（r'_Cr(x,y)およびr'_Cb(x,y)）、残差データ復元処理が終了し、処理は図１３に戻る。

＜残差データ復元処理の流れ＞
次に、残差復元処理のステップＳ２２９において実行される残差データ復元処理の流れの例を、図１５のフローチャートを参照して説明する。

残差データ復元処理が開始されると、ステップＳ２５１において、復元部２４２の右シフト部２６２は、復元された輝度成分の残差データ（r'_Y(x,y)）を、図１３のステップＳ２２１の処理により算出された残差データのビット深度差（delta_bitdepth）の分、右シフトする（r'_Y(x,y)＞＞delta_bitdepth）。

ステップＳ２５２において、重み係数乗算部２６４は、ステップＳ２５１において算出された右シフト結果（r'_Y(x,y)＞＞delta_bitdepth）に、図１３のステップＳ２２８の処理により取得された重み係数αを乗算する（α×(r'_Y(x,y)＞＞delta_bitdepth)）。

ステップＳ２５３において、右シフト部２６５は、ステップＳ２５２において算出された乗算結果（α×(r'_Y(x,y)＞＞delta_bitdepth)）を３ビット右シフトする（α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）。

ステップＳ２５４において、演算部２６６は、復元された色差成分Crの予測残差データ（Δr'_Cr(x,y)）に、ステップＳ２５３において算出された右シフト結果（α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）を加算することにより（Δr'_Cr(x,y) + α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）、色差成分Crの残差データを復元する（r'_Cr(x,y)）。また、演算部２６７は、復元された色差成分Cbの予測残差データ（Δr'_Cb(x,y)）に、ステップＳ２５３において算出された右シフト結果（α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）を加算することにより（Δr'_Cb(x,y) + α×(r'_Y(x,y)＞＞delta_bitdepth)＞＞3）、色差成分Cbの残差データを復元する（r'_Cb(x,y)）。

＜残差データ復元処理の流れ＞
次に、残差復元処理のステップＳ２３２において実行される残差データ復元処理の流れの例を、図１６のフローチャートを参照して説明する。

残差データ復元処理が開始されると、ステップＳ２６１において、復元部２４２の左シフト部２６３は、復元された輝度成分の残差データ（r'_Y(x,y)）を、図１３のステップＳ２２１の処理により算出された残差データのビット深度差（-delta_bitdepth）の分、左シフトする（r'_Y(x,y)＜＜-delta_bitdepth）。

ステップＳ２６２において、重み係数乗算部２６４は、ステップＳ２６１において算出された左シフト結果（r'_Y(x,y)＜＜-delta_bitdepth）に、図１３のステップＳ２３１の処理により取得された重み係数αを乗算する（α×(r'_Y(x,y)＜＜-delta_bitdepth)）。

ステップＳ２６３において、右シフト部２６５は、ステップＳ２６２において算出された乗算結果（α×(r'_Y(x,y)＜＜-delta_bitdepth)）を３ビット右シフトする（α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）。

ステップＳ２６４において、演算部２６６は、復元された色差成分Crの予測残差データ（Δr'_Cr(x,y)）に、ステップＳ２６３において算出された右シフト結果（α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）を加算することにより（Δr'_Cr(x,y) + α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）、色差成分Crの残差データを復元する（r'_Cr(x,y)）。また、演算部２６７は、復元された色差成分Cbの予測残差データ（Δr'_Cb(x,y)）に、ステップＳ２６３において算出された右シフト結果（α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）を加算することにより（Δr'_Cb(x,y) + α×(r'_Y(x,y)＜＜-delta_bitdepth)＞＞3）、色差成分Cbの残差データを復元する（r'_Cb(x,y)）。

以上のように各処理を実行することにより、残差復元部２２２は、残差データのビット深度がコンポーネント間で異なる場合であっても、残差データを正しく復元することができる。したがって、画像復号装置２００は、符号化効率の低減を抑制することができる。

以上においては、残差データのビット深度を揃える際に、輝度成分のビット深度をビットシフトして色差成分に揃えるように説明したが、このようなビット深度のスケーリングにおいて、どのコンポーネントを基準とするかは任意である。例えば、色差成分のビット深度をスケーリングするようにしてもよい。ただし、一般的に、情報量の多い（ビット深度が深い）コンポーネントをスケーリングする方が、予測精度を向上させ、符号化効率を向上させることができるので望ましい。上述したようなYUVの色空間の場合、一般的に輝度成分の方が重要であり情報量が大きい。したがって、輝度成分のビット深度をスケーリングする方が望ましい。

また、以上においては、YUV色空間の画像を符号化・復号する場合について説明したが、画像の色空間は任意であり、また、どのコンポーネント間で予測を行うようにしてもよい。例えば、画像の色空間がRGBの場合であっても、上述したYUVの場合と同様に、ビット深度のスケーリングを用いて残差予測・残差復号を行うことができる。

＜２．第２の実施の形態＞
＜残差予測の禁止＞
なお、残差予測・残差復号の制御方法は、上述した例に限らない。例えば、残差データのビット深度がコンポーネント間で異なる場合、残差予測を禁止する（予測残差データを算出しない）ようにしてもよい。より具体的には、残差データのビット深度がコンポーネント間で異なる場合、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）を用いて、残差予測が行われないように制御するようにしてもよい。例えば、その場合、luma_chroma_prediction_enabled_flagの値を０にするようにしてもよい。このようにすることにより、その情報に対応するピクチャにおいては、残差予測が禁止される（当然、残差復元も行われないようになる）。したがって、不正確な残差予測・残差復元を行わないようにすることができる。つまり、不正確な残差予測・残差復元による符号化効率の低減を抑制することができる。また、ビット深度のスケーリング等の処理を省略することができるので、処理の負荷の増大を抑制することができる。

＜セマンティクス＞
以上のような制御を行うためには、セマンティクスを図１７の例のような記述にすればよい。図１７に示されるセマンティクスの下線を付した部分が、上述した残差予測・残差復号の実行制御に相当する記述である。

＜ヘッダ処理部および残差予測部＞
この場合も、画像符号化装置１００は、第１の実施の形態の場合と基本的に同様の構成を有するようにすることができる。

図１８は、この場合のヘッダ処理部１２１および残差予測部１２２の主な構成例を示すブロック図である。図１８に示されるように、この場合、残差予測部１２２は、第１の実施の形態の場合と比較して、制御部１４１の代わりに制御部３１１を有し、予測部１４２の代わりに予測部３１２を有する。

制御部３１１は、基本的に制御部１４１と同様の処理を行う。制御部１４１の構成と比較して、制御部３１１は、ビット深度差算出部１５１の代わりにビット深度差算出部３２１を有し、ビットシフト制御部１５２の代わりにビットシフト制御部３２２を有し、さらに、制御部１４１の場合と同様に、重み係数設定部１５３を有する。

ビット深度差算出部３２１は、ビット深度差算出部１５１の場合と同様に、コンポーネント間のビット深度差（delta_bitdepth）を算出する。しかしながら、ビット深度差算出部３２１は、ビット深度差算出部１５１の場合と異なり、算出したコンポーネント間のビット深度差（delta_bitdepth）を予測部３１２に供給しない。

ビットシフト制御部３２２は、ビットシフト制御部１５２の場合と同様に、予測部３１２による演算を制御する。ただし、ビットシフト制御部３２２は、残差データのビット深度がコンポーネント間で異なる場合、残差予測を禁止する（予測残差データを算出しない）。

つまりこの実施の形態の例の場合、ビット深度のスケーリング、すなわち、コンポーネント間でビット深度を揃えるためのビットシフトは行われないので、予測部３１２は、予測部１４２の構成と比較して、右シフト部１６２および左シフト部１６３が省略される。

＜残差予測処理の流れ＞
この実施の形態の場合、符号化処理は、第１の実施の形態の場合と同様に実行される。図１９のフローチャートを参照して、この実施の形態の場合の、残差予測処理の流れの例を説明する。

図１９の例の場合も、残差予測処理が開始されると、ステップＳ３０１において、ビット深度差算出部３２１は、残差予測を行うコンポーネント間のビット深度の差分を算出する。すなわち、ビット深度差算出部３２１は、式（４）の演算を行い、輝度成分（Y）と色差成分（CrまたはCb）のビット深度差（delta_bitdepth）を算出する。色差成分（Cr）と色差成分（Cb）とでビット深度差が異なる場合は、それぞれビット深度差（delta_bitdepth）を算出する。

ステップＳ３０２において、ビットシフト制御部３２２は、ステップＳ３０１において算出されたビット深度差（delta_bitdepth）が０であるか否かを判定する。０であると判定された場合、処理は、ステップＳ３０３に進む。この場合、ビットシフトは行われず、残差予測は、式（３）のように行われる。

つまり、ステップＳ３０３乃至ステップＳ３０５の各処理は、第１の実施の形態の残差予測処理のステップＳ１２３乃至ステップＳ１２５の各処理と同様に実行される。そして、ステップＳ３０５の処理が終了するか、ステップＳ３０３において、残差予測を行わないと判定された場合、残差予測処理が終了し、処理は、図５に戻る。

また、ステップＳ３０２において、ビット深度差（delta_bitdepth）が０でないと判定された場合、処理は、ステップＳ３０６進む。

ステップＳ３０６において、ビットシフト制御部３２２は、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）の値を、残差予測（残差復元）が行われない（禁止する）ことを示す値に設定する。例えば、ビットシフト制御部３２２が、luma_chroma_prediction_enabled_flagの値を０にするようにしてもよい。

ステップＳ３０６の処理が終了すると、残差予測処理が終了し、処理は、図５に戻る。

このようにすることにより、残差データのビット深度がコンポーネント間で異なり、残差予測を正しく行うことができない場合に、その残差予測を行わないようにすることができる。したがって、常に、予測残差データを正しく算出することができるようになり、画像符号化装置１００は、不正確な残差予測による符号化効率の低減を抑制することができる。また、ビット深度のスケーリングが不要になるので、処理の負荷の増大を抑制することができる。

＜ヘッダ取得部および残差復元部＞
この場合も、画像復号装置２００は、第１の実施の形態の場合と基本的に同様の構成を有するようにすることができる。

図２０は、この場合のヘッダ取得部２２１および残差復元部２２２の主な構成例を示すブロック図である。図２０に示されるように、この場合、残差復元部２２２は、第１の実施の形態の場合と比較して、制御部２４１の代わりに制御部３５１を有し、復元部２４２の代わりに復元部３５２を有する。

制御部３５１は、基本的に制御部２４１と同様の処理を行う。制御部２４１の構成と比較して、制御部３５１は、ビット深度差算出部２５１の代わりにビット深度差算出部３６１を有し、ビットシフト制御部２５２の代わりにビットシフト制御部３６２を有する。

ビット深度差算出部３６１は、ビット深度差算出部２５１の場合と同様に、コンポーネント間のビット深度差（delta_bitdepth）を算出する。しかしながら、ビット深度差算出部３６１は、ビット深度差算出部２５１の場合と異なり、算出したコンポーネント間のビット深度差（delta_bitdepth）を復元部３５２に供給しない。

ビットシフト制御部３６２は、ビットシフト制御部２５２の場合と同様に、復元部３５２による演算を制御する。ただし、ビットシフト制御部３６２は、残差データのビット深度がコンポーネント間で異なる場合、残差復元を禁止とする（色差成分の残差データを復元しない）。

つまりこの実施の形態の例の場合、ビット深度のスケーリング、すなわち、コンポーネント間でビット深度を揃えるためのビットシフトは行われないので、復元部３５２は、復元部２４２の構成と比較して、右シフト部２６２および左シフト部２６３が省略される。

＜残差復元処理の流れ＞
この実施の形態の場合、復号処理は、第１の実施の形態の場合と同様に実行される。図２１のフローチャートを参照して、この実施の形態の場合の、残差復元処理の流れの例を説明する。

図２１の例の場合も、残差復元処理が開始されると、ステップＳ３２１において、ビット深度差算出部３６１は、残差予測が行われたコンポーネント間のビット深度の差分を算出する。すなわち、ビット深度差算出部３６１は、式（１０）の演算を行い、輝度成分（Y）と色差成分（CrまたはCb）のビット深度差（delta_bitdepth）を算出する。色差成分（Cr）と色差成分（Cb）とでビット深度差が異なる場合は、それぞれビット深度差（delta_bitdepth）を算出する。

ステップＳ３２２において、ビットシフト制御部３６２は、ステップＳ３２１において算出されたビット深度差（delta_bitdepth）が０であるか否かを判定する。０であると判定された場合、処理は、ステップＳ３２３に進む。この場合、ビットシフトは行われず、残差復元は、式（９）のように行われる。

つまり、ステップＳ３２３乃至ステップＳ３２５の各処理は、第１の実施の形態の残差予測処理のステップＳ２２３乃至ステップＳ２２５の各処理と同様に実行される。そして、ステップＳ３２５の処理が終了するか、ステップＳ３２３において残差予測が行われていないと判定された場合、残差復元処理が終了し、処理は、図１２に戻る。

また、ステップＳ３２２において、ステップＳ３２１において算出されたビット深度差（delta_bitdepth）が０でないと判定された場合も、ビット深度のスケーリングは行われず、残差復元が省略される。したがって、この場合も残差復元処理が終了し、処理は、図１２に戻る。

このようにすることにより、残差データのビット深度がコンポーネント間で異なり、残差予測を正しく行うことができない場合に、その残差予測を行わないようにし、それに応じて残差復元も行わないようにすることができる。したがって、常に、残差データを正しく復元することができるようになり、画像復号装置２００は、不正確な残差復元による符号化効率の低減を抑制することができる。また、ビット深度のスケーリングが不要になるので、処理の負荷の増大を抑制することができる。

＜３．第３の実施の形態＞
＜ビット深度のスケーリングと残差予測の禁止の併用＞
なお、残差予測・残差復号の制御方法は、上述した例に限らない。例えば、残差データのビット深度がコンポーネント間で異なり、かつ、算出されたコンポーネント間のビット深度の差が正の場合のみ、ビット深度のスケーリングを行い、算出されたコンポーネント間のビット深度の差が負の場合は、残差予測を禁止する（予測残差データを算出しない）ようにしてもよい。

より具体的には、例えば、輝度成分の残差データのビット深度が色差成分の残差データのビット深度より大きい場合、右シフトによるビット深度のスケーリングにより、残差データのビット深度をコンポーネント間で揃えて残差予測を行い、輝度成分の残差データのビット深度が色差成分の残差データのビット深度より小さい場合、残差予測を禁止する（予測残差データを算出しない）ようにしてもよい。

上述したように、画像の性質上、輝度成分の方が色差成分より重要であり、輝度成分の残差データのビット深度が色差成分の残差データのビット深度以上となることが一般的である。逆に、色差成分の方が輝度成分よりもビット深度が大きいことは稀である。つまり、敢えて画像の性質に逆らってまで、色差成分の方がビット深度が大きく設定されている場合、その画像には、画像の性質を超えた製作者の何らかの意図が含まれている可能性が高く、そのために、一般的な画像向けの処理である残差予測の予測精度が低減しやすくなる可能性も考えられる。つまり、符号化効率が低減しやすくなる可能性がある。

そこで、予測精度が高いことが期待される、輝度成分の方が色差成分よりもビット深度が大きい場合は、残差予測（残差復元）を実行可能とし、かつ、正しく予測（復元）を行うことができるように、右シフトによるビット深度のスケーリングにより、残差データのビット深度をコンポーネント間で揃えて残差予測を行うようにしてもよい。そして、予測精度が低減する可能性のある、色差成分の方が輝度成分よりもビット深度が大きい場合は、残差予測（残差復元）を、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）を用いて、残差予測が行われないように制御するようにしてもよい。

このようにすることにより、残差予測を行うことによる十分な効果が得られる（十分に符号化効率を向上させることができる）場合のみ、残差予測・残差復号を実行するようにすることができる。したがって、不要な残差予測・残差復号を省略することができるので、符号化効率の低減を抑制することができるとともに、処理の負荷の増大を抑制することができる。

＜セマンティクス＞
以上のような制御を行うためには、セマンティクスを図２２の例のような記述にすればよい。図２２に示されるセマンティクスの下線を付した部分が、上述した残差予測・残差復号の実行制御に相当する記述である。

図２３は、この場合のヘッダ処理部１２１および残差予測部１２２の主な構成例を示すブロック図である。図２３に示されるように、この場合、残差予測部１２２は、第１の実施の形態の場合と比較して、制御部１４１の代わりに制御部４１１を有し、予測部１４２の代わりに予測部４１２を有する。

制御部４１１は、基本的に制御部１４１と同様の処理を行う。制御部１４１の構成と比較して、制御部４１１は、ビット深度差算出部１５１の代わりにビット深度差算出部４２１を有し、ビットシフト制御部１５２の代わりにビットシフト制御部４２２を有し、さらに、制御部１４１の場合と同様に、重み係数設定部１５３を有する。

ビット深度差算出部４２１は、ビット深度差算出部１５１の場合と同様に、コンポーネント間のビット深度差（delta_bitdepth）を算出する。しかしながら、ビット深度差算出部４２１は、ビット深度差算出部１５１の場合と異なり、算出したコンポーネント間のビット深度差（delta_bitdepth）を左シフト部１６３に供給しない（予測部４１２も左シフト部１６３を有していない）。

ビットシフト制御部４２２は、ビットシフト制御部１５２の場合と同様に、予測部４１２による演算を制御する。ただし、ビットシフト制御部４２２は、ビット深度差算出部４２１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が０の場合、予測部４１２にビット深度のスケーリングを行わずに予測残差データを算出させ、ビット深度差算出部４２１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が正の場合、予測部４１２にビット深度のスケーリングを行わせて予測残差データを算出させる。これに対して、ビット深度差算出部４２１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が負の場合、ビットシフト制御部４２２は、予測部４１２を制御し、残差予測を禁止する（予測残差データを算出させないようにする）。

つまりこの実施の形態の例の場合、ビット深度差算出部４２１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が負のときは、ビット深度のスケーリング、すなわち、コンポーネント間でビット深度を揃えるためのビットシフトが行われないので、予測部４１２は、予測部１４２の構成と比較して、左シフト部１６３が省略される。

＜残差予測処理の流れ＞
この実施の形態の場合、符号化処理は、第１の実施の形態の場合と同様に実行される。図２４のフローチャートを参照して、この実施の形態の場合の、残差予測処理の流れの例を説明する。

図２４の例の場合も、残差予測処理が開始されると、ステップＳ４０１において、ビット深度差算出部４２１は、残差予測を行うコンポーネント間のビット深度の差分を算出する。すなわち、ビット深度差算出部４２１は、式（４）の演算を行い、輝度成分（Y）と色差成分（CrまたはCb）のビット深度差（delta_bitdepth）を算出する。色差成分（Cr）と色差成分（Cb）とでビット深度差が異なる場合は、それぞれビット深度差（delta_bitdepth）を算出する。

ステップＳ４０２において、ビットシフト制御部４２２は、ステップＳ４０１において算出されたビット深度差（delta_bitdepth）が０であるか否かを判定する。０であると判定された場合、処理は、ステップＳ４０３に進む。この場合、ビットシフトは行われず、残差予測は、式（３）のように行われる。

つまり、ステップＳ４０３乃至ステップＳ４０５の各処理は、第１の実施の形態の残差予測処理のステップＳ１２３乃至ステップＳ１２５の各処理と同様に実行される。そして、ステップＳ４０５の処理が終了するか、ステップＳ４０３において、残差予測を行わないと判定された場合、残差予測処理が終了し、処理は、図５に戻る。

また、ステップＳ４０２において、ビット深度差（delta_bitdepth）が０でないと判定された場合、処理は、ステップＳ４０６進む。

ステップＳ４０６において、ビットシフト制御部４２２は、ステップＳ４０１において算出されたビット深度差（delta_bitdepth）が正であるか否かを判定する。正であると判定された場合、処理はステップＳ４０７に進む。この場合、残差予測は、式（６）のように行われる（右シフトによるスケーリングが行われる）。

つまり、ステップＳ４０７乃至ステップＳ４０９の各処理は、第１の実施の形態の残差予測処理のステップＳ１２７乃至ステップＳ１２９の各処理と同様に実行される。そして、ステップＳ４０９の処理が終了するか、ステップＳ４０７において、残差予測を行わないと判定された場合、残差予測処理が終了し、処理は、図５に戻る。

また、ステップＳ４０６において、ビット深度差（delta_bitdepth）が正でない（負である）と判定された場合、処理は、ステップＳ４１０進む。

ステップＳ４１０において、ビットシフト制御部４２２は、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）の値を、残差予測（残差復元）が行われない（禁止する）ことを示す値に設定する。例えば、ビットシフト制御部４２２が、luma_chroma_prediction_enabled_flagの値を０にするようにしてもよい。

ステップＳ４１０の処理が終了すると、残差予測処理が終了し、処理は、図５に戻る。

このようにすることにより、残差データのコンポーネント間のビット深度差が負であり、すなわち輝度成分より色差成分の方がビット深度が大きく、残差予測を行っても十分な効果が得られない（十分に符号化効率を向上させることができない）可能性がある場合、その残差予測を行わないようにすることができる。したがって、画像符号化装置１００は、不要な残差予測を省略することができるので、符号化効率の低減を抑制することができるとともに、処理の負荷の増大を抑制することができる。

図２５は、この場合のヘッダ取得部２２１および残差復元部２２２の主な構成例を示すブロック図である。図２５に示されるように、この場合、残差復元部２２２は、第１の実施の形態の場合と比較して、制御部２４１の代わりに制御部４５１を有し、復元部２４２の代わりに復元部４５２を有する。

制御部４５１は、基本的に制御部２４１と同様の処理を行う。制御部２４１の構成と比較して、制御部４５１は、ビット深度差算出部２５１の代わりにビット深度差算出部４６１を有し、ビットシフト制御部２５２の代わりにビットシフト制御部４６２を有する。

ビット深度差算出部４６１は、ビット深度差算出部２５１の場合と同様に、コンポーネント間のビット深度差（delta_bitdepth）を算出する。しかしながら、ビット深度差算出部４６１は、ビット深度差算出部２５１の場合と異なり、算出したコンポーネント間のビット深度差（delta_bitdepth）を左シフト部２６３に供給しない（復元部４５２も左シフト部２６３を有していない）。

ビットシフト制御部４６２は、ビットシフト制御部２５２の場合と同様に、復元部４５２による演算を制御する。ただし、ビットシフト制御部４６２は、ビット深度差算出部４６１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が０の場合、復元部４５２にビット深度のスケーリングを行わずに残差データを復元させ、ビット深度差算出部４６１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が正の場合、復元部４５２にビット深度のスケーリングを行わせて残差データを復元させる。これに対して、ビット深度差算出部４６１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が負の場合、ビットシフト制御部４６２は、復元部４５２を制御し、残差復元を省略する（残差データの復元を省略する）。

つまりこの実施の形態の例の場合、ビット深度差算出部４６１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が負のときは、ビット深度のスケーリング、すなわち、コンポーネント間でビット深度を揃えるためのビットシフトが行われないので、復元部４５２は、復元部２４２の構成と比較して、左シフト部２６３が省略される。

＜残差復元処理の流れ＞
この実施の形態の場合、復号処理は、第１の実施の形態の場合と同様に実行される。図２６のフローチャートを参照して、この実施の形態の場合の、残差復元処理の流れの例を説明する。

図２６の例の場合も、残差復元処理が開始されると、ステップＳ４２１において、ビット深度差算出部４６１は、残差予測が行われたコンポーネント間のビット深度の差分を算出する。すなわち、ビット深度差算出部４６１は、式（１０）の演算を行い、輝度成分（Y）と色差成分（CrまたはCb）のビット深度差（delta_bitdepth）を算出する。色差成分（Cr）と色差成分（Cb）とでビット深度差が異なる場合は、それぞれビット深度差（delta_bitdepth）を算出する。

ステップＳ４２２において、ビットシフト制御部４６２は、ステップＳ４２１において算出されたビット深度差（delta_bitdepth）が０であるか否かを判定する。０であると判定された場合、処理は、ステップＳ４２３に進む。この場合、ビットシフトは行われず、残差復元は、式（９）のように行われる。

つまり、ステップＳ４２３乃至ステップＳ４２５の各処理は、第１の実施の形態の残差予測処理のステップＳ２２３乃至ステップＳ２２５の各処理と同様に実行される。そして、ステップＳ４２５の処理が終了するか、ステップＳ４２３において残差予測が行われていないと判定された場合、残差復元処理が終了し、処理は、図１２に戻る。

また、ステップＳ４２２において、ビット深度差（delta_bitdepth）が０でないと判定された場合、処理は、ステップＳ４２６進む。

ステップＳ４２６において、ビットシフト制御部４６２は、ステップＳ４２１において算出されたビット深度差（delta_bitdepth）が正であるか否かを判定する。正であると判定された場合、処理はステップＳ４２７に進む。この場合、残差予測は、式（１２）のように行われる（右シフトによるスケーリングが行われる）。

つまり、ステップＳ４２７乃至ステップＳ４２９の各処理は、第１の実施の形態の残差予測処理のステップＳ２２７乃至ステップＳ２２９の各処理と同様に実行される。そして、ステップＳ４２９の処理が終了するか、ステップＳ４２７において、残差予測が行われていないと判定された場合、残差復元処理が終了し、処理は、図１２に戻る。

また、ステップＳ４２６において、ビット深度差（delta_bitdepth）が正でない（負である）と判定された場合も、ビット深度のスケーリングは行われず、残差復元が省略される。したがって、この場合も残差復元処理が終了し、処理は、図１２に戻る。

このようにすることにより、残差データのコンポーネント間のビット深度差が負であり、すなわち輝度成分より色差成分の方がビット深度が大きく、残差予測を行っても十分な効果が得られない（十分に符号化効率を向上させることができない）可能性がある場合、その残差予測を行わないようにし、それに応じて残差復元も行わないようにすることができる。したがって、画像復号装置２００は、不要な残差復元を省略することができるので、符号化効率の低減を抑制することができるとともに、処理の負荷の増大を抑制することができる。

＜４．第４の実施の形態＞
＜画像の色空間による残差予測制御＞
なお、残差予測・残差復号の制御方法は、上述した例に限らない。例えば、画像の色空間に応じて残差予測・残差復号を行うか否かを制御するようにしてもよい。例えば、基本的に第３の実施の形態で説明したのと同様に残差予測・残差復号の実行を制御し、さらに、符号化・復号対象の画像の色空間がRGBの場合、残差予測・残差復号を禁止するようにしてもよい。

一般的に、YUVの場合、輝度成分は色差成分よりも情報として重要な場合が多く、情報量が多い（ビット深度が大きい）ケースも考えられる。これに対して、RGBの場合、各コンポーネントの情報としての重要性は互いに同一であり、情報量（ビット深度）も互いに同一とされる場合が多い。G成分がR成分やB成分よりも情報として重要とされる場合も考えられるが、情報量（ビット深度）に差が生じるケースは稀である。

換言するに、画像の色空間がRGBであって、各コンポーネントの情報量（ビット深度）が均一でないようにする場合、その画像には、画像の性質を超えた製作者の何らかの意図が含まれている可能性が高く、そのために、一般的な画像向けの処理である残差予測の予測精度が低減しやすくなる可能性も考えられる。つまり、符号化効率が低減しやすくなる可能性がある。

そこで、画像がYUVのような予測精度が高いことが期待される色空間の場合のみ、残差予測（残差復元）を実行可能とし、画像がRGBのように予測精度が低減し易い色空間の場合は、ピクチャパラメータセット（PPS）に含まれる、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）を用いて、残差予測（残差復元）が行われないように制御するようにしてもよい。

このようにすることにより、残差予測を行うことによる十分な効果が得られる（十分に符号化効率を向上させることができる）色空間の場合のみ、残差予測・残差復号を実行するようにすることができる。したがって、不要な残差予測・残差復号を省略することができるので、符号化効率の低減を抑制することができるとともに、処理の負荷の増大を抑制することができる。

＜セマンティクス＞
以上のような制御を行うためには、セマンティクスを図２７の例のような記述にすればよい。図２７に示されるセマンティクスの下線を付した部分が、上述した残差予測・残差復号の実行制御に相当する記述である。

図２８は、この場合のヘッダ処理部１２１および残差予測部１２２の主な構成例を示すブロック図である。図２８に示されるように、この場合、ヘッダ処理部１２１は、第１の実施の形態の場合と比較して、VUI（Video Userbility Information）処理部５０１をさらに有する。また、残差予測部１２２は、第１の実施の形態の場合と比較して、制御部１４１の代わりに制御部５１１を有し、予測部１４２の代わりに予測部４１２を有する。

VUI処理部５０１は、VUI（Video Userbility Information）の生成に関する処理を行う。VUIは、ビデオの表示に関するデータであり、ビデオパラメータセット（VPS）やシーケンスパラメータセット（SPS）に格納される。また、VUI処理部５０１は、例えば、そのようなVUIに含まれる、画像の色空間を示す情報（matrix_coffs）を残差予測部１２２（後述する色空間判定部５２３）に供給する。matrix_coffsは、RGBから輝度・色差への変換行列を示す情報である。換言するに、matrix_coffs=0の場合、画像の色空間がsRGBであることを示す。

制御部５１１は、基本的に制御部１４１と同様の処理を行う。制御部１４１の構成と比較して、制御部５１１は、ビット深度差算出部１５１の代わりにビット深度差算出部５２１を有し、ビットシフト制御部１５２の代わりにビットシフト制御部５２２を有し、さらに、制御部１４１の場合と同様に、重み係数設定部１５３を有する。さらに、制御部５１１は、色空間判定部５２３を有する。

ビット深度差算出部５２１は、ビット深度差算出部１５１の場合と同様に、コンポーネント間のビット深度差（delta_bitdepth）を算出する。しかしながら、ビット深度差算出部５２１は、ビット深度差算出部１５１の場合と異なり、算出したコンポーネント間のビット深度差（delta_bitdepth）を左シフト部１６３に供給しない（予測部４１２も左シフト部１６３を有していない）。

ビットシフト制御部５２２は、ビットシフト制御部１５２の場合と同様に、予測部４１２による演算を制御する。ただし、ビットシフト制御部５２２は、ビット深度差算出部５２１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が０の場合、予測部４１２にビット深度のスケーリングを行わずに予測残差データを算出させ、ビット深度差算出部５２１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が正の場合、予測部４１２にビット深度のスケーリングを行わせて予測残差データを算出させる。これに対して、ビット深度差算出部５２１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が負の場合、ビットシフト制御部５２２は、予測部４１２を制御し、残差予測を禁止する（予測残差データを算出させないようにする）。

さらに、ビットシフト制御部５２２は、色空間判定部５２３による画像の色空間の判定結果に応じて、予測部４１２による演算を制御する。例えば、色空間判定部５２３により画像の色空間がRGBであると判定された場合、ビットシフト制御部５２２は、予測部４１２を制御し、残差予測を禁止する（予測残差データを算出させないようにする）。

色空間判定部５２３は、VUI処理部５０１から供給される画像の色空間を示す情報（matrix_coffs）を参照して、画像の色空間を判定する。例えば、matrix_coffs=0の場合、色空間判定部５２３は、画像の色空間がRGBであると判定する。

つまりこの実施の形態の例の場合、第３の実施の形態の場合と同様に、ビット深度差算出部４２１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が負のときは、ビット深度のスケーリング、すなわち、コンポーネント間でビット深度を揃えるためのビットシフトが行われない。したがって、予測部４１２は、第３の実施の形態において説明したように、予測部１４２の構成と比較して、左シフト部１６３が省略される。

＜残差予測処理の流れ＞
この実施の形態の場合、符号化処理は、第１の実施の形態の場合と同様に実行される。図２９のフローチャートを参照して、この実施の形態の場合の、残差予測処理の流れの例を説明する。

図２９の例の場合も、残差予測処理が開始されると、ステップＳ５０１において、ビット深度差算出部５２１は、残差予測を行うコンポーネント間のビット深度の差分を算出する。すなわち、ビット深度差算出部５２１は、式（４）の演算を行い、輝度成分（Y）と色差成分（CrまたはCb）のビット深度差（delta_bitdepth）を算出する。色差成分（Cr）と色差成分（Cb）とでビット深度差が異なる場合は、それぞれビット深度差（delta_bitdepth）を算出する。

ステップＳ５０２において、ビットシフト制御部５２２は、ステップＳ５０１において算出されたビット深度差（delta_bitdepth）が０であるか否かを判定する。０であると判定された場合、処理は、ステップＳ５０３に進む。この場合、ビットシフトは行われず、残差予測は、式（３）のように行われる。

つまり、ステップＳ５０３乃至ステップＳ５０５の各処理は、第１の実施の形態の残差予測処理のステップＳ１２３乃至ステップＳ１２５の各処理と同様に実行される。そして、ステップＳ５０５の処理が終了するか、ステップＳ５０３において、残差予測を行わないと判定された場合、残差予測処理が終了し、処理は、図５に戻る。

また、ステップＳ５０２において、ビット深度差（delta_bitdepth）が０でないと判定された場合、処理は、ステップＳ５０６進む。

ステップＳ５０６において、色空間判定部５２３は、VUI処理部５０１から取得した画像の色空間を示す情報（matrix_coffs）に基づいて、画像の色空間がRGBであるか否かを判定する。RGBでないと判定された場合、処理は、ステップＳ５０７に進む。

ステップＳ５０７において、ビットシフト制御部５２２は、ステップＳ５０１において算出されたビット深度差（delta_bitdepth）が正であるか否かを判定する。正であると判定された場合、処理はステップＳ５０８に進む。この場合、残差予測は、式（６）のように行われる（右シフトによるスケーリングが行われる）。

つまり、ステップＳ５０８乃至ステップＳ５１０の各処理は、第１の実施の形態の残差予測処理のステップＳ１２７乃至ステップＳ１２９の各処理と同様に実行される。そして、ステップＳ５１０の処理が終了するか、ステップＳ５０８において、残差予測を行わないと判定された場合、残差予測処理が終了し、処理は、図５に戻る。

また、ステップＳ５０６において色空間がRGBであると判定されるか、ステップＳ５０７においてビット深度差（delta_bitdepth）が正でない（負である）と判定された場合、処理は、ステップＳ５１１進む。

ステップＳ５１１において、ビットシフト制御部５２２は、残差予測を行うか否かを制御する情報（例えばluma_chroma_prediction_enabled_flag）の値を、残差予測（残差復元）が行われない（禁止する）ことを示す値に設定する。例えば、ビットシフト制御部５２２が、luma_chroma_prediction_enabled_flagの値を０にするようにしてもよい。

ステップＳ５１１の処理が終了すると、残差予測処理が終了し、処理は、図５に戻る。

このようにすることにより、残差データのコンポーネント間のビット深度差が負であり、すなわち輝度成分より色差成分の方がビット深度が大きく、残差予測を行っても十分な効果が得られない（十分に符号化効率を向上させることができない）可能性がある場合、その残差予測を行わないようにすることができる。また、残差予測を行うことによる十分な効果が得られる（十分に符号化効率を向上させることができる）色空間の場合のみ、残差予測を実行するようにすることができる。したがって、画像符号化装置１００は、不要な残差予測を省略することができるので、符号化効率の低減を抑制することができるとともに、処理の負荷の増大を抑制することができる。

図３０は、この場合のヘッダ取得部２２１および残差復元部２２２の主な構成例を示すブロック図である。図３０に示されるように、この場合、ヘッダ取得部２２１は、第１の実施の形態の場合と比較して、VUI取得部５４１をさらに有する。また、残差復元部２２２は、第１の実施の形態の場合と比較して、制御部２４１の代わりに制御部５５１を有し、復元部２４２の代わりに復元部４５２を有する。

VUI取得部５４１は、符号化側から供給されたビデオパラメータセット（VPS）やシーケンスパラメータセット（SPS）から、ビデオの表示に関するデータであるVUIを取得し、そのVUIに含まれる画像の色空間を示す情報（matrix_coffs）を取得し、残差復元部２２２（後述する色空間判定部５６３）に供給する。

制御部５５１は、基本的に制御部２４１と同様の処理を行う。制御部２４１の構成と比較して、制御部５５１は、ビット深度差算出部２５１の代わりにビット深度差算出部５６１を有し、ビットシフト制御部２５２の代わりにビットシフト制御部５６２を有する。さらに、制御部５５１は、色空間判定部５６３を有する。

ビット深度差算出部５６１は、ビット深度差算出部２５１の場合と同様に、コンポーネント間のビット深度差（delta_bitdepth）を算出する。しかしながら、ビット深度差算出部５６１は、ビット深度差算出部２５１の場合と異なり、算出したコンポーネント間のビット深度差（delta_bitdepth）を左シフト部２６３に供給しない（復元部４５２も左シフト部２６３を有していない）。

ビットシフト制御部５６２は、ビットシフト制御部２５２の場合と同様に、復元部４５２による演算を制御する。ただし、ビットシフト制御部５６２は、ビット深度差算出部５６１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が０の場合、復元部４５２にビット深度のスケーリングを行わずに残差データを復元させ、ビット深度差算出部５６１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が正の場合、復元部４５２にビット深度のスケーリングを行わせて残差データを復元させる。これに対して、ビット深度差算出部５６１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が負の場合、ビットシフト制御部５６２は、復元部４５２を制御し、残差復元を省略する（残差データの復元を省略する）。

さらに、ビットシフト制御部５６２は、色空間判定部５６３による画像の色空間の判定結果に応じて、復元部４５２による演算を制御する。例えば、色空間判定部５６３により画像の色空間がRGBであると判定された場合、ビットシフト制御部５６２は、復元部４５２を制御し、残差復元を省略する（残差データの復元を省略する）。

色空間判定部５６３は、VUI取得部５４１から供給される画像の色空間を示す情報（matrix_coffs）を参照して、画像の色空間を判定する。例えば、matrix_coffs=0の場合、色空間判定部５６３は、画像の色空間がRGBであると判定する。

つまりこの実施の形態の例の場合、第３の実施の形態の場合と同様に、ビット深度差算出部５６１により算出される残差データのコンポーネント間ビット深度差（delta_bitdepth）が負のときは、ビット深度のスケーリング、すなわち、コンポーネント間でビット深度を揃えるためのビットシフトが行われない。したがって、復元部４５２は、復元部２４２の構成と比較して、左シフト部２６３が省略される。

＜残差復元処理の流れ＞
この実施の形態の場合、復号処理は、第１の実施の形態の場合と同様に実行される。図３１のフローチャートを参照して、この実施の形態の場合の、残差復元処理の流れの例を説明する。

図３１の例の場合も、残差復元処理が開始されると、ステップＳ５２１において、ビット深度差算出部５６１は、残差予測が行われたコンポーネント間のビット深度の差分を算出する。すなわち、ビット深度差算出部５６１は、式（１０）の演算を行い、輝度成分（Y）と色差成分（CrまたはCb）のビット深度差（delta_bitdepth）を算出する。色差成分（Cr）と色差成分（Cb）とでビット深度差が異なる場合は、それぞれビット深度差（delta_bitdepth）を算出する。

ステップＳ５２２において、ビットシフト制御部５６２は、ステップＳ５２１において算出されたビット深度差（delta_bitdepth）が０であるか否かを判定する。０であると判定された場合、処理は、ステップＳ５２３に進む。この場合、ビットシフトは行われず、残差復元は、式（９）のように行われる。

つまり、ステップＳ５２３乃至ステップＳ５２５の各処理は、第１の実施の形態の残差予測処理のステップＳ２２３乃至ステップＳ２２５の各処理と同様に実行される。そして、ステップＳ５２５の処理が終了するか、ステップＳ５２３において残差予測が行われていないと判定された場合、残差復元処理が終了し、処理は、図１２に戻る。

また、ステップＳ５２２において、ビット深度差（delta_bitdepth）が０でないと判定された場合、処理は、ステップＳ５２６進む。

ステップＳ５２６において、色空間判定部５６３は、VUI取得部５４１から取得した画像の色空間を示す情報（matrix_coffs）に基づいて、画像の色空間がRGBであるか否かを判定する。RGBでないと判定された場合、処理は、ステップＳ５２７に進む。

ステップＳ５２７において、ビットシフト制御部５６２は、ステップＳ５２１において算出されたビット深度差（delta_bitdepth）が正であるか否かを判定する。正であると判定された場合、処理はステップＳ５２８に進む。この場合、残差予測は、式（１２）のように行われる（右シフトによるスケーリングが行われる）。

つまり、ステップＳ５２８乃至ステップＳ５３０の各処理は、第１の実施の形態の残差予測処理のステップＳ２２７乃至ステップＳ２２９の各処理と同様に実行される。そして、ステップＳ５３０の処理が終了するか、ステップＳ５２８において、残差予測が行われていないと判定された場合、残差復元処理が終了し、処理は、図１２に戻る。

また、ステップＳ５２６において色空間がRGBであると判定されるか、ステップＳ５２７においてビット深度差（delta_bitdepth）が正でない（負である）と判定された場合も、ビット深度のスケーリングは行われず、残差復元が省略される。したがって、この場合も残差復元処理が終了し、処理は、図１２に戻る。

このようにすることにより、残差データのコンポーネント間のビット深度差が負であり、すなわち輝度成分より色差成分の方がビット深度が大きく、残差予測を行っても十分な効果が得られない（十分に符号化効率を向上させることができない）可能性がある場合、その残差予測を行わないようにし、それに応じて残差復元も行わないようにすることができる。また、残差予測を行うことによる十分な効果が得られる（十分に符号化効率を向上させることができる）色空間の場合のみ、残差予測を実行するようにし、それに応じて残差復元も行わないようにすることができる。したがって、画像復号装置２００は、不要な残差復元を省略することができるので、符号化効率の低減を抑制することができるとともに、処理の負荷の増大を抑制することができる。

＜５．第５の実施の形態＞
＜重み係数の共通化＞
なお、以上においては、重み係数設定部１５３が、コンポーネント毎に独立に重み係数αを設定するように説明したが、これに限らず、重み係数設定部１５３が、複数のコンポーネントに共通の重み係数αを設定するようにしてもよい。例えば、重み係数設定部１５３が、色差成分Crと色差成分Cbの両方に共通の重み係数αを設定するようにしてもよい。

＜シンタクスとセマンティクス＞
図３２に、重み係数αをコンポーネント毎に独立に設定する場合の、重み係数αを伝送するTUのシンタクスの例を示す。この場合、図３２の斜線模様で示される部分のように、重み係数αを伝送すrための条件判定が、色差成分Crと色差成分Cbのそれぞれについて行われ、色差成分Crと色差成分Cbのそれぞれについて重み係数αの伝送（luma_chroma_pred()の呼び出し）が行われる。また、その重み係数αの伝送において、色差成分（Chroma）のコンポーネント番号（c）を指定する必要がある（例えば、luma_chroma_pred(x0,y0,c)の"c"。図３２の例では、c="0"or"1"）。

残差予測（Luma-chroma prediction）のシンタクスの例を図３３に示す。図３３に示されるように、このシンタクスにおいても、色差成分（Chroma）のコンポーネント番号（c）を指定する必要がある。

さらに、セマンティクスの例を図３４および図３５に示す。これらの図に示されるように、セマンティクスにおいても、色差成分（Chroma）のコンポーネント番号（c）を指定する必要がある。

これに対して、図３６に、重み係数αを共通化する場合の、重み係数αを伝送するTUのシンタクスの例を示す。この場合、図３６の斜線模様で示される部分のように、重み係数αを伝送すrための条件判定と、重み係数αの伝送（luma_chroma_pred()の呼び出し）は１回行えば良い。したがって、このようにすることにより、画像符号化装置１００および画像復号装置２００の負荷を低減させることができるとともに、伝送する情報量を低減させることができ、符号化効率を向上させることができる。また、色差成分（Chroma）のコンポーネント番号（c）の指定が不要になるので、さらに、符号化効率を向上させることができる。

また、その場合の残差予測（Luma-chroma prediction）のシンタクスの例を図３７に示す。図３７に示されるように、このシンタクスにおいても、色差成分（Chroma）のコンポーネント番号（c）の指定が不要になるので、さらに、符号化効率を向上させることができる。

さらに、その場合のセマンティクスの例を図３８および図３９に示す。これらの図に示されるように、セマンティクスにおいても、色差成分（Chroma）のコンポーネント番号（c）の指定が不要になる。したがって、さらに、画像符号化装置１００および画像復号装置２００の負荷を低減させることができる。

本技術の適用範囲は、画像データを符号化・復号可能なあらゆる画像符号化装置及び画像復号装置に適用することができる。

また、本技術は、例えば、MPEG、H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本技術は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。

＜６．第６の実施の形態＞
＜多視点画像符号化・多視点画像復号への適用＞
上述した一連の処理は、多視点画像符号化・多視点画像復号に適用することができる。図４０は、多視点画像符号化方式の一例を示す。

図４０に示されるように、多視点画像は、複数の視点（ビュー（view））の画像を含む。この多視点画像の複数のビューは、他のビューの情報を利用せずに自身のビューの画像のみを用いて符号化・復号を行うベースビューと、他のビューの情報を利用して符号化・復号を行うノンベースビューとによりなる。ノンベースビューの符号化・復号は、ベースビューの情報を利用するようにしても良いし、他のノンベースビューの情報を利用するようにしてもよい。

図４０の例のような多視点画像を符号化・復号する場合、各視点の画像を符号化・復号するが、この各視点の符号化・復号に対して、第１の実施の形態乃至第５の実施の形態において上述した方法を適用するようにしてもよい。このようにすることにより、各視点の符号化効率の低減を抑制することができる。つまり、多視点画像の場合も同様に、符号化効率の低減を抑制することができる。

＜多視点画像符号化装置＞
図４１は、上述した多視点画像符号化を行う多視点画像符号化装置を示す図である。図４１に示されるように、多視点画像符号化装置６００は、符号化部６０１、符号化部６０２、および多重化部６０３を有する。

符号化部６０１は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部６０２は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部６０３は、符号化部６０１において生成されたベースビュー画像符号化ストリームと、符号化部６０２において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。

例えば、このような多視点画像符号化装置６００の符号化部６０１および符号化部６０２として、上述した画像符号化装置１００を適用すればよい。このようにすることにより、多視点画像の符号化においても、第１の実施の形態乃至第５の実施の形態において説明した各種方法を適用することができる。すなわち、多視点画像符号化装置６００は、多視点画像の符号化データの符号化効率の低減を抑制することができる。

＜多視点画像復号装置＞
図４２は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。図４２に示されるように、多視点画像復号装置６１０は、逆多重化部６１１、復号部６１２、および復号部６１３を有する。

逆多重化部６１１は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部６１２は、逆多重化部６１１により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部６１３は、逆多重化部６１１により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。

例えば、このような多視点画像復号装置６１０の復号部６１２および復号部６１３として、上述した画像復号装置２００を適用すればよい。このようにすることにより、多視点画像の符号化データの復号においても、第１の実施の形態乃至第５の実施の形態において説明した各種方法を適用することができる。すなわち、多視点画像復号装置６１０は、第１の実施の形態乃至第５の実施の形態において説明した各種方法で符号化された多視点画像の符号化データを正しく復号することができる。したがって、多視点画像復号装置６１０は、多視点画像の符号化データの符号化効率の低減を抑制することができる。

＜７．第７の実施の形態＞
＜階層画像符号化・階層画像復号への適用＞
また、上述した一連の処理は、階層画像符号化・階層画像復号（スケーラブル符号化・スケーラブル復号）に適用することができる。図４３は、階層画像符号化方式の一例を示す。

階層画像符号化（スケーラブル符号化）は、画像データを、所定のパラメータについてスケーラビリティ（scalability）機能を有するように、画像を複数レイヤ化（階層化）し、レイヤ毎に符号化するものである。階層画像復号は、その階層画像符号化（スケーラブル復号）は、その階層画像符号化に対応する復号である。

図４３に示されるように、画像の階層化においては、スケーラビリティ機能を有する所定のパラメータを基準として１の画像が複数の画像（レイヤ）に分割される。つまり、階層化された画像（階層画像）は、その所定のパラメータの値が互いに異なる複数の階層（レイヤ）の画像を含む。この階層画像の複数のレイヤは、他のレイヤの画像を利用せずに自身のレイヤの画像のみを用いて符号化・復号を行うベースレイヤと、他のレイヤの画像を利用して符号化・復号を行うノンベースレイヤ（エンハンスメントレイヤとも称する）とによりなる。ノンベースレイヤは、ベースレイヤの画像を利用するようにしても良いし、他のノンベースレイヤの画像を利用するようにしてもよい。

一般的に、ノンベースレイヤは、冗長性が低減されるように、自身の画像と、他のレイヤの画像との差分画像のデータ（差分データ）により構成される。例えば、１の画像をベースレイヤとノンベースレイヤ（エンハンスメントレイヤとも称する）に２階層化した場合、ベースレイヤのデータのみで元の画像よりも低品質な画像が得られ、ベースレイヤのデータとノンベースレイヤのデータを合成することで、元の画像（すなわち高品質な画像）が得られる。

このように画像を階層化することにより、状況に応じて多様な品質の画像を容易に得ることができる。例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ（base layer）のみの画像圧縮情報を伝送し、空間時間解像度の低い、或いは、画質の良くない動画像を再生し、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ（base layer）に加えて、エンハンスメントレイヤ（enhancement layer）の画像圧縮情報を伝送し、空間時間解像度の高い、或いは、画質の高い動画像を再生するといったように、トランスコード処理を行うことなく、端末やネットワークの能力に応じた画像圧縮情報を、サーバから送信することが可能となる。

図４３の例のような階層画像を符号化・復号する場合、各レイヤの画像を符号化・復号するが、この各レイヤの符号化・復号に対して、第１の実施の形態乃至第５の実施の形態において上述した方法を適用するようにしてもよい。このようにすることにより、各レイヤの符号化効率の低減を抑制することができる。つまり、階層画像の場合も同様に、符号化効率の低減を抑制することができる。

＜スケーラブルなパラメータ＞
このような階層画像符号化・階層画像復号（スケーラブル符号化・スケーラブル復号）において、スケーラビリティ（scalability）機能を有するパラメータは、任意である。例えば、図４４に示されるような空間解像度をそのパラメータとしてもよい（spatial scalability）。このスペーシャルスケーラビリティ（spatial scalability）の場合、レイヤ毎に画像の解像度が異なる。つまり、図４４に示されるように、各ピクチャが、元の画像より空間的に低解像度のベースレイヤと、ベースレイヤの画像と合成することにより元の画像（元の空間解像度）が得られるエンハンスメントレイヤの２階層に階層化される。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。

また、このようなスケーラビリティ性を持たせるパラメータとして、他には、例えば、図４５に示されるような、時間解像度を適用しても良い（temporal scalability）。このテンポラルスケーラビリティ（temporal scalability）の場合、レイヤ毎にフレームレートが異なる。つまり、この場合、図４５に示されるように、互いに異なるフレームレートのレイヤに階層化されており、低フレームレートのレイヤに、高フレームレートのレイヤを加えることで、より高フレームレートの動画像を得ることができ、全てのレイヤを加えることで、元の動画像（元のフレームレート）を得ることができる。この階層数は一例であり、任意の階層数に階層化することができる。

さらに、このようなスケーラビリティ性を持たせるパラメータとして、例えば、信号雑音比（SNR（Signal to Noise ratio））を適用しても良い（SNR scalability）。このSNRスケーラビリティ（SNR scalability）の場合、レイヤ毎にSN比が異なる。つまり、図４６に示されるように、各ピクチャが、元の画像よりSNRの低いベースレイヤと、ベースレイヤの画像と合成することにより元の画像（元のSNR）が得られるエンハンスメントレイヤの２階層に階層化される。すなわち、ベースレイヤ（base layer）画像圧縮情報においては、低PSNRの画像に関する情報が伝送されており、これに、エンハンスメントレイヤ（enhancement layer）画像圧縮情報を加えることで、高PSNR画像を再構築することが可能である。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。

スケーラビリティ性を持たせるパラメータは、上述した例以外であっても、もちろんよい。例えば、ベースレイヤ（base layer）が８ビット（bit）画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、10ビット（bit）画像が得られるビット深度スケーラビリティ（bit-depth scalability）がある。

また、ベースレイヤ（base layer）が4:2:0フォーマットのコンポーネント画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、4:2:2フォーマットのコンポーネント画像が得られるクロマスケーラビリティ（chroma scalability）がある。

＜階層画像符号化装置＞
図４７は、上述した階層画像符号化を行う階層画像符号化装置を示す図である。図４７に示されるように、階層画像符号化装置６２０は、符号化部６２１、符号化部６２２、および多重化部６２３を有する。

符号化部６２１は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。符号化部６２２は、ノンベースレイヤ画像を符号化し、ノンベースレイヤ画像符号化ストリームを生成する。多重化部６２３は、符号化部６２１において生成されたベースレイヤ画像符号化ストリームと、符号化部６２２において生成されたノンベースレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。

例えば、この階層画像符号化装置６２０の符号化部６２１および符号化部６２２として、上述した画像符号化装置１００を適用すればよい。このようにすることにより、階層画像の符号化においても、第１の実施の形態乃至第５の実施の形態において説明した各種方法を適用することができる。すなわち、階層画像符号化装置６２０は、階層画像の符号化データの符号化効率の低減を抑制することができる。

＜階層画像復号装置＞
図４８は、上述した階層画像復号を行う階層画像復号装置を示す図である。図４８に示されるように、階層画像復号装置６３０は、逆多重化部６３１、復号部６３２、および復号部６３３を有する。

逆多重化部６３１は、ベースレイヤ画像符号化ストリームとノンベースレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを逆多重化し、ベースレイヤ画像符号化ストリームと、ノンベースレイヤ画像符号化ストリームとを抽出する。復号部６３２は、逆多重化部６３１により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。復号部６３３は、逆多重化部６３１により抽出されたノンベースレイヤ画像符号化ストリームを復号し、ノンベースレイヤ画像を得る。

例えば、この階層画像復号装置６３０の復号部６３２および復号部６３３として、上述した画像復号装置２００を適用すればよい。このようにすることにより、階層画像の符号化データの復号においても、第１の実施の形態乃至第５の実施の形態において説明した各種方法を適用することができる。すなわち、階層画像復号装置６３０は、第１の実施の形態乃至第５の実施の形態において説明した各種方法で符号化された階層画像の符号化データを正しく復号することができる。したがって、階層画像復号装置６３０は、階層画像の符号化データの符号化効率の低減を抑制することができる。

＜８．第８の実施の形態＞
＜コンピュータ＞
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

図４９は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

図４９に示されるコンピュータ８００において、CPU（Central Processing Unit）８０１、ROM（Read Only Memory）８０２、RAM（Random Access Memory）８０３は、バス８０４を介して相互に接続されている。

バス８０４にはまた、入出力インタフェース８１０も接続されている。入出力インタフェース８１０には、入力部８１１、出力部８１２、記憶部８１３、通信部８１４、およびドライブ８１５が接続されている。

入力部８１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部８１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部８１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部８１４は、例えば、ネットワークインタフェースよりなる。ドライブ８１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア８２１を駆動する。

以上のように構成されるコンピュータでは、CPU８０１が、例えば、記憶部８１３に記憶されているプログラムを、入出力インタフェース８１０およびバス８０４を介して、RAM８０３にロードして実行することにより、上述した一連の処理が行われる。RAM８０３にはまた、CPU８０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

コンピュータ（CPU８０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア８２１をドライブ８１５に装着することにより、入出力インタフェース８１０を介して、記憶部８１３にインストールすることができる。

また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部８１４で受信し、記憶部８１３にインストールすることができる。

その他、このプログラムは、ROM８０２や記憶部８１３に、あらかじめインストールしておくこともできる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

また、以上において、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

上述した実施形態に係る画像符号化装置及び画像復号装置は、例えば、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

＜９．第９の実施の形態＞
＜第１の応用例：テレビジョン受像機＞
図５０は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース（I/F）部９０９、制御部９１０、ユーザインタフェース（I/F）部９１１、及びバス９１２を備える。

チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからEPG（Electronic Program Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのGUI（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic ElectroLuminescence Display）（有機ELディスプレイ）など）の映像面上に映像又は画像を表示する。

音声信号処理部９０７は、デコーダ９０４から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

外部インタフェース部９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース部９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース部９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

制御部９１０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

ユーザインタフェース部９１１は、制御部９１０と接続される。ユーザインタフェース部９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース部９０９及び制御部９１０を相互に接続する。

このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施形態に係る画像復号装置２００の機能を有する。つまり、デコーダ９０４は、画像データが第１の実施の形態乃至第５の実施の形態において説明したいずれか方法で符号化された符号化データを、その実施の形態において説明した方法で正しく復号することができる。したがって、テレビジョン装置９００は、符号化効率の低減を抑制することができる。

＜第２の応用例：携帯電話機＞
図５１は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９に供給し、その記憶媒体に書き込ませる。

記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Universal Serial Bus）メモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９に供給し、その記憶媒体に書き込ませる。

さらに、画像表示モードにおいて、記録再生部９２９は、記憶媒体に記録されている符号化ストリームを読み出して画像処理部９２７へ出力する。画像処理部９２７は、記録再生部９２９から入力される符号化ストリームを復号し、画像データを表示部９３０に供給し、その画像を表示させる。

また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施形態に係る画像符号化装置１００や画像復号装置２００の機能を有する。つまり、画像処理部９２７は、画像データを第１の実施の形態乃至第５の実施の形態において説明したいずれかの方法で符号化したり、その符号化により得られる符号化データを、その実施の形態において説明した方法で正しく復号したりすることができる。したがって、携帯電話機９２０は、符号化効率の低減を抑制することができる。

＜第３の応用例：記録再生装置＞
図５２は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データおよび映像データを復号する。

記録再生装置９４０は、チューナ９４１、外部インタフェース（I/F）部９４２、エンコーダ９４３、HDD（Hard Disk Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、OSD（On-Screen Display）９４８、制御部９４９、およびユーザインタフェース（I/F）部９５０を備える。

チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送部としての役割を有する。

外部インタフェース部９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース部９４２は、例えば、IEEE（Institute of Electrical and Electronic Engineers）1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース部９４２を介して受信される映像データおよび音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース部９４２は、記録再生装置９４０における伝送部としての役割を有する。

エンコーダ９４３は、外部インタフェース部９４２から入力される映像データおよび音声データが符号化されていない場合に、映像データおよび音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

HDD９４４は、映像および音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラムおよびその他のデータを内部のハードディスクに記録する。また、HDD９４４は、映像および音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ９４５は、装着されている記録媒体へのデータの記録および読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばDVD（Digital Versatile Disc）ディスク（DVD-Video、DVD-RAM（DVD - Random Access Memory）、DVD-R（DVD - Recordable）、DVD-RW（DVD - Rewritable）、DVD+R（DVD + Recordable）、DVD+RW（DVD + Rewritable）等）又はBlu-ray（登録商標）ディスクなどであってよい。

セレクタ９４６は、映像および音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、HDD９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをOSD９４８へ出力する。また、デコーダ９４７は、生成した音声データを外部のスピーカへ出力する。

OSD９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、OSD９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。

制御部９４９は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

ユーザインタフェース部９５０は、制御部９４９と接続される。ユーザインタフェース部９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタンおよびスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施形態に係る画像符号化装置１００の機能を有する。つまり、エンコーダ９４３は、画像データを第１の実施の形態乃至第５の実施の形態において説明したいずれか方法で符号化することができる。また、デコーダ９４７は、上述した実施形態に係る画像復号装置２００の機能を有する。つまり、デコーダ９４７は、画像データが第１の実施の形態乃至第５の実施の形態において説明したいずれかの方法で符号化された符号化データを、その実施の形態において説明した方法で正しく復号することができる。したがって、記録再生装置９４０は、符号化効率の低減を抑制することができる。

＜第４の応用例：撮像装置＞
図５３は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース（I/F）部９６６、メモリ部９６７、メディアドライブ９６８、OSD９６９、制御部９７０、ユーザインタフェース（I/F）部９７１、およびバス９７２を備える。

光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース部９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、OSD９６９、および制御部９７０を相互に接続する。

光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、CCD（Charge Coupled Device）又はCMOS（Complementary Metal Oxide Semiconductor）などのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース部９６６またはメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース部９６６またはメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、OSD９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

OSD９６９は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部９６４へ出力する。

外部インタフェース部９６６は、例えばUSB入出力端子として構成される。外部インタフェース部９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース部９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース部９６６は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース部９６６は、撮像装置９６０における伝送部としての役割を有する。

メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部９７０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

ユーザインタフェース部９７１は、制御部９７０と接続される。ユーザインタフェース部９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース部９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施形態に係る画像符号化装置１００や画像復号装置２００の機能を有する。つまり、画像処理部９６４は、画像データを第１の実施の形態乃至第５の実施の形態において説明したいずれかの方法で符号化したり、その符号化により得られる符号化データを、その実施の形態において説明した方法で正しく復号したりすることができる。したがって、撮像装置９６０は、符号化効率を向上させることができる。

なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えばMPEG DASH等のようなHTTPストリーミングにも適用することができる。つまり、このような複数の符号化データ間で、符号化や復号に関する情報を共有することもできる。

＜１０．第１０の実施の形態＞
＜実施のその他の例＞
以上において本技術を適用する装置やシステム等の例を説明したが、本技術は、これに限らず、このような装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。

＜ビデオセット＞
本技術をセットとして実施する場合の例について、図５４を参照して説明する。図５４は、本技術を適用したビデオセットの概略的な構成の一例を示している。

近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

図５４に示されるビデオセット１３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

図５４に示されるように、ビデオセット１３００は、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４等のモジュール群と、コネクティビティ１３２１、カメラ１３２２、およびセンサ１３２３等の関連する機能を有するデバイスとを有する。

モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

図５４の例の場合、ビデオモジュール１３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ、ビデオプロセッサ、ブロードバンドモデム１３３３、およびRFモジュール１３３４を有する。

プロセッサは、所定の機能を有する構成をSoC（System On a Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large Scale Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

図５４のアプリケーションプロセッサ１３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ１３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ１３３２等、ビデオモジュール１３１１内外の構成を必要に応じて制御することもできる。

ビデオプロセッサ１３３２は、画像の符号化・復号（その一方若しくは両方）に関する機能を有するプロセッサである。

ブロードバンドモデム１３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（またはその両方）の広帯域通信により送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、その広帯域通信により受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。ブロードバンドモデム１３３３は、例えば、ビデオプロセッサ１３３２が処理する画像データ、画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報を処理する。

RFモジュール１３３４は、アンテナを介して送受信されるRF（Radio Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール１３３４は、ブロードバンドモデム１３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール１３３４は、フロントエンドモジュール１３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

なお、図５４において点線１３４１に示されるように、アプリケーションプロセッサ１３３１とビデオプロセッサ１３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

外部メモリ１３１２は、ビデオモジュール１３１１の外部に設けられた、ビデオモジュール１３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ１３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic Random Access Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

パワーマネージメントモジュール１３１３は、ビデオモジュール１３１１（ビデオモジュール１３１１内の各構成）への電力供給を管理し、制御する。

フロントエンドモジュール１３１４は、RFモジュール１３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図６１に示されるように、フロントエンドモジュール１３１４は、例えば、アンテナ部１３５１、フィルタ１３５２、および増幅部１３５３を有する。

アンテナ部１３５１は、無線信号を送受信するアンテナおよびその周辺の構成を有する。アンテナ部１３５１は、増幅部１３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ１３５２に供給する。フィルタ１３５２は、アンテナ部１３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール１３３４に供給する。増幅部１３５３は、RFモジュール１３３４から供給されるRF信号を増幅し、アンテナ部１３５１に供給する。

コネクティビティ１３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ１３２１の物理構成は、任意である。例えば、コネクティビティ１３２１は、ブロードバンドモデム１３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

例えば、コネクティビティ１３２１が、Bluetooth（登録商標）、IEEE 802.11（例えばWi-Fi（Wireless Fidelity、登録商標））、NFC（Near Field Communication）、IrDA（InfraRed Data Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ１３２１が、USB（Universal Serial Bus）、HDMI（登録商標）（High-Definition Multimedia Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ１３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

なお、コネクティビティ１３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ１３２１が、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid State Drive）、NAS（Network Attached Storage）等も含む）を有するようにしてもよい。また、コネクティビティ１３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

カメラ１３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ１３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ１３３２に供給されて符号化される。

センサ１３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ１３２３により検出されたデータは、例えば、アプリケーションプロセッサ１３３１に供給されてアプリケーション等により利用される。

以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

以上のような構成のビデオセット１３００において、後述するようにビデオプロセッサ１３３２に本技術を適用することができる。したがって、ビデオセット１３００は、本技術を適用したセットとして実施することができる。

＜ビデオプロセッサの構成例＞
図５５は、本技術を適用したビデオプロセッサ１３３２（図５４）の概略的な構成の一例を示している。

図５５の例の場合、ビデオプロセッサ１３３２は、ビデオ信号およびオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータおよびオーディオデータを復号し、ビデオ信号およびオーディオ信号を再生出力する機能とを有する。

図５５に示されるように、ビデオプロセッサ１３３２は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、フレームメモリ１４０５、およびメモリ制御部１４０６を有する。また、ビデオプロセッサ１３３２は、エンコード・デコードエンジン１４０７、ビデオES（Elementary Stream）バッファ１４０８Ａおよび１４０８Ｂ、並びに、オーディオESバッファ１４０９Ａおよび１４０９Ｂを有する。さらに、ビデオプロセッサ１３３２は、オーディオエンコーダ１４１０、オーディオデコーダ１４１１、多重化部（MUX（Multiplexer））１４１２、逆多重化部（DMUX（Demultiplexer））１４１３、およびストリームバッファ１４１４を有する。

ビデオ入力処理部１４０１は、例えばコネクティビティ１３２１（図５４）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部１４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部１４０３は、画像データに対して、ビデオ出力処理部１４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部１４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部１４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ１３２１等に出力する。

フレームメモリ１４０５は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、およびエンコード・デコードエンジン１４０７によって共用される画像データ用のメモリである。フレームメモリ１４０５は、例えばDRAM等の半導体メモリとして実現される。

メモリ制御部１４０６は、エンコード・デコードエンジン１４０７からの同期信号を受けて、アクセス管理テーブル１４０６Ａに書き込まれたフレームメモリ１４０５へのアクセススケジュールに従ってフレームメモリ１４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル１４０６Ａは、エンコード・デコードエンジン１４０７、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３等で実行される処理に応じて、メモリ制御部１４０６により更新される。

エンコード・デコードエンジン１４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン１４０７は、フレームメモリ１４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ１４０８Ａに順次書き込む。また、例えば、ビデオESバッファ１４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ１４０５に順次書き込む。エンコード・デコードエンジン１４０７は、これらの符号化や復号において、フレームメモリ１４０５を作業領域として使用する。また、エンコード・デコードエンジン１４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部１４０６に対して同期信号を出力する。

ビデオESバッファ１４０８Ａは、エンコード・デコードエンジン１４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。ビデオESバッファ１４０８Ｂは、逆多重化部（DMUX）１４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン１４０７に供給する。

オーディオESバッファ１４０９Ａは、オーディオエンコーダ１４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。オーディオESバッファ１４０９Ｂは、逆多重化部（DMUX）１４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ１４１１に供給する。

オーディオエンコーダ１４１０は、例えばコネクティビティ１３２１等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode number 3）方式等の所定の方式で符号化する。オーディオエンコーダ１４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ１４０９Ａに順次書き込む。オーディオデコーダ１４１１は、オーディオESバッファ１４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ１３２１等に供給する。

多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）１４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）１４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

逆多重化部（DMUX）１４１３は、多重化部（MUX）１４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）１４１３は、ストリームバッファ１４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）１４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）１４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等から供給されたトランスポートストリームを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１により各種記録媒体から読み出されたファイルデータを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

ストリームバッファ１４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給する。

また、例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１等に供給し、各種記録媒体に記録させる。

さらに、ストリームバッファ１４１４は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

また、ストリームバッファ１４１４は、例えばコネクティビティ１３２１等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

次に、このような構成のビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたビデオ信号は、ビデオ入力処理部１４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ１４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部１４０２または第２画像拡大縮小部１４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換および拡大縮小処理が行われ、再びフレームメモリ１４０５に書き込まれる。この画像データは、エンコード・デコードエンジン１４０７によって符号化され、ビデオストリームとしてビデオESバッファ１４０８Ａに書き込まれる。

また、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたオーディオ信号は、オーディオエンコーダ１４１０によって符号化され、オーディオストリームとして、オーディオESバッファ１４０９Ａに書き込まれる。

ビデオESバッファ１４０８Ａのビデオストリームと、オーディオESバッファ１４０９Ａのオーディオストリームは、多重化部（MUX）１４１２に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部（MUX）１４１２により生成されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークに出力される。また、多重化部（MUX）１４１２により生成されたファイルデータは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

また、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからビデオプロセッサ１３３２に入力されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。また、例えばコネクティビティ１３２１等において各種記録媒体から読み出され、ビデオプロセッサ１３３２に入力されたファイルデータは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。つまり、ビデオプロセッサ１３３２に入力されたトランスポートストリームまたはファイルデータは、逆多重化部（DMUX）１４１３によりビデオストリームとオーディオストリームとに分離される。

オーディオストリームは、オーディオESバッファ１４０９Ｂを介してオーディオデコーダ１４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ１４０８Ｂに書き込まれた後、エンコード・デコードエンジン１４０７により順次読み出されて復号されてフレームメモリ１４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部１４０３によって拡大縮小処理されて、フレームメモリ１４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部１４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、エンコード・デコードエンジン１４０７に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン１４０７が、上述した実施の形態に係る画像符号化装置１００や画像復号装置２００の機能を有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図３９を参照して上述した効果と同様の効果を得ることができる。

なお、エンコード・デコードエンジン１４０７において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

＜ビデオプロセッサの他の構成例＞
図５６は、本技術を適用したビデオプロセッサ１３３２の概略的な構成の他の例を示している。図５６の例の場合、ビデオプロセッサ１３３２は、ビデオデータを所定の方式で符号化・復号する機能を有する。

より具体的には、図５６に示されるように、ビデオプロセッサ１３３２は、制御部１５１１、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、および内部メモリ１５１５を有する。また、ビデオプロセッサ１３３２は、コーデックエンジン１５１６、メモリインタフェース１５１７、多重化・逆多重化部（MUX DMUX）１５１８、ネットワークインタフェース１５１９、およびビデオインタフェース１５２０を有する。

制御部１５１１は、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６等、ビデオプロセッサ１３３２内の各処理部の動作を制御する。

図５６に示されるように、制御部１５１１は、例えば、メインCPU１５３１、サブCPU１５３２、およびシステムコントローラ１５３３を有する。メインCPU１５３１は、ビデオプロセッサ１３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU１５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU１５３２は、メインCPU１５３１の補助的な役割を果たす。例えば、サブCPU１５３２は、メインCPU１５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ１５３３は、メインCPU１５３１およびサブCPU１５３２が実行するプログラムを指定する等、メインCPU１５３１およびサブCPU１５３２の動作を制御する。

ディスプレイインタフェース１５１２は、制御部１５１１の制御の下、画像データを例えばコネクティビティ１３２１等に出力する。例えば、ディスプレイインタフェース１５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、またはデジタルデータの画像データのまま、コネクティビティ１３２１のモニタ装置等に出力する。

ディスプレイエンジン１５１３は、制御部１５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

画像処理エンジン１５１４は、制御部１５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６により共用される、ビデオプロセッサ１３３２の内部に設けられたメモリである。内部メモリ１５１５は、例えば、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６の間で行われるデータの授受に利用される。例えば、内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６に供給する。この内部メモリ１５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static Random Access Memory）のような比較的（例えば外部メモリ１３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

コーデックエンジン１５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン１５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン１５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化若しくは符号化データの復号を行うようにしてもよい。

図５６に示される例において、コーデックエンジン１５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video１５４１、AVC/H.264１５４２、HEVC/H.265１５４３、HEVC/H.265(Scalable)１５４４、HEVC/H.265(Multi-view)１５４５、およびMPEG-DASH１５５１を有する。

MPEG-2 Video１５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264１５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265１５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)１５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)１５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

MPEG-DASH１５５１は、画像データをMPEG-DASH（MPEG-Dynamic Adaptive Streaming over HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（HyperText Transfer Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH１５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video１５４１乃至HEVC/H.265(Multi-view)１５４５を利用する。

メモリインタフェース１５１７は、外部メモリ１３１２用のインタフェースである。画像処理エンジン１５１４やコーデックエンジン１５１６から供給されるデータは、メモリインタフェース１５１７を介して外部メモリ１３１２に供給される。また、外部メモリ１３１２から読み出されたデータは、メモリインタフェース１５１７を介してビデオプロセッサ１３３２（画像処理エンジン１５１４若しくはコーデックエンジン１５１６）に供給される。

多重化・逆多重化部（MUX DMUX）１５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX DMUX）１５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX DMUX）１５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

ネットワークインタフェース１５１９は、例えばブロードバンドモデム１３３３やコネクティビティ１３２１等向けのインタフェースである。ビデオインタフェース１５２０は、例えばコネクティビティ１３２１やカメラ１３２２等向けのインタフェースである。

次に、このようなビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース１５１９を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、例えば、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてファイルデータに変換され、ビデオインタフェース１５２０を介して例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

さらに、例えば、コネクティビティ１３２１等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース１５２０を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース１５１９を介して例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給され図示せぬ他の装置に伝送される。

なお、ビデオプロセッサ１３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ１５１５や外部メモリ１３１２を利用して行われる。また、パワーマネージメントモジュール１３１３は、例えば制御部１５１１への電力供給を制御する。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、コーデックエンジン１５１６に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン１５１６が、上述した実施の形態に係る画像符号化装置１００や画像復号装置２００を実現する機能ブロックを有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図３９を参照して上述した効果と同様の効果を得ることができる。

なお、コーデックエンジン１５１６において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

以上にビデオプロセッサ１３３２の構成を２例示したが、ビデオプロセッサ１３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ１３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

＜装置への適用例＞
ビデオセット１３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット１３００は、テレビジョン装置９００（図５０）、携帯電話機９２０（図５１）、記録再生装置９４０（図５２）、撮像装置９６０（図５３）等に組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、図１乃至図３９を参照して上述した効果と同様の効果を得ることができる。

なお、上述したビデオセット１３００の各構成の一部であっても、ビデオプロセッサ１３３２を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ１３３２のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線１３４１により示されるプロセッサやビデオモジュール１３１１等を、本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４を組み合わせ、本技術を適用したビデオユニット１３６１として実施することもできる。いずれの構成の場合であっても、図１乃至図３９を参照して上述した効果と同様の効果を得ることができる。

つまり、ビデオプロセッサ１３３２を含むものであればどのような構成であっても、ビデオセット１３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ１３３２、点線１３４１により示されるプロセッサ、ビデオモジュール１３１１、または、ビデオユニット１３６１を、テレビジョン装置９００（図５０）、携帯電話機９２０（図５１）、記録再生装置９４０（図５２）、撮像装置９６０（図５３）等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット１３００の場合と同様に、図１乃至図３９を参照して上述した効果と同様の効果を得ることができる。

また、本明細書では、各種情報が、符号化ストリームに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

なお、本技術は以下のような構成も取ることができる。
（１）複数コンポーネントからなる入力画像と予測画像との残差データに対して前記コンポーネント間で予測を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記予測を行う残差予測部と、
前記残差予測部による前記予測により生成された予測残差データを符号化する符号化部と
を備える画像処理装置。
（２）前記残差予測部は、ビットシフトによって前記残差データの前記ビット深度を揃える
（１）、（３）乃至（９）のいずれかに記載の画像処理装置。
（３）前記残差予測部は、前記予測を行う前記２つのコンポーネント間の前記ビット深度の差が０でない場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記予測を行う
（１）、（２）、（４）乃至（９）のいずれかに記載の画像処理装置。
（４）前記残差予測部は、前記ビット深度の差が正の場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記予測を行い、前記ビット深度の差が負の場合、前記予測を省略する
（１）乃至（３）、（５）乃至（９）のいずれかに記載の画像処理装置。
（５）前記残差予測部は、前記入力画像の色空間がRGB空間でない場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記予測を行い、前記入力画像の色空間がRGB空間の場合、前記予測を省略する
（１）乃至（４）、（６）乃至（９）のいずれかに記載の画像処理装置。
（６）前記入力画像の色空間がYUV空間であり、
前記残差予測部は、輝度成分と色差成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記予測を行う
（１）乃至（５）、（７）乃至（９）のいずれかに記載の画像処理装置。
（７）前記入力画像の色空間がRGB空間であり、
前記残差予測部は、G成分とR成分若しくはB成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記予測を行う
（１）乃至（６）、（８）、（９）のいずれかに記載の画像処理装置。
（８）前記残差予測部は、前記予測を行う２つのコンポーネント間の前記ビット深度の差を求め、前記２つのコンポーネントの内の一方のコンポーネントの前記残差データに対して前記ビット深度の差に応じた前記ビットシフトを行い、前記ビットシフトされた前記残差データに所定の重み係数を乗算し、その乗算結果に対して所定のビット数分のビットシフトを行い、他方のコンポーネントの前記残差データと前記ビットシフトされた前記乗算結果との差分を求めることにより、前記予測を行う
（１）乃至（７）、（９）のいずれかに記載の画像処理装置。
（９）前記残差予測部は、複数のコンポーネントで共通の前記重み係数を設定する
（１）乃至（８）のいずれかに記載の画像処理装置。
（１０）複数コンポーネントからなる入力画像と予測画像との残差データに対して前記コンポーネント間で予測を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記予測を行い、
前記予測により生成された予測残差データを符号化する
画像処理方法。
（１１）複数コンポーネントからなる画像とその予測画像との残差データの前記コンポーネント間の予測結果である予測残差データが符号化された符号化データを復号する復号部と、
前記復号部により前記符号化データが復号されて得られた前記予測残差データを用いて前記残差データの復元を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記復元を行う残差復元部と
を備える画像処理装置。
（１２）前記残差復元部は、ビットシフトによって前記残差データの前記ビット深度を揃える
（１１）、（１３）乃至（１９）のいずれかに記載の画像処理装置。
（１３）前記ビット深度に関する情報を受け取る受け取り部をさらに備え、
前記残差復元部は、前記受け取り部により受け取られた前記ビット深度に関する情報に基づいて、前記予測を行う前記２つのコンポーネント間の前記ビット深度の差を求め、求めた前記ビット深度の差に基づいて前記ビットシフトを行うことにより、前記残差データの前記ビット深度を揃える
（１１）、（１２）、（１４）乃至（１９）のいずれかに記載の画像処理装置。
（１４）前記残差復元部は、求めた前記ビット深度の差が０でない場合、前記ビットシフトによって前記残差データの前記ビット深度を揃える
（１１）乃至（１３）、（１４）乃至（１９）のいずれかに記載の画像処理装置。
（１５）前記残差復元部は、求めた前記ビット深度の差が正の場合、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記復元を行い、求めた前記ビット深度の差が負の場合、前記復元を省略する
（１１）乃至（１４）、（１５）乃至（１９）のいずれかに記載の画像処理装置。
（１６）前記受け取り部は、前記画像の色空間に関する情報をさらに受け取り、
前記残差復元部は、前記受け取り部により受け取られた前記画像の色空間に関する情報に基づいて、前記画像の色空間がRGB空間でない場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記復元を行い、前記画像の色空間がRGB空間の場合、前記復元を省略する
（１１）乃至（１５）、（１７）乃至（１９）のいずれかに記載の画像処理装置。
（１７）前記画像の色空間がYUV空間であり、
前記残差復元部は、輝度成分と色差成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記復元を行う
（１１）乃至（１６）、（１８）、（１９）のいずれかに記載の画像処理装置。
（１８）前記画像の色空間がRGB空間であり、
前記残差復元部は、G成分とR成分若しくはB成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記復元を行う
（１１）乃至（１７）、（１９）のいずれかに記載の画像処理装置。
（１９）前記残差復元部は、前記復元を行う２つのコンポーネント間の前記ビット深度の差を求め、前記２つのコンポーネントの内の一方のコンポーネントの復元済みの前記残差データに対して前記ビット深度の差に応じた前記ビットシフトを行い、前記ビットシフトされた前記残差データに所定の重み係数を乗算し、その乗算結果に対して所定のビット数分のビットシフトを行い、前記ビットシフトされた前記乗算結果と前記予測残差データとを加算することにより、他方のコンポーネントの前記残差データの前記復元を行う
（１１）乃至（１８）のいずれかに記載の画像処理装置。
（２０）複数コンポーネントからなる画像とその予測画像との残差データの前記コンポーネント間の予測結果である予測残差データが符号化された符号化データを復号し、
前記符号化データが復号されて得られた前記予測残差データを用いて前記残差データの復元を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記復元を行う
画像処理方法。

１００画像符号化装置，１２１ヘッダ処理部，１２２残差予測部，１２３残差復元部，１３１ SPS処理部，１３２ PPS処理部，１４１制御部，１４２予測部，１５１ビット深度差算出部，１５２ビットシフト制御部，１５３重み係数設定部，１６１選択部，１６２右シフト部，１６３左シフト部，１６４重み係数乗算部，１６５右シフト部，１６６および１６７演算部，２００画像復号装置，２２１ヘッダ取得部，２２２残差復元部，２３１ SPS取得部，２３２ PPS取得部，２３３重み係数取得部，２４１制御部，２４２復元部，２５１ビット深度差算出部，２５２ビットシフト制御部，２６１選択部，２６２右シフト部，２６３左シフト部，２６４重み係数乗算部，２６５右シフト部，２６６および２６７演算部，３１１制御部，３１２予測部，３２１ビット深度差算出部，３２２ビットシフト制御部，３５１制御部，３５２復元部，３６１ビット深度差算出部，３６２ビットシフト制御部，４１１制御部，４１２予測部，４２１ビット深度差算出部，４２２ビットシフト制御部，４５１制御部，４５２復元部，４６１ビット深度差算出部，４６２ビットシフト制御部，５０１ VUI処理部，５１１制御部，５１２予測部，５２１ビット深度差算出部，５２２ビットシフト制御部，５２３色空間判定部，５４１ VUI取得部，５５１制御部，５６１ビット深度差算出部，５６２ビットシフト制御部，５６３色空間判定部

Claims

複数コンポーネントからなる入力画像と予測画像との残差データに対して前記コンポーネント間で予測を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記予測を行う残差予測部と、
前記残差予測部による前記予測により生成された予測残差データを符号化する符号化部と
を備える画像処理装置。
前記残差予測部は、ビットシフトによって前記残差データの前記ビット深度を揃える
請求項１に記載の画像処理装置。
前記残差予測部は、前記予測を行う前記２つのコンポーネント間の前記ビット深度の差が０でない場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記予測を行う
請求項２に記載の画像処理装置。
前記残差予測部は、前記ビット深度の差が正の場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記予測を行い、前記ビット深度の差が負の場合、前記予測を省略する
請求項３に記載の画像処理装置。
前記残差予測部は、前記入力画像の色空間がRGB空間でない場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記予測を行い、前記入力画像の色空間がRGB空間の場合、前記予測を省略する
請求項２に記載の画像処理装置。
前記入力画像の色空間がYUV空間であり、
前記残差予測部は、輝度成分と色差成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記予測を行う
請求項２に記載の画像処理装置。
前記入力画像の色空間がRGB空間であり、
前記残差予測部は、G成分とR成分若しくはB成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記予測を行う
請求項２に記載の画像処理装置。
前記残差予測部は、前記予測を行う２つのコンポーネント間の前記ビット深度の差を求め、前記２つのコンポーネントの内の一方のコンポーネントの前記残差データに対して前記ビット深度の差に応じた前記ビットシフトを行い、前記ビットシフトされた前記残差データに所定の重み係数を乗算し、その乗算結果に対して所定のビット数分のビットシフトを行い、他方のコンポーネントの前記残差データと前記ビットシフトされた前記乗算結果との差分を求めることにより、前記予測を行う
請求項２に記載の画像処理装置。
前記残差予測部は、複数のコンポーネントで共通の前記重み係数を設定する
請求項８に記載の画像処理装置。
複数コンポーネントからなる入力画像と予測画像との残差データに対して前記コンポーネント間で予測を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記予測を行い、
前記予測により生成された予測残差データを符号化する
画像処理方法。
複数コンポーネントからなる画像とその予測画像との残差データの前記コンポーネント間の予測結果である予測残差データが符号化された符号化データを復号する復号部と、
前記復号部により前記符号化データが復号されて得られた前記予測残差データを用いて前記残差データの復元を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記復元を行う残差復元部と
を備える画像処理装置。
前記残差復元部は、ビットシフトによって前記残差データの前記ビット深度を揃える
請求項１１に記載の画像処理装置。
前記ビット深度に関する情報を受け取る受け取り部をさらに備え、
前記残差復元部は、前記受け取り部により受け取られた前記ビット深度に関する情報に基づいて、前記予測を行う前記２つのコンポーネント間の前記ビット深度の差を求め、求めた前記ビット深度の差に基づいて前記ビットシフトを行うことにより、前記残差データの前記ビット深度を揃える
請求項１２に記載の画像処理装置。
前記残差復元部は、求めた前記ビット深度の差が０でない場合、前記ビットシフトによって前記残差データの前記ビット深度を揃える
請求項１３に記載の画像処理装置。
前記残差復元部は、求めた前記ビット深度の差が正の場合、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記復元を行い、求めた前記ビット深度の差が負の場合、前記復元を省略する
請求項１３に記載の画像処理装置。
前記受け取り部は、前記画像の色空間に関する情報をさらに受け取り、
前記残差復元部は、前記受け取り部により受け取られた前記画像の色空間に関する情報に基づいて、前記画像の色空間がRGB空間でない場合、前記ビットシフトによって前記残差データの前記ビット深度をコンポーネント間で揃えて前記復元を行い、前記画像の色空間がRGB空間の場合、前記復元を省略する
請求項１３に記載の画像処理装置。
前記画像の色空間がYUV空間であり、
前記残差復元部は、輝度成分と色差成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記復元を行う
請求項１２に記載の画像処理装置。
前記画像の色空間がRGB空間であり、
前記残差復元部は、G成分とR成分若しくはB成分との間で、前記ビットシフトによって前記残差データの前記ビット深度を揃えて前記復元を行う
請求項１２に記載の画像処理装置。
前記残差復元部は、前記復元を行う２つのコンポーネント間の前記ビット深度の差を求め、前記２つのコンポーネントの内の一方のコンポーネントの復元済みの前記残差データに対して前記ビット深度の差に応じた前記ビットシフトを行い、前記ビットシフトされた前記残差データに所定の重み係数を乗算し、その乗算結果に対して所定のビット数分のビットシフトを行い、前記ビットシフトされた前記乗算結果と前記予測残差データとを加算することにより、他方のコンポーネントの前記残差データの前記復元を行う
請求項１２に記載の画像処理装置。
複数コンポーネントからなる画像とその予測画像との残差データの前記コンポーネント間の予測結果である予測残差データが符号化された符号化データを復号し、
前記符号化データが復号されて得られた前記予測残差データを用いて前記残差データの復元を行う際に、前記残差データのビット深度を前記コンポーネント間で揃えて前記復元を行う
画像処理方法。