JPWO2013164922A1

JPWO2013164922A1 - 画像処理装置及び画像処理方法

Info

Publication number: JPWO2013164922A1
Application number: JP2014513342A
Authority: JP
Inventors: 佐藤　数史; 数史佐藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2012-05-02
Filing date: 2013-03-05
Publication date: 2015-12-24
Also published as: US20150036744A1; WO2013164922A1; CN104255028A

Abstract

【課題】色差成分のイントラ予測のためのＬＭモードの予測精度を高めること。【解決手段】スケーラブル復号される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成するエンハンスメントレイヤ予測部、を備える画像処理装置を提供する。【選択図】図１１

Description

本開示は、画像処理装置及び画像処理方法に関する。

現在、Ｈ．２６４／ＡＶＣよりも符号化効率をさらに向上することを目的として、ＩＴＵ−ＴとＩＳＯ／ＩＥＣとの共同の標準化団体であるＪＣＴＶＣ（Joint Collaboration Team-Video Coding）により、ＨＥＶＣ（High Efficiency Video Coding）と呼ばれる画像符号化方式の標準化が進められている。ＨＥＶＣ規格については、２０１２年２月に最初のドラフト版の仕様であるＣｏｍｍｉｔｔｅｅｄｒａｆｔが発行されている（例えば、下記非特許文献１参照）。

ＨＥＶＣに代表される画像符号化方式において重要な技術の１つは、画面内予測、即ちイントラ予測である。イントラ予測は、画像の様々な相関特性を利用し、あるブロック内の画素値を他のブロックの画素値から予測することで、符号化される情報量を削減する技術である。イントラ予測に際しては、通常、予測対象のブロックの画素値を予測するために最適な予測モードが、複数の予測モードから選択される。例えば、ＨＥＶＣでは、平均値予測（DC Prediction）、角度予測（Angular Prediction）及び平面予測（Planar Prediction）などの様々な予測モードが選択可能である。また、色差成分のイントラ予測に関しては、動的に構築される輝度成分の線型関数を予測関数として用いて色差成分の画素値を予測する、線型モデル（ＬＭ：Linear Model）モードと呼ばれる追加的な予測モードもまた提案されている（下記非特許文献２参照）。

スケーラブル符号化（ＳＶＣ（Scalable Video Coding）ともいう）もまた、将来の画像符号化方式において重要な技術の１つである。スケーラブル符号化とは、粗い画像信号を伝送するレイヤと精細な画像信号を伝送するレイヤとを階層的に符号化する技術をいう。スケーラブル符号化において階層化される典型的な属性は、主に次の３種類である。
−空間スケーラビリティ：空間解像度あるいは画像サイズが階層化される。
−時間スケーラビリティ：フレームレートが階層化される。
−ＳＮＲ（Signal to Noise Ratio）スケーラビリティ：ＳＮ比が階層化される。
さらに、標準規格で未だ採用されていないものの、ビット深度スケーラビリティ及びクロマフォーマットスケーラビリティもまた議論されている。また、スケーラブル符号化におけるベースレイヤを旧来の画像符号化方式で符号化し、エンハンスメントレイヤをＨＥＶＣで符号化することも提案されている（下記非特許文献３参照）。

Benjamin Bross, Woo-Jin Han, Jens-Rainer Ohm, Gary J. Sullivan, Thomas Wiegand, "High efficiency video coding (HEVC) text specification draft 6"（JCTVC-H1003 ver20, 2012年2月17日） Jianle Chen， et al. "CE6.a.4: Chroma intra prediction by reconstructed luma samples"（JCTVC-E266，2011年3月） Ajay Luthra, Jens-Rainer Ohm, Joern Ostermann, "Draft requirements for the scalable enhancement of HEVC"（ISO/IEC JTC1/SC29/WG11 N12400，2011年11月）

上記非特許文献２により提案されているＬＭモードにおいて、予測関数の係数は、予測対象のブロックに隣接する隣接ブロックの輝度成分及び色差成分の画素値を用いて算出される。そのため、予測対象のブロックにおける色成分の間の相関が隣接ブロックにおける相関と異なる場合には、良好な予測精度を有する予測関数が構築されない。結果として、ＬＭモードは、予測対象のブロックと隣接ブロックとの間で色成分の間の相関が十分に類似するケースにおいてのみ有益であった。

通常、シングルレイヤの（あるいはシングルビューの）画像符号化方式では、あるブロックの色差成分を予測する際に、当該色差成分の実際の画素値は当然ながら未知である。しかし、マルチレイヤの（あるいはマルチビューの）画像符号化方式では、あるブロックの色差成分を予測する際に、他のレイヤの対応するブロックの色差成分の実際の画素値が既に復号されているケースがあり得る。

本明細書では、上述した点に着目し、主にスケーラブル符号化における色差成分のイントラ予測のためのＬＭモードの予測精度を向上させる技術を提案する。

本開示によれば、スケーラブル復号される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成するエンハンスメントレイヤ予測部、を備える画像処理装置が提供される。

上記画像処理装置は、典型的には、画像を復号する画像復号装置として実現され得る。

また、本開示によれば、スケーラブル復号される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成すること、を含む画像処理方法が提供される。

また、本開示によれば、スケーラブル符号化される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成するエンハンスメントレイヤ予測部、を備える画像処理装置が提供される。

上記画像処理装置は、典型的には、画像を符号化する画像符号化装置として実現され得る。

また、本開示によれば、スケーラブル符号化される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成すること、を含む画像処理方法が提供される。

本開示に係る技術によれば、色差成分のイントラ予測のためのＬＭモードの予測精度を高めることができる。

スケーラブル符号化について説明するための説明図である。既存のＬＭモードについて説明するための説明図である。本開示において提案される新たなＬＭモードについて説明するための説明図である。一実施形態に係る画像符号化装置の概略的な構成を示すブロック図である。一実施形態に係る画像復号装置の概略的な構成を示すブロック図である。図４に示した第１符号化部及び第２符号化部の構成の一例を示すブロック図である。図６に示したイントラ予測部の詳細な構成の一例を示すブロック図である。参照画素の間引きの一例について説明するための説明図である。一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。図９に示したエンハンスメントレイヤのイントラ予測処理の詳細な流れの一例を示すフローチャートである。図５に示した第１復号部及び第２復号部の構成の一例を示すブロック図である。図１１に示したイントラ予測部の詳細な構成の一例を示すブロック図である。一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。図１３に示したエンハンスメントレイヤのイントラ予測処理の詳細な流れの一例を示すフローチャートである。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。スケーラブル符号化の用途の第１の例について説明するための説明図である。スケーラブル符号化の用途の第２の例について説明するための説明図である。スケーラブル符号化の用途の第３の例について説明するための説明図である。マルチビューコーデックについて説明するための説明図である。マルチビューコーデックのための画像符号化装置の概略的な構成を示すブロック図である。マルチビューコーデックのための画像復号装置の概略的な構成を示すブロック図である。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

また、以下の順序で説明を行う。
１．概要
１−１．スケーラブル符号化
１−２．既存のＬＭモード
１−３．新たなＬＭモード
１−４．エンコーダの基本的な構成例
１−５．デコーダの基本的な構成例
２．一実施形態に係る符号化部の構成例
２−１．全体的な構成
２−２．イントラ予測部の詳細な構成
３．一実施形態に係る符号化時の処理の流れ
４．一実施形態に係る復号部の構成例
４−１．全体的な構成
４−２．イントラ予測部の詳細な構成
５．一実施形態に係る復号時の処理の流れ
６．応用例
６−１．様々な製品への応用
６−２．スケーラブル符号化の様々な用途
６−３．その他
７．まとめ

＜１．概要＞
［１−１．スケーラブル符号化］
スケーラブル符号化においては、一連の画像をそれぞれ含む複数のレイヤが符号化される。ベースレイヤ（base layer）は、最初に符号化される、最も粗い画像を表現するレイヤである。ベースレイヤの符号化ストリームは、他のレイヤの符号化ストリームを復号することなく、独立して復号され得る。ベースレイヤ以外のレイヤは、エンハンスメントレイヤ（enhancement layer）と呼ばれる、より精細な画像を表現するレイヤである。エンハンスメントレイヤの符号化ストリームは、ベースレイヤの符号化ストリームに含まれる情報を用いて符号化される。従って、エンハンスメントレイヤの画像を再現するためには、ベースレイヤ及びエンハンスメントレイヤの双方の符号化ストリームが復号されることになる。スケーラブル符号化において扱われるレイヤの数は、２つ以上のいかなる数であってもよい。３つ以上のレイヤが符号化される場合には、最下位のレイヤがベースレイヤ、残りの複数のレイヤがエンハンスメントレイヤである。より上位のエンハンスメントレイヤの符号化ストリームは、より下位のエンハンスメントレイヤ又はベースレイヤの符号化ストリームに含まれる情報を用いて符号化され及び復号され得る。本明細書では、依存関係を有する少なくとも２つのレイヤのうち、依存される側のレイヤを下位レイヤ（lower layer）、依存する側のレイヤを上位レイヤ（upper layer）という。

図１は、スケーラブル符号化される３つのレイヤＬ１、Ｌ２及びＬ３を示している。レイヤＬ１はベースレイヤであり、レイヤＬ２及びＬ３はエンハンスメントレイヤである。なお、ここでは、様々な種類のスケーラビリティのうち、空間スケーラビリティを例にとっている。レイヤＬ２のレイヤＬ１に対する空間解像度の比は、２：１である。レイヤＬ３のレイヤＬ１に対する空間解像度の比は、４：１である。なお、スケーラビリティ比は、かかる例に限定されない。例えば、１．５：１という非整数のスケーラビリティ比もまた採用され得る。レイヤＬ１のブロックＢ１は、ベースレイヤのピクチャ内の予測ブロックである。レイヤＬ２のブロックＢ２は、ブロックＢ１と共通するシーンを映したエンハンスメントレイヤのピクチャ内の予測ブロックである。ブロックＢ２は、レイヤＬ１のブロックＢ１に対応する。レイヤＬ３のブロックＢ３は、ブロックＢ１及びＢ２と共通するシーンを映したより上位のエンハンスメントレイヤのピクチャ内の予測ブロックである。ブロックＢ３は、レイヤＬ１のブロックＢ１及びレイヤＬ２のブロックＢ２に対応する。

このようなレイヤ構造において、あるレイヤの画像の相関特性は、通常、共通するシーンに対応する他のレイヤの画像の相関特性と類似する。相関特性とは、空間的相関、時間的相関、及び色成分間の相関を含み得る。例えば、空間的相関を例にとると、レイヤＬ１においてブロックＢ１がある方向の隣接ブロックとの間の強い相関を有する場合、レイヤＬ２においてブロックＢ２が同じ方向の隣接ブロックとの間で強い相関を有し、レイヤＬ３においてブロックＢ３がやはり同じ方向の隣接ブロックとの間で強い相関を有する可能性が高い。従って、例えばベースレイヤ内のあるブロックについて特定の予測モードが最適であると判定された場合、エンハンスメントレイヤ内の対応するブロックについても同じ予測モードが最適である可能性が高い。この傾向は、予測モード情報のレイヤ間の再利用の動機付けとなり得る。なお、レイヤ間で画像の相関特性が類似するという点は、図１に例示した空間スケーラビリティのみならず、ＳＮＲスケーラビリティ、ビット深度スケーラビリティ及びクロマフォーマットスケーラビリティにおいても同様である。

ここで、上記非特許文献２により提案されているＬＭモード（輝度ベース色差予測モードともいう）は、輝度成分と色差成分との間の相関を利用することにより、輝度成分の画素値から色差成分の画素値を予測しようとする予測モードである。予測は、隣接ブロックの輝度成分及び色差成分の画素値を用いて算出される係数を有する予測関数を用いて行われる。しかし、予測ブロックと隣接ブロックとの間で、色成分間の相関は必ずしも類似しない。そして、色成分間の相関が類似しない場合には、隣接ブロックの画素値に基づいて構築される予測関数は、もはや予測ブロックの色差成分の画素値を予測するための良好な予測精度を有しない。このような理由から、ＬＭモードは、比較的限られたケースにおいてのみ有益であった。

しかし、図１を用いて説明したようなマルチレイヤの（あるいはマルチビューの）画像符号化方式では、例えばエンハンスメントレイヤ内の予測ブロックについてイントラ予測を実行しようとする場合に、下位レイヤ内の対応ブロックは既に符号化され又は復号されている。そして、予測ブロックと隣接ブロックとの間で色成分間の相関が類似しない場合であっても、当該予測ブロックと下位レイヤ内の対応ブロックとの間では色成分間の相関は同等であるか少なくとも類似する。従って、エンハンスメントレイヤでは、ＬＭモードの予測関数を、隣接ブロックの代わりに下位レイヤ内の対応ブロックの画素値に基づいて構築することで、既存のＬＭモードよりも高い予測精度を達成できると期待される。そこで、本開示に係る技術では、スケーラブル符号化における色差成分のイントラ予測のＬＭモードを改良し、既存の手法よりも向上された予測精度を実現する。

［１−２．既存のＬＭモード］
ＨＥＶＣの標準化作業において提案されているＬＭモード（輝度ベース色差予測モード）では、動的に計算される係数を有する線型関数が予測関数として用いられる。予測関数の引数は（必要に応じてダウンサンプリングされる）輝度成分の値であり、戻り値は色差成分の予測画素値である。より具体的には、ＬＭモードにおける予測関数は、次のような線型一次関数であってよい：

式（１）において、Ｒｅ_Ｌ´（ｘ，ｙ）は、復号画像（いわゆるリコンストラクト画像）の輝度成分のダウンサンプリングされた値を表す。輝度成分のダウンサンプリング（あるいは位相シフト）は、クロマフォーマットに依存して色差成分の密度が輝度成分の密度と異なる場合に行われ得る。α及びβは、所定の計算式を用いて隣接ブロックの画素値から計算される係数である。

例えば、図２を参照すると、クロマフォーマットが４：２：０である場合の、１６×１６画素のサイズを有する輝度成分（Ｌｕｍａ）の予測ブロック及び対応する色差成分（Ｃｈｒｏｍａ）の予測ブロックが概念的に示されている。輝度成分の密度は、水平方向及び垂直方向の各々について色差成分の密度の２倍である。各予測ブロックの周囲に位置し、図中で塗りつぶされている丸印は、上記予測関数の係数α、βを算出する際に参照される、隣接ブロック内の参照画素である。図中右において斜線で網掛けされている丸印は、処理対象の予測ブロック内の、ダウンサンプリングされた輝度成分である。このようにダウンサンプリングされた輝度成分の値を上記予測関数の右辺のＲｅ_Ｌ´（ｘ，ｙ）に代入することにより、共通する画素位置の色差成分の予測値が算出される。クロマフォーマットが４：２：０である場合、図２の例のように、２×２個の輝度成分ごとに１つの輝度成分の入力値（予測関数へ代入される値）がダウンサンプリングにより生成される。参照画素も同様にダウンサンプリングされ得る。

予測関数の係数α及びβは、それぞれ次の式（２）及び式（３）に従って算出される。なお、Ｉは参照画素数を表す。

本開示に係る技術では、ＬＭモードの予測関数を構築するためのこのような隣接ブロックに依存する手法を、特にエンハンスメントレイヤにおいて、次に説明するように、隣接ブロックではなく下位レイヤ内の対応ブロックに依存する手法に改良する。

［１−３．新たなＬＭモード］
図３の例では、説明を簡明にするために、クロマフォーマットが４：４：４であって、ベースレイヤ内の予測ブロックのサイズは４×４画素、エンハンスメントレイヤ内の予測ブロックのサイズは８×８画素であるものとする。図３には、ベースレイヤ内の輝度成分の予測ブロックＢ_ｂ１及び色差成分の予測ブロックＢ_ｂ２、並びに、エンハンスメントレイヤ内の輝度成分の予測ブロックＢ_ｈ１及び色差成分の予測ブロックＢ_ｈ２が示されている。これら予測ブロックの画像内の位置は、互いに対応する（即ち、これら予測ブロックは画像内で共通する位置に存在する）。ベースレイヤ内の色差成分の予測ブロックＢ_ｂ２にＬＭモードが適用される場合には、予測ブロックＢ_ｂ１及びＢ_ｂ２の隣接ブロックの画素値を上記式（２）及び式（３）に代入することにより算出される係数α_１、β_１を用いて、ＬＭモードの予測関数が構築される。これに対し、本開示に係る技術において、エンハンスメントレイヤ内の色差成分の予測ブロックＢ_ｈ２にＬＭモードが適用される場合には、下位レイヤ内の対応ブロックＢ_ｂ１及びＢ_ｂ２の画素値が上記式（２）及び式（３）に代入される。そして、これら対応ブロックの画素値に基づいて算出される係数α_２、β_２を用いて、エンハンスメントレイヤのための予測関数が構築される。

このように改良されるエンハンスメントレイヤのためのＬＭモードは、既存のＬＭモードと比較して、より高い予測精度を実現することができる。それに加えて、例えばベースレイヤにおいてＬＭモード以外の予測モード（ＤＣ予測、平面予測又は角度予測など）が符号化効率の観点で最適な場合であっても、エンハンスメントレイヤにおいては上述した改良されたＬＭモードがさらに高い符号化効率を達成できる余地が生じる。なぜならば、ベースレイヤでのＬＭモードが予測ブロックとは位置の異なる隣接ブロックの色成分間の相関に基づくのに対し、エンハンスメントレイヤでのＬＭモードは、共通する位置の対応ブロックの色成分間の相関に基づくからである。従って、ここで説明した新たなＬＭモードをエンハンスメントレイヤにおいて少なくとも探索の候補として採用することは、ベースレイヤにおいてどの予測モードが最適であると判定されたかに関わらず有益である。

［１−４．エンコーダの基本的な構成例］
図４は、スケーラブル符号化をサポートする、一実施形態に係る画像符号化装置１０の概略的な構成を示すブロック図である。図４を参照すると、画像符号化装置１０は、第１符号化部１ａ、第２符号化部１ｂ、共通メモリ２及び多重化部３を備える。

第１符号化部１ａは、ベースレイヤ画像を符号化し、ベースレイヤの符号化ストリームを生成する。第２符号化部１ｂは、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤの符号化ストリームを生成する。共通メモリ２は、レイヤ間で共通的に利用される情報を記憶する。多重化部３は、第１符号化部１ａにより生成されるベースレイヤの符号化ストリームと、第２符号化部１ｂにより生成される１つ以上のエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

［１−５．デコーダの基本的な構成例］
図５は、スケーラブル符号化をサポートする、一実施形態に係る画像復号装置６０の概略的な構成を示すブロック図である。図５を参照すると、画像復号装置６０は、逆多重化部５、第１復号部６ａ、第２復号部６ｂ及び共通メモリ７を備える。

逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及び１つ以上のエンハンスメントレイヤの符号化ストリームに逆多重化する。第１復号部６ａは、ベースレイヤの符号化ストリームからベースレイヤ画像を復号する。第２復号部６ｂは、エンハンスメントレイヤの符号化ストリームからエンハンスメントレイヤ画像を復号する。共通メモリ７は、レイヤ間で共通的に利用される情報を記憶する。

図４に例示した画像符号化装置１０において、ベースレイヤの符号化のための第１符号化部１ａの構成と、エンハンスメントレイヤの符号化のための第２符号化部１ｂの構成とは、互いに類似する。第１符号化部１ａにより生成され又は取得されるいくつかのパラメータは、共通メモリ２を用いてバッファリングされ、第２符号化部１ｂにより再利用される。次節では、そのような第１符号化部１ａ及び第２符号化部１ｂの構成について詳細に説明する。

同様に、図５に例示した画像復号装置６０において、ベースレイヤの復号のための第１復号部６ａの構成と、エンハンスメントレイヤの復号のための第２復号部６ｂの構成とは、互いに類似する。第１復号部６ａにより生成され又は取得されるいくつかのパラメータは、共通メモリ７を用いてバッファリングされ、第２復号部６ｂにより再利用される。さらに次の節では、そのような第１復号部６ａ及び第２復号部６ｂの構成について詳細に説明する。

＜２．一実施形態に係る符号化部の構成例＞
［２−１．全体的な構成］
図６は、図４に示した第１符号化部１ａ及び第２符号化部１ｂの構成の一例を示すブロック図である。図６を参照すると、第１符号化部１ａは、並び替えバッファ１２、減算部１３、直交変換部１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、レート制御部１８、逆量子化部２１、逆直交変換部２２、加算部２３、デブロックフィルタ２４、フレームメモリ２５、セレクタ２６及び２７、動き探索部３０、並びにイントラ予測部４０ａを備える。第２符号化部１ｂは、イントラ予測部４０ａの代わりに、イントラ予測部４０ｂを備える。

並び替えバッファ１２は、一連の画像データに含まれる画像を並び替える。並び替えバッファ１２は、符号化処理に係るＧＯＰ（Group of Pictures）構造に応じて画像を並び替えた後、並び替え後の画像データを減算部１３、動き探索部３０及びイントラ予測部４０ａ又は４０ｂへ出力する。

減算部１３には、並び替えバッファ１２から入力される画像データ、及び後に説明する動き探索部３０又はイントラ予測部４０ａ若しくは４０ｂから入力される予測画像データが供給される。減算部１３は、並び替えバッファ１２から入力される画像データと予測画像データとの差分である予測誤差データを算出し、算出した予測誤差データを直交変換部１４へ出力する。

直交変換部１４は、減算部１３から入力される予測誤差データについて直交変換を行う。直交変換部１４により実行される直交変換は、例えば、離散コサイン変換（Discrete Cosine Transform：ＤＣＴ）又はカルーネン・レーベ変換などであってよい。直交変換部１４は、直交変換処理により取得される変換係数データを量子化部１５へ出力する。

量子化部１５には、直交変換部１４から入力される変換係数データ、及び後に説明するレート制御部１８からのレート制御信号が供給される。量子化部１５は、変換係数データを量子化し、量子化後の変換係数データ（以下、量子化データという）を可逆符号化部１６及び逆量子化部２１へ出力する。また、量子化部１５は、レート制御部１８からのレート制御信号に基づいて量子化パラメータ（量子化スケール）を切り替えることにより、量子化データのビットレートを変化させる。

可逆符号化部１６は、量子化部１５から入力される各レイヤの量子化データについて可逆符号化処理を行うことにより、各レイヤの符号化ストリームを生成する。また、可逆符号化部１６は、セレクタ２７から入力されるイントラ予測に関する情報又はインター予測に関する情報を符号化して、符号化パラメータを符号化ストリームのヘッダ領域内に多重化する。そして、可逆符号化部１６は、生成した符号化ストリームを蓄積バッファ１７へ出力する。

蓄積バッファ１７は、可逆符号化部１６から入力される符号化ストリームを半導体メモリなどの記憶媒体を用いて一時的に蓄積する。そして、蓄積バッファ１７は、蓄積した符号化ストリームを、伝送路の帯域に応じたレートで、図示しない伝送部（例えば、通信インタフェース又は周辺機器との接続インタフェースなど）へ出力する。

レート制御部１８は、蓄積バッファ１７の空き容量を監視する。そして、レート制御部１８は、蓄積バッファ１７の空き容量に応じてレート制御信号を生成し、生成したレート制御信号を量子化部１５へ出力する。例えば、レート制御部１８は、蓄積バッファ１７の空き容量が少ない時には、量子化データのビットレートを低下させるためのレート制御信号を生成する。また、例えば、レート制御部１８は、蓄積バッファ１７の空き容量が十分大きい時には、量子化データのビットレートを高めるためのレート制御信号を生成する。

逆量子化部２１は、量子化部１５から入力される量子化データについて逆量子化処理を行う。そして、逆量子化部２１は、逆量子化処理により取得される変換係数データを、逆直交変換部２２へ出力する。

逆直交変換部２２は、逆量子化部２１から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを復元する。そして、逆直交変換部２２は、復元した予測誤差データを加算部２３へ出力する。

加算部２３は、逆直交変換部２２から入力される復元された予測誤差データと動き探索部３０又はイントラ予測部４０ａ若しくは４０ｂから入力される予測画像データとを加算することにより、復号画像データ（いわゆるリコンストラクト画像）を生成する。そして、加算部２３は、生成した復号画像データをデブロックフィルタ２４及びフレームメモリ２５へ出力する。

デブロックフィルタ２４は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタリング処理を行う。デブロックフィルタ２４は、加算部２３から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データをフレームメモリ２５へ出力する。

フレームメモリ２５は、加算部２３から入力される復号画像データ、及びデブロックフィルタ２４から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。

セレクタ２６は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとして動き探索部３０に供給する。また、セレクタ２６は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部４０ａ又は４０ｂに供給する。

セレクタ２７は、インター予測モードにおいて、動き探索部３０から出力されるインター予測の結果としての予測画像データを減算部１３へ出力すると共に、インター予測に関する情報を可逆符号化部１６へ出力する。また、セレクタ２７は、イントラ予測モードにおいて、イントラ予測部４０ａ又は４０ｂから出力されるイントラ予測の結果としての予測画像データを減算部１３へ出力すると共に、イントラ予測に関する情報を可逆符号化部１６へ出力する。セレクタ２７は、インター予測モードとイントラ予測モードとを、動き探索部３０及びイントラ予測部４０ａ又は４０ｂから出力されるコスト関数値の大きさに応じて切り替える。

動き探索部３０は、並び替えバッファ１２から入力される符号化対象の画像データ（原画像データ）、及びセレクタ２６を介して供給される復号画像データに基づいて、インター予測処理（フレーム間予測処理）を行う。例えば、動き探索部３０は、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、動き探索部３０は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、動き探索部３０は、当該最適な予測モードに従って予測画像データを生成する。そして、動き探索部３０は、選択した最適な予測モードを示す予測モード情報及び参照画像情報を含むインター予測に関する情報、コスト関数値、並びに予測画像データを、セレクタ２７へ出力する。

イントラ予測部４０ａは、ベースレイヤの原画像データ及び復号画像データに基づいて、予測ブロックごとにイントラ予測処理を行う。例えば、イントラ予測部４０ａは、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、イントラ予測部４０ａは、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、イントラ予測部４０ａは、当該最適な予測モードに従ってベースレイヤの予測画像データを生成する。そして、イントラ予測部４０ａは、選択した最適な予測モードを示す予測モード情報を含むイントラ予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。また、イントラ予測部４０ａは、イントラ予測に関する少なくとも一部のパラメータを、共通メモリ２によりバッファリングさせる。

イントラ予測部４０ｂは、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、予測ブロックごとにイントラ予測処理を行う。例えば、イントラ予測部４０ｂは、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、イントラ予測部４０ｂは、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、イントラ予測部４０ｂは、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。そして、イントラ予測部４０ｂは、選択した最適な予測モードを示す予測モード情報を含むイントラ予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。エンハンスメントレイヤにおいて探索される予測モードの候補は、上述したように改良される新たなＬＭモードを含み得る。イントラ予測部４０ｂは、ある予測ブロックへの新たなＬＭモードの適用に際して、共通メモリ２によりバッファリングされ得る下位レイヤ内の対応する位置の輝度成分及び色差成分の画素値を参照する。イントラ予測部４０ｂは、共通メモリ２により追加的にバッファリングされ得る下位レイヤの予測モード情報に基づいて、エンハンスメントレイヤにおいて探索される予測モードの候補を絞り込んでもよい。予測モードの候補が１つしか残らない場合には、当該１つの予測モードが最適な予測モードとして選択されてよい。

第１符号化部１ａは、ここで説明した一連の符号化処理を、ベースレイヤの一連の画像データについて実行する。第２符号化部１ｂは、ここで説明した一連の符号化処理を、エンハンスメントレイヤの一連の画像データについて実行する。エンハンスメントレイヤが複数存在する場合には、エンハンスメントレイヤの符号化処理は、エンハンスメントレイヤの数だけ繰り返され得る。ベースレイヤの符号化処理と、エンハンスメントレイヤの符号化処理とは、例えば、何らかのブロックごとに同期して実行されてもよい。

なお、本明細書では、ベースレイヤ及びエンハンスメントレイヤの双方がＨＥＶＣに従って符号化され及び復号される例を主に説明する。本明細書における予測ブロックは、ＨＥＶＣにおいて予測処理の処理単位を意味する予測単位（ＰＵ：Prediction Unit）に相当する。但し、本開示に係る技術は、少なくとも１つのレイヤがＭＰＥＧ２又はＡＶＣなどの他の種類の画像符号化方式に従って符号化され及び復号されるケースにも適用可能である。例えば、ベースレイヤは、ＬＭモードをサポートしない画像符号化方式に従って符号化され及び復号されてもよい。また、本開示に係る技術は、マルチレイヤではなくマルチビューの画像符号化方式にも適用可能である。

［２−２．イントラ予測部の詳細な構成］
図７は、図６に示したイントラ予測部４０ａ及び４０ｂの詳細な構成の一例を示すブロック図である。図７を参照すると、イントラ予測部４０ａは、予測制御部４１ａ、係数算出部４２ａ、フィルタ４４ａ、予測部４５ａ及びモード判定部４６ａを有する。イントラ予測部４０ｂは、予測制御部４１ｂ、係数算出部４２ｂ、フィルタ４４ｂ、予測部４５ｂ及びモード判定部４６ｂを有する。

（１）ベースレイヤのイントラ予測処理
イントラ予測部４０ａの予測制御部４１ａは、ベースレイヤのイントラ予測処理を制御する。例えば、予測制御部４１ａは、各予測ブロックについて、輝度成分についてのイントラ予測処理及び色差成分についてのイントラ予測処理を実行する。各色成分についてのイントラ予測処理において、予測制御部４１ａは、複数の予測モードで予測部４５ａに各予測ブロックの予測画像を生成させ、モード判定部４６ａに最適な予測モードを判定させる。ベースレイヤがＨＥＶＣに従って符号化される場合には、色差成分の予測モードの候補（以下、候補モードという）は、ＬＭモードを含む。ベースレイヤにおけるＬＭモードは、図２を用いて説明した既存のＬＭモードである。

係数算出部４２ａは、ＬＭモードにおいて予測部４５ａにより使用される予測関数の係数を、上述した式（２）及び式（３）に隣接ブロックの画素値を代入することにより算出する。フィルタ４４ａは、フレームメモリ２５から入力される予測ブロックの輝度成分の画素値をクロマフォーマットに応じてダウンサンプリング（位相シフト）することにより、ＬＭモードの予測関数への入力値を生成する。

予測部４５ａは、予測制御部４１ａによる制御の下、各色成分（即ち、輝度成分及び色差成分の各々）について、様々な候補モードに従って、各予測ブロックの予測画像を生成する。候補モードがＬＭモードである場合には、予測部４５ａは、フィルタ４４ａにより生成される輝度成分の入力値を、係数算出部４２ａにより算出される係数を有する予測関数に代入することにより、各色差成分の値を予測する。他の候補モードでの予測画像の生成もまた、既存の手法と同様に行われてよい。予測部４５ａは、予測モードごとに、予測の結果として生成される予測画像データをモード判定部４６ａへ出力する。

モード判定部４６ａは、並び替えバッファ１２から入力される原画像データと予測部４５ａから入力される予測画像データとに基づいて、各予測モードのコスト関数値を算出する。そして、モード判定部４６ａは、算出したコスト関数値に基づき、各色成分についての最適な予測モードを選択する。そして、モード判定部４６ａは、選択した最適な予測モードを示す予測モード情報を含むイントラ予測に関する情報、コスト関数値、並びに各色成分の予測画像データを、セレクタ２７へ出力する。

また、共通メモリ２は、フレームメモリ２５から入力される、デブロックフィルタ適用前の復号画像データを記憶する。当該復号画像データは、輝度成分及び色差成分の画素値を含む。共通メモリ２により記憶される復号画像データは、上位レイヤにおいて新たなＬＭモードのための予測関数の係数を算出する際に、イントラ予測部４０ｂにより参照される。また、モード判定部４６ａは、予測ブロックごとの最適な予測モードを示す予測モード情報を、共通メモリ２に記憶させてもよい。当該予測モード情報は、上位レイヤにおいて候補モードを絞り込むために利用され得る。

（２）エンハンスメントレイヤのイントラ予測処理
イントラ予測部４０ｂの予測制御部４１ｂは、エンハンスメントレイヤのイントラ予測処理を制御する。例えば、予測制御部４１ｂは、予測ブロックごとに、輝度成分についてのイントラ予測処理及び色差成分についてのイントラ予測処理を実行する。各色成分についてのイントラ予測処理において、予測制御部４１ｂは、１つ以上の予測モードで予測部４５ｂに各予測ブロックの予測画像を生成させ、モード判定部４６ｂに最適な予測モードを判定させる。色差成分の候補モードには、図３を用いて説明した新たなＬＭモードが含まれる。

係数算出部４２ｂは、予測ブロックに対応する位置の下位レイヤの輝度成分及び色差成分の画素値を、共通メモリ２から取得する。そして、係数算出部４２ｂは、共通メモリ２から取得した画素値を上述した式（２）及び式（３）に代入することにより、新たなＬＭモードのための予測関数の係数を算出する。フィルタ４４ｂは、フレームメモリ２５から入力される予測ブロックの輝度成分の画素値をクロマフォーマットに応じてダウンサンプリング（位相シフト）することにより、予測関数への入力値を生成する。

予測部４５ｂは、予測制御部４１ｂによる制御の下、各色成分（即ち、輝度成分及び色差成分の各々）について、様々な候補モードに従って、各予測ブロックの予測画像を生成する。候補モードがＬＭモードである場合には、予測部４５ｂは、フィルタ４４ｂにより生成される輝度成分の入力値を、係数算出部４２ｂにより算出される係数を有する予測関数に代入することにより、各色差成分の値を予測する。他の候補モードでの予測画像の生成は、既存の手法と同様に行われてよい。予測部４５ｂは、予測モードごとに、予測の結果として生成される予測画像データをモード判定部４６ｂへ出力する。

モード判定部４６ｂは、並び替えバッファ１２から入力される原画像データと予測部４５ｂから入力される予測画像データとに基づいて、各予測モードのコスト関数値を算出する。そして、モード判定部４６ｂは、算出したコスト関数値に基づき、各色成分についての最適な予測モードを選択する。そして、モード判定部４６ｂは、選択した最適な予測モードを示す予測モード情報を含むイントラ予測に関する情報、コスト関数値、並びに各色成分の予測画像データを、セレクタ２７へ出力する。

なお、予測制御部４１ｂは、共通メモリ２によりバッファリングされ得る下位レイヤ内の対応ブロックの予測モード情報に基づいて、エンハンスメントレイヤ内の予測ブロックについての候補モードを絞り込んでもよい。

例えば、予測制御部４１ｂは、対応ブロックについて最適な予測モードとしてＬＭモードが選択されたことを予測モード情報が示す場合に、予測ブロックについての候補モードを新たなＬＭモードのみに絞り込んでもよい。既存のＬＭモードよりも新たなＬＭモードの方が予測精度がより高いと想定されることから、下位レイヤにおいてＬＭモードが最適な予測モードとして選択された場合には、上位レイヤにおいて必然的に新たなＬＭモードが最適である可能性が高い。そのため、このような絞り込みによって、予測モードの探索に要する処理コストを削減することができる。また、エンハンスメントレイヤ内の予測ブロックについて別個の予測モード情報を符号化することが不要となるため、符号化効率も高められる。

一方で、予測制御部４１ｂは、対応ブロックについて最適な予測モードとして非ＬＭモードが選択された場合にも、予測ブロックについての候補モードに新たなＬＭモードを含める。このように、対応ブロックについて非ＬＭモードが選択されたかに関わらずエンハンスメントレイヤ内の予測ブロックについて新たなＬＭモードを候補モードに含めることにより、高い予測精度を実現し得る新たなＬＭモードを最大限に活用して、符号化効率を効果的に高めることができる。

なお、候補モードが１つしか残らない場合には、モード判定部４６ｂによるコスト関数値の比較は省略され、当該１つの候補モードが最適な予測モードとして選択されてよい。

さらなる上位レイヤが存在する場合には、共通メモリ２は、フレームメモリ２５から入力されるデブロックフィルタ適用前のエンハンスメントレイヤの復号画像データをさらに記憶してもよい。また、モード判定部４６ｂは、予測ブロックごとの最適な予測モードを示す予測モード情報を、さらなる上位レイヤのために共通メモリ２に記憶させてもよい。

なお、上述したように、式（２）及び式（３）におけるＩの値は、参照画素数を表す。色差成分の予測ブロックの一辺のサイズをＳ_Ｂとすると、既存のＬＭモードでは、Ｉ＝２・Ｓ_Ｂである。これに対し、上述した新たなＬＭモードでは、Ｉの値は異なり得る。例えば、スケーラビリティ比が２：１の場合、対応ブロックの一辺のサイズはＳ_Ｂ／２であり、Ｉ＝（Ｓ_Ｂ／２）^２である。ブロックサイズが大きくなると、既存のＬＭモードと比較して、新たなＬＭモードにおける参照画素数Ｉはより大きくなり得る。参照画素数Ｉがより大きいほど、式（２）及び式（３）の計算に要するコストは増大する。そこで、係数算出部４２ｂは、新たなＬＭモードの適用に際して、下位レイヤ内の参照画素を間引くことにより、係数算出処理の処理コストを低減してもよい。

図８は、参照画素の間引きの一例について説明するための説明図である。図８を参照すると、図３と同様の、８×８画素のサイズを有するエンハンスメントレイヤ内の予測ブロック、及び４×４画素のサイズを有するベースレイヤ内の対応ブロックが示されている。ここでも、説明を簡明にするために、クロマフォーマットは４：４：４であるものとする。エンハンスメントレイヤ内の色差成分の予測ブロックＢ_ｈ２にＬＭモードが適用される場合には、下位レイヤ内の予測ブロックＢ_ｂ１及びＢ_ｂ２の画素値が、係数算出部４２ｂにより係数算出式に代入される。但し、図８の例では、係数算出部４２ｂは、予測ブロックＢ_ｂ１及びＢ_ｂ２の全ての画素値ではなく一部のみ（例えば、図中で網掛けされた画素）を係数算出式に代入する。それにより、係数算出処理の処理コストを低減することができる。なお、間引かれる参照画素の位置は、図８の例に限定されず、いかなる位置であってもよい。間引かれる参照画素の割合もまた、図８の例に限定されず、いかなる割合であってもよい。間引かれる参照画素の位置又は割合が、ブロックサイズなどのパラメータに依存して動的に設定されてもよい。

＜３．一実施形態に係る符号化時の処理の流れ＞
本節では、図９及び図１０を用いて、符号化時の処理の流れについて説明する。

（１）概略的な流れ
図９は、一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

図９を参照すると、まず、ベースレイヤのためのイントラ予測部４０ａは、ベースレイヤのイントラ予測処理を実行する（ステップＳ１１０）。ここでのイントラ予測処理は、例えば、上記非特許文献１において定義されているような仕様に従った処理であってよい。次に、可逆符号化部１６は、イントラ予測処理の結果として生成されるイントラ予測に関する情報及び量子化データを符号化し、ベースレイヤの符号化ストリームを生成する（ステップＳ１２０）。また、共通メモリ２は、デブロックフィルタ適用前のベースレイヤの輝度成分及び色差成分の画素値をバッファリングする（ステップＳ１３０）。

次に、エンハンスメントレイヤのためのイントラ予測部４０ｂは、エンハンスメントレイヤのイントラ予測処理を実行する（ステップＳ１４０）。ここでのイントラ予測処理について、後により詳細に説明する。次に、可逆符号化部１６は、イントラ予測処理の結果として生成されるイントラ予測に関する情報及び量子化データを符号化し、エンハンスメントレイヤの符号化ストリームを生成する（ステップＳ１５０）。

その後、より上位のエンハンスメントレイヤが存在するか否かが判定される（ステップＳ１６０）。そして、より上位のエンハンスメントレイヤが存在する場合には、デブロックフィルタ適用前のエンハンスメントレイヤの輝度成分及び色差成分の画素値が共通メモリ２によりバッファリングされ（ステップＳ１７０）、処理はステップＳ１４０へ戻る。一方、より上位のエンハンスメントレイヤが存在しない場合には、図９のフローチャートは終了する。

（２）エンハンスメントレイヤのイントラ予測処理
図１０は、図９のステップＳ１４０におけるエンハンスメントレイヤのイントラ予測処理の詳細な流れの一例を示すフローチャートである。

図１０のフローチャートにおける処理対象の予測ブロックを、ここでは注目ブロックという。注目ブロックについて、新たなＬＭモードを含む１つ以上の候補モードが存在し得る。エンハンスメントレイヤのイントラ予測処理は、処理対象の候補モードに応じて分岐する（ステップＳ１４１）。処理対象の候補モードがＬＭモードである場合には、処理はステップＳ１４２へ進む。そうでない場合には、処理はステップＳ１４６へ進む。

ＬＭモードの処理において、係数算出部４２ｂは、注目ブロックに対応する位置の下位レイヤの輝度成分及び色差成分の参照画素値を、共通メモリ２から取得する（ステップＳ１４２）。次に、係数算出部４２ｂは、必要に応じて（例えば、参照画素数が所定の閾値よりも多い場合に）、取得した参照画素を間引く（ステップＳ１４３）。次に、係数算出部４２ｂは、輝度成分及び色差成分の参照画素値を係数算出式に代入することにより、ＬＭモードの予測関数の係数α、βを算出する（ステップＳ１４４）。次に、予測部４５ｂは、フィルタ４４ｂにより生成される輝度成分の入力値を、係数算出部４２ｂにより算出される係数を有する予測関数に代入することにより、注目ブロックの予測画像を生成する（ステップＳ１４５）。

一方、非ＬＭモードの処理において、予測部４５ｂは、予測制御部４１ｂにより指定される予測モードに従って、注目ブロックの予測画像を生成する（ステップＳ１４５）。

これら処理は、注目ブロックについての全ての候補モードが探索されるまで繰り返される（ステップＳ１４７）。そして、全ての候補モードが探索されると、モード判定部４６ｂは、コスト関数値を比較することにより、１つ以上の候補モードから最適な予測モードを選択する（ステップＳ１４８）。

＜４．一実施形態に係る復号部の構成例＞
［４−１．全体的な構成］
図１１は、図５に示した第１復号部６ａ及び第２復号部６ｂの構成の一例を示すブロック図である。図１１を参照すると、第１復号部６ａは、蓄積バッファ６１、可逆復号部６２、逆量子化部６３、逆直交変換部６４、加算部６５、デブロックフィルタ６６、並び替えバッファ６７、Ｄ／Ａ（Digital to Analogue）変換部６８、フレームメモリ６９、セレクタ７０及び７１、動き補償部８０、並びにイントラ予測部９０ａを備える。第２復号部６ｂは、イントラ予測部９０ａの代わりに、イントラ予測部９０ｂを備える。

蓄積バッファ６１は、伝送路を介して入力される符号化ストリームを記憶媒体を用いて一時的に蓄積する。

可逆復号部６２は、蓄積バッファ６１から入力される符号化ストリームを、符号化の際に使用された符号化方式に従って復号する。また、可逆復号部６２は、符号化ストリームのヘッダ領域に多重化されている情報を復号する。可逆復号部６２により復号される情報は、例えば、上述したインター予測に関する情報及びイントラ予測に関する情報を含み得る。可逆復号部６２は、インター予測に関する情報を動き補償部８０へ出力する。また、可逆復号部６２は、イントラ予測に関する情報をイントラ予測部９０ａ又は９０ｂへ出力する。

逆量子化部６３は、可逆復号部６２による復号後の量子化データを逆量子化する。逆直交変換部６４は、符号化の際に使用された直交変換方式に従い、逆量子化部６３から入力される変換係数データについて逆直交変換を行うことにより、予測誤差データを生成する。そして、逆直交変換部６４は、生成した予測誤差データを加算部６５へ出力する。

加算部６５は、逆直交変換部６４から入力される予測誤差データと、セレクタ７１から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部６５は、生成した復号画像データをデブロックフィルタ６６及びフレームメモリ６９へ出力する。

デブロックフィルタ６６は、加算部６５から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データを並び替えバッファ６７及びフレームメモリ６９へ出力する。

並び替えバッファ６７は、デブロックフィルタ６６から入力される画像を並び替えることにより、時系列の一連の画像データを生成する。そして、並び替えバッファ６７は、生成した画像データをＤ／Ａ変換部６８へ出力する。

Ｄ／Ａ変換部６８は、並び替えバッファ６７から入力されるデジタル形式の画像データをアナログ形式の画像信号に変換する。そして、Ｄ／Ａ変換部６８は、例えば、画像復号装置６０と接続されるディスプレイ（図示せず）にアナログ画像信号を出力することにより、画像を表示させる。

フレームメモリ６９は、加算部６５から入力されるフィルタリング前の復号画像データ、及びデブロックフィルタ６６から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。

セレクタ７０は、可逆復号部６２により取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ６９からの画像データの出力先を動き補償部８０とイントラ予測部９０ａ又は９０ｂとの間で切り替える。例えば、セレクタ７０は、インター予測モードが指定された場合には、フレームメモリ６９から供給されるフィルタリング後の復号画像データを参照画像データとして動き補償部８０へ出力する。また、セレクタ７０は、イントラ予測モードが指定された場合には、フレームメモリ６９から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部９０ａ又は９０ｂへ出力する。

セレクタ７１は、可逆復号部６２により取得されるモード情報に応じて、加算部６５へ供給すべき予測画像データの出力元を動き補償部８０とイントラ予測部９０ａ又は９０ｂとの間で切り替える。例えば、セレクタ７１は、インター予測モードが指定された場合には、動き補償部８０から出力される予測画像データを加算部６５へ供給する。また、セレクタ７１は、イントラ予測モードが指定された場合には、イントラ予測部９０ａ又は９０ｂから出力される予測画像データを加算部６５へ供給する。

動き補償部８０は、可逆復号部６２から入力されるインター予測に関する情報とフレームメモリ６９からの参照画像データとに基づいて動き補償処理を行い、予測画像データを生成する。そして、動き補償部８０は、生成した予測画像データをセレクタ７１へ出力する。

イントラ予測部９０ａは、可逆復号部６２から入力されるイントラ予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてベースレイヤのイントラ予測処理を行い、予測画像データを生成する。そして、イントラ予測部９０ａは、生成したベースレイヤの予測画像データをセレクタ７１へ出力する。また、イントラ予測部４０ａは、イントラ予測に関する少なくとも一部のパラメータを、共通メモリ７によりバッファリングさせる。

イントラ予測部９０ｂは、可逆復号部６２から入力されるイントラ予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤのイントラ予測処理を行い、予測画像データを生成する。そして、イントラ予測部９０ｂは、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。エンハンスメントレイヤにおいて指定される候補モードは、上述した新たなＬＭモードを含み得る。イントラ予測部９０ｂは、ある予測ブロックへの新たなＬＭモードの適用に際して、共通メモリ７によりバッファリングされ得る下位レイヤ内の対応する位置の輝度成分及び色差成分の画素値を参照する。イントラ予測部９０ｂは、共通メモリ７により追加的にバッファリングされ得る下位レイヤの予測モード情報に基づいて、エンハンスメントレイヤの候補モードを絞り込んでもよい。候補モードが１つしか残らない場合には、エンハンスメントレイヤの予測モード情報は復号されない。

第１復号部６ａは、ここで説明した一連の復号処理を、ベースレイヤの一連の画像データについて実行する。第２復号部６ｂは、ここで説明した一連の復号処理を、エンハンスメントレイヤの一連の画像データについて実行する。エンハンスメントレイヤが複数存在する場合には、エンハンスメントレイヤの復号処理は、エンハンスメントレイヤの数だけ繰り返され得る。ベースレイヤの復号処理と、エンハンスメントレイヤの復号処理とは、何らかのブロックごとに同期して実行されてもよい。

［４−２．イントラ予測部の詳細な構成］
図１２は、図１１に示したイントラ予測部９０ａ及び９０ｂの詳細な構成の一例を示すブロック図である。図１２を参照すると、イントラ予測部９０ａは、予測制御部９１ａ、係数算出部９２ａ、フィルタ９４ａ及び予測部９５ａを有する。イントラ予測部９０ｂは、予測制御部９１ｂ、係数算出部９２ｂ、フィルタ９４ｂ及び予測部９５ｂを有する。

（１）ベースレイヤのイントラ予測処理
イントラ予測部９０ａの予測制御部９１ａは、ベースレイヤのイントラ予測処理を制御する。例えば、予測制御部９１ａは、各予測ブロックについて、輝度成分についてのイントラ予測処理及び色差成分についてのイントラ予測処理を実行する。各色成分についてのイントラ予測処理において、予測制御部９１ａは、可逆復号部６２により復号される予測モード情報を取得する。そして、予測制御部９１ａは、予測モード情報により指定された予測モードで予測部９５ａに各予測ブロックの予測画像を生成させる。ベースレイヤがＨＥＶＣに従って復号される場合には、予測モード情報は、色差成分についてＬＭモードを示し得る。ベースレイヤにおけるＬＭモードは、図２を用いて説明した既存のＬＭモードである。

係数算出部９２ａは、ＬＭモードにおいて予測部９５ａにより使用される予測関数の係数を、上述した式（２）及び式（３）に隣接ブロックの画素値を代入することにより算出する。フィルタ９４ａは、フレームメモリ６９から入力される予測ブロックの輝度成分の画素値をクロマフォーマットに応じてダウンサンプリング（位相シフト）することにより、ＬＭモードの予測関数への入力値を生成する。

予測部９５ａは、予測制御部９１ａによる制御の下、各色成分（即ち、輝度成分及び色差成分の各々）について、指定された予測モードに従って、各予測ブロックの予測画像を生成する。候補モードがＬＭモードである場合には、予測部９５ａは、フィルタ９４ａにより生成される輝度成分の入力値を、係数算出部９２ａにより算出される係数を有する予測関数に代入することにより、各色差成分の値を予測する。他の予測モードでの予測画像の生成もまた、既存の手法と同様に行われてよい。そして、予測部９５ａは、予測の結果として生成される予測画像データを、加算部６５へ出力する。

共通メモリ７は、フレームメモリ６９から入力される、デブロックフィルタ適用前の復号画像データを記憶する。当該復号画像データは、輝度成分及び色差成分の画素値を含む。共通メモリ７により記憶される復号画像データは、上位レイヤにおいて新たなＬＭモードのための予測関数の係数を算出する際に、イントラ予測部９０ｂにより参照される。また、予測制御部９１ａは、予測ブロックごとに指定された予測モードを示す予測モード情報を、共通メモリ７に記憶させてもよい。当該予測モード情報は、上位レイヤにおいて予測モードを絞り込むために利用され得る。

（２）エンハンスメントレイヤのイントラ予測処理
イントラ予測部９０ｂの予測制御部９１ｂは、エンハンスメントレイヤのイントラ予測処理を制御する。例えば、予測制御部９１ｂは、予測ブロックごとに、輝度成分についてのイントラ予測処理及び色差成分についてのイントラ予測処理を実行する。各色成分についてのイントラ予測処理において、予測制御部９１ｂは、可逆復号部６２により復号される予測モード情報を取得する。そして、予測制御部９１ｂは、予測モード情報により指定された予測モードで予測部９５ｂに各予測ブロックの予測画像を生成させる。色差成分について、予測モード情報は、図３を用いて説明した新たなＬＭモードを示し得る。

係数算出部９２ｂは、予測ブロックに対応する位置の下位レイヤの輝度成分及び色差成分の画素値を、共通メモリ７から取得する。そして、係数算出部９２ｂは、共通メモリ７から取得した画素値を上述した式（２）及び式（３）に代入することにより、新たなＬＭモードのための予測関数の係数を算出する。フィルタ９４ｂは、フレームメモリ６９から入力される予測ブロックの輝度成分の画素値をクロマフォーマットに応じてダウンサンプリング（位相シフト）することにより、予測関数への入力値を生成する。

予測部９５ｂは、予測制御部９１ｂにより指定される予測モードに従って、各色成分（即ち、輝度成分及び色差成分の各々）について、各予測ブロックの予測画像を生成する。ＬＭモードが指定された場合には、予測部９５ｂは、フィルタ９４ｂにより生成される輝度成分の入力値を、係数算出部９２ｂにより算出される係数を有する予測関数に代入することにより、各色差成分の値を予測する。他の予測モードでの予測画像の生成は、既存の手法と同様に行われてよい。予測部９５ｂは、予測の結果として生成される予測画像データを、加算部６５へ出力する。

なお、予測制御部９１ｂは、共通メモリ７によりバッファリングされ得る下位レイヤ内の対応ブロックの予測モード情報に基づいて、エンハンスメントレイヤ内の予測ブロックについての予測モードを絞り込んでもよい。

例えば、予測制御部９１ｂは、対応ブロックについて予測モード情報によりＬＭモードが指定された場合に、予測ブロックについての予測モードを新たなＬＭモードのみに絞り込んでもよい。この場合、エンハンスメントレイヤ内の予測ブロックについて、別個の予測モード情報は符号化ストリームから復号されない。

一方で、予測制御部９１ｂは、対応ブロックについて予測モード情報により非ＬＭモードが指定された場合には、予測ブロックについて別個の予測モード情報を取得する。そして、予測制御部９１ｂは、取得した別個の予測モード情報がＬＭモードを示す場合に、新たなＬＭモードに従って、予測部９５ｂに予測ブロックの予測画像を生成させる。

さらなる上位レイヤが存在する場合には、共通メモリ７は、フレームメモリ６９から入力されるデブロックフィルタ適用前のエンハンスメントレイヤの復号画像データをさらに記憶してもよい。また、予測制御部９１ｂは、予測ブロックごとに指定された予測モードを示す予測モード情報を、さらなる上位レイヤのために共通メモリ７に記憶させてもよい。

また、係数算出部９２ｂは、図８を用いて説明したように、新たなＬＭモードの適用に際して、下位レイヤ内の参照画素を間引くことにより、係数算出処理の処理コストを低減してもよい。

＜５．一実施形態に係る復号時の処理の流れ＞
本節では、図１３及び図１４を用いて、復号時の処理の流れについて説明する。

（１）概略的な流れ
図１３は、一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

図１３を参照すると、まず、可逆復号部６２は、ベースレイヤの符号化ストリームから、ベースレイヤのイントラ予測に関する情報及び量子化データを復号する（ステップＳ２１０）。次に、ベースレイヤのためのイントラ予測部９０ａは、ベースレイヤのイントラ予測処理を実行する（ステップＳ２２０）。ここでのイントラ予測処理は、例えば、上記非特許文献１において定義されているような仕様に従った処理であってよい。共通メモリ７は、デブロックフィルタ適用前のベースレイヤの輝度成分及び色差成分の画素値をバッファリングする（ステップＳ２３０）。

次に、可逆復号部６２は、エンハンスメントレイヤの符号化ストリームから、エンハンスメントレイヤのイントラ予測に関する情報及び量子化データを復号する（ステップＳ２４０）。次に、エンハンスメントレイヤのためのイントラ予測部９０ｂは、エンハンスメントレイヤのイントラ予測処理を実行する（ステップＳ２５０）。ここでのイントラ予測処理について、後により詳細に説明する。

その後、より上位のエンハンスメントレイヤが存在するか否かが判定される（ステップＳ２６０）。そして、より上位のエンハンスメントレイヤが存在する場合には、デブロックフィルタ適用前のエンハンスメントレイヤの輝度成分及び色差成分の画素値が共通メモリ７によりバッファリングされ（ステップＳ２７０）、処理はステップＳ２４０へ戻る。一方、より上位のエンハンスメントレイヤが存在しない場合には、図１３のフローチャートは終了する。

（２）エンハンスメントレイヤのイントラ予測処理
図１４は、図１３のステップＳ２５０におけるエンハンスメントレイヤのイントラ予測処理の詳細な流れの一例を示すフローチャートである。

図１４のフローチャートにおける処理対象の予測ブロックを、ここでは注目ブロックという。まず、予測制御部９１ｂは、注目ブロックについての予測モードを判定する（ステップＳ２５１）。例えば、予測制御部９１ｂは、可逆復号部６２により復号されるエンハンスメントレイヤのための別個の予測モード情報を取得することにより、注目ブロックについての予測モードを判定してもよい。また、予測制御部９１ｂは、ベースレイヤ内の対応ブロックについての予測モード情報から予測モードを１つに絞り込むことができる場合には、エンハンスメントレイヤのための別個の予測モード情報を取得することなく、注目ブロックについての予測モードを判定してもよい。その後の処理は、判定された注目ブロックの予測モードに応じて分岐する（ステップＳ２５２）。注目ブロックの予測モードがＬＭモードである場合には、処理はステップＳ２５３へ進む。そうでない場合には、処理はステップＳ２５７へ進む。

ＬＭモードの処理において、係数算出部９２ｂは、注目ブロックに対応する位置の下位レイヤの輝度成分及び色差成分の参照画素値を、共通メモリ７から取得する（ステップＳ５３）。次に、係数算出部９２ｂは、必要に応じて（例えば、参照画素数が所定の閾値よりも多い場合に）、取得した参照画素を間引く（ステップＳ２５４）。次に、係数算出部９２ｂは、輝度成分及び色差成分の参照画素値を係数算出式に代入することにより、ＬＭモードの予測関数の係数α、βを算出する（ステップＳ２５５）。次に、予測部９５ｂは、フィルタ９４ｂにより生成される輝度成分の入力値を、係数算出部９２ｂにより算出される係数を有する予測関数に代入することにより、注目ブロックの予測画像を生成する（ステップＳ２５６）。

一方、非ＬＭモードの処理において、予測部９５ｂは、予測制御部９１ｂにより指定される予測モードに従って、注目ブロックの予測画像を生成する（ステップＳ２５７）。

＜６．応用例＞
［６−１．様々な製品への応用］
上述した実施形態に係る画像符号化装置１０及び画像復号装置６０は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

（１）第１の応用例
図１５は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース９０９、制御部９１０、ユーザインタフェース９１１、及びバス９１２を備える。

チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからＥＰＧ（Electronic Program Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのＧＵＩ（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はＯＬＥＤなど）の映像面上に映像又は画像を表示する。

音声信号処理部９０７は、デコーダ９０４から入力される音声データについてＤ／Ａ変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

外部インタフェース９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

制御部９１０は、Ｃ予測ブロック（Central Processing Unit）などのプロセッサ、並びにＲＡＭ（Random Access Memory）及びＲＯＭ（Read Only Memory）などのメモリを有する。メモリは、Ｃ予測ブロックにより実行されるプログラム、プログラムデータ、ＥＰＧデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にＣ予測ブロックにより読み込まれ、実行される。Ｃ予測ブロックは、プログラムを実行することにより、例えばユーザインタフェース９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

ユーザインタフェース９１１は、制御部９１０と接続される。ユーザインタフェース９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース９０９及び制御部９１０を相互に接続する。

このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、テレビジョン装置９００での画像のスケーラブル復号に際して、エンハンスメントレイヤにおいて新たなＬＭモードを採用することにより、予測精度を一層高めることができる。

（２）第２の応用例
図１６は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをＡ／Ｄ変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、ＲＡＭ又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９の記憶媒体に記憶させる。

また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、携帯電話機９２０での画像のスケーラブル符号化及び復号に際して、エンハンスメントレイヤにおいて新たなＬＭモードを採用することにより、予測精度を一層高めることができる。

（３）第３の応用例
図１７は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

記録再生装置９４０は、チューナ９４１、外部インタフェース９４２、エンコーダ９４３、ＨＤＤ（Hard Disk Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen Display）９４８、制御部９４９、及びユーザインタフェース９５０を備える。

チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送手段としての役割を有する。

外部インタフェース９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース９４２は、例えば、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース、ＵＳＢインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース９４２は、記録再生装置９４０における伝送手段としての役割を有する。

エンコーダ９４３は、外部インタフェース９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

ＨＤＤ９４４は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、ＨＤＤ９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばＤＶＤディスク（ＤＶＤ−Ｖｉｄｅｏ、ＤＶＤ−ＲＡＭ、ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）又はＢｌｕ−ｒａｙ（登録商標）ディスクなどであってよい。

セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをＨＤＤ９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、ＨＤＤ９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをＯＳＤ９４８へ出力する。また、デコーダ９０４は、生成した音声データを外部のスピーカへ出力する。

ＯＳＤ９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、ＯＳＤ９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を重畳してもよい。

制御部９４９は、Ｃ予測ブロックなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、Ｃ予測ブロックにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にＣ予測ブロックにより読み込まれ、実行される。Ｃ予測ブロックは、プログラムを実行することにより、例えばユーザインタフェース９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

ユーザインタフェース９５０は、制御部９４９と接続される。ユーザインタフェース９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施形態に係る画像符号化装置１０の機能を有する。また、デコーダ９４７は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、記録再生装置９４０での画像のスケーラブル符号化及び復号に際して、エンハンスメントレイヤにおいて新たなＬＭモードを採用することにより、予測精度を一層高めることができる。

（４）第４の応用例
図１８は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、制御部９７０、ユーザインタフェース９７１、及びバス９７２を備える。

光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、及び制御部９７０を相互に接続する。

光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤ又はＣＭＯＳなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、ＯＳＤ９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

ＯＳＤ９６９は、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を生成して、生成した画像を画像処理部９６４へ出力する。

外部インタフェース９６６は、例えばＵＳＢ入出力端子として構成される。外部インタフェース９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース９６６は、ＬＡＮ又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース９６６は、撮像装置９６０における伝送手段としての役割を有する。

メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はＳＳＤ（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部９７０は、Ｃ予測ブロックなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、Ｃ予測ブロックにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にＣ予測ブロックにより読み込まれ、実行される。Ｃ予測ブロックは、プログラムを実行することにより、例えばユーザインタフェース９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

ユーザインタフェース９７１は、制御部９７０と接続される。ユーザインタフェース９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、撮像装置９６０での画像のスケーラブル符号化及び復号に際して、エンハンスメントレイヤにおいて新たなＬＭモードを採用することにより、予測精度を一層高めることができる。

［６−２．スケーラブル符号化の様々な用途］
上述したスケーラブル符号化の利点は、様々な用途において享受され得る。以下、３つの用途の例について説明する。

（１）第１の例
第１の例において、スケーラブル符号化は、データの選択的な伝送のために利用される。図１９を参照すると、データ伝送システム１０００は、ストリーム記憶装置１００１及び配信サーバ１００２を含む。配信サーバ１００２は、ネットワーク１００３を介して、いくつかの端末装置と接続される。ネットワーク１００３は、有線ネットワークであっても無線ネットワークであってもよく、又はそれらの組合せであってもよい。図１９には、端末装置の例として、ＰＣ（Personal Computer）１００４、ＡＶ機器１００５、タブレット装置１００６及び携帯電話機１００７が示されている。

ストリーム記憶装置１００１は、例えば、画像符号化装置１０により生成される多重化ストリームを含むストリームデータ１０１１を記憶する。多重化ストリームは、ベースレイヤ（ＢＬ）の符号化ストリーム及びエンハンスメントレイヤ（ＥＬ）の符号化ストリームを含む。配信サーバ１００２は、ストリーム記憶装置１００１に記憶されているストリームデータ１０１１を読み出し、読み出したストリームデータ１０１１の少なくとも一部分を、ネットワーク１００３を介して、ＰＣ１００４、ＡＶ機器１００５、タブレット装置１００６、及び携帯電話機１００７へ配信する。

端末装置へのストリームの配信の際、配信サーバ１００２は、端末装置の能力又は通信環境などの何らかの条件に基づいて、配信すべきストリームを選択する。例えば、配信サーバ１００２は、端末装置が扱うことのできる画質を上回るほど高い画質を有する符号化ストリームを配信しないことにより、端末装置における遅延、オーバフロー又はプロセッサの過負荷の発生を回避してもよい。また、配信サーバ１００２は、高い画質を有する符号化ストリームを配信しないことにより、ネットワーク１００３の通信帯域が占有されることを回避してもよい。一方、配信サーバ１００２は、これら回避すべきリスクが存在しない場合、又はユーザとの契約若しくは何らかの条件に基づいて適切だと判断される場合に、多重化ストリームの全てを端末装置へ配信してもよい。

図１９の例では、配信サーバ１００２は、ストリーム記憶装置１００１からストリームデータ１０１１を読み出す。そして、配信サーバ１００２は、高い処理能力を有するＰＣ１００４へ、ストリームデータ１０１１をそのまま配信する。また、ＡＶ機器１００５は低い処理能力を有するため、配信サーバ１００２は、ストリームデータ１０１１から抽出されるベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を生成し、ストリームデータ１０１２をＡＶ機器１００５へ配信する。また、配信サーバ１００２は、高い通信レートで通信可能であるタブレット装置１００６へストリームデータ１０１１をそのまま配信する。また、携帯電話機１００７は低い通信レートでしか通信できないため、配信サーバ１００２は、ベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を携帯電話機１００７へ配信する。

このように多重化ストリームを用いることにより、伝送されるトラフィックの量を適応的に調整することができる。また、個々のレイヤがそれぞれ単独に符号化されるケースと比較して、ストリームデータ１０１１の符号量は削減されるため、ストリームデータ１０１１の全体が配信されるとしても、ネットワーク１００３に掛かる負荷は抑制される。さらに、ストリーム記憶装置１００１のメモリリソースも節約される。

端末装置のハードウエア性能は、装置ごとに異なる。また、端末装置において実行されるアプリケーションのケイパビリティも様々である。さらに、ネットワーク１００３の通信容量もまた様々である。データ伝送のために利用可能な容量は、他のトラフィックの存在に起因して、時々刻々と変化し得る。そこで、配信サーバ１００２は、ストリームデータの配信を開始する前に、配信先の端末装置との間のシグナリングを通じて、端末装置のハードウエア性能及びアプリケーションケイパビリティなどに関する端末情報と、ネットワーク１００３の通信容量などに関するネットワーク情報とを取得してもよい。そして、配信サーバ１００２は、取得した情報に基づいて、配信すべきストリームを選択し得る。

なお、復号すべきレイヤの抽出は、端末装置において行われてもよい。例えば、ＰＣ１００４は、受信した多重化ストリームから抽出され復号されるベースレイヤ画像をその画面に表示してもよい。また、ＰＣ１００４は、受信した多重化ストリームからベースレイヤの符号化ストリームを抽出してストリームデータ１０１２を生成し、生成したストリームデータ１０１２を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

図１９に示したデータ伝送システム１０００の構成は一例に過ぎない。データ伝送システム１０００は、いかなる数のストリーム記憶装置１００１、配信サーバ１００２、ネットワーク１００３、及び端末装置を含んでもよい。

（２）第２の例
第２の例において、スケーラブル符号化は、複数の通信チャネルを介するデータの伝送のために利用される。図２０を参照すると、データ伝送システム１１００は、放送局１１０１及び端末装置１１０２を含む。放送局１１０１は、地上波チャネル１１１１上で、ベースレイヤの符号化ストリーム１１２１を放送する。また、放送局１１０１は、ネットワーク１１１２を介して、エンハンスメントレイヤの符号化ストリーム１１２２を端末装置１１０２へ送信する。

端末装置１１０２は、放送局１１０１により放送される地上波放送を受信するための受信機能を有し、地上波チャネル１１１１を介してベースレイヤの符号化ストリーム１１２１を受信する。また、端末装置１１０２は、放送局１１０１と通信するための通信機能を有し、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信する。

端末装置１１０２は、例えば、ユーザからの指示に応じて、ベースレイヤの符号化ストリーム１１２１を受信し、受信した符号化ストリーム１１２１からベースレイヤ画像を復号してベースレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したベースレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

また、端末装置１１０２は、例えば、ユーザからの指示に応じて、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信し、ベースレイヤの符号化ストリーム１１２１とエンハンスメントレイヤの符号化ストリーム１１２２とを多重化することにより多重化ストリームを生成してもよい。また、端末装置１１０２は、エンハンスメントレイヤの符号化ストリーム１１２２からエンハンスメントレイヤ画像を復号してエンハンスメントレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したエンハンスメントレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

上述したように、多重化ストリームに含まれる各レイヤの符号化ストリームは、レイヤごとに異なる通信チャネルを介して伝送され得る。それにより、個々のチャネルに掛かる負荷を分散させて、通信の遅延若しくはオーバフローの発生を抑制することができる。

また、何らかの条件に応じて、伝送のために使用される通信チャネルが動的に選択されてもよい。例えば、データ量が比較的多いベースレイヤの符号化ストリーム１１２１は帯域幅の広い通信チャネルを介して伝送され、データ量が比較的少ないエンハンスメントレイヤの符号化ストリーム１１２２は帯域幅の狭い通信チャネルを介して伝送され得る。また、特定のレイヤの符号化ストリーム１１２２が伝送される通信チャネルが、通信チャネルの帯域幅に応じて切り替えられてもよい。それにより、個々のチャネルに掛かる負荷をより効果的に抑制することができる。

なお、図２０に示したデータ伝送システム１１００の構成は一例に過ぎない。データ伝送システム１１００は、いかなる数の通信チャネル及び端末装置を含んでもよい。また、放送以外の用途において、ここで説明したシステムの構成が利用されてもよい。

（３）第３の例
第３の例において、スケーラブル符号化は、映像の記憶のために利用される。図２１を参照すると、データ伝送システム１２００は、撮像装置１２０１及びストリーム記憶装置１２０２を含む。撮像装置１２０１は、被写体１２１１を撮像することにより生成される画像データをスケーラブル符号化し、多重化ストリーム１２２１を生成する。多重化ストリーム１２２１は、ベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームを含む。そして、撮像装置１２０１は、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給する。

ストリーム記憶装置１２０２は、撮像装置１２０１から供給される多重化ストリーム１２２１を、モードごとに異なる画質で記憶する。例えば、ストリーム記憶装置１２０２は、通常モードにおいて、多重化ストリーム１２２１からベースレイヤの符号化ストリーム１２２２を抽出し、抽出したベースレイヤの符号化ストリーム１２２２を記憶する。これに対し、ストリーム記憶装置１２０２は、高画質モードにおいて、多重化ストリーム１２２１をそのまま記憶する。それにより、ストリーム記憶装置１２０２は、高画質での映像の記録が望まれる場合にのみ、データ量の多い高画質のストリームを記録することができる。そのため、画質の劣化のユーザへの影響を抑制しながら、メモリリソースを節約することができる。

例えば、撮像装置１２０１は、監視カメラであるものとする。撮像画像に監視対象（例えば侵入者）が映っていない場合には、通常モードが選択される。この場合、撮像画像は重要でない可能性が高いため、データ量の削減が優先され、映像は低画質で記録される（即ち、ベースレイヤの符号化ストリーム１２２２のみが記憶される）。これに対し、撮像画像に監視対象（例えば、侵入者である被写体１２１１）が映っている場合には、高画質モードが選択される。この場合、撮像画像は重要である可能性が高いため、画質の高さが優先され、映像は高画質で記録される（即ち、多重化ストリーム１２２１が記憶される）。

図２１の例では、モードは、例えば画像解析結果に基づいて、ストリーム記憶装置１２０２により選択される。しかしながら、かかる例に限定されず、撮像装置１２０１がモードを選択してもよい。後者の場合、撮像装置１２０１は、通常モードにおいて、ベースレイヤの符号化ストリーム１２２２をストリーム記憶装置１２０２へ供給し、高画質モードにおいて、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給してもよい。

なお、モードを選択するための選択基準は、いかなる基準であってもよい。例えば、マイクロフォンを通じて取得される音声の大きさ又は音声の波形などに応じて、モードが切り替えられてもよい。また、周期的にモードが切り替えられてもよい。また、ユーザがらの指示に応じてモードが切り替えられてもよい。さらに、選択可能なモードの数は、階層化されるレイヤの数を超えない限り、いかなる数であってもよい。

図２１に示したデータ伝送システム１２００の構成は一例に過ぎない。データ伝送システム１２００は、いかなる数の撮像装置１２０１を含んでもよい。また、監視カメラ以外の用途において、ここで説明したシステムの構成が利用されてもよい。

［６−３．その他］
（１）マルチビューコーデックへの応用
マルチビューコーデックは、マルチレイヤコーデックの一種であり、いわゆる多視点映像を符号化し及び復号するための画像符号化方式である。図２２は、マルチビューコーデックについて説明するための説明図である。図２２を参照すると、３つの視点においてそれぞれ撮影される３つのビューのフレームのシーケンスが示されている。各ビューには、ビューＩＤ（view_id）が付与される。これら複数のビューのうちいずれか１つのビューが、ベースビュー（base view）に指定される。ベースビュー以外のビューは、ノンベースビューと呼ばれる。図２２の例では、ビューＩＤが"０"であるビューがベースビューであり、ビューＩＤが"１"又は"２"である２つのビューがノンベースビューである。これらビューが階層的に符号化される場合、各ビューがレイヤに相当し得る。図中に矢印で示したように、ノンベースビューの画像は、ベースビューの画像を参照して符号化され及び復号される（他のノンベースビューの画像も参照されてよい）。

図２３は、マルチビューコーデックをサポートする画像符号化装置１０ｖの概略的な構成を示すブロック図である。図２３を参照すると、画像符号化装置１０ｖは、第１レイヤ符号化部１ｃ、第２レイヤ符号化部１ｄ、共通メモリ２及び多重化部３を備える。

第１レイヤ符号化部１ｃの機能は、入力としてベースレイヤ画像の代わりにベースビュー画像を受け取ることを除き、図４を用いて説明した第１符号化部１ａの機能と同等である。第１レイヤ符号化部１ｃは、ベースビュー画像を符号化し、第１レイヤの符号化ストリームを生成する。第２レイヤ符号化部１ｄの機能は、入力としてエンハンスメントレイヤ画像の代わりにノンベースビュー画像を受け取ることを除き、図４を用いて説明した第２符号化部１ｂの機能と同等である。第２レイヤ符号化部１ｄは、ノンベースビュー画像を符号化し、第２レイヤの符号化ストリームを生成する。共通メモリ２は、レイヤ間で共通的に利用される情報を記憶する。多重化部３は、第１レイヤ符号化部１ｃにより生成される第１レイヤの符号化ストリームと、第２レイヤ符号化部１ｄにより生成される第２レイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

図２４は、マルチビューコーデックをサポートする画像復号装置６０ｖの概略的な構成を示すブロック図である。図２４を参照すると、画像復号装置６０ｖは、逆多重化部５、第１レイヤ復号部６ｃ、第２レイヤ復号部６ｄ及び共通メモリ７を備える。

逆多重化部５は、マルチレイヤの多重化ストリームを第１レイヤの符号化ストリーム及び第２レイヤの符号化ストリームに逆多重化する。第１レイヤ復号部６ｃの機能は、入力としてベースレイヤ画像の代わりにベースビュー画像が符号化された符号化ストリームを受け取ることを除き、図５を用いて説明した第１復号部６ａの機能と同等である。第１レイヤ復号部６ｃは、第１レイヤの符号化ストリームからベースビュー画像を復号する。第２レイヤ復号部６ｄの機能は、入力としてエンハンスメントレイヤ画像の代わりにノンベースビュー画像が符号化された符号化ストリームを受け取ることを除き、図５を用いて説明した第２復号部６ｂの機能と同等である。第２レイヤ復号部６ｄは、第２レイヤの符号化ストリームからノンベースビュー画像を復号する。共通メモリ７は、レイヤ間で共通的に利用される情報を記憶する。

マルチビューの画像データを符号化し又は復号する際、本開示に係る技術に従って、ノンベースビューの色差成分の予測ブロックの予測画像が、ベースビューの対応する位置の参照画素に基づいて構築される予測関数を用いて、ＬＭモードで生成されてもよい。それにより、スケーラブル符号化のケースと同様に、マルチビューコーデックにおいても、予測精度を高め、符号化効率を一層向上させることができる。

（２）ストリーミング技術への応用
本開示に係る技術は、ストリーミングプロトコルに適用されてもよい。例えば、ＭＰＥＧ−ＤＡＳＨ（Dynamic Adaptive Streaming over HTTP）では、解像度などのパラメータが互いに異なる複数の符号化ストリームがストリーミングサーバにおいて予め用意される。そして、ストリーミングサーバは、複数の符号化ストリームからストリーミングすべき適切なデータをセグメント単位で動的に選択し、選択したデータを配信する。このようなストリーミングプロトコルにおいて、本開示に係る技術に従って、ＬＭモードの予測精度が向上させられてもよい。

＜７．まとめ＞
ここまで、図１〜図２４を用いて、一実施形態に係る画像符号化装置１０及び画像復号装置６０について説明した。上述した実施形態によれば、スケーラブル符号化又は復号される画像のエンハンスメントレイヤ内の色差成分の予測ブロックの予測画像が生成される際に、隣接ブロックの参照画素ではなく、ベースレイヤ内の対応する位置の参照画素に基づいて構築される予測関数が、ＬＭモードにおいて使用される。従って、予測ブロックと隣接ブロックとの間で色成分間の相関が類似しない場合であっても、良好な予測精度を有する予測関数を構築してＬＭモードの予測精度を向上させることができる。

また、上述した実施形態によれば、ベースレイヤ内の対応ブロックについてＬＭモード以外の予測モードが指定された場合においても、エンハンスメントレイヤ内の予測ブロックについて、ＬＭモードが指定され得る。即ち、エンハンスメントレイヤにおいて、ベースレイヤの予測モードを覆して、ＬＭモードを活用することができる。それにより、高い予測精度を有する改良されたＬＭモードをより多くの画像領域で活用して、符号化効率を高めることが可能となる。このような手法は、例えば、ベースレイヤがＬＭモードをサポートしない画像符号化方式（例えば、ＭＰＥＧ２又はＡＶＣ）で、エンハンスメントレイヤがＬＭモードをサポートする画像符号化方式（例えば、ＨＥＶＣ）で符号化され及び復号される、いわゆるマルチコーデックのスケーラブル符号化において、ＬＭモードの活用の幅を広げることができる点で有益である。

また、上述した実施形態によれば、ベースレイヤ内の対応ブロックについてＬＭモードが指定された場合には、エンハンスメントレイヤ内の予測ブロックについて他の予測モードの探索が行われることなくＬＭモードが指定され得る。それにより、エンハンスメントレイヤにおいて別個の予測モード情報を符号化することが不要となるため、符号化効率を一層向上することができる。また、エンコーダ側の処理コストを低減することができる。

なお、本明細書では、イントラ予測に関する情報及びインター予測に関する情報が、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について主に説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
スケーラブル復号される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成するエンハンスメントレイヤ予測部、
を備える画像処理装置。
（２）
前記エンハンスメントレイヤ予測部は、前記第１の予測ブロックに対応する前記ベースレイヤ内の第２の予測ブロックについて輝度ベース色差予測モード以外の予測モードが指定された場合において、前記第１の予測ブロックについて取得される別個の予測モード情報が輝度ベース色差予測モードを示すときに、前記係数を有する前記予測関数を用いて前記第２の予測ブロックの前記予測画像を生成する、前記（１）に記載の画像処理装置。
（３）
前記ベースレイヤの符号化ストリームを、輝度ベース色差予測モードをサポートしない第１の符号化方式に従って復号するベースレイヤ復号部と、
前記エンハンスメントレイヤの符号化ストリームを、輝度ベース色差予測モードをサポートする第２の符号化方式に従って復号するエンハンスメントレイヤ復号部と、
をさらに備える、前記（１）又は前記（２）に記載の画像処理装置。
（４）
前記エンハンスメントレイヤ予測部は、前記第１の予測ブロックに対応する前記ベースレイヤ内の第２の予測ブロックについて輝度ベース色差予測モードが指定された場合に、前記係数を有する前記予測関数を用いて前記第２の予測ブロックの前記予測画像を生成する、前記（１）に記載の画像処理装置。
（５）
前記エンハンスメントレイヤ予測部は、前記ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分のうち一部のみを、輝度ベース色差予測モードの係数算出式に代入することにより、前記係数を算出する、前記（１）〜（４）のいずれか１項に記載の画像処理装置。
（６）
前記ベースレイヤ内のデブロックフィルタ適用前の輝度成分及び色差成分の画素値を記憶するメモリ、をさらに備え、
前記エンハンスメントレイヤ予測部は、前記メモリに記憶される前記画素値を用いて、前記係数を算出する、
前記（１）〜（５）のいずれか１項に記載の画像処理装置。
（７）
スケーラブル復号される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成すること、
を含む画像処理方法。
（８）
スケーラブル符号化される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成するエンハンスメントレイヤ予測部、
を備える画像処理装置。
（９）
前記エンハンスメントレイヤ予測部は、前記第１の予測ブロックに対応する前記ベースレイヤ内の第２の予測ブロックについて最適な予測モードとして輝度ベース色差予測モードが選択されたかに関わらず、前記係数を有する前記予測関数を用いる輝度ベース色差予測モードを含む１つ以上の予測モードから、前記第２の予測ブロックについての最適な予測モードを選択する、前記（８）に記載の画像処理装置。
（１０）
前記ベースレイヤの符号化ストリームを、輝度ベース色差予測モードをサポートしない第１の符号化方式に従って符号化するベースレイヤ符号化部と、
前記エンハンスメントレイヤの符号化ストリームを、輝度ベース色差予測モードをサポートする第２の符号化方式に従って符号化するエンハンスメントレイヤ符号化部と、
をさらに備える、前記（８）又は前記（９）に記載の画像処理装置。
（１１）
前記エンハンスメントレイヤ予測部は、前記第１の予測ブロックに対応する前記ベースレイヤ内の第２の予測ブロックについて最適な予測モードとして輝度ベース色差予測モードが選択された場合に、前記係数を有する前記予測関数を用いる輝度ベース色差予測モードを前記第２の予測ブロックについての最適な予測モードとして選択する、前記（８）に記載の画像処理装置。
（１２）
前記エンハンスメントレイヤ予測部は、前記ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分のうち一部のみを、輝度ベース色差予測モードの係数算出式に代入することにより、前記係数を算出する、前記（８）〜（１１）のいずれか１項に記載の画像処理装置。
（１３）
フィルタ適用前の輝度成分及び色差成分の画素値を記憶するメモリ、をさらに備え、
前記エンハンスメントレイヤ予測部は、前記メモリに記憶される前記画素値を用いて、前記係数を算出する、
前記（８）〜（１２）のいずれか１項に記載の画像処理装置。
（１４）
スケーラブル符号化される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成すること、
を含む画像処理方法。

１０画像符号化装置（画像処理装置）
４０ａイントラ予測部（ベースレイヤ予測部）
４０ｂイントラ予測部（エンハンスメントレイヤ予測部）
６０画像復号装置（画像処理装置）
９０ａイントラ予測部（ベースレイヤ予測部）
９０ｂイントラ予測部（エンハンスメントレイヤ予測部）

Claims

スケーラブル復号される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成するエンハンスメントレイヤ予測部、
を備える画像処理装置。
前記エンハンスメントレイヤ予測部は、前記第１の予測ブロックに対応する前記ベースレイヤ内の第２の予測ブロックについて輝度ベース色差予測モード以外の予測モードが指定された場合において、前記第１の予測ブロックについて取得される別個の予測モード情報が輝度ベース色差予測モードを示すときに、前記係数を有する前記予測関数を用いて前記第２の予測ブロックの前記予測画像を生成する、請求項１に記載の画像処理装置。
前記ベースレイヤの符号化ストリームを、輝度ベース色差予測モードをサポートしない第１の符号化方式に従って復号するベースレイヤ復号部と、
前記エンハンスメントレイヤの符号化ストリームを、輝度ベース色差予測モードをサポートする第２の符号化方式に従って復号するエンハンスメントレイヤ復号部と、
をさらに備える、請求項１に記載の画像処理装置。
前記エンハンスメントレイヤ予測部は、前記第１の予測ブロックに対応する前記ベースレイヤ内の第２の予測ブロックについて輝度ベース色差予測モードが指定された場合に、前記係数を有する前記予測関数を用いて前記第２の予測ブロックの前記予測画像を生成する、請求項１に記載の画像処理装置。
前記エンハンスメントレイヤ予測部は、前記ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分のうち一部のみを、輝度ベース色差予測モードの係数算出式に代入することにより、前記係数を算出する、請求項１に記載の画像処理装置。
前記ベースレイヤ内のデブロックフィルタ適用前の輝度成分及び色差成分の画素値を記憶するメモリ、をさらに備え、
前記エンハンスメントレイヤ予測部は、前記メモリに記憶される前記画素値を用いて、前記係数を算出する、
請求項１に記載の画像処理装置。
スケーラブル復号される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成すること、
を含む画像処理方法。
スケーラブル符号化される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成するエンハンスメントレイヤ予測部、
を備える画像処理装置。
前記エンハンスメントレイヤ予測部は、前記第１の予測ブロックに対応する前記ベースレイヤ内の第２の予測ブロックについて最適な予測モードとして輝度ベース色差予測モードが選択されたかに関わらず、前記係数を有する前記予測関数を用いる輝度ベース色差予測モードを含む１つ以上の予測モードから、前記第２の予測ブロックについての最適な予測モードを選択する、請求項８に記載の画像処理装置。
前記ベースレイヤの符号化ストリームを、輝度ベース色差予測モードをサポートしない第１の符号化方式に従って符号化するベースレイヤ符号化部と、
前記エンハンスメントレイヤの符号化ストリームを、輝度ベース色差予測モードをサポートする第２の符号化方式に従って符号化するエンハンスメントレイヤ符号化部と、
をさらに備える、請求項８に記載の画像処理装置。
前記エンハンスメントレイヤ予測部は、前記第１の予測ブロックに対応する前記ベースレイヤ内の第２の予測ブロックについて最適な予測モードとして輝度ベース色差予測モードが選択された場合に、前記係数を有する前記予測関数を用いる輝度ベース色差予測モードを前記第２の予測ブロックについての最適な予測モードとして選択する、請求項８に記載の画像処理装置。
前記エンハンスメントレイヤ予測部は、前記ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分のうち一部のみを、輝度ベース色差予測モードの係数算出式に代入することにより、前記係数を算出する、請求項８に記載の画像処理装置。
フィルタ適用前の輝度成分及び色差成分の画素値を記憶するメモリ、をさらに備え、
前記エンハンスメントレイヤ予測部は、前記メモリに記憶される前記画素値を用いて、前記係数を算出する、
請求項８に記載の画像処理装置。
スケーラブル符号化される画像のエンハンスメントレイヤ内の色差成分の第１の予測ブロックの予測画像を、ベースレイヤ内の前記第１の予測ブロックに対応する位置の輝度成分及び色差成分から算出される係数を有する輝度ベース色差予測モードの予測関数を用いて生成すること、
を含む画像処理方法。