WO2013157308A1

WO2013157308A1 - 画像処理装置及び画像処理方法

Info

Publication number: WO2013157308A1
Application number: PCT/JP2013/055387
Authority: WO
Inventors: 佐藤　数史
Original assignee: ソニー株式会社
Priority date: 2012-04-20
Filing date: 2013-02-28
Publication date: 2013-10-24
Also published as: US20160119639A1

Abstract

【課題】スケーラブル符号化において複数のレイヤを異なる画像符号化方式で符号化する場合に、予測モード情報のために要する符号量を削減すること。【解決手段】第１の符号化方式で復号されるベースレイヤ内の第１のブロックについて、第１の予測モードセットのうち予測モード情報により指定される予測モードで予測画像を生成するベースレイヤ予測部と、前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で復号されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために指定された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成するエンハンスメントレイヤ予測部と、を備える画像処理装置を提供する。

Description

画像処理装置及び画像処理方法

　本開示は、画像処理装置及び画像処理方法に関する。

　現在、Ｈ．２６４／ＡＶＣよりも符号化効率をさらに向上することを目的として、ＩＴＵ－ＴとＩＳＯ／ＩＥＣとの共同の標準化団体であるＪＣＴＶＣ（Joint　Collaboration　Team-Video　Coding）により、ＨＥＶＣ（High　Efficiency　Video　Coding）と呼ばれる画像符号化方式の標準化が進められている。ＨＥＶＣ規格については、２０１２年２月に最初のドラフト版の仕様であるＣｏｍｍｉｔｔｅｅ　ｄｒａｆｔが発行されている（例えば、下記非特許文献１参照）。

　また、異なる画像符号化方式で符号化ストリームを復号することを可能とするために、スケーラブル符号化におけるベースレイヤを旧来の画像符号化方式で符号化し、エンハンスメントレイヤをＨＥＶＣで符号化することも提案されている（例えば、下記非特許文献２参照）。

　スケーラブル符号化（ＳＶＣ（Scalable　Video　Coding）ともいう）とは、一般には、粗い画像信号を伝送するレイヤと精細な画像信号を伝送するレイヤとを階層的に符号化する技術をいう。スケーラブル符号化において階層化される典型的な属性は、主に次の３種類である。
　　－空間スケーラビリティ：空間解像度あるいは画像サイズが階層化される。
　　－時間スケーラビリティ：フレームレートが階層化される。
　　－ＳＮＲ（Signal　to　Noise　Ratio）スケーラビリティ：ＳＮ比が階層化される。
さらに、標準規格で未だ採用されていないものの、ビット深度スケーラビリティ及びクロマフォーマットスケーラビリティもまた議論されている。

　スケーラブル符号化では、レイヤ間で共有可能なパラメータを１つのレイヤ内でのみ符号化することで、符号化効率を高めることができる。例えば、Ｈ．２６４／ＡＶＣ　Ａｎｎｅｘ　Ｇ　ＳＶＣでは、参照画像情報がレイヤ間で共有され得る。

Benjamin　Bross,　Woo-Jin　Han,　Jens-Rainer　Ohm,　Gary　J.　Sullivan,　Thomas　Wiegand,　"High　efficiency　video　coding　(HEVC)　text　specification　draft　6"（JCTVC-H1003　ver20,　2012年2月17日） Ajay　Luthra,　Jens-Rainer　Ohm,　Joern　Ostermann,　"Draft　requirements　for　the　scalable　enhancement　of　HEVC"（ISO/IEC　JTC1/SC29/WG11　N12400，2011年11月）

　しかしながら、複数のレイヤを互いに異なる画像符号化方式で符号化する場合には、サポートされるモードの相違を原因として、レイヤ間でのパラメータの共有が難しくなる。例えば、Ｈ．２６４／ＡＶＣ（以下、単にＡＶＣという）又はＭＰＥＧ２などの旧来の画像符号化方式とＨＥＶＣとでは、イントラ予測及びインター予測のためにサポートされる予測モードのセットが異なる。しかし、イントラ予測及びインター予測は、本来、画像の空間的相関又は時間的相関を利用して符号量を削減する技術であり、それら相関の特性はレイヤ間で大きく変化しない。

　従って、スケーラブル符号化において複数のレイヤを異なる画像符号化方式で符号化する場合にも、予測モードを適切にマッピングすることにより、予測モード情報のために要する符号量を削減することが可能である。

　本開示によれば、第１の符号化方式で復号されるベースレイヤ内の第１のブロックについて、第１の予測モードセットのうち予測モード情報により指定される予測モードで予測画像を生成するベースレイヤ予測部と、前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で復号されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために指定された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成するエンハンスメントレイヤ予測部と、を備える画像処理装置が提供される。

　上記画像処理装置は、典型的には、画像を復号する画像復号装置として実現され得る。

　また、本開示によれば、第１の符号化方式で復号されるベースレイヤ内の第１のブロックについて、第１の予測モードセットのうち予測モード情報により指定される予測モードで予測画像を生成することと、前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で復号されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために指定された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成することと、を含む画像処理方法が提供される。

　また、本開示によれば、第１の符号化方式で符号化されるベースレイヤ内の第１のブロックについて、第１の予測モードセットから選択される最適な予測モードで予測画像を生成するベースレイヤ予測部と、前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で符号化されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために選択された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成するエンハンスメントレイヤ予測部と、を備える画像処理装置が提供される。

　上記画像処理装置は、典型的には、画像を符号化する画像符号化装置として実現され得る。

　また、本開示によれば、第１の符号化方式で符号化されるベースレイヤ内の第１のブロックについて、第１の予測モードセットから選択される最適な予測モードで予測画像を生成することと、前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で符号化されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために選択された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成することと、を含む画像処理方法が提供される。

　本開示に係る技術によれば、スケーラブル符号化において複数のレイヤを異なる画像符号化方式で符号化する場合に、予測モード情報のために要する符号量を削減することができる。

スケーラブル符号化について説明するための説明図である。ＡＶＣにおけるイントラ予測の予測モードセットについて説明するための第１の説明図である。ＡＶＣにおけるイントラ予測の予測モードセットについて説明するための第２の説明図である。ＡＶＣにおけるインター予測の予測モードセットについて説明するための第１の説明図である。ＡＶＣにおけるインター予測の予測モードセットについて説明するための第２の説明図である。ＨＥＶＣにおけるイントラ予測の予測モードセットについて説明するための第１の説明図である。ＨＥＶＣにおけるイントラ予測の予測モードセットについて説明するための第２の説明図である。ＨＥＶＣにおけるインター予測の予測モードセットについて説明するための第１の説明図である。ＨＥＶＣにおけるインター予測の予測モードセットについて説明するための第２の説明図である。ＡＶＣとＨＥＶＣとの間のイントラ予測の予測モードセットのマッピングの一例について説明するための説明図である。エンハンスメントレイヤにおける予測方向の絞り込みについて説明するための説明図である。ＡＶＣとＨＥＶＣとの間のインター予測の予測モードセットのマッピングの第１の例について説明するための説明図である。ＡＶＣとＨＥＶＣとの間のインター予測の予測モードセットのマッピングの第２の例について説明するための説明図である。一実施形態に係る画像符号化装置の概略的な構成を示すブロック図である。一実施形態に係る画像復号装置の概略的な構成を示すブロック図である。図９に示した第１符号化部及び第２符号化部の構成の一例を示すブロック図である。図１１に示したイントラ予測部の詳細な構成の一例を示すブロック図である。図１１に示したインター予測部の詳細な構成の一例を示すブロック図である。一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。符号化時のエンハンスメントレイヤのためのイントラ予測処理の詳細な流れの一例を示すフローチャートである。符号化時のエンハンスメントレイヤのための動き探索処理の詳細な流れの一例を示すフローチャートである。図１０に示した第１復号部及び第２復号部の構成の一例を示すブロック図である。図１６に示したイントラ予測部の詳細な構成の一例を示すブロック図である。図１６に示したインター予測部の詳細な構成の一例を示すブロック図である。一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。復号時のエンハンスメントレイヤのためのイントラ予測処理の詳細な流れの一例を示すフローチャートである。復号時のエンハンスメントレイヤのための動き補償処理の詳細な流れの一例を示すフローチャートである。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。スケーラブル符号化の用途の第１の例について説明するための説明図である。スケーラブル符号化の用途の第２の例について説明するための説明図である。スケーラブル符号化の用途の第３の例について説明するための説明図である。マルチビューコーデックについて説明するための説明図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　また、以下の順序で説明を行う。
　　１．概要
　　　１－１．スケーラブル符号化
　　　１－２．ベースレイヤのための予測モードセット
　　　１－３．エンハンスメントレイヤのための予測モードセット
　　　１－４．予測モードのマッピング
　　　１－５．エンコーダの基本的な構成例
　　　１－６．デコーダの基本的な構成例
　　２．一実施形態に係る符号化部の構成例
　　　２－１．全体的な構成
　　　２－２．イントラ予測部の詳細な構成
　　　２－３．インター予測部の詳細な構成
　　３．一実施形態に係る符号化時の処理の流れ
　　４．一実施形態に係る復号部の構成例
　　　４－１．全体的な構成
　　　４－２．イントラ予測部の詳細な構成
　　　４－３．インター予測部の詳細な構成
　　５．一実施形態に係る復号時の処理の流れ
　　６．変形例
　　　６－１．予測モードの拡張
　　　６－２．符号化方式の組合せに応じた切替え
　　７．応用例
　　　７－１．様々な製品への応用
　　　７－２．スケーラブル符号化の様々な用途
　　　７－３．その他
　　８．まとめ

　＜１．概要＞
　　［１－１．スケーラブル符号化］
　スケーラブル符号化においては、一連の画像をそれぞれ含む複数のレイヤが符号化される。ベースレイヤ（base　layer）は、最初に符号化される、最も粗い画像を表現するレイヤである。ベースレイヤの符号化ストリームは、他のレイヤの符号化ストリームを復号することなく、独立して復号され得る。ベースレイヤ以外のレイヤは、エンハンスメントレイヤ（enhancement　layer）と呼ばれる、より精細な画像を表現するレイヤである。エンハンスメントレイヤの符号化ストリームは、ベースレイヤの符号化ストリームに含まれる情報を用いて符号化される。従って、エンハンスメントレイヤの画像を再現するためには、ベースレイヤ及びエンハンスメントレイヤの双方の符号化ストリームが復号されることになる。スケーラブル符号化において扱われるレイヤの数は、２つ以上のいかなる数であってもよい。３つ以上のレイヤが符号化される場合には、最下位のレイヤがベースレイヤ、残りの複数のレイヤがエンハンスメントレイヤである。より上位のエンハンスメントレイヤの符号化ストリームは、より下位のエンハンスメントレイヤ又はベースレイヤの符号化ストリームに含まれる情報を用いて符号化され及び復号され得る。本明細書では、依存関係を有する少なくとも２つのレイヤのうち、依存される側のレイヤを下位レイヤ（lower　layer）、依存する側のレイヤを上位レイヤ（upper　layer）という。

　図１は、スケーラブル符号化される３つのレイヤＬ１、Ｌ２及びＬ３を示している。レイヤＬ１はベースレイヤであり、レイヤＬ２及びＬ３はエンハンスメントレイヤである。なお、ここでは、様々な種類のスケーラビリティのうち、空間スケーラビリティを例にとっている。レイヤＬ２のレイヤＬ１に対する空間解像度の比は、２：１である。レイヤＬ３のレイヤＬ１に対する空間解像度の比は、４：１である。レイヤＬ１のブロックＢ１は、ベースレイヤのピクチャ内の予測処理の処理単位である。レイヤＬ２のブロックＢ２は、ブロックＢ１と共通するシーンを映したエンハンスメントレイヤのピクチャ内の予測処理の処理単位である（ＨＥＶＣでは、当該処理単位を予測単位という）。ブロックＢ２は、レイヤＬ１のブロックＢ１に対応する。レイヤＬ３のブロックＢ３は、ブロックＢ１及びＢ２と共通するシーンを映したより上位のエンハンスメントレイヤのピクチャ内の予測処理の処理単位である。ブロックＢ３は、レイヤＬ１のブロックＢ１及びレイヤＬ２のブロックＢ２に対応する。

　このようなレイヤ構造において、あるレイヤの画像の空間的相関は、通常、共通するシーンに対応する他のレイヤの画像の空間的相関と類似する。例えば、レイヤＬ１においてブロックＢ１がある方向の隣接ブロックとの間の強い相関を有する場合、レイヤＬ２においてブロックＢ２が同じ方向の隣接ブロックとの間で強い相関を有する可能性が高い。同様に、あるレイヤの画像の時間的相関は、通常、共通するシーンに対応する他のレイヤの画像の時間的相関と類似する。例えば、レイヤＬ１においてブロックＢ１がある参照ピクチャ内の参照ブロックとの間の強い相関を有する場合、レイヤＬ２においてブロックＢ２が（レイヤのみ異なる）同じ参照ピクチャ内の対応する参照ブロックとの間で強い相関を有する可能性が高い。レイヤＬ２とレイヤＬ３との間にも同じことが言える。

　従って、スケーラブル符号化において、上述したような相関特性のレイヤ間の類似性を利用して、イントラ予測及びインター予測の予測モード情報をレイヤ間で共有する（再利用する）ことが可能である。それにより、符号化効率は高められる。しかし、上記非特許文献２において提案されているように、複数のレイヤが互いに異なる画像符号化方式で符号化される場合には、サポートされる予測モードセットが同一ではないことが、予測モード情報の共有の妨げとなり得る。

　以下の説明では、一例として、ベースレイヤがＡＶＣ（Advanced　Video　Coding）で符号化され、エンハンスメントレイヤがＨＥＶＣ（High　Efficiency　Video　Coding）で符号化されるものとする。但し、本開示に係る技術は、かかる例に限定されず、他の画像符号化方式の組合せ（例えば、ベースレイヤがＭＰＥＧ２で符号化され、エンハンスメントレイヤがＨＥＶＣで符号化される、など）にも適用可能である。また、レイヤ間で画像の空間的相関及び時間的相関が類似するという点は、図１に例示した空間スケーラビリティのみならず、ＳＮＲスケーラビリティ、ビット深度スケーラビリティ及びクロマフォーマットスケーラビリティにおいても同様である。本開示に係る技術は、これら種類のスケーラビリティを実現するスケーラブル符号化にも適用可能である。

　また、本開示に係る技術のいくつかのアイディアは、エンハンスメントレイヤがＨＥＶＣで符号化されるスケーラブル符号化に一般に適用可能である。この場合、ベースレイヤは、ＡＶＣ、ＭＰＥＧ２又はＨＥＶＣなどのいかなる符号化方式で符号化されていてもよい。

　　［１－２．ベースレイヤのための予測モードセット］
　　　（１）イントラ予測
　図２Ａ及び図２Ｂを用いて、ＡＶＣにおけるイントラ予測の予測モードセットについて説明する。

　図２Ａを参照すると、ＡＶＣにおいて、４×４画素又は８×８画素のサイズを有する輝度成分の予測ブロックについて使用され得る９種類の予測モード（モード０～モード８）が示されている。モード０における予測方向は、垂直方向である。モード１における予測方向は、水平方向である。モード２は、ＤＣ予測を表す。モード３における予測方向は、斜め左下である。モード４における予測方向は、斜め右下である。モード５における予測方向は、垂直右である。モード６における予測方向は、水平下である。モード７における予測方向は、垂直左である。モード８における予測方向は、水平上である。ここで、ＤＣ予測とは、いわゆる平均値予測に相当し、複数の参照画素の画素値の平均を予測画素値として用いる予測モードである。ＤＣ予測以外の８種類の予測モードは、それぞれ、特定の予測方向と関連付けられる。予測方向の角度分解能は、２２．５度である。

　図２Ｂを参照すると、ＡＶＣにおいて、１６×１６画素のサイズを有する輝度成分の予測ブロックについて使用され得る４種類の予測モード（モード０～モード３）が示されている。モード０における予測方向は、垂直方向である。モード１における予測方向は、水平方向である。モード２は、ＤＣ予測を表す。モード３は、平面予測を表す。ここで、平面予測とは、上及び左の参照画素の画素値から内挿される値を予測画素値として用いる予測モードである。色差成分のイントラ予測ブロックについても、モード番号は異なるものの、図２Ｂに示した４種類の予測モードが選択可能である。

　　　（２）インター予測
　次に、図３Ａ及び図３Ｂを用いて、ＡＶＣにおけるインター予測の予測モードセットについて説明する。

　ＡＶＣにおけるインター予測（動き補償）では、１６×１６画素、１６×８画素、８×１６画素、８×８画素、８×４画素、４×８画素及び４×４画素という７通りのサイズから選択されるブロックサイズを有する予測ブロックごとに、参照画像番号と動きベクトルとを決定することができる。そして、動きベクトル情報の符号量を削減するために、動きベクトルの予測が行われる。

　図３Ａを参照すると、予測ブロックＰＴｅに隣接する３つの隣接ブロックＢＬａ、ＢＬｂ及びＢＬｃが示されている。これら隣接ブロックＢＬａ、ＢＬｂ及びＢＬｃに設定された動きベクトルを、それぞれ動きベクトルＭＶａ、ＭＶｂ及びＭＶｃとする。予測ブロックＰＴｅについての予測動きベクトルＰＭＶｅは、次のような予測式を用いて、動きベクトルＭＶａ、ＭＶｂ及びＭＶｃから算出され得る。

　ここで、式（１）におけるｍｅｄはメディアンオペレーションを表す。即ち、式（１）によれば、予測動きベクトルＰＭＶｅは、動きベクトルＭＶａ、ＭＶｂ及びＭＶｃの水平成分の中央値と垂直成分の中央値とを成分とするベクトルである。なお、例えば予測ブロックＰＴｅが画像の端部に位置するために、動きベクトルＭＶａ、ＭＶｂ又はＭＶｃのいずれかが存在しない場合には、存在しない動きベクトルは、メディアンオペレーションの引数から省略されてもよい。予測動きベクトルＰＭＶｅが決定されると、さらに、次式に従って差分動きベクトルＭＶＤｅが算出される。なお、ＭＶｅは、予測ブロックＰＴｅについて動き補償のために利用されるべき実際の動きベクトルを表す。

　ＡＶＣでは、このように算出される差分動きベクトルＭＶＤｅを表す動きベクトル情報及び参照画像情報が、インター予測ブロックごとに符号化され得る。

　また、動きベクトル情報の符号量をさらに削減するために、ＡＶＣでは、主にＢピクチャを対象として、いわゆるダイレクトモードがサポートされる。ダイレクトモードでは、動きベクトル情報は符号化されず、符号化済みの予測ブロックの動きベクトル情報から符号化対象の予測ブロックの動きベクトル情報が生成される。ダイレクトモードには、空間ダイレクトモード及び時間ダイレクトモードという２つの種類が存在する。例えば、空間ダイレクトモードにおいては、予測ブロックＰＴｅについての動きベクトルＭＶｅは、上述した予測式（１）を用いて、次式のように決定され得る。

　図３Ｂは、時間ダイレクトモードの考え方を概略的に示している。図３Ｂにおいて、符号化対象画像ＩＭ０１のＬ０参照ピクチャである参照画像ＩＭＬ０、及び符号化対象画像ＩＭ０１のＬ１参照ピクチャである参照画像ＩＭＬ１が示されている。参照画像ＩＭＬ０内のブロックＢｃｏｌは、符号化対象画像ＩＭ０１内の予測ブロックＰＴｅのコロケーテッドブロックである。ここで、コロケーテッドブロックＢｃｏｌに設定された動きベクトルをＭＶｃｏｌとする。また、符号化対象画像ＩＭ０１と参照画像ＩＭＬ０との間の時間軸上の距離をＴＤ_Ｂ、参照画像ＩＭＬ０と参照画像ＩＭＬ１との間の時間軸上の距離をＴＤ_Ｄとする。すると、時間ダイレクトモードにおいては、予測ブロックＰＴｅについての動きベクトルＭＶＬ０及びＭＶＬ１は、次式のように決定され得る。

　ＡＶＣでは、スライスごとに、空間ダイレクトモード及び時間ダイレクトモードのいずれが利用可能であるかが指定される。そして、ブロックごとに、ダイレクトモードが利用されるか否かが指定される。

　さらに、ＡＶＣでは、ブロック（マクロブロック）ごとにスキップモードを指定することができる。スキップモードに指定されたブロック（スキップト・マクロブロックという）においては、ブロック情報（例えば、動き情報及び予測誤差データなど）は符号化されず、予測動きベクトルを用いて補償される予測画素がそのまま復号画素として使用され得る。

　また、ＡＶＣでは、動き補償のために利用される参照画像の方向（前方参照又は後方参照）を、ブロックごとに指定することができる。指定される参照方向がＬ０予測である場合には、通常、Ｌ０参照ピクチャを用いて前方向予測が行われる。指定される参照方向がＬ１予測である場合には、通常、Ｌ１参照ピクチャを用いて後方向予測が行われる。指定される参照方向が双予測である場合には、Ｌ０参照ピクチャ及びＬ１参照ピクチャの双方を用いた予測が行われる。なお、Ｌ０参照ピクチャ及びＬ１参照ピクチャの双方が同じ方向に存在してもよい。イントラ予測モード若しくはダイレクトモードが適用されるブロック、又はスキップトマクロブロックにおいては、参照方向は指定されない。

　　［１－３．エンハンスメントレイヤのための予測モードセット］
　　　（１）イントラ予測
　次に、図４Ａ及び図４Ｂを用いて、ＨＥＶＣにおけるイントラ予測の予測モードセットについて説明する。

　ＨＥＶＣにおいても、ＡＶＣと同様、ＤＣ予測及び平面予測に加えて、様々な予測方向と関連付けられる複数の予測モードが使用され得る。但し、ＨＥＶＣにおける角度予測法（Angular　Prediction）では、ＡＶＣと比較して、予測方向の角度分解能が高められている。

　図４Ａは、ＨＥＶＣの角度予測法において選択可能な予測方向の候補を示している。図４Ａに示した画素Ｐ１は、予測対象画素である。画素Ｐ１が属するブロックの周囲の網掛けされた画素は、参照画素である。ブロックサイズが４×４画素である場合には、図中で実線（太線及び細線の双方）で示された、参照画素と予測対象画素とを結ぶ１７種類の予測方向（に対応する予測モード）が、（ＤＣ予測に加えて）選択可能である。ブロックサイズが８×８画素、１６×１６画素又は３２×３２画素である場合には、図中で点線並びに実線（太線及び細線の双方）で示された３３種類の予測方向（に対応する予測モード）が、（ＤＣ予測及び平面予測に加えて）選択可能である。ブロックサイズが６４×６４画素である場合には、図中で太線で示された２種類の予測方向（に対応する予測モード）が、（ＤＣ予測に加えて）選択可能である。角度分解能（隣り合う予測方向の間の角度差）は、最も高いケースで１８０度／３２＝５．６２５度である。

　さらに、ＨＥＶＣにおいて、色差成分の予測単位については、同じブロックの輝度成分に基づいて色差成分の予測画像を生成するための輝度ベース色差予測モードがサポートされる。輝度ベース色差予測モードでは、動的に計算される係数を有する線型関数が予測関数として用いられることから、当該予測モードを線型モデル（ＬＭ：Linear　Model）モードともいう。予測関数の引数は（必要に応じてダウンサンプリングされる）輝度成分の値であり、戻り値は色差成分の予測画素値である。より具体的には、ＬＭモードにおける予測関数は、次のような線型一次関数であってよい：

　式（６）において、Ｒｅ_Ｌ´（ｘ，ｙ）は、復号画像（いわゆるリコンストラクト画像）の輝度成分のダウンサンプリングされた値を表す。輝度成分のダウンサンプリング（あるいは位相シフト）は、クロマフォーマットに依存して色差成分の密度が輝度成分の密度と異なる場合に行われ得る。α及びβは、所定の計算式を用いて隣接ブロックの画素値から計算される係数である。

　例えば、図４Ｂを参照すると、クロマフォーマットが４：２：０である場合の、１６×１６画素のサイズを有する輝度成分（Ｌｕｍａ）の予測単位（ＰＵ）及び対応する色差成分（Ｃｈｒｏｍａ）のＰＵが概念的に示されている。輝度成分の密度は、水平方向及び垂直方向の各々について色差成分の密度の２倍である。各ＰＵの周囲に位置し、図中で塗りつぶされている丸印は、上記予測関数の係数α、βを算出する際に参照される参照画素である。図中右において斜線で網掛けされている丸印は、ダウンサンプリングされた輝度成分である。このようにダウンサンプリングされた輝度成分の値を上記予測関数の右辺のＲｅ_Ｌ´（ｘ，ｙ）に代入することにより、共通する画素位置の色差成分の予測値が算出される。クロマフォーマットが４：２：０である場合、図４Ｂの例のように、２×２個の輝度成分ごとに１つの輝度成分の入力値（予測関数へ代入される値）がダウンサンプリングにより生成される。参照画素も同様にダウンサンプリングされ得る。

　予測関数の係数α及びβは、それぞれ次の式（７）及び式（８）に従って算出される。なお、Ｉは参照画素数を表す。

　上述した説明から理解されるように、ＨＥＶＣのイントラ予測のためにサポートされる予測モードセットは、ＡＶＣのイントラ予測のためにサポートされる予測モードセットと同一でない。例えば、輝度成分に着目すると、あるブロックサイズにおいて、ＨＥＶＣではＤＣ予測モード及び平面（Planar）予測モードがサポートされるのに対して、ＡＶＣでは平面予測モードがサポートされない。また、色差成分に着目すると、ＨＥＶＣではＬＭモードがサポートされるのに対して、ＡＶＣではＬＭモードはサポートされない。従って、ベースレイヤにおいてＡＶＣによりサポートされる予測モードセットから選択される予測モードを単純にエンハンスメントレイヤにおいて再利用すると、エンハンスメントレイヤにおいて、符号化効率の観点でより良好な予測モードが見過ごされかねない。

　　　（２）インター予測
　次に、図５Ａ及び図５Ｂを用いて、ＨＥＶＣにおけるインター予測の予測モードセットについて説明する。

　ＨＥＶＣでは、インター予測のための予測モードとして、新たにマージモードがサポートされる。マージモードとは、ある予測ブロックを、空間方向又は時間方向の近傍の参照ブロックのうち動き情報が共通するブロックとマージすることにより、当該予測ブロックについて動き情報の符号化を省略する予測モードである。空間方向に予測ブロックをマージするモードを空間マージモード、時間方向に予測ブロックをマージするモードを時間マージモードともいう。

　例えば、図５Ａを参照すると、符号化対象画像ＩＭ１０内の予測ブロックＰＴｅが示されている。ブロックＢ１１及びＢ１２は、それぞれ予測ブロックＰＴｅの左及び上の隣接ブロックである。動きベクトルＭＶ１０は、予測ブロックＰＴｅについて算出される動きベクトルである。動きベクトルＭＶ１１及びＭＶ１２は、それぞれ隣接ブロックＢ１１及びＢ１２について算出される参照動きベクトルである。さらに、参照画像ＩＭ１ｒｅｆ内に、予測ブロックＰＴｅのコロケーテッドブロックＢｃｏｌが示されている。動きベクトルＭＶｃｏｌは、コロケーテッドブロックＢｃｏｌについて算出される参照動きベクトルである。

　図５Ａの例において、動きベクトルＭＶ１０が参照動きベクトルＭＶ１１又はＭＶ１２と等しい場合、予測ブロックＰＴｅが空間的にマージされることを示すマージ情報が符号化され得る。実際には、当該マージ情報は、予測ブロックＰＴｅがいずれの隣接ブロックとマージされるかも示し得る。また、動きベクトルＭＶ１０が参照動きベクトルＭＶｃｏｌと等しい場合、予測ブロックＰＴｅが時間的にマージされることを示すマージ情報が符号化され得る。予測ブロックＰＴｅが空間的に又は時間的にマージされる場合、予測ブロックＰＴｅについて動きベクトル情報及び参照画像情報は符号化されない。

　予測ブロックＰＴｅが他のブロックとマージされない場合には、予測ブロックＰＴｅについて動きベクトル情報が符号化される。ＨＥＶＣにおいて、動きベクトル情報が符号化されるモードを、ＡＭＶＰ（Advanced　Motion　Vector　Prediction）モードという。ＡＭＶＰモードでは、動き情報として、プレディクタ情報、差分動きベクトル情報及び参照画像情報が符号化され得る。ＡＭＶＰモードのプレディクタは、ＡＶＣにおける上述した予測式と異なり、メディアンオペレーションを含まない。

　例えば、図５Ｂを参照すると、符号化対象画像内の予測ブロックＰＴｅが再び示されている。ブロックＢ２１～Ｂ２５は、予測ブロックＰＴｅに隣接する隣接ブロックである。ブロックＢｃｏｌは、参照画像内の予測ブロックＰＴｅのコロケーテッドブロックである。空間プレディクタが利用される場合、プレディクタ情報は、ブロックＢ２１～Ｂ２５のいずれかを指し示す。時間プレディクタが利用される場合、プレディクタ情報は、ブロックＢｃｏｌを指し示す。そして、プレディクタ情報が指し示す参照ブロックの動きベクトルが、予測ブロックＰＴｅについての予測動きベクトルＰＭＶｅとして利用される。予測ブロックＰＴｅについての差分動きベクトルＭＶＤｅは、式（２）と同じ計算式によって算出される。空間プレディクタが利用されるＡＭＶＰモードを空間的動きベクトル予測モード、時間プレディクタが利用されるＡＭＶＰモードを時間的動きベクトル予測モードともいう。

　上述した説明から理解されるように、ＨＥＶＣのインター予測のためにサポートされる予測モードセットは、ＡＶＣのインター予測のためにサポートされる予測モードセットと同一ではない。例えば、ＡＶＣによりサポートされるダイレクトモードは、ＨＥＶＣによりサポートされない。また、ＨＥＶＣによりサポートされるマージモードは、ＡＶＣによりサポートされない。また、ＨＥＶＣのＡＭＶＰモードにおいて動きベクトルを予測するために利用されるプレディクタは、ＡＶＣにおいて利用されるプレディクタと異なる。従って、ベースレイヤにおいてＡＶＣによりサポートされる予測モードセットから選択される予測モードを、単純にエンハンスメントレイヤにおいて再利用することは困難である。

　なお、ＨＥＶＣにおいても、動き補償のための参照方向として、Ｌ０予測、Ｌ１予測及び双予測のいずれかがブロックごとに指定され得る。イントラ予測モードが適用されるブロックにおいては、参照方向は指定されない。

　　［１－４．予測モードのマッピング］
　スケーラブル符号化において複数のレイヤを異なる画像符号化方式で符号化する場合にイントラ予測又はインター予測の予測モードをレイヤ間で共有しなければ、予測モード情報の符号量の増大によって、符号化効率が低下し得る。また、符号化の際の予測モードの探索のために、より多くの処理コストが必要となる。そこで、本開示に係る技術では、予測モードセットの異なる画像符号化方式の間の予測モードのマッピングを定義することにより、ベースレイヤで選択された予測モードに基づいてエンハンスメントレイヤで予測モードを選択することを可能とする。

　予測モードのマッピングは、例えば、以下に説明する３つの基準に従って定義されてよい。ここで、ベースレイヤは第１の予測モードセットを有する第１の符号化方式で符号化され、エンハンスメントレイヤは第２の予測モードセットを有する第２の符号化方式で符号化されるものとする。また、第１のブロックはベースレイヤ内の予測ブロックであり、第２のブロックはエンハンスメントレイヤ内の第１のブロックに対応する予測ブロックであるものとする。

　まず、第１の基準として、第１のブロックのために選択されなかった第１の予測モードセット内の予測モードに対応する第２の予測モードセット内の予測モードは、第２のブロックのための選択から除外される。第２の基準として、第２のブロックにおいて選択の候補となる予測モード（以下、候補モードという）は、第１のブロックのために選択された予測モードに対応する予測モード、及び第１の予測モードセット内に対応する予測モードが存在しない予測モードを含んでよい。また、特にインター予測に関し、第３の基準として、画像の空間的相関に基づく予測モードが第１のブロックのために選択された場合には、画像の空間的相関に基づく予測モードが第２のブロックのために選択される。同様に、画像の時間的相関に基づく予測モードが第１のブロックのために選択された場合には、画像の時間的相関に基づく予測モードが第２のブロックのために選択される。なお、これら基準は、どのように組み合わされてもよい。また、追加的な基準が導入されてもよく、一部の基準が省略されてもよい。

　　　（１）イントラ予測の予測モードのマッピング
　図６は、ＡＶＣとＨＥＶＣとの間のイントラ予測の予測モードセットのマッピングの一例について説明するための説明図である。図６を参照すると、左側にＡＶＣの予測モードセットＰＭＳ１、右側にＨＥＶＣの予測モードセットＰＭＳ２がリストアップされている。

　例えば、ベースレイヤ内の輝度成分（Ｌｕｍａ）の８×８画素の予測ブロック（第１のブロック）について、予測モードセットＰＭＳ１は、ＤＣ予測モード、及び特定の予測方向とそれぞれ関連付けられる８種類の予測モード（図中の“Ｏｔｈｅｒｓ”）を含む。スケーラビリティ比が１：２であるとすると、エンハンスメントレイヤ内の対応する輝度成分の予測ブロック（第２のブロック）のサイズは、１６×１６画素である。第２のブロックについて、予測モードセットＰＭＳ２は、ＤＣ予測モード、平面予測モード、及び特定の予測方向とそれぞれ関連付けられる複数の角度予測モードを含む。ここで、予測モードセットＰＭＳ１から第１のブロックのためにＤＣ予測モードが選択された場合、第２のブロックのための予測モードの選択から、角度予測モードが除外される。結果的に、エンコーダは、第２の予測ブロックについて、候補モードをＤＣ予測モード及び平面予測モードの２つに絞り込み、これら２つの候補モードのうち最適な予測モードを選択する。この場合、１ビットの予測モード情報のみが符号化ストリーム内に符号化されれば十分である。デコーダは、かかる予測モード情報を復号して、第２のブロックのためにＤＣ予測モード又は平面予測モードを選択する。

　また、例えば、ベースレイヤ内の輝度成分（Ｌｕｍａ）の１６×１６画素の予測ブロック（第１のブロック）について、予測モードセットＰＭＳ１は、ＤＣ予測モード、平面予測モード並びに垂直方向及び水平方向とそれぞれ関連付けられる２種類の予測モードを含む。スケーラビリティ比が１：２であるとすると、エンハンスメントレイヤ内の対応する輝度成分の予測ブロック（第２のブロック）のサイズは、３２×３２画素である。第２のブロックについて、予測モードセットＰＭＳ２は、ＤＣ予測モード、平面予測モード、及び特定の予測方向とそれぞれ関連付けられる複数の角度予測モードを含む。ここで、予測モードセットＰＭＳ１から第１のブロックのためにＤＣ予測モードが選択された場合、第２のブロックのための予測モードの選択から、平面予測モード及び角度予測モードが除外される。結果的に、エンコーダは、第２の予測ブロックについて、候補モードをＤＣ予測モードのみに絞り込む。この場合には、候補モードが１つしか残らないため、エンコーダは、当該１つの候補モードであるＤＣ予測モードを選択する。この場合、予測モード情報は符号化されなくてよい。デコーダは、第１のブロックのために指定された予測モードを参照し、第２のブロックのためにＤＣ予測モードを選択する。予測モードセットＰＭＳ１から第１のブロックのために平面予測モードが選択された場合には、同様に、第２のブロックのために平面予測モードが選択される。

　ベースレイヤ内の輝度成分の８×８画素の予測ブロックである第１のブロックについて、例えば図２Ａに例示したモード７（垂直左）が選択されたものとする。この場合、第２のブロックのための予測モードの選択から、ＤＣ予測モード及び平面予測モードが除外される（平面予測モードは除外されなくてもよい）。さらに、図６の例では、予測方向の絞り込みもまた行われる。例えば、水平方向を０度とし、反時計回りに角度が増加するとすると、選択されたモード７の予測方向は、６７．５度である。共に選択されなかったモード０の予測方向は９０度、モード４の予測方向は４５度である。そこで、第２のブロックのための予測モードの選択において、角度予測モードの予測方向の範囲は、４５度より大きく９０度より小さい範囲内に絞り込まれ得る。結果的に、エンコーダは、第２の予測ブロックについて、候補モードを、５０．６２５度から８４．３７５度までの範囲内の７個の予測方向に対応する角度予測モードに絞り込み、これら候補モードのうち最適な予測モードを選択する（図７参照）。この場合、符号化される予測モード情報は、第１のブロックのために選択された予測モードと第２のブロックのために選択された予測モードとの間の予測方向の差分を示すパラメータであってよい。図７の例では、角度差θ＝５．６２５度を用いて、－３θ、－２θ、－θ、０、θ、２θ、３θにそれぞれ対応する７個の符号番号が予測モード情報のために与えられている。最適な予測方向のレイヤ間の角度差はゼロに近い確率が高いことから、より小さい角度差に対してより小さい符号番号を付与することで、可変長符号化後のエンハンスメントレイヤの符号量を効果的に削減することができる。なお、角度差θは、ブロックサイズに応じて他の値（例えば、１１．２５度など）であってもよい。

　また、例えば、ベースレイヤ内の色差成分（Ｃｈｒｏｍａ）の予測ブロック（第１のブロック）について、予測モードセットＰＭＳ１は、ＤＣ予測モード、平面予測モード並びに垂直方向及び水平方向とそれぞれ関連付けられる２種類の予測モード（図中の“Ｏｔｈｅｒｓ”）を含む。エンハンスメントレイヤ内の対応する色差成分の予測ブロック（第２のブロック）について、予測モードセットＰＭＳ２は、ＤＣ予測モード、平面予測モード、垂直方向及び水平方向とそれぞれ関連付けられる２種類の角度予測モード、並びにＬＭモードを含む。ここで、予測モードセットＰＭＳ１から第１のブロックのためにＤＣ予測モードが選択された場合、第２のブロックのための予測モードの選択から、平面予測モード及び角度予測モードが除外される。結果的に、エンコーダは、第２の予測ブロックについて、候補モードをＤＣ予測モード及びＬＭモードの２つに絞り込み、これら２つの候補モードのうち最適な予測モードを選択する。この場合、１ビットの予測モード情報のみが符号化ストリーム内に符号化されれば十分である。デコーダは、かかる予測モード情報を復号して、第２のブロックのためにＤＣ予測モード又はＬＭモードを選択する。予測モードセットＰＭＳ１から第１のブロックのためにＤＣ予測モード以外の予測モードが選択された場合にも、同様に、第２の予測ブロックについて、候補モードは、第１のブロックのために選択された予測モード及びＬＭモードの２つに絞り込まれる。

　　　（２）インター予測の予測モードのマッピング
　図８Ａは、ＡＶＣとＨＥＶＣとの間のインター予測の予測モードセットのマッピングの第１の例について説明するための説明図である。図８Ａを参照すると、左側にＡＶＣの予測モードセットＰＭＳ３、右側にＨＥＶＣの予測モードセットＰＭＳ４がリストアップされている。

　例えば、ベースレイヤ内の予測ブロック（第１のブロック）について、予測モードセットＰＭＳ３は、空間ダイレクトモード、時間ダイレクトモード及びその他の予測モードを含む。エンハンスメントレイヤ内の対応する予測ブロック（第２のブロック）について、予測モードセットＰＭＳ４は、空間的動きベクトル予測モード（空間的ＡＭＶＰモード）、空間マージモード、時間的動きベクトル予測モード（時間的ＡＭＶＰモード）及び時間マージモードを含む。ここで、予測モードセットＰＭＳ３から第１のブロックのために（画像の空間的相関に基づく）空間ダイレクトモードが選択された場合、第２のブロックのための候補モードは、（やはり画像の空間的相関に基づく）空間的動きベクトル予測モード及び空間マージモードの２つに絞り込まれる。エンコーダは、これら２つの候補モードのうち最適な予測モードを選択する。同様に、予測モードセットＰＭＳ３から第１のブロックのために（画像の時間的相関に基づく）時間ダイレクトモードが選択された場合、第２のブロックのための候補モードは、（やはり画像の時間的相関に基づく）時間的動きベクトル予測モード及び時間マージモードの２つに絞り込まれる。エンコーダは、これら２つの候補モードのうち最適な予測モードを選択する。予測モードセットＰＭＳ３から非ダイレクトモードが選択された場合には、第２のブロックのための候補モードは、絞り込まれなくてもよい。このようなマッピングによって、符号化される予測モード情報の符号量を削減すると共に、符号化の際の予測モードの探索のための処理コストを低減することができる。また、画像の相関特性の類似性に従って予測モードがマッピングされるため、エンハンスメントレイヤにおけるインター予測の予測精度を低下させることなく、符号量を削減することができる。

　図８Ｂは、ＡＶＣとＨＥＶＣとの間のインター予測の予測モードセットのマッピングの第２の例について説明するための説明図である。第２の例では、予測モードのマッピングのための上述した基準とは異なる第４の基準が導入される。第４の基準として、動きベクトル情報の符号化を省略することが第１のブロックのために選択された場合には、同様に動きベクトル情報の符号化を省略する予測モードが第２のブロックのために選択される。図８Ｂを参照すると、左側にＡＶＣの予測モードセットＰＭＳ３、右側にＨＥＶＣの予測モードセットＰＭＳ４が再びリストアップされている。但し、図８Ｂにおいては、予測モードセットＰＭＳ３がスキップモードを含むことが明示されている。

　例えば、第１のブロックのために空間若しくは時間ダイレクトモード又はスキップモードが指定された場合には、第２のブロックのための候補モードはマージモードに絞り込まれる。第１のブロックのために空間ダイレクトモードが指定された場合には、第２のブロックのための予測モードは、空間マージモードであってよい。同様に、第１のブロックのために時間ダイレクトモードが指定された場合には、第２のブロックのための予測モードは、時間マージモードであってよい。第１のブロックのためにスキップモードが指定された場合には、エンコーダは、第２のブロックのために、空間マージモード及び時間マージモードのうち最適な予測モードを選択し得る。一方、第１のブロックのためにダイレクトモード及びスキップモードとは異なる予測モードが指定された場合には、第２のブロックのための候補モードは動きベクトル予測モードに絞り込まれる。この場合、エンコーダは、第２のブロックのために、空間的動きベクトル予測モード及び時間的動きベクトル予測モードのうち最適な予測モードを選択し得る。このようなマッピングによっても、符号化される予測モード情報の符号量を削減すると共に、符号化の際の予測モードの探索のための処理コストを低減することができる。また、画像の相関特性の類似性に従って予測モードがマッピングされるため、エンハンスメントレイヤにおけるインター予測の予測精度を低下させることなく、符号量を削減することができる。

　ここで説明した２つの例のいずれにおいても、ベースレイヤ内の第１のブロックのために選択された参照方向が、エンハンスメントレイヤ内の第２のブロックのために再利用されてもよい。即ち、第１のブロックのためにＬ０予測が選択された場合には、対応する第２のブロックのためにＬ０予測が選択され得る。第１のブロックのためにＬ１予測が選択された場合には、対応する第２のブロックのためにＬ１予測が選択され得る。第１のブロックのために双予測が選択された場合には、対応する第２のブロックのために双予測が選択され得る。それにより、エンハンスメントレイヤにおいて参照方向を符号化するための符号量を削減することができる。

　なお、本項で示した予測モードのマッピングは一例に過ぎない。異なる形式のマッピングもまた利用可能である。

　　［１－５．エンコーダの基本的な構成例］
　図９は、スケーラブル符号化をサポートする、一実施形態に係る画像符号化装置１０の概略的な構成を示すブロック図である。図９を参照すると、画像符号化装置１０は、第１符号化部１ａ、第２符号化部１ｂ、共通メモリ２及び多重化部３を備える。

　第１符号化部１ａは、ベースレイヤ画像を符号化し、ベースレイヤの符号化ストリームを生成する。第２符号化部１ｂは、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤの符号化ストリームを生成する。共通メモリ２は、レイヤ間で共通的に利用される情報を記憶する。多重化部３は、第１符号化部１ａにより生成されるベースレイヤの符号化ストリームと、第２符号化部１ｂにより生成される１つ以上のエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

　　［１－６．デコーダの基本的な構成例］
　図１０は、スケーラブル符号化をサポートする、一実施形態に係る画像復号装置６０の概略的な構成を示すブロック図である。図１０を参照すると、画像復号装置６０は、逆多重化部５、第１復号部６ａ、第２復号部６ｂ及び共通メモリ７を備える。

　逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及び１つ以上のエンハンスメントレイヤの符号化ストリームに逆多重化する。第１復号部６ａは、ベースレイヤの符号化ストリームからベースレイヤ画像を復号する。第２復号部６ｂは、エンハンスメントレイヤの符号化ストリームからエンハンスメントレイヤ画像を復号する。共通メモリ７は、レイヤ間で共通的に利用される情報を記憶する。

　図９に例示した画像符号化装置１０において、ベースレイヤの符号化のための第１符号化部１ａの構成と、エンハンスメントレイヤの符号化のための第２符号化部１ｂの構成とは、互いに類似する。第１符号化部１ａにより生成され又は取得されるいくつかのパラメータは、共通メモリ２を用いてバッファリングされ、第２符号化部１ｂにより再利用される。次節では、そのような第１符号化部１ａ及び第２符号化部１ｂの構成について詳細に説明する。

　同様に、図１０に例示した画像復号装置６０において、ベースレイヤの復号のための第１復号部６ａの構成と、エンハンスメントレイヤの復号のための第２復号部６ｂの構成とは、互いに類似する。第１復号部６ａにより生成され又は取得されるいくつかのパラメータは、共通メモリ７を用いてバッファリングされ、第２復号部６ｂにより再利用される。さらに次の節では、そのような第１復号部６ａ及び第２復号部６ｂの構成について詳細に説明する。

　＜２．一実施形態に係る符号化部の構成例＞
　　［２－１．全体的な構成］
　図１１は、図９に示した第１符号化部１ａ及び第２符号化部１ｂの構成の一例を示すブロック図である。図１１を参照すると、第１符号化部１ａは、並び替えバッファ１２、減算部１３、直交変換部１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、レート制御部１８、逆量子化部２１、逆直交変換部２２、加算部２３、デブロックフィルタ２４、フレームメモリ２５、セレクタ２６及び２７、イントラ予測部３０ａ、及びインター予測部４０ａを備える。第２符号化部１ｂは、イントラ予測部３０ａの代わりにイントラ予測部３０ｂを、インター予測部４０ａの代わりにインター予測部４０ｂを備える。

　並び替えバッファ１２は、一連の画像データに含まれる画像を並び替える。並び替えバッファ１２は、符号化処理に係るＧＯＰ（Group　of　Pictures）構造に応じて画像を並び替えた後、並び替え後の画像データを減算部１３、イントラ予測部３０ａ又は３０ｂ、及びインター予測部４０ａ又は４０ｂへ出力する。

　減算部１３には、並び替えバッファ１２から入力される画像データ、及び後に説明するイントラ予測部３０ａ若しくは３０ｂ又はインター予測部４０ａ若しくは４０ｂから入力される予測画像データが供給される。減算部１３は、並び替えバッファ１２から入力される画像データと予測画像データとの差分である予測誤差データを算出し、算出した予測誤差データを直交変換部１４へ出力する。

　直交変換部１４は、減算部１３から入力される予測誤差データについて直交変換を行う。直交変換部１４により実行される直交変換は、例えば、離散コサイン変換（Discrete　Cosine　Transform：ＤＣＴ）又はカルーネン・レーベ変換などであってよい。直交変換部１４は、直交変換処理により取得される変換係数データを量子化部１５へ出力する。

　量子化部１５には、直交変換部１４から入力される変換係数データ、及び後に説明するレート制御部１８からのレート制御信号が供給される。量子化部１５は、変換係数データを量子化し、量子化後の変換係数データ（以下、量子化データという）を可逆符号化部１６及び逆量子化部２１へ出力する。また、量子化部１５は、レート制御部１８からのレート制御信号に基づいて量子化パラメータ（量子化スケール）を切り替えることにより、量子化データのビットレートを変化させる。

　可逆符号化部１６は、量子化部１５から入力される各レイヤの量子化データについて可逆符号化処理を行うことにより、各レイヤの符号化ストリームを生成する。また、可逆符号化部１６は、セレクタ２７から入力されるイントラ予測に関する情報又はインター予測に関する情報を符号化して、符号化パラメータを符号化ストリームのヘッダ領域内に多重化する。そして、可逆符号化部１６は、生成した符号化ストリームを蓄積バッファ１７へ出力する。

　蓄積バッファ１７は、可逆符号化部１６から入力される符号化ストリームを半導体メモリなどの記憶媒体を用いて一時的に蓄積する。そして、蓄積バッファ１７は、蓄積した符号化ストリームを、伝送路の帯域に応じたレートで、図示しない伝送部（例えば、通信インタフェース又は周辺機器との接続インタフェースなど）へ出力する。

　レート制御部１８は、蓄積バッファ１７の空き容量を監視する。そして、レート制御部１８は、蓄積バッファ１７の空き容量に応じてレート制御信号を生成し、生成したレート制御信号を量子化部１５へ出力する。例えば、レート制御部１８は、蓄積バッファ１７の空き容量が少ない時には、量子化データのビットレートを低下させるためのレート制御信号を生成する。また、例えば、レート制御部１８は、蓄積バッファ１７の空き容量が十分大きい時には、量子化データのビットレートを高めるためのレート制御信号を生成する。

　逆量子化部２１は、量子化部１５から入力される量子化データについて逆量子化処理を行う。そして、逆量子化部２１は、逆量子化処理により取得される変換係数データを、逆直交変換部２２へ出力する。

　逆直交変換部２２は、逆量子化部２１から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを復元する。そして、逆直交変換部２２は、復元した予測誤差データを加算部２３へ出力する。

　加算部２３は、逆直交変換部２２から入力される復元された予測誤差データとイントラ予測部３０ａ若しくは３０ｂ又はインター予測部４０ａ若しくは４０ｂから入力される予測画像データとを加算することにより、復号画像データ（いわゆるリコンストラクト画像）を生成する。そして、加算部２３は、生成した復号画像データをデブロックフィルタ２４及びフレームメモリ２５へ出力する。

　デブロックフィルタ２４は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタリング処理を行う。デブロックフィルタ２４は、加算部２３から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データをフレームメモリ２５へ出力する。

　フレームメモリ２５は、加算部２３から入力される復号画像データ、及びデブロックフィルタ２４から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。

　セレクタ２６は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部３０ａ又は３０ｂに供給する。また、セレクタ２６は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてインター予測部４０ａ又は４０ｂに供給する。

　セレクタ２７は、イントラ予測モードにおいて、イントラ予測部３０ａ又は３０ｂから出力されるイントラ予測の結果としての予測画像データを減算部１３へ出力すると共に、イントラ予測に関する情報を可逆符号化部１６へ出力する。また、セレクタ２７は、インター予測モードにおいて、インター予測部４０ａ又は４０ｂから出力されるインター予測の結果としての予測画像データを減算部１３へ出力すると共に、インター予測に関する情報を可逆符号化部１６へ出力する。セレクタ２７は、イントラ予測モードとインター予測モードとを、コスト関数値の大きさに応じて切り替える。

　イントラ予測部３０ａは、ベースレイヤの原画像データ及び復号画像データに基づいて、ＡＶＣの予測ブロックごとにイントラ予測処理を行う。例えば、イントラ予測部３０ａは、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、イントラ予測部３０ａは、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、イントラ予測部３０ａは、当該最適な予測モードに従ってベースレイヤの予測画像データを生成する。そして、イントラ予測部３０ａは、選択した最適な予測モードを表す予測モード情報を含むイントラ予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。また、イントラ予測部３０ａは、予測モード情報を共通メモリ２によりバッファリングさせる。

　イントラ予測部３０ｂは、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣの予測単位ごとにイントラ予測処理を行う。例えば、イントラ予測部３０ｂは、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、イントラ予測部３０ｂは、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、イントラ予測部３０ｂは、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。そして、イントラ予測部３０ｂは、選択した最適な予測モードを表す予測モード情報を含むイントラ予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。また、イントラ予測部３０ｂは、共通メモリ２によりバッファリングされるベースレイヤの予測モード情報を取得する。ベースレイヤの予測モード情報は、ＡＶＣによりサポートされる予測モードセット内のいずれかの予測モードを、予測ブロックごとに表す。イントラ予測部３０ｂは、かかる予測モード情報に基づいて、エンハンスメントレイヤのイントラ予測処理において探索される候補モード（ＨＥＶＣによりサポートされる予測モードセット内の予測モード）を絞り込む。

　インター予測部４０ａは、ベースレイヤの原画像データ及び復号画像データに基づいて、ＡＶＣの予測ブロックごとに動き探索処理を行う。例えば、インター予測部４０ａは、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、インター予測部４０ａは、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、インター予測部４０ａは、当該最適な予測モードに従ってベースレイヤの予測画像データを生成する。そして、インター予測部４０ａは、選択した最適な予測モードを表す予測モード情報と参照画像情報とを含むインター予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。また、インター予測部４０ａは、予測モード情報及び参照画像情報を、共通メモリ２によりバッファリングさせる。

　インター予測部４０ｂは、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣの予測単位ごとに動き探索処理を行う。例えば、インター予測部４０ｂは、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、インター予測部４０ｂは、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、インター予測部４０ｂは、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。そして、インター予測部４０ｂは、選択した最適な予測モードを表す予測モード情報と参照画像情報とを含むインター予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。また、インター予測部４０ｂは、共通メモリ２によりバッファリングされるベースレイヤの予測モード情報を取得する。ベースレイヤの予測モード情報は、ＡＶＣによりサポートされる予測モードセット内のいずれかの予測モードを、予測ブロックごとに表す。インター予測部４０ｂは、かかる予測モード情報に基づいて、エンハンスメントレイヤの動き探索処理において探索される候補モード（ＨＥＶＣによりサポートされる予測モードセット内の予測モード）を絞り込む。参照画像情報もまたレイヤ間で再利用されてよい。

　第１符号化部１ａは、ここで説明した一連の符号化処理を、ベースレイヤの一連の画像データについて実行する。第２符号化部１ｂは、ここで説明した一連の符号化処理を、エンハンスメントレイヤの一連の画像データについて実行する。エンハンスメントレイヤが複数存在する場合には、エンハンスメントレイヤの符号化処理は、エンハンスメントレイヤの数だけ繰り返され得る。ベースレイヤの符号化処理と、エンハンスメントレイヤの符号化処理とは、例えば、符号化単位又は予測単位などの処理単位ごとに同期して実行されてもよい。

　　［２－２．イントラ予測部の詳細な構成］
　図１２は、図１１に示したイントラ予測部３０ａ及び３０ｂの詳細な構成の一例を示すブロック図である。図１２を参照すると、イントラ予測部３０ａは、予測制御部３１ａ、予測部３５ａ及びモード判定部３６ａを有する。イントラ予測部３０ｂは、予測制御部３１ｂ、係数算出部３２ｂ、フィルタ３４ｂ、予測部３５ｂ及びモード判定部３６ｂを有する。

　　　（１）ベースレイヤのイントラ予測処理
　イントラ予測部３０ａの予測制御部３１ａは、ＡＶＣの仕様に従って、ベースレイヤのイントラ予測処理を制御する。例えば、予測制御部３１ａは、予測ブロックごとに、各色成分についてのイントラ予測処理を実行する。

　より具体的には、予測制御部３１ａは、図６に例示した予測モードセットＰＭＳ１内の複数の予測モードで予測部３５ａに各予測ブロックの予測画像を生成させ、モード判定部３６ａに最適な予測モードを判定させる。予測部３５ａは、予測制御部３１ａによる制御の下、各色成分について様々な候補モードに従って、各予測ブロックの予測画像を生成する。モード判定部３６ａは、原画像データと予測部３５ａから入力される予測画像データとに基づいて、各予測モードのコスト関数値を算出する。モード判定部３６ａは、算出したコスト関数値に基づき、各色成分についての最適な予測モードを選択する。そして、モード判定部３６ａは、選択した最適な予測モードを表す予測モード情報を含むイントラ予測に関する情報、コスト関数値、並びに各色成分の予測画像データを、セレクタ２７へ出力する。

　また、モード判定部３６ａは、ベースレイヤ内の予測ブロックごとの最適な予測モードを表す予測モード情報を、共通メモリ２内に設けられるモード情報バッファに格納する。

　　　（２）エンハンスメントレイヤのイントラ予測処理
　イントラ予測部３０ｂの予測制御部３１ｂは、ＨＥＶＣの仕様に従って、エンハンスメントレイヤのイントラ予測処理を制御する。例えば、予測制御部３１ｂは、予測単位ごとに、各色成分についてのイントラ予測処理を実行する。

　より具体的には、予測制御部３１ｂは、図６に例示した予測モードセットＰＭＳ２内の１つ以上の予測モード（候補モード）で予測部３５ｂに各予測単位の予測画像を生成させる。候補モードは、モード情報バッファから取得されるベースレイヤ（又は下位レイヤ）の予測モード情報に基づいて絞り込まれる。候補モードが複数存在する場合には、予測制御部３１ｂは、モード判定部３６ｂに最適な予測モードを判定させる。

　係数算出部３２ｂは、ＬＭモードにおいて、予測部３５ｂにより使用される予測関数の係数を、上述した式（７）及び式（８）に従って算出する。フィルタ３４ｂは、輝度成分の画素値をクロマフォーマットに応じてダウンサンプリングすることにより、ＬＭモードの予測関数への入力値を生成する。

　予測部３５ｂは、予測制御部３１ｂにより指定される候補モードに従って、各予測単位の予測画像を生成する。

　例えば、輝度成分の予測対象の予測単位（以下、注目ＰＵという）のブロックサイズが１６×１６画素であり、対応するベースレイヤ内の予測ブロック（以下、対応ブロックという）のブロックサイズが８×８画素であるものとする。対応ブロックのためにＤＣ予測モードが選択されたことをベースレイヤの予測モード情報が示す場合には、候補モードは、ＤＣ予測モード及び平面予測モードに絞り込まれる。この場合、予測部３５ｂは、ＤＣ予測モードの予測画像と平面予測モードの予測画像とを生成する。

　また、例えば、輝度成分の注目ＰＵのブロックサイズが３２×３２画素であり、対応ブロックのブロックサイズが１６×１６画素であるものとする。対応ブロックのためにＤＣ予測モードが選択されたことをベースレイヤの予測モード情報が示す場合には、候補モードは、ＤＣ予測モードのみに絞り込まれる。同じケースで対応ブロックのために平面予測モードが選択されたことをベースレイヤの予測モード情報が示す場合には、候補モードは、平面予測モードのみに絞り込まれる。

　また、例えば、輝度成分の注目ＰＵに対応する対応ブロックのために特定の予測方向に関連付けられる予測モードが選択されたことをベースレイヤの予測モード情報が示す場合には、候補モードは、角度予測モードに絞り込まれる。さらに、角度予測モードにおける予測方向は、ベースレイヤの予測モードの予測方向に近い範囲内に絞り込まれ得る。

　また、例えば、色差成分の注目ＰＵについては、候補モードは、対応ブロックのために選択された予測モード及びＬＭモードに絞り込まれる。

　モード判定部３６ｂは、原画像データと予測部３５ｂから入力される予測画像データとに基づいて各予測モードのコスト関数値を算出する。そして、モード判定部３６ｂは、予測単位ごとに、各色成分についての予測モードを選択する。候補モードが複数存在する場合には、最小のコスト関数値を示す予測モードが選択され、絞り込まれた候補モードの中で選択された予測モードを示す予測モード情報が生成される。候補モードが１つしか存在しない場合には、予測モード情報は生成されなくてよい。そして、モード判定部３６ｂは、予測モード情報を含み得るイントラ予測に関する情報、コスト関数値、並びに各色成分の予測画像データを、セレクタ２７へ出力する。

　また、モード判定部３６ｂは、より上位のレイヤが存在する場合には、予測単位ごとの予測モード情報をモード情報バッファに格納してもよい。

　　［２－３．インター予測部の詳細な構成］
　図１３は、図１１に示したインター予測部４０ａ及び４０ｂの詳細な構成の一例を示すブロック図である。図１３を参照すると、インター予測部４０ａは、予測制御部４１ａ、予測部４２ａ及びモード判定部４３ａを有する。インター予測部４０ｂは、予測制御部４１ｂ、予測部４２ｂ及びモード判定部４３ｂを有する。

　　　（１）ベースレイヤの動き探索処理
　インター予測部４０ａの予測制御部４１ａは、ＡＶＣの仕様に従って、ベースレイヤの動き探索処理を制御する。例えば、予測制御部４１ａは、予測ブロックごとに、各色成分についての動き探索処理を実行する。

　より具体的には、予測制御部４１ａは、図８Ａ又は図８Ｂに例示した予測モードセットＰＭＳ３内の複数の予測モードで予測部４２ａに各予測ブロックの予測画像を生成させ、モード判定部４３ａに最適な予測モードを判定させる。予測部４２ａは、予測制御部４１ａによる制御の下、各色成分について様々な候補モードに従って、各予測ブロックの予測画像を生成する。モード判定部４３ａは、原画像データと予測部４２ａから入力される予測画像データとに基づいて、各予測モードのコスト関数値を算出する。モード判定部４３ａは、算出したコスト関数値に基づき、各色成分についての最適な予測モードを選択する。そして、モード判定部４３ａは、選択した最適な予測モードを表す予測モード情報と参照画像情報とを含むインター予測に関する情報、コスト関数値、並びに各色成分の予測画像データを、セレクタ２７へ出力する。

　また、モード判定部４３ａは、ベースレイヤ内の予測ブロックごとの予測モード情報と参照画像情報とを、共通メモリ２内に設けられる動き情報バッファに格納する。

　　　（２）エンハンスメントレイヤの動き探索処理
　インター予測部４０ｂの予測制御部４１ｂは、ＨＥＶＣの仕様に従って、エンハンスメントレイヤの動き探索処理を制御する。例えば、予測制御部４１ｂは、予測単位ごとに、各色成分についての動き探索処理を実行する。

　より具体的には、予測制御部４１ｂは、図８Ａ又は図８Ｂに例示した予測モードセットＰＭＳ４内の１つ以上の予測モード（候補モード）で予測部４２ｂに各予測単位の予測画像を生成させる。候補モードは、動き情報バッファから取得されるベースレイヤ（又は下位レイヤ）の予測モード情報に基づいて絞り込まれる。候補モードが複数存在する場合には、予測制御部４１ｂは、モード判定部４３ｂに最適な予測モードを判定させる。

　予測部４２ｂは、予測制御部４１ｂにより指定される候補モードに従って、各予測単位の予測画像を生成する。参照画像は、動き情報バッファから取得される参照画像情報に従って決定され得る。

　例えば、ベースレイヤ内の対応ブロックのために空間ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための候補モードは、空間マージモード及び空間的動きベクトル予測モードに絞り込まれる。この場合、予測部４２ｂは、空間マージモードの予測画像と空間的動きベクトル予測モードの予測画像とを生成する。その代わりに、ベースレイヤ内の対応ブロックのために空間ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための予測モードは、空間マージモードに決定されてもよい。

　また、例えば、ベースレイヤ内の対応ブロックのために時間ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための候補モードは、時間マージモード及び時間的動きベクトル予測モードに絞り込まれる。この場合、予測部４２ｂは、時間マージモードの予測画像と時間的動きベクトル予測モードの予測画像とを生成する。その代わりに、ベースレイヤ内の対応ブロックのために時間ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための予測モードは、時間マージモードに決定されてもよい。

　また、例えば、ベースレイヤ内の対応ブロックのためにスキップモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための予測モードは、マージモードに絞り込まれてもよい。この場合、予測部４２ｂは、空間マージモードの予測画像と時間マージモードの予測画像とを生成する。

　また、例えば、ベースレイヤ内の対応ブロックのために非ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための候補モードは絞り込まれず、予測部４２ｂは、ＨＥＶＣによりサポートされる全ての予測モードの予測画像を生成し得る。なお、図８Ｂに示した例のように、注目ＰＵのための候補モードは、ベースレイヤ内の対応ブロックのためにダイレクトモード又はスキップモードが選択されたか否かに依存して絞り込まれてもよい（例えば、これらモードが選択されなければ、注目ＰＵのための候補モードはＡＭＶＰモードに絞り込まれ得る）。

　さらに、例えば、予測部４２ｂは、レイヤ間で参照方向を再利用してもよい。この場合、予測部４２ｂは、ベースレイヤ内の対応ブロックのために使用された参照方向（Ｌ０予測、Ｌ１予測又は双予測）に従って予測画像を生成し得る。

　モード判定部４３ｂは、原画像データと予測部４２ｂから入力される予測画像データとに基づいて各予測モードのコスト関数値を算出する。そして、モード判定部４３ｂは、予測単位ごとに、各色成分についての予測モードを選択する。候補モードが複数存在する場合には、最小のコスト関数値を示す予測モードが選択され、絞り込まれた候補モードの中で選択された予測モードを示す予測モード情報が生成される。そして、モード判定部４３ｂは、予測モード情報を含み得るインター予測に関する情報、コスト関数値、並びに各色成分の予測画像データを、セレクタ２７へ出力する。

　また、モード判定部４３ａは、より上位のレイヤが存在する場合には、予測単位ごとの予測モード情報を動き情報バッファに格納してもよい。

　＜３．一実施形態に係る符号化時の処理の流れ＞
　　　（１）概略的な流れ
　図１４は、一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

　図１４を参照すると、まず、ベースレイヤのためのイントラ予測部３０ａは、ＡＶＣの仕様に従って、ベースレイヤのイントラ予測処理を実行する（ステップＳ１１）。イントラ予測部３０ａは、予測ブロックごとの予測モード情報を共通メモリ２に格納する。

　次に、ベースレイヤのためのインター予測部４０ａは、ＡＶＣの仕様に従って、ベースレイヤの動き探索処理を実行する（ステップＳ１２）。インター予測部４０ａは、予測ブロックごとの予測モード情報及び参照画像情報を共通メモリ２に格納する。

　次に、セレクタ２７は、イントラ予測部３０ａ及びインター予測部４０ａから入力されるコスト関数値を比較することにより、イントラ予測モード又はインター予測モードを選択する（ステップＳ１３）。

　次に、可逆符号化部１６は、イントラ予測モードが選択された場合には、イントラ予測部３０ａから入力されるイントラ予測に関する情報を符号化する。また、可逆符号化部１６は、インター予測モードが選択された場合には、インター予測部４０ａから入力されるインター予測に関する情報を符号化する（ステップＳ１４）。

　次に、ベースレイヤのある予測ブロックについてイントラ予測モードが選択された場合には（ステップＳ１５）、エンハンスメントレイヤためのイントラ予測部３０ｂは、エンハンスメントレイヤ内の対応する予測単位についてイントラ予測処理を実行する（ステップＳ１６）。ここで、予測モードの候補は、共通メモリ２から取得されるベースレイヤの予測モード情報に基づいて絞り込まれる。

　また、ベースレイヤのある予測ブロックについてインター予測モードが選択された場合には（ステップＳ１５）、エンハンスメントレイヤためのインター予測部４０ｂは、エンハンスメントレイヤ内の対応する予測単位について動き探索処理を実行する（ステップＳ１７）。ここで、予測モードの候補は、共通メモリ２から取得されるベースレイヤの予測モード情報に基づいて絞り込まれる。参照画像情報もまた再利用され得る。

　次に、可逆符号化部１６は、イントラ予測部３０ｂから入力されるイントラ予測に関する情報、又はインター予測部４０ｂから入力されるインター予測に関する情報を符号化する（ステップＳ１８）。

　　　（２）エンハンスメントレイヤのためのイントラ予測処理
　図１５Ａは、図１４のステップＳ１６に相当する、符号化時のエンハンスメントレイヤのためのイントラ予測処理の詳細な流れの一例を示すフローチャートである。

　図１５Ａを参照すると、まず、イントラ予測部３０ｂは、共通メモリ２によりバッファリングされるベースレイヤの予測モード情報を取得する（ステップＳ２１）。

　次に、イントラ予測部３０ｂは、取得した予測モード情報により示されるベースレイヤの予測モードに基づいて、エンハンスメントレイヤのためのイントラ予測の候補モードを絞り込む（ステップＳ２２）。

　次に、イントラ予測部３０ｂは、ステップＳ２２においてベースレイヤの予測モードに基づいて絞り込まれた候補モードの各々に従って、予測画像を生成する（ステップＳ２３）。

　次に、イントラ予測部３０ｂは、候補モードが複数存在する場合には（ステップＳ２４）、原画像データと予測画像データとに基づいて算出されるコストを評価することにより、最適な予測モードを選択する（ステップＳ２５）。また、イントラ予測部３０ｂは、絞り込まれた候補モードの中で選択された予測モードを示す予測モード情報を生成する（ステップＳ２６）。

　一方、イントラ予測部３０ｂは、候補モードが１つしか存在しない場合には（ステップＳ２４）、当該１つの候補モードを、最適な予測モードとして選択する（ステップＳ２７）。この場合には、予測モード情報は生成されない。

　　　（３）エンハンスメントレイヤのための動き探索処理
　図１５Ｂは、図１４のステップＳ１７に相当する、符号化時のエンハンスメントレイヤのための動き探索処理の詳細な流れの一例を示すフローチャートである。

　図１５Ｂを参照すると、まず、インター予測部４０ｂは、共通メモリ２によりバッファリングされるベースレイヤの予測モード情報及び参照画像情報を取得する（ステップＳ３１）。

　次に、インター予測部４０ｂは、取得した予測モード情報により示されるベースレイヤの予測モードに基づいて、エンハンスメントレイヤのためのインター予測の候補モードを絞り込む（ステップＳ３２）。

　次に、インター予測部４０ｂは、ステップＳ３２においてベースレイヤの予測モードに基づいて絞り込まれた候補モードの各々に従って、予測画像を生成する（ステップＳ３３）。

　図８Ａに示したマッピング例では、ベースレイヤにおいていずれの予測モードが選択された場合にも、エンハンスメントレイヤにおいて候補モードは複数存在する。そこで、インター予測部４０ｂは、次に、原画像データと予測画像データとに基づいて算出されるコストを評価することにより、最適な予測モードを選択する（ステップＳ３４）。

　次に、インター予測部４０ｂは、絞り込まれた候補モードの中で選択された予測モードを示す予測モード情報を生成する（ステップＳ３５）。なお、図８Ｂに示したマッピング例において、候補モードが１つしか存在しない場合には、当該１つの候補モードが最適な予測モードとして選択され、予測モード情報は生成されない。

　＜４．一実施形態に係る復号部の構成例＞
　　［４－１．全体的な構成］
　図１６は、図１０に示した第１復号部６ａ及び第２復号部６ｂの構成の一例を示すブロック図である。図１６を参照すると、第１復号部６ａは、蓄積バッファ６１、可逆復号部６２、逆量子化部６３、逆直交変換部６４、加算部６５、デブロックフィルタ６６、並び替えバッファ６７、Ｄ／Ａ（Digital　to　Analogue）変換部６８、フレームメモリ６９、セレクタ７０及び７１、イントラ予測部８０ａ並びにインター予測部９０ａを備える。第２復号部６ｂは、イントラ予測部８０ａの代わりにイントラ予測部８０ｂを、インター予測部９０ａの代わりにインター予測部９０ｂを備える。

　蓄積バッファ６１は、伝送路を介して入力される符号化ストリームを記憶媒体を用いて一時的に蓄積する。

　可逆復号部６２は、蓄積バッファ６１から入力される符号化ストリームを、符号化の際に使用された符号化方式に従って復号する。また、可逆復号部６２は、符号化ストリームのヘッダ領域に多重化されている情報を復号する。可逆復号部６２により復号される情報は、例えば、上述したイントラ予測に関する情報及びインター予測に関する情報を含み得る。可逆復号部６２は、イントラ予測に関する情報をイントラ予測部８０ａ又は８０ｂへ出力する。また、可逆復号部６２は、インター予測に関する情報をインター予測部９０ａ又は９０ｂへ出力する。

　逆量子化部６３は、可逆復号部６２による復号後の量子化データを逆量子化する。逆直交変換部６４は、符号化の際に使用された直交変換方式に従い、逆量子化部６３から入力される変換係数データについて逆直交変換を行うことにより、予測誤差データを生成する。そして、逆直交変換部６４は、生成した予測誤差データを加算部６５へ出力する。

　加算部６５は、逆直交変換部６４から入力される予測誤差データと、セレクタ７１から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部６５は、生成した復号画像データをデブロックフィルタ６６及びフレームメモリ６９へ出力する。

　デブロックフィルタ６６は、加算部６５から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データを並び替えバッファ６７及びフレームメモリ６９へ出力する。

　並び替えバッファ６７は、デブロックフィルタ６６から入力される画像を並び替えることにより、時系列の一連の画像データを生成する。そして、並び替えバッファ６７は、生成した画像データをＤ／Ａ変換部６８へ出力する。

　Ｄ／Ａ変換部６８は、並び替えバッファ６７から入力されるデジタル形式の画像データをアナログ形式の画像信号に変換する。そして、Ｄ／Ａ変換部６８は、例えば、画像復号装置６０と接続されるディスプレイ（図示せず）にアナログ画像信号を出力することにより、画像を表示させる。

　フレームメモリ６９は、加算部６５から入力されるフィルタリング前の復号画像データ、及びデブロックフィルタ６６から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。

　セレクタ７０は、可逆復号部６２により取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ６９からの画像データの出力先をイントラ予測部８０ａ又は８０ｂとインター予測部９０ａ又は９０ｂとの間で切り替える。例えば、セレクタ７０は、イントラ予測モードが指定された場合には、フレームメモリ６９から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部８０ａ又は８０ｂへ出力する。また、セレクタ７０は、インター予測モードが指定された場合には、フレームメモリ６９から供給されるフィルタリング後の復号画像データを参照画像データとしてインター予測部９０ａ又は９０ｂへ出力する。

　セレクタ７１は、可逆復号部６２により取得されるモード情報に応じて、加算部６５へ供給すべき予測画像データの出力元をイントラ予測部８０ａ又は８０ｂとインター予測部９０ａ又は９０ｂとの間で切り替える。例えば、セレクタ７１は、イントラ予測モードが指定された場合には、イントラ予測部８０ａ又は８０ｂから出力される予測画像データを加算部６５へ供給する。また、セレクタ７１は、インター予測モードが指定された場合には、インター予測部９０ａ又は９０ｂから出力される予測画像データを加算部６５へ供給する。

　イントラ予測部８０ａは、可逆復号部６２から入力されるイントラ予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてベースレイヤのイントラ予測処理を行い、予測画像データを生成する。そして、イントラ予測部８０ａは、生成したベースレイヤの予測画像データをセレクタ７１へ出力する。また、イントラ予測部８０ａは、予測モード情報を共通メモリ７によりバッファリングさせる。

　イントラ予測部８０ｂは、可逆復号部６２から入力されるイントラ予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤのイントラ予測処理を行い、予測画像データを生成する。そして、イントラ予測部８０ｂは、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。また、イントラ予測部８０ｂは、共通メモリ７によりバッファリングされるベースレイヤの予測モード情報を取得する。ベースレイヤの予測モード情報は、ＡＶＣによりサポートされる予測モードセット内のいずれかの予測モードを、予測ブロックごとに表す。イントラ予測部８０ｂは、かかる予測モード情報に基づいて、エンハンスメントレイヤのイントラ予測処理において指定される予測モード（ＨＥＶＣによりサポートされる予測モードセット内の予測モード）を絞り込む。

　インター予測部９０ａは、可逆復号部６２から入力されるインター予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてベースレイヤの動き補償処理を行い、予測画像データを生成する。そして、インター予測部９０ａは、生成したベースレイヤの予測画像データをセレクタ７１へ出力する。また、インター予測部９０ａは、予測モード情報及び参照画像情報を共通メモリ７によりバッファリングさせる。

　インター予測部９０ｂは、可逆復号部６２から入力されるインター予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤの動き補償処理を行い、予測画像データを生成する。そして、インター予測部９０ａは、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。また、インター予測部９０ｂは、共通メモリ７によりバッファリングされるベースレイヤの予測モード情報を取得する。ベースレイヤの予測モード情報は、ＡＶＣによりサポートされる予測モードセット内のいずれかの予測モードを、予測ブロックごとに表す。インター予測部９０ｂは、かかる予測モード情報に基づいて、エンハンスメントレイヤの動き補償処理において指定される予測モード（ＨＥＶＣによりサポートされる予測モードセット内の予測モード）を絞り込む。

　第１復号部６ａは、ここで説明した一連の復号処理を、ベースレイヤの一連の画像データについて実行する。第２復号部６ｂは、ここで説明した一連の復号処理を、エンハンスメントレイヤの一連の画像データについて実行する。エンハンスメントレイヤが複数存在する場合には、エンハンスメントレイヤの復号処理は、エンハンスメントレイヤの数だけ繰り返され得る。ベースレイヤの復号処理と、エンハンスメントレイヤの復号処理とは、例えば、符号化単位又は予測単位などの処理単位ごとに同期して実行されてもよい。

　　［４－２．イントラ予測部の詳細な構成］
　図１７は、図１６に示したイントラ予測部８０ａ及び８０ｂの詳細な構成の一例を示すブロック図である。図１７を参照すると、イントラ予測部８０ａは、予測制御部８１ａ及び予測部８５ａを有する。イントラ予測部８０ｂは、予測制御部８１ｂ、係数算出部８２ｂ、フィルタ８４ｂ及び予測部８５ｂを有する。

　　　（１）ベースレイヤのイントラ予測処理
　イントラ予測部８０ａの予測制御部８１ａは、ＡＶＣの仕様に従って、ベースレイヤのイントラ予測処理を制御する。例えば、予測制御部８１ａは、予測ブロックごとに、各色成分についてのイントラ予測処理を実行する。

　より具体的には、予測制御部８１ａは、可逆復号部６２から入力されるベースレイヤの予測モード情報を取得する。当該予測モード情報は、図６に例示した予測モードセットＰＭＳ１内のいずれかの予測モードを示す。予測部８５ａは、予測モード情報により示される予測モードに従って、各予測ブロックの予測画像を生成する。そして、予測部８５ａは、生成した予測画像データを、セレクタ７１へ出力する。

　また、予測制御部８１ａは、ベースレイヤ内の予測ブロックごとに指定された予測モードを表す予測モード情報を、共通メモリ７内に設けられるモード情報バッファに格納する。

　　　（２）エンハンスメントレイヤのイントラ予測処理
　イントラ予測部８０ｂの予測制御部８１ｂは、ＨＥＶＣの仕様に従って、エンハンスメントレイヤのイントラ予測処理を制御する。例えば、予測制御部８１ｂは、予測単位ごとに、各色成分についてのイントラ予測処理を実行する。

　より具体的には、予測制御部８１ｂは、モード情報バッファから取得されるベースレイヤ（又は下位レイヤ）の予測モード情報に基づいて、エンハンスメントレイヤのための候補モードを絞り込む。ここでの各候補モードは、図６に例示した予測モードセットＰＭＳ２内のいずれかの予測モードである。絞り込み後に候補モードが１つしか残らない場合には、予測制御部８１ｂは、当該１つの候補モードを選択する。一方、絞り込み後に候補モードが複数存在する場合には、予測制御部８１ｂは、可逆復号部６２から入力されるエンハンスメントレイヤの予測モード情報に基づいて、当該複数の候補モードから１つの候補モードを選択する。予測部８５ｂは、予測制御部８１ｂにより選択される予測モードに従って、各予測ブロックの予測画像を生成する。そして、予測部８５ｂは、生成した予測画像データを、セレクタ７１へ出力する。

　係数算出部８２ｂは、ＬＭモードにおいて、予測部８５ｂにより使用される予測関数の係数を、上述した式（７）及び式（８）に従って算出する。フィルタ８４ｂは、輝度成分の画素値をクロマフォーマットに応じてダウンサンプリングすることにより、ＬＭモードの予測関数への入力値を生成する。

　ベースレイヤの予測モードに基づくエンハンスメントレイヤの予測モードの絞り込みは、例えば、図６に示したマッピングに従って行われてよい。

　例えば、輝度成分の注目ＰＵのブロックサイズが１６×１６画素であり、ベースレイヤ内の対応ブロックのブロックサイズが８×８画素であるものとする。対応ブロックのためにＤＣ予測モードが指定されたことをベースレイヤの予測モード情報が示す場合には、候補モードは、ＤＣ予測モード及び平面予測モードに絞り込まれる。この場合、予測制御部８１ｂは、ＤＣ予測モード及び平面予測モードのうちエンハンスメントレイヤの予測モード情報により指定される予測モードを選択する。予測モード情報は、たかだか１ビットであってよい。

　また、例えば、輝度成分の注目ＰＵのブロックサイズが３２×３２画素であり、対応ブロックのブロックサイズが１６×１６画素であるものとする。対応ブロックのためにＤＣ予測モードが指定されたことをベースレイヤの予測モード情報が示す場合には、候補モードは、ＤＣ予測モードのみに絞り込まれる。同じケースで対応ブロックのために平面予測モードが指定されたことをベースレイヤの予測モード情報が示す場合には、候補モードは、平面予測モードのみに絞り込まれる。この場合、予測制御部８１ｂは、エンハンスメントレイヤの予測モード情報を取得しなくてよい。

　また、例えば、輝度成分の注目ＰＵに対応する対応ブロックのために特定の予測方向に関連付けられる予測モードが選択されたことをベースレイヤの予測モード情報が示す場合には、候補モードは、角度予測モードに絞り込まれる。さらに、角度予測モードにおける予測方向は、ベースレイヤの予測モードの予測方向に近い範囲内に絞り込まれ得る。この場合、予測制御部８１ｂは、ベースレイヤの予測モードの予測方向とエンハンスメントレイヤの予測モード情報により指定される予測方向の差分とを用いて、選択すべき予測モードの予測方向を決定する。そして、予測制御部８１ｂは、決定した予測方向に対応する予測モードを注目ＰＵのために選択する。

　また、例えば、色差成分の注目ＰＵについては、候補モードは、ベースレイヤ内の対応ブロックのために選択された予測モード及びＬＭモードに絞り込まれる。この場合、予測制御部８１ｂは、ベースレイヤ内の対応ブロックのために指定された予測モード及びＬＭモードのうちエンハンスメントレイヤの予測モード情報により指定される予測モードを選択する。予測モード情報は、たかだか１ビットであってよい。

　予測制御部８１ｂは、より上位のレイヤが存在する場合には、予測単位ごとの予測モード情報をモード情報バッファに格納してもよい。

　　［４－３．インター予測部の詳細な構成］
　図１８は、図１６に示したインター予測部９０ａ及び９０ｂの詳細な構成の一例を示すブロック図である。図１８を参照すると、インター予測部９０ａは、予測制御部９１ａ及び予測部９２ａを有する。インター予測部９０ｂは、予測制御部９１ｂ及び予測部９２ｂを有する。

　　　（１）ベースレイヤの動き補償処理
　インター予測部９０ａの予測制御部９１ａは、ＡＶＣの仕様に従って、ベースレイヤの動き補償処理を制御する。例えば、予測制御部９１ａは、予測ブロックごとに、各色成分についての動き補償処理を実行する。

　より具体的には、予測制御部９１ａは、可逆復号部６２から入力されるベースレイヤの予測モード情報を取得する。当該予測モード情報は、図８Ａ又は図８Ｂに例示した予測モードセットＰＭＳ３内のいずれかの予測モードを示す。予測部９２ａは、予測モード情報により示される予測モードに従って、各予測ブロックの予測画像を生成する。そして、予測部９２ａは、生成した予測画像データを、セレクタ７１へ出力する。

　また、予測制御部９１ａは、ベースレイヤ内の予測ブロックごとに指定された予測モードを表す予測モード情報及び参照画像情報を、共通メモリ７内に設けられる動き情報バッファに格納する。

　　　（２）エンハンスメントレイヤの動き補償処理
　インター予測部９０ｂの予測制御部９１ｂは、ＨＥＶＣの仕様に従って、エンハンスメントレイヤの動き補償処理を制御する。例えば、予測制御部９１ｂは、予測単位ごとに、各色成分についての動き補償処理を実行する。

　より具体的には、予測制御部９１ｂは、動き情報バッファから取得されるベースレイヤ（又は下位レイヤ）の予測モード情報に基づいて、エンハンスメントレイヤのための候補モードを絞り込む。ここでの各候補モードは、図８Ａ又は図８Ｂに例示した予測モードセットＰＭＳ４内のいずれかの予測モードである。また、予測制御部８１ｂは、可逆復号部６２から入力されるエンハンスメントレイヤの予測モード情報に基づいて、絞り込み後の複数の候補モードから１つの候補モードを選択する。予測部９２ｂは、予測制御部９１ｂにより選択される予測モードに従って、各予測ブロックの予測画像を生成する。参照画像は、動き情報バッファから取得される参照画像情報に従って決定され得る。そして、予測部９２ｂは、生成した予測画像データを、セレクタ７１へ出力する。

　ベースレイヤの予測モードに基づくエンハンスメントレイヤの予測モードの絞り込みは、例えば、図８Ａ又は図８Ｂに示したマッピングに従って行われてよい。

　例えば、ベースレイヤ内の対応ブロックのために空間ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための候補モードは、空間マージモード及び空間的動きベクトル予測モードに絞り込まれる。この場合、予測制御部９１ｂは、空間マージモード及び空間的動きベクトル予測モードのうちエンハンスメントレイヤの予測モード情報により指定される予測モードを選択する。その代わりに、ベースレイヤ内の対応ブロックのために空間ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、予測モード情報を参照することなく、注目ＰＵのための予測モードとして空間マージモードが選択されてもよい。

　また、例えば、ベースレイヤ内の対応ブロックのために時間ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための候補モードは、時間マージモード及び時間的動きベクトル予測モードに絞り込まれる。この場合、予測制御部９１ｂは、時間マージモード及び時間的動きベクトル予測モードのうちエンハンスメントレイヤの予測モード情報により指定される予測モードを選択する。その代わりに、ベースレイヤ内の対応ブロックのために時間ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、予測モード情報を参照することなく、注目ＰＵのための予測モードとして時間マージモードが選択されてもよい。

　また、例えば、ベースレイヤ内の対応ブロックのためにスキップモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための候補モードは、空間マージモード及び時間マージモードに絞り込まれてもよい。この場合、予測制御部９１ｂは、空間マージモード及び時間マージモードのうちエンハンスメントレイヤの予測モード情報により指定される予測モードを選択する。

　また、例えば、ベースレイヤ内の対応ブロックのために非ダイレクトモードが選択されたことをベースレイヤの予測モード情報が示す場合には、注目ＰＵのための候補モードは絞り込まれず、予測制御部９１ｂは、ＨＥＶＣによりサポートされる全ての予測モードのうちエンハンスメントレイヤの予測モード情報により指定される予測モードを選択し得る。なお、図８Ｂに示した例のように、注目ＰＵのための候補モードは、ベースレイヤ内の対応ブロックのためにダイレクトモード又はスキップモードが選択されたか否かに依存して絞り込まれてもよい。

　さらに、例えば、レイヤ間で参照方向が再利用されてもよい。この場合、予測制御部９１ｂは、ベースレイヤ内の対応ブロックのために使用された参照方向（Ｌ０予測、Ｌ１予測又は双予測）に従って、予測部９２ｂに予測画像を生成させ得る。

　予測制御部９１ｂは、より上位のレイヤが存在する場合には、予測単位ごとの予測モード情報を動き情報バッファに格納してもよい。

　＜５．一実施形態に係る復号時の処理の流れ＞
　　　（１）概略的な流れ
　図１９は、一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

　図１９を参照すると、まず、可逆復号部６２は、ベースレイヤの符号化パラメータを復号する（ステップＳ６１）。その後の処理は、復号されたパラメータにより各ブロックについてイントラ予測モード及びインター予測モードのいずれが指定されているかに応じて分岐する（ステップＳ６２）。

　イントラ予測モードが指定されている予測ブロックについて、ベースレイヤのためのイントラ予測部８０ａは、予測モード情報により指定される予測モードに従って、ベースレイヤのイントラ予測処理を実行する（ステップＳ６３）。イントラ予測部８０ａは、予測ブロックごとの予測モード情報を共通メモリ７に格納する。

　次に、可逆復号部６２は、エンハンスメントレイヤの符号化パラメータを復号する（ステップＳ６４）。そして、エンハンスメントレイヤためのイントラ予測部８０ｂは、エンハンスメントレイヤ内の対応する予測単位について、イントラ予測処理を実行する（ステップＳ６５）。ここでの予測モードの候補は、共通メモリ７から取得されるベースレイヤの予測モード情報に基づいて絞り込まれる。

　インター予測モードが指定されている予測ブロックについて、ベースレイヤのためのインター予測部９０ａは、予測モード情報及び参照画像情報に従って、ベースレイヤの動き補償処理を実行する（ステップＳ６６）。インター予測部９０ａは、予測ブロックごとの予測モード情報及び参照画像情報を共通メモリ７に格納する。

　次に、可逆復号部６２は、エンハンスメントレイヤの符号化パラメータを復号する（ステップＳ６７）。そして、エンハンスメントレイヤためのインター予測部９０ｂは、エンハンスメントレイヤ内の対応する予測単位について、動き補償処理を実行する（ステップＳ６８）。ここでの予測モードの候補は、共通メモリ７から取得されるベースレイヤの予測モード情報に基づいて絞り込まれる。参照画像情報もまた再利用され得る。

　　　（２）エンハンスメントレイヤのためのイントラ予測処理
　図２０Ａは、図１９のステップＳ６５に相当する、復号時のエンハンスメントレイヤのためのイントラ予測処理の詳細な流れの一例を示すフローチャートである。

　図２０Ａを参照すると、まず、イントラ予測部８０ｂは、共通メモリ７によりバッファリングされるベースレイヤの予測モード情報を取得する（ステップＳ７１）。

　次に、イントラ予測部８０ｂは、取得した予測モード情報により示されるベースレイヤの予測モードに基づいて、エンハンスメントレイヤのためのイントラ予測の候補モードを絞り込む（ステップＳ７２）。その後の処理は、絞り込み後の候補モードが複数存在するか否かに応じて分岐する（ステップＳ７３）。

　イントラ予測部８０ｂは、絞り込み後の候補モードが複数存在する場合には、エンハンスメントレイヤの予測モード情報を取得する（ステップＳ７４）。そして、イントラ予測部８０ｂは、絞り込み後の候補モードのうち、エンハンスメントレイヤの予測モード情報により示される予測モードを選択する（ステップＳ７５）。

　一方、イントラ予測部８０ｂは、絞り込み後の候補モードが１つしか存在しない場合には、当該１つの候補モードを選択する（ステップＳ７６）。この場合には、エンハンスメントレイヤの予測モード情報は取得されない。

　そして、イントラ予測部８０ｂは、ステップＳ７５又はステップＳ７６において選択された予測モードに従って、予測画像を生成する（ステップＳ７７）。

　　　（３）エンハンスメントレイヤのための動き補償処理
　図２０Ｂは、図１９のステップＳ６８に相当する、復号時のエンハンスメントレイヤのための動き補償処理の詳細な流れの一例を示すフローチャートである。

　図２０Ｂを参照すると、まず、インター予測部９０ｂは、共通メモリ７によりバッファリングされるベースレイヤの予測モード情報及び参照画像情報を取得する（ステップＳ８１）。

　次に、インター予測部９０ｂは、取得した予測モード情報により示されるベースレイヤの予測モードに基づいて、エンハンスメントレイヤのためのインター予測の候補モードを絞り込む（ステップＳ８２）。

　図８Ａに示したマッピング例では、ベースレイヤにおいていずれの予測モードが選択された場合にも、エンハンスメントレイヤにおいて候補モードは複数存在する。そこで、インター予測部９０ｂは、さらに、エンハンスメントレイヤの予測モード情報を取得する（ステップＳ８３）。そして、インター予測部９０ｂは、絞り込み後の候補モードのうち、エンハンスメントレイヤの予測モード情報により示される予測モードを選択する（ステップＳ８４）。

　そして、インター予測部９０ｂは、ステップＳ８４において選択された予測モードと再利用され得る参照画像情報とに従って、予測画像を生成する（ステップＳ８５）。なお、図８Ｂに示したマッピング例において、候補モードが１つしか存在しない場合には、インター予測部９０ｂは、エンハンスメントレイヤの予測モード情報を参照することなく、当該１つの候補モードと参照画像情報とに従って、予測画像を生成してもよい。

　＜６．変形例＞
　　［６－１．予測モードの拡張］
　エンハンスメントレイヤにおいてサポートされる予測モードセットは、シングルレイヤの通常の符号化においてサポートされる予測モードセットとは一致していなくてもよい。下位レイヤが存在するというエンハンスメントレイヤの特徴を活かして拡張された予測モードが、エンハンスメントレイヤにおいてサポートされてもよい。

　例えば、図８Ａ及び図８Ｂを用いて説明したように、ＨＥＶＣにおけるインター予測では、マージモード及び動きベクトル予測モードを含む複数の予測モードがサポートされる。ここで、ｉ番目の予測モードにおいて予測され（ＡＭＶＰモード）又は取得される（マージモード）注目ＰＵの候補予測動きベクトルをＰＭＶ_ｉとする。また、ベースレイヤ内の対応ブロックについて使用された動きベクトルをＭＶ_ｂａｓｅとする。一例としての拡張される予測モードにおいて、注目ＰＵについて使用される予測動きベクトルＰＭＶｅは、次の式（９）及び式（１０）に従って決定されてもよい。なお、番号ｋは、式（９）に示す通り、動きベクトルＭＶ_ｂａｓｅとの間で最も小さい差分を示す候補予測動きベクトルに対応する予測モードの番号である。

　ベースレイヤとエンハンスメントレイヤとの間で空間解像度が異なる場合には、解像度比に応じて動きベクトルＭＶ_ｂａｓｅをスケーリングした上で、上記式（９）が評価されてもよい。また、動きベクトルＭＶ_ｂａｓｅに対応する参照インデックスとｉ番目の予測モードに対応する参照インデックスとが異なる場合には、参照インデックスの相違に基づいて動きベクトルＭＶ_ｂａｓｅをスケーリングした上で、上記式（９）が評価されてもよい。参照インデックスとは、例えば“Parsing　Robustness　for　Merge/AMVP”（Toshiyasu　Sugio，　Takahiro　Nishi，　JCTVC-F470）において説明されているマージインデックス及びＡＭＶＰインデックスを含み得る。これらスケーリングによって、空間解像度又は参照画像の時間的位置が異なる状況で動きベクトルが算出される場合にも、それら動きベクトルを適切に比較して、最適な予測モードを決定することが可能となる。

　一般的に、ベースレイヤ内の対応ブロックの動きベクトルは、近傍ブロックの動きベクトルと比較して、エンハンスメントレイヤ内の注目ＰＵのための理想的な動きベクトルに、より近いと想定される。そのため、上述したように動きベクトルＭＶ_ｂａｓｅとの間で最も小さい差分を示す予測動きベクトルを選択することで、エンハンスメントレイヤにおいて動きベクトルの予測精度を高め、符号化効率を向上させることができる。なお、ベースレイヤの動きベクトルＭＶ_ｂａｓｅは、典型的には、共通メモリを用いてバッファリングされる。動きベクトルＭＶ_ｂａｓｅは、メモリリソースの消費を抑制するために、バッファリングの際に間引かれてもよい。その代わりに、動きベクトルＭＶ_ｂａｓｅは、バッファリングされることなく、ベースレイヤのリコンストラクト画像から再探索されてもよい。再探索の手法は、ＢＬＲ（spatial　scalability　using　BL　Reconstructed　pixel　only）モードという種類のスケーラブル符号化において特に有益である。

　式（９）において、動きベクトルＭＶ_ｂａｓｅとの間で最も小さい差分を示す予測動きベクトルに対応する複数の予測モード（複数のｋの解）が存在する場合には、動きベクトルＭＶ_ｂａｓｅに対応する参照インデックスと同じ参照インデックスを有する予測モードが、エンハンスメントレイヤのインター予測のために選択されてよい。それにより、エンハンスメントレイヤにおいてベースレイヤと同等の参照画像を用いて、精度の高い予測画像を生成することができる。動きベクトルＭＶ_ｂａｓｅに対応する参照インデックスと同じ参照インデックスを有する予測モードが１つでない（例えば２つ以上、又はゼロである）ときは、最も小さい差分を示す複数の予測モードのうち参照インデックスの最も小さい予測モードが、エンハンスメントレイヤのインター予測のために選択されてもよい。その代わりに、当該複数の予測モードのうちどの予測モードを使用すべきかを示すパラメータがエンコーダにおいてエンハンスメントレイヤの符号化ストリーム内に符号化され、デコーダにおいて復号されてもよい。

　　［６－２．符号化方式の組合せに応じた切替え］
　ここまで、ベースレイヤがＡＶＣで符号化され、エンハンスメントレイヤがＨＥＶＣで符号化される例を主に説明した。しかしながら、例えば、レイヤ間の参照方向の再利用、並びに、式（９）及び式（１０）を用いて説明した拡張された予測モードなどのアイディアは、エンハンスメントレイヤがＨＥＶＣで符号化されるスケーラブル符号化に一般に適用可能である。ベースレイヤの符号化方式は、ＡＶＣであってもよく、又はＨＥＶＣであってもよい。

　また、ＪＣＴＶＣにおいて、ベースレイヤにおいて使用される符号化方式を示すフラグをＶＰＳ（Video　Parameter　Set）内に符号化することが検討されている（例えば“NAL　unit　header　and　parameter　set　designs　for　HEVC　extensions”（Jill　Boyce，　Ye-Kui　Wang，　JCTVC-K1007）参照）。当該フラグは、例えば、ベースレイヤにおいてＡＶＣが使用される場合には“１”を、そうでなければ“０”を示し得る。上述した個々のアイディアは、ＶＰＳから復号されるこのフラグの値に応じて、有効化され又は無効化されてもよい。

　例えば、ベースレイヤの符号化方式としてＡＶＣが示された場合（エンハンスメントレイヤの符号化方式はＨＥＶＣ）に、本開示に係る技術に従って、エンハンスメントレイヤのための予測モードが絞り込まれてもよい。一方、ベースレイヤ及びエンハンスメントレイヤの符号化方式が共にＨＥＶＣである場合には、ベースレイヤ内の対応ブロックのために指定された予測モード（例えば、マージモード又はＡＭＶＰモード）が、そのままエンハンスメントレイヤ内の注目ＰＵのために選択（再利用）されてもよい。

　その代わりに、例えば、ベースレイヤ及びエンハンスメントレイヤの符号化方式が共にＨＥＶＣである場合にはベースレイヤにおいて指定された予測モードがエンハンスメントレイヤにおいて再利用され、ベースレイヤの符号化方式がＡＶＣである場合には、予測モード情報及びその他の情報（例えば、動き情報）が、シングルレイヤの通常の符号化と同様にエンハンスメントレイヤにおいて符号化されてもよい。後者の場合、エンハンスメントレイヤのインター予測は、ベースレイヤの動き情報を参照することなく、エンハンスメントレイヤの符号化ストリームから復号される予測モードで実行され得る。

　なお、ＡＶＣ及びＨＥＶＣの双方において、Ｐピクチャ及びＢピクチャ（インター予測が実行され得るピクチャ）内にイントラ予測ブロックを配置することが許容される。そこで、エンハンスメントレイヤのピクチャタイプに関わらず、ベースレイヤ内の対応ブロックについてイントラ予測が実行された場合には、エンハンスメントレイヤ内の注目ＰＵについてイントラ予測が実行されてもよい。その代わりに、ベースレイヤ内の対応ブロックについてイントラ予測が実行された場合、エンハンスメントレイヤのＰピクチャ又はＢピクチャ内の注目ＰＵについて、別途動き情報が符号化されてもよい。後者の場合、エンハンスメントレイヤのインター予測は、エンハンスメントレイヤの符号化ストリームから復号される動き情報を用いて実行され得る。

　ここで説明したような予測処理の切替えによって、スケーラブル符号化の用途に応じた柔軟な予測処理の設計を可能とし、エンハンスメントレイヤの予測精度を高めて符号化効率を一層向上させることができる。

　＜７．応用例＞
　　［７－１．様々な製品への応用］
　上述した実施形態に係る画像符号化装置１０及び画像復号装置６０は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

　　　（１）第１の応用例
　図２１は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース９０９、制御部９１０、ユーザインタフェース９１１、及びバス９１２を備える。

　チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

　デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからＥＰＧ（Electronic　Program　Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

　デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

　映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのＧＵＩ（Graphical　User　Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

　表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はＯＬＥＤなど）の映像面上に映像又は画像を表示する。

　音声信号処理部９０７は、デコーダ９０４から入力される音声データについてＤ／Ａ変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

　外部インタフェース９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

　制御部９１０は、ＣＰＵ（Central　Processing　Unit）などのプロセッサ、並びにＲＡＭ（Random　Access　Memory）及びＲＯＭ（Read　Only　Memory）などのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、プログラムデータ、ＥＰＧデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

　ユーザインタフェース９１１は、制御部９１０と接続される。ユーザインタフェース９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

　バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース９０９及び制御部９１０を相互に接続する。

　このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、テレビジョン装置９００での画像のスケーラブル復号に際して、複数のレイヤが異なる画像符号化方式で符号化される場合にも、予測モード情報のために要する符号量を削減することができる。

　　　（２）第２の応用例
　図２２は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

　アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

　携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

　音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをＡ／Ｄ変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

　記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、ＲＡＭ又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

　また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９の記憶媒体に記憶させる。

　また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、携帯電話機９２０での画像のスケーラブル符号化及び復号に際して、複数のレイヤが異なる画像符号化方式で符号化される場合にも、予測モード情報のために要する符号量を削減することができる。

　　　（３）第３の応用例
　図２３は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

　記録再生装置９４０は、チューナ９４１、外部インタフェース９４２、エンコーダ９４３、ＨＤＤ（Hard　Disk　Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen　Display）９４８、制御部９４９、及びユーザインタフェース９５０を備える。

　チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送手段としての役割を有する。

　外部インタフェース９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース９４２は、例えば、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース、ＵＳＢインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース９４２は、記録再生装置９４０における伝送手段としての役割を有する。

　エンコーダ９４３は、外部インタフェース９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

　ＨＤＤ９４４は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、ＨＤＤ９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

　ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばＤＶＤディスク（ＤＶＤ－Ｖｉｄｅｏ、ＤＶＤ－ＲＡＭ、ＤＶＤ－Ｒ、ＤＶＤ－ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）又はＢｌｕ－ｒａｙ（登録商標）ディスクなどであってよい。

　セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをＨＤＤ９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、ＨＤＤ９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

　デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをＯＳＤ９４８へ出力する。また、デコーダ９０４は、生成した音声データを外部のスピーカへ出力する。

　ＯＳＤ９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、ＯＳＤ９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を重畳してもよい。

　制御部９４９は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

　ユーザインタフェース９５０は、制御部９４９と接続される。ユーザインタフェース９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

　このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施形態に係る画像符号化装置１０の機能を有する。また、デコーダ９４７は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、記録再生装置９４０での画像のスケーラブル符号化及び復号に際して、複数のレイヤが異なる画像符号化方式で符号化される場合にも、予測モード情報のために要する符号量を削減することができる。

　　　（４）第４の応用例
　図２４は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

　撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、制御部９７０、ユーザインタフェース９７１、及びバス９７２を備える。

　光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、及び制御部９７０を相互に接続する。

　光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤ又はＣＭＯＳなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

　信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

　画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、ＯＳＤ９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

　ＯＳＤ９６９は、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を生成して、生成した画像を画像処理部９６４へ出力する。

　外部インタフェース９６６は、例えばＵＳＢ入出力端子として構成される。外部インタフェース９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース９６６は、ＬＡＮ又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース９６６は、撮像装置９６０における伝送手段としての役割を有する。

　メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はＳＳＤ（Solid　State　Drive）のような非可搬性の記憶部が構成されてもよい。

　制御部９７０は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

　ユーザインタフェース９７１は、制御部９７０と接続される。ユーザインタフェース９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

　このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、撮像装置９６０での画像のスケーラブル符号化及び復号に際して、複数のレイヤが異なる画像符号化方式で符号化される場合にも、予測モード情報のために要する符号量を削減することができる。

　　［７－２．スケーラブル符号化の様々な用途］
　上述したスケーラブル符号化の利点は、様々な用途において享受され得る。以下、３つの用途の例について説明する。

　　　（１）第１の例
　第１の例において、スケーラブル符号化は、データの選択的な伝送のために利用される。図２５を参照すると、データ伝送システム１０００は、ストリーム記憶装置１００１及び配信サーバ１００２を含む。配信サーバ１００２は、ネットワーク１００３を介して、いくつかの端末装置と接続される。ネットワーク１００３は、有線ネットワークであっても無線ネットワークであってもよく、又はそれらの組合せであってもよい。図２５には、端末装置の例として、ＰＣ（Personal　Computer）１００４、ＡＶ機器１００５、タブレット装置１００６及び携帯電話機１００７が示されている。

　ストリーム記憶装置１００１は、例えば、画像符号化装置１０により生成される多重化ストリームを含むストリームデータ１０１１を記憶する。多重化ストリームは、ベースレイヤ（ＢＬ）の符号化ストリーム及びエンハンスメントレイヤ（ＥＬ）の符号化ストリームを含む。配信サーバ１００２は、ストリーム記憶装置１００１に記憶されているストリームデータ１０１１を読み出し、読み出したストリームデータ１０１１の少なくとも一部分を、ネットワーク１００３を介して、ＰＣ１００４、ＡＶ機器１００５、タブレット装置１００６、及び携帯電話機１００７へ配信する。

　端末装置へのストリームの配信の際、配信サーバ１００２は、端末装置の能力又は通信環境などの何らかの条件に基づいて、配信すべきストリームを選択する。例えば、配信サーバ１００２は、端末装置が扱うことのできる画質を上回るほど高い画質を有する符号化ストリームを配信しないことにより、端末装置における遅延、オーバフロー又はプロセッサの過負荷の発生を回避してもよい。また、配信サーバ１００２は、高い画質を有する符号化ストリームを配信しないことにより、ネットワーク１００３の通信帯域が占有されることを回避してもよい。一方、配信サーバ１００２は、これら回避すべきリスクが存在しない場合、又はユーザとの契約若しくは何らかの条件に基づいて適切だと判断される場合に、多重化ストリームの全てを端末装置へ配信してもよい。

　図２５の例では、配信サーバ１００２は、ストリーム記憶装置１００１からストリームデータ１０１１を読み出す。そして、配信サーバ１００２は、高い処理能力を有するＰＣ１００４へ、ストリームデータ１０１１をそのまま配信する。また、ＡＶ機器１００５は低い処理能力を有するため、配信サーバ１００２は、ストリームデータ１０１１から抽出されるベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を生成し、ストリームデータ１０１２をＡＶ機器１００５へ配信する。また、配信サーバ１００２は、高い通信レートで通信可能であるタブレット装置１００６へストリームデータ１０１１をそのまま配信する。また、携帯電話機１００７は低い通信レートでしか通信できないため、配信サーバ１００２は、ベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を携帯電話機１００７へ配信する。

　このように多重化ストリームを用いることにより、伝送されるトラフィックの量を適応的に調整することができる。また、個々のレイヤがそれぞれ単独に符号化されるケースと比較して、ストリームデータ１０１１の符号量は削減されるため、ストリームデータ１０１１の全体が配信されるとしても、ネットワーク１００３に掛かる負荷は抑制される。さらに、ストリーム記憶装置１００１のメモリリソースも節約される。

　端末装置のハードウエア性能は、装置ごとに異なる。また、端末装置において実行されるアプリケーションのケイパビリティも様々である。さらに、ネットワーク１００３の通信容量もまた様々である。データ伝送のために利用可能な容量は、他のトラフィックの存在に起因して、時々刻々と変化し得る。そこで、配信サーバ１００２は、ストリームデータの配信を開始する前に、配信先の端末装置との間のシグナリングを通じて、端末装置のハードウエア性能及びアプリケーションケイパビリティなどに関する端末情報と、ネットワーク１００３の通信容量などに関するネットワーク情報とを取得してもよい。そして、配信サーバ１００２は、取得した情報に基づいて、配信すべきストリームを選択し得る。

　なお、復号すべきレイヤの抽出は、端末装置において行われてもよい。例えば、ＰＣ１００４は、受信した多重化ストリームから抽出され復号されるベースレイヤ画像をその画面に表示してもよい。また、ＰＣ１００４は、受信した多重化ストリームからベースレイヤの符号化ストリームを抽出してストリームデータ１０１２を生成し、生成したストリームデータ１０１２を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　図２５に示したデータ伝送システム１０００の構成は一例に過ぎない。データ伝送システム１０００は、いかなる数のストリーム記憶装置１００１、配信サーバ１００２、ネットワーク１００３、及び端末装置を含んでもよい。

　　　（２）第２の例
　第２の例において、スケーラブル符号化は、複数の通信チャネルを介するデータの伝送のために利用される。図２６を参照すると、データ伝送システム１１００は、放送局１１０１及び端末装置１１０２を含む。放送局１１０１は、地上波チャネル１１１１上で、ベースレイヤの符号化ストリーム１１２１を放送する。また、放送局１１０１は、ネットワーク１１１２を介して、エンハンスメントレイヤの符号化ストリーム１１２２を端末装置１１０２へ送信する。

　端末装置１１０２は、放送局１１０１により放送される地上波放送を受信するための受信機能を有し、地上波チャネル１１１１を介してベースレイヤの符号化ストリーム１１２１を受信する。また、端末装置１１０２は、放送局１１０１と通信するための通信機能を有し、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信する。

　端末装置１１０２は、例えば、ユーザからの指示に応じて、ベースレイヤの符号化ストリーム１１２１を受信し、受信した符号化ストリーム１１２１からベースレイヤ画像を復号してベースレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したベースレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　また、端末装置１１０２は、例えば、ユーザからの指示に応じて、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信し、ベースレイヤの符号化ストリーム１１２１とエンハンスメントレイヤの符号化ストリーム１１２２とを多重化することにより多重化ストリームを生成してもよい。また、端末装置１１０２は、エンハンスメントレイヤの符号化ストリーム１１２２からエンハンスメントレイヤ画像を復号してエンハンスメントレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したエンハンスメントレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

　上述したように、多重化ストリームに含まれる各レイヤの符号化ストリームは、レイヤごとに異なる通信チャネルを介して伝送され得る。それにより、個々のチャネルに掛かる負荷を分散させて、通信の遅延若しくはオーバフローの発生を抑制することができる。

　また、何らかの条件に応じて、伝送のために使用される通信チャネルが動的に選択されてもよい。例えば、データ量が比較的多いベースレイヤの符号化ストリーム１１２１は帯域幅の広い通信チャネルを介して伝送され、データ量が比較的少ないエンハンスメントレイヤの符号化ストリーム１１２２は帯域幅の狭い通信チャネルを介して伝送され得る。また、特定のレイヤの符号化ストリーム１１２２が伝送される通信チャネルが、通信チャネルの帯域幅に応じて切り替えられてもよい。それにより、個々のチャネルに掛かる負荷をより効果的に抑制することができる。

　なお、図２６に示したデータ伝送システム１１００の構成は一例に過ぎない。データ伝送システム１１００は、いかなる数の通信チャネル及び端末装置を含んでもよい。また、放送以外の用途において、ここで説明したシステムの構成が利用されてもよい。

　　　（３）第３の例
　第３の例において、スケーラブル符号化は、映像の記憶のために利用される。図２７を参照すると、データ伝送システム１２００は、撮像装置１２０１及びストリーム記憶装置１２０２を含む。撮像装置１２０１は、被写体１２１１を撮像することにより生成される画像データをスケーラブル符号化し、多重化ストリーム１２２１を生成する。多重化ストリーム１２２１は、ベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームを含む。そして、撮像装置１２０１は、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給する。

　ストリーム記憶装置１２０２は、撮像装置１２０１から供給される多重化ストリーム１２２１を、モードごとに異なる画質で記憶する。例えば、ストリーム記憶装置１２０２は、通常モードにおいて、多重化ストリーム１２２１からベースレイヤの符号化ストリーム１２２２を抽出し、抽出したベースレイヤの符号化ストリーム１２２２を記憶する。これに対し、ストリーム記憶装置１２０２は、高画質モードにおいて、多重化ストリーム１２２１をそのまま記憶する。それにより、ストリーム記憶装置１２０２は、高画質での映像の記録が望まれる場合にのみ、データ量の多い高画質のストリームを記録することができる。そのため、画質の劣化のユーザへの影響を抑制しながら、メモリリソースを節約することができる。

　例えば、撮像装置１２０１は、監視カメラであるものとする。撮像画像に監視対象（例えば侵入者）が映っていない場合には、通常モードが選択される。この場合、撮像画像は重要でない可能性が高いため、データ量の削減が優先され、映像は低画質で記録される（即ち、ベースレイヤの符号化ストリーム１２２２のみが記憶される）。これに対し、撮像画像に監視対象（例えば、侵入者である被写体１２１１）が映っている場合には、高画質モードが選択される。この場合、撮像画像は重要である可能性が高いため、画質の高さが優先され、映像は高画質で記録される（即ち、多重化ストリーム１２２１が記憶される）。

　図２７の例では、モードは、例えば画像解析結果に基づいて、ストリーム記憶装置１２０２により選択される。しかしながら、かかる例に限定されず、撮像装置１２０１がモードを選択してもよい。後者の場合、撮像装置１２０１は、通常モードにおいて、ベースレイヤの符号化ストリーム１２２２をストリーム記憶装置１２０２へ供給し、高画質モードにおいて、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給してもよい。

　なお、モードを選択するための選択基準は、いかなる基準であってもよい。例えば、マイクロフォンを通じて取得される音声の大きさ又は音声の波形などに応じて、モードが切り替えられてもよい。また、周期的にモードが切り替えられてもよい。また、ユーザがらの指示に応じてモードが切り替えられてもよい。さらに、選択可能なモードの数は、階層化されるレイヤの数を超えない限り、いかなる数であってもよい。

　図２７に示したデータ伝送システム１２００の構成は一例に過ぎない。データ伝送システム１２００は、いかなる数の撮像装置１２０１を含んでもよい。また、監視カメラ以外の用途において、ここで説明したシステムの構成が利用されてもよい。

　　［７－３．その他］
　　　（１）マルチビューコーデックへの応用
　マルチビューコーデックは、いわゆる多視点映像を符号化し及び復号するための画像符号化方式である。図２８は、マルチビューコーデックについて説明するための説明図である。図２８を参照すると、３つの視点においてそれぞれ撮影される３つのビューのフレームのシーケンスが示されている。各ビューには、ビューＩＤ（view_id）が付与される。これら複数のビューのうちいずれか１つのビューが、ベースビュー（base　view）に指定される。ベースビュー以外のビューは、ノンベースビューと呼ばれる。図２８の例では、ビューＩＤが“０”であるビューがベースビューであり、ビューＩＤが“１”又は“２”である２つのビューがノンベースビューである。

　本開示に係る技術に従って、マルチビューの画像データを符号化し又は復号する際、ベースビューのために指定された予測モードに基づいてノンベースビューのための予測モードを選択することにより、全体としての符号量を削減することができる。それにより、スケーラブル符号化のケースと同様に、マルチビューコーデックにおいても、符号化効率を一層向上させることができる。

　　　（２）ストリーミング技術への応用
　本開示に係る技術は、ストリーミングプロトコルに適用されてもよい。例えば、ＭＰＥＧ－ＤＡＳＨ（Dynamic　Adaptive　Streaming　over　HTTP）では、解像度などのパラメータが互いに異なる複数の符号化ストリームがストリーミングサーバにおいて予め用意される。そして、ストリーミングサーバは、複数の符号化ストリームからストリーミングすべき適切なデータをセグメント単位で動的に選択し、選択したデータを配信する。このようなストリーミングプロトコルにおいて、１つの符号化ストリームのために指定された予測モードに基づいて他の符号化ストリームのための予測モードが選択されてもよい。

　＜８．まとめ＞
　ここまで、図１～図２８を用いて、一実施形態に係る画像符号化装置１０及び画像復号装置６０について説明した。上述した実施形態によれば、スケーラブル符号化において複数のレイヤが異なる画像符号化方式で符号化される場合に、ベースレイヤ内の第１のブロックのために選択された予測モードに基づいて、第１のブロックに対応するエンハンスメントレイヤ内の第２のブロックのための予測モードが選択される。従って、エンハンスメントレイヤの予測モード情報のために要する符号量を削減し、符号化効率を高めることができる。

　また、上述した実施形態によれば、第１のブロックのために選択されなかった第１の予測モードセット内の予測モードに対応する第２の予測モードセット内の予測モードは、第２のブロックのための選択から除外される。従って、エンハンスメントレイヤについて、予測モードの候補を絞り込むことができる。それにより、予測モード情報に割当てられるビット数を削減することができる。

　また、上述した実施形態によれば、第１のブロックのために選択された予測モードに対応する予測モードのみならず、第２の予測モードセット内の予測モードのうちの第１の予測モードセット内に対応する予測モードが存在しない予測モードもまた、予測モードの候補に含められる。従って、エンハンスメントレイヤにおいてサポートされる第２の予測モードセットにのみ含まれる予測モードの利用の余地が残される。それにより、予測モード情報のために要する符号量を削減しつつ、より高い予測精度をも達成することができる。

　また、上述した実施形態によれば、画像の空間的相関に基づく予測モードが第１のブロックのために選択された場合には、画像の空間的相関に基づく予測モードが第２のブロックのために選択される。同様に、画像の時間的相関に基づく予測モードが第１のブロックのために選択された場合には、画像の時間的相関に基づく予測モードが第２のブロックのために選択される。従って、レイヤ間で共通する画像の相関特性を活用して、予測モード情報のために要する符号量を効果的に削減することができる。

　なお、本明細書では、イントラ予測に関する情報及びインター予測に関する情報が、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について主に説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　第１の符号化方式で復号されるベースレイヤ内の第１のブロックについて、第１の予測モードセットのうち予測モード情報により指定される予測モードで予測画像を生成するベースレイヤ予測部と、
　前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で復号されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために指定された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成するエンハンスメントレイヤ予測部と、
　を備える画像処理装置。
（２）
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために指定されなかった前記第１の予測モードセット内の予測モードに対応する前記第２の予測モードセット内の予測モードを、前記第２のブロックのための選択から除外する、前記（１）に記載の画像処理装置。
（３）
　前記エンハンスメントレイヤ予測部は、前記第２の予測モードセット内の、前記第１のブロックのために選択された予測モードに対応する予測モード、及び前記第１の予測モードセット内に対応する予測モードが存在しない予測モードのうち、予測モード情報により指定される予測モードを、前記第２のブロックのために選択する、前記（２）に記載の画像処理装置。
（４）
　前記第１の予測モードセット及び前記第２の予測モードセットは、イントラ予測のための予測モードのセットである、前記（１）～（３）のいずれか１項に記載の画像処理装置。
（５）
　前記第１の予測モードセットは、ＤＣ予測モードを含み、平面予測モードを含まず、
　前記第２の予測モードセットは、ＤＣ予測モード及び平面予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのためにＤＣ予測モードが指定された場合には、ＤＣ予測モード及び平面予測モードのうち前記第２のブロックのために指定される予測モードを選択する、
　前記（４）に記載の画像処理装置。
（６）
　前記第１の予測モードセットは、ＤＣ予測モード及び平面予測モードを含み、
　前記第２の予測モードセットは、ＤＣ予測モード及び平面予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのためにＤＣ予測モード及び平面予測モードの一方が指定された場合には、前記第２のブロックのためにＤＣ予測モード及び平面予測モードの当該一方を選択する、
　前記（４）に記載の画像処理装置。
（７）
　前記第１の予測モードセットは、複数の予測方向に対応する複数の予測モードを含み、
　前記第２の予測モードセットは、前記第１の予測モードセットよりも多くの予測方向に対応する複数の予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために指定された予測モードの予測方向に近い範囲内に絞り込まれる予測方向に対応する１つ以上の予測モードのうちのいずれかを前記第２のブロックのために選択する、
　前記（４）～（６）のいずれか１項に記載の画像処理装置。
（８）
　前記画像処理装置は、前記エンハンスメントレイヤの符号化ストリームから予測方向の差分を示すパラメータを復号する復号部、をさらに備え、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために指定された予測モードの予測方向と前記パラメータにより示される予測方向の前記差分とを用いて決定される予測方向に対応する予測モードを、前記第２のブロックのために選択する、
　前記（７）に記載の画像処理装置。
（９）
　前記第１の予測モードセットは、輝度ベース色差予測モードを含まず、
　前記第２の予測モードセットは、輝度ベース色差予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために指定された予測モード及び前記輝度ベース色差予測モードのうち、前記第２のブロックのために指定される予測モードを選択する、
　前記（４）～（８）のいずれか１項に記載の画像処理装置。
（１０）
　前記第１の予測モードセット及び前記第２の予測モードセットは、インター予測のための予測モードのセットである、前記（１）～（３）のいずれか１項に記載の画像処理装置。
（１１）
　前記エンハンスメントレイヤ予測部は、画像の空間的相関に基づく予測モードが前記第１のブロックのために指定された場合には、画像の空間的相関に基づく予測モードを前記第２のブロックのために選択し、画像の時間的相関に基づく予測モードが前記第１のブロックのために指定された場合には、画像の時間的相関に基づく予測モードを前記第２のブロックのために選択する、前記（１０）に記載の画像処理装置。
（１２）
　前記第１の予測モードセットは、空間ダイレクトモードを含み、
　前記第２の予測モードセットは、空間マージモード及び空間的動きベクトル予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために前記空間ダイレクトモードが指定された場合には、前記空間マージモード及び前記空間的動きベクトル予測モードのうち前記第２のブロックのために指定される予測モードを選択する、
　前記（１１）に記載の画像処理装置。
（１３）
　前記第１の予測モードセットは、時間ダイレクトモードを含み、
　前記第２の予測モードセットは、時間マージモード及び時間的動きベクトル予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために前記時間ダイレクトモードが指定された場合には、前記時間マージモード及び前記時間的動きベクトル予測モードのうち前記第２のブロックのために指定される予測モードを選択する、
　前記（１１）又は前記（１２）に記載の画像処理装置。
（１４）
　前記第１の符号化方式は、ＡＶＣ（Advanced　Video　Coding）であり、
　前記第２の符号化方式は、ＨＥＶＣ（High　Efficiency　Video　Coding）であり、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのためにダイレクトモード又はスキップモードが指定された場合には、マージモードを前記第２のブロックのために選択する、
　前記（１０）に記載の画像処理装置。
（１５）
　前記第１の符号化方式は、ＡＶＣ（Advanced　Video　Coding）であり、
　前記第２の符号化方式は、ＨＥＶＣ（High　Efficiency　Video　Coding）であり、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのためにダイレクトモード及びスキップモードとは異なる予測モードが指定された場合には、動きベクトル予測モードを前記第２のブロックのために選択する、
　前記（１０）に記載の画像処理装置。
（１６）
　前記ベースレイヤ予測部は、Ｌ０予測、Ｌ１予測及び双予測から選択される参照方向に従って、前記第１のブロックについてインター予測を実行し、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために使用された前記参照方向に従って、前記第２のブロックについてインター予測を実行する、
　前記（１０）～（１５）のいずれか１項に記載の画像処理装置。
（１７）
　第１の符号化方式で復号されるベースレイヤ内の第１のブロックについて、第１の予測モードセットのうち予測モード情報により指定される予測モードで予測画像を生成することと、
　前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で復号されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために指定された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成することと、
　を含む画像処理方法。
（１８）
　第１の符号化方式で符号化されるベースレイヤ内の第１のブロックについて、第１の予測モードセットから選択される最適な予測モードで予測画像を生成するベースレイヤ予測部と、
　前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で符号化されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために選択された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成するエンハンスメントレイヤ予測部と、
　を備える画像処理装置。
（１９）
　第１の符号化方式で符号化されるベースレイヤ内の第１のブロックについて、第１の予測モードセットから選択される最適な予測モードで予測画像を生成することと、
　前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で符号化されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために選択された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成することと、
　を含む画像処理方法。

　また、以下のような構成も本開示の技術的範囲に属する。
（１）
　第１の符号化方式で復号されるベースレイヤ内の第１のブロックについて、第１の動きベクトルを用いてインター予測を実行することにより、予測画像を生成するベースレイヤ予測部と、
　第２の符号化方式で復号されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第２の符号化方式のインター予測のための予測モードセットのうち、前記第１の動きベクトルとの間で最も小さい差分を示す予測動きベクトルに対応する予測モードでインター予測を実行することにより、予測画像を生成するエンハンスメントレイヤ予測部と、
　を備える画像処理装置。
（２）
　前記エンハンスメントレイヤ予測部は、前記ベースレイヤと前記エンハンスメントレイヤとの間の解像度比に応じてスケーリングされた前記第１の動きベクトルと、前記予測モードセットのうちの各予測モードに対応する予測動きベクトルとの間の差分を評価する、前記（１）に記載の画像処理装置。
（３）
　前記エンハンスメントレイヤ予測部は、前記第１の動きベクトルとの間で最も小さい差分を示す予測動きベクトルに対応する複数の予測モードが存在する場合には、前記ベースレイヤにおける前記第１の動きベクトルに対応する参照インデックスと同じ参照インデックスを有する予測モードを、前記エンハンスメントレイヤのインター予測のために選択する、前記（１）又は前記（２）に記載の画像処理装置。
（４）
　前記エンハンスメントレイヤ予測部は、前記第１の動きベクトルとの間で最も小さい差分を示す予測動きベクトルに対応する前記複数の予測モードが存在する場合において、前記ベースレイヤにおける前記第１の動きベクトルに対応する参照インデックスと同じ参照インデックスを有する予測モードが１つでないときは、前記複数の予測モードのうち参照インデックスの最も小さい予測モードを、前記エンハンスメントレイヤのインター予測のために選択する、前記（３）に記載の画像処理装置。
（５）
　前記エンハンスメントレイヤ予測部は、前記第１の動きベクトルとの間で最も小さい差分を示す予測動きベクトルに対応する複数の予測モードが存在する場合には、前記エンハンスメントレイヤの符号化ストリームから復号されるパラメータにより示される予測モードを、前記エンハンスメントレイヤのインター予測のために選択する、前記（１）又は前記（２）に記載の画像処理装置。
（６）
　前記エンハンスメントレイヤ予測部は、前記ベースレイヤと前記エンハンスメントレイヤとの間の参照インデックスの相違に基づいてスケーリングされた前記第１の動きベクトルと、前記予測モードセットのうちの各予測モードに対応する予測動きベクトルとの間の差分を評価する、前記（１）～（５）のいずれか１項に記載の画像処理装置。
（７）
　前記第１の符号化方式は、ＡＶＣ（Advanced　Video　Coding）及びＨＥＶＣ（High　Efficiency　Video　Coding）のうち符号化ストリームから復号されるフラグにより示される方式であり、
　前記第２の符号化方式は、ＨＥＶＣであり
　前記エンハンスメントレイヤ予測部は、前記フラグがＡＶＣを示す場合には、前記第１のブロックについての動き情報を参照することなく、前記エンハンスメントレイヤの符号化ストリームから復号される予測モードでインター予測を実行する、
　前記（１）～（６）のいずれか１項に記載の画像処理装置。
（８）
　前記エンハンスメントレイヤ予測部は、前記ベースレイヤ内の第３のブロックについて、前記ベースレイヤ予測部によりイントラ予測が実行された場合には、前記エンハンスメントレイヤ内の前記第３のブロックに対応する第４のブロックについて、イントラ予測を実行することにより予測画像を生成する、前記（１）～（７）のいずれか１項に記載の画像処理装置。
（９）
　前記エンハンスメントレイヤ予測部は、前記ベースレイヤ内の第３のブロックについて、前記ベースレイヤ予測部によりイントラ予測が実行された場合には、前記エンハンスメントレイヤ内の前記第３のブロックに対応する第４のブロックについて、前記エンハンスメントレイヤの符号化ストリームから復号される動き情報を用いてインター予測を実行する、前記（１）～（７）のいずれか１項に記載の画像処理装置。
（１０）
　第１の符号化方式で復号されるベースレイヤ内の第１のブロックについて、第１の動きベクトルを用いてインター予測を実行することにより、予測画像を生成することと、
　第２の符号化方式で復号されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第２の符号化方式のインター予測のための予測モードセットのうち、前記第１の動きベクトルとの間で最も小さい差分を示す予測動きベクトルに対応する予測モードでインター予測を実行することにより、予測画像を生成することと、
　を含む画像処理方法。
（１１）
　第１の符号化方式で符号化されるベースレイヤ内の第１のブロックについて、第１の動きベクトルを用いてインター予測を実行することにより、予測画像を生成するベースレイヤ予測部と、
　第２の符号化方式で符号化されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第２の符号化方式のインター予測のための予測モードセットのうち、前記第１の動きベクトルとの間で最も小さい差分を示す予測動きベクトルに対応する予測モードでインター予測を実行することにより、予測画像を生成するエンハンスメントレイヤ予測部と、
　を備える画像処理装置。
（１２）
　第１の符号化方式で符号化されるベースレイヤ内の第１のブロックについて、第１の動きベクトルを用いてインター予測を実行することにより、予測画像を生成することと、
　第２の符号化方式で符号化されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第２の符号化方式のインター予測のための予測モードセットのうち、前記第１の動きベクトルとの間で最も小さい差分を示す予測動きベクトルに対応する予測モードでインター予測を実行することにより、予測画像を生成することと、
　を含む画像処理方法。

　１０　　　　画像符号化装置（画像処理装置）
　３０ａ　　　イントラ予測部（ベースレイヤ予測部）
　３０ｂ　　　イントラ予測部（エンハンスメントレイヤ予測部）
　４０ａ　　　インター予測部（ベースレイヤ予測部）
　４０ｂ　　　インター予測部（エンハンスメントレイヤ予測部）
　６０　　　　画像復号装置（画像処理装置）
　８０ａ　　　イントラ予測部（ベースレイヤ予測部）
　８０ｂ　　　イントラ予測部（エンハンスメントレイヤ予測部）
　９０ａ　　　インター予測部（ベースレイヤ予測部）
　９０ｂ　　　インター予測部（エンハンスメントレイヤ予測部）

Claims

　第１の符号化方式で復号されるベースレイヤ内の第１のブロックについて、第１の予測モードセットのうち予測モード情報により指定される予測モードで予測画像を生成するベースレイヤ予測部と、
　前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で復号されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために指定された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成するエンハンスメントレイヤ予測部と、
　を備える画像処理装置。
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために指定されなかった前記第１の予測モードセット内の予測モードに対応する前記第２の予測モードセット内の予測モードを、前記第２のブロックのための選択から除外する、請求項１に記載の画像処理装置。
　前記エンハンスメントレイヤ予測部は、前記第２の予測モードセット内の、前記第１のブロックのために選択された予測モードに対応する予測モード、及び前記第１の予測モードセット内に対応する予測モードが存在しない予測モードのうち、予測モード情報により指定される予測モードを、前記第２のブロックのために選択する、請求項２に記載の画像処理装置。
　前記第１の予測モードセット及び前記第２の予測モードセットは、イントラ予測のための予測モードのセットである、請求項１に記載の画像処理装置。
　前記第１の予測モードセットは、ＤＣ予測モードを含み、平面予測モードを含まず、
　前記第２の予測モードセットは、ＤＣ予測モード及び平面予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのためにＤＣ予測モードが指定された場合には、ＤＣ予測モード及び平面予測モードのうち前記第２のブロックのために指定される予測モードを選択する、
　請求項４に記載の画像処理装置。
　前記第１の予測モードセットは、ＤＣ予測モード及び平面予測モードを含み、
　前記第２の予測モードセットは、ＤＣ予測モード及び平面予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのためにＤＣ予測モード及び平面予測モードの一方が指定された場合には、前記第２のブロックのためにＤＣ予測モード及び平面予測モードの当該一方を選択する、
　請求項４に記載の画像処理装置。
　前記第１の予測モードセットは、複数の予測方向に対応する複数の予測モードを含み、
　前記第２の予測モードセットは、前記第１の予測モードセットよりも多くの予測方向に対応する複数の予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために指定された予測モードの予測方向に近い範囲内に絞り込まれる予測方向に対応する１つ以上の予測モードのうちのいずれかを前記第２のブロックのために選択する、
　請求項４に記載の画像処理装置。
　前記画像処理装置は、前記エンハンスメントレイヤの符号化ストリームから予測方向の差分を示すパラメータを復号する復号部、をさらに備え、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために指定された予測モードの予測方向と前記パラメータにより示される予測方向の前記差分とを用いて決定される予測方向に対応する予測モードを、前記第２のブロックのために選択する、
　請求項７に記載の画像処理装置。
　前記第１の予測モードセットは、輝度ベース色差予測モードを含まず、
　前記第２の予測モードセットは、輝度ベース色差予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために指定された予測モード及び前記輝度ベース色差予測モードのうち、前記第２のブロックのために指定される予測モードを選択する、
　請求項４に記載の画像処理装置。
　前記第１の予測モードセット及び前記第２の予測モードセットは、インター予測のための予測モードのセットである、請求項１に記載の画像処理装置。
　前記エンハンスメントレイヤ予測部は、画像の空間的相関に基づく予測モードが前記第１のブロックのために指定された場合には、画像の空間的相関に基づく予測モードを前記第２のブロックのために選択し、画像の時間的相関に基づく予測モードが前記第１のブロックのために指定された場合には、画像の時間的相関に基づく予測モードを前記第２のブロックのために選択する、請求項１０に記載の画像処理装置。
　前記第１の予測モードセットは、空間ダイレクトモードを含み、
　前記第２の予測モードセットは、空間マージモード及び空間的動きベクトル予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために前記空間ダイレクトモードが指定された場合には、前記空間マージモード及び前記空間的動きベクトル予測モードのうち前記第２のブロックのために指定される予測モードを選択する、
　請求項１１に記載の画像処理装置。
　前記第１の予測モードセットは、時間ダイレクトモードを含み、
　前記第２の予測モードセットは、時間マージモード及び時間的動きベクトル予測モードを含み、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために前記時間ダイレクトモードが指定された場合には、前記時間マージモード及び前記時間的動きベクトル予測モードのうち前記第２のブロックのために指定される予測モードを選択する、
　請求項１１に記載の画像処理装置。
　前記第１の符号化方式は、ＡＶＣ（Advanced　Video　Coding）であり、
　前記第２の符号化方式は、ＨＥＶＣ（High　Efficiency　Video　Coding）であり、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのためにダイレクトモード又はスキップモードが指定された場合には、マージモードを前記第２のブロックのために選択する、
　請求項１０に記載の画像処理装置。
　前記第１の符号化方式は、ＡＶＣ（Advanced　Video　Coding）であり、
　前記第２の符号化方式は、ＨＥＶＣ（High　Efficiency　Video　Coding）であり、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのためにダイレクトモード及びスキップモードとは異なる予測モードが指定された場合には、動きベクトル予測モードを前記第２のブロックのために選択する、
　請求項１０に記載の画像処理装置。
　前記ベースレイヤ予測部は、Ｌ０予測、Ｌ１予測及び双予測から選択される参照方向に従って、前記第１のブロックについてインター予測を実行し、
　前記エンハンスメントレイヤ予測部は、前記第１のブロックのために使用された前記参照方向に従って、前記第２のブロックについてインター予測を実行する、
　請求項１０に記載の画像処理装置。
　第１の符号化方式で復号されるベースレイヤ内の第１のブロックについて、第１の予測モードセットのうち予測モード情報により指定される予測モードで予測画像を生成することと、
　前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で復号されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために指定された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成することと、
　を含む画像処理方法。
　第１の符号化方式で符号化されるベースレイヤ内の第１のブロックについて、第１の予測モードセットから選択される最適な予測モードで予測画像を生成するベースレイヤ予測部と、
　前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で符号化されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために選択された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成するエンハンスメントレイヤ予測部と、
　を備える画像処理装置。
　第１の符号化方式で符号化されるベースレイヤ内の第１のブロックについて、第１の予測モードセットから選択される最適な予測モードで予測画像を生成することと、
　前記第１の予測モードセットとは異なる第２の予測モードセットを有する第２の符号化方式で符号化されるエンハンスメントレイヤ内の前記第１のブロックに対応する第２のブロックについて、前記第１のブロックのために選択された予測モードに基づいて前記第２の予測モードセットから選択される予測モードで予測画像を生成することと、
　を含む画像処理方法。