JP6636122B2

JP6636122B2 - 復号装置および復号方法

Info

Publication number: JP6636122B2
Application number: JP2018220624A
Authority: JP
Inventors: 碩陸; 佐藤　数史; 数史佐藤
Original assignee: Velos Media International Ltd
Current assignee: Velos Media International Ltd
Priority date: 2012-06-29
Filing date: 2018-11-26
Publication date: 2020-01-29
Anticipated expiration: 2033-06-21
Also published as: US10958930B2; RU2642364C2; AU2018201321A1; CN109040762B; SG11201408571RA; CA2875213C; MX2014016002A; SG10201909372YA; JP2020039187A; US20150092846A1; BR112014032227A2; CN104380752A; RU2752695C2; TW201907726A; MX342499B; BR112014032228A2; EP2869560A1; US10623765B2; US20140003510A1; MX2014015993A

Description

本技術は、復号装置および復号方法に関し、特に、参照画像を特定する情報に関する情報の情報量を削減することができるようにした復号装置および復号方法に関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEG（Moving Picture Experts Group phase）などの方式に準拠した装置が、放送局などの情報配信、および一般家庭における情報受信の双方において普及しつつある。

特に、MPEG2（ISO/IEC 13818-2）方式は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに現在広く用いられている。MPEG2方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4乃至8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18乃至22MBpsの符号量（ビットレート）を割り当てることで、高い圧縮率と良好な画質の実現が可能である。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。MPEG4の画像符号化方式に関しては、1998年12月にISO/IEC 14496-2として規格が国際標準に承認された。

更に、近年、当初テレビ会議用の画像符号化を目的として、H．26L （ITU-T Q6/16 VCEG）という標準の規格化が進んでいる。H．26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。

また、現在、MPEG4の活動の一環として、このH．26Lをベースに、H．26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われている。この標準化は、2003年3月にH．264及びMPEG-4 Part10（AVC（Advanced Video Coding））という名の元に国際標準化された。

更に、その拡張として、RGBや4:2:2、4:4:4といった、業務用に必要な符号化ツールや、MPEG-2で規定されていた8x8DCTや量子化マトリクスをも含んだFRExt (Fidelity Range Extension)の標準化が2005年2月に完了し、これにより、ＡＶＣは、映画に含まれるフィルムノイズをも良好に表現することが可能な符号化方式となり、Blu-Ray（登録商標） Disc等の幅広いアプリケーションに用いられる運びとなった。

しかしながら、昨今、ハイビジョン画像の４倍の、4000×2000画素程度の画像を圧縮したい、或いは、インターネットのような、限られた伝送容量の環境において、ハイビジョン画像を配信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、ITU-T傘下のVCEG(Video Coding Expert Group) において、符号化効率の改善に関する検討が継続され行なわれている。

ところで、HEVC（High Efficiency Video Coding）方式においては、復号装置において参照画像を特定する参照画像特定情報を認識するためのShort-term reference picture set（以下、RPSという）が、SPS（Sequence Parameter Set）に含まれている（例えば、非特許文献１参照）。

図１は、RPSのシンタックスの一例を示す図である。

図１の第２行目に示すように、RPSには、inter_ref_pic_set_prediction_flagが含まれる。inter_ref_pic_set_prediction_flagは、符号化対象の画像のGOP（Group of Picture）内の符号化対象の画像より符号化順で前の画像である前画像の参照画像を特定する参照画像特定情報を、符号化対象の画像の参照画像特定情報として用いるかを示す参照情報である。

inter_ref_pic_set_prediction_flagは、前画像の参照画像を特定する参照画像特定情報を符号化対象の画像の参照画像特定情報として用いることを示す場合１であり、前画像の参照画像を特定する参照画像特定情報を符号化対象の画像の参照画像特定情報として用いないことを示す場合０である。

図１の第３行目および第４行目に示すように、inter_ref_pic_set_prediction_flagが１である場合、RPSには、前画像を特定する前画像特定情報であるdelta_idx_minus1が含まれる。delta_idx_minus1は、具体的には、符号化対象の画像の符号化番号（Coding Order）から前画像の符号化番号を減算した値から１を減算した値である。ここで、符号化番号とは、GOP内の各画像に対して、符号化順に、小さい値から付与される番号である。

また、図１の第１３乃至第２３行目に示すように、inter_ref_pic_set_prediction_flagが０である場合、RPSには、参照画像特定情報が含まれる。

図２は、inter_ref_pic_set_prediction_flagとdelta_idx_minus1の一例を示す図である。

図２の例では、符号化番号がＮである符号化対象の画像の参照画像特定情報が、符号化対象の画像より符号化順で１つ前の符号化番号がＮ−１である前画像の参照画像特定情報と同一である。

この場合、inter_ref_pic_set_prediction_flagは、前画像の参照画像特定情報を符号化対象の画像の参照画像特定情報として用いることを示す１にされる。また、delta_idx_minus1は、符号化対象の画像の符号化番号であるＮから前画像の符号化番号であるＮ−１を減算し、その結果得られる値１からさらに１を減算した値０にされる。

Benjamin Bross,Woo-Jin Han,Jens-Rainer Ohm,Gary J. Sullivan, Thomas Wiegand,"High efficiency video coding (HEVC) text specification draft 7", JCTVC-I1003_d4,2012.4.27-5.7

しかしながら、RPS等の参照画像特定情報に関する情報の情報量は十分に削減されていない。

本技術は、このような状況に鑑みてなされたものであり、参照画像を特定する情報に関する情報の情報量を削減することができるようにするものである。

本技術の一側面の復号装置は、復号対象の画像がGOP（Group of Picture）の先頭の画像以外の画像であるかどうかを判定し、前記復号対象の画像がGOPの先頭の画像以外の画像である場合にのみ、前記復号対象の画像のGOP内の前記復号対象の画像より復号順で前の画像である前画像の、予測画像の生成に用いられる参照画像を特定する参照画像特定情報を、前記復号対象の画像の参照画像特定情報として用いるかを示す参照情報を受け取る受け取り部と、前記受け取り部により前記参照情報が受け取られた場合、その参照情報に基づいて、前記復号対象の画像の参照画像特定情報を生成し、前記受け取り部により前記参照情報が受け取られない場合、前記前画像の参照画像特定情報を前記復号対象の画像の参照画像特定情報として用いないことを示す参照情報に基づいて、前記復号対象の画像の参照画像特定情報を生成する参照画像設定部と、前記参照画像設定部により生成された前記参照画像特定情報により特定される参照画像を用いて、予測画像を生成する予測画像生成部とを備える復号装置である。

本技術の一側面の復号方法は、本技術の一側面の復号装置に対応する。

本技術の一側面においては、復号対象の画像がGOP（Group of Picture）の先頭の画像以外の画像であるかどうかが判定され、前記復号対象の画像がGOPの先頭の画像以外の画像である場合にのみ、前記復号対象の画像のGOP内の前記復号対象の画像より復号順で前の画像である前画像の、予測画像の生成に用いられる参照画像を特定する参照画像特定情報を、前記復号対象の画像の参照画像特定情報として用いるかを示す参照情報が受け取られ、前記参照情報が受け取られた場合、その参照情報に基づいて、前記復号対象の画像の参照画像特定情報が生成され、前記参照情報が受け取られない場合、前記前画像の参照画像特定情報を前記復号対象の画像の参照画像特定情報として用いないことを示す参照情報に基づいて、前記復号対象の画像の参照画像特定情報が生成され、前記参照画像特定情報により特定される参照画像を用いて、予測画像が生成される。

なお、本技術の一側面の復号装置は、コンピュータにプログラムを実行させることにより実現することができる。

また、本技術の一側面の復号装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。

本技術によれば、参照画像を特定する情報に関する情報の情報量を削減した符号化ストリームを復号することができる。

RPSのシンタックスの一例を示す図である。 inter_ref_pic_set_prediction_flagとdelta_idx_minus1の一例を示す図である。本技術を適用した符号化装置の第１実施の形態の構成例を示すブロック図である。図３の符号化部の構成例を示すブロック図である。図３の設定部１２により設定されるSPSのシンタックスの例を示す図である。 RPSのシンタックスの例を示す図である。図３の設定部１２により設定されるRPSの情報量を説明する図である。従来のRPSの情報量を説明する図である。スライスヘッダのシンタックスの例を示す図である。図３の符号化装置の生成処理を説明するフローチャートである。図１０のRPS設定処理の詳細を説明するフローチャートである。図１０の符号化処理の詳細を説明するフローチャートである。図１０の符号化処理の詳細を説明するフローチャートである。図１２のRPSインデックス決定処理の詳細を説明するフローチャートである。本技術を適用した復号装置の第１実施の形態の構成例を示すブロック図である。図１５の復号部の構成例を示すブロック図である。図１５の復号装置による受け取り処理を説明するフローチャートである。図１７のRPS設定処理の詳細を説明するフローチャートである。図１７の復号処理の詳細を説明するフローチャートである。本技術を適用した符号化装置の第２実施の形態の構成例を示すブロック図である。図２０の設定部により設定されるSPSのシンタックスの例を示す図である。図２１のRPSのシンタックスの例を示す図である。図２０の設定部により設定されるRPSの情報量を説明する図である。図２０の設定部により設定されるRPSの情報量を説明する図である。従来のRPSの情報量を説明する図である。図２０の符号化装置のRPS設定処理の詳細を説明するフローチャートである。本技術を適用した復号装置の第２実施の形態の構成例を示すブロック図である。図２７の復号装置のRPS設定処理の詳細を説明するフローチャートである。本技術を適用した符号化装置の第３実施の形態の構成例を示すブロック図である。図２９の設定部により設定されるSPSのシンタックスの例を示す図である。図３０のRPSのシンタックスの例を示す図である。図２９の設定部により設定されるRPSの情報量を説明する図である。図２９の符号化装置のRPS設定処理の詳細を説明するフローチャートである。本技術を適用した復号装置の第３実施の形態の構成例を示すブロック図である。図３４の復号装置のRPS設定処理の詳細を説明するフローチャートである。本技術を適用した符号化装置の第４実施の形態の構成例を示すブロック図である。図３６の符号化部の構成例を示すブロック図である。図３６の設定部により設定されるPPSのシンタックスの例を示す図である。図３６の設定部により設定されるPPSのシンタックスの例を示す図である。従来のHEVC方式におけるPPSのシンタックスの例を示す図である。従来のHEVC方式におけるPPSのシンタックスの例を示す図である。図３７の可逆符号化部により付加されるスライスヘッダのシンタックスの例を示す図である。図３７の可逆符号化部により付加されるスライスヘッダのシンタックスの例を示す図である。図３７の可逆符号化部により付加されるスライスヘッダのシンタックスの例を示す図である。従来のHEVC方式におけるスライスヘッダのシンタックスの例を示す図である。従来のHEVC方式におけるスライスヘッダのシンタックスの例を示す図である。従来のHEVC方式におけるスライスヘッダのシンタックスの例を示す図である。図３６の符号化装置の生成処理を説明するフローチャートである。図４８の符号化処理の詳細を説明するフローチャートである。図４８の符号化処理の詳細を説明するフローチャートである。図４８のPPS設定処理の詳細を説明するフローチャートである。本技術を適用した復号装置の第４実施の形態の構成例を示すブロック図である。図５２の復号部の構成例を示すブロック図である。図５２の復号装置による受け取り処理を説明するフローチャートである。図５４の復号処理の詳細を説明するフローチャートである。多視点画像符号化方式の例を示す図である。本技術を適用した多視点画像符号化装置の主な構成例を示す図である。本技術を適用した多視点画像復号装置の主な構成例を示す図である。階層画像符号化方式の例を示す図である。本技術を適用した階層画像符号化装置の主な構成例を示す図である。本技術を適用した階層画像復号装置の主な構成例を示す図である。コンピュータのハードウエアの構成例を示すブロック図である。本技術を適用したテレビジョン装置の概略構成例を示す図である。本技術を適用した携帯電話機の概略構成例を示す図である。本技術を適用した記録再生装置の概略構成例を示す図である。本技術を適用した撮像装置の概略構成例を示す図である。スケーラブル符号化利用の一例を示すブロック図である。スケーラブル符号化利用の他の例を示すブロック図である。スケーラブル符号化利用のさらに他の例を示すブロック図である。本技術を適用したビデオセットの概略的な構成の一例を示す図である。本技術を適用したビデオプロセッサの概略的な構成の一例を示す図である。本技術を適用したビデオプロセッサの概略的な構成の他の例を示す図である。

＜第１実施の形態＞
（符号化装置の第１実施の形態の構成例）
図３は、本技術を適用した符号化装置の第１実施の形態の構成例を示すブロック図である。

図３の符号化装置１０は、符号化部１１、設定部１２、および伝送部１３により構成され、画像をHEVC方式で符号化する。

具体的には、符号化装置１０の符号化部１１には、フレーム単位の画像が入力信号として入力される。符号化部１１は、設定部１２から供給されるRPSを参照して、入力信号をHEVC方式で符号化し、その結果得られる符号化データを設定部１２に供給する。

設定部１２は、inter_ref_pic_set_prediction_flagを含まず、参照画像特定情報を含むRPSと、inter_ref_pic_set_prediction_flagと、参照画像特定情報またはdelta_idx_minus1とを含むRPSを設定する。設定部１２は、各RPSに、そのRPS（参照画像情報）を特定する参照画像情報特定情報としてのインデックスを付与する。ここでは、inter_ref_pic_set_prediction_flagを含まず、参照画像特定情報を含むRPSのインデックスとして０が付与されるものとする。

設定部１２は、インデックスが付与されたRPSを符号化部１１に供給する。設定部１２は、RPSを含むSPS,PPS（Picture Parameter Set）などを設定する。

設定部１２は、設定されたSPSおよびPPSと、符号化部１１から供給される符号化データとから、符号化ストリームを生成する。設定部１２は、符号化ストリームを伝送部１３に供給する。

伝送部１３は、設定部１２から供給される符号化ストリームを、後述する復号装置に伝送する。

（符号化部の構成例）
図４は、図３の符号化部１１の構成例を示すブロック図である。

図４の符号化部１１は、A/D変換部３１、画面並べ替えバッファ３２、演算部３３、直交変換部３４、量子化部３５、可逆符号化部３６、蓄積バッファ３７、逆量子化部３８、逆直交変換部３９、加算部４０、デブロックフィルタ４１、適応オフセットフィルタ４２、適応ループフィルタ４３、フレームメモリ４４、スイッチ４５、イントラ予測部４６、動き予測・補償部４７、予測画像選択部４８、参照画像設定部４９、およびレート制御部５０により構成される。

具体的には、符号化部１１のA/D変換部３１は、入力信号として入力されたフレーム単位の画像をA/D変換し、画面並べ替えバッファ３２に出力して記憶させる。画面並べ替えバッファ３２は、記憶した表示の順番のフレーム単位の画像を、GOP構造に応じて、符号化のための順番に並べ替え、演算部３３、イントラ予測部４６、および動き予測・補償部４７に出力する。

演算部３３は、符号化部として機能し、予測画像選択部４８から供給される予測画像と、画面並べ替えバッファ３２から出力された符号化対象の画像の差分を演算することにより符号化を行う。具体的には、演算部３３は、画面並べ替えバッファ３２から出力された符号化対象の画像から、予測画像選択部４８から供給される予測画像を減算することにより符号化を行う。演算部３３は、その結果得られる画像を、残差情報として直交変換部３４に出力する。なお、予測画像選択部４８から予測画像が供給されない場合、演算部３３は、画面並べ替えバッファ３２から読み出された画像をそのまま残差情報として直交変換部３４に出力する。

直交変換部３４は、演算部３３からの残差情報を直交変換し、直交変換係数を生成する。直交変換部３４は、生成された直交変換係数を量子化部３５に供給する。

量子化部３５は、直交変換部３４から供給される直交変換係数に対して、レート制御部５０から供給される量子化パラメータを用いて量子化を行う。量子化部３５は、その結果得られる係数は、可逆符号化部３６に入力される。

可逆符号化部３６は、最適イントラ予測モードを示す情報（以下、イントラ予測モード情報という）をイントラ予測部４６から取得する。また、可逆符号化部３６は、最適インター予測モードを示す情報（以下、インター予測モード情報という）、動きベクトルなどを動き予測・補償部４７から取得する。また、可逆符号化部３６は、参照画像設定部４９から、RPSのインデックスまたはRPS等を取得し、レート制御部５０から量子化パラメータを取得する。

また、可逆符号化部３６は、適応オフセットフィルタ４２から格納フラグ、インデックスまたはオフセット、および種類情報をオフセットフィルタ情報として取得し、適応ループフィルタ４３からフィルタ係数を取得する。

可逆符号化部３６は、量子化部３５から供給される量子化された係数に対して、可変長符号化（例えば、CAVLC（Context-Adaptive Variable Length Coding）など）、算術符号化（例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）など）などの可逆符号化を行う。

また、可逆符号化部３６は、イントラ予測モード情報、または、インター予測モード情報、動きベクトル、RPSのインデックスまたはRPSなど、量子化パラメータ、オフセットフィルタ情報、およびフィルタ係数を、符号化に関する符号化情報として可逆符号化する。可逆符号化部３６は、可逆符号化された符号化情報と係数を、符号化データとして蓄積バッファ３７に供給し、蓄積させる。なお、可逆符号化された符号化情報は、可逆符号化された係数のヘッダ情報（スライスヘッダ）とされてもよい。

蓄積バッファ３７は、可逆符号化部３６から供給される符号化データを、一時的に記憶する。また、蓄積バッファ３７は、記憶している符号化データを、図３の設定部１２に供給する。

また、量子化部３５より出力された、量子化された係数は、逆量子化部３８にも入力される。逆量子化部３８は、量子化部３５により量子化された係数に対して、レート制御部５０から供給される量子化パラメータを用いて逆量子化を行い、その結果得られる直交変換係数を逆直交変換部３９に供給される。

逆直交変換部３９は、逆量子化部３８から供給される直交変換係数に対して逆直交変換を行う。逆直交変換部３９は、逆直交変換の結果得られる残差情報を加算部４０に供給する。

加算部４０は、逆直交変換部３９から供給される残差情報と、予測画像選択部４８から供給される予測画像を加算して、局部的に復号された画像を得る。なお、予測画像選択部４８から予測画像が供給されない場合、加算部４０は、逆直交変換部３９から供給される残差情報を局部的に復号された画像とする。加算部４０は、局部的に復号された画像をデブロックフィルタ４１に供給するとともに、フレームメモリ４４に供給して蓄積させる。

デブロックフィルタ４１は、加算部４０から供給される局部的に復号された画像に対して、ブロック歪を除去する適応デブロックフィルタ処理を行い、その結果得られる画像を適応オフセットフィルタ４２に供給する。

適応オフセットフィルタ４２は、デブロックフィルタ４１による適応デブロックフィルタ処理後の画像に対して、主にリンギングを除去する適応オフセットフィルタ(SAO: Sample adaptive offset)処理を行う。

具体的には、適応オフセットフィルタ４２は、最大の符号化単位であるLCU（Largest Coding Unit）ごとに適応オフセットフィルタ処理の種類を決定し、その適応オフセットフィルタ処理で用いられるオフセットを求める。適応オフセットフィルタ４２は、求められたオフセットを用いて、適応デブロックフィルタ処理後の画像に対して、決定された種類の適応オフセットフィルタ処理を行う。そして、適応オフセットフィルタ４２は、適応オフセットフィルタ処理後の画像を適応ループフィルタ４３に供給する。

また、適応オフセットフィルタ４２は、オフセットを格納するバッファを有している。適応オフセットフィルタ４２は、LCUごとに、適応デブロックフィルタ処理に用いられたオフセットが既にバッファに格納されているかどうかを判定する。

適応オフセットフィルタ４２は、適応デブロックフィルタ処理に用いられたオフセットが既にバッファに格納されていると判定した場合、オフセットがバッファに格納されているかを示す格納フラグを、オフセットがバッファに格納されていることを示す値（ここでは１）に設定する。

そして、適応オフセットフィルタ４２は、LCUごとに、１に設定された格納フラグ、バッファにおけるオフセットの格納位置を示すインデックス、および、行われた適応オフセットフィルタ処理の種類を示す種類情報を可逆符号化部３６に供給する。

一方、適応オフセットフィルタ４２は、適応デブロックフィルタ処理に用いられたオフセットがまだバッファに格納されていない場合、そのオフセットを順にバッファに格納する。また、適応オフセットフィルタ４２は、格納フラグを、オフセットがバッファに格納されていないことを示す値（ここでは０）に設定する。そして、適応オフセットフィルタ４２は、LCUごとに、０に設定された格納フラグ、オフセット、および種類情報を可逆符号化部３６に供給する。

適応ループフィルタ４３は、適応オフセットフィルタ４２から供給される適応オフセットフィルタ処理後の画像に対して、例えば、LCUごとに、適応ループフィルタ（ALF:Adaptive Loop Filter)処理を行う。適応ループフィルタ処理としては、例えば、２次元のウィナーフィルタ（Wiener Filter）による処理が用いられる。もちろん、ウィナーフィルタ以外のフィルタが用いられてもよい。

具体的には、適応ループフィルタ４３は、LCUごとに、画面並べ替えバッファ３２から出力される画像である原画像と適応ループフィルタ処理後の画像の残差が最小となるように、適応ループフィルタ処理で用いられるフィルタ係数を算出する。そして、適応ループフィルタ４３は、適応オフセットフィルタ処理後の画像に対して、算出されたフィルタ係数を用いて、LCUごとに適応ループフィルタ処理を行う。

適応ループフィルタ４３は、適応ループフィルタ処理後の画像をフレームメモリ４４に供給する。また、適応ループフィルタ４３は、フィルタ係数を可逆符号化部３６に供給する。

なお、ここでは、適応ループフィルタ処理は、LCUごとに行われるものとするが、適応ループフィルタ処理の処理単位は、LCUに限定されない。但し、適応オフセットフィルタ４２と適応ループフィルタ４３の処理単位を合わせることにより、処理を効率的に行うことができる。

フレームメモリ４４は、適応ループフィルタ４３から供給される画像と、加算部４０から供給される画像を蓄積する。フレームメモリ４４に蓄積された画像は、参照画像としてスイッチ４５を介してイントラ予測部４６または動き予測・補償部４７に出力される。

イントラ予測部４６は、フレームメモリ４４からスイッチ４５を介して読み出された参照画像を用いて、候補となる全てのイントラ予測モードのイントラ予測処理を行う。

また、イントラ予測部４６は、画面並べ替えバッファ３２から読み出された画像と、イントラ予測処理の結果生成される予測画像とに基づいて、候補となる全てのイントラ予測モードに対してコスト関数値（詳細は後述する）を算出する。そして、イントラ予測部４６は、コスト関数値が最小となるイントラ予測モードを、最適イントラ予測モードに決定する。

イントラ予測部４６は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、予測画像選択部４８に供給する。イントラ予測部４６は、予測画像選択部４８から最適イントラ予測モードで生成された予測画像の選択が通知された場合、イントラ予測モード情報を可逆符号化部３６に供給する。

なお、コスト関数値は、RD(Rate Distortion)コストともいい、例えば、H．264/AVC方式における参照ソフトウエアであるJM(Joint Model)で定められているような、High Complexity モードか、Low Complexity モードのいずれかの手法に基づいて算出される。

具体的には、コスト関数値の算出手法としてHigh Complexity モードが採用される場合、候補となる全ての予測モードに対して、仮に復号までが行われ、次の式（１）で表わされるコスト関数値が各予測モードに対して算出される。

Dは、原画像と復号画像の差分（歪）、Rは、直交変換の係数まで含んだ発生符号量、λは、量子化パラメータQPの関数として与えられるラグランジュ乗数である。

一方、コスト関数値の算出手法としてLow Complexity モードが採用される場合、候補となる全ての予測モードに対して、予測画像の生成、および、符号化情報の符号量の算出が行われ、次の式（２）で表わされるコスト関数が各予測モードに対して算出される。

Dは、原画像と予測画像の差分（歪）、Header_Bitは、符号化情報の符号量、QPtoQuantは、量子化パラメータQPの関数として与えられる関数である。

Low Complexity モードにおいては、全ての予測モードに対して、予測画像を生成するだけでよく、復号画像を生成する必要がないため、演算量が少なくて済む。

動き予測・補償部４７は、候補となる全てのインター予測モードの動き予測・補償処理を行う。具体的には、動き予測・補償部４７は、画面並べ替えバッファ３２から供給される画像と、フレームメモリ４４からスイッチ４５を介して読み出される参照画像に基づいて、候補となる全てのインター予測モードの動きベクトルを検出する。そして、動き予測・補償部４７は、予測画像生成部として機能し、その動きベクトルに基づいて参照画像に補償処理を施し、予測画像を生成する。

このとき、動き予測・補償部４７は、画面並べ替えバッファ３２から供給される画像と予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、動き予測・補償部４７は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部４８に供給する。また、動き予測・補償部４７は、予測画像選択部４８から最適インター予測モードで生成された予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトルなどを可逆符号化部３６に出力し、参照画像特定情報を参照画像設定部４９に出力する。

予測画像選択部４８は、イントラ予測部４６および動き予測・補償部４７から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちの、対応するコスト関数値が小さい方を、最適予測モードに決定する。そして、予測画像選択部４８は、最適予測モードの予測画像を、演算部３３および加算部４０に供給する。また、予測画像選択部４８は、最適予測モードの予測画像の選択をイントラ予測部４６または動き予測・補償部４７に通知する。

参照画像設定部４９は、動き予測・補償部４７から供給される参照画像特定情報をGOP分だけ保持する。参照画像設定部４９は、符号化対象の画像がGOPの先頭の画像である場合、RPSのインデックスとしての０と、符号化対象の画像のRPSがSPSに含まれるRPSであることを示すRPSフラグとを可逆符号化部３６に供給する。

一方、符号化対象の画像がGOPの先頭の画像以外の画像である場合、参照画像設定部４９は、保持されている前画像の参照画像特定情報と、符号化対象の画像の参照画像特定情報とを比較し、比較結果に基づいてinter_ref_pic_set_prediction_flagとdelta_idx_minus1を決定する。そして、参照画像設定部４９は、決定されたinter_ref_pic_set_prediction_flagと、符号化対象の画像の参照画像特定情報またはdelta_idx_minus1とを含むRPSを、符号化対象の画像のRPSとする。

そして、参照画像設定部４９は、符号化対象の画像のRPSと同一のRPSが設定部１２から供給されている場合、そのRPSのインデックスと、符号化対象の画像のRPSがSPSに含まれるRPSであることを示すRPSフラグとを可逆符号化部３６に供給する。一方、符号化対象の画像のRPSと同一のRPSが設定部１２から供給されていない場合、参照画像設定部４９は、符号化対象の画像のRPSと、符号化対象の画像のRPSがSPSに含まれるRPSではないことを示すRPSフラグとを可逆符号化部３６に供給する。

レート制御部５０は、蓄積バッファ３７に蓄積された符号化データに基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部３５で用いられる量子化パラメータを決定する。レート制御部５０は、決定された量子化パラメータを、量子化部３５、可逆符号化部３６、および逆量子化部３８に供給する。

（SPSのシンタックスの例）
図５は、図３の設定部１２により設定されるSPSのシンタックスの例を示す図である。

図５の第１８行目に示すように、SPSには、各インデックス(i)のRPSが含まれる。

（RPSのシンタックスの例）
図６は、RPSのシンタックスの例を示す図である。

なお、図示は省略するが、図６の第６行目以降の記述は、図１の第３行目以降の記述と同様である。

図６の第２行目と第３行目に示すように、インデックス(idx)が０であるRPSには、inter_ref_pic_set_prediction_flagが含まれず、inter_ref_pic_set_prediction_flagが0である場合に含まれる参照画像特定情報が含まれる。

一方、第４行目および第５行目に示すように、インデックス(idx)が０以外であるRPSには、inter_ref_pic_set_prediction_flagが含まれる。そして、inter_ref_pic_set_prediction_flagが0である場合参照画像特定情報が含まれ、inter_ref_pic_set_prediction_flagが1である場合delta_idx_minus1が含まれる。

（本技術の効果の説明）
図７は、図３の設定部１２により設定されるRPSの情報量を説明する図であり、図８は、従来のRPSの情報量を説明する図である。

図７と図８の例では、GOP内の先頭から２番目のピクチャと８番目のピクチャの参照画像特定情報が、符号化順で１つ前のピクチャの参照画像特定情報と同一である。

この場合、図７に示すように、設定部１２は、インデックスが0であるRPSとして、GOPの先頭のピクチャの参照画像特定情報を設定する。また、設定部１２は、例えばインデックスが1であるRPSとして、inter_ref_pic_set_prediction_flagとしての1と、delta_idx_minus1としての0を設定する。そして、GOPの先頭のピクチャのRPSのインデックスが0とされ、２番目のピクチャと８番目のピクチャのRPSのインデックスが1とされる。

これに対して、図８に示すように、従来の場合、例えばインデックスが0であるRPSとして、inter_ref_pic_set_prediction_flagとしての0とGOPの先頭のピクチャの参照画像特定情報が設定される。また、設定部１２の場合と同様に、インデックスが1であるRPSが設定される。そして、GOPの先頭のピクチャのインデックスが0とされ、２番目のピクチャと８番目のピクチャのRPSのインデックスが1とされる。

以上のように、設定部１２は、先頭のピクチャのRPSとして用いられるインデックスが0であるRPSとしてinter_ref_pic_set_prediction_flagを設定しない。即ち、GOPの先頭のピクチャは、自分より符号化順で前のピクチャが存在しないため、inter_ref_pic_set_prediction_flagは必ず0となる。従って、設定部１２は、先頭のピクチャのRPSとして用いられるインデックスが0であるRPSとしてinter_ref_pic_set_prediction_flagを設定せず、inter_ref_pic_set_prediction_flagが0であるものとして参照画像特定情報のみを設定する。その結果、従来の場合に比べて、先頭のピクチャのinter_ref_pic_set_prediction_flag分だけRPSの情報量を削減することができる。

（スライスヘッダのシンタックスの例）
図９は、スライスヘッダのシンタックスの例を示す図である。

図９の第５行目に示すように、スライスヘッダには、対応する係数のRPSフラグ（short_term_ref_pic_set_sps_flag）が含まれる。また、図９の第６行目と第７行目に示すように、RPSフラグが、符号化対象の画像のRPSがSPSに含まれるRPSではないことを示す０である場合、スライスヘッダには、対応する係数のRPSがshort_term_ref_pic_set(num_short_term_ref_pic_sets)として含まれる。

図９の第８行目および第９行目に示すように、RPSフラグが、符号化対象の画像のRPSがSPSに含まれるRPSであることを示す１である場合、スライスヘッダには、対応する係数のRPSのインデックスがshort_term_ref_pic_set_idxとして含まれる。

（符号化装置の処理の説明）
図１０は、図３の符号化装置１０の生成処理を説明するフローチャートである。

図１０のステップＳ１１において、符号化装置１０の設定部１２は、RPSを設定するRPS設定処理を行う。このRPS設定処理の詳細は、後述する図１１を参照して後述する。ステップＳ１２において、符号化部１１は、外部から入力信号として入力されるフレーム単位の画像をHEVC方式で符号化する符号化処理を行う。この符号化処理の詳細は、後述する図１２および図１３を参照して説明する。

ステップＳ１３において、設定部１２は、インデックスが付与されたRPSを含むSPSを設定する。ステップＳ１４において、設定部１２は、PPSを設定する。ステップＳ１５において、設定部１２は、設定されたSPSおよびPPSと、符号化部１１から供給される符号化データとから、符号化ストリームを生成する。設定部１２は、符号化ストリームを伝送部１３に供給する。

ステップＳ１６において、伝送部１３は、設定部１２から供給される符号化ストリームを、後述する復号装置に伝送し、処理を終了する。

図１１は、図１０のステップＳ１１のRPS設定処理の詳細を説明するフローチャートである。

図１１のステップＳ２１において、設定部１２は、RPSのインデックスｉを０に設定する。ステップＳ２２において、RPSのインデックスｉが０であるかどうかを判定する。ステップＳ２２でRPSのインデックスｉが０であると判定された場合、ステップＳ２３において、設定部１２は、inter_ref_pic_set_prediction_flagを０に設定し、処理をステップＳ２５に進める。

ステップＳ２２でRPSのインデックスｉが０ではないと判定された場合、設定部１２は、ステップＳ２４において、設定部１２は、インデックスｉのRPSとして、inter_ref_pic_set_prediction_flagを設定し、処理をステップＳ２５に進める。

ステップＳ２５において、設定部１２は、inter_ref_pic_set_prediction_flagが１であるかどうかを判定する。ステップＳ２５でinter_ref_pic_set_prediction_flagが１であると判定された場合、ステップＳ２６において、設定部１２は、インデックスｉのRPSとしてdelta_idx_minus1を設定し、処理をステップＳ２８に進める。

一方、ステップＳ２５でinter_ref_pic_set_prediction_flagが１ではないと判定された場合、即ちinter_ref_pic_set_prediction_flagが０である場合、ステップＳ２７において、設定部１２は、参照画像特定情報を設定し、処理をステップＳ２８に進める。

ステップＳ２８において、設定部１２は、インデックスｉを１だけインクリメントする。ステップＳ２９において、設定部１２は、インデックスｉが、SPSに含めるRPSの数num_short_term_ref_pic_sets以上であるかどうかを判定する。

ステップＳ２９でインデックスｉが数num_short_term_ref_pic_sets以上ではないと判定された場合、処理はステップＳ２２に戻り、インデックスｉが数num_short_term_ref_pic_sets以上になるまで、ステップＳ２２乃至Ｓ２９の処理が繰り返される。

一方、ステップＳ２９でインデックスｉが数num_short_term_ref_pic_sets以上であると判定された場合、処理は図１０のステップＳ１１に戻り、ステップＳ１２に進む。

図１２および図１３は、図１０のステップＳ１２の符号化処理の詳細を説明するフローチャートである。

図１２のステップＳ３１において、符号化部１１のA/D変換部３１は、入力信号として入力されたフレーム単位の画像をA/D変換し、画面並べ替えバッファ３２に出力して記憶させる。

ステップＳ３２において、画面並べ替えバッファ３２は、記憶した表示の順番のフレームの画像を、GOP構造に応じて、符号化のための順番に並べ替える。画面並べ替えバッファ３２は、並べ替え後のフレーム単位の画像を、演算部３３、イントラ予測部４６、および動き予測・補償部４７に供給する。

ステップＳ３３において、イントラ予測部４６は、候補となる全てのイントラ予測モードのイントラ予測処理を行う。また、イントラ予測部４６は、画面並べ替えバッファ３２から読み出された画像と、イントラ予測処理の結果生成される予測画像とに基づいて、候補となる全てのイントラ予測モードに対してコスト関数値を算出する。そして、イントラ予測部４６は、コスト関数値が最小となるイントラ予測モードを、最適イントラ予測モードに決定する。イントラ予測部４６は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、予測画像選択部４８に供給する。

また、動き予測・補償部４７は、候補となる全てのインター予測モードの動き予測・補償処理を行う。また、動き予測・補償部４７は、画面並べ替えバッファ３２から供給される画像と予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、動き予測・補償部４７は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部４８に供給する。

ステップＳ３４において、予測画像選択部４８は、ステップＳ３３の処理によりイントラ予測部４６および動き予測・補償部４７から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちのコスト関数値が最小となる方を、最適予測モードに決定する。そして、予測画像選択部４８は、最適予測モードの予測画像を、演算部３３および加算部４０に供給する。

ステップＳ３５において、予測画像選択部４８は、最適予測モードが最適インター予測モードであるかどうかを判定する。ステップＳ３５で最適予測モードが最適インター予測モードであると判定された場合、予測画像選択部４８は、最適インター予測モードで生成された予測画像の選択を動き予測・補償部４７に通知する。

そして、ステップＳ３６において、動き予測・補償部４７は、インター予測モード情報と、対応する動きベクトルとを可逆符号化部３６に供給する。動き予測・補償部４７は、参照画像特定情報を参照画像設定部４９に供給する。

ステップＳ３７において、参照画像設定部４９は、RPSのインデックスを決定するRPSインデックス決定処理を行う。このRPSインデックス決定処理の詳細は、後述する図１４を参照して説明する。

一方、ステップＳ３５で最適予測モードが最適インター予測モードではないと判定された場合、即ち最適予測モードが最適イントラ予測モードである場合、予測画像選択部４８は、最適イントラ予測モードで生成された予測画像の選択をイントラ予測部４６に通知する。そして、ステップＳ３８において、イントラ予測部４６は、イントラ予測モード情報を可逆符号化部３６に供給し、処理をステップＳ３９に進める。

ステップＳ３９において、演算部３３は、画面並べ替えバッファ３２から供給される画像から、予測画像選択部４８から供給される予測画像を減算することにより符号化を行う。演算部３３は、その結果得られる画像を、残差情報として直交変換部３４に出力する。

ステップＳ４０において、直交変換部３４は、演算部３３からの残差情報に対して直交変換を施し、その結果得られる直交変換係数を量子化部３５に供給する。

ステップＳ４１において、量子化部３５は、レート制御部５０から供給される量子化パラメータを用いて直交変換部３４から供給される係数を量子化する。量子化された係数は、可逆符号化部３６と逆量子化部３８に入力される。

図１３のステップＳ４２において、逆量子化部３８は、レート制御部５０から供給される量子化パラメータを用いて、量子化部３５から供給される量子化された係数を逆量子化し、その結果得られる直交変換係数を逆直交変換部３９に供給する。

ステップＳ４３において、逆直交変換部３９は、逆量子化部３８から供給される直交変換係数に対して逆直交変換を施し、その結果得られる残差情報を加算部４０に供給する。

ステップＳ４４において、加算部４０は、逆直交変換部３９から供給される残差情報と、予測画像選択部４８から供給される予測画像を加算し、局部的に復号された画像を得る。加算部４０は、得られた画像をデブロックフィルタ４１に供給するとともに、フレームメモリ４４に供給する。

ステップＳ４５において、デブロックフィルタ４１は、加算部４０から供給される局部的に復号された画像に対して、デブロッキングフィルタ処理を行う。デブロックフィルタ４１は、その結果得られる画像を適応オフセットフィルタ４２に供給する。

ステップＳ４６において、適応オフセットフィルタ４２は、デブロックフィルタ４１から供給される画像に対して、LCUごとに適応オフセットフィルタ処理を行う。適応オフセットフィルタ４２は、その結果得られる画像を適応ループフィルタ４３に供給する。また、適応オフセットフィルタ４２は、LCUごとに、格納フラグ、インデックスまたはオフセット、および種類情報を、オフセットフィルタ情報として可逆符号化部３６に供給する。

ステップＳ４７において、適応ループフィルタ４３は、適応オフセットフィルタ４２から供給される画像に対して、LCUごとに適応ループフィルタ処理を行う。適応ループフィルタ４３は、その結果得られる画像をフレームメモリ４４に供給する。また、適応ループフィルタ４３は、適応ループフィルタ処理で用いられたフィルタ係数を可逆符号化部３６に供給する。

ステップＳ４８において、フレームメモリ４４は、適応ループフィルタ４３から供給される画像と加算部４０から供給される画像を蓄積する。フレームメモリ４４に蓄積された画像は、参照画像としてスイッチ４５を介してイントラ予測部４６または動き予測・補償部４７に出力される。

ステップＳ４９において、可逆符号化部３６は、イントラ予測モード情報、または、インター予測モード情報、動きベクトル、RPSのインデックスまたはRPSなど、レート制御部５０からの量子化パラメータ、オフセットフィルタ情報、およびフィルタ係数を、符号化情報として可逆符号化する。

ステップＳ５０において、可逆符号化部３６は、量子化部３５から供給される量子化された係数を可逆符号化する。そして、可逆符号化部３６は、ステップＳ４９の処理で可逆符号化された符号化情報と可逆符号化された係数から、符号化データを生成する。

ステップＳ５１において、蓄積バッファ３７は、可逆符号化部３６から供給される符号化データを、一時的に蓄積する。

ステップＳ５２において、レート制御部５０は、蓄積バッファ３７に蓄積された符号化データに基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部３５で用いられる量子化パラメータを決定する。レート制御部５０は、決定された量子化パラメータを、量子化部３５、可逆符号化部３６、および逆量子化部３８に供給する。

ステップＳ５３において、蓄積バッファ３７は、記憶している符号化データを、図３の設定部１２に出力する。

なお、図１２および図１３の符号化処理では、説明を簡単化するため、常に、イントラ予測処理と動き予測・補償処理が行われるようにしたが、実際には、ピクチャタイプ等によっていずれか一方のみが行われる場合もある。

図１４は、図１２のステップＳ３７のRPSインデックス決定処理の詳細を説明するフローチャートである。

図１４のステップＳ７１において、参照画像設定部４９は、動き予測・補償部４７から供給される参照画像特定情報をGOP分だけ保持する。ステップＳ７２において、参照画像設定部４９は、符号化対象の画像がGOPの先頭の画像であるかどうかを判定する。

ステップＳ７２で符号化対象の画像がGOPの先頭の画像であると判定された場合、ステップＳ７３において、参照画像設定部４９は、RPSフラグを１に設定する。ステップＳ７４において、参照画像設定部４９は、RPSのインデックスを０に設定し、処理をステップＳ７９に進める。

一方、ステップＳ７２で符号化対象の画像がGOPの先頭の画像以外の画像であると判定された場合、ステップＳ７５において、参照画像設定部４９は、符号化対象の画像のRPSを生成する。

具体的には、参照画像設定部４９は、保持されている前画像の参照画像特定情報と、符号化対象の画像の参照画像特定情報とが同一であるかどうかを判定する。参照画像設定部４９は、保持されている前画像の参照画像特定情報と、符号化対象の画像の参照画像特定情報とが同一であると判定された場合、inter_ref_pic_set_prediction_flagとして１を含み、delta_idx_minus1を含む符号化対象の画像のRPSを生成する。

一方、保持されている前画像の参照画像特定情報と、符号化対象の画像の参照画像特定情報とが同一ではないと判定された場合、参照画像設定部４９は、inter_ref_pic_set_prediction_flagとして０を含む符号化対象の画像のRPSを生成する。

ステップＳ７６において、参照画像設定部４９は、符号化対象の画像のRPSが設定部１２から供給されるSPSに含まれるRPSと同一であるかどうかを判定する。ステップＳ７６で符号化対象の画像のRPSがSPSに含まれるRPSと同一であると判定された場合、ステップＳ７７において、参照画像設定部４９は、RPSフラグを１に設定する。

ステップＳ７８において、参照画像設定部４９は、符号化対象の画像のRPSと同一のSPSに含まれるRPSのインデックスを認識し、処理をステップＳ７９に進める。ステップＳ７９において、参照画像設定部４９は、ステップＳ７３またはステップＳ７７で設定されたRPSフラグと、ステップＳ７４で設定されたRPSのインデックスまたはステップＳ７８で認識されたRPSのインデックスとを可逆符号化部３６に供給する。そして、処理は図１２のステップＳ３７に戻り、ステップＳ３９に進む。

一方、ステップＳ７６で符号化対象の画像のRPSがSPSに含まれるRPSと同一ではないと判定された場合、参照画像設定部４９は、RPSフラグを０に設定する。ステップＳ８１において、参照画像設定部４９は、ステップＳ８０で設定されたRPSフラグとステップＳ７５で生成されたRPSとを可逆符号化部３６に供給する。そして、処理は図１２のステップＳ３７に戻り、ステップＳ３９に進む。

以上のように、符号化装置１０は、符号化対象の画像がGOPの先頭の画像以外の画像である場合、inter_ref_pic_set_prediction_flagを伝送する。即ち、符号化装置１０は、符号化対象の画像がGOPの先頭の画像である場合、inter_ref_pic_set_prediction_flagを伝送しない。従って、GOPの先頭の画像のinter_ref_pic_set_prediction_flag分だけ、参照画像特定情報に関するRPSの情報量を削減することができる。

（復号装置の第１実施の形態の構成例）
図１５は、図３の符号化装置１０から伝送される符号化ストリームを復号する、本技術を適用した復号装置の第１実施の形態の構成例を示すブロック図である。

図１５の復号装置１１０は、受け取り部１１１、抽出部１１２、および復号部１１３により構成される。

復号装置１１０の受け取り部１１１は、図３の符号化装置１０から伝送されてくる符号化ストリームを受け取り、抽出部１１２に供給する。

抽出部１１２は、受け取り部１１１から供給される符号化ストリームから、SPS,PPS、符号化データ等を抽出する。抽出部１１２は、符号化データを復号部１１３に供給する。また、抽出部１１２は、SPSに基づいて、各RPSのinter_ref_pic_set_prediction_flagとdelta_idx_minus1または参照画像特定情報とを取得し、復号部１１３に供給する。さらに、抽出部１１２は、SPSに含まれるRPS以外の情報やPPS等も、必要に応じて復号部１１３に供給する。

復号部１１３は、抽出部１１２から供給される各RPSのinter_ref_pic_set_prediction_flagとdelta_idx_minus1または参照画像特定情報とに基づいて、抽出部１１２から供給される符号化データをHEVC方式で復号する。このとき、復号部１１３は、必要に応じてSPSに含まれるRPS以外の情報やPPS等も参照する。復号部１１３は、復号の結果得られる画像を、出力信号として出力する。

（復号部の構成例）
図１６は、図１５の復号部１１３の構成例を示すブロック図である。

図１６の復号部１１３は、蓄積バッファ１３１、可逆復号部１３２、逆量子化部１３３、逆直交変換部１３４、加算部１３５、デブロックフィルタ１３６、適応オフセットフィルタ１３７、適応ループフィルタ１３８、画面並べ替えバッファ１３９、D/A変換部１４０、フレームメモリ１４１、スイッチ１４２、イントラ予測部１４３、参照画像設定部１４４、動き補償部１４５、およびスイッチ１４６により構成される。

復号部１１３の蓄積バッファ１３１は、図１５の抽出部１１２から符号化データを受け取り、蓄積する。蓄積バッファ１３１は、蓄積されている符号化データを可逆復号部１３２に供給する。

可逆復号部１３２は、蓄積バッファ１３１からの符号化データに対して、可変長復号や、算術復号等の可逆復号を施すことで、量子化された係数と符号化情報を得る。可逆復号部１３２は、量子化された係数を逆量子化部１３３に供給する。また、可逆復号部１３２は、符号化情報としてのイントラ予測モード情報などをイントラ予測部１４３に供給し、動きベクトル、インター予測モード情報などを動き補償部１４５に供給する。可逆復号部１３２は、符号化情報としてのRPSフラグとRPSのインデックスまたはRPSとを参照画像設定部１４４に供給する。

さらに、可逆復号部１３２は、符号化情報としてのイントラ予測モード情報またはインター予測モード情報をスイッチ１４６に供給する。可逆復号部１３２は、符号化情報としてのオフセットフィルタ情報を適応オフセットフィルタ１３７に供給し、フィルタ係数を適応ループフィルタ１３８に供給する。

逆量子化部１３３、逆直交変換部１３４、加算部１３５、デブロックフィルタ１３６、適応オフセットフィルタ１３７、適応ループフィルタ１３８、フレームメモリ１４１、スイッチ１４２、イントラ予測部１４３、および、動き補償部１４５は、図４の逆量子化部３８、逆直交変換部３９、加算部４０、デブロックフィルタ４１、適応オフセットフィルタ４２、適応ループフィルタ４３、フレームメモリ４４、スイッチ４５、イントラ予測部４６、および、動き予測・補償部４７とそれぞれ同様の処理を行い、これにより、画像が復号される。

具体的には、逆量子化部１３３は、可逆復号部１３２からの量子化された係数を逆量子化し、その結果得られる直交変換係数を逆直交変換部１３４に供給する。

逆直交変換部１３４は、逆量子化部１３３からの直交変換係数に対して逆直交変換を行う。逆直交変換部１３４は、逆直交変換の結果得られる残差情報を加算部１３５に供給する。

加算部１３５は、復号部として機能し、逆直交変換部１３４から供給される復号対象の画像としての残差情報と、スイッチ１４６から供給される予測画像を加算することにより、復号を行う。加算部１３５は、復号の結果得られる画像をデブロックフィルタ１３６に供給するとともに、フレームメモリ１４１に供給する。なお、スイッチ１４６から予測画像が供給されない場合、加算部１３５は、逆直交変換部１３４から供給される残差情報である画像を復号の結果得られる画像として、デブロックフィルタ１３６に供給するとともに、フレームメモリ１４１に供給して蓄積させる。

デブロックフィルタ１３６は、加算部１３５から供給される画像に対して適応デブロックフィルタ処理を行い、その結果得られる画像を適応オフセットフィルタ１３７に供給する。

適応オフセットフィルタ１３７は、可逆復号部１３２から供給されるオフセットを順に格納するバッファを有する。また、適応オフセットフィルタ１３７は、LCUごとに、可逆復号部１３２から供給されるオフセットフィルタ情報に基づいて、デブロックフィルタ１３６による適応デブロックフィルタ処理後の画像に対して、適応オフセットフィルタ処理を行う。

具体的には、オフセットフィルタ情報に含まれる格納フラグが０である場合、適応オフセットフィルタ１３７は、LCU単位のデブロックフィルタ処理後の画像に対して、そのオフセットフィルタ情報に含まれるオフセットを用いて、種類情報が示す種類の適応オフセットフィルタ処理を行う。

一方、オフセットフィルタ情報に含まれる格納フラグが１である場合、適応オフセットフィルタ１３７は、LCU単位のデブロックフィルタ処理後の画像に対して、そのオフセットフィルタ情報に含まれるインデックスが示す位置に格納されるオフセットを読み出す。そして、適応オフセットフィルタ１３７は、読み出されたオフセットを用いて、種類情報が示す種類の適応オフセットフィルタ処理を行う。適応オフセットフィルタ１３７は、適応オフセットフィルタ処理後の画像を、適応ループフィルタ１３８に供給する。

適応ループフィルタ１３８は、適応オフセットフィルタ１３７から供給される画像に対して、可逆復号部１３２から供給されるフィルタ係数を用いて、LCUごとに適応ループフィルタ処理を行う。適応ループフィルタ１３８は、その結果得られる画像をフレームメモリ１４１および画面並べ替えバッファ１３９に供給する。

画面並べ替えバッファ１３９は、適応ループフィルタ１３８から供給される画像をフレーム単位で記憶する。画面並べ替えバッファ１３９は、記憶した符号化のための順番のフレーム単位の画像を、元の表示の順番に並び替え、D/A変換部１４０に供給する。

D/A変換部１４０は、画面並べ替えバッファ１３９から供給されるフレーム単位の画像をD/A変換し、出力信号として出力する。フレームメモリ１４１は、適応ループフィルタ１３８から供給される画像と加算部１３５から供給される画像を蓄積する。フレームメモリ１４１に蓄積された画像は参照画像として読み出され、スイッチ１４２を介して動き補償部１４５またはイントラ予測部１４３に供給される。

イントラ予測部１４３は、フレームメモリ１４１からスイッチ１４２を介して読み出された参照画像を用いて、可逆復号部１３２から供給されるイントラ予測モード情報が示すイントラ予測モードのイントラ予測処理を行う。イントラ予測部１４３は、その結果生成される予測画像をスイッチ１４６に供給する。

参照画像設定部１４４は、図１５の抽出部１１２から供給される各RPSのinter_ref_pic_set_prediction_flagとdelta_idx_minus1または参照画像特定情報とをRPS情報として保持する。また、参照画像設定部１４４は、可逆復号部１３２から供給されるRPSフラグおよびRPSのインデックスまたはRPS、並びに、各RPSのRPS情報に基づいて、復号対象の画像の参照画像特定情報を生成する。参照画像設定部１４４は、生成された参照画像特定情報を動き補償部１４５に供給するとともに、保持する。

動き補償部１４５は、参照画像設定部１４４から供給される参照画像特定情報に基づいて、フレームメモリ１４１からスイッチ１４２を介して、参照画像特定情報により特定される参照画像を読み出す。動き補償部１４５は、予測画像生成部として機能し、動きベクトルと参照画像を用いて、インター予測モード情報が示す最適インター予測モードの動き補償処理を行う。動き補償部１４５は、その結果生成される予測画像をスイッチ１４６に供給する。

スイッチ１４６は、可逆復号部１３２からイントラ予測モード情報が供給された場合、イントラ予測部１４３から供給される予測画像を加算部１３５に供給する。一方、可逆復号部１３２からインター予測モード情報が供給された場合、スイッチ１４６は、動き補償部１４５から供給される予測画像を加算部１３５に供給する。

（復号装置の処理の説明）
図１７は、図１５の復号装置１１０による受け取り処理を説明するフローチャートである。

図１７のステップＳ１１１において、復号装置１１０の受け取り部１１１は、図３の符号化装置１０から伝送されてくる符号化ストリームを受け取り、抽出部１１２に供給する。

ステップＳ１１２において、抽出部１１２は、受け取り部１１１から供給される符号化ストリームから、SPS,PPS、符号化データ等を抽出する。抽出部１１２は、符号化データを復号部１１３に供給する。また、抽出部１１２は、SPSに含まれるRPS以外の情報やPPS等も、必要に応じて復号部１１３に供給する。

ステップＳ１１３において、抽出部１１２は、SPSに基づいて、各RPSのinter_ref_pic_set_prediction_flagとdelta_idx_minus1または参照画像特定情報とをRPS情報として取得し、復号部１１３に供給する。

ステップＳ１１４において、復号部１１３は、抽出部１１２から供給される各RPSのRPS情報に基づいて、抽出部１１２から供給される符号化データをHEVC方式で復号する復号処理を行う。この復号処理の詳細は、後述する図１９を参照して説明する。そして、処理は終了する。

図１８は、図１７のステップＳ１１３のRPS設定処理の詳細を説明するフローチャートである。

図１８のステップＳ１２０において、抽出部１１２は、SPS（図５）に含まれるnum_short_term_ref_pic_setsを取得する。ステップＳ１２１において、抽出部１１２は、生成するRPS情報に対応するRPSのインデックスｉを０に設定する。ステップＳ１２２において、RPSのインデックスｉが０であるかどうかを判定する。

ステップＳ１２２でインデックスｉが０であると判定された場合、ステップＳ１２３において、抽出部１１２は、インデックスｉのRPSのRPS情報に含まれるinter_ref_pic_set_prediction_flagを０に設定し、処理をステップＳ１２５に進める。

一方、ステップＳ１２２でインデックスｉが０ではないと判定された場合、ステップＳ１２４において、抽出部１１２は、SPSに含まれるインデックスｉのRPSに含まれるinter_ref_pic_set_prediction_flagを取得する。そして、抽出部１１２は、取得されたinter_ref_pic_set_prediction_flagを、インデックスｉのRPSのRPS情報に含まれるinter_ref_pic_set_prediction_flagとして設定し、処理をステップＳ１２５に進める。

ステップＳ１２５において、抽出部１１２は、inter_ref_pic_set_prediction_flagが１であるかどうかを判定する。ステップＳ１２５でinter_ref_pic_set_prediction_flagが１であると判定された場合、ステップＳ１２６において、抽出部１１２は、SPSに含まれるインデックスｉのRPSに含まれるdelta_idx_minus1を取得する。そして、抽出部１１２は、取得されたdelta_idx_minus1をインデックスｉのRPSのRPS情報に含まれるdelta_idx_minus1として設定し、処理をステップＳ１２８に進める。

一方、ステップＳ１２５でinter_ref_pic_set_prediction_flagが１ではないと判定された場合、ステップＳ１２７において、抽出部１１２は、SPSに含まれるインデックスｉのRPSに含まれる参照画像特定情報を取得する。そして、抽出部１１２は、取得された参照画像特定情報をインデックスｉのRPSのRPS情報に含まれる参照画像特定情報として設定し、処理をステップＳ１２８に進める。

ステップＳ１２８において、抽出部１１２は、インデックスｉを１だけインクリメントする。ステップＳ１２９において、抽出部１１２は、インデックスｉが、ステップＳ１２０で取得されたnum_short_term_ref_pic_sets以上であるかどうかを判定する。

ステップＳ１２９でインデックスｉがnum_short_term_ref_pic_sets以上ではないと判定された場合、処理はステップＳ１２２に戻り、インデックスｉがnum_short_term_ref_pic_sets以上になるまで、ステップＳ１２２乃至Ｓ１２９の処理が繰り返される。

一方、ステップＳ１２９でインデックスｉがnum_short_term_ref_pic_sets以上であると判定された場合、ステップＳ１３０において、抽出部１１２は、設定されたnum_short_term_ref_pic_sets個のRPSのRPS情報を供給する。そして、処理は図１７のステップＳ１１３に戻り、ステップＳ１１４に進む。

図１９は、図１７のステップＳ１１４の復号処理の詳細を説明するフローチャートである。

図１９のステップＳ１３１において、復号部１１３の蓄積バッファ１３１は、図１５の抽出部１１２からフレーム単位の符号化データを受け取り、蓄積する。蓄積バッファ１３１は、蓄積されている符号化データを可逆復号部１３２に供給する。

ステップＳ１３２において、可逆復号部１３２は、蓄積バッファ１３１からの符号化データを可逆復号し、量子化された係数と符号化情報を得る。可逆復号部１３２は、量子化された係数を逆量子化部１３３に供給する。また、可逆復号部１３２は、符号化情報としてのイントラ予測モード情報などをイントラ予測部１４３に供給し、動きベクトル、インター予測モード情報、RPSフラグとRPSのインデックスまたはRPSなどを動き補償部１４５に供給する。

ステップＳ１３３において、逆量子化部１３３は、可逆復号部１３２からの量子化された係数を逆量子化し、その結果得られる直交変換係数を逆直交変換部１３４に供給する。

ステップＳ１３４において、動き補償部１４５は、可逆復号部１３２からインター予測モード情報が供給されたかどうかを判定する。ステップＳ１３４でインター予測モード情報が供給されたと判定された場合、処理はステップＳ１３５に進む。

ステップＳ１３５において、参照画像設定部１４４は、抽出部１１２から供給される各RPSのRPS情報と、可逆復号部１３２から供給されるRPSフラグおよびRPSのインデックスまたはRPSとに基づいて、復号対象の画像の参照画像特定情報を生成し、保持する。

具体的には、参照画像設定部１４４は、抽出部１１２から供給される各RPSのRPS情報を保持している。参照画像設定部１４４は、RPSフラグが１である場合、保持しているRPS情報のうちのRPSのインデックスのRPS情報を読み出す。そして、参照画像設定部１４４は、読み出されたRPS情報に含まれるinter_ref_pic_set_prediction_flagが０である場合、RPS情報に含まれる参照画像特定情報を復号対象の画像の参照画像特定情報として生成し、保持する。

一方、参照画像設定部１４４は、inter_ref_pic_set_prediction_flagが１である場合、保持している参照画像特定情報のうちの、RPS情報に含まれるdelta_idx_minus1により特定される前画像の参照画像特定情報を読み出す。そして、参照画像設定部１４４は、読み出された前画像の参照画像特定情報を、復号対象の画像の参照画像特定情報として生成し、保持する。

また、参照画像設定部１４４は、RPSフラグが０であり、RPSフラグとともに可逆復号部１３２から供給されるRPSに含まれるinter_ref_pic_set_prediction_flagが０である場合、RPSに含まれる参照画像特定情報を復号対象の画像の参照画像特定情報として生成し、保持する。一方、参照画像設定部１４４は、inter_ref_pic_set_prediction_flagが１である場合、保持している参照画像特定情報のうちの、RPSに含まれるdelta_idx_minus1により特定される前画像の参照画像特定情報を読み出す。そして、参照画像設定部１４４は、読み出された前画像の参照画像特定情報を、復号対象の画像の参照画像特定情報として生成し、保持する。

ステップＳ１３６において、動き補償部１４５は、参照画像設定部１４４から供給される参照画像特定情報に基づいて参照画像を読み出し、動きベクトルと参照画像を用いて、インター予測モード情報が示す最適インター予測モードの動き補償処理を行う。動き補償部１４５は、その結果生成される予測画像を、スイッチ１４６を介して加算部１３５に供給し、処理をステップＳ１３８に進める。

一方、ステップＳ１３４でインター予測モード情報が供給されていないと判定された場合、即ちイントラ予測モード情報がイントラ予測部１４３に供給された場合、処理はステップＳ１３７に進む。

ステップＳ１３７において、イントラ予測部１４３は、フレームメモリ１４１からスイッチ１４２を介して読み出された参照画像を用いて、イントラ予測モード情報が示すイントラ予測モードのイントラ予測処理を行う。イントラ予測部１４３は、イントラ予測処理の結果生成される予測画像を、スイッチ１４６を介して加算部１３５に供給し、処理をステップＳ１３８に進める。

ステップＳ１３８において、逆直交変換部１３４は、逆量子化部１３３からの直交変換係数に対して逆直交変換を施し、その結果得られる残差情報を加算部１３５に供給する。

ステップＳ１３９において、加算部１３５は、逆直交変換部１３４から供給される残差情報と、スイッチ１４６から供給される予測画像を加算する。加算部１３５は、その結果得られる画像をデブロックフィルタ１３６に供給するとともに、フレームメモリ１４１に供給する。

ステップＳ１４０において、デブロックフィルタ１３６は、加算部１３５から供給される画像に対してデブロッキングフィルタ処理を行い、ブロック歪を除去する。デブロックフィルタ１３６は、その結果得られる画像を適応オフセットフィルタ１３７に供給する。

ステップＳ１４１において、適応オフセットフィルタ１３７は、可逆復号部１３２から供給されるオフセットフィルタ情報に基づいて、デブロックフィルタ１３６によるデブロックフィルタ処理後の画像に対して、LCUごとに適応オフセットフィルタ処理を行う。適応オフセットフィルタ１３７は、適応オフセットフィルタ処理後の画像を、適応ループフィルタ１３８に供給する。

ステップＳ１４２において、適応ループフィルタ１３８は、適応オフセットフィルタ１３７から供給される画像に対して、可逆復号部１３２から供給されるフィルタ係数を用いて、LCUごとに適応ループフィルタ処理を行う。適応ループフィルタ１３８は、その結果得られる画像をフレームメモリ１４１および画面並べ替えバッファ１３９に供給する。

ステップＳ１４３において、フレームメモリ１４１は、加算部１３５から供給される画像と、適応ループフィルタ１３８から供給される画像を蓄積する。フレームメモリ１４１に蓄積された画像は、参照画像としてスイッチ１４２を介して動き補償部１４５またはイントラ予測部１４３に供給される。

ステップＳ１４４において、画面並べ替えバッファ１３９は、適応ループフィルタ１３８から供給される画像をフレーム単位で記憶し、記憶した符号化のための順番のフレーム単位の画像を、元の表示の順番に並び替え、D/A変換部１４０に供給する。

ステップＳ１４５において、D/A変換部１４０は、画面並べ替えバッファ１３９から供給されるフレーム単位の画像をD/A変換し、出力信号として出力する。そして、処理は、図１７のステップＳ１１４に戻り、終了する。

以上のように、復号装置１１０は、符号化対象の画像がGOPの先頭の画像以外の画像である場合に伝送されてくるinter_ref_pic_set_prediction_flagを受け取り、inter_ref_pic_set_prediction_flagを受け取った場合、そのinter_ref_pic_set_prediction_flagに基づいて、復号対象の画像の参照画像特定情報を生成する。一方、復号装置１１０は、inter_ref_pic_set_prediction_flagを受け取らない場合、inter_ref_pic_set_prediction_flagとしての０に基づいて復号対象の画像の参照画像特定情報を生成する。

その結果、復号装置１１０は、GOPの先頭の画像のinter_ref_pic_set_prediction_flag分だけRPSの情報量を削減した符号化ストリームを復号することができる。

＜第２実施の形態＞
（符号化装置の第２実施の形態の構成例）
図２０は、本技術を適用した符号化装置の第２実施の形態の構成例を示すブロック図である。

なお、図２０の構成のうち、図３の構成と同一のものには同一の符号を付してあり、説明は繰り返しになるので、省略する。

図２０の符号化装置１５０の構成は、設定部１２の代わりに設定部１５１が設けられている点が、図３の符号化装置１０の構成と異なる。符号化装置１５０は、inter_ref_pic_set_prediction_flagとdelta_idx_minus1をGOP単位で共有化可能なようにSPSを設定する。

具体的には、設定部１５１は、必要に応じてinter_ref_pic_set_prediction_flag，delta_idx_minus1、参照画像特定情報などを含むRPSを設定し、各RPSにインデックスを付与する。設定部１５１は、インデックスが付与されたRPSを符号化部１１に供給する。また、設定部１５１は、RPSとGOP内の全てのピクチャにおいてinter_ref_pic_set_prediction_flagが０であるかを示す参照不可情報とを含み、必要に応じてGOP内の全てのピクチャにおいて共通のdelta_idx_minus1を含むSPSを設定する。設定部１５１は、PPSなどを設定する。

また、設定部１５１は、図３の設定部１２と同様に、設定されたSPSおよびPPSと、符号化部１１から供給される符号化データとから、符号化ストリームを生成する。設定部１５１は、設定部１２と同様に、符号化ストリームを伝送部１３に供給する。

（SPSのシンタックスの例）
図２１は、図２０の設定部１５１により設定されるSPSのシンタックスの例を示す図である。

図２１の第４行目に示すように、SPSには、参照不可情報（disable_rps_prediction_flag）が含まれる。また、第５行目および第６行目に示すように、参照不可情報が、GOP内の全てのピクチャにおいてinter_ref_pic_set_prediction_flagが０であることを示さない０である場合、SPSには、GOP内の全てのピクチャにおいてdelta_idx_minus1が同一であるかを示す同一情報(unified_rps_prediction_control_present_flag)が含まれる。

さらに、第７行目および第８行目に示すように、同一情報が、GOP内の全てのピクチャにおいてdelta_idx_minus1が同一であることを示す１である場合、SPSには、GOP内の全てのピクチャにおいて共通のdelta_idx_minus1であるunified_delta_idx_minus1が含まれる。また、第１１行目に示すように、SPSには、各インデックス(i)のRPSが含まれる。

（RPSのシンタックスの例）
図２２は、RPSのシンタックスの例を示す図である。

なお、図示は省略するが、図２２の第１１行目以降の記述は、図１の第５行目以降の記述と同様である。

図２２の第２行目と第３行目に示すように、disable_rps_prediction_flagが１である場合、RPSには、inter_ref_pic_set_prediction_flagが含まれず、inter_ref_pic_set_prediction_flagが0である場合に含まれる参照画像特定情報が含まれる。

一方、第４行目および第５行目に示すように、disable_rps_prediction_flagが０である場合、RPSには、inter_ref_pic_set_prediction_flagが含まれる。そして、第６行目乃至第８行目に示すように、inter_ref_pic_set_prediction_flagとunified_rps_prediction_control_present_flagが１である場合、RPSには、delta_idx_minus1は含まれず、delta_idx_minus1はunified_delta_idx_minus1とされる。

また、第９行目および第１０行目に示すように、inter_ref_pic_set_prediction_flagが１であり、unified_rps_prediction_control_present_flagが０である場合、RPSには、delta_idx_minus1が含まれる。

（本技術の効果の説明）
図２３および図２４は、図２０の設定部１５１により設定されるRPSの情報量を説明する図であり、図２５は、従来のRPSの情報量を説明する図である。

図２３の例では、GOP内の先頭から２番目のピクチャと８番目のピクチャの参照画像特定情報が、符号化順で１つ前のピクチャの参照画像特定情報と同一である。

この場合、図２３に示すように、設定部１５１は、disable_rps_prediction_flagとして０を設定し、unified_rps_prediction_control_present_flagとして１を設定する。また、設定部１５１は、unified_delta_idx_minus1として０を設定する。

さらに、設定部１５１は、例えば、インデックスが０であるRPSとして、inter_ref_pic_set_prediction_flagとしての０と、GOPの先頭のピクチャの参照画像特定情報とを設定する。また、設定部１５１は、インデックスが１であるRPSとして、inter_ref_pic_set_prediction_flagとしての１を設定する。そして、GOPの先頭のピクチャのRPSのインデックスが０とされ、２番目のピクチャと８番目のピクチャのRPSのインデックスが１とされる。

このように、設定部１５１は、GOP内の全てのピクチャに共通のdelta_idx_minus1をunified_delta_idx_minus1として設定する。従って、設定部１５１は、delta_idx_minus1をGOP単位で設定することができる。

また、図２４と図２５の例では、GOP内の全てのピクチャの参照画像特定情報が、符号化順で前のピクチャの参照画像特定情報と同一ではない。

この場合、図２４に示すように、設定部１５１は、disable_rps_prediction_flagとして１を設定し、GOP内の各ピクチャに対応するRPSとして、そのピクチャの参照画像特定情報を設定する。これに対して、従来の場合、図２５に示すように、GOP内の各ピクチャに対応するRPSとして、inter_ref_pic_set_prediction_flagとしての０と、そのピクチャの参照画像特定情報が設定される。

このように、設定部１５１は、GOP内の全てのピクチャに共通のinter_ref_pic_set_prediction_flagとしての０を、disable_rps_prediction_flagとして設定する。従って、disable_rps_prediction_flagが１である場合、従来の場合に比べて、inter_ref_pic_set_prediction_flag分だけRPSの情報量を削減することができる。

（符号化装置の処理の説明）
図２０の符号化装置１５０の生成処理は、RPS設定処理を除いて図１０の生成処理と同様であるので、以下では、RPS設定処理についてのみ説明する。

図２６は、符号化装置１５０の設定部１５１のRPS設定処理の詳細を説明するフローチャートである。

図２６のステップＳ１６１において、設定部１５１は、SPSとしてdisable_rps_prediction_flagを設定する。ステップＳ１６２において、設定部１５１は、disable_rps_prediction_flagが１であるかどうかを判定する。ステップＳ１６２でdisable_rps_prediction_flagが１ではないと判定された場合、ステップＳ１６３において、設定部１５１は、SPSとしてunified_rps_prediction_control_present_flagを設定する。

ステップＳ１６４において、設定部１５１は、unified_rps_prediction_control_present_flagが１であるかどうかを判定する。ステップＳ１６４でunified_rps_prediction_control_present_flagが１であると判定された場合、ステップＳ１６５において、設定部１５１は、SPSとしてunified_delta_idx_minus1を設定し、処理をステップＳ１６６に進める。

ステップＳ１６２でdisable_rps_prediction_flagが１であると判定された場合、または、ステップＳ１６４でunified_rps_prediction_control_present_flagが０であると判定された場合、処理はステップＳ１６６に進む。

ステップＳ１６６において、設定部１５１は、RPSのインデックスｉを０に設定する。ステップＳ１６７において、設定部１５１は、disable_rps_prediction_flagが１であるかどうかを判定する。ステップＳ１６７でdisable_rps_prediction_flagが１であると判定された場合、ステップＳ１６８において、設定部１５１は、inter_ref_pic_set_prediction_flagを０に設定し、処理をステップＳ１７０に進める。

一方、ステップＳ１６７でdisable_rps_prediction_flagが１ではないと判定された場合、ステップＳ１６９において、設定部１５１は、インデックスｉのRPSとしてinter_ref_pic_set_prediction_flagを設定し、処理をステップＳ１７０に進める。

ステップＳ１７０において、設定部１５１は、inter_ref_pic_set_prediction_flagが１であるかどうかを判定する。ステップＳ１７０でinter_ref_pic_set_prediction_flagが１であると判定された場合、ステップＳ１７１において、設定部１５１は、unified_rps_prediction_control_present_flagが１であるかどうかを判定する。

ステップＳ１７１でunified_rps_prediction_control_present_flagが１であると判定された場合、処理はステップＳ１７４に進む。一方、ステップＳ１７１でunified_rps_prediction_control_present_flagが１ではないと判定された場合、ステップＳ１７２において、設定部１５１は、インデックスｉのRPSとしてdelta_idx_minus1を設定し、処理をステップＳ１７４に進める。

また、ステップＳ１７０でinter_ref_pic_set_prediction_flagが１ではないと判定された場合、ステップＳ１７３において、設定部１５１は、インデックスｉのRPSとして参照画像特定情報を設定し、処理をステップＳ１７４に進める。

ステップＳ１７４において、設定部１５１は、インデックスｉを１だけインクリメントする。ステップＳ１７５において、設定部１５１は、インデックスｉが、SPSに含めるRPSの数num_short_term_ref_pic_sets以上であるかどうかを判定する。

ステップＳ１７５でインデックスｉが数num_short_term_ref_pic_sets以上ではないと判定された場合、処理はステップＳ１６７に戻り、インデックスｉが数num_short_term_ref_pic_sets以上になるまで、ステップＳ１６７乃至Ｓ１７５の処理が繰り返される。

一方、ステップＳ１７５でインデックスｉが数num_short_term_ref_pic_sets以上であると判定された場合、RPS設定処理は終了する。

以上のように、符号化装置１５０は、disable_rps_prediction_flagを設定するので、disable_rps_prediction_flagが１である場合、従来の場合に比べて、inter_ref_pic_set_prediction_flag分だけ、参照画像特定情報に関するRPSの情報量を削減することができる。また、inter_ref_pic_set_prediction_flagをGOP単位で設定することができる。

さらに、符号化装置１５０は、GOP内の全てのピクチャに共通のdelta_idx_minus1をunified_delta_idx_minus1として設定するので、delta_idx_minus1をGOP単位で設定することができる。

（復号装置の第２実施の形態の構成例）
図２７は、図２０の符号化装置１５０から伝送される符号化ストリームを復号する、本技術を適用した復号装置の第２実施の形態の構成例を示すブロック図である。

なお、図２７の構成のうち、図１５の構成と同一のものには同一の符号を付してあり、説明は繰り返しになるので、省略する。

図２７の復号装置１７０の構成は、抽出部１１２の代わりに抽出部１７１が設けられている点が、図１５の復号装置１１０の構成と異なる。復号装置１７０は、図２１のSPSに基づいて各RPSのRPS情報を設定する。

具体的には、復号装置１７０の抽出部１７１は、図１５の抽出部１１２と同様に、受け取り部１１１から供給される符号化ストリームから、SPS,PPS、符号化データ等を抽出する。抽出部１７１は、抽出部１１２と同様に、符号化データを復号部１１３に供給する。また、抽出部１７１は、図２１のSPSに基づいて、各RPSのRPS情報を取得し、復号部１１３に供給する。さらに、抽出部１７１は、抽出部１１２と同様に、SPSに含まれるRPS以外の情報やPPS等も、必要に応じて復号部１１３に供給する。

（復号装置の処理の説明）
図２７の復号装置１７０の受け取り処理は、RPS設定処理を除いて、図１７の受け取り処理と同様であるので、以下では、RPS設定処理についてのみ説明する。

図２８は、図２７の復号装置１７０のRPS設定処理の詳細を説明するフローチャートである。

図２８のステップＳ１９１において、抽出部１７１は、SPS（図２１）に含まれるnum_short_term_ref_pic_setsを取得する。ステップＳ１９２において、抽出部１７１は、SPSに含まれるdisable_rps_prediction_flagを取得する。ステップＳ１９３において、抽出部１７１は、取得されたdisable_rps_prediction_flagが１であるかどうかを判定する。

ステップＳ１９３でdisable_rps_prediction_flagが１ではないと判定された場合、ステップＳ１９４において、抽出部１７１は、SPSに含まれるunified_rps_prediction_control_present_flagを取得する。ステップＳ１９５において、抽出部１７１は、取得されたunified_rps_prediction_control_present_flagが１であるかどうかを判定する。

ステップＳ１９５でunified_rps_prediction_control_present_flagが１であると判定された場合、抽出部１７１は、SPSに含まれるunified_delta_idx_minus1を取得し、処理をステップＳ１９７に進める。

一方、ステップＳ１９５でunified_delta_idx_minus1が１ではないと判定された場合、処理はステップＳ１９７に進む。また、ステップＳ１９３でdisable_rps_prediction_flagが１であると判定された場合、処理はステップＳ１９７に進む。

ステップＳ１９７において、抽出部１７１は、生成するRPS情報に対応するRPSのインデックスｉを０に設定する。ステップＳ１９８において、抽出部１７１は、ステップＳ１９２で取得されたdisable_rps_prediction_flagが１であるかどうかを判定する。

ステップＳ１９８でdisable_rps_prediction_flagが１であると判定された場合、ステップＳ１９９において、抽出部１７１は、インデックスｉのRPSのRPS情報に含まれるinter_ref_pic_set_prediction_flagを０に設定し、処理をステップＳ２０１に進める。

一方、ステップＳ１９８でdisable_rps_prediction_flagが１ではないと判定された場合、ステップＳ２００において、抽出部１７１は、SPSに含まれるインデックスｉのRPSに含まれるinter_ref_pic_set_prediction_flagを取得する。そして、抽出部１７１は、取得されたinter_ref_pic_set_prediction_flagを、インデックスｉのRPSのRPS情報に含まれるinter_ref_pic_set_prediction_flagとして設定し、処理をステップＳ２０１に進める。

ステップＳ２０１において、抽出部１７１は、inter_ref_pic_set_prediction_flagが１であるかどうかを判定する。ステップＳ２０１でinter_ref_pic_set_prediction_flagが１であると判定された場合、ステップＳ２０２において、抽出部１７１は、ステップＳ１９４で取得されたunified_rps_prediction_control_present_flagが１であるかどうかを判定する。

ステップＳ２０２でunified_rps_prediction_control_present_flagが１であると判定された場合、処理はステップＳ２０３に進む。ステップＳ２０３において、抽出部１７１は、ステップＳ１９６で取得されたunified_delta_idx_minus1を、インデックスｉのRPSのRPS情報に含まれるunified_delta_idx_minus1として設定し、処理をステップＳ２０６に進める。

一方、ステップＳ２０２でunified_rps_prediction_control_present_flagが１ではないと判定された場合、ステップＳ２０４において、抽出部１７１は、SPSに含まれるインデックスｉのRPSに含まれるdelta_idx_minus1を取得する。そして、抽出部１７１は、取得されたdelta_idx_minus1をインデックスｉのRPSのRPS情報に含まれるdelta_idx_minus1として設定し、処理をステップＳ２０６に進める。

一方、ステップＳ２０１でinter_ref_pic_set_prediction_flagが１ではないと判定された場合、ステップＳ２０５において、抽出部１７１は、SPSに含まれるインデックスｉのRPSに含まれる参照画像特定情報を取得する。そして、抽出部１７１は、取得された参照画像特定情報をインデックスｉのRPSのRPS情報に含まれる参照画像特定情報として設定し、処理をステップＳ２０６に進める。

ステップＳ２０６乃至Ｓ２０８の処理は、図１８のステップＳ１２８乃至Ｓ１３０の処理と同様であるので、説明は省略する。

以上のように、復号装置１７０は、disable_rps_prediction_flagを受け取り、disable_rps_prediction_flagに基づいて復号対象の画像の参照画像特定情報を生成する。その結果、復号装置１７０は、disable_rps_prediction_flagが１である場合にinter_ref_pic_set_prediction_flag分だけRPSの情報量を削減した符号化ストリームを復号することができる。

また、復号装置１７０は、GOP内の全てのピクチャに共通のdelta_idx_minus1をunified_delta_idx_minus1として受け取り、unified_delta_idx_minus1に基づいて復号対象の画像の参照画像特定情報を生成する。その結果、復号装置１７０は、delta_idx_minus1をGOP単位で設定した符号化ストリームを復号することができる。

＜第３実施の形態＞
（符号化装置の第３実施の形態の構成例）
図２９は、本技術を適用した符号化装置の第３実施の形態の構成例を示すブロック図である。

なお、図２９の構成のうち、図３の構成と同一のものには同一の符号を付してあり、説明は繰り返しになるので、省略する。

図２９の符号化装置１９０の構成は、設定部１２の代わりに設定部１９１が設けられている点が、図３の符号化装置１０の構成と異なる。符号化装置１９０は、図３の符号化装置１０と図２０の符号化装置１５０を組み合わせたものである。

具体的には、符号化装置１９０の設定部１９１は、inter_ref_pic_set_prediction_flagを含まず、参照画像特定情報を含むRPSと、必要に応じてinter_ref_pic_set_prediction_flag，delta_idx_minus1、参照画像特定情報などを含むRPSを含むRPSを設定する。また、設定部１９１は、各RPSにインデックスを付与する。ここでは、inter_ref_pic_set_prediction_flagを含まず、参照画像特定情報を含むRPSのインデックスとして０が付与されるものとする。

設定部１９１は、インデックスが付与されたRPSを符号化部１１に供給する。また、設定部１９１は、RPSとdisable_rps_prediction_flagを含み、必要に応じてunified_rps_prediction_control_present_flagやunified_delta_idx_minus1を含むSPSを設定する。設定部１９１は、PPSなどを設定する。

また、設定部１９１は、図３の設定部１２と同様に、設定されたSPSおよびPPSと、符号化部１１から供給される符号化データとから、符号化ストリームを生成する。設定部１９１は、設定部１２と同様に、符号化ストリームを伝送部１３に供給する。

（SPSのシンタックスの例）
図３０は、図２９の設定部１９１により設定されるSPSのシンタックスの例を示す図である。

図３０の構成は、図２１の構成と同一であるので、説明は省略する。

（RPSのシンタックスの例）
図３１は、RPSのシンタックスの例を示す図である。

なお、図示は省略するが、図３１の第１１行目以降の記述は、図１の第５行目以降の記述と同様である。

図３１の第２行目と第３行目に示すように、インデックス(idx)が０である場合、または、disable_rps_prediction_flagが１である場合、RPSには、inter_ref_pic_set_prediction_flagが含まれず、inter_ref_pic_set_prediction_flagが0である場合に含まれる参照画像特定情報が含まれる。

第４行目乃至第１０行目の記述は、図２２の第４行目乃至第１０行目の記述と同様であるので、説明は省略する。

（本技術の効果の説明）
図３２は、図２９の設定部１９１により設定されるRPSの情報量を説明する図である。

図３２の例では、GOP内の先頭から２番目のピクチャと８番目のピクチャの参照画像特定情報が、符号化順で１つ前のピクチャの参照画像特定情報と同一である。

この場合、図３２に示すように、設定部１９１は、disable_rps_prediction_flagとして０を設定し、unified_rps_prediction_control_present_flagとして１を設定する。また、設定部１９１は、unified_delta_idx_minus1として０を設定する。

さらに、設定部１９１は、例えば、インデックスが０であるRPSとして、GOPの先頭のピクチャの参照画像特定情報を設定する。また、設定部１９１は、インデックスが１であるRPSとして、inter_ref_pic_set_prediction_flagとしての１を設定する。そして、GOPの先頭のピクチャのRPSのインデックスが０とされ、２番目のピクチャと８番目のピクチャのRPSのインデックスが１とされる。

このように、設定部１９１は、先頭のピクチャのRPSとして用いられるインデックスが0であるRPSとしてinter_ref_pic_set_prediction_flagを設定しない。従って、図８に示した従来の場合に比べて、先頭のピクチャのinter_ref_pic_set_prediction_flag分だけRPSの情報量を削減することができる。

また、設定部１９１は、GOP内の全てのピクチャに共通のdelta_idx_minus1をunified_delta_idx_minus1として設定する。従って、delta_idx_minus1をGOP単位で設定することができる。

さらに、図示は省略するが、設定部１９１は、GOP内の全てのピクチャに共通のinter_ref_pic_set_prediction_flagとしての０を、disable_rps_prediction_flagとして設定する。従って、disable_rps_prediction_flagが１である場合、従来の場合に比べて、先頭のピクチャ以外のピクチャのinter_ref_pic_set_prediction_flag分もRPSの情報量を削減することができる。

（符号化装置の処理の説明）
図２９の符号化装置１９０の生成処理は、RPS設定処理を除いて図１０の生成処理と同様であるので、以下では、RPS設定処理についてのみ説明する。

図３３は、符号化装置１９０の設定部１９１のRPS設定処理の詳細を説明するフローチャートである。

図３３のステップＳ２２１乃至Ｓ２２６の処理は、図２６のステップＳ１６１乃至Ｓ１６６の処理と同様であるので、説明は省略する。

ステップＳ２２７において、設定部１９１は、disable_rps_prediction_flagが１であるか、または、インデックスｉが０であるかを判定する。ステップＳ２２７でdisable_rps_prediction_flagが１であるか、または、インデックスｉが０であると判定された場合、処理はステップＳ２２８に進む。一方、ステップＳ２２７でdisable_rps_prediction_flagが１ではなく、かつ、インデックスｉが０ではないと判定された場合、処理はステップＳ２２９に進む。

ステップＳ２２８乃至Ｓ２３５の処理は、図２６のステップＳ１６８乃至Ｓ１７５の処理と同様であるので、説明は省略する。

（復号装置の第３実施の形態の構成例）
図３４は、図２９の符号化装置１９０から伝送される符号化ストリームを復号する、本技術を適用した復号装置の第３実施の形態の構成例を示すブロック図である。

なお、図３４の構成のうち、図１５の構成と同一のものには同一の符号を付してあり、説明は繰り返しになるので、省略する。

図３４の復号装置２１０の構成は、抽出部１１２の代わりに抽出部２１１が設けられている点が、図１５の復号装置１１０の構成と異なる。復号装置２１０は、図３１のRPSを含む図３０のSPSに基づいて各RPSのRPS情報を設定する。

具体的には、復号装置２１０の抽出部２１１は、図１５の抽出部１１２と同様に、受け取り部１１１から供給される符号化ストリームから、SPS,PPS、符号化データ等を抽出する。抽出部２１１は、抽出部１１２と同様に、符号化データを復号部１１３に供給する。また、抽出部２１１は、図３１のRPSを含む図３０のSPSに基づいて各RPSのRPS情報を取得し、復号部１１３に供給する。さらに、抽出部２１１は、抽出部１１２と同様に、SPSに含まれるRPS以外の情報やPPS等も、必要に応じて復号部１１３に供給する。

（復号装置の処理の説明）
図３４の復号装置２１０の受け取り処理は、RPS設定処理を除いて、図１７の受け取り処理と同様であるので、以下では、RPS設定処理についてのみ説明する。

図３５は、図３４の復号装置２１０のRPS設定処理の詳細を説明するフローチャートである。

図３５のステップＳ２５１乃至Ｓ２５７の処理は、図２８のステップＳ１９１乃至Ｓ１９７の処理と同様であるので、説明は省略する。

ステップＳ２５８において、抽出部２１１は、ステップＳ２５２で取得されたdisable_rps_prediction_flagが１であるか、または、インデックスｉが０であるかどうかを判定する。

ステップＳ２５８でdisable_rps_prediction_flagが１であるか、または、インデックスｉが０であると判定された場合、処理はステップＳ２５９に進む。一方、ステップＳ２５８でdisable_rps_prediction_flagが１ではなく、かつ、インデックスｉが０ではないと判定された場合、処理はステップＳ２６０に進む。

ステップＳ２５９乃至Ｓ２６８の処理は、図２８のステップＳ１９９乃至Ｓ２０８の処理と同様であるので、説明は省略する。

＜第４実施の形態＞
（符号化装置の第４実施の形態の構成例）
図３６は、本技術を適用した符号化装置の第４実施の形態の構成例を示すブロック図である。

なお、図３６の構成のうち、図３の構成と同一のものには同一の符号を付してあり、説明は繰り返しになるので、省略する。

図３６の符号化装置２３０の構成は、符号化部１１の代わりに符号化部２３１が設けられている点、および、設定部１２の代わりに設定部２３２が設けられている点が、図３の符号化装置１０の構成と異なる。符号化装置２３０は、ピクチャ内のスライスの種類に応じて、そのスライスの種類に不要な参照画像に関する情報を設定しない。

具体的には、符号化装置２３０の符号化部２３１には、フレーム単位の画像が入力信号として入力される。符号化部２３１は、設定部２３２から供給されるRPS,PPS等を参照して、入力信号をHEVC方式で符号化する。このとき、符号化部２３１は、必要に応じて、インター予測における参照画像に対して重み付け予測（Weighted Prediction）を行う。

重み付け予測とは、参照画像に対して重み付けを行って予測画像を生成する処理である。具体的には、例えば、符号化対象のフレームXより符号化順で前の2つのフレームY１とフレームY０の復号画像が参照画像として用いられる場合、重み付け予測では、フレームXの予測画像X'が、以下の式（３）により求められる。

なお、式（３）において、w０とw１は重み係数であり、dはオフセット値である。この重み係数とオフセット値は、符号化ストリームに含められて伝送される。

重み付け予測を行うことにより、フェードイン、フェードアウト、クロスフェード等により、参照画像と符号化対象の画像の間で輝度の変化が発生する場合であっても、予測画像と符号化対象の画像の差分を削減することができる。その結果、符号化効率を向上させることができる。

これに対して、重み付け予測が行われない場合、フェードイン、フェードアウト、クロスフェード等により参照画像と符号化対象の画像の間で発生する輝度の変化が、そのまま予測画像と符号化対象の画像の差分となり、符号化効率が悪い。

符号化部２３１は、符号化の結果得られる符号化データを設定部２３２に供給する。

設定部２３２は、図３の設定部１２と同様に、inter_ref_pic_set_prediction_flagを含まず、参照画像特定情報を含むRPSと、inter_ref_pic_set_prediction_flagと、参照画像特定情報またはdelta_idx_minus1とを含むRPSを設定する。設定部２３２は、設定部１２と同様に、各RPSにインデックスを付与する。

設定部２３２は、RPSを含むSPS,PPSなどを設定する。設定部２３２は、インデックスが付与されたRPSとPPSを符号化部２３１に供給する。設定部２３２は、設定されたSPSおよびPPSと、符号化部２３１から供給される符号化データとから、符号化ストリームを生成する。設定部２３２は、符号化ストリームを伝送部１３に供給する。

（符号化部の構成例）
図３７は、図３６の符号化部２３１の構成例を示すブロック図である。

なお、図３７の構成のうち、図４の構成と同一のものには同一の符号を付してあり、説明は繰り返しになるので、省略する。

図３７の符号化部２３１の構成は、動き予測・補償部４７の代わりに動き予測・補償部２５１が設けられ、可逆符号化部３６の代わりに可逆符号化部２５２が設けられている点が、図４の符号化部１１の構成と異なる。

動き予測・補償部２５１は、図３６の設定部２３２から供給されるPPSに基づいて、候補となる全てのインター予測モードの重み付け予測を用いた動き予測・補償処理を行う。
具体的には、動き予測・補償部２５１は、画面並べ替えバッファ３２から供給される画像と、フレームメモリ４４からスイッチ４５を介して読み出される参照画像に基づいて、候補となる全てのインター予測モードの動きベクトルを検出する。そして、動き予測・補償部２５１は、検出された動きベクトルに基づいて参照画像に補償処理を施す。

そして、動き予測・補償部２５１は、重み付け予測における重み係数とオフセット値からなる重み付け情報を算出する。動き予測・補償部２５１は、生成部として機能し、算出された重み付け情報に基づいて補償処理後の参照画像に対して重み付け予測を行い、予測画像を生成する。

このとき、動き予測・補償部２５１は、図４の動き予測・補償部４７と同様に、画面並べ替えバッファ３２から供給される画像と予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出する。そして、動き予測・補償部２５１は、動き予測・補償部４７と同様に、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。

そして、動き予測・補償部２５１は、動き予測・補償部４７と同様に、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部４８に供給する。また、動き予測・補償部２５１は、予測画像選択部４８から最適インター予測モードで生成された予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトル、重み付け情報などを可逆符号化部２５２に出力する。また、動き予測・補償部２５１は、参照画像特定情報を参照画像設定部４９に出力する。

可逆符号化部２５２は、図３６の設定部２３２から供給されるPPSに基づいて、符号化対象の画像のスライスの種類を表すスライスタイプを生成する。また、可逆符号化部２５２は、図４の可逆符号化部３６と同様に、イントラ予測モード情報をイントラ予測部４６から取得する。また、可逆符号化部２５２は、インター予測モード情報、動きベクトル、重み付け情報などを動き予測・補償部２５１から取得する。また、可逆符号化部２５２は、可逆符号化部３６と同様に、参照画像設定部４９から、RPSのインデックスまたはRPS等を取得し、レート制御部５０から量子化パラメータを取得する。

また、可逆符号化部２５２は、可逆符号化部３６と同様に、適応オフセットフィルタ４２から格納フラグ、インデックスまたはオフセット、および種類情報をオフセットフィルタ情報として取得し、適応ループフィルタ４３からフィルタ係数を取得する。

可逆符号化部２５２は、可逆符号化部３６と同様に、量子化部３５から供給される量子化された係数に対して可逆符号化を行う。また、可逆符号化部２５２は、スライスタイプ、イントラ予測モード情報、または、インター予測モード情報、動きベクトル、重み付け情報、RPSのインデックスまたはRPSなど、量子化パラメータ、オフセットフィルタ情報、およびフィルタ係数を、符号化情報として可逆符号化する。

可逆符号化部２５２は、可逆符号化された符号化情報をスライスヘッダとして、可逆符号化された係数に付加し、符号化データを生成する。可逆符号化部２５２は、符号化データを蓄積バッファ３７に供給し、蓄積させる。

（PPSのシンタックスの例）
図３８と図３９は、図３６の設定部２３２により設定されるPPSのシンタックスの例を示す図であり、図４０と図４１は、従来のHEVC方式におけるPPSのシンタックスの例を示す図である。

図３８の第６行目に示すように、設定部２３２により設定されるPPSには、対応するピクチャ内の全てのスライスの種類が同一であるかどうかを表す統一フラグ(unified_slice_type_flag)が含まれる。また、第７行目と第８行目に示すように、統一フラグが1である場合、PPSには、対応するピクチャ内の全てのスライスの種類がIスライスであるかどうかを表すIフラグ（all_intra_slice_flag）が含まれる。

また、第９行目および第１０行目に示すように、Iフラグが1ではない場合、即ちピクチャ内にPスライスまたはBスライスが含まれる場合、PPSには、対応するピクチャ内にBスライスがないかどうかを表すB無しフラグ（no_b_slice_flag）が含まれる。

そして、第１１行目と第１２行目に示すように、Iフラグが1ではない場合、PPSには、対応するピクチャよりも表示時刻が早い参照画像を用いた前方向の予測（L0予測）におけるRPSの最大数であるRPSL0数(num_ref_idx_l0_default_active_minus1)が、参照画像に関する情報として含まれる。

また、第１３行目と第１４行目に示すように、B無しフラグが0である場合、即ち、ピクチャ内にBスライスが含まれる場合、PPSには、対応するピクチャよりも表示時刻が遅い参照画像を用いた後ろ方向の予測（L1予測）におけるRPSの最大数であるRPSL1数(num_ref_idx_l1_default_active_minus1)が、参照画像に関する情報として含まれる。

第２５行目と第２６行目に示すように、Iフラグが1ではない場合、PPSには、Pスライスに対して重み付け予測を行うかどうかを表すP予測フラグ（weighted_pred_flag）が、参照画像に関する情報として含まれる。また、B無しフラグが1ではない場合、PPSには、Bスライスに対して重み付け予測を行うかどうかを表すB予測フラグ（weighted_bipred_flag）が、参照画像に関する情報として含まれる。

以上のように、図３８と図３９のPPSでは、対応するピクチャがIスライスのみからなる場合、RPSL0数、RPSL1数、P予測フラグ、およびB予測フラグが設定されない。また、対応するピクチャがIスライス以外のスライスを含む場合、RPSL1数とB予測フラグが設定されない。従って、ピクチャ内のスライスの種類によらず、全てのピクチャに対して、RPSL0数、RPSL1数、P予測フラグ、およびB予測フラグが設定される場合に比べて、符号化効率を向上させることができる。

なお、復号装置では、ピクチャがIスライスのみからなる場合、RPSL0数とRPSL1数が0であると認識され、ピクチャがIスライス以外のスライスを含む場合、RPSL1数が0であると認識される。

これに対して、図４０と図４１に示す従来のHEVC方式のPPSでは、図４０の６行目、７行目、１７行目、および１８行目に示すように、ピクチャ内のスライスの種類によらず、RPSL0数、RPSL1数、P予測フラグ、およびB予測フラグが設定される。

なお、ピクチャがBスライスのみからなる場合、P予測フラグは設定されないようにしてもよい。

（スライスヘッダのシンタックスの例）
図４２乃至図４４は、図３７の可逆符号化部２５２により付加されるスライスヘッダのシンタックスの例を示す図であり、図４５乃至図４７は、従来のHEVC方式におけるスライスヘッダのシンタックスの例を示す図である。

図４２の第２行目に示すように、可逆符号化部２５２により付加されるスライスヘッダには、対応するスライスがピクチャ内の先頭のスライスであるかどうかを表す先頭フラグ（first_slice_in_pic_flag）が含まれる。また、第１１行目と第１２行目に示すように、統一フラグが0である場合、または、統一フラグが1であり、かつ、先頭フラグが0である場合、スライスヘッダには、対応するスライスのスライスタイプ（slice_type）が含まれる。

即ち、図４２乃至図４４のスライスヘッダには、ピクチャ内のスライスの種類が同一ではない場合、または、ピクチャ内のスライスの種類が同一であり、かつ、対応するスライスがピクチャ内の先頭のスライスである場合、スライスタイプが設定される。

しかしながら、図４２乃至図４４のスライスヘッダには、ピクチャ内のスライスの種類が同一であり、かつ、対応するスライスがピクチャ内の先頭以外のスライスである場合、スライスタイプは設定されない。この場合、先頭のスライスのスライスヘッダに含まれるスライスタイプが、先頭以外のスライスのスライスタイプとされる。

従って、ピクチャ内の全てのスライスのスライスタイプが同一であるかどうかによらず、全てのスライスのスライスタイプが設定される場合に比べて、符号化効率を向上させることができる。

これに対して、図４５乃至図４７に示す従来のHEVC方式におけるスライスヘッダには、図４５の第１１行目に示すように、ピクチャ内の全てのスライスのスライスタイプが同一であるかどうかによらず、全てのスライスのスライスタイプが設定される。

（符号化装置の処理の説明）
図４８は、図３６の符号化装置２３０の生成処理を説明するフローチャートである。

図４８のステップＳ２８１において、符号化装置２３０の設定部２３２は、図１１のRPS設定処理を行う。ステップＳ２８２において、符号化部２３１は、外部から入力信号として入力されるフレーム単位の画像をHEVC方式で符号化する符号化処理を行う。この符号化処理の詳細は、後述する図４９および図５０を参照して説明する。

ステップＳ２８３において、設定部２３２は、インデックスが付与されたRPSを含むSPSを設定する。ステップＳ２８４において、設定部２３２は、PPSを設定するPPS設定処理を行う。このPPS設定処理の詳細は、後述する図５１を参照して説明する。

ステップＳ２８５およびステップＳ２８６の処理は、図１０のステップＳ１５およびＳ１６の処理と同様であるので、説明は省略する。

図４９および図５０は、図４８のステップＳ２８２の符号化処理の詳細を説明するフローチャートである。

図４９のステップＳ３０１およびＳ３０２の処理は、図１２のステップＳ３１およびＳ３２の処理と同様であるので、説明は省略する。

ステップＳ３０３において、動き予測・補償部２５１は、図３６の設定部２３２から供給されるPPSに含まれるP予測フラグまたはB予測フラグに基づいて、重み付け予測を行うかどうかを判定する。

具体的には、符号化対象の画像がPスライスである場合、P予測フラグが1であるとき、動き予測・補償部２５１は、重み付け予測を行うと判定する。また、符号化対象の画像がBスライスである場合、B予測フラグが1であるとき、動き予測・補償部２５１は、重み付け予測を行うと判定する。さらに、符号化対象の画像がIスライスである場合、ステップＳ３０３の処理をスキップして、ステップＳ３０４に進む。

ステップＳ３０３で重み付け予測を行うと判定された場合、ステップＳ３０４において、イントラ予測部４６は、候補となる全てのイントラ予測モードのイントラ予測処理を行う。また、イントラ予測部４６は、画面並べ替えバッファ３２から読み出された画像と、イントラ予測処理の結果生成される予測画像とに基づいて、候補となる全てのイントラ予測モードに対してコスト関数値を算出する。そして、イントラ予測部４６は、コスト関数値が最小となるイントラ予測モードを、最適イントラ予測モードに決定する。イントラ予測部４６は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、予測画像選択部４８に供給する。

また、動き予測・補償部２５１は、候補となる全てのインター予測モードの重み付け予測を用いた動き予測・補償処理を行う。また、動き予測・補償部２５１は、画面並べ替えバッファ３２から供給される画像と予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、動き予測・補償部２５１は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部４８に供給する。

但し、符号化対象の画像がIスライスである場合、動き予測・補償処理は行われない。ステップＳ３０４の処理後、処理はステップＳ３０６に進む。

一方、ステップＳ３０３で重み付け予測を行わないと判定された場合、ステップＳ３０５において、イントラ予測部４６は、ステップＳ３０４の処理と同様の処理を行う。

また、動き予測・補償部２５１は、候補となる全てのインター予測モードの動き予測・補償処理を行う。また、動き予測・補償部２５１は、画面並べ替えバッファ３２から供給される画像と予測画像とに基づいて、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、動き予測・補償部２５１は、最適インター予測モードのコスト関数値と、対応する予測画像を予測画像選択部４８に供給する。そして、処理はステップＳ３０６に進む。

ステップＳ３０６乃至Ｓ３０８の処理は、図１２のステップＳ３４乃至Ｓ３６の処理と同様であるので、説明は省略する。

ステップＳ３０８の処理後、ステップＳ３０９において、動き予測・補償部２５１は、動き予測・補償処理において重み付け予測を行ったかどうかを判定する。ステップＳ３０９で重み付け予測を行ったと判定された場合、ステップＳ３１０において、動き予測・補償部２５１は、重み付け予測における重み付け情報を可逆符号化部２５２に供給する。そして、ステップＳ３１１に進む。

ステップＳ３１１乃至Ｓ３２２の処理は、図１２および図１３のステップＳ３７乃至Ｓ４８の処理と同様であるので、説明は省略する。

図５０のステップＳ３２３において、可逆符号化部２５２は、図３６の設定部２３２から供給されるPPSに含まれる統一フラグが0であるか、または、統一フラグと先頭フラグが1であるかどうかを判定する。

ステップＳ３２３で統一フラグが0であるか、または、統一フラグと先頭フラグが1であると判定された場合、ステップＳ３２４において、可逆符号化部２５２は、符号化対象の画像のスライスタイプを生成する。そして、処理はステップＳ３２５に進む。

一方、ステップＳ３２３で統一フラグが0ではなく、かつ、統一フラグと先頭フラグが1ではないと判定された場合、処理はステップＳ３２５に進む。

ステップＳ３２５において、可逆符号化部２５２は、スライスタイプ、イントラ予測モード情報、または、インター予測モード情報、動きベクトル、重み付け情報、RPSのインデックスまたはRPSなど、レート制御部５０からの量子化パラメータ、オフセットフィルタ情報、およびフィルタ係数を、符号化情報として可逆符号化する。

ステップＳ３２６乃至Ｓ３２９の処理は、図１３のステップＳ５０乃至Ｓ５３の処理と同様であるので、説明は省略する。

図５１は、図４８のステップＳ２８４のPPS設定処理の詳細を説明するフローチャートである。このPPS設定処理は、ピクチャ単位で行われる。

図５１のステップＳ３３１において、設定部２３２は、ピクチャ内の全てのスライスの種類は同一であるかどうかを判定する。ステップＳ３３１でピクチャ内の全てのスライスの種類が同一であると判定された場合、ステップＳ３３２において、設定部２３２は、統一フラグを1に設定し、PPSに含める。

ステップＳ３３３において、設定部２３２は、ピクチャ内の全てのスライスの種類はIスライスであるかどうかを判定する。ステップＳ３３３でピクチャ内の全てのスライスの種類がIスライスであると判定された場合、ステップＳ３３４において、設定部２３２は、Iフラグを1に設定してPPSに含め、処理をステップＳ３３７に進める。

一方、ステップＳ３３３でピクチャ内の全てのスライスの種類がIスライスではないと判定された場合、ステップＳ３３５において、設定部２３２は、Iフラグを０に設定してPPSに含め、処理をステップＳ３３７に進める。

一方、ステップＳ３３１でピクチャ内の全てのスライスの種類が同一ではないと判定された場合、ステップＳ３３６において、設定部２３２は、統一フラグを0に設定してPPSに含め、処理をステップＳ３３７に進める。

ステップＳ３３７において、設定部２３２は、Iフラグが1ではないかどうかを判定する。ステップＳ３３７でIフラグが1ではないと判定された場合、ステップＳ３３８において、設定部２３２は、PPSに含まれるRPSL0数とP予測フラグを設定し、PPSに含める。

ステップＳ３３９において、設定部２３２は、ピクチャ内にBスライスが含まれるかどうかを判定する。ステップＳ３３９でピクチャ内にBスライスが含まれると判定された場合、ステップＳ３４０において、設定部２３２は、PPSに含まれるB無しフラグを0に設定し、PPSに含める。ステップＳ３４１において、設定部２３２は、PPSに含まれるRPSL1数とB予測フラグを設定し、PPSに含める。そして、処理は、図４８のステップＳ２８４に戻り、ステップＳ２８５に進む。

一方、ステップＳ３３９でピクチャ内にBスライスが含まれていないと判定された場合、ステップＳ３４２において、設定部２３２は、B無しフラグを1に設定し、PPSに含める。そして、処理は、図４８のステップＳ２８４に戻り、ステップＳ２８５に進む。

また、ステップＳ３３７でIフラグが1であると判定された場合、処理は、図４８のステップＳ２８４に戻り、ステップＳ２８５に進む。

以上のように、符号化装置２３０は、ピクチャ内のスライスの種類に応じて参照画像に関する情報を設定するので、参照画像に関する情報の情報量を削減し、符号化効率を向上させることができる。また、符号化装置２３０は、ピクチャ内の全てのスライスの種類が同一であるかどうかによってスライスタイプを設定するので、スライスタイプの情報量を削減し、符号化効率を向上させることができる。

（復号装置の第４実施の形態の構成例）
図５２は、図３６の符号化装置２３０から伝送される符号化ストリームを復号する、本技術を適用した復号装置の第４実施の形態の構成例を示すブロック図である。

なお、図５２の構成のうち、図１５の構成と同一のものには同一の符号を付してあり、説明は繰り返しになるので、省略する。

図５２の復号装置２７０の構成は、復号部１１３の代わりに復号部２７１が設けられる点が、図１５の構成と異なる。復号装置２７０は、必要に応じて、動き補償処理時に重み付け予測を行う。

具体的には、復号装置２７０の復号部２７１は、抽出部１１２から供給される各RPSのinter_ref_pic_set_prediction_flagとdelta_idx_minus1または参照画像特定情報とに基づいて、抽出部１１２から供給される符号化データをHEVC方式で復号する。このとき、復号部２７１は、必要に応じてSPSに含まれるRPS以外の情報やPPS等も参照する。また、復号部２７１は、必要に応じて、動き補償処理時に重み付け予測を行う。復号部２７１は、復号の結果得られる画像を、出力信号として出力する。

（復号部の構成例）
図５３は、図５２の復号部２７１の構成例を示すブロック図である。

なお、図５３の構成のうち、図１６の構成と同一のものには同一の符号を付してあり、説明は繰り返しになるので、省略する。

図５３の復号部２７１の構成は、可逆復号部１３２の代わりに可逆復号部２９１が設けられる点、および、動き補償部１４５の代わりに動き補償部２９２が設けられる点が、図１６の構成と異なる。

復号部２７１の可逆復号部２９１は、図１６の可逆復号部１３２と同様に、蓄積バッファ１３１からの符号化データに対して可逆復号を施すことで、量子化された係数と符号化情報を得る。可逆復号部２９１は、可逆復号部１３２と同様に、量子化された係数を逆量子化部１３３に供給する。また、可逆復号部２９１は、符号化情報としてのイントラ予測モード情報などをイントラ予測部１４３に供給し、動きベクトル、インター予測モード情報、重み付け情報などを動き補償部２９２に供給する。可逆復号部２９１は、可逆復号部１３２と同様に、符号化情報としてのRPSフラグとRPSのインデックスまたはRPSとを参照画像設定部１４４に供給する。

さらに、可逆復号部２９１は、可逆復号部１３２と同様に、符号化情報としてのイントラ予測モード情報またはインター予測モード情報をスイッチ１４６に供給する。可逆復号部２９１は、可逆復号部１３２と同様に、符号化情報としてのオフセットフィルタ情報を適応オフセットフィルタ１３７に供給し、フィルタ係数を適応ループフィルタ１３８に供給する。

動き補償部２９２は、図１６の動き補償部１４５と同様に、参照画像設定部１４４から供給される参照画像特定情報に基づいて、フレームメモリ１４１からスイッチ１４２を介して、参照画像特定情報により特定される参照画像を読み出す。

また、動き補償部２９２は、抽出部１１２から供給されるPPSに含まれるP予測フラグまたはB予測フラグに基づいて、図３７の動き予測・補償部２５１と同様に、重み付け予測を行うかどうかを判定する。

動き補償部２９２は、生成部として機能し、重み付け予測を行うと判定した場合、動きベクトルと参照画像を用いて、インター予測モード情報が示す最適インター予測モードの重み付け予測を用いた動き補償処理を行う。このとき、動き補償部２９２は、必要に応じて、符号化対象の画像のスライスがPスライスである場合RPSL0数を参照し、符号化対象の画像のスライスがBスライスである場合RPSL0数とRPSL1数を参照する。

一方、動き補償部２９２は、重み付け予測を行わないと判定した場合、動き補償部１４５と同様に、最適インター予測モードの動き補償処理を行う。動き補償部２９２は、その結果生成される予測画像をスイッチ１４６に供給する。

（復号装置の処理の説明）
図５４は、図５２の復号装置２７０による受け取り処理を説明するフローチャートである。

図５４のステップＳ３５１乃至Ｓ３５３の処理は、図１７のステップＳ１１１乃至Ｓ１１３の処理と同様であるので、説明は省略する。

ステップＳ３５４において、復号部２７１は、抽出部１１２から供給される各RPSのRPS情報とPPSに基づいて復号処理を行う。この復号処理の詳細は、後述する図５５を参照して説明する。そして、処理は終了する。

図５５は、図５４のステップＳ３５４の復号処理の詳細を説明するフローチャートである。

図５５のステップＳ３６１において、復号部２７１の蓄積バッファ１３１は、図５２の抽出部１１２からフレーム単位の符号化データを受け取り、蓄積する。蓄積バッファ１３１は、蓄積されている符号化データを可逆復号部２９１に供給する。

ステップＳ３６２において、可逆復号部２９１は、蓄積バッファ１３１からの符号化データを可逆復号し、量子化された係数と符号化情報を得る。可逆復号部２９１は、量子化された係数を逆量子化部１３３に供給する。また、可逆復号部２９１は、符号化情報としてのイントラ予測モード情報などをイントラ予測部１４３に供給し、動きベクトル、インター予測モード情報、重み付け情報、RPSフラグとRPSのインデックスまたはRPSなどを動き補償部２９２に供給する。

さらに、可逆復号部２９１は、符号化情報としてのイントラ予測モード情報またはインター予測モード情報をスイッチ１４６に供給する。可逆復号部２９１は、符号化情報としてのオフセットフィルタ情報を適応オフセットフィルタ１３７に供給し、フィルタ係数を適応ループフィルタ１３８に供給する。

ステップＳ３６３乃至Ｓ３６５の処理は、図１９のステップＳ１３３乃至Ｓ１３５の処理と同様であるので、説明は省略する。ステップＳ３６６において、動き補償部２９２は、図５２の抽出部１１２から供給されるPPSに含まれるP予測フラグまたはB予測フラグに基づいて、図３７の動き予測・補償部２５１と同様に、重み付け予測を行うかどうかを判定する。

ステップＳ３６６で重み付け予測を行うと判定された場合、ステップＳ３６７において、動き補償部２９２は、参照画像設定部１４４から供給される参照画像特定情報に基づいて参照画像を読み出し、動きベクトルと参照画像を用いて、インター予測モード情報が示す最適インター予測モードの重み付け予測を用いた動き補償処理を行う。

このとき、必要に応じて、符号化対象の画像のスライスがPスライスである場合RPSL0数を参照し、符号化対象の画像のスライスがBスライスである場合RPSL0数とRPSL1数を参照する。動き補償部２９２は、その結果生成される予測画像を、スイッチ１４６を介して加算部１３５に供給し、処理をステップＳ３７０に進める。

一方、ステップＳ３６６で重み付け予測を行わないと判定された場合、ステップＳ３６８において、動き補償部２９２は、参照画像設定部１４４から供給される参照画像特定情報に基づいて参照画像を読み出し、動きベクトルと参照画像を用いて、インター予測モード情報が示す最適インター予測モードの動き補償処理を行う。動き補償部２９２は、その結果生成される予測画像を、スイッチ１４６を介して加算部１３５に供給し、処理をステップＳ３７０に進める。

ステップＳ３６９乃至Ｓ３７７の処理は、図１９のステップＳ１３７乃至Ｓ１４５の処理と同様であるので、説明は省略する。

以上のように、復号装置２７０は、ピクチャ内のスライスの種類に応じて参照画像に関する情報を設定することにより符号化効率が向上された符号化ストリームを復号することができる。

なお、第４実施の形態では、参照画像に関する情報は、RPSL0数、RPSL1数、P予測フラグ、およびB予測フラグであるものとしたが、これに限定されない。

＜多視画像点符号化・多視点画像復号への適用＞
上述した一連の処理は、多視点画像符号化・多視点画像復号に適用することができる。図５６は、多視点画像符号化方式の一例を示す。

図５６に示されるように、多視点画像は、複数の視点の画像を含み、その複数の視点のうちの所定の１つの視点の画像が、ベースビューの画像に指定されている。ベースビューの画像以外の各視点の画像は、ノンベースビューの画像として扱われる。

図５６のような多視点画像符号化を行う場合、各ビュー（同一ビュー）において、量子化パラメータの差分をとることもできる：

多視点画像符号化を行う場合、各ビュー(異なるビュー)において、量子化パラメータの差分をとることもできる：

この場合、上記(1)乃至(4)を組み合わせて用いることもできる。たとえば、ノンベースビューでは、ベースビューとノンベースビューとの間においてスライスレベルで量子化パラメータの差分をとる手法(3-1と2-3とを組み合わせる)、ベースビューとノンベースビューとの間においてLCUレベルで量子化パラメータの差分をとる手法(3-2と2-1とを組み合わせる)、が考えられる。このように、差分を繰り返して適用することにより、多視点符号化を行った場合においても、符号化効率を向上させることができる。

上述した手法と同様に、上記の各dQPに対して、値が0でないdQPが存在するか否かを識別するフラグをセットすることもできる。

＜多視点画像符号化装置＞
図５７は、上述した多視点画像符号化を行う多視点画像符号化装置を示す図である。図５７に示されるように、多視点画像符号化装置６００は、符号化部６０１、符号化部６０２、および多重化部６０３を有する。

符号化部６０１は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部６０２は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部６０３は、符号化部６０１において生成されたベースビュー画像符号化ストリームと、符号化部６０２において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。

この多視点画像符号化装置６００の符号化部６０１および符号化部６０２に対して、符号化装置１０（１５０，１９０）を適用することができる。この場合、多視点画像符号化装置６００は、符号化部６０１が設定する量子化パラメータと符号化部６０２が設定する量子化パラメータとの差分値を設定して、伝送させる。

＜多視点画像復号装置＞
図５８は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。図５８に示されるように、多視点画像復号装置６１０は、逆多重化部６１１、復号部６１２、および復号部６１３を有する。

逆多重化部６１１は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部６１２は、逆多重化部６１１により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部６１３は、逆多重化部６１１により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。

この多視点画像復号装置６１０の復号部６１２および復号部６１３に対して、復号装置１１０（１７０，２１０）を適用することができる。この場合、多視点画像復号装置６１０は、符号化部６０１が設定する量子化パラメータと符号化部６０２が設定する量子化パラメータとの差分値から量子化パラメータを設定して、逆量子化を行う。

＜階層画像点符号化・階層画像復号への適用＞
上述した一連の処理は、階層画像符号化・階層画像復号に適用することができる。図５９は、階層画像符号化方式の一例を示す。

図５９に示されるように、階層画像は、複数の階層(解像度)の画像を含み、その複数の解像度のうちの所定の１つの階層の画像が、ベースレイヤの画像に指定されている。ベースレイヤの画像以外の各階層の画像は、ノンベースレイヤの画像として扱われる。

図５９のような階層画像符号化(空間スケーラビリティ)を行う場合、各レイヤ(同一レイヤ)において、量子化パラメータの差分をとることもできる：

階層符号化を行う場合、各レイヤ(異なるレイヤ)において、量子化パラメータの差分をとることもできる：

この場合、上記(1)乃至(4)を組み合わせて用いることもできる。たとえば、ノンベースレイヤでは、ベースレイヤとノンベースレイヤとの間においてスライスレベルで量子化パラメータの差分をとる手法(3-1と2-3とを組み合わせる)、ベースレイヤとノンベースレイヤとの間においてLCUレベルで量子化パラメータの差分をとる手法(3-2と2-1とを組み合わせる)、が考えられる。このように、差分を繰り返して適用することにより、階層符号化を行った場合においても、符号化効率を向上させることができる。

＜階層画像符号化装置＞
図６０は、上述した階層画像符号化を行う階層画像符号化装置を示す図である。図６０に示されるように、階層画像符号化装置６２０は、符号化部６２１、符号化部６２２、および多重化部６２３を有する。

符号化部６２１は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。符号化部６２２は、ノンベースレイヤ画像を符号化し、ノンベースレイヤ画像符号化ストリームを生成する。多重化部６２３は、符号化部６２１において生成されたベースレイヤ画像符号化ストリームと、符号化部６２２において生成されたノンベースレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。

この階層画像符号化装置６２０の符号化部６２１および符号化部６２２に対して、符号化装置１０（１５０，１９０）を適用することができる。この場合、階層画像符号化装置６２０は、符号化部６２１が設定する量子化パラメータと符号化部６２２が設定する量子化パラメータとの差分値を設定して、伝送させる。

＜階層画像復号装置＞
図６１は、上述した階層画像復号を行う階層画像復号装置を示す図である。図６１に示されるように、階層画像復号装置６３０は、逆多重化部６３１、復号部６３２、および復号部６３３を有する。

逆多重化部６３１は、ベースレイヤ画像符号化ストリームとノンベースレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを逆多重化し、ベースレイヤ画像符号化ストリームと、ノンベースレイヤ画像符号化ストリームとを抽出する。復号部６３２は、逆多重化部６３１により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。復号部６３３は、逆多重化部６３１により抽出されたノンベースレイヤ画像符号化ストリームを復号し、ノンベースレイヤ画像を得る。

この階層画像復号装置６３０の復号部６３２および復号部６３３に対して、復号装置１１０（１７０，２１０）を適用することができる。この場合、階層画像復号装置６３０は、符号化部６２１が設定する量子化パラメータと符号化部６２２が設定する量子化パラメータとの差分値から量子化パラメータ設定して、逆量子化を行う。

＜本技術を適用したコンピュータの説明＞
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

図６２は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

コンピュータにおいて、CPU（Central Processing Unit）８０１，ROM（Read Only Memory）８０２，RAM（Random Access Memory）８０３は、バス８０４により相互に接続されている。

バス８０４には、さらに、入出力インタフェース８０５が接続されている。入出力インタフェース８０５には、入力部８０６、出力部８０７、記憶部８０８、通信部８０９、及びドライブ８１０が接続されている。

入力部８０６は、キーボード、マウス、マイクロホンなどよりなる。出力部８０７は、ディスプレイ、スピーカなどよりなる。記憶部８０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部８０９は、ネットワークインタフェースなどよりなる。ドライブ８１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア８１１を駆動する。

以上のように構成されるコンピュータでは、CPU８０１が、例えば、記憶部８０８に記憶されているプログラムを、入出力インタフェース８０５及びバス８０４を介して、RAM８０３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU８０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブルメディア８１１をドライブ８１０に装着することにより、入出力インタフェース８０５を介して、記憶部８０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部８０９で受信し、記憶部８０８にインストールすることができる。その他、プログラムは、ROM８０２や記憶部８０８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

＜テレビジョン装置の構成例＞
図６３は、本技術を適用したテレビジョン装置の概略構成を例示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース部９０９を有している。さらに、テレビジョン装置９００は、制御部９１０、ユーザインタフェース部９１１等を有している。

チューナ９０２は、アンテナ９０１で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ビットストリームをデマルチプレクサ９０３に出力する。

デマルチプレクサ９０３は、符号化ビットストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ９０４に出力する。また、デマルチプレクサ９０３は、ＥＰＧ（Electronic Program Guide）等のデータのパケットを制御部９１０に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。

デコーダ９０４は、パケットの復号化処理を行い、復号処理化によって生成された映像データを映像信号処理部９０５、音声データを音声信号処理部９０７に出力する。

映像信号処理部９０５は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部９０５は、表示部９０６に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部９０５は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部９０５は、このようにして生成した映像データに基づいて駆動信号を生成して表示部９０６を駆動する。

表示部９０６は、映像信号処理部９０５からの駆動信号に基づき表示デバイス（例えば液晶表示素子等）を駆動して、番組の映像などを表示させる。

音声信号処理部９０７は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのＤ／Ａ変換処理や増幅処理を行いスピーカ９０８に供給することで音声出力を行う。

外部インタフェース部９０９は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。

制御部９１０にはユーザインタフェース部９１１が接続されている。ユーザインタフェース部９１１は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９１０に供給する。

制御部９１０は、ＣＰＵ(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータ、ＥＰＧデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置９００の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、テレビジョン装置９００がユーザ操作に応じた動作となるように各部を制御する。

なお、テレビジョン装置９００では、チューナ９０２、デマルチプレクサ９０３、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース部９０９等と制御部９１０を接続するためバス９１２が設けられている。

このように構成されたテレビジョン装置では、デコーダ９０４に本願の復号装置（復号方法）の機能が設けられる。このため、参照画像を特定する情報に関する情報の情報量を削減した符号化ストリームを復号することができる。

＜携帯電話機の構成例＞
図６４は、本技術を適用した携帯電話機の概略構成を例示している。携帯電話機９２０は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１を有している。これらは、バス９３３を介して互いに接続されている。

また、通信部９２２にはアンテナ９２１が接続されており、音声コーデック９２３には、スピーカ９２４とマイクロホン９２５が接続されている。さらに制御部９３１には、操作部９３２が接続されている。

携帯電話機９２０は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

音声通話モードにおいて、マイクロホン９２５で生成された音声信号は、音声コーデック９２３で音声データへの変換やデータ圧縮が行われて通信部９２２に供給される。通信部９２２は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部９２２は、送信信号をアンテナ９２１に供給して図示しない基地局へ送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック９２３に供給する。音声コーデック９２３は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ９２４に出力する。

また、データ通信モードにおいて、メール送信を行う場合、制御部９３１は、操作部９３２の操作によって入力された文字データを受け付けて、入力された文字を表示部９３０に表示する。また、制御部９３１は、操作部９３２におけるユーザ指示等に基づいてメールデータを生成して通信部９２２に供給する。通信部９２２は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部９３０に供給して、メール内容の表示を行う。

なお、携帯電話機９２０は、受信したメールデータを、記録再生部９２９で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、ＲＡＭや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、またはメモリカード等のリムーバブルメディアである。

データ通信モードにおいて画像データを送信する場合、カメラ部９２６で生成された画像データを、画像処理部９２７に供給する。画像処理部９２７は、画像データの符号化処理を行い、符号化データを生成する。

多重分離部９２８は、画像処理部９２７で生成された符号化データと、音声コーデック９２３から供給された音声データを所定の方式で多重化して通信部９２２に供給する。通信部９２２は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部９２８に供給する。多重分離部９２８は、多重化データの分離を行い、符号化データを画像処理部９２７、音声データを音声コーデック９２３に供給する。画像処理部９２７は、符号化データの復号化処理を行い、画像データを生成する。この画像データを表示部９３０に供給して、受信した画像の表示を行う。音声コーデック９２３は、音声データをアナログ音声信号に変換してスピーカ９２４に供給して、受信した音声を出力する。

このように構成された携帯電話装置では、画像処理部９２７に本願の符号化装置および復号装置（符号化方法および復号方法）の機能が設けられる。このため、参照画像を特定する情報に関する情報の情報量を削減した符号化ストリームを復号することができる。

＜記録再生装置の構成例＞
図６５は、本技術を適用した記録再生装置の概略構成を例示している。記録再生装置９４０は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置９４０は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置９４０は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。

記録再生装置９４０は、チューナ９４１、外部インタフェース部９４２、エンコーダ９４３、ＨＤＤ（Hard Disk Drive）部９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen Display）部９４８、制御部９４９、ユーザインタフェース部９５０を有している。

チューナ９４１は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ９４１は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ９４６に出力する。

外部インタフェース部９４２は、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース部、ＵＳＢインタフェース、フラッシュメモリインタフェース等の少なくともいずれかで構成されている。外部インタフェース部９４２は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。

エンコーダ９４３は、外部インタフェース部９４２から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームをセレクタ９４６に出力する。

ＨＤＤ部９４４は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。

ディスクドライブ９４５は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばＤＶＤディスク（ＤＶＤ−Ｖｉｄｅｏ、ＤＶＤ−ＲＡＭ、ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）やＢｌｕ−ｒａｙ（登録商標）ディスク等である。

セレクタ９４６は、映像や音声の記録時には、チューナ９４１またはエンコーダ９４３からのいずれかの符号化ビットストリームを選択して、ＨＤＤ部９４４やディスクドライブ９４５のいずれかに供給する。また、セレクタ９４６は、映像や音声の再生時に、ＨＤＤ部９４４またはディスクドライブ９４５から出力された符号化ビットストリームをデコーダ９４７に供給する。

デコーダ９４７は、符号化ビットストリームの復号化処理を行う。デコーダ９４７は、復号処理化を行うことにより生成された映像データをＯＳＤ部９４８に供給する。また、デコーダ９４７は、復号処理化を行うことにより生成された音声データを出力する。

ＯＳＤ部９４８は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ９４７から出力された映像データに重畳して出力する。

制御部９４９には、ユーザインタフェース部９５０が接続されている。ユーザインタフェース部９５０は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９４９に供給する。

制御部９４９は、ＣＰＵやメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置９４０の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、記録再生装置９４０がユーザ操作に応じた動作となるように各部を制御する。

このように構成された記録再生装置では、デコーダ９４７に本願の復号装置（復号方法）の機能が設けられる。このため、参照画像を特定する情報に関する情報の情報量を削減した符号化ストリームを復号することができる。

＜撮像装置の構成例＞
図６６は、本技術を適用した撮像装置の概略構成を例示している。撮像装置９６０は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、カメラ信号処理部９６３、画像データ処理部９６４、表示部９６５、外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０を有している。また、制御部９７０には、ユーザインタフェース部９７１が接続されている。さらに、画像データ処理部９６４や外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０等は、バス９７２を介して接続されている。

光学ブロック９６１は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤまたはＣＭＯＳイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部９６３に供給する。

カメラ信号処理部９６３は、撮像部９６２から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部９６３は、カメラ信号処理後の画像データを画像データ処理部９６４に供給する。

画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データの符号化処理を行う。画像データ処理部９６４は、符号化処理を行うことにより生成された符号化データを外部インタフェース部９６６やメディアドライブ９６８に供給する。また、画像データ処理部９６４は、外部インタフェース部９６６やメディアドライブ９６８から供給された符号化データの復号化処理を行う。画像データ処理部９６４は、復号化処理を行うことにより生成された画像データを表示部９６５に供給する。また、画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データを表示部９６５に供給する処理や、ＯＳＤ部９６９から取得した表示用データを、画像データに重畳させて表示部９６５に供給する。

ＯＳＤ部９６９は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部９６４に出力する。

外部インタフェース部９６６は、例えば、ＵＳＢ入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部９６６には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部９６６は、ＬＡＮやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部９７０は、例えば、ユーザインタフェース部９７１からの指示にしたがって、メディアドライブ９６８から符号化データを読み出し、それを外部インタフェース部９６６から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部９７０は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部９６６を介して取得し、それを画像データ処理部９６４に供給したりすることができる。

メディアドライブ９６８で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触IC（Integrated Circuit）カード等であってもよい。

また、メディアドライブ９６８と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやＳＳＤ（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

制御部９７０は、ＣＰＵを用いて構成されている。メモリ部９６７は、制御部９７０により実行されるプログラムや制御部９７０が処理を行う上で必要な各種のデータ等を記憶する。メモリ部９６７に記憶されているプログラムは、撮像装置９６０の起動時などの所定タイミングで制御部９７０により読み出されて実行される。制御部９７０は、プログラムを実行することで、撮像装置９６０がユーザ操作に応じた動作となるように各部を制御する。

このように構成された撮像装置では、画像データ処理部９６４に本願の符号化装置および復号装置（符号化方法および復号方法）の機能が設けられる。このため、参照画像を特定する情報に関する情報の情報量を削減することができる。また、参照画像を特定する情報に関する情報の情報量を削減した符号化ストリームを復号することができる。

＜階層符号化の応用例＞
（第１のシステム）
次に、階層符号化（スケーラブル符号化）されたスケーラブル符号化データの具体的な利用例について説明する。スケーラブル符号化は、例えば、図６７に示される例のように、伝送するデータの選択のために利用される。

図６７に示されるデータ伝送システム１０００において、配信サーバ１００２は、スケーラブル符号化データ記憶部１００１に記憶されているスケーラブル符号化データを読み出し、ネットワーク１００３を介して、パーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置に配信する。

その際、配信サーバ１００２は、端末装置の能力や通信環境等に応じて、適切な品質の符号化データを選択して伝送する。配信サーバ１００２が不要に高品質なデータを伝送しても、端末装置において高画質な画像を得られるとは限らず、遅延やオーバーフローの発生要因となる恐れがある。また、不要に通信帯域を占有したり、端末装置の負荷を不要に増大させたりしてしまう恐れもある。逆に、配信サーバ１００２が不要に低品質なデータを伝送しても、端末装置において十分な画質の画像を得ることができない恐れがある。そのため、配信サーバ１００２は、スケーラブル符号化データ記憶部１００１に記憶されているスケーラブル符号化データを、適宜、端末装置の能力や通信環境等に対して適切な品質の符号化データとして読み出し、伝送する。

例えば、スケーラブル符号化データ記憶部１００１は、スケーラブルに符号化されたスケーラブル符号化データ（BL+EL）１０１１を記憶するとする。このスケーラブル符号化データ（BL+EL）１０１１は、ベースレイヤとエンハンスメントレイヤの両方を含む符号化データであり、復号することにより、ベースレイヤの画像およびエンハンスメントレイヤの画像の両方を得ることができるデータである。

配信サーバ１００２は、データを伝送する端末装置の能力や通信環境等に応じて、適切なレイヤを選択し、そのレイヤのデータを読み出す。例えば、配信サーバ１００２は、処理能力の高いパーソナルコンピュータ１００４やタブレットデバイス１００６に対しては、高品質なスケーラブル符号化データ（BL+EL）１０１１をスケーラブル符号化データ記憶部１００１から読み出し、そのまま伝送する。これに対して、例えば、配信サーバ１００２は、処理能力の低いAV機器１００５や携帯電話機１００７に対しては、スケーラブル符号化データ（BL+EL）１０１１からベースレイヤのデータを抽出し、スケーラブル符号化データ（BL+EL）１０１１と同じコンテンツのデータであるが、スケーラブル符号化データ（BL+EL）１０１１よりも低品質なスケーラブル符号化データ（BL）１０１２として伝送する。

このようにスケーラブル符号化データを用いることにより、データ量を容易に調整することができるので、遅延やオーバーフローの発生を抑制したり、端末装置や通信媒体の負荷の不要な増大を抑制したりすることができる。また、スケーラブル符号化データ（BL+EL）１０１１は、レイヤ間の冗長性が低減されているので、各レイヤの符号化データを個別のデータとする場合よりもそのデータ量を低減させることができる。したがって、スケーラブル符号化データ記憶部１００１の記憶領域をより効率よく使用することができる。

なお、パーソナルコンピュータ１００４乃至携帯電話機１００７のように、端末装置には様々な装置を適用することができるので、端末装置のハードウエアの性能は、装置によって異なる。また、端末装置が実行するアプリケーションも様々であるので、そのソフトウエアの能力も様々である。さらに、通信媒体となるネットワーク１００３も、例えばインターネットやLAN（Local Area Network）等、有線若しくは無線、またはその両方を含むあらゆる通信回線網を適用することができ、そのデータ伝送能力は様々である。さらに、他の通信等によっても変化する恐れがある。

そこで、配信サーバ１００２は、データ伝送を開始する前に、データの伝送先となる端末装置と通信を行い、端末装置のハードウエア性能や、端末装置が実行するアプリケーション（ソフトウエア）の性能等といった端末装置の能力に関する情報、並びに、ネットワーク１００３の利用可能帯域幅等の通信環境に関する情報を得るようにしてもよい。そして、配信サーバ１００２が、ここで得た情報を基に、適切なレイヤを選択するようにしてもよい。

なお、レイヤの抽出は、端末装置において行うようにしてもよい。例えば、パーソナルコンピュータ１００４が、伝送されたスケーラブル符号化データ（BL+EL）１０１１を復号し、ベースレイヤの画像を表示しても良いし、エンハンスメントレイヤの画像を表示しても良い。また、例えば、パーソナルコンピュータ１００４が、伝送されたスケーラブル符号化データ（BL+EL）１０１１から、ベースレイヤのスケーラブル符号化データ（BL）１０１２を抽出し、記憶したり、他の装置に転送したり、復号してベースレイヤの画像を表示したりするようにしてもよい。

もちろん、スケーラブル符号化データ記憶部１００１、配信サーバ１００２、ネットワーク１００３、および端末装置の数はいずれも任意である。また、以上においては、配信サーバ１００２がデータを端末装置に伝送する例について説明したが、利用例はこれに限定されない。データ伝送システム１０００は、スケーラブル符号化された符号化データを端末装置に伝送する際、端末装置の能力や通信環境等に応じて、適切なレイヤを選択して伝送するシステムであれば、任意のシステムに適用することができる。

（第２のシステム）
また、スケーラブル符号化は、例えば、図６８に示される例のように、複数の通信媒体を介する伝送のために利用される。

図６８に示されるデータ伝送システム１１００において、放送局１１０１は、地上波放送１１１１により、ベースレイヤのスケーラブル符号化データ（BL）１１２１を伝送する。また、放送局１１０１は、有線若しくは無線またはその両方の通信網よりなる任意のネットワーク１１１２を介して、エンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を伝送する（例えばパケット化して伝送する）。

端末装置１１０２は、放送局１１０１が放送する地上波放送１１１１の受信機能を有し、この地上波放送１１１１を介して伝送されるベースレイヤのスケーラブル符号化データ（BL）１１２１を受け取る。また、端末装置１１０２は、ネットワーク１１１２を介した通信を行う通信機能をさらに有し、このネットワーク１１１２を介して伝送されるエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を受け取る。

端末装置１１０２は、例えばユーザ指示等に応じて、地上波放送１１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）１１２１を、復号してベースレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

また、端末装置１１０２は、例えばユーザ指示等に応じて、地上波放送１１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）１１２１と、ネットワーク１１１２を介して取得したエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２とを合成して、スケーラブル符号化データ（BL+EL）を得たり、それを復号してエンハンスメントレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

以上のように、スケーラブル符号化データは、例えばレイヤ毎に異なる通信媒体を介して伝送させることができる。したがって、負荷を分散させることができ、遅延やオーバーフローの発生を抑制することができる。

また、状況に応じて、伝送に使用する通信媒体を、レイヤ毎に選択することができるようにしてもよい。例えば、データ量が比較的多いベースレイヤのスケーラブル符号化データ（BL）１１２１を帯域幅の広い通信媒体を介して伝送させ、データ量が比較的少ないエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を帯域幅の狭い通信媒体を介して伝送させるようにしてもよい。また、例えば、エンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を伝送する通信媒体を、ネットワーク１１１２とするか、地上波放送１１１１とするかを、ネットワーク１１１２の利用可能帯域幅に応じて切り替えるようにしてもよい。もちろん、任意のレイヤのデータについて同様である。

このように制御することにより、データ伝送における負荷の増大を、より抑制することができる。

もちろん、レイヤ数は任意であり、伝送に利用する通信媒体の数も任意である。また、データ配信先となる端末装置１１０２の数も任意である。さらに、以上においては、放送局１１０１からの放送を例に説明したが、利用例はこれに限定されない。データ伝送システム１１００は、スケーラブル符号化された符号化データを、レイヤを単位として複数に分割し、複数の回線を介して伝送するシステムであれば、任意のシステムに適用することができる。

（第３のシステム）
また、スケーラブル符号化は、例えば、図６９に示される例のように、符号化データの記憶に利用される。

図６９に示される撮像システム１２００において、撮像装置１２０１は、被写体１２１１を撮像して得られた画像データをスケーラブル符号化し、スケーラブル符号化データ（BL+EL）１２２１として、スケーラブル符号化データ記憶装置１２０２に供給する。

スケーラブル符号化データ記憶装置１２０２は、撮像装置１２０１から供給されるスケーラブル符号化データ（BL+EL）１２２１を、状況に応じた品質で記憶する。例えば、通常時の場合、スケーラブル符号化データ記憶装置１２０２は、スケーラブル符号化データ（BL+EL）１２２１からベースレイヤのデータを抽出し、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）１２２２として記憶する。これに対して、例えば、注目時の場合、スケーラブル符号化データ記憶装置１２０２は、高品質でデータ量の多いスケーラブル符号化データ（BL+EL）１２２１のまま記憶する。

このようにすることにより、スケーラブル符号化データ記憶装置１２０２は、必要な場合のみ、画像を高画質に保存することができるので、画質劣化による画像の価値の低減を抑制しながら、データ量の増大を抑制することができ、記憶領域の利用効率を向上させることができる。

例えば、撮像装置１２０１が監視カメラであるとする。撮像画像に監視対象（例えば侵入者）が写っていない場合（通常時の場合）、撮像画像の内容は重要でない可能性が高いので、データ量の低減が優先され、その画像データ（スケーラブル符号化データ）は、低品質に記憶される。これに対して、撮像画像に監視対象が被写体１２１１として写っている場合（注目時の場合）、その撮像画像の内容は重要である可能性が高いので、画質が優先され、その画像データ（スケーラブル符号化データ）は、高品質に記憶される。

なお、通常時であるか注目時であるかは、例えば、スケーラブル符号化データ記憶装置１２０２が、画像を解析することにより判定しても良い。また、撮像装置１２０１が判定し、その判定結果をスケーラブル符号化データ記憶装置１２０２に伝送するようにしてもよい。

なお、通常時であるか注目時であるかの判定基準は任意であり、判定基準とする画像の内容は任意である。もちろん、画像の内容以外の条件を判定基準とすることもできる。例えば、収録した音声の大きさや波形等に応じて切り替えるようにしてもよいし、所定の時間毎に切り替えるようにしてもよいし、ユーザ指示等の外部からの指示によって切り替えるようにしてもよい。

また、以上においては、通常時と注目時の２つの状態を切り替える例を説明したが、状態の数は任意であり、例えば、通常時、やや注目時、注目時、非常に注目時等のように、３つ以上の状態を切り替えるようにしてもよい。ただし、この切り替える状態の上限数は、スケーラブル符号化データのレイヤ数に依存する。

また、撮像装置１２０１が、スケーラブル符号化のレイヤ数を、状態に応じて決定するようにしてもよい。例えば、通常時の場合、撮像装置１２０１が、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）１２２２を生成し、スケーラブル符号化データ記憶装置１２０２に供給するようにしてもよい。また、例えば、注目時の場合、撮像装置１２０１が、高品質でデータ量の多いベースレイヤのスケーラブル符号化データ（BL+EL）１２２１を生成し、スケーラブル符号化データ記憶装置１２０２に供給するようにしてもよい。

以上においては、監視カメラを例に説明したが、この撮像システム１２００の用途は任意であり、監視カメラに限定されない。

また、LCUとは、最大のサイズのCU（Coding Unit）であり、CTU（Coding Tree Unit）は、LCUのCTB（Coding Tree Block）と、そのLCUベース（レベル）で処理するときのパラメータを含む単位である。また、CTUを構成するCUは、CB(Coding Block)と、そのCUベース（レベル）で処理するときのパラメータを含む単位である。

＜実施のその他の例＞
以上において本技術を適用する装置やシステム等の例を説明したが、本技術は、これに限らず、このような装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。

（ビデオセットの構成例）
本技術をセットとして実施する場合の例について、図７０を参照して説明する。図７０は、本技術を適用したビデオセットの概略的な構成の一例を示している。

近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

図７０に示されるビデオセット１３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

図７０に示されるように、ビデオセット１３００は、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４等のモジュール群と、コネクティビティ１３２１、カメラ１３２２、およびセンサ１３２３等の関連する機能を有するデバイスとを有する。

モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

図７０の例の場合、ビデオモジュール１３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ、ビデオプロセッサ、ブロードバンドモデム１３３３、およびRFモジュール１３３４を有する。

プロセッサは、所定の機能を有する構成をSoC（System On a Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large Scale Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

図７０のアプリケーションプロセッサ１３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ１３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ１３３２等、ビデオモジュール１３１１内外の構成を必要に応じて制御することもできる。

ビデオプロセッサ１３３２は、画像の符号化・復号（その一方若しくは両方）に関する機能を有するプロセッサである。

ブロードバンドモデム１３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（またはその両方）の広帯域通信に関する処理を行うプロセッサ（若しくはモジュール）である。例えば、ブロードバンドモデム１３３３は、送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。例えば、ブロードバンドモデム１３３３は、ビデオプロセッサ１３３２が処理する画像データや画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報をデジタル変調・復調することができる。

RFモジュール１３３４は、アンテナを介して送受信されるRF（Radio Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール１３３４は、ブロードバンドモデム１３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール１３３４は、フロントエンドモジュール１３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

なお、図７０において点線１３４１に示されるように、アプリケーションプロセッサ１３３１とビデオプロセッサ１３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

外部メモリ１３１２は、ビデオモジュール１３１１の外部に設けられた、ビデオモジュール１３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ１３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic Random Access Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

パワーマネージメントモジュール１３１３は、ビデオモジュール１３１１（ビデオモジュール１３１１内の各構成）への電力供給を管理し、制御する。

フロントエンドモジュール１３１４は、RFモジュール１３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図７０に示されるように、フロントエンドモジュール１３１４は、例えば、アンテナ部１３５１、フィルタ１３５２、および増幅部１３５３を有する。

アンテナ部１３５１は、無線信号を送受信するアンテナおよびその周辺の構成を有する。アンテナ部１３５１は、増幅部１３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ１３５２に供給する。フィルタ１３５２は、アンテナ部１３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール１３３４に供給する。増幅部１３５３は、RFモジュール１３３４から供給されるRF信号を増幅し、アンテナ部１３５１に供給する。

コネクティビティ１３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ１３２１の物理構成は、任意である。例えば、コネクティビティ１３２１は、ブロードバンドモデム１３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

例えば、コネクティビティ１３２１が、Bluetooth（登録商標）、IEEE 802.11（例えばWi-Fi（Wireless Fidelity、登録商標））、NFC（Near Field Communication）、IrDA（InfraRed Data Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ１３２１が、USB（Universal Serial Bus）、HDMI（登録商標）（High-Definition Multimedia Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ１３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

なお、コネクティビティ１３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ１３２１が、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid State Drive）、NAS（Network Attached Storage）等も含む）を有するようにしてもよい。また、コネクティビティ１３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

カメラ１３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ１３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ１３３２に供給されて符号化される。

センサ１３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ１３２３により検出されたデータは、例えば、アプリケーションプロセッサ１３３１に供給されてアプリケーション等により利用される。

以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

以上のような構成のビデオセット１３００において、後述するようにビデオプロセッサ１３３２に本技術を適用することができる。したがって、ビデオセット１３００は、本技術を適用したセットとして実施することができる。

（ビデオプロセッサの構成例）
図７１は、本技術を適用したビデオプロセッサ１３３２（図７０）の概略的な構成の一例を示している。

図７１の例の場合、ビデオプロセッサ１３３２は、ビデオ信号およびオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータおよびオーディオデータを復号し、ビデオ信号およびオーディオ信号を再生出力する機能とを有する。

図７１に示されるように、ビデオプロセッサ１３３２は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、フレームメモリ１４０５、およびメモリ制御部１４０６を有する。また、ビデオプロセッサ１３３２は、エンコード・デコードエンジン１４０７、ビデオES（Elementary Stream）バッファ１４０８Ａおよび１４０８Ｂ、並びに、オーディオESバッファ１４０９Ａおよび１４０９Ｂを有する。さらに、ビデオプロセッサ１３３２は、オーディオエンコーダ１４１０、オーディオデコーダ１４１１、多重化部（MUX（Multiplexer））１４１２、逆多重化部（DMUX（Demultiplexer））１４１３、およびストリームバッファ１４１４を有する。

ビデオ入力処理部１４０１は、例えばコネクティビティ１３２１（図７０）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部１４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部１４０３は、画像データに対して、ビデオ出力処理部１４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部１４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部１４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ１３２１（図７０）等に出力する。

フレームメモリ１４０５は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、およびエンコード・デコードエンジン１４０７によって共用される画像データ用のメモリである。フレームメモリ１４０５は、例えばDRAM等の半導体メモリとして実現される。

メモリ制御部１４０６は、エンコード・デコードエンジン１４０７からの同期信号を受けて、アクセス管理テーブル１４０６Ａに書き込まれたフレームメモリ１４０５へのアクセススケジュールに従ってフレームメモリ１４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル１４０６Ａは、エンコード・デコードエンジン１４０７、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３等で実行される処理に応じて、メモリ制御部１４０６により更新される。

エンコード・デコードエンジン１４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン１４０７は、フレームメモリ１４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ１４０８Ａに順次書き込む。また、例えば、ビデオESバッファ１４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ１４０５に順次書き込む。エンコード・デコードエンジン１４０７は、これらの符号化や復号において、フレームメモリ１４０５を作業領域として使用する。また、エンコード・デコードエンジン１４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部１４０６に対して同期信号を出力する。

ビデオESバッファ１４０８Ａは、エンコード・デコードエンジン１４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。ビデオESバッファ１４０８Ｂは、逆多重化部（DMUX）１４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン１４０７に供給する。

オーディオESバッファ１４０９Ａは、オーディオエンコーダ１４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。オーディオESバッファ１４０９Ｂは、逆多重化部（DMUX）１４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ１４１１に供給する。

オーディオエンコーダ１４１０は、例えばコネクティビティ１３２１（図７０）等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode number 3）方式等の所定の方式で符号化する。オーディオエンコーダ１４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ１４０９Ａに順次書き込む。オーディオデコーダ１４１１は、オーディオESバッファ１４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ１３２１（図７０）等に供給する。

多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）１４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）１４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

逆多重化部（DMUX）１４１３は、多重化部（MUX）１４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）１４１３は、ストリームバッファ１４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）１４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）１４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等（いずれも図７０）から供給されたトランスポートストリームを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１により（図７０）各種記録媒体から読み出されたファイルデータを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

ストリームバッファ１４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図７０）等に供給する。

また、例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１（図７０）等に供給し、各種記録媒体に記録させる。

さらに、ストリームバッファ１４１４は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等（いずれも図７０）を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

また、ストリームバッファ１４１４は、例えばコネクティビティ１３２１（図７０）等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

次に、このような構成のビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１（図７０）等からビデオプロセッサ１３３２に入力されたビデオ信号は、ビデオ入力処理部１４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ１４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部１４０２または第２画像拡大縮小部１４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換および拡大縮小処理が行われ、再びフレームメモリ１４０５に書き込まれる。この画像データは、エンコード・デコードエンジン１４０７によって符号化され、ビデオストリームとしてビデオESバッファ１４０８Ａに書き込まれる。

また、コネクティビティ１３２１（図７０）等からビデオプロセッサ１３３２に入力されたオーディオ信号は、オーディオエンコーダ１４１０によって符号化され、オーディオストリームとして、オーディオESバッファ１４０９Ａに書き込まれる。

ビデオESバッファ１４０８Ａのビデオストリームと、オーディオESバッファ１４０９Ａのオーディオストリームは、多重化部（MUX）１４１２に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部（MUX）１４１２により生成されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図７０）等を介して外部ネットワークに出力される。また、多重化部（MUX）１４１２により生成されたファイルデータは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１（図７０）等に出力され、各種記録媒体に記録される。

また、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図７０）等を介して外部ネットワークからビデオプロセッサ１３３２に入力されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。また、例えばコネクティビティ１３２１（図７０）等において各種記録媒体から読み出され、ビデオプロセッサ１３３２に入力されたファイルデータは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。つまり、ビデオプロセッサ１３３２に入力されたトランスポートストリームまたはファイルデータは、逆多重化部（DMUX）１４１３によりビデオストリームとオーディオストリームとに分離される。

オーディオストリームは、オーディオESバッファ１４０９Ｂを介してオーディオデコーダ１４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ１４０８Ｂに書き込まれた後、エンコード・デコードエンジン１４０７により順次読み出されて復号されてフレームメモリ１４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部１４０３によって拡大縮小処理されて、フレームメモリ１４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部１４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、エンコード・デコードエンジン１４０７に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン１４０７が、符号化装置１０や復号装置１１０の機能を有するようにすればよい。また、例えば、エンコード・デコードエンジン１４０７が、符号化装置１５０や復号装置１７０、符号化装置１９０や復号装置２１０、符号化装置２３０や復号装置２７０の機能を有するようにしてもよい。さらに、例えば、エンコード・デコードエンジン１４０７が、多視点画像符号化装置６００や多視点画像復号装置６１０の機能を有するようにしてもよい。このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図６１を参照して上述した効果と同様の効果を得ることができる。

なお、エンコード・デコードエンジン１４０７において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

（ビデオプロセッサの他の構成例）
図７２は、本技術を適用したビデオプロセッサ１３３２（図７０）の概略的な構成の他の例を示している。図７２の例の場合、ビデオプロセッサ１３３２は、ビデオデータを所定の方式で符号化・復号する機能とを有する。

より具体的には、図７２に示されるように、ビデオプロセッサ１３３２は、制御部１５１１、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、および内部メモリ１５１５を有する。また、ビデオプロセッサ１３３２は、コーデックエンジン１５１６、メモリインタフェース１５１７、多重化・逆多重化部（MUX DMUX）１５１８、ネットワークインタフェース１５１９、およびビデオインタフェース１５２０を有する。

制御部１５１１は、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６等、ビデオプロセッサ１３３２内の各処理部の動作を制御する。

図７２に示されるように、制御部１５１１は、例えば、メインCPU１５３１、サブCPU１５３２、およびシステムコントローラ１５３３を有する。メインCPU１５３１は、ビデオプロセッサ１３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU１５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU１５３２は、メインCPU１５３１の補助的な役割を果たす。例えば、サブCPU１５３２は、メインCPU１５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ１５３３は、メインCPU１５３１およびサブCPU１５３２が実行するプログラムを指定する等、メインCPU１５３１およびサブCPU１５３２の動作を制御する。

ディスプレイインタフェース１５１２は、制御部１５１１の制御の下、画像データを例えばコネクティビティ１３２１（図７０）等に出力する。例えば、ディスプレイインタフェース１５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、またはデジタルデータの画像データのまま、コネクティビティ１３２１（図７０）のモニタ装置等に出力する。

ディスプレイエンジン１５１３は、制御部１５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

画像処理エンジン１５１４は、制御部１５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６により共用される、ビデオプロセッサ１３３２の内部に設けられたメモリである。内部メモリ１５１５は、例えば、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６の間で行われるデータの授受に利用される。例えば、内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６に供給する。この内部メモリ１５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static Random Access Memory）のような比較的（例えば外部メモリ１３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

コーデックエンジン１５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン１５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン１５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化若しくは符号化データの復号を行うようにしてもよい。

図７２に示される例において、コーデックエンジン１５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video１５４１、AVC/H.264１５４２、HEVC/H.265１５４３、HEVC/H.265(Scalable)１５４４、HEVC/H.265(Multi-view)１５４５、およびMPEG-DASH１５５１を有する。

MPEG-2 Video１５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264１５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265１５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)１５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)１５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

MPEG-DASH１５５１は、画像データをMPEG-DASH（MPEG-Dynamic Adaptive Streaming over HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（HyperText Transfer Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH１５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video１５４１乃至HEVC/H.265(Multi-view)１５４５を利用する。

メモリインタフェース１５１７は、外部メモリ１３１２用のインタフェースである。画像処理エンジン１５１４やコーデックエンジン１５１６から供給されるデータは、メモリインタフェース１５１７を介して外部メモリ１３１２に供給される。また、外部メモリ１３１２から読み出されたデータは、メモリインタフェース１５１７を介してビデオプロセッサ１３３２（画像処理エンジン１５１４若しくはコーデックエンジン１５１６）に供給される。

多重化・逆多重化部（MUX DMUX）１５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX DMUX）１５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX DMUX）１５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

ネットワークインタフェース１５１９は、例えばブロードバンドモデム１３３３やコネクティビティ１３２１（いずれも図７０）等向けのインタフェースである。ビデオインタフェース１５２０は、例えばコネクティビティ１３２１やカメラ１３２２（いずれも図７０）等向けのインタフェースである。

次に、このようなビデオプロセッサ１３３２の動作の例について説明する。例えば、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図７０）等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース１５１９を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、例えば、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１（図７０）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてファイルデータに変換され、ビデオインタフェース１５２０を介して例えばコネクティビティ１３２１（図７０）等に出力され、各種記録媒体に記録される。

さらに、例えば、コネクティビティ１３２１（図７０）等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース１５２０を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１（図７０）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース１５１９を介して例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図７０）等に供給され図示せぬ他の装置に伝送される。

なお、ビデオプロセッサ１３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ１５１５や外部メモリ１３１２を利用して行われる。また、パワーマネージメントモジュール１３１３は、例えば制御部１５１１への電力供給を制御する。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、コーデックエンジン１５１６に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン１５１６が、符号化装置１０や復号装置１１０を実現する機能ブロックを有するようにすればよい。また、例えば、コーデックエンジン１５１６が、符号化装置１５０や復号装置１７０、符号化装置１９０や復号装置２１０、符号化装置２３０や復号装置２７０を実現する機能ブロックを有するようにしてもよい。さらに、例えば、コーデックエンジン１５１６が、多視点画像符号化装置６００や多視点画像復号装置６１０の機能を有するようにしてもよい。このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図６１を参照して上述した効果と同様の効果を得ることができる。

なお、コーデックエンジン１５１６において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

以上にビデオプロセッサ１３３２の構成を２例示したが、ビデオプロセッサ１３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ１３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

（装置への適用例）

ビデオセット１３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット１３００は、テレビジョン装置９００（図６３）、携帯電話機９２０（図６４）、記録再生装置９４０（図６５）、撮像装置９６０（図６６）等に組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、図１乃至図６１を参照して上述した効果と同様の効果を得ることができる。

また、ビデオセット１３００は、例えば、図６７のデータ伝送システム１０００におけるパーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置、図６８のデータ伝送システム１１００における放送局１１０１および端末装置１１０２、並びに、図６９の撮像システム１２００における撮像装置１２０１およびスケーラブル符号化データ記憶装置１２０２等にも組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、図１乃至図６１を参照して上述した効果と同様の効果を得ることができる。

なお、上述したビデオセット１３００の各構成の一部であっても、ビデオプロセッサ１３３２を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ１３３２のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線１３４１により示されるプロセッサやビデオモジュール１３１１等を本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４を組み合わせ、本技術を適用したビデオユニット１３６１として実施することもできる。いずれの構成の場合であっても、図１乃至図６１を参照して上述した効果と同様の効果を得ることができる。

つまり、ビデオプロセッサ１３３２を含むものであればどのような構成であっても、ビデオセット１３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ１３３２、点線１３４１により示されるプロセッサ、ビデオモジュール１３１１、または、ビデオユニット１３６１を、テレビジョン装置９００（図６３）、携帯電話機９２０（図６４）、記録再生装置９４０（図６５）、撮像装置９６０（図６６）、図６７のデータ伝送システム１０００におけるパーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置、図６８のデータ伝送システム１１００における放送局１１０１および端末装置１１０２、並びに、図６９の撮像システム１２００における撮像装置１２０１およびスケーラブル符号化データ記憶装置１２０２等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット１３００の場合と同様に、図１乃至図６１を参照して上述した効果と同様の効果を得ることができる。

本明細書では、各種情報が、符号化ストリームに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

本技術は、MPEG，H.26x等のように、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルＴＶ、インターネット、携帯電話などのネットワークメディアを介して送受信する際に、若しくは光、磁気ディスク、フラッシュメモリのような記憶メディア上で処理する際に用いられる装置に適用することができる。

また、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えばMPEG DASH等のようなHTTPストリーミングにも適用することができる。

また、本技術における符号化方式は、HEVC方式以外の符号化方式であってもよい。

なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

なお、本技術は、以下のような構成もとることができる。

（１）
符号化対象の画像がGOP（Group of Picture）の先頭の画像以外の画像である場合に伝送されてくる、前記符号化対象の画像より符号化順で前の画像である前画像の、予測画像の生成に用いられる参照画像を特定する参照画像特定情報を、前記符号化対象の画像の前記参照画像特定情報として用いるかを示す参照情報を受け取る受け取り部と、
前記受け取り部により前記参照情報が受け取られた場合、その参照情報に基づいて、復号対象の画像の前記参照画像特定情報を生成し、前記受け取り部により前記参照情報が受け取られない場合、前記前画像の前記参照画像特定情報を前記符号化対象の画像の前記参照画像特定情報として用いないことを示す参照情報に基づいて、復号対象の画像の前記参照画像特定情報を生成する参照画像設定部と、
前記参照画像設定部により生成された前記参照画像特定情報により特定される前記参照画像を用いて、予測画像を生成する予測画像生成部と
を備える復号装置。
（２）
前記受け取り部は、前記参照情報が、前記前画像の前記参照画像特定情報を前記符号化対象の画像の前記参照画像特定情報として用いることを示す場合、前記前画像を特定する前画像特定情報を受け取り、
前記参照画像設定部は、前記受け取り部により受け取られた前記前画像特定情報により特定される前記前画像の前記参照画像特定情報を、前記復号対象の画像の前記参照画像特定情報として生成する
前記（１）に記載の復号装置。
（３）
前記受け取り部は、前記参照情報が、前記前画像の前記参照画像特定情報を前記符号化対象の画像の前記参照画像特定情報として用いないことを示す場合、前記符号化対象の画像の前記参照画像特定情報を受け取り、
前記参照画像設定部は、前記受け取り部により受け取られた前記参照画像特定情報を、前記復号対象の画像の前記参照画像特定情報として生成する
前記（２）に記載の復号装置。
（４）
前記受け取り部は、前記参照情報と、前記前画像特定情報または前記参照画像特定情報とを含む、複数の参照画像情報を受け取るとともに、前記符号化対象の画像がGOP（Group of Picture）の先頭の画像以外の画像である場合に伝送されてくる、前記複数の参照画像情報のうちの、前記符号化対象の画像の前記参照画像情報を特定する参照画像情報特定情報を受け取り、
前記参照画像設定部は、前記受け取り部により受け取られた前記参照画像情報特定情報により特定される前記参照画像情報に含まれる前記参照情報に基づいて、前記復号対象の画像の前記参照画像特定情報を生成する
前記（３）に記載の復号装置。
（５）
前記受け取り部は、前記参照画像特定情報を含む先頭用参照画像情報を前記参照画像情報として受け取るとともに、前記符号化対象の画像がGOP（Group of Picture）の先頭の画像である場合に伝送されてくる、前記先頭用参照画像情報を特定する前記参照画像情報特定情報を受け取り、
前記参照画像設定部は、前記受け取り部により受け取られた前記参照画像情報特定情報により特定される前記先頭用参照画像情報に含まれる前記参照画像特定情報に基づいて、前記復号対象の画像の前記参照画像特定情報を生成する
前記（４）に記載の復号装置。
（６）
復号装置が、
符号化対象の画像がGOP（Group of Picture）の先頭の画像以外の画像である場合に伝送されてくる、前記符号化対象の画像より符号化順で前の画像である前画像の、予測画像の生成に用いられる参照画像を特定する参照画像特定情報を、前記符号化対象の画像の前記参照画像特定情報として用いるかを示す参照情報を受け取る受け取りステップと、
前記受け取りステップの処理により前記参照情報が受け取られた場合、その参照情報に基づいて、復号対象の画像の前記参照画像特定情報を生成し、前記受け取りステップの処理により前記参照情報が受け取られない場合、前記前画像の前記参照画像特定情報を前記符号化対象の画像の前記参照画像特定情報として用いないことを示す参照情報に基づいて、復号対象の画像の前記参照画像特定情報を生成する参照画像設定ステップと、
前記参照画像設定ステップの処理により生成された前記参照画像特定情報により特定される前記参照画像を用いて、予測画像を生成する予測画像生成ステップと
を含む復号方法。

１０符号化装置, １２設定部，１３伝送部，３３演算部，４７動き予測・補償部，１１０復号装置，１１１受け取り部，１３５加算部，１４４参照画像設定部，１４５動き補償部，１５０符号化装置，１７０復号装置，１９０符号化装置，２１０復号装置，２３０符号化装置，２３２設定部，２５１動き予測・補償部，２７０復号装置，２９２動き補償部

Claims

少なくとも１つのプロセッサとコンピュータプログラムを備える少なくとも１つのメモリとを備える復号装置であって、前記メモリと前記コンピュータプログラムとは、前記少なくとも１つのプロセッサと協働して、前記復号装置に、
復号する複数の画像のシーケンスパラメータセット（ＳＰＳ）において受信されるシンタックスエレメントを復号し、前記シンタックスエレメントは、前記ＳＰＳに含まれるショートターム参照画像セット（ＲＰＳ）の数を指示し、
前記複数の画像の処理対象画像のスライスヘッダにおいて、前記処理対象画像のショートタームＲＰＳのインデックスの値を、前記ＳＰＳに含まれるショートタームＲＰＳの数に等しく設定し、
前記処理対象画像の前記ショートタームＲＰＳの前記インデックスの値が、前記処理対象画像のスライスヘッダにおいて予測フラグの値が受信されないことを示す、ゼロに等しい値である場合、前記予測フラグの値を、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されないことを示す第１の値に設定し、
前記処理対象画像の予測画像を生成し、
前記予測画像を用いて前記処理対象画像を復号する、
ことを実行させるように構成された、復号装置。
前記処理対象画像の前記予測画像を生成することは、さらに、
前記処理対象画像のショートタームＲＰＳのインデックスの値が、前記予測フラグの値が前記処理対象画像の前記スライスヘッダにおいて受信されることを示す、ゼロに等しくない値である場合、前記予測フラグの値を復号し、前記予測フラグの値は、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されないことを示す第１の値か、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されることを示す第２の値のいずれかであり、
前記予測フラグの値に基づいて前記処理対象画像のショートタームＲＰＳを生成し、
前記処理対象画像のショートタームＲＰＳを用いて前記処理対象画像の前記予測画像を生成することを備える、請求項１に記載の復号装置。
前記処理対象画像の前記予測画像を生成することは、さらに、
前記予測フラグの値が、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されることを示す前記第２の値に等しい場合、前記処理対象画像の前記スライスヘッダにおいて受信されるＲＰＳデルタインデックスを復号し、
前記ＲＰＳデルタインデックスに基づいて前記処理対象画像のショートタームＲＰＳを生成し、
前記処理対象画像のショートタームＲＰＳを用いて前記処理対象画像の前記予測画像を生成することを備える、請求項２に記載の復号装置。
前記処理対象画像の前記予測画像を生成することは、さらに、
前記予測フラグの値が、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されないことを示す前記第１の値に等しい場合、前記処理対象画像の前記スライスヘッダにおいて受信される、前記処理対象画像のショートタームＲＰＳ特定情報を復号し、前記処理対象画像の前記スライスヘッダは、前記ＲＰＳデルタインデックスを含まず、
前記ショートタームＲＰＳ特定情報に基づいて前記処理対象画像のショートタームＲＰＳを生成し、
前記処理対象画像のショートタームＲＰＳを用いて前記処理対象画像の前記予測画像を生成する、請求項１または２に記載の復号装置。
復号する複数の画像のシーケンスパラメータセット（ＳＰＳ）において受信されるシンタックスエレメントを復号し、前記シンタックスエレメントは、前記ＳＰＳに含まれるショートターム参照画像セット（ＲＰＳ）の数を指示し、
前記複数の画像の処理対象画像のスライスヘッダにおいて、前記処理対象画像のショートタームＲＰＳのインデックスの値を、前記ＳＰＳに含まれるショートタームＲＰＳの数に等しく設定し、
前記処理対象画像の前記ショートタームＲＰＳの前記インデックスの値が、前記処理対象画像のスライスヘッダにおいて予測フラグの値が受信されないことを示す、ゼロに等しい値である場合、前記予測フラグの値を、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されないことを示す第１の値に設定し、
前記処理対象画像の予測画像を生成し、
前記予測画像を用いて前記処理対象画像を復号する、
復号方法。
前記処理対象画像の前記予測画像を生成することは、さらに、
前記処理対象画像のショートタームＲＰＳのインデックスの値が、前記予測フラグの値が前記処理対象画像の前記スライスヘッダにおいて受信されることを示す、ゼロに等しくない値である場合、前記予測フラグの値を復号し、前記予測フラグの値は、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されないことを示す第１の値か、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されることを示す第２の値のいずれかであり、
前記予測フラグの値に基づいて前記処理対象画像のショートタームＲＰＳを生成し、
前記処理対象画像のショートタームＲＰＳを用いて前記処理対象画像の前記予測画像を生成することを備える、請求項５に記載の復号方法。
前記処理対象画像の前記予測画像を生成することは、さらに、
前記予測フラグの値が、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されることを示す前記第２の値に等しい場合、前記処理対象画像の前記スライスヘッダにおいて受信されるＲＰＳデルタインデックスを復号し、
前記ＲＰＳデルタインデックスに基づいて前記処理対象画像のショートタームＲＰＳを生成し、
前記処理対象画像のショートタームＲＰＳを用いて前記処理対象画像の前記予測画像を生成することを備える、請求項６に記載の復号方法。
前記処理対象画像の前記予測画像を生成することは、さらに、
前記予測フラグの値が、前記処理対象画像のショートタームＲＰＳが前記ＳＰＳに含まれるショートタームＲＰＳから予測されないことを示す前記第１の値に等しい場合、前記処理対象画像の前記スライスヘッダにおいて受信される、前記処理対象画像のショートタームＲＰＳ特定情報を復号し、前記処理対象画像の前記スライスヘッダは、前記ＲＰＳデルタインデックスを含まず、
前記ショートタームＲＰＳ特定情報に基づいて前記処理対象画像のショートタームＲＰＳを生成し、
前記処理対象画像のショートタームＲＰＳを用いて前記処理対象画像の前記予測画像を生成する、請求項５または６に記載の復号方法。