JP2015035642A - 画像復号装置、および画像符号化装置 - Google Patents

画像復号装置、および画像符号化装置 Download PDF

Info

Publication number
JP2015035642A
JP2015035642A JP2013152608A JP2013152608A JP2015035642A JP 2015035642 A JP2015035642 A JP 2015035642A JP 2013152608 A JP2013152608 A JP 2013152608A JP 2013152608 A JP2013152608 A JP 2013152608A JP 2015035642 A JP2015035642 A JP 2015035642A
Authority
JP
Japan
Prior art keywords
layer
picture
inter
decoding
tid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013152608A
Other languages
English (en)
Inventor
知宏 猪飼
Tomohiro Igai
知宏 猪飼
貴也 山本
Takaya Yamamoto
貴也 山本
山本 智幸
Tomoyuki Yamamoto
智幸 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2013152608A priority Critical patent/JP2015035642A/ja
Publication of JP2015035642A publication Critical patent/JP2015035642A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 符号化処理、または、復号処理におけるメモリを削減する。
【解決手段】 階層動画像復号装置1は、同じ表示時刻に属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号するNALユニットヘッダ復号部を備えている。
【選択図】 図18

Description

本発明は、画像が階層的に符号化された階層符号化データを復号する画像復号装置、および画像を階層的に符号化することによって階層符号化データを生成する画像符号化装置に関する。
通信システムで伝送される情報、あるいは蓄積装置に記録される情報の1つに画像あるいは動画像がある。従来、これらの画像(以降、動画像を含む)の伝送・蓄積のため、画像を符号化する技術が知られている。
動画像符号化方式としては、AVC(H.264/MPEG-4 Advanced Video Coding)や、その後継コーデックであるHEVC(High-Efficiency Video Coding)が知られている。
これらの動画像符号化方式では、通常、入力画像を符号化/復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像(原画像)から減算して得られる予測残差(「差分画像」または「残差画像」と呼ぶこともある)が符号化される。また、予測画像の生成方法としては、画面間予測(インター予測)、および、画面内予測(イントラ予測)が挙げられる。
イントラ予測では、同一ピクチャ内の局所復号画像に基づいて、当該ピクチャにおける予測画像が順次生成される。
インター予測では、ピクチャ間の動き補償により予測画像が生成される。インター予測で予測画像生成に用いられる復号済のピクチャは参照ピクチャと呼ばれる。
HEVCでは、60fpsのコンテンツを30fpsで再生する場合のような、時間的に間引いたフレームレートで再生する場合を想定してテンポラルスケーラブルのための技術が用いられている。具体的には、各ピクチャに時間識別子(TemporalID、サブレイヤ識別子とも呼ばれる)を割り当て、時間識別子の高いピクチャは、その時間識別子よりも小さい時間識別子のピクチャを参照しない、という制約を課している。これにより、特定の時間識別子のピクチャのみを間引いて再生する場合には、それよりも高い時間識別子が付加されたピクチャの復号は不要になる。
また、近年、必要なデータレートに従って、画像を階層的に符号化する階層符号化技術が提案されている。代表的な階層符号化方式の一つとしてSHVC(Scalable HEVC)およびMV-HEVC(MultiView HEVC)が知られている。
SHVCでは、空間スケーラビリティ、時間スケーラビリティ、SNRスケーラビリティをサポートする。例えば空間スケーラビリティの場合、原画像から所望の解像度にダウンサンプリングした画像を下位レイヤとして符号化する。次に上位レイヤではレイヤ間の冗長性を除去するためにレイヤ間予測を行う(非特許文献2)。
MV-HEVCでは、視点スケーラビリティをサポートする。例えば、視点画像0(レイヤ0)、視点画像1(レイヤ1)、視点画像2(レイヤ2)の3つの視点画像を符号化する場合、下位レイヤ(レイヤ0)から、上位レイヤである視点画像1、視点画像2をレイヤ間予測により予測することによりレイヤ間の冗長性の除去が可能である。
レイヤ間予測には、レイヤ間画像予測とレイヤ間動き予測がある。レイヤ間画像予測では、下位レイヤの復号画像を利用して、予測画像を生成する。レイヤ間動き予測では、下位レイヤの動き情報を利用して、動き情報の予測値を導出する。
SHVCおよびMV-HEVCでは、予測画像の生成に、インター予測、イントラ予測、レイヤ間画像予測のいずれかを利用できる。
SHVCおよびMV-HEVCでは、非特許文献3に示すような、レイヤ単位で、レイヤ間予測に用いる最大サブレイヤmax_tid_il_ref_pics_plus1を指定し、その最大サブレイヤmax_tid_il_ref_pics_plus1以上(max_tid_il_ref_pics_plus1 - 1より大きい)の時間識別子のピクチャは、レイヤ間予測で参照されない技術が用いられている。これにより、時間識別子が所定の時間識別子よりも大きい下位レイヤのピクチャは、レイヤ間予測で用いることがないので、上位レイヤを復号する場合において、復号を省略することができる。レイヤ間予測で用いられない場合においても、同じレイヤの後続のピクチャで参照する場合には、時間識別子が大きいピクチャも復号する必要がある。実際には、同じレイヤの後続のピクチャで参照する場合は、参照するピクチャの時間識別子は、所定の時間識別子と同じか、より大きい時間識別子を備えるが、これらピクチャもまた、レイヤ間予測に用いることがないため、上位レイヤのみを復号する場合には、所定の時間識別子より大きいピクチャの復号は不要となる。
また、シーケンス全体において、参照に使用し得るレイヤに関する情報はVPSで符号化されるが、個々のピクチャでは参照しないことがある。そのため、ピクチャ単位で、参照するレイヤ数及び、どのレイヤを参照するかどうかを示す情報を符号化する技術が知られている。
JCTVC-M1008_v3 「SHVC Working Draft 2」, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 13th Meeting: Incheon, KR, 18-26 Apr. 2013 (2013年6月14日公開) JCTVC-D1004_v4 「MV-HEVC Draft 4」, Joint Collaborative Team on Video Coding (JCT-3V) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 4th Meeting: Incheon, KR, 20-26 Apr. 2013 (2013年6月24日公開) JCTVC-L0449 「Design Considered for Signalling Inter-layer Prediction Indication」, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 12th Meeting: Geneva, CH, 14-23 Jan. 2013 (2013年1月22日公開)
しかしながら、従来技術では、ピクチャ単位で付加される時間識別子が、異なるレイヤ間で一致することが保障されていないため、あるレイヤで可能であった時間的な間引き再生が、別のレイヤで可能であるとは限らない。そのため、間引き再生中にあるレイヤ(例えば低解像度のレイヤ)から、別のレイヤ(例えば、高解像度のレイヤ)に再生を変えることや、複数の視点(例えば、視点画像0であるレイヤ0と視点画像1であるレイヤ1)を同じ間引き再生において、再生することができないという課題があった。
また、同じアクセスユニットの別のレイヤの時間識別子をどのように設定するかについて、明確にされていなかった。
また、所定の時間識別子より大きい時間識別子のサブレイヤにおいて、視点間予測を禁止する最大サブレイヤの指定がレイヤ単位であるため、全てのレイヤで同じ最大サブレイヤを指定する場合にもレイヤ単位で最大サブレイヤを復号する必要があるため、冗長な符号を復号する必要があるという課題があった。
また、全てのレイヤで同じ最大サブレイヤを指定する場合には、時間識別子が当該最大サブレイヤよりも大きい場合には、レイヤ間予測が行われないため、ピクチャ単位で符号化される参照レイヤ数や参照レイヤの指定は不要であるにも関わらず、それら情報を符号化する必要があるという課題があった。
また、実依存レイヤ情報がテンポラルID(TID)およびレイヤ間予測最大TIDによらずに復号されるため、実際には参照されない依存レイヤから、実依存レイヤ(レイヤ間参照ピクチャ、レイヤ間予測ピクチャ)を選択することになり、実依存レイヤを示す実依存レイヤ情報が冗長であるという課題がある。
本発明は、上記課題を鑑みてされたものであり、その目的は、階層符号化方式において、ピクチャ単位で付加される時間識別子がレイヤ間で一致していること示すフラグを符号化することにより、該フラグが真の場合は、間引き再生中にあるレイヤから、別のレイヤに再生を変えることや、複数の視点を同じ間引き再生において再生することが可能となる仕組みを提供することにある。
また、最大サブレイヤが全てのレイヤで同じであることを示すフラグを符号化することにより、冗長な符号の符号化を回避することが可能となる画像符号化装置および画像復号装置を実現することにある。さらに、全てのレイヤで同じ最大サブレイヤを指定する場合に、時間識別子が当該最大サブレイヤよりも大きいピクチャに関しては、参照レイヤ数や参照レイヤの指定を省略することで、符号化効率が向上する画像符号化装置および画像復号装置を実現することにある。
また、TIDおよびレイヤ間予測最大TIDに応じて、実依存レイヤ情報を符号化・復号することにより、符号化効率が向上する画像符号化装置および画像復号装置を実現することにある。
本発明の1実施形態の画像復号装置によれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、前記NALユニットヘッダ復号部は、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号することを特徴とする。
上記の構成の画像復号装置によれば、同じアクセスユニットに属する全てのレイヤのTIDが共通であることが示されている場合には、あるレイヤで可能であった時間的な間引き再生が、別のレイヤで可能である。そのため、間引き再生中にあるレイヤ(例えば低解像度のレイヤ)から、別のレイヤ(例えば、高解像度のレイヤ)に再生を変えることや、複数の視点(例えば、視点画像0であるレイヤ0と視点画像0であるレイヤ1)を同じ間引き再生において、再生することができるという効果を奏する。
本発明の1実施形態の画像復号装置によれば、パラメータセットから少なくともレイヤ間サブレイヤアライメントフラグを復号するパラメータセット復号部を備え、前記NALユニットヘッダ復号部は、レイヤ間サブレイヤアライメントフラグが1の場合には、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号することを特徴とする。
上記の構成の画像復号装置によれば、レイヤ間サブレイヤアライメントフラグが1の場合には、同じアクセスユニットに属する全てのレイヤのTIDが共通であることが示されている場合には、あるレイヤで可能であった時間的な間引き再生が、別のレイヤで可能である。そのため、間引き再生中にあるレイヤ(例えば低解像度のレイヤ)から、別のレイヤ(例えば、高解像度のレイヤ)に再生を変えることや、複数の視点(例えば、視点画像0であるレイヤ0と視点画像0であるレイヤ1)を同じ間引き再生において、再生することができるという効果を奏する。
本発明の1実施形態の画像復号装置によれば、パラメータセットから少なくともプロファイルを復号するパラメータセット復号部を備え、前記NALユニットヘッダ復号部は、プロファイルがステレオ画像のプロファイルを示す場合には、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号することを特徴とする。
本発明の1実施形態の画像復号装置によれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部を備え、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、前記NALユニットヘッダ復号部は、あるレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを復号することを特徴とする。
上記の構成の画像復号装置によれば、同じ表示時刻に属する全てのレイヤのTIDが共通であることが示されている場合には、あるレイヤがTSAピクチャ(もしくはSTSAピクチャ)である場合には、他のレイヤもTSAピクチャ(もしくはSTSAピクチャ)である。そのため、どのレイヤにおいても、同じタイミングであるサブレイヤから、より上位のサブライヤに移行することができる(間引き再生中から非間引き再生に移行するなど間引きの粒度を下げることができる)という効果を奏する。
本発明の1実施形態の画像復号装置によれば、パラメータセットから少なくともレイヤ間サブレイヤアライメントフラグを復号するパラメータセット復号部を備え、前記NALユニットヘッダ復号部は、レイヤ間サブレイヤアライメントフラグが1の場合には、あるレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じ表示時刻(アクセスユニット)に属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを復号することを特徴とする。
本発明の1実施形態の画像復号装置によれば、パラメータセットから少なくともプロファイルを復号するパラメータセット復号部を備え、前記NALユニットヘッダ復号部は、プロファイルがステレオ画像のプロファイルを示す場合には、ベースレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを復号することを特徴とする。
本発明の1実施形態の画像復号装置によれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、パラメータセットから少なくともレイヤ間予測最大TIDを復号するパラメータセット復号部と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのレイヤ間予測最大TIDより小さいTIDを有するピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、パラメータセット復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合には、全てのレイヤに共通のレイヤ間予測最大TIDを割り当て、共通のレイヤ間予測最大TIDが用いられないと判定される場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする。
上記の構成の画像復号装置によれば、共通レイヤ間予測最大TIDが用いられる場合にはレイヤ毎にレイヤ間予測最大TIDの復号を行う必要がないため、冗長なフラグの復号を削減する効果を奏する。
本発明の1実施形態の画像復号装置によれば、上記パラメータセット復号部は、レイヤ間予測最大TIDアライメントフラグを復号し、レイヤ間予測最大TIDアライメントフラグが1の場合には、1つのレイヤ間予測最大TIDを復号し、全てのレイヤに復号した1つのレイヤ間予測最大TIDを割り当て、レイヤ間予測最大TIDアライメントフラグが0の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする。
本発明の1実施形態の画像復号装置によれば、パラメータセット復号部は、共通レイヤ間予測最大TIDを復号し、共通レイヤ間予測最大TIDが所定の値以外の場合には、全てのレイヤに復号した共通レイヤ間予測最大TIDを割り当て、共通レイヤ間予測最大TIDが所定の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする。
本発明の1実施形態の画像復号装置によれば、上記パラメータセット復号部は、レイヤ間サブレイヤアライメントフラグを復号し、レイヤ間サブレイヤアライメントフラグが1、かつ、ベースレイヤのレイヤ間予測最大TIDが所定の値以外の場合には、全てのレイヤに復号したベースレイヤのレイヤのレイヤ間予測最大TIDを割り当て、ベースレイヤのレイヤ間予測最大TIDが所定の値の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする。
本発明の1実施形態の画像復号装置によれば、上記画像復号装置は、さらに、レイヤ間予測が可能であるか否かを示すフラグであるレイヤ間予測可能フラグを復号するレイヤ間予測可能フラグ復号部を備え、上記レイヤ間予測可能フラグ復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合で、TIDが、該共通レイヤ間予測最大TID未満の場合にのみ、上記レイヤ間予測可能フラグを復号し、それ以外の場合には、レイヤ間予測可能フラグを0に設定することを特徴とする。
上記の構成の画像復号装置によれば、共通レイヤ間予測最大TIDで指示されるTID以上のTIDのピクチャの場合には、レイヤ間予測が制限されていることを利用して、レイヤ間予測可能フラグの復号を省略することにより、冗長なフラグの復号を削減する効果を奏する。
本発明の1実施形態の画像復号装置によれば、上記画像復号装置は、さらに、レイヤ間予測のみを用いるか否かを示すフラグであるレイヤ間予測限定フラグを復号するレイヤ間予測限定フラグ復号部を備え、上記レイヤ間予測限定フラグ復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合で、TIDが、該共通レイヤ間予測最大TID未満の場合にのみ、上記レイヤ間予測限定フラグを復号し、それ以外の場合には、レイヤ間予測限定フラグを0に設定することを特徴とする。
上記の構成の画像復号装置によれば、共通レイヤ間予測最大TIDで指示されるTID以上のTIDのピクチャの場合には、レイヤ間予測が制限されていることを利用して、レイヤ間予測限定フラグの復号を省略することにより、冗長なフラグの復号を削減する効果を奏する。
本発明の1実施形態の画像復号装置によれば、上記画像復号装置は、さらに、テンポラル動き予測用の参照ピクチャを、レイヤIDによって指定するか否かを示すフラグである代替コロケート指示フラグを復号する代替コロケート指示情報復号部を備え、
上記代替コロケート指示情報復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合で、TIDが、該共通レイヤ間予測最大TID未満の場合にのみ、上記代替コロケート指示フラグを復号し、それ以外の場合には、代替コロケート指示フラグを0に設定することを特徴とする。
上記の構成の画像復号装置によれば、共通レイヤ間予測最大TIDで指示されるTID以上のTIDのピクチャの場合には、レイヤ間予測が制限されていることを利用して、代替コロケート指示フラグの復号を省略することにより、冗長なフラグの復号を削減する効果を奏する。
本発明の1実施形態の画像復号装置によれば、対象レイヤが参照する可能性のある対象レイヤとは異なるレイヤを示す情報である依存レイヤ情報を復号するレイヤ依存情報復号手段と、前記対象レイヤのある対象ピクチャが参照する、前記対象レイヤとは異なるレイヤのピクチャを示す情報を復号する実依存レイヤ情報復号手段と、前記実依存レイヤ情報に基づいて、少なくともレイヤ間参照ピクチャセットを生成する参照ピクチャセット導出手段を備え、前記レイヤ依存情報復号手段は、依存レイヤリストに属する各レイヤのピクチャが前記対象ピクチャから参照されるか否かを示す実レイヤ依存フラグを、前記対象ピクチャのTIDが、前記依存レイヤのレイヤ間予測最大TID未満にのみ、上記レイヤ間予測可能フラグに復号することを特徴とする。
本発明によれば、同じ表示時刻(出力順、アクセスユニット)の全てのレイヤで同じTIDを有することにより、異なるレイヤで同じ間引き再生を可能とする。
本発明によれば、同じ表示時刻(出力順、アクセスユニット)の全てのレイヤでサブレイヤアクセスピクチャの位置をアライメントすることによって、間引き再生におけるサブレイヤの移行をレイヤ間で揃えることを可能とする。
また、本発明によれば、レイヤ間のサブレイヤアライメントを制御するフラグを設けることによって、レイヤ間でサブレイヤアライメントを行う場合と、行わない場合の両方をサポートする。
また、本発明によれば、ステレオ画像において、レイヤ間のサブレイヤアライメントを行うことによって、複数の視点を同期して間引き再生する、もしくは、間引き再生のレイヤを移行することが可能になる。
また、本発明によれば、全てのレイヤで同じレイヤ間予測に用いる最大サブレイヤを指定することにより、レイヤ毎に最大サブレイヤを復号するような無駄を無くせる。
また、本発明によれば、レイヤ間サブレイヤアライメントの情報を用いることで、実依存レイヤに関する情報の符号量を低減できる。
また、本発明によれば、レイヤ間予測最大TIDに応じて、実依存レイヤ情報を復号することにより、実依存レイヤ情報の符号量を低減できる。
本発明の一実施形態に係る階層動画像復号装置に含まれる復号ピクチャ管理部におけるピクチャ管理処理を例示するフロー図である。 本発明の実施形態に係る階層符号化データのレイヤ構造を説明するための図であって、(a)は、階層動画像符号化装置側について示しており、(b)は、階層動画像復号装置側について示している。 本発明の実施形態に係る階層符号化データの構成を説明するための図であって、(a)は、シーケンスSEQを規定するシーケンスレイヤを示しており、(b)は、ピクチャPICTを規定するピクチャレイヤを示しており、(c)は、スライスSを規定するスライスレイヤを示しており、(d)は、符号化ツリーユニットCTUを規定するCTUレイヤを示しており、(e)は、符号化ツリーユニットCTUに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示している。 上記階層動画像復号装置の概略的構成を示す機能ブロック図である。 上記階層動画像復号装置に含まれる復号ピクチャ管理部の構成を例示した機能ブロック図である。 復号処理の特定のタイミングでのDPBの状態を例示した図である。 上記階層動画像復号装置の可変長復号部からSPS復号時に利用されるシンタックス表の一部であって、参照ピクチャセットおよび参照ピクチャリストに係る部分を示す図である。 上記階層動画像復号装置の可変長復号部から短期参照ピクチャセット情報の復号時に利用されるシンタックス表を示す図である。 上記階層動画像復号装置の可変長復号部からスライスセグメントヘッダ復号時に利用されるシンタックス表の一部であって、参照ピクチャセットに係る部分を示す図である。 スライス復号時に参照されるシンタックス表の一部であって、ILRP情報に相当する部分を示す図である。 上記階層動画像復号装置の可変長復号部からスライスセグメントヘッダ復号時に利用されるシンタックス表の一部であって、参照ピクチャリストに係る部分を示す図である。 上記階層動画像復号装置の可変長復号部から参照ピクチャリスト修正情報の復号時に利用されるシンタックス表を示す図である。 本発明の実施形態に係る符号化データ#1におけるデータの階層構造を示す図である。 NAL(Network Abstraction Layer)ユニットのシンタックステーブルを示す。 本発明の実施形態に係るNALユニットタイプの値とNALユニットの種別の関係を示す図である。 本発明の実施形態に係るテンポラルスケーラビリティを説明するための図である。 本発明の実施形態に係るTSAピクチャ、STSAピクチャを説明するための図である。 本発明の実施形態に係るレイヤ間でTIDのアライメントを行う例である。 レイヤ間でTIDのアライメントを行わない例である。 レイヤ間でTIDのアライメントを行わないさらに別の例である。 レイヤ間で、TSAピクチャのアライメントを行う例である。 レイヤ間で、STSAピクチャのアライメントを行う例である。 レイヤ間で、TSAピクチャ、STSAピクチャのアライメントを行わない例である。 レイヤ間で、TSAピクチャ、STSAピクチャの半アライメント(セミアライメント)が行われている例である。 レイヤ間予測最大TIDMaxTidIlRefPicsを説明するための図である。 レイヤ間でレイヤ間予測最大TIDがアライメントされている場合を説明する図である。 レイヤ間でレイヤ間予測最大TIDがアライメントされていない場合を説明する図である。 本発明の実施形態に係る可変長復号部12の構成を例示した機能ブロック図である。 本発明の実施形態に係るパラメータセット復号部121の復号する符号化データの構成を説明する図である。 本発明の実施形態に係るパラメータセット復号部121の構成を例示した機能ブロック図である。 本発明の実施形態に係るスライスセグメントヘッダ復号部122の構成を例示した機能ブロック図である。 本発明の実施形態に係るレイヤ間予測最大TIDに関するD3の処理を示す図である。 本発明の第2の実施形態に係るパラメータセット復号部121aの復号する符号化データの構成を説明する図である。 本発明の第2の実施形態に係るパラメータセット復号部121aの構成を例示した機能ブロック図である。 本発明の第2の実施形態に係るパラメータセット復号部121bの復号する符号化データの構成を説明する図である。 本発明の第2の実施形態に係るパラメータセット復号部121bの構成を例示した機能ブロック図である。 本発明の第2の実施形態に係るパラメータセット復号部121cの復号する符号化データの構成を説明する図である。 本発明の第2の実施形態に係るパラメータセット復号部121cの構成を例示した機能ブロック図である。 本発明の第3の実施形態に係るパラメータセット復号部121aの構成を例示した機能ブロック図である。 本発明の第3の実施形態に係るスライスセグメントヘッダ復号部122aの復号する符号化データの構成を説明する図である。 本発明の第3の実施形態に係るスライスセグメントヘッダ復号部122aの構成を例示した機能ブロック図である。 本発明の第3の実施形態に係るスライスセグメントヘッダ復号部122bの復号する符号化データの構成を説明する図である。 本発明の第3の実施形態に係るスライスセグメントヘッダ復号部122bの構成を例示した機能ブロック図である。 本発明の第3の実施形態に係るスライスセグメントヘッダ復号部122cの復号する符号化データの構成を説明する図である。 本発明の第3の実施形態に係るスライスセグメントヘッダ復号部122cの構成を例示した機能ブロック図である。 本発明の第3の実施形態に係るスライスセグメントヘッダ復号部122abcの構成を例示した機能ブロック図である。 本発明の一実施形態に係る階層動画像符号化装置の概略的構成を示す機能ブロック図である。 本実施形態に係るレイヤ間サブレイヤアライメントフラグをVPSに符号化する場合における符号化データの構成を説明する図である。 本実施形態に係るレイヤ間サブレイヤアライメントフラグをSPS(VUI)に符号化する場合における符号化データの構成を説明する図である。 本発明の第4の実施形態に係るレイヤ依存情報復号部4011aにおける依存レイヤRefLayers[]の導出処理を示す図である。 本発明の第4の実施形態に係る実依存レイヤ復号部1223Caの復号する符号化データの構成を説明する図である。 本発明の第4の実施形態に係るスライスセグメントヘッダ復号部122Caの構成を例示した機能ブロック図である。 本発明の第4の実施形態に係る実依存レイヤ復号部1223Caにおける実依存レイヤRefPicLayerId[]の導出処理を示す図である。 本実施形態の依存レイヤを説明する図である。 本実施形態の実依存レイヤを説明する図である。 本実施形態のレイヤ間予測最大TID制限を説明する図である。 本発明の第4の実施形態に係るレイヤ依存情報復号部4011bにおける依存レイヤの導出処理を示す図である。 本発明の第4の実施形態に係る実依存レイヤ復号部1223Cbの復号する符号化データの構成を説明する図である。 本発明の第4の実施形態に係るスライスセグメントヘッダ復号部122Cbの構成を例示した機能ブロック図である。 本発明の第4の実施形態に係る実依存レイヤ復号部1223Cbにおける実依存レイヤRefPicLayerId[]の導出処理を示す図である。 本発明の第4の実施形態に係る実依存レイヤ復号部1223Ccの復号する符号化データの構成を説明する図である。 本発明の第4の実施形態に係るスライスセグメントヘッダ復号部122Ccの構成を例示した機能ブロック図である。 本発明の第4の実施形態に係る実依存レイヤ復号部1223Ccにおける実依存レイヤRefPicLayerId[]の導出処理を示す図である。 本発明の第4の実施形態に係る実依存レイヤ復号部1223Ccにおける実依存レイヤRefPicLayerId[]の導出処理を示す図である。
図1〜図64に基づいて、本発明の一実施形態に係る階層動画像復号装置1および階層動画像符号化装置2を説明すれば以下の通りである。
〔概要〕
本実施の形態に係る階層動画像復号装置(画像復号装置)1は、階層動画像符号化装置(画像符号化装置)2によって階層符号化された符号化データを復号する。階層符号化とは、動画像を低品質のものから高品質のものにかけて階層的に符号化する符号化方式のことである。階層符号化は、例えば、SHVCやMV-HEVCにおいて標準化されている。なお、ここでいう動画像の品質とは、主観的および客観的な動画像の見栄えに影響する要素のことを広く意味する。動画像の品質には、例えば、“解像度”、“フレームレート”、“画質”、および、“画素の表現精度”が含まれる。よって、以下、動画像の品質が異なるといえば、例示的には、“解像度”等が異なることを指すが、これに限られない。例えば、異なる量子化ステップで量子化された動画像の場合(すなわち、異なる符号化雑音により符号化された動画像の場合)も互いに動画像の品質が異なるといえる。
また、階層符号化技術は、階層化される情報の種類の観点から、(1)空間スケーラビリティ、(2)時間スケーラビリティ、(3)SNR(Signal to Noise Ratio)スケーラビリティ、および(4)ビュースケーラビリティに分類されることもある。空間スケーラビリティとは、解像度や画像のサイズにおいて階層化する技術である。時間スケーラビリティとは、フレームレート(単位時間のフレーム数)において階層化する技術である。SNRスケーラビリティは、符号化雑音において階層化する技術である。また、ビュースケーラビリティは、各画像に対応付けられた視点位置において階層化する技術である。
本実施形態に係る階層動画像符号化装置2及び階層動画像復号装置1の詳細な説明に先立って、まず(1)階層動画像符号化装置2によって生成され、階層動画像復号装置1によって復号される階層符号化データのレイヤ構造を説明し、次いで(2)各レイヤで採用できるデータ構造の具体例について説明を行う。
〔階層符号化データのレイヤ構造〕
ここで、図2を用いて、階層符号化データの符号化および復号について説明すると次のとおりである。図2は、動画像を、下位階層L3、中位階層L2、および上位階層L1の3階層により階層的に符号化/復号する場合について模式的に表す図である。つまり、図2(a)および(b)に示す例では、3階層のうち、上位階層L1が最上位層となり、下位階層L3が最下位層となる。
以下において、階層符号化データから復号され得る特定の品質に対応する復号画像は、特定の階層の復号画像(または、特定の階層に対応する復号画像)と称される(例えば、上位階層L1の復号画像POUT#A)。
図2(a)は、入力画像PIN#A〜PIN#Cをそれぞれ階層的に符号化して符号化データDATA#A〜DATA#Cを生成する階層動画像符号化装置2#A〜2#Cを示している。図2(b)は、階層的に符号化された符号化データDATA#A〜DATA#Cをそれぞれ復号して復号画像POUT#A〜POUT#Cを生成する階層動画像復号装置1#A〜1#Cを示している。
まず、図2(a)を用いて、符号化装置側について説明する。符号化装置側の入力となる入力画像PIN#A、PIN#B、およびPIN#Cは、原画は同じだが、画像の品質(解像度、フレームレート、および画質等)が異なる。画像の品質は、入力画像PIN#A、PIN#B、およびPIN#Cの順に低くなる。
下位階層L3の階層動画像符号化装置2#Cは、下位階層L3の入力画像PIN#Cを符号化して下位階層L3の符号化データDATA#Cを生成する。下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報が含まれる(図2において“C”にて示している)。下位階層L3は、最下層の階層であるため、下位階層L3の符号化データDATA#Cは、基本符号化データとも称される。
また、中位階層L2の階層動画像符号化装置2#Bは、中位階層L2の入力画像PIN#Bを、下位階層の符号化データDATA#Cを参照しながら符号化して中位階層L2の符号化データDATA#Bを生成する。中位階層L2の符号化データDATA#Bには、符号化データDATA#Cに含まれる基本情報“C”に加えて、中位階層の復号画像POUT#Bを復号するのに必要な付加的情報(図2において“B”にて示している)が含まれる。
また、上位階層L1の階層動画像符号化装置2#Aは、上位階層L1の入力画像PIN#Aを、中位階層L2の符号化データDATA#Bを参照しながら符号化して上位階層L1の符号化データDATA#Aを生成する。上位階層L1の符号化データDATA#Aには、下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報“C”および中位階層L2の復号画像POUT#Bを復号するのに必要な付加的情報“B”に加えて、上位階層の復号画像POUT#Aを復号するのに必要な付加的情報(図2において“A”にて示している)が含まれる。
このように上位階層L1の符号化データDATA#Aは、異なる複数の品質の復号画像に関する情報を含む。
次に、図2(b)を参照しながら復号装置側について説明する。復号装置側では、上位階層L1、中位階層L2、および下位階層L3それぞれの階層に応じた復号装置1#A、1#B、および1#Cが、符号化データDATA#A、DATA#B、およびDATA#Cを復号して復号画像POUT#A、POUT#B、およびPOUT#Cを出力する。
なお、上位の階層符号化データの一部の情報を抽出して、より下位の特定の復号装置において、当該抽出した情報を復号することで特定の品質の動画像を再生することもできる。
例えば、中位階層L2の階層復号装置1#Bは、上位階層L1の階層符号化データDATA#Aから、復号画像POUT#Bを復号するのに必要な情報(すなわち、階層符号化データDATA#Aに含まれる“B”および“C”)を抽出して、復号画像POUT#Bを復号してもよい。言い換えれば、復号装置側では、上位階層L1の階層符号化データDATA#Aに含まれる情報に基づいて、復号画像POUT#A、POUT#B、およびPOUT#Cを復号できる。
なお、以上の3階層の階層符号化データに限られず、階層符号化データは、2階層で階層符号化されていてもよいし、3階層よりも多い階層数にて階層符号化されていてもよい。
また、特定の階層の復号画像に関する符号化データの一部または全部を他の階層とは独立して符号化し、特定の階層の復号の際に、他の階層の情報を参照しなくても済むように階層符号化データを構成してもよい。例えば、図2(a)および(b)を用いて上述した例では、復号画像POUT#Bの復号に“C”および“B”を参照すると説明したが、これに限られない。復号画像POUT#Bが“B”だけを用いて復号できるように階層符号化データを構成することも可能である。例えば、復号画像POUT#Bの復号に、“B”だけから構成される階層符号化データと、復号画像POUT#Cを入力とする階層動画像復号装置も構成できる。
なお、SNRスケーラビリティを実現する場合、入力画像PIN#A、PIN#B、およびPIN#Cとして同一の原画を用いた上で、復号画像POUT#A、POUT#B、およびPOUT#Cが異なる画質となるよう階層符号化データを生成することもできる。その場合、下位階層の階層動画像符号化装置が、上位階層の階層動画像符号化装置に較べて、より大きい量子化幅を用いて予測残差を量子化することで階層符号化データを生成する。
本書では、説明の便宜上、次のとおり用語を定義する。以下の用語は、特に断りがなければ、下記の技術的事項のことを表わすのに用いる。
上位レイヤ : ある階層よりも上位に位置する階層のことを、上位レイヤと称する。例えば、図2において、下位階層L3の上位レイヤは、中位階層L2および上位階層L1である。また、上位レイヤの復号画像とは、より品質の高い(例えば、解像度が高い、フレームレートが高い、画質が高い等)復号画像のことをいう。
下位レイヤ : ある階層よりも下位に位置する階層のことを、下位レイヤと称する。例えば、図2において、上位階層L1の下位レイヤは、中位階層L2および下位階層L3である。また、下位レイヤの復号画像とは、より品質の低い復号画像のことをいう。
対象レイヤ : 復号または符号化の対象となっている階層のことをいう。
参照レイヤ(reference layer) : 対象レイヤに対応する復号画像を復号するのに参照される特定の下位レイヤのことを参照レイヤと称する。
図2(a)および(b)に示した例では、上位階層L1の参照レイヤは、中位階層L2および下位階層L3である。しかしながら、これに限られず、特定の上記レイヤの復号において、下位レイヤのすべてを参照しなくてもよいように階層符号化データを構成することもできる。例えば、上位階層L1の参照レイヤが、中位階層L2および下位階層L3のいずれか一方となるように階層符号化データを構成することも可能である。
基本レイヤ(base layer) : 最下層に位置する階層のことを基本レイヤと称する。基本レイヤの復号画像は、符号化データから復号され得るもっとも低い品質の復号画像であり、基本復号画像と呼称される。別の言い方をすれば、基本復号画像は、最下層の階層に対応する復号画像のことである。基本復号画像の復号に必要な階層符号化データの部分符号化データは基本符号化データと呼称される。例えば、上位階層L1の階層符号化データDATA#Aに含まれる基本情報“C”が基本符号化データである。
拡張レイヤ : 基本レイヤの上位レイヤは、拡張レイヤと称される。
レイヤ識別子 : レイヤ識別子は、階層を識別するためのものであり、階層と1対1に対応する。階層符号化データには特定の階層の復号画像の復号に必要な部分符号化データを選択するために用いられる階層識別子が含まれる。特定のレイヤに対応するレイヤ識別子に関連付けられた階層符号化データの部分集合は、レイヤ表現とも呼称される。
一般に、特定の階層の復号画像の復号には、当該階層のレイヤ表現、および/または、当該階層の下位レイヤに対応するレイヤ表現が用いられる。すなわち、対象レイヤの復号画像の復号においては、対象レイヤのレイヤ表現、および/または、対象レイヤの下位レイヤに含まれる1つ以上階層のレイヤ表現が用いられる。
レイヤ間予測 : レイヤ間予測とは、対象レイヤのレイヤ表現と異なる階層(参照レイヤ)のレイヤ表現に含まれるシンタックス要素値、シンタックス要素値より導出される値、および復号画像に基づいて、対象レイヤのシンタックス要素値や対象レイヤの復号に用いられる符号化パラメータ等を予測することである。動き予測に関する情報を参照レイヤの情報から予測するレイヤ間予測のことを動き情報予測と称することもある。また、下位レイヤの復号画像から予測するレイヤ間予測のことをレイヤ間画像予測(あるいはレイヤ間テクスチャ予測)と称することもある。なお、レイヤ間予測に用いられる階層は、例示的には、対象レイヤの下位レイヤである。また、参照レイヤを用いず対象レイヤ内で予測を行うことをレイヤ内予測と称することもある。
なお、以上の用語は、飽くまで説明の便宜上のものであり、上記の技術的事項を別の用語にて表現してもかまわない。
(NALユニットレイヤ)
図13は、符号化データ#1におけるデータの階層構造を示す図である。符号化データ#1は、NAL(Network Abstraction Layer)ユニットと呼ばれる単位で符号化される。
NALは、動画像符号化処理を行う層であるVCL(Video Coding Layer)と、符号化データを伝送・蓄積する下位システムとの間における通信を抽象化するために設けられる層である。
VCLは、画像符号化処理を行う層のことであり、VCLにおいて符号化が行われる。一方、ここでいう、下位システムは、H.264/AVCおよびHEVCのファイルフォーマットや、MPEG−2システムに対応する。以下に示す例では、下位システムは、対象レイヤおよび参照レイヤにおける復号処理に対応する。なお、NALでは、VCLで生成されたビットストリームが、NALユニットという単位で区切られて、宛先となる下位システムへ伝送される。
図14(a)は、NAL(Network Abstraction Layer)ユニットのシンタックステーブルを示す。NALユニットには、VCLで符号化された符号化データ、および、当該符号化データが宛先の下位システムに適切に届けられるためのヘッダ(NALユニットヘッダ:nal_unit_header())が含まれる。なお、NALユニットヘッダは、例えば、図14(b)に示すシンタックスで表わされる。NALユニットヘッダには、NALユニットに格納された符号化データの種類を表わす”nal_unit_type”、格納された符号化データが属するサブレイヤの識別子(テンポラル識別子)を表わす”nuh_temporal_id_plus1”や、格納された符号化データが属するレイヤの識別子(レイヤ識別子)を表わす”nuh_layer_id”が記述されている。
NALユニットデータには、後述のパラメータセット、SEI、スライスなどが含まれる。
図15は、NALユニットタイプの値とNALユニットの種別の関係を示す図である。図15に示す通り、SYNA101 で示される0から15の値のNALユニットタイプを持つNALユニットは、非RAP(ランダムアクセスピクチャ)のスライスである。SYNA102 で示される16から21の値のNALユニットタイプを持つNALユニットは、RAP(ランダムアクセスピクチャ)のスライスである。RAPピクチャには、大きく分けて、BLAピクチャ、IDRピクチャ、CRAピクチャがあり、BLAピクチャは、さらに、BLA_W_LP、BLA_W_DLP、BLA_N_LPに分類される。IDRピクチャは、さらに、IDR_W_DLP、IDR_N_LPに分類される。TSA_R、TSA_NのNALユニットタイプは、TSAピクチャ(temporal sub-layer accessピクチャ))を表す、STSA_R、STSA_NのNALユニットタイプは、STSAピクチャ(step-wise temporal sub-layer accessピクチャ)を表す。また図15において、NALユニットに応じて、VCLもくはnon-VCLが区別される。VCLNALユニットは、符号化ユニット構成、予測パラメータ、残差などの画像の符号化データ。non-VCLNALユニットは、パラメータセットなど、画像を復号するために用いる上位のパラメータの符号化データである。
(アクセスユニット)
特定の分類ルールにより集約されたNALユニットの集合のことをアクセスユニットと呼ぶ。レイヤ数が1の場合には、アクセスユニットは1ピクチャを構成するNALユニットの集合である。レイヤ数が1より大きい場合には、アクセスユニットは同じ時刻の複数のレイヤのピクチャを構成するNALユニットの集合である。なお、アクセスユニットの区切りを示すために、符号化データはアクセスユニットデリミタ(Access unit delimiter)と呼ばれるNALユニットを含んでも良い。アクセスユニットデリミタは、符号化データ中にあるアクセスユニットを構成するNALユニットの集合と、別のアクセスユニットを構成するNALユニットの集合の間に含まれる。
(基本レイヤ)
図3は、NALユニットデータの符号化データのデータ構造を例示する図である。階層符号化データDATA#Cは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。
図3の(a)〜(e)は、それぞれ、シーケンスSEQを規定するシーケンスレイヤ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、符号化ツリーユニット(Coding Tree Unit;CTU)を規定するCTUレイヤ、符号化ツリーユニットCTUに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示す図である。
(シーケンスレイヤ)
シーケンスレイヤでは、処理対象のシーケンスSEQ(以下、対象シーケンスとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。シーケンスSEQは、図3の(a)に示すように、ビデオパラメータセットVPS(Video Parameter Set)、シーケンスパラメータセットSPS(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、ピクチャPICT〜PICTNP(NPはシーケンスSEQに含まれるピクチャの総数)、及び、付加拡張情報SEI(Supplemental Enhancement Information)を含んでいる。
ビデオパラメータセットVPSは、複数のレイヤから構成されている動画像において、複数の動画像に共通する符号化パラメータの集合および動画像に含まれる複数のレイヤおよび個々のレイヤに関連する符号化パラメータの集合が規定されている。例えば、VPSは、対象レイヤで参照する対象レイヤ以外のレイヤである参照レイヤを規定する。具体的には、レイヤ依存フラグdirect_dependent_flag[i][j]をVPSに含め、レイヤ依存フラグdirect_dependent_flag[i][j]が1である場合に、対象レイヤiは参照レイヤjを参照し、レイヤ依存フラグが0であれば、対象レイヤiは参照レイヤjを参照しない。また、対象レイヤiに対応する0でないレイヤ依存フラグdirect_dependent_flag[i][j]の数から、対象レイヤiが参照する参照レイヤの数(レイヤ間予測参照レイヤ数ともいう)NumDirectRefLayers[i]が定まる。また、レイヤ依存フラグdirect_dependent_flag[i][j]が1の場合に、レイヤ依存タイプdirect_dependency_type[i][j]がさらにVPSに含まれる。
シーケンスパラメータセットSPSでは、対象シーケンスを復号するために階層動画像復号装置1が参照する符号化パラメータの集合が規定されている。SPSは符号化データ内に複数存在してもよい。その場合、対象シーケンス毎に復号に用いられるSPSが複数の候補から選択される。特定シーケンスの復号に使用されるSPSは、アクティブSPSとも呼ばれる。以下では、特に断りがなければ、対象シーケンスに対するアクティブSPSを意味する。
ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために階層動画像復号装置1が参照する符号化パラメータの集合が規定されている。なお、PPSは符号化データ内に複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。特定ピクチャの復号に使用されるPPSはアクティブPPSとも呼ばれる。以下では、特に断りがなければ、PPSは対象ピクチャに対するアクティブPPSを意味する。
(ピクチャレイヤ)
ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。ピクチャPICTは、図3の(b)に示すように、スライスセグメントヘッダSH1〜SHNS、及び、スライスS1〜SNSを含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
なお、以下、スライスセグメントヘッダSH1〜SHNSやスライスS1〜SNSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する階層符号化データDATA#Cに含まれるデータであって、添え字を付している他のデータも同様である。
スライスセグメントヘッダSHkには、対応するスライスSkの復号方法を決定するために階層動画像復号装置1が参照する符号化パラメータ群が含まれている。例えば、SPSを指定するSPS識別子(seq_parameter_set_id)や、PPSを指定するPPS識別子(pic_parameter_set_id)が含まれる。また、スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスセグメントヘッダSHに含まれる符号化パラメータの一例である。
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、又は、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、又は、イントラ予測を用いるBスライスなどが挙げられる。
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。スライスSは、図3の(c)に示すように、符号化ツリーユニットCTU1〜CTUNC(NCはスライスSに含まれるCTUの総数)を含んでいる。
(CTUレイヤ)
CTUレイヤでは、処理対象の符号化ツリーユニットCTU(以下、対象CTUとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。なお、符号化ツリーユニットのことを符号化ツリーブロック(CTB: Coding Tree block)、または、最大符号化単位(LCU:Largest Cording Unit)と呼ぶこともある。
符号化ツリーユニットCTUは、CTUヘッダCTUHと、符号化単位情報CU〜CUNL(NLはCTUに含まれる符号化単位情報の総数)とを含む。ここで、まず、符号化ツリーユニットCTUと、符号化単位情報CUとの関係について説明すると次のとおりである。
符号化ツリーユニットCTUは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するための単位に分割される。
符号化ツリーユニットCTUの上記単位は、再帰的な4分木分割により分割されている。この再帰的な4分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。
以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応する単位を、符号化ノード(coding node)として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。
つまり、符号化単位情報(以下、CU情報と称する)CU〜CUNLは、符号化ツリーユニットCTUを再帰的に4分木分割して得られる各符号化ノード(符号化単位)に対応する情報である。
また、符号化ツリーのルート(root)は、符号化ツリーユニットCTUに対応付けられる。換言すれば、符号化ツリーユニットCTUは、複数の符号化ノードを再帰的に含む4分木分割の木構造の最上位ノードに対応付けられる。
なお、各符号化ノードのサイズは、当該符号化ノードの親ノードとなる符号化ノード(すなわち、当該符号化ノードの1階層上位のノード)のサイズの縦横とも半分である。
また、符号化ツリーユニットCTUのサイズ、および、各符号化ユニットのとり得るサイズは、シーケンスパラメータセットSPSに含まれる、最小符号化ノードのサイズ指定情報、および最大符号化ノードと最小符号化ノードの階層深度の差分に依存する。例えば、最小符号化ノードのサイズが8×8画素であって、最大符号化ノードと最小符号化ノードの階層深度の差分が3である場合、符号化ツリーユニットCTUのサイズが64×64画素であって、符号化ノードのサイズは、4種類のサイズ、すなわち、64×64画素、32×32画素、16×16画素、および、8×8画素の何れかをとり得る。
(CTUヘッダ)
CTUヘッダCTUHには、対象CTUの復号方法を決定するために階層動画像復号装置1が参照する符号化パラメータが含まれる。具体的には、図3の(d)に示すように、対象CTUの各CUへの分割パターンを指定するCTU分割情報SP_CTU、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
CTU分割情報SP_CTUは、CTUを分割するための符号化ツリーを表す情報であり、具体的には、対象CTUに含まれる各CUの形状、サイズ、および、対象CTU内での位置を指定する情報である。
なお、CTU分割情報SP_CTUは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばCTU分割情報SP_CTUは、対象CTU全体またはCTUの部分領域を四分割するか否かを示すフラグの集合であってもよい。その場合、CTUの形状やサイズを併用することで各CUの形状やサイズを特定できる。
また、量子化パラメータ差分Δqpは、対象CTUにおける量子化パラメータqpと、当該対象CTUの直前に符号化されたCTUにおける量子化パラメータqp’との差分qp−qp’である。
(CUレイヤ)
CUレイヤでは、処理対象のCU(以下、対象CUともS!称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。
ここで、CU情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー(prediction tree;PT)および変換ツリー(transform tree;TT)のルートのノードとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。
予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。換言すれば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。
予測ツリーにおける分割(以下、PU分割と略称する)の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との2つがある。
イントラ予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)と、N×Nとがある。
また、インター予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)、2N×N、2N×nU、2N×nD、N×2N、nL×2N、および、nR×2Nなどがある。
また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。換言すれば、変換ブロックは、符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
変換ツリーにおける分割には、符号化ノードと同一のサイズの領域を変換ブロックとして割り付けるものと、上述したツリーブロックの分割と同様、再帰的な4分木分割によるものがある。
変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。
(CU情報のデータ構造)
続いて、図3(e)を参照しながらCU情報CUに含まれるデータの具体的な内容を説明する。図3(e)に示すように、CU情報CUは、具体的には、スキップフラグSKIP、予測ツリー情報(以下、PT情報と略称する)PTI、および、変換ツリー情報(以下、TT情報と略称する)TTIを含む。
スキップフラグSKIPは、対象のPUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、そのCU情報CUにおけるPT情報PTIの一部、および、TT情報TTIは省略される。なお、スキップフラグSKIPは、Iスライスでは省略される。
[PT情報]
PT情報PTIは、CUに含まれる予測ツリー(以下、PTと略称する)に関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合であり、階層動画像復号装置1により予測画像を生成する際に参照される。PT情報PTIは、図3(e)に示すように、予測タイプ情報PType、および、予測情報PInfoを含んでいる。
予測タイプ情報PTypeは、対象PUについての予測画像生成方法を指定する情報である。ベースレイヤにおいては、イントラ予測を用いるのか、または、インター予測を用いるのかを指定する情報である。
予測情報PInfoは、予測タイプ情報PTypeで指定される予測方法において用いられる予測情報である。ベースレイヤにおいては、イントラ予測の場合にイントラ予測情報PP_Intraが含まれる。また、インター予測の場合にはインター予測情報PP_Interを含む。
インター予測情報PP_Interは、階層動画像復号装置1が、インター予測によってインター予測画像を生成する際に参照される予測情報を含む。より具体的には、インター予測情報PP_Interは、対象CUの各インターPUへの分割パターンを指定するインターPU分割情報、および、各インターPUについてのインター予測パラメータ(動き補償パラメータ)を含む。インター予測パラメータとしては、例えば、マージフラグ(merge_flag)、マージインデックス(merge_idx)、推定動きベクトルインデックス(mvp_idx)、参照ピクチャインデックス(ref_idx)、インター予測フラグ(inter_pred_flag)、および動きベクトル残差(mvd)を含む。
イントラ予測情報PP_Intraは、階層動画像復号装置1が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータを含む。より具体的には、イントラ予測情報PP_Intraには、対象CUの各イントラPUへの分割パターンを指定するイントラPU分割情報、および、各イントラPUについてのイントラ予測パラメータが含まれる。イントラ予測パラメータは、各イントラPUについてのイントラ予測方法(予測モード)を指定するためのパラメータである。
ここで、イントラ予測パラメータは、各イントラPUについてのイントラ予測(予測モード)を復元するためのパラメータである。予測モードを復元するためのパラメータには、MPM(Most Probable Mode、以下同様)に関するフラグであるmpm_flag、MPMを選択するためのインデックスであるmpm_idx、および、MPM以外の予測モードを指定するためのインデックスであるrem_idxが含まれる。ここで、MPMとは、対象パーティションで選択される可能性が高い推定予測モードである。例えば、対象パーティションの周辺のパーティションに割り付けられた予測モードに基づいて推定された推定予測モードや、一般的に発生確率の高いDCモードやPlanarモードがMPMに含まれ得る。
また、以下において、単に“予測モード”と表記する場合、特にことわりのない限り、輝度予測モードのことを指すものとする。色差予測モードについては、“色差予測モード”と表記し、輝度予測モードと区別する。また、予測モードを復元するパラメータには、色差予測モードを指定するためのパラメータであるchroma_modeが含まれる。
[TT情報]
TT情報TTIは、CUに含まれる変換ツリー(以下、TTと略称する)に関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数の変換ブロックそれぞれに関する情報の集合であり、階層動画像復号装置1により残差データを復号する際に参照される。
TT情報TTIは、図3(e)に示すように、対象CUの各変換ブロックへの分割パターンを指定するTT分割情報SP_TT、および、量子化予測残差QD1〜QDNT(NTは、対象CUに含まれるブロックの総数)を含んでいる。
TT分割情報SP_TTは、具体的には、対象CUに含まれる各変換ブロックの形状、および、対象CU内での位置を決定するための情報である。例えば、TT分割情報SP_TTは、対象ノードの分割を行うのか否かを示す情報(split_transform_unit_flag)と、その分割の深度を示す情報(trafoDepth)とから実現できる。
また、例えば、CUサイズが、64×64の場合、分割により得られる各変換ブロックは、32×32画素から4×4画素までのサイズをとり得る。
各量子化予測残差QDは、階層動画像符号化装置2が以下の処理1〜3を、処理対象の変換ブロックである対象ブロックに施すことによって生成した符号化データである。
処理1:符号化対象画像から予測画像を減算した予測残差を周波数変換(例えば、DCT変換(Discrete Cosine Transform)およびDST変換(Discrete Sine Transform)等)する;
処理2:処理1にて得られた変換係数を量子化する;
処理3:処理2にて量子化された変換係数を可変長符号化する;
なお、上述した量子化パラメータqpは、階層動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2qp/6)。
(PU分割情報)
PU分割情報によって指定されるPU分割タイプには、対象CUのサイズを2N×2N画素とすると、次の合計8種類のパターンがある。すなわち、2N×2N画素、2N×N画素、N×2N画素、およびN×N画素の4つの対称的分割(symmetric splittings)、並びに、2N×nU画素、2N×nD画素、nL×2N画素、およびnR×2N画素の4つの非対称的分割(asymmetric splittings)である。なお、N=2(mは1以上の任意の整数)を意味している。以下、対象CUを分割して得られる予測単位のことを予測ブロック、または、パーティションと称する。
(拡張レイヤ)
拡張レイヤのレイヤ表現に含まれる符号化データ(以下、拡張レイヤ符号化データ)についても、例えば、図3に示すデータ構造とほぼ同様のデータ構造を採用できる。ただし、拡張レイヤ符号化データでは、以下のとおり、付加的な情報を追加したり、パラメータを省略できる。
スライスレイヤでは、空間スケーラビリティ、時間スケーラビリティ、および、SNRスケーラビリティ、ビュースケーラビリティの階層の識別情報(それぞれ、dependency_id、temporal_id、quality_id、および、view_id)が符号化されていてもよい。
また、CU情報CUに含まれる予測タイプ情報PTypeは、対象CUについての予測画像生成方法がイントラ予測、インター予測、または、レイヤ間画像予測のいずれかを指定する情報である。予測タイプ情報PTypeには、レイヤ間画像予測モードの適用有無を指定するフラグ(レイヤ間画像予測フラグ)を含む。なお、レイヤ間画像予測フラグは、texture_rl_flag、inter_layer_pred_flag、または、base_mode_flagと呼ばれることもある。
拡張レイヤにおいて、対象CUのCUタイプが、イントラCU、レイヤ間CU、インターCU、スキップCUのいずれであるかが指定されていてもよい。
イントラCUは、ベースレイヤにおけるイントラCUと同様に定義できる。イントラCUでは、レイヤ間画像予測フラグが“0”に、予測モードフラグが“0”に設定される。
レイヤ間CUは、参照レイヤのピクチャの復号画像を予測画像生成に用いるCUと定義できる。レイヤ間CUでは、レイヤ間画像予測フラグが“1”に、予測モードフラグが“0”に設定される。
スキップCUは、上述のHEVC方式の場合と同様に定義できる。例えば、スキップCUでは、スキップフラグに“1”が設定される。
インターCUは、非スキップかつ動き補償(MC;Motion Compensation)を適用するCUと定義されていてもよい。インターCUでは、例えば、スキップフラグに“0”が設定され、予測モードフラグに“1”が設定される。
また、上述のとおり拡張レイヤの符号化データを、下位レイヤの符号化方式と異なる符号化方式により生成しても構わない。すなわち、拡張レイヤの符号化・復号処理は、下位レイヤのコーデックの種類に依存しない。
下位レイヤが、例えば、MPEG-2や、H.264/AVC方式によって符号化されていてもよい。
拡張レイヤ符号化データでは、VPSが拡張されて、レイヤ間の参照構造を表すパラメータが含まれていてもよい。
また、拡張レイヤ符号化データでは、SPS、PPS、スライスセグメントヘッダが拡張されて、レイヤ間画像予測に用いる参照レイヤの復号画像に係る情報(例えば、後述のレイヤ間参照ピクチャセット、レイヤ間参照ピクチャリスト、ベース制御情報等を直接、または、間接的に導出するためのシンタックス)が含まれていてもよい。
なお、以上に説明したパラメータは、単独で符号化されていてもよいし、複数のパラメータが複合的に符号化されていてもよい。複数のパラメータが複合的に符号化される場合は、そのパラメータの値の組み合わせに対してインデックスが割り当てられ、割り当てられた当該インデックスが符号化される。また、パラメータが、別のパラメータや、復号済みの情報から導出可能であれば、当該パラメータの符号化を省略できる。
(サブレイヤ)
サブレイヤは時間スケーラビリティを表現するために用いられる。一般的には各サブレイヤに属するピクチャに対して時間識別子(TemporalID, Tid)が割り当てられている。時間識別子は、低次サブレイヤほど、言い換えると低いフレームレートに相当するサブレイヤほど、小さい値が割り当てられている。特定のサブレイヤに相当するフレームレートの出力画像を得たい場合には、当該サブレイヤに割り当てられている時間識別子以下の値を持つ時間識別子が割り当てられた符号化データを抽出して復号すればよい。
例えば、時間識別子の値がaであることをTID=aと表記した上で、TID=0が15fps(frame per second)に、TID=1が30fps、TID=2が60fpsに相当するとする。この場合、15fpsの出力画像を得るためにはTID=0の符号化データを抽出して復号すればよい。また、60fpsの出力画像を得るためにはTID=0、TID=1、TID=2の符号化データを抽出して復号すればよい。なお、階層符号化データに含まれる最大の時間識別子は最高次時間識別子(Highest Temporal Id)とも呼ばれる。
上記の特性を実現するため、TID=kのピクチャは、k以下の時間識別子を持つピクチャのみをインター予測で参照可能という特徴を持つ。そのため、最高次時間識別子を持つピクチャは、インター予測で参照されない場合には、レイヤ間画像予測による参照ピクチャ(レイヤ間参照ピクチャ、レイヤ間予測ピクチャ)としてのみ利用され得る。
図16は、サブレイヤを説明するための図である。図中の図形は、ピクチャを示す、図形中の数字は復号順を示す番号である。以下、復号順Xのピクチャを、ピクチャXと呼ぶ。図16では、3つのサブレイヤ(TID=0, 1,2)が用いられている。ここでは、復号順0、1のピクチャがサブレイヤ0(TID=0)のピクチャ、ピクチャ2がサブレイヤ1(TID=1)のサブレイヤ非参照ピクチャ、復号順4、5、7のピクチャが、サブレイヤ1(TID=2)のサブレイヤ参照ピクチャとする。サブレイヤ非参照ピクチャであるピクチャ3は、後述のCF条件(T3)により、自身と同じもしくのTIDのピクチャから参照されてはならないため、ピクチャ6は、復号順序が前のピクチャであっても同じサブレイヤのピクチャ3を参照してはならない。これに対し、復号順5のサブレイヤ参照ピクチャは、サブレイヤ参照ピクチャであるから、同じサブレイヤ階層のピクチャから参照可能である。そのため、この図では、同じTID=3のサブレイヤのピクチャ7から参照されている。なお、サブレイヤ参照ピクチャであるか、サブレイヤ非参照ピクチャであるかに関わらず、後述のCF条件(T4)により、あるピクチャは、自身よりも低いTIDのピクチャから参照されてはならない(参照ピクチャのTIDは、対象ピクチャのTIDよりも大きくなくてはならない)ため、TID=2のサブレイヤのピクチャ5は、TID=1のサブレイヤであるピクチャ6から参照することはできない。
再生において、高いサブレイヤから低いサブレイヤへの遷移(TIDが大きいサブレイヤも再生する状態からTIDの小さいサブレイヤだけを再生する状態への遷移)は常に行うことができるが、低いサブレイヤから高いサブレイヤへの遷移(TIDが小さいサブレイヤだけを再生する状態からTIDの大きいサブレイヤも再生する状態への遷移)はできないことがある。低いサブレイヤから高いサブレイヤへの遷移が可能なピクチャを示すものがTSAピクチャおよびSTSAピクチャである。
図17は、TSAピクチャ、STSAピクチャを説明するための図である。TSAピクチャは、復号順で後続のピクチャにおいて、TSAピクチャ自身と同じサブレイヤか、それよりも高いサブレイヤに遷移可能なピクチャである。図17(a)に示すように、ピクチャ3およびその後続のピクチャ4は、自身よりも低いサブレイヤのピクチャのみを参照しているため、常に低いサブレイヤから高いサブレイヤへの遷移が可能である。すなわち、ピクチャ3では、ピクチャ3のサブレイヤより低いサブレイヤ(TID=0)から、ピクチャ3と同じサブレイヤ(TID=1)に遷移することができる。また、復号順4において、ピクチャ3よりも高いサブレイヤ(TID=2)に遷移することもできる。このようなピクチャであるピクチャ3をTSAピクチャと呼ぶ。TSAピクチャは、TSA_D、TSA_NのNALユニットタイプにより示すことができる。TSA_D、TSA_Nは各々、サブレイヤ参照ピクチャのTSAピクチャ、サブレイヤ非参照ピクチャのTSAピクチャを示す。
STSAピクチャは、復号順で後続のピクチャにおいて、STSAピクチャ自身と同じサブレイヤに遷移可能なピクチャである。図17(b)に示すように、ピクチャ3は、自身よりも低いサブレイヤのピクチャのみを参照しているため、この時点では、高いサブレイヤへの遷移が可能である。但し、ピクチャ4、ピクチャ3よりも高いサブピクチャのピクチャを参照している。そのため、この時点では復号順3のサブピクチャと同じサブピクチャまでしか遷移することができない。このようなピクチャであるピクチャ3をSTSAピクチャと呼ぶ。STSAピクチャは、STSA_D、STSA_NのNALユニットタイプにより示すことができる。STSA_D、STSA_Nは各々、サブレイヤ参照ピクチャのTSAピクチャ、サブレイヤ非参照ピクチャのTSAピクチャを示す。
(レイヤ間サブレイヤアライメントとユースケース)
以下、レイヤ間サブレイヤアライメントと関連するユースケースを説明する。レイヤ間サブレイヤアライメントとは、同じ表示時刻(出力順、以下アクセスユニット)を有する異なるピクチャの間で、サブレイヤのパラメータであるTID、もしくは、サブレイヤの遷移をサポートする参照関係を示すTSAピクチャおよびSTSAピクチャについて同じ値を用いることである。
以下に説明するユースケースのうち(U1)(U2)がサブレイヤ情報がアライメントされている場合、ユースケースのうち(U3)(U4)がサブレイヤ情報がアライメントされていない場合に対応する。
レイヤ間で、TIDがアライメントされている場合には、以下のユースケース(U1)を実現することができる。
あるレイヤで時間的な間引き再生が可能である場合には、別のレイヤでも同様の間引き再生が可能である。例えば、間引き再生を変化させずに、あるレイヤ(例えば低解像度のレイヤ)から別のレイヤ(例えば、高解像度のレイヤ)に再生を変えることや、複数のレイヤ(例えば、視点画像0のレイヤ0と、視点画像1のレイヤ1)を同時に同じ間引き再生を用いて、再生することができる・・・(U1)
レイヤ間で、TSAピクチャおよびSTSAピクチャがアライメントされている場合には、以下のユースケース(U2)を実現することができる
あるレイヤのある表示時刻で低いサブレイヤから高いサブレイヤに移行することが可能である場合には、同じ表示時刻の別のレイヤも、同様に低いサブレイヤから高いサブレイヤに移行することが可能である。低いサブレイヤから高いサブレイヤへの移行において、レイヤの制限がないため、どのレイヤを再生しているかにかかわらず、レイヤに応じてサブレイヤ間の移行タイミングを逃すことがない。また、複数のレイヤを同時に再生している場合において、同じタイミングで低いサブレイヤから高いサブレイヤに移行することができる・・・(U2)
逆に、レイヤ間で、サブレイヤ情報がアライメントされていない場合には、以下のユースケース(U3)(U4)を実現することができる。
レイヤ間で、TIDがアライメントされていない場合には、以下のユースケース(U3)(U3´)を実現することができる。
ベースレイヤでは細かいレベル(例えば3レベル)のサブレイヤを設定して、高い粒度のテンポラルスケーラビリティをサポートし、非ベースレイヤでは粗いレベル(例えば2レベル)のサブレイヤを設定し粒度の低いテンポラルスケーラビリティをサポートにとどめ高い符号化効率を実現する・・・(U3)
ベースレイヤのみ複数のサブレイヤを有し、テンポラルスケーラビリティをサポートし、非ベースレイヤでは単一のサブレイヤのみを有しテンポラルスケーラビリティをサポートせず高い符号化効率を実現する・・・(U3´)
レイヤ間で、TSAピクチャおよびSTSAピクチャがアライメントされていない場合には、以下のユースケース(U4)を実現することができる
あるレイヤでは、高い頻度でTSAピクチャもしくはSTSAピクチャを挿入し、低いサブレイヤから高いサブレイヤに移行することが容易に可能であるようにし利便性が高くするが、別のレイヤではTSAピクチャもしくはSTSAピクチャを挿入しない、もしくは、低い頻度とすることによって、高い符号化を実現する。・・・(U4)
図18は、レイヤ間で時間識別子(TemporalID、TID)のアライメント(レイヤ間TIDアライメント、レイヤ間サブレイヤ同期)を行う例である。この例は、ユースケース(U1)に対応する。図18に示すように、同じ表示時刻(出力順、アクセスユニット)のピクチャはレイヤが異なっても同じTIDを有する。例えば、同じ表示時刻のレイヤ0のピクチャ5とレイヤ1のピクチャ6は同じTID=1を有し、同じ表示時刻のレイヤ0のピクチャ9とレイヤ1のピクチャ10は同じTID=2を有する。
図19は、レイヤ間でTIDのアライメントを行わない例である。この例は、ユースケース(U3)に対応する。
図19に示すように、レイヤ0では、ピクチャ9は、自身よりも高いサブレイヤのピクチャであるピクチャ7のピクチャを参照できないのに対し、レイヤ1では、ピクチャ10は、ピクチャ8を参照することができる。これは、レイヤ0が3つのサブレイヤ(TID=0、1、2)に分かれているのに対し、レイヤ1が1つのサブレイヤのみ(TID=0)であることから、サブレイヤに関する制約を受けないためである。なお、図19では、同じアクセスユニットであるピクチャ7とピクチャ10は各々異なるTIDを持つことから、レイヤ間で同じTIDを共有しない。つまり、レイヤ間でTIDのアライメントを行わない例となっている。
図20は、レイヤ間でTIDのアライメントを行わないさらに別の例である。この例では、ユースケース(U3´)に対応する。レイヤ0が3つのサブレイヤ(TID=0、1、2)に分かれているのに対し、レイヤ1が2つのサブレイヤのみ(TID=0、1)である。
図20に示すように、レイヤ0では、ピクチャ13は、自身よりも高いサブレイヤのピクチャであるピクチャ9のピクチャを参照できないのに対し、レイヤ1では、復号順13に対応するピクチャ14は、ピクチャ9に対応するピクチャ10を参照することができる。図19、図20では共通して、細かいサブレイヤ構成のレイヤ0では参照できないピクチャを、粗いサブレイヤ構成のレイヤ1では参照できることため、レイヤ1の方が符号化効率を高めることができる。
上記、ユースケース(U2)(U3)を考慮すれば、レイヤ間のTIDがレイヤ間アライメントが同じではない場合を許して、ユースケース(U1)〜(U3)に対応しつつ、後述のレイヤ間サブレイヤアライメントフラグによって、ユースケース(U1)が可能であることを復号装置に伝送することが好適である。
図21は、レイヤ間で、TSAピクチャのアライメント(レイヤ間サブレイヤピクチャ同期)を行う例である。この例では、ユースケースのU2に対応する。
図21に示すように、同じ表示時刻のピクチャ5とピクチャ6はともにTSAピクチャであり、同期されている。すなわち、同じ表示時刻において、レイヤに限定されずに(レイヤ0でもレイヤ1でも)、低サブレイヤから高サブレイヤに移行できる。ここではTSAピクチャであるので、TSAピクチャ自身と同じサブレイヤか、それよりも高いサブレイヤに移行可能である。
図22は、レイヤ間で、STSAピクチャのアライメントを行う例である。この例では、ユースケースのU2に対応する。図22に示すように、同じ表示時刻のピクチャ5とピクチャ6はともにSTSAピクチャであり、同期されている。すなわち、同じ表示時刻において、レイヤに限定されずに(レイヤ0でもレイヤ1でも)、低サブレイヤから高サブレイヤに移行できる。ここではSTSAピクチャであるので、TSAピクチャ自身と同じサブレイヤに移行可能である。
図23は、レイヤ間で、TSAピクチャ、STSAピクチャのアライメント(レイヤ間サブレイヤピクチャ同期)が行われていない例である。この例では、ユースケースのU4に対応する。図23に示すように、同じ表示時刻のピクチャ5はSTSAピクチャであるが、ピクチャ6はSTSAピクチャではない。すなわち、レイヤ0では、低サブレイヤから高サブレイヤに移行できるピクチャ5の表示時刻において、レイヤ1では、低サブレイヤから高サブレイヤに移行できない。その代わりに、ピクチャ6は、ピクチャ5では参照できない同じサブレイヤのピクチャを参照しており、高い符号化効率を実現することができる。
図24は、レイヤ間で、TSAピクチャ、STSAピクチャの半アライメント(セミアライメント、レイヤ間サブレイヤピクチャ同期)が行われている例である。この例も、ユースケースのU4に対応する。図22に示すように、同じ表示時刻のピクチャ5はTSAピクチャ、ピクチャ6はSTSAピクチャであり、いずれかのサブレイヤ移行ピクチャであるという意味では同期されている。すなわち、同じ表示時刻において、レイヤに限定されずに(レイヤ0でもレイヤ1でも)、低サブレイヤから高サブレイヤに移行できる。しかしながら、レイヤ0では、移行可能点のピクチャは、TSAピクチャであるので、TSAピクチャ自身と同じサブレイヤか、それよりも高いサブレイヤに移行可能であるのに対し、レイヤ1では、、移行可能点のピクチャは、STSAピクチャであるので、TSAピクチャ自身と同じサブレイヤにのみ移行可能である。
(レイヤ間予測最大TID)
図25は、レイヤ間予測最大TIDMaxTidIlRefPicsを説明するための図である。レイヤ間予測最大TIDは、あるTIDのサブレイヤのピクチャが、レイヤ間予測に用いられるか否かを判別するために用いられる。レイヤ間予測最大TIDMaxTidIlRefPicsは、MaxTidIlRefPics以下のTIDのピクチャは、レイヤ間予測に用いられるが、レイヤ間予測最大TIDMaxTidIlRefPicsより大きいTIDのピクチャは、レイヤ間予測に用いられないことを示す。符号化データでは、MaxTidIlRefPicsに1を加えたmax_tid_il_ref_pics_plus1が符号化される。max_tid_il_ref_pics_plus1を復号した際、レイヤ間予測最大TIDMaxTidIlRefPicsは、
MaxTidIlRefPics =max_tid_il_ref_pics_plus1-1
により導出される。
MaxTidIlRefPicsの代わりにmax_tid_il_ref_pics_plus1を用いると、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1は、max_tid_il_ref_pics_plus1より小さいTIDのピクチャは、レイヤ間予測に用いられるが、max_tid_il_ref_pics_plus以上のTIDのピクチャは、レイヤ間予測に用いられないことを示す。
図25に示すように、レイヤ0のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[0]が2の場合には、TID=1以下のサブレイヤのピクチャのみがレイヤ間予測において参照される。従って、TID=0のピクチャ1、ピクチャ3およびTID=1のピクチャ5のみがレイヤ間予測で参照される。TID=2のピクチャ7、ピクチャ9は、レイヤ間予測で参照することができない。図25に示すように、レイヤ0を再生せず、レイヤ1のみを再生する場合には、レイヤ間予測最大TIDを超えるTIDのピクチャ、すなわち、ピクチャ7、ピクチャ9は、参照されないことが分かっているので、復号する必要がない。このように、あるレイヤのレイヤ間予測最大TIDは、自身以外のレイヤを再生する場合に、高いサブレイヤのピクチャの復号を省略するのに使用することができ、処理量を低減可能である。
レイヤ間でTIDがアライメントされている場合は、レイヤ1のピクチャのTIDは、同じ表示時刻(出力順、アクセスユニット)のレイヤ0のピクチャのTIDであるから、レイヤ0にレイヤ間予測最大TIDによりレイヤ間予測が制限されている場合には、レイヤ1のピクチャのTIDを参照することで、レイヤ0のピクチャがレイヤ間予測で参照されないことが分かる。
(レイヤ間予測最大TID)
図26は、レイヤ間予測最大TIDのレイヤ間アライメントを示す図である。レイヤ間予測最大TIDがレイヤ間アライメントされているとは、異なるレイヤで同じレイヤ間予測最大TIDを有することである。図26に示す通り、レイヤ0のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[0]、レイヤ1のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[1]はどちらも1であり、レイヤ間でアライメントされている。レイヤ間予測最大TIDがレイヤ間アライメントされている場合には、レイヤを区別することなく、あるレイヤがレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[]によりレイヤ間予測が制御されている場合には、他の全てのレイヤで同じレイヤ間予測最大TIDで、レイヤ間予測が制御される。従って、参照先がどのレイヤのピクチャであるのかを考慮することなく、対象ピクチャのTIDが、レイヤ間予測最大TIDより大きい場合には、レイヤ間予測を行わない、ことを判別することができる。
図27は、レイヤ間予測最大TIDのレイヤ間アライメントがなされていない例を示す図である。レイヤ0のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[0]は1、レイヤ1のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[1]は3であり、レイヤ間でアライメントされていない。この場合、レイヤ2のピクチャであるピクチャ9からすると、同じ表示時刻のレイヤ0のピクチャ7は、レイヤ間予測最大TIDによりレイヤ間予測が制限されているのに対し、同じ表示時刻のレイヤ0のピクチャ7は、レイヤ間予測最大TIDによりレイヤ間予測がTID=0以下に制限されているのに対し、同じ表示時刻のレイヤ0のピクチャ8は、レイヤ間予測最大TIDによるレイヤ間予測の制限はTID=2以下であるから、参照することができる。このようにレイヤ間予測最大TIDがレイヤ間でアライメントされていない場合には、レイヤ間予測最大TIDによりレイヤ間予測が制限されているかがレイヤ依存となる。
(RPS情報)
参照ピクチャセット(RPS)に係るシンタックス値(以下、RPS情報)は以下を含む。
1.SPS短期RPS情報:SPSに含まれる短期参照ピクチャセット情報
2.SPS長期RP情報:SPSに含まれる長期参照ピクチャ情報
3.SH短期RPS情報:スライスセグメントヘッダに含まれる短期参照ピクチャセット情報
4.SH長期RP情報:スライスセグメントヘッダに含まれる長期参照ピクチャ情報
5.ILRP情報:レイヤ間参照ピクチャ情報
(1.SPS短期RPS情報)
SPS短期RPS情報は、SPSを参照する各ピクチャから利用され得る複数の短期RPSの情報を含む。なお、短期RPSは、対象ピクチャに対する相対的な位置(例えば対象ピクチャとのPOC差分)により指定される参照ピクチャ(短期参照ピクチャ)となり得るピクチャの集合である。
SPS短期RPS情報を、図7を参照して説明する。図7は、SPS復号時に利用されるSPSシンタックス表の一部を例示している。図7の(A)の部分がSPS短期RPS情報に相当する。SPS短期RPS情報には、SPSに含まれる短期RPS数(num_short_term_ref_pic_sets)、および、各短期RPSの定義(short_term_ref_pic_set(i))が含まれる。
短期RPS情報について、図8を参照して説明する。図8は、SPS復号時、および、スライスセグメントヘッダ復号時に利用される短期RPSのシンタックス表を例示している。
短期RPS情報には、対象ピクチャより表示順が早い短期参照ピクチャ数(num_negative_pics)、および、対象ピクチャより表示順が遅い短期参照ピクチャ数(num_positive_pics)が含まれる。なお、以下では、対象ピクチャより表示順が早い短期参照ピクチャを前方短期参照ピクチャ、対象ピクチャより表示順が遅い短期参照ピクチャを後方短期参照ピクチャと呼ぶ。
また、短期RPS情報には、各前方短期参照ピクチャに対して、対象ピクチャに対するPOC差分の絶対値(delta_poc_s0_minus1[i])、および、対象ピクチャの参照ピクチャとして使用される可能性の有無(used_by_curr_pic_s0_flag[i])が含まれる。加えて、各後方短期参照ピクチャに対して、対象ピクチャに対するPOC差分の絶対値(delta_poc_s1_minus1[i])、および、対象ピクチャの参照ピクチャとして使用される可能性の有無(used_by_curr_pic_s1_flag[i])が含まれる。
(2.SPS長期RP情報)
SPS長期RP情報は、SPSを参照する各ピクチャから利用され得る複数の長期参照ピクチャの情報を含む。なお、長期参照ピクチャとは、シーケンス内の絶対的な位置(例えばPOC)により指定されるピクチャである。
SPS長期RP情報の復号について、図7を再び参照して説明する。図7の(B)の部分がSPS長期RP情報に相当する。SPS長期RP情報には、SPSで伝送される長期参照ピクチャの有無を示す情報(long_term_ref_pics_present_flag)、SPSに含まれる長期参照ピクチャ数(num_long_term_ref_pics_sps)、および、各長期参照ピクチャの情報が含まれる。長期参照ピクチャの情報には、参照ピクチャのPOC(lt_ref_pic_poc_lsb_sps[i])、および、対象ピクチャの参照ピクチャとして使用される可能性の有無(used_by_curr_pic_lt_sps_flag[i])が含まれる。
なお、上記参照ピクチャのPOCは、参照ピクチャに関連付けられたPOCの値自体であってもよいし、POCのLSB(Least Significant Bit)、すなわち、POCを既定の2の冪乗の数で割った余りの値を用いてもよい。
(3.SH短期RPS情報)
SH短期RPS情報は、スライスセグメントヘッダを参照するピクチャから利用され得る単一の短期RPSの情報を含む。
SPS短期RPS情報の復号について、図9を参照して説明する。図9は、スライスセグメントヘッダ復号時に利用されるスライスセグメントヘッダシンタックス表の一部を例示している。図9の(A)の部分がSH短期RPS情報に相当する。SH短期RPS情報は、短期RPSをSPSで復号済みの短期RPSの中から選択するか、スライスセグメントヘッダに明示的に含めるかを示すフラグ(short_term_ref_pic_set_sps_flag)を含む。SPSで復号済の中から選択する場合、復号済の短期RPSを一つ選択する識別子(short_term_ref_pic_set_idx)が含まれる。スライスセグメントヘッダに明示的に含める場合は、前述の図8を参照して説明したシンタックス表(short_term_ref_pic_set(idx))に相当する情報が、SPS短期RPS情報に含まれる。
(4.SH長期RP情報)
SH長期RP情報は、スライスセグメントヘッダを参照するピクチャから利用され得る長期参照ピクチャの情報を含む。
SH長期RP情報の復号について、図9を再び参照して説明する。図9の(B)の部分がSH長期RP情報に相当する。SH長期RP情報は、対象ピクチャで長期参照ピクチャが利用可能(long_term_ref_pic_present_flag)である場合のみスライスセグメントヘッダに含まれる。SPSで1以上の長期参照ピクチャを復号済である場合(num_long_term_ref_pics_sps>0)、SPSで復号済の長期参照ピクチャの中で対象ピクチャで参照され得る参照ピクチャの数(num_long_term_sps)がSH長期RP情報に含まれる。また、スライスセグメントヘッダで明示的に伝送される長期参照ピクチャ数(num_long_term_pics)がSH長期RP情報に含まれる。加えて、上記num_long_term_spsの数の長期参照ピクチャをSPSで伝送済の長期参照ピクチャの中から選択する情報(lt_idx_sps[i])がSH長期RP情報に含まれる。さらに、スライスセグメントヘッダに明示的に含める長期参照ピクチャの情報として、上記num_long_term_picsの数だけ、参照ピクチャのPOC(poc_lsb_lt [i])、および、対象ピクチャの参照ピクチャとして使用される可能性の有無(used_by_curr_pic_lt_flag[i])が含まれる。
(5.ILRP情報)
ILRP情報は、スライスセグメントヘッダを含むピクチャからレイヤ間予測で参照され得るレイヤ間参照ピクチャの情報を含む。
ILRP情報について、図10を参照して説明する。図10はスライス復号時に参照されるシンタックス表の一部であって、ILRP情報に相当する部分である。
ILRP情報は、レイヤ間予測可能フラグ(inter_layer_pred_enabled_flag)を含む。さらに、レイヤ間予測有効フラグが1であり(レイヤ間予測が有効であり)、かつ、対象ピクチャから参照可能な参照レイヤ数(NumDirectRefLayers[nuh_layer_id])が1より大きい場合、レイヤ間参照ピクチャ数を表すシンタックス(num_inter_layr_ref_pics_minus1)がILRP情報に含まれる。対象ピクチャにおけるレイヤ間参照ピクチャ数(NumActiveRefLayerPics)は“num_inter_layer_ref_pics_minus1 + 1”の値に設定される。加えて、各レイヤ間参照ピクチャの属するレイヤを示すレイヤ識別子(inter_layer_pred_layer_idc[i])がILRP情報に含まれる。
なお、ILRP情報に含まれる上記の各シンタックスは、自明である場合は省略されてもよい。例えば、1つのピクチャから参照可能なレイヤ間参照ピクチャ数が1枚に制限されている場合、レイヤ間参照ピクチャ数に係るシンタックスは不要である。
〔階層動画像復号装置〕
以下では、第1の実施形態に係る階層動画像復号装置1の構成について、図28〜図31、図29〜図30を参照して説明する。
(階層動画像復号装置の構成)
図4を用いて、階層動画像復号装置1の概略的構成を説明すると次のとおりである。図4は、階層動画像復号装置1の概略的構成を示した機能ブロック図である。階層動画像復号装置1は、階層動画像符号化装置2から供給される階層符号化データDATAを復号して、対象レイヤの復号画像POUT#Tを生成する。なお、以下では、対象レイヤは拡張レイヤであるとして説明する。そのため、対象レイヤは、参照レイヤに対する上位レイヤでもある。逆に、参照レイヤは、対象レイヤに対する下位レイヤでもある。
図4に示すように階層動画像復号装置1は、可変長復号部12、ピクチャ復号部13、復号ピクチャ管理部14を備える。
可変長復号部12は、対象レイヤ符号化データDATA#Tに含まれるバイナリから各種のシンタックス値を復号して出力する。
図28は、可変長復号部12の構成を例示した機能ブロック図である。図28に示すように、可変長復号部12は、NALユニットヘッダ復号部11、パラメータセット復号部121、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123を含んで構成される。
NALユニットヘッダ復号部11は、NALユニットヘッダを復号する。図14の(b)は、NALユニットヘッダの構成を示す図である。NALユニットヘッダ復号部11は、NALユニットヘッダから、NALユニットタイプ(nal_unit_type)、レイヤID(nuh_layer_id)、テンポラルID(nuh_temporal_id_plus1)などのNALユニットヘッダ情報を復号する。
テンポラルID(TemporalID, TID)は、nuh_temporal_id_plus1から以下の式により復号される。
TemporalID = nuh_temporal_id_plus1 - 1
なお、テンポラルIDに関しては、ビットストリームコンフォーマンスとして、以下のCF条件(T1)〜CF条件(T4)を満たす必要がある。
NALユニットタイプがIRAPピクチャの場合にはTemporalID=0とする・・・CF条件(T1)
NALユニットタイプがTSAピクチャもしくはSTSAの場合にはTemporalID=0としてはならない・・・CF条件(T2)
対象ピクチャがサブレイヤ非参照ピクチャの場合には、RPSには対象ピクチャのTemporalIDと同じTemporalIDを有するピクチャを参照ピクチャとして入れてはならない・・・CF条件(T3)
RPSには、対象ピクチャのTemporalIDよりも大きいTemporalIDを有するピクチャを参照ピクチャとして入れてはならない・・・CF条件(T4)
なお、ビットストリームコンフォーマンスとは、画像復号装置(ここでは本発明の実施形態に係る画像復号装置)が復号するビットストリームが満たす必要がある条件である。
パラメータセット復号部121、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123は、各々、パラメータセット(VPS、SPS、PPS)に含まれるシンタックス値、予測情報、および、変換係数に係るシンタックス値を復号する。
図30は、パラメータセット復号部121の構成を例示した機能ブロック図である。図30に示すようにパラメータセット復号部121は、レイヤ間サブレイヤアライメントフラグ復号部1211を含んで構成される。
パラメータセット復号部121は、対象レイヤが参照する可能性のある対象レイヤとは異なるレイヤを示す情報である依存レイヤ情報を復号する。
具体的には、対象レイヤiが、参照レイヤjに依存するか否かを示すレイヤ依存フラグdirect_dependent_flag[i][j]を復号し、依存レイヤリストRefLayers[][]と依存レイヤ数NumDirectRefLayers[]を導出する。依存レイヤリストRefLayers[][]は、レイヤIDのリストで表現される。依存レイヤリストRefLayers[ nuh_layer_id ][]は、nuh_layer_idで指定される対象レイヤが参照する、対照レイヤとは異なるレイヤのリストである。依存レイヤリストRefLayers[][]は、依存レイヤ識別子RefLayers[i][j]のセット(リスト)である。以下、RefLayersを単に依存レイヤ、と呼ぶこともある。また、各依存レイヤ識別子RefLayers[i][j]を復号することにより、依存レイヤリストRefLayers が復号される。
レイヤ依存情報復号部4011は、対象レイヤiが、参照レイヤjのレイヤ依存フラグdirect_dependent_flag[ i ][ j ]が1である場合に、以下の式により導出される。
if( direct_dependent_flag[ i ][ j ] )
RefLayerId[ i ][ NumDirectRefLayers[ i ]++ ] = j
なお、レイヤを示すインデックスiをレイヤIDに変換するテーブルlayer_id_in_nuh[]を用いて、
RefLayerId[ layer_id_in_nuh[i] ][ NumDirectRefLayers[ layer_id_in_nuh [i] ]++ ] = layer_id_in_nuh[j]
を用いても良い。direct_dependent_flag[ i ][ j ]が1である場合に、依存レイヤ数NumDirectRefLayers[]をインクリメントする。
全ての対象レイヤiが、参照レイヤjについて上記処理を行うことにより、依存レイヤリストRefLayers[][]と依存レイヤ数NumDirectRefLayers[]が導出される。 パラメータセット復号部121は、VPSからレイヤ依存タイプdirect_dependency_type[i][j]をさらに復号しても良い。
図29は、パラメータセット復号部121の復号する符号化データの構成を説明する図である。図中、SS1001に示すようにパラメータセット(ここではVPS)の符号化データは、レイヤ間サブレイヤアライメントフラグ(レイヤ間TIDアライメントフラグ、tid_alignment_flag)を含む。
パラメータセット復号部121は、パラメータセットからレイヤ間サブレイヤアライメントフラグ(tid_alignment_flag)を復号する。
レイヤ間サブレイヤアライメントフラグは、同じ表示時刻(アクセスユニット)に属する全てのレイヤのVCLNALユニットのピクチャが同じTemporalIDを有することを示す。すなわち、以下のCF条件(S1)をビットストリームコンフォーマンスとして要求する。
レイヤ間サブレイヤアライメントフラグが1の場合には、同じアクセスユニットの全てのVCLNALユニットは、同じ値のTemporalIDを有していなければならない・・・CF条件(S1)
なお、同様の判定をビットストリームコンフォーマンスとする場合にも可能である。例えば、以下のCF条件(S1´)なども可能である。
レイヤ間サブレイヤアライメントフラグが1の場合には、あるVCLNALユニットのTIDは、同じアクセスユニットの他のVCLNALユニットのTemporalIDと同じ値を有していなければならない・・・CF条件(S1´)
なお、同様のコンフォーマンス条件は、単一のレイヤだけをサポートするHEVC Main Profile規格にも存在するが、HEVC Main Profileは同じ表示時刻を有する複数のスライスが同じTemporalIDを持つことを定義しているだけであり、HEVC Main Profileの定義の外にある複数のレイヤの場合を定義したものではない。
なお、個別レイヤの間引き再生においては、同じ表示時刻を有する同じレイヤに属する全てのスライスは同じTemporalIDを持つ必要があるため、本発明の実施形態においても、以下のCF条件(S0)をビットストリームコンフォーマンスとして要求する。
同じレイヤIDを有する同じアクセスユニットの全てのVCLNALユニットは、同じ値のTIDを有していなければならない・・・CF条件(S0)
上記CF条件(S0)は、以下のように表現することもできる。
あるアクセスユニットのある符号化ピクチャに属する全てのVCLNALユニットは、同じTIDを有していなくてはならない。
符号化ピクチャとは、1つもしくは複数のスライスセグメントから構成されるピクチャである。そのため、「ある符号化ピクチャに属する全てのVCLNALユニットは、同じTIDを有する」、により、全てのスライスで同じTIDを有する制限を示すことになる。なお、上記符号化ピクチャの定義は、ある1つのレイヤのピクチャのことである。別のレイヤのピクチャは、別の符号化ピクチャとして扱われるため、CF条件(S0)の定義では、異なるレイヤのピクチャは、同じアクセスユニットであっても、異なる値のTIDを有することができる。
なお、単一レイヤ用の動画復号装置に対して、CF条件(S1)が要求されている場合、階層動画復号装置においては、その要求をCF条件(S0)に置き換える。
CF条件(S1)により、本実施形態の備えるNALユニットヘッダ復号部11は、レイヤ間サブレイヤアライメントフラグが1の場合には、同じ表示時刻(アクセスユニット)に属する全てのレイヤの符号化データから同じTemporalIDを復号する。
図31は、スライスセグメントヘッダ復号部122の構成を例示した機能ブロック図である。図31に示すようにスライスセグメントヘッダ復号部122は、RPS情報復号部1221、RPL情報復号部1222、実依存レイヤ復号部1223(レイヤ間参照ピクチャ情報復号部)、代替コロケート指示情報復号部1224を含んで構成される。
RPS情報復号部1221は、スライスセグメントヘッダからSH短期RPS情報、SH長期RP情報を復号する。
RPL情報復号部1222は、スライスセグメントヘッダから図11に示すSHリスト修正情報を復号する。
実依存レイヤ復号部1223は、依存レイヤリストRefLayersに属する依存レイヤから、復号対象ピクチャ(例えばスライスセグメントヘッダに対応するピクチャ)で実際に用いられる実依存レイヤ(レイヤ間参照ピクチャ、レイヤ間予測ピクチャ)の情報(実依存レイヤ情報、レイヤ間参照ピクチャ情報)を復号する。実依存レイヤも依存レイヤRefLayersと同様、レイヤIDのリストで表現される。実依存レイヤRefPicLayerIdは、実依存レイヤ識別子RefPicLayerId[i]のセット(リスト)である。以下、RefPicLayerIdを単に実依存レイヤ、と呼ぶこともある。 実依存レイヤ復号部1223は、対象スライスセグメントにおけるレイヤ間予測に関する実依存レイヤ情報として、実依存レイヤピクチャごとのレイヤ識別情報である参照ピクチャレイヤ識別子RefPicLayerId[]、実参照レイヤピクチャの中で実際にサンプル予測および動き予測で参照するレイヤ数を示す、実サンプル依存レイヤ数NumActiveSamplePredRefLayersおよび実動き依存レイヤ数NumActiveMotionPredRefLayers、そして、サンプル予測と動き予測それぞれの実依存レイヤ数に対応する依存レイヤの識別情報である、実サンプル依存レイヤ識別子ActiveSamplePredRefLayerId[]および実動き依存レイヤ識別子ActiveMotionPredRefLayerId[]を導出する。
代替コロケート指示情報復号部1224は、テンポラル動き予測に用いる参照ピクチャcolPicを特定するための情報を復号する。
ピクチャ復号部13は、可変長復号部12から復号された対象ピクチャに関するスライスセグメントヘッダ、予測情報、および、変換係数に係るシンタックス値と復号ピクチャ管理部14から入力される参照ピクチャリストに基づいて、対象ピクチャの復号ピクチャを復号する。復号ピクチャは復号ピクチャ管理部14に出力される。
なお、ピクチャ復号部13におけるインター予測による予測画像生成には、復号ピクチャ管理部14内のDPBに記録されている復号ピクチャであって、ピクチャ復号部13に入力される参照ピクチャリストに含まれるピクチャが参照ピクチャとして利用される。また、ピクチャ復号部13におけるレイヤ間画像予測による予測画像生成には、復号ピクチャ管理部14内のDPBに記録されているレイヤ間参照ピクチャであって、上述の参照ピクチャリストに含まれるピクチャが参照ピクチャとして利用される。
復号ピクチャ管理部14は、入力される復号ピクチャや参照レイヤピクチャを内部のDPBに記録するとともに、入力されるシンタックス値に基づいて参照ピクチャリスト生成や出力ピクチャ決定を行う。
復号ピクチャ管理部14は、復号されたSH短期RPS情報、SH長期RP情報に基づいて、CF条件(T4)を満たす同じレイヤの復号対象ピクチャ、もしくは、実依存レイヤ復号部1223で復号されたILRP情報(実依存レイヤもしくは実サンプル依存レイヤ)に基づいて復号対象ピクチャとは異なるレイヤのピクチャである参照レイヤピクチャを含むように、参照ピクチャセット(RPS)および参照ピクチャリストを導出する。
本実施形態の備える復号ピクチャ管理部14は、レイヤ間サブレイヤアライメントフラグが1の場合には、CF条件(S1)により、復号対象ピクチャと同じTemporalIDのピクチャを、対象ピクチャと異なるレイヤから参照し、参照ピクチャに設定する。
本実施形態の備える復号ピクチャ管理部14は、CF条件(T4)により、復号対象ピクチャと同じレイヤの復号対象ピクチャのTemporalID以下のTemporalIDを有するピクチャを参照ピクチャに設定する。
なお、復号ピクチャ管理部14は、復号対象ピクチャのTemporalIDに基づいてCF条件(S1)およびCF条件(T4)に対応する処理を行う必要はなく、符号化データが、復号ピクチャ管理部14を満たしていれば自動的に、上記処理を行うことができる。
復号ピクチャ管理部14の詳細について後述する。
生成される参照ピクチャセットがCF条件(S1)(T4)を満たすことによって、本実施形態の画像復号装置が復号対象とする符号化データを再生する場合においては、レイヤによらず、間引き再生が可能となる。
ピクチャの復号においては、復号対象となるピクチャのほか、復号対象ピクチャが参照するピクチャも復号しておく必要があるが、復号対象と同じレイヤの参照ピクチャに関しては、再生すべきTIDA以下のサブレイヤのピクチャは、それより上のサブレイヤのピクチャを参照することがないため、再生対象ではないTIDAより上のサブレイヤのピクチャを復号する必要がない。復号対象と異なるレイヤの参照ピクチャについても、レイヤ間サブレイヤアライメントがなされている場合には、レイヤ間参照ピクチャは、復号対象と同じTIDを有することから、レイヤ間参照ピクチャは、それより上のサブレイヤのピクチャを参照することがないため、再生対象ではないTIDAより上のサブレイヤのピクチャを復号する必要がない。この関係が全てのピクチャ、レイヤで成り立つため、結果として、全てのレイヤにおいて、同じサブレイヤ再生が可能となる。
上記構成の階層動画像復号装置1によれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部11と、パラメータセットから少なくともレイヤ間サブレイヤアライメントフラグを復号するパラメータセット復号部121と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、前記NALユニットヘッダ復号部は、レイヤ間サブレイヤアライメントフラグが1の場合には、同じ表示時刻(アクセスユニット)に属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号することを特徴とする。
上記構成の階層動画像復号装置1によれば、同じ表示時刻に属する全てのレイヤのTIDが共通であることが示されている場合(レイヤ間サブレイヤアライメントフラグが1の場合)には、あるレイヤで可能であった時間的な間引き再生が、別のレイヤで可能である。そのため、間引き再生を変化させずに、あるレイヤ(例えば低解像度のレイヤ)から別のレイヤ(例えば、高解像度のレイヤ)に再生を変えることや、複数の視点(例えば、視点画像0であるレイヤ0と視点画像0であるレイヤ1)のピクチャを同時に同じ間引き再生を用いて、再生することができるという効果を奏する。
(階層動画像復号装置S1´)
以下では、第1の実施形態に係る階層動画像復号装置1の変形例である階層動画像復号装置S1´について説明する。本例は、階層動画像復号装置1S1´と同様、フラグによらずに、レイヤ間TIDアライメントが行われている場合を扱う。
本変形例の復号装置が復号する符号化データのコンフォーマンス要求は以下の通りである。 本変形例の階層動画像復号装置S1´が復号する符号化データは、レイヤ間サブレイヤアライメントフラグによらず、CF条件(S1)を要求する。
上記構成の階層動画像復号装置1S1´によれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、前記NALユニットヘッダ復号部は、同じ表示時刻(アクセスユニット)に属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号することを特徴とする。
上記の構成の画像復号装置によれば、あるレイヤで可能であった時間的な間引き再生が、別のレイヤで可能である。そのため、間引き再生を変化させずに、あるレイヤ(例えば低解像度のレイヤ)から別のレイヤ(例えば、高解像度のレイヤ)に再生を変えることや、複数の視点(例えば、視点画像0であるレイヤ0と視点画像0であるレイヤ1)のピクチャを同時に同じ間引き再生を用いて、再生することができるという効果を奏する。
階層動画像復号装置1S1´では、レイヤ間サブレイヤアライメントフラグ(レイヤ間TIDアライメントフラグ)を用いないため、レイヤ間でサブレイヤを非同期するユースケースをサポートしないが、レイヤ間サブレイヤアライメントがなされていることを前提とした機能であるユースケース(U1)を全ての符号化データに対してサポートすることができる。また、階層動画像復号装置と送信側で、パラメータセットをやり取りし、レイヤ間サブレイヤアライメントフラグを確認(ネゴシエーション)することなく、レイヤ間サブレイヤアライメントがなされていることを知ることができるため、ネゴシエーションの手間を省略できる。
(階層動画像復号装置S1´´)
以下では、第1の実施形態に係る階層動画像復号装置1の変形例である階層動画像復号装置1S1´´について説明する。
本変形例の復号装置が復号する符号化データが、ステレオ画像のプロファイルを有する符号化データである場合には、CF条件(S1)を要求する。
この条件は、階層動画像復号装置S1´と同様に、レイヤ間サブレイヤアライメントフラグを用いない条件とすることもできるが、以下のようにレイヤ間サブレイヤアライメントフラグを用いた上で、その値をプロファイルに応じて制限することによっても実現できる。
本変形例の復号装置が復号する符号化データは、レイヤ間サブレイヤアライメントフラグ(レイヤ間TIDアライメントフラグ)が1の場合に、CF条件(S1)を要求する。
本変形例の復号装置が復号する符号化データが、ステレオ画像のプロファイルを有する符号化データである場合には、レイヤ間サブレイヤアライメントフラグ(レイヤ間TIDアライメントフラグ)が1であることを要求する。
階層動画像復号装置1S1´´は、可変長復号部12S1´´、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12S1´´は、NALユニットヘッダ復号部11S2´、パラメータセット復号部121、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。
NALユニットヘッダ復号部11S1´´は、ステレオ画像のプロファイルを有する符号化データである場合には、同じ表示時刻に属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号する。
パラメータセット復号部121は、少なくともプロファイルを復号する。プロファイルは、VPSもしくはSPSから、general_profile_idcもしくはgeneral_profile_compatibility_flag[]を復号することで得られる。
上記構成の階層動画像復号装置1S1´´によれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、パラメータセットから少なくともプロファイルを復号するパラメータセット復号部と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、前記NALユニットヘッダ復号部は、プロファイルが、ステレオ画像である場合には、同じ表示時刻に属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号することを特徴とする。
上記の構成の画像復号装置によれば、プロファイルがステレオ画像である場合には、複数の視点(例えば、視点画像0であるレイヤ0と視点画像0であるレイヤ1)のピクチャを同時に同じ間引き再生を用いて、再生することができるという効果を奏する。
つまり、プロファイルがステレオ画像を示す全ての符号化データの場合に、レイヤ間サブレイヤアライメントがなされていることを前提としたユースケース(U1)をサポートする。
なお、上記条件では、ステレオ画像を示すプロファイルである、ステレオプロファイルではなく、多視点画像を示すプロファイルであるマルチビュープロファイルや、多視点にデプスを追加したマルチビュープラスデプスプロファイルに適用しても良い。
(階層動画像復号装置1S2)
以上説明した階層動画像復号装置1、階層動画像復号装置1S1´、階層動画像復号装置1S1´´では、レイヤ間の間引き再生の同期を実現するため、もしくは、レイヤ間の間引き再生を行わない代わりに高い符号化効率を得る復号装置である。これらは、図18から図20を用いて説明したレイヤ間TIDアライメントに関する。なお、間引き再生を行う場合には、低いサブレイヤから高いサブレイヤに移行することも同様に重要である。これらは、図21〜図24を用いて説明したレイヤ間サブレイヤピクチャアライメントに関する。
以下、第1の実施形態に係る階層動画像復号装置1の変形例である階層動画像復号装置1S2として、レイヤ間サブレイヤピクチャアライメントを示すレイヤ間サブレイヤアライメントフラグ(レイヤ間サブレイヤアクセスピクチャ同期フラグ)を用いる例を説明する。レイヤ間サブレイヤアライメントフラグは、TSAピクチャおよびSTSAピクチャに関するレイヤ間サブレイヤピクチャアライメントを行うフラグであるが、同時に、レイヤ間でTIDを同期するフラグを兼ねても良い。
本変形例の復号装置が復号する符号化データのコンフォーマンス要求は以下の通りである。
本変形例の復号装置が復号する符号化データは、レイヤ間サブレイヤアライメントフラグ(レイヤ間サブレイヤアクセスピクチャ同期フラグ)が1の場合に、CF条件(S1)を要求する。
本変形例の復号装置が復号する符号化データは、レイヤ間サブレイヤアライメントフラグが1の場合に、以下のCF条件(S2)CF条件(S3)を要求する。
但し、CF条件(S2)CF条件(S3)の代わりにCF条件(S4)でも良い。
本変形例の復号装置が復号する符号化データは、レイヤ間サブレイヤアライメントフラグが1の場合に、CF条件(S4)を要求する。
本変形例における、レイヤ間サブレイヤアライメントフラグは、あるレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じ表示時刻に属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダであることを示す。すなわち、CF条件(S1)に加えて、以下のCF条件(S2)とCF条件(S3)をビットストリームコンフォーマンスとして要求する。
あるアクセスユニットに属するピクチャのNALユニットタイプがTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤのピクチャのNALユニットのNALユニットタイプはTSAピクチャでなければならない・・・CF条件(S2)
あるアクセスユニットに属するピクチャのNALユニットタイプがSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤのピクチャのNALユニットのNALユニットタイプはSTSAピクチャでなければならない・・・CF条件(S3)
CF条件(S2)、CF条件(S3)は、図21、図22に対応する。
なお、本変形例における、レイヤ間サブレイヤアライメントフラグは、CF条件(S2)(S3)よりも、緩いレイヤ間アライメントでも良い。つまり、図24に対応するセミアライメント条件の場合でも良い。
この場合、CF条件(S2)、CF条件(S3)の代わりに、以下のCF条件(S4)をビットストリームコンフォーマンスとして要求する。
あるアクセスユニットに属するピクチャのNALユニットタイプがTSAピクチャもしくはSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤのピクチャのNALユニットのNALユニットタイプもTSAピクチャもしくはSTSAピクチャでなければならない・・・CF条件(S4)
また、セミアライメント条件は、CF条件(S4)の代わりに、ベースレイヤを基準とする次のCF条件(S4´)等でも良い。
アクセスユニットに属するベースレイヤピクチャ(NALユニットIDが0のピクチャ)のNALユニットタイプがTSAピクチャもしくはSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤのピクチャのNALユニットのNALユニットタイプもTSAピクチャもしくはSTSAピクチャでなければならない・・・CF条件(S4´)
なお、上記では、CF条件(S2)かつCF条件(S3)を条件としていたが、より緩いレイヤ間アライメントとして、CF条件(S2)とCF条件(S3)のどちらか一方を要求しても良い。CF条件(S2)のみを条件とする場合には、TSAピクチャのレイヤ間アライメントが行われているため、間引き再生から間引き再生のない(もしくは殆どない)状態に遷移が可能という効果を奏する。CF条件(S3)のみを条件とする場合には、比較的挿入が容易なSTSAピクチャのレイヤ間アライメントに限定されるため、間引き再生状態の遷移が可能であるという効果を保ちながら、レイヤ間アライメントともない符号化効率低下が小さいという効果を奏する。
また、レイヤ間サブレイヤアライメントフラグを0か1かの2択のフラグではなく、3択を示すフラグとしても良い。この場合のフラグをレイヤ間サブレイヤアライメント識別子inter_layer_sublayer_alignment_idxと呼び。1つの値は、レイヤ間アライメントを要求しない。ほかの1つの場合に、緩いレイヤ間アライメントを要求するように割り当て、ほかの1つの場合に、強いレイヤ間アライメントを要求するように割り当てることが望ましい。例えば、1つを緩いアライメントであるCF条件(S4)、ほかを強いアライメントであるCF条件(S2)+CF条件(S3)としても良い。
inter_layer_sublayer_alignment_idx=0:TSA、STSAのレイヤ間アライメントを要求しない(TSA、STSAのアライメントが行われていても良い)
inter_layer_sublayer_alignment_idx=1:CF条件(S4)
inter_layer_sublayer_alignment_idx=2:CF条件(S2)+CF条件(S3)
また、CF条件(S2)とCF条件(S3)を区別可能なように、1つの値の場合にCF条件(S2)を要求し、別の1つの値の場合にCF条件(S3)を要求しても良い。例えば、レイヤ間サブレイヤアライメント識別子inter_layer_sublayer_alignment_idxの1つの値は、レイヤ間アライメントを要求しないことを示し。他の1つの値は緩いアライメントであるCF条件(S2)もしくはCF条件(S3)を示し、他の値を強いアライメントであるCF条件(S2)+CF条件(S3)としても良い。
inter_layer_sublayer_alignment_idx=0:TSA、STSAのレイヤ間アライメントを要求しない(TSA、STSAのアライメントが行われていても良い)
inter_layer_sublayer_alignment_idx=1:CF条件(S2)
inter_layer_sublayer_alignment_idx=2:CF条件(S3)
inter_layer_sublayer_alignment_idx=3:CF条件(S2)+CF条件(S3)
他の構成として、例えば、レイヤ間サブレイヤアライメント識別子inter_layer_sublayer_alignment_idxの1つの値は、レイヤ間アライメントを要求しないことを示し。他の値を緩いアライメントであるCF条件(S4)およびCF条件(S2)およびCF条件(S3)とし、ほかの1つの値を強いアライメントであるCF条件(S2)+CF条件(S3)を示すようにしても良い。
inter_layer_sublayer_alignment_idx=0:TSA、STSAのレイヤ間アライメントを要求しない(TSA、STSAのアライメントが行われていても良い)
inter_layer_sublayer_alignment_idx=1:CF条件(S4)
inter_layer_sublayer_alignment_idx=2:CF条件(S1)
inter_layer_sublayer_alignment_idx=3:CF条件(S2)
inter_layer_sublayer_alignment_idx=4:CF条件(S2)+CF条件(S3)
また、緩いレイヤ間アライメントとしては、必ずしも、CF条件(S4)、CF条件(S2)、CF条件(S3)の3つを区別する必要はなくCF条件(S4)を含む以下の構成でも良い。
inter_layer_sublayer_alignment_idx=0:TSA、STSAのレイヤ間アライメントを要求しない(TSA、STSAのアライメントが行われていても良い)
inter_layer_sublayer_alignment_idx=1:CF条件(S4)
inter_layer_sublayer_alignment_idx=2:CF条件(S2)
inter_layer_sublayer_alignment_idx=3:CF条件(S2)+CF条件(S3)
<VPSにおける符号化>
図48は、レイヤ間サブレイヤアライメントフラグ(図ではinter_layer_sublayer_alignment_idx)を全レイヤ共通の1つのフラグとして、符号化データのVPSに含める構成を示す。VPSは、全てのレイヤに共通のパラメータを指定するパラメータセットであるため、VPSで、レイヤ間サブレイヤアライメントフラグを符号化する構成によれば、全てのレイヤに対してレイヤ間アライメントを強制することができる効果を奏する。また、個別のレイヤでフラグを符号化する構成に比べて、全てのレイヤで1つのフラグを共有するため、符号量が低減できる効果を奏する。
なお、VPSで符号化する場合においても、個々のレイヤ毎に、レイヤ間サブレイヤアライメントフラグを含める構成も可能である。例えば、ベースレイヤを除くレイヤ(例えば、1からレイヤ数−1までのインデックスiで識別されるレイヤ)について、レイヤ間サブレイヤアライメントフラグinter_layer_sublayer_alignment_idx[i]を含めることもできる。個別のレイヤのレイヤ間アライメントを示すフラグを符号化する場合には、どのレイヤとアライメントしているか(どのレイヤのピクチャがTSAもしくはSTSAピクチャであれば、同じアクセスユニットに属する対象とするレイヤもTSAもしくはSTSAピクチャであるか)を示す参照レイヤを識別する情報(例えば、参照レイヤのレイヤIDを含める構成でも良い。レイヤ間サブレイヤアライメントフラグinter_layer_sublayer_alignment_idx[i]毎に、アライメント対象となる参照レイヤinter_layer_sublayer_alignment_pic_idx[i]を含める構成とすれば自由度が高い構成が可能である。自由度の高い指定、例えば、レイヤ1、レイヤ3、レイヤ5だけをアライメントするような指定が行うことができる。
なお、アライメント対象となる参照レイヤのレイヤIDを符号化せず、かならずレイヤID0つまり、ベースレイヤとアライメントすることにしても良い。参照レイヤのレイヤIDを符号化する場合には、参照レイヤのレイヤIDを符号化しない場合には、自由度は低いが、レイヤ間アライメントの基準となるレイヤが明確であるので、基準となるレイヤであるベースレイヤのピクチャがTSAもしくはSTSAピクチャであるかを判定することで、レイヤ間アライメントがなされているほかのレイヤでもTSAもしくはSTSAピクチャであり、同じピクチャでサブレイヤの遷移が行えることが容易にわかる。なお、基準となるレイヤを、依存レイヤの内で最小インデックスとなるレイヤとしても良い。
<SPS・VUIにおける符号化>
図49は、レイヤ間サブレイヤアライメントフラグ(図ではinter_layer_sublayer_alignment_flag)を符号化データのSPS(VUI)に含める場合の例である。SPSは基本的には個々のレイヤ毎に符号化されるパラメータである。そのためSPS(VUI)で含めることによって、個々のレイヤで異なるレイヤ間アライメント状態を示すことができる。なお、1つのSPSパラメータを複数のレイヤで共有することも可能である。VUIはSPS内のパラメータであり、VUIが存在するというフラグvui_parameters_present_flagが1の場合に符号化される。また、VUIではビットストリームに制約を課すか否かのフラグbitstream_restriction_flagが1の場合にレイヤ間サブレイヤアライメントフラグ(図ではinter_layer_sublayer_alignment_flag)を含む。個別のレイヤでフラグを符号化することが可能なSPS(VUI)で符号化する場合には、あるレイヤはレイヤ間アライメントがされており、ほかのレイヤではレイヤ間アライメントがなされていない状態を明示的に識別することができるという効果を奏する。また、SPSはVPSよりも高い周期で切り替えることが可能であるから、ある区間でレイヤ間アライメントを行い、ほかの区間ではレイヤ間アライメントを行わないような指定がより容易に行えるという効果を奏する。また、VUIにはビットストリームに対する制約を集めたパラメータを含めているため、ほかのビットストリーム制約のパラメータと共通の場所で符号化できるという効果を奏する。なお、SPS(VUI)に含める場合にも、アライメント対象となる参照レイヤinter_layer_sublayer_alignment_pic_idx[i]を含める構成としても良いし、参照レイヤの情報を含めずにベースレイヤ(もしくは依存レイヤの内で最小インデックスとなるレイヤ)とアライメントする構成としても良い。
階層動画像復号装置1S2は、可変長復号部12S2、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12S2は、NALユニットヘッダ復号部11S2、パラメータセット復号部121、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。
NALユニットヘッダ復号部11S2は、レイヤ間サブレイヤアライメントフラグが1の場合に、あるレイヤのNALユニットタイプがTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにTSAピクチャの値を設定する。
また、NALユニットヘッダ復号部11S2は、レイヤ間サブレイヤアライメントフラグが1の場合に、あるレイヤのNALユニットタイプがSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにSTSAピクチャの値を設定する。
なお、CF条件(S2)(S3)の代わりに、CF条件(S4)を用いる場合には、以下の構成でも良い。
NALユニットヘッダ復号部11S2は、レイヤ間サブレイヤアライメントフラグが1の場合に、あるレイヤのNALユニットタイプがTSAピクチャもしくはSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにTSAピクチャもしくはSTSAピクチャの値を設定する。
なお、CF条件(S2)(S3)およびCF条件(S4)の代わりに、CF条件(S2)のみおよびCF条件(S3)のみを要求しても良い。例えばCF条件(S2)のみの場合には、 NALユニットヘッダ復号部11S2は、レイヤ間サブレイヤアライメントフラグが1の場合に、あるレイヤのNALユニットタイプがTSAピクチャピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにTSAピクチャピクチャの値を設定する。
また、さらに、既に説明したように、レイヤ間サブレイヤアライメントフラグinter_layer_sublayer_alignment_idxとして3選択以上のフラグを用いても良い。例えば、一つの構成では、
NALユニットヘッダ復号部11S2は、レイヤ間サブレイヤアライメントフラグが1の場合に、CF条件(S4)により、あるレイヤのNALユニットタイプがTSAピクチャピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにTSAピクチャピクチャの値を設定する。
また、NALユニットヘッダ復号部11S2は、レイヤ間サブレイヤアライメントフラグが2の場合に、CF条件(S2)により、あるレイヤのNALユニットタイプがTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにTSAピクチャの値を設定する。
また、NALユニットヘッダ復号部11S2は、レイヤ間サブレイヤアライメントフラグが3の場合に、CF条件(S3)により、あるレイヤのNALユニットタイプがSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにSTSAピクチャの値を設定する。
また、NALユニットヘッダ復号部11S2は、レイヤ間サブレイヤアライメントフラグが4の場合に、CF条件(S2)+CF(3)により、あるレイヤのNALユニットタイプがTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにTSAピクチャの値を設定し、あるレイヤのNALユニットタイプがSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにSTSAピクチャの値を設定する。
上記構成の階層動画像復号装置1S2によれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、パラメータセットから少なくともレイヤ間サブレイヤアライメントフラグを復号するパラメータセット復号部と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、前記NALユニットヘッダ復号部は、レイヤ間サブレイヤアライメントフラグが1の場合には、あるレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを復号することを特徴とする。
上記の構成の画像復号装置によれば、同じアクセスユニットに属する全てのレイヤのTIDが共通であることが示されている場合には、あるレイヤがTSAピクチャ(もしくはSTSAピクチャ)である場合には、他のレイヤもTSAピクチャ(もしくはSTSAピクチャ)である。そのため、どのレイヤにおいても、同じタイミングであるサブレイヤから、より上位のサブライヤに移行することができる(間引き再生中から非間引き再生に移行するなど間引きの粒度を下げることができる)という効果を奏する。
上記の構成の画像復号装置によれば、レイヤ間サブレイヤアライメントフラグを1とすることにより、ユースケース(U1)とユースケース(U2)をサポートすることができる。また、上記の構成の画像復号装置は、コンフォーマンス条件を、レイヤ間サブレイヤアライメントフラグ依存としているため、レイヤ間サブレイヤアライメントフラグを0とすることにより、ユースケース(U3)とユースケース(U4)もサポートすることができる。
(階層動画像復号装置1S2´)
以下では、第1の実施形態に係る階層動画像復号装置1の変形例である階層動画像復号装置1S2´について、図1〜図16を参照して説明する。本例は、階層動画像復号装置1S1´と同様、フラグによらずに、レイヤ間TIDアライメントが行われている場合を扱う。
本変形例の復号装置が復号する符号化データのコンフォーマンス要求は以下の通りである。
本変形例の復号装置が復号する符号化データは、レイヤ間サブレイヤアライメントフラグによらず、CF条件(S1)を要求する。
本変形例の復号装置が復号する符号化データは、レイヤ間サブレイヤアライメントフラグが1の場合には、CF条件(S2)、CF条件(S3)を要求する。
但し、CF条件(S2)CF条件(S3)の代わりにCF条件(S4)でも良い。
本変形例の復号装置が復号する符号化データは、レイヤ間サブレイヤアライメントフラグが1の場合に、CF条件(S4)を要求する。
階層動画像復号装置1S2´は、可変長復号部12S2´、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12S2´は、NALユニットヘッダ復号部11S2´、パラメータセット復号部121、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。
NALユニットヘッダ復号部11S2´は、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号する。
NALユニットヘッダ復号部11S2´は、レイヤ間サブレイヤアライメントフラグが1の場合に、あるレイヤのNALユニットタイプがTSAピクチャもしくはSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにTSAピクチャもしくはSTSAピクチャの値を設定する。
パラメータセット復号部121は、パラメータセットからレイヤ間サブレイヤアライメントフラグを復号する。
上記構成の階層動画像復号装置1S2´によれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、パラメータセットから少なくともレイヤ間サブレイヤアライメントフラグを復号するパラメータセット復号部と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、前記NALユニットヘッダ復号部は、レイヤ間サブレイヤアライメントフラグが1の場合には、あるレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを復号することを特徴とする。
上記の構成の画像復号装置によれば、あるレイヤがTSAピクチャ(もしくはSTSAピクチャ)である場合には、他のレイヤもTSAピクチャ(もしくはSTSAピクチャ)である。そのため、どのレイヤにおいても、同じタイミングであるサブレイヤから、より上位のサブライヤに移行することができる(間引き再生中から非間引き再生に移行するなど間引きの粒度を下げることができる)という効果を奏する。
上記の構成の画像復号装置によれば、全ての符号化データに対してユースケース(U1)とユースケース(U2)をサポートすることができる。
(階層動画像復号装置1S2´´)
以下では、第1の実施形態に係る階層動画像復号装置1S2の変形例である階層動画像復号装置1S2´´について説明する。一般に、ステレオ画像符号化では、同じアクセスユニットの複数のレイヤのピクチャを復号し再生する。間引き再生においても、複数のレイヤのピクチャが同時に再生できた方が好ましい。従って、特に、ステレオ画像を示すプロファイルの場合には、レイヤ間サブレイヤアライメントを行うことをビットストリームコンフォーマンスとして要求する。
本変形例の復号装置が復号する符号化データが、ステレオ画像のプロファイルを有する符号化データである場合には、CF条件(S1)を要求する。
本変形例の復号装置が復号する符号化データが、ステレオ画像のプロファイルを有する符号化データである場合には、CF条件(S2)(S3)もしくはCF条件(S4)を要求する。
この条件は、以下のようにレイヤ間サブレイヤアライメントフラグを用いた条件としても同値である。
本変形例の復号装置が復号する符号化データは、レイヤ間サブレイヤアライメントフラグが1の場合に、CF条件(S1)を要求する。
本変形例の復号装置が復号する符号化データは、レイヤ間サブレイヤアライメントフラグが1の場合に、CF条件(S2)(S3)もしくはCF条件(S4)を要求する。
本変形例の復号装置が復号する符号化データが、ステレオ画像のプロファイルを有する符号化データである場合には、レイヤ間サブレイヤアライメントフラグが1であることを要求する。
階層動画像復号装置1S2´´は、可変長復号部12S2´´、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12S2´´は、NALユニットヘッダ復号部11S2´、パラメータセット復号部121、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。
NALユニットヘッダ復号部11S2´´は、プロファイルがステレオプロファイルを示す場合に、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号する。
NALユニットヘッダ復号部11S2´´は、プロファイルがステレオプロファイルを示す場合に、あるレイヤのNALユニットタイプがTSAピクチャもしくはSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにTSAピクチャもしくはSTSAピクチャの値を設定する。
パラメータセット復号部121は、パラメータセットから少なくともプロファイルを復号する。プロファイルは、VPSもしくはSPSから、general_profile_idcもしくはgeneral_profile_compatibility_flag[]を復号することで得られる。
NALユニットヘッダ復号部11S2´´は、パラメータセット復号部121が復号したプロファイルがステレオ画像を示す場合に、アクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号する。
NALユニットヘッダ復号部11S2´´は、パラメータセット復号部121が復号したプロファイルがステレオ画像を示す場合に、あるレイヤのNALユニットタイプがTSAピクチャもしくはSTSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データにTSAピクチャもしくはSTSAピクチャの値を設定する。
上記構成の階層動画像復号装置1S2´´によれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、パラメータセットから少なくともプロファイルを復号するパラメータセット復号部と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、前記NALユニットヘッダ復号部は、プロファイルがステレオ画像を示す場合には、あるレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを復号することを特徴とする。
上記の構成の画像復号装置によれば、ステレオ画像の再生において、あるレイヤがTSAピクチャ(もしくはSTSAピクチャ)である場合には、他のレイヤもTSAピクチャ(もしくはSTSAピクチャ)である。そのため、どのレイヤにおいても、同じタイミングであるサブレイヤから、より上位のサブライヤに移行することができる(間引き再生中から非間引き再生に移行するなど間引きの粒度を下げることができる)という効果を奏する。
つまり、プロファイルがステレオ画像を示す符号化データの場合に、レイヤ間サブレイヤアライメントがなされていることを前提としたユースケース(U1)とユースケース(U2)をサポートすることができる。
なお、上記条件では、ステレオ画像を示すプロファイルである、ステレオプロファイルではなく、多視点画像を示すプロファイルであるマルチビュープロファイルや、多視点に奥行き情報(デプス)を追加したマルチビュープラスデプスプロファイルに適用しても良い。
(第2の実施形態)
以下では、第2の実施形態に係る階層動画像復号装置の構成について、図34〜図A8を参照して説明する。第2の実施形態に係る階層動画像復号装置は、全てのレイヤが同じレイヤ間予測最大TIDを用いる場合を示すフラグを有する、もしくは、全てのレイヤが同じレイヤ間予測最大TIDを用いる場合において、レイヤ毎に符号化されるレイヤ間予測最大TIDの冗長性を低減する。以下、第2の実施形態に係る階層動画像復号装置について、階層動画像復号装置1Aa、階層動画像復号装置1Ab、階層動画像復号装置1Acを順に説明する。
(階層動画像復号装置1Aa)
以下、第2の実施形態に係る階層動画像復号装置として、階層動画像復号装置1Aa、階層動画像復号装置1Ab、階層動画像復号装置1Acの3つの例を説明する。
階層動画像復号装置1Aaは、可変長復号部12Aa、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Aaは、NALユニットヘッダ復号部11、パラメータセット復号部121a、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。
図34は、パラメータセット復号部121aの構成を例示した機能ブロック図である。図34に示すようにパラメータセット復号部121aは、レイヤ間予測最大TIDアライメントフラグ復号部1212a、レイヤ間予測最大TID復号部1213aを含んで構成される。
図33は、パラメータセット復号部121aの復号する符号化データの構成を示すシンタックスデーブルである。図中、SA1001に示すように、パラメータセット(ここではVPS)の符号化データはレイヤ間予測最大TIDアライメントフラグ(max_tid_alignment_flag)を含む。また、SA1002に示すように、レイヤ間予測最大TIDアライメントフラグが1の場合には、符号化データは1つのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]を含む。SA1003に示すように、レイヤ間予測最大TIDアライメントフラグが1以外の場合には、符号化データはレイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]を含む。ここでiはレイヤIDを示す0から最大レイヤ数―2(vps_max_layers_minus1−1)までのインデックス。
なお、最大レイヤ数が2以下の場合には、レイヤ間予測最大TIDアライメントフラグmax_tid_alignment_flagを含まないようにすることが好ましい。すなわち、最大レイヤ数―1vps_max_layers_minus1が1以下の場合は、レイヤ間予測最大TIDアライメントフラグmax_tid_alignment_flagを含まず、vps_max_layers_minus1が1より大きい場合(2以上の場合)に、レイヤ間予測最大TIDアライメントフラグmax_tid_alignment_flagを含むことが望ましい。
パラメータセット復号部121aのレイヤ間予測最大TIDアライメントフラグ復号部1212a、パラメータセットからレイヤ間予測最大TIDアライメントフラグ(max_tid_alignment_flag)を復号する。パラメータセット復号部121aのレイヤ間予測最大TID復号部1213aは、レイヤ間予測最大TIDアライメントフラグが1の場合には、1つのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]を復号し、レイヤ間予測最大TIDアライメントフラグが1以外の場合には、レイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]を復号する。ここでiはレイヤIDを示す0から最大レイヤ数―1vps_max_layers_minus1までのインデックス。なお、最大レイヤ数が3以上の場合(最大レイヤ数―1vps_max_layers_minus1が1より大きい場合)に、レイヤ間予測最大TIDアライメントフラグ復号部1212aはレイヤ間予測最大TIDアライメントフラグmax_tid_alignment_flagを符号化データから復号する。レイヤ間予測最大TIDアライメントフラグmax_tid_alignment_flagを符号化データから復号しない場合には、レイヤ間予測最大TIDアライメントフラグ復号部1212aはmax_tid_alignment_flagに0もしくは1を設定する。
パラメータセット復号部121aは、レイヤ間予測最大TIDアライメントフラグが1の場合には、復号した1つのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]を共通レイヤ間予測最大TID(general_max_tid_il_ref_pics_plus1)に設定する。
general_max_tid_il_ref_pics_plus1 = max_tid_il_ref_pics_plus1[ 0 ]
パラメータセット復号部121aのレイヤ間予測最大TID復号部1213aは、共通レイヤ間予測最大TIDを、レイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]に設定する。
上記構成の階層動画像復号装置1Aa、また後述の階層動画像復号装置1Ab、階層動画像復号装置1Acによれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、パラメータセットから少なくともレイヤ間予測最大TIDを復号するパラメータセット復号部と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのレイヤ間予測最大TIDより小さいTIDを有するピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、パラメータセット復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合には、全てのレイヤに共通のレイヤ間予測最大TIDを割り当て、共通のレイヤ間予測最大TIDが用いられないと判定される場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする。
上記の構成の画像復号装置によれば、共通レイヤ間予測最大TIDが用いられる場合にはレイヤ毎にレイヤ間予測最大TIDの復号を行う必要がないため、冗長なフラグの復号を削減する効果を奏する。
上記構成の階層動画像復号装置1Aaによれば、上記パラメータセット復号部は、レイヤ間予測最大TIDアライメントフラグを復号し、レイヤ間予測最大TIDアライメントフラグが1の場合には、1つのレイヤ間予測最大TIDを復号し、全てのレイヤに復号した1つのレイヤ間予測最大TIDを割り当て、レイヤ間予測最大TIDアライメントフラグが0の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする。
(階層動画像復号装置1Ab)
以下、第2の実施形態に係る階層動画像復号装置の1構成として、階層動画像復号装置1Abを説明する。
階層動画像復号装置1Abは、可変長復号部12Ab、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Abは、NALユニットヘッダ復号部11、パラメータセット復号部121b、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。
図36は、パラメータセット復号部121bの構成を例示した機能ブロック図である。図36に示すようにパラメータセット復号部121bは、共通レイヤ間予測最大TID復号部1212b、レイヤ間予測最大TID復号部1213bを含んで構成される。
図35は、パラメータセット復号部121bの復号する符号化データの構成を説明する図である。図中、SA2001に示すように、パラメータセット(ここではVPS)の符号化データは共通レイヤ間予測最大TID(general_max_tid_il_ref_pics_plus1)を含む。また、SA2002に示すように、共通レイヤ間予測最大TIDgeneral_max_tid_il_ref_pics_plus1が所定の値以外の場合(ここでは7未満の場合)には、符号化データはレイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]を含まない(導出される)。SA2003に示すように、共通レイヤ間予測最大TIDが所定の値の場合(ここでは7の場合)には、符号化データはレイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]を含む。ここでiはレイヤIDを示す0から最大レイヤ数―2(vps_max_layers_minus1−1)までのインデックス。
なお、最大レイヤ数が3以上の場合(最大レイヤ数―1vps_max_layers_minus1が1より大きい場合)には、共通レイヤ間予測最大TIDgeneral_max_tid_il_ref_pics_plus1を符号化データから復号する。符号化データから復号しない場合には、general_max_tid_il_ref_pics_plus1として所定の値(ここでは7)を設定する。
パラメータセット復号部121bの共通レイヤ間予測最大TID復号部1212bは、パラメータセットから共通レイヤ間予測最大TIDgeneral_max_tid_il_ref_pics_plus1を復号する。
パラメータセット復号部121bのレイヤ間予測最大TID復号部1213bは、共通レイヤ間予測最大TIDgeneral_max_tid_il_ref_pics_plus1が制限しないことを示す所定の値(ここでは7)の場合には、レイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]を復号する。ここでiはレイヤIDを示す0から最大レイヤ数―2(vps_max_layers_minus1−1)までのインデックスである。
さらに、レイヤ間予測最大TID復号部1213bは、共通レイヤ間予測最大TIDが所定の値以外の場合には、SA2002に示すように、共通レイヤ間予測最大TIDを、レイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]に設定する。ここでiはレイヤIDを示す0から最大レイヤ数―2(vps_max_layers_minus1−1)までのインデックスである。
上記構成の階層動画像復号装置1Abによれば、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、パラメータセットから少なくともレイヤ間予測最大TIDを復号するパラメータセット復号部と、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのレイヤ間予測最大TIDより小さいTIDを有するピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、パラメータセット復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合には、全てのレイヤに共通のレイヤ間予測最大TIDを割り当て、共通のレイヤ間予測最大TIDが用いられないと判定される場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする。
上記の構成の画像復号装置によれば、共通レイヤ間予測最大TIDが所定の値の場合にはレイヤ毎にレイヤ間予測最大TIDの復号を行う必要がないため、冗長なフラグの復号を削減する効果を奏する。
パラメータセット復号部は、共通レイヤ間予測最大TIDを復号し、共通レイヤ間予測最大TIDが所定の値以外の場合には、全てのレイヤに復号した共通レイヤ間予測最大TIDを割り当て、共通レイヤ間予測最大TIDが所定の値の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする画像復号装置。
(階層動画像復号装置1Ac)
以下、第2の実施形態に係る階層動画像復号装置の1構成として、階層動画像復号装置1Acを説明する。
階層動画像復号装置1Acは、可変長復号部12Ac、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Acは、NALユニットヘッダ復号部11、パラメータセット復号部121c、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、NALユニットヘッダ復号部11、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。
図38は、パラメータセット復号部121cの構成を例示した機能ブロック図である。図38に示すようにパラメータセット復号部121cは、レイヤ間サブレイヤアライメントフラグ復号部1211、レイヤ間予測最大TID復号部1213cを含んで構成される。
図37は、パラメータセット復号部121cの復号する符号化データの構成を説明する図である。図中、SA3000、SA3001に示すように、パラメータセット(ここではVPS)の符号化データはレイヤ間サブレイヤアライメントフラグ(tid_alignment_flag)と、ベースレイヤのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]を含む。また、SA3002に示すように、レイヤ間サブレイヤアライメントフラグが1であり、なお且つ、ベースレイヤのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]が所定の値以外の場合(ここでは7未満の場合)には、符号化データはレイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]を含まない(導出される)。SA3003に示すように、レイヤ間サブレイヤアライメントフラグが0の場合、もしくは、ベースレイヤのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]が所定の値の場合(ここでは7の場合)には、符号化データはレイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]を含む。ここでiはレイヤIDを示す0から最大レイヤ数―2(vps_max_layers_minus1−1)までのインデックスである。
なお、第1の実施形態で説明したように、レイヤ間サブレイヤアライメントフラグの値にかかわらず、TIDのサブレイヤアライメントが行われる場合、すなわちCF条件(S1)が成り立つ場合には、レイヤ間サブレイヤアライメントフラグによらず、ベースレイヤのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]が所定の値以外の場合(ここでは7未満の場合)には、符号化データはレイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]を含まない(導出される)としても良い。
パラメータセット復号部121cのレイヤ間予測最大TID復号部1213cは、ベースレイヤのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]が所定の値以外の場合(ここでは7未満の場合)には、共通レイヤ間予測最大TIDgeneral_max_tid_il_ref_pics_plus1にベースレイヤのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]を設定する。そして、レイヤ間予測最大TID復号部1213cは、SA3002に示すように、共通レイヤ間予測最大TID(ベースレイヤのレイヤ間予測最大TID)を、レイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]に設定する。
パラメータセット復号部121cのレイヤ間予測最大TID復号部1213cは、ベースレイヤのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ 0 ]が所定の値の場合(ここでは7以上の場合)には、レイヤ毎のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ i ]を復号する。ここでiはレイヤIDを示す1から最大レイヤ数―2(vps_max_layers_minus1−1)までのインデックスである。
上記構成の階層動画像復号装置1A3によれば、上記パラメータセット復号部は、ベースレイヤのレイヤ間予測最大TIDが所定の値以外の場合には、全てのレイヤに、復号したベースレイヤのレイヤ間予測最大TIDを割り当て、レイヤ間サブレイヤアライメントフラグが0、又は、ベースレイヤのレイヤ間予測最大TIDが所定の値の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする。
なお、上記パラメータセット復号部は、レイヤ間サブレイヤアライメントフラグが1、かつ、ベースレイヤのレイヤ間予測最大TIDが所定の値以外の場合には、全てのレイヤに、復号したベースレイヤのレイヤ間予測最大TIDを割り当て、レイヤ間サブレイヤアライメントフラグが0、又は、ベースレイヤのレイヤ間予測最大TIDが所定の値の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とするように構成しても良い。
上記構成の階層動画像復号装置1Acによれば、ベースレイヤのレイヤ間予測最大TIDが所定の値以外の場合には、レイヤ毎にレイヤ間予測最大TIDの復号を行う必要がないため、冗長なフラグの復号を削減する効果を奏する。
(第3の実施形態)
以下では、第3の実施形態に係る階層動画像復号装置1Bの構成について、図40〜図46を参照して説明する。第3の実施形態に係る階層動画像復号装置1Bは、全てのレイヤが同じレイヤ間予測最大TIDを用いる場合において、スライスセグメントヘッダで符号化されるレイヤ間予測に関する情報の冗長性を低減する。以下、第3の実施形態に係る階層動画像復号装置1Bの構成として、階層動画像復号装置1Ba、階層動画像復号装置1Bb、階層動画像復号装置1Bcを順に説明する。
(階層動画像復号装置1Ba)
階層動画像復号装置1Baは、可変長復号部12Ba、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Baは、NALユニットヘッダ復号部11、パラメータセット復号部121a、スライスセグメントヘッダ復号部122a、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、NALユニットヘッダ復号部11、スライスセグメントヘッダ復号部122、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。なお、パラメータセット復号部は、第2の実施形態で説明したパラメータセット復号部を用いることができる。すなわち、パラメータセット復号部121aの代わりに、パラメータセット復号部121b、パラメータセット復号部121cを用いても良い。
図41は、スライスセグメントヘッダ復号部122aの構成を例示した機能ブロック図である。図41に示すようにスライスセグメントヘッダ復号部122aは、実依存レイヤ復号部1223として、レイヤ間予測可能フラグ復号部12231を含んで構成される。
図40は、スライスセグメントヘッダ復号部122aの復号する符号化データの構成を説明する図である。図中、SB1001に示すように、スライスセグメントヘッダの符号化データは、レイヤ間予測可能フラグ(inter_layer_pred_enabled_flag)を含む。SB1002に示すように、レイヤ間予測可能フラグ(inter_layer_pred_enabled_flag)が1の場合には、符号化データは、さらに、num_inter_layer_ref_pics_minus1と、inter_layer_pred_layer_idc[ i ]を含む。
スライスセグメントヘッダ復号部122aのレイヤ間予測可能フラグ復号部12231は、対象ピクチャのTemporalIDが、共通レイヤ間予測最大TID(general_max_tid_il_ref_pics_plus1から1を減算した値)以下の場合で、かつ、レイヤIDnuh_layer_idが0より大きく、かつ、依存レイヤNumDirectRefLayers[ nuh_layer_id ]が0より大きい場合に、符号化データからレイヤ間予測可能フラグを復号する。
レイヤ間予測可能フラグ復号部12231は、レイヤ間予測可能フラグが符号化データから復号されない場合には、レイヤ間予測可能フラグとして、レイヤ間予測を行わないことを示す0を導出する。つまり、対象ピクチャのTemporalIDが、共通レイヤ間予測最大TIDgeneral_max_tid_il_ref_pics_plus1以上の場合(general_max_tid_il_ref_pics_plus1から1を減算した値よりも大きい場合)には、符号化データからレイヤ間予測可能フラグを復号せずに、レイヤ間予測可能フラグとして0を設定する。
スライスセグメントヘッダ復号部122aは、レイヤ間予測が可能であるか否かを示すフラグであるレイヤ間予測可能フラグを復号するレイヤ間予測可能フラグ復号部を備え、
上記レイヤ間予測可能フラグ復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合で、TIDが、該共通レイヤ間予測最大TID未満の場合にのみ、上記レイヤ間予測可能フラグを復号し、それ以外の場合には、レイヤ間予測可能フラグを0に設定することを特徴とする。
上記構成の階層動画像復号装置1Baによれば、スライスセグメントヘッダ復号部122aを備えることにより、共通レイヤ間予測最大TIDで指示されるTIDよりも大きいTIDのピクチャの場合には、レイヤ間予測が制限されていることを利用して、レイヤ間予測可能フラグの復号を省略することにより、冗長なフラグの復号を削減する効果を奏する。
(階層動画像復号装置1Bb)
以下、第3の実施形態に係る階層動画像復号装置の1構成として、階層動画像復号装置1Bbを説明する。
階層動画像復号装置1Bbは、可変長復号部12Bb、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Bbは、NALユニットヘッダ復号部11、パラメータセット復号部121a、スライスセグメントヘッダ復号部122b、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、NALユニットヘッダ復号部11、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。なお、パラメータセット復号部は、第2の実施形態で説明したパラメータセット復号部121aを用いることができる。
図43は、スライスセグメントヘッダ復号部122bの構成を例示した機能ブロック図である。図43に示すようにスライスセグメントヘッダ復号部122bは、実依存レイヤ復号部1223として、レイヤ間予測限定フラグ復号部12232を含んで構成される。
図42は、スライスセグメントヘッダ復号部122bの復号する符号化データの構成を説明する図である。図中、SB2001に示すように、スライスセグメントヘッダの符号化データは、スライスがレイヤ間予測のみを用いるか否かを示すフラグであるレイヤ間予測限定フラグ(inter_layer_sample_pred_only_flag)を含む。
スライスセグメントヘッダ復号部122bのレイヤ間予測限定フラグ復号部12232は、対象ピクチャのTemporalIDが、共通レイヤ間予測最大TID(general_max_tid_il_ref_pics_plus1から1を減算した値)以下の場合で、かつ、依存レイヤNumSamplePredRefLayers[ nuh_layer_id ]が0より大きい場合に、符号化データからレイヤ間予測限定フラグを復号する。
レイヤ間予測限定フラグ復号部12232は、レイヤ間予測限定フラグが符号化データから復号されない場合には、レイヤ間予測限定フラグとして0を導出する。つまり、レイヤ間予測限定フラグ復号部12232は、対象ピクチャのTemporalIDが、共通レイヤ間予測最大TIDgeneral_max_tid_il_ref_pics_plus1以上の場合(general_max_tid_il_ref_pics_plus1から1を減算した値よりも大きい場合)には、符号化データからレイヤ間予測限定フラグを復号せずに、レイヤ間予測限定フラグとして0を設定する。
スライスセグメントヘッダ復号部122bは、レイヤ間予測のみを用いるか否かを示すフラグであるレイヤ間予測限定フラグを復号するレイヤ間予測限定フラグ復号部を備え、
上記レイヤ間予測限定フラグ復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合で、TIDが、該共通レイヤ間予測最大TID未満の場合にのみ、上記レイヤ間予測限定フラグを復号し、それ以外の場合には、レイヤ間予測限定フラグを0に設定することを特徴とする。
上記構成の階層動画像復号装置1Bbによれば、共通レイヤ間予測最大TIDで指示されるTIDよりも大きいTIDのピクチャの場合には、レイヤ間予測が制限されていることを利用して、レイヤ間予測限定フラグの復号を省略することにより、冗長なフラグの復号を削減する効果を奏する。
(階層動画像復号装置1Bc)
以下、第3の実施形態に係る階層動画像復号装置の1構成として、階層動画像復号装置1Bcを説明する。
階層動画像復号装置1Bcは、可変長復号部12Bc、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Bcは、NALユニットヘッダ復号部11、パラメータセット復号部121a、スライスセグメントヘッダ復号部122c、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、NALユニットヘッダ復号部11、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。なお、パラメータセット復号部は、第2の実施形態で説明したパラメータセット復号部121aを用いることができる。
図45は、スライスセグメントヘッダ復号部122cの構成を例示した機能ブロック図である。図45に示すようにスライスセグメントヘッダ復号部122cは、代替コロケート指示情報復号部1224を含んで構成される。
図44は、スライスセグメントヘッダ復号部122cの復号する符号化データの構成を説明する図である。図中、SB3001に示すように、スライスセグメントヘッダの符号化データは、代替コロケート指示フラグ(alt_collocated_indication_flag)を含む。
スライスセグメントヘッダ復号部122bの代替コロケート指示情報復号部1224は、対象ピクチャのTemporalIDが、共通レイヤ間予測最大TIDgeneral_max_tid_il_ref_pics_plus1から1を減算した値以下の場合で、かつ、レイヤIDnuh_layer_idが0より大きく、かつ、依存レイヤNumActiveMotionPredRefLayers[ nuh_layer_id ]が0より大きい場合に、符号化データから代替コロケート指示フラグを復号する。
代替コロケート指示情報復号部1224は、代替コロケート指示フラグが符号化データから復号されない場合には、代替コロケート指示フラグとして、テンポラル動き予測用の参照ピクチャをレイヤIDによって指定しないことを示す0を導出する。つまり、対象ピクチャのTemporalIDが、共通レイヤ間予測最大TIDgeneral_max_tid_il_ref_pics_plus1以上の場合(general_max_tid_il_ref_pics_plus1-1よりも大きい場合)には、符号化データから代替コロケート指示フラグを復号せずに、代替コロケート指示フラグとして0を設定する。
スライスセグメントヘッダ復号部122cは、テンポラル動き予測用の参照ピクチャを、レイヤIDによって指定するか否かを示すフラグである代替コロケート指示フラグを復号する代替コロケート指示情報復号部を備え、上記代替コロケート指示情報復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合で、TIDが、該共通レイヤ間予測最大TID未満の場合にのみ、上記代替コロケート指示フラグを復号し、それ以外の場合には、代替コロケート指示フラグを0に設定することを特徴とする。
上記構成の階層動画像復号装置1Bcによれば、共通レイヤ間予測最大TIDで指示されるTIDよりも大きいTIDのピクチャの場合には、レイヤ間予測が制限されていることを利用して、代替コロケート指示フラグの復号を省略することにより、冗長なフラグの復号を削減する効果を奏する。
(階層動画像復号装置1Babc)
以下、第3の実施形態に係る階層動画像復号装置の1構成として、階層動画像復号装置1Babcを説明する。階層動画像復号装置1Ba、階層動画像復号装置1Bb、階層動画像復号装置1Bcにおいて説明したレイヤ間予測可能フラグ復号部12231、レイヤ間予測限定フラグ復号部12232、代替コロケート指示情報復号部1224は組み合わせて用いることも可能である。ここでは、全てを組み合わせて利用した場合を例として説明する。
階層動画像復号装置1Babcは、可変長復号部12Babc、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Babcは、NALユニットヘッダ復号部11、パラメータセット復号部121a、スライスセグメントヘッダ復号部122abc、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、NALユニットヘッダ復号部11、スライスセグメントデータ復号部123は、階層動画像復号装置1で説明済みであるため説明は省略する。なお、パラメータセット復号部は、第2の実施形態で説明したパラメータセット復号部121aを用いることができる。
図46は、スライスセグメントヘッダ復号部122abcの構成を例示した機能ブロック図である。図46に示すようにスライスセグメントヘッダ復号部122abcは、実依存レイヤ復号部1223として、レイヤ間予測可能フラグ復号部12231、レイヤ間予測限定フラグ復号部12232、代替コロケート指示情報復号部1224を含んで構成される。
上記構成の階層動画像復号装置1Babcによれば、共通レイヤ間予測最大TIDで指示されるTIDよりも大きいTIDのピクチャの場合には、レイヤ間予測が制限されていることを利用して、レイヤ間予測可能フラグ、レイヤ間予測限定フラグ、代替コロケート指示フラグの復号を省略することにより、冗長なフラグの復号を削減する効果を奏する。
以下、第1の実施形態から第3の実施形態の共通部分についてより詳細に説明する。
(第4の実施形態)
以下では、第4の実施形態に係る階層動画像復号装置1Cの構成について、図50〜図64を参照して説明する。第4の実施形態に係る階層動画像復号装置1Cは、対象ピクチャにおいてレイヤ間予測に用いるピクチャであるレイヤ間参照ピクチャを依存レイヤのから選択する方法に関する。特に、レイヤ間参照ピクチャを依存レイヤのから選択する方法として、依存レイヤ毎に、その依存レイヤがレイヤ間参照ピクチャとして用いられるか否かを示す1ビットのフラグ(実レイヤ依存フラグ)を、対象ピクチャのTIDが、該依存レイヤのレイヤ間予測最大TID未満の場合にのみに復号することを特徴とする。すなわち、実依存レイヤを復号する場合に、対象ピクチャのTIDと、レイヤ間予測最大TIDに応じて、実レイヤ依存フラグを復号するかを否かを切り替える。以下、第4の実施形態に係る階層動画像復号装置1Cの構成として、階層動画像復号装置1Ca、階層動画像復号装置1Cb、階層動画像復号装置1Ccを順に説明する。
(階層動画像復号装置1Ca)
階層動画像復号装置1Caは、可変長復号部12Ca、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Caは、NALユニットヘッダ復号部11、パラメータセット復号部121Ca、スライスセグメントヘッダ復号部122Ca、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、NALユニットヘッダ復号部11は、階層動画像復号装置1で説明済みであるため説明は省略する。
パラメータセット復号部121Caは、レイヤ依存情報復号部4011aを含んで構成される。レイヤ依存情報復号部4011aは、対象レイヤが参照する可能性のある対象レイヤとは異なるレイヤを示す情報である依存レイヤ情報をVPSから復号する。
具体的には、パラメータセット復号部121Caは、対象レイヤiが、参照レイヤjに依存するか否かを示すレイヤ依存フラグdirect_dependent_flag[i][j]を復号し、依存レイヤリストRefLayers[][]と依存レイヤ数NumDirectRefLayers[]を導出する。依存レイヤリストRefLayers[][]は、レイヤIDのリストで表現される。依存レイヤリストRefLayers[ nuh_layer_id ][]は、nuh_layer_idで指定される対象レイヤが参照する、対照レイヤとは異なるレイヤのリストである。依存レイヤリストRefLayers[][]は、依存レイヤ識別子RefLayers[i][j]のセット(リスト)である。以下、RefLayersを単に依存レイヤ、と呼ぶこともある。
図50は、レイヤ依存情報復号部4011aにおける依存レイヤRefLayers[]の導出処理を示す図である。
レイヤ依存情報復号部4011aは、SC1001aに示すように、i(0〜63)、j(0〜63)に対して、依存レイヤリストRefLayerId[i][j]および、依存レイヤ数NumDirectRefLayers[ i ]を0に初期化する。
レイヤ依存情報復号部4011aは、SC1002aに示すように、i(0〜63)、j(i〜63)に対して、対象レイヤiが、参照レイヤjのレイヤ依存フラグdirect_dependent_flag[ i ][ j ]を復号する。direct_dependent_flag[ i ][ j ]が1である場合には、以下の式により、依存レイヤリストRefLayerIdに、レイヤIDを追加し、依存レイヤ数をNumDirectRefLayers[ iNuhLId ][ k ]を1だけインクリメントする。
RefLayerId[ iNuhLId ][ NumDirectRefLayers[ iNuhLId ][ k ]++ ][k] = layer_id_in_nuh[ j ]
なおレイヤIDは、レイヤを示すインデックスiをレイヤIDに変換するテーブルlayer_id_in_nuh[]を用いて、layer_id_in_nuh[ j ]により導出される。
全ての対象レイヤiが、参照レイヤjについて上記処理を行うことにより、依存レイヤリストRefLayers[][]と依存レイヤ数NumDirectRefLayers[]が導出される。
図54は、依存レイヤの例を示す。図54に示すように、レイヤ依存フラグdirect_dependent_flagが1となる参照レイヤ、ここではレイヤ0、レイヤ2、レイヤ3のレイヤIDのリストRefLayers[][]= {0, 2, 3}が依存レイヤリストである。
レイヤ依存情報復号部4011aは、依存レイヤRefLayers[i][j]の各々に対し、レイヤ依存タイプdirect_dependency_type[i][j]を復号する。レイヤ依存タイプは、レイヤ依存フラグから導出された依存レイヤRefLayerIdごとに、レイヤ間予測の種類を示す情報であり、少なくとも画素の予測に用いるサンプル予測、動きベクトルの予測に用いる動き予測を示すことができる。
ある対象ピクチャで実際に用いられる依存レイヤのリストを実依存レイヤリストRefPicLayerId[]と呼ぶ。実依存レイヤリストRefPicLayerId[]は、レイヤIDのリストで表現される。
図55は、実依存レイヤの例を示す。実レイヤ依存フラグactive_direct_dependent_flagは、各依存レイヤが対象ピクチャにおいてレイヤ間参照ピクチャとして用いられるか否かを示す0か1のフラグである。図55では、依存レイヤRefLayers[][]= {0, 2, 3}に対して、各々active_direct_dependent_flag[0]、active_direct_dependent_flag[1]、active_direct_dependent_flag[2]が割り当てられている。その値は、各々、1、0、1である。active_direct_dependent_flag = {1,0,1}である。図55では、レイヤ0、3に対応するインデックス0と2の実レイヤ依存フラグは1(active_direct_dependent_flag[0]=1、active_direct_dependent_flag[2]=1)、レイヤ2に対応するインデックス1の実レイヤ依存フラグ(active_direct_dependent_flag[1]=0)の例を示しており、レイヤ2は、実依存レイヤ情報で選択されなかったため、実依存レイヤには格納されない。レイヤ1は、レイヤ依存フラグを復号した段階で、元々依存レイヤに格納されていなかったので実レイヤ依存フラグは復号されない。
なお、実レイヤ依存フラグactive_direct_dependent_flagの表記は、レイヤ間参照ピクチャ有効フラグinter_layer_ref_pic_enable_flagや、レイヤ間予測ピクチャ存在フラグinter_layer_pred_pic_present_flagや、その他の表記でも良い。
図56は、レイヤ間予測最大TIDの制限を説明する図である。レイヤ0からレイヤ2までの3レイヤがあり、レイヤ0のレイヤ間予測最大TIDがmax_tid_il_ref_pics_plus1[0] = 2、レイヤ1のレイヤ間予測最大TIDがmax_tid_il_ref_pics_plus1[1] = 1の例である。レイヤXのレイヤ間予測最大TIDがmax_tid_il_ref_pics_plus1[X]の場合には、レイヤXのピクチャは、レイヤ間予測最大TIDがmax_tid_il_ref_pics_plus1[X]未満のレイヤのみをレイヤ間参照ピクチャとして参照できる。従って、レイヤ0のピクチャは、TID=0もしくは1のサブレイヤのピクチャのみが、他のレイヤからレイヤ間参照ピクチャとして参照することができる。レイヤ1のレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[1]が1であるので、レイヤ1のピクチャは、すなわちTID=0のサブレイヤのピクチャのみが、他のレイヤからレイヤ間参照ピクチャとして参照することができる。レイヤ2からみると、TID=0のピクチャでは、レイヤ0、レイヤ1の2つの依存レイヤのピクチャをレイヤ間参照ピクチャとして参照できるのに対し、TID=1のピクチャでは、レイヤ0の依存レイヤのピクチャのみがレイヤ間参照ピクチャとして参照できる。以下に説明するように、レイヤ間参照ピクチャを導出する実依存レイヤ復号部1223Caは、TIDに応じて参照できないことが予め分かっている依存レイヤについては、レイヤ間参照ピクチャとして用いるか否かを示すフラグである実レイヤ依存フラグactive_direct_dependent_flagを復号しない(実依存レイヤ復号部1223Cb、実依存レイヤ復号部1223Ccも同様)ことにより、実レイヤ依存フラグの符号量を低減する。
図52は、スライスセグメントヘッダ復号部122Caの構成を例示した機能ブロック図である。図52に示すようにスライスセグメントヘッダ復号部122Caは、実依存レイヤ復号部1223として、実依存レイヤ復号部1223Caを含んで構成される。
図51は、実依存レイヤ復号部1223Caの復号する符号化データの構成を説明する図である。図中、SB1001に示すように、スライスセグメントヘッダの符号化データは、実レイヤ間依存情報active_inter_layer_info()に示す情報、具体的には、ある依存レイヤに対象ピクチャと同時刻のピクチャが、レイヤ間参照ピクチャとして、参照可能であるか否かを示す実レイヤ依存フラグactive_direct_dependent_flagを含む。
本実施形態の階層動画像復号装置1Caが復号する符号化データは、図51に示すように、実レイヤ間依存情報として、対象ピクチャの属するレイヤnuh_layer_idの各々の依存レイヤi(ここでiは、0〜依存レイヤ数NumDirectRefLayers[ nuh_layer_id ]-1)において、対象ピクチャのTemporalIDが、依存レイヤiのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ref_layer_id]より小さい場合に実レイヤ依存フラグactive_direct_dependent_flag[i]を含む。
ここで、ref_layer_idは、図51で以下の式で示すように依存レイヤiのレイヤIDを示し、依存レイヤリストRefLayerId[][]の対象レイヤnuh_layer_id、インデックスiの識別子RefLayerId[ nuh_layer_id][i] から導出することができる。
ref_layer_id = RefLayerId[ nuh_layer_id][i]
スライスセグメントヘッダ復号部122Caは、レイヤIDnuh_layer_idが0より大きく、かつ、依存レイヤNumDirectRefLayers[ nuh_layer_id ]が0より大きい場合に、実依存レイヤ復号部1223Cにより、実依存レイヤを復号する。
実依存レイヤ復号部1223Caは、対象ピクチャのTemporalIDが、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1より小さい場合に符号化データから実レイヤ依存フラグを復号する。
実依存レイヤ復号部1223Caは、図51の符号化データから、実レイヤ依存フラグactive_direct_dependent_flag[i]を復号し、実依存レイヤRefPicLayerId[]を導出する。すなわち、実依存レイヤ復号部1223Caは、対象ピクチャの属するレイヤnuh_layer_idの各々の依存レイヤi(ここでiは、0〜依存レイヤ数NumDirectRefLayers[ nuh_layer_id ]-1)について、依存レイヤiのレイヤ間予測最大TIDであるmax_tid_il_ref_pics_plus1[ref_layer_id]よりも、対象ピクチャのTemporalIDが小さい場合には、対象ピクチャにおいて依存レイヤが用いられるか否かを示す実レイヤ依存フラグactive_direct_dependent_flag[i]を復号する。なお、実依存レイヤ復号部1223Caは、参照レイヤiの実レイヤ依存フラグactive_direct_dependent_flag[i]が符号化データに含まれない場合には、実レイヤ依存フラグactive_direct_dependent_flag[i]として0を導出する。
また、上記では、依存レイヤiが、0〜依存レイヤ数NumDirectRefLayers[ nuh_layer_id ]-1に対する
active_direct_dependent_flag[i]を復号すると説明したが、予め実依存レイヤ数(例えばmax_active_ref_layers)が定まる場合には、active_direct_dependent_flag[i]を復号する度に、active_direct_dependent_flag[i]が1となるレイヤ数をNumActiveRefLayerPicsとしてカウントし、そのレイヤ数NumActiveRefLayerPicsが既に復号された実依存レイヤ数max_active_ref_layersに達するまで、active_direct_dependent_flag[i]を復号する構成にしても良い。すなわち、実依存レイヤ数max_active_ref_layersに達っした時点でループを終了しても良い。
図53は、実依存レイヤ復号部1223Caにおける実依存レイヤRefPicLayerId[]の導出処理を示す図である。図53(a)に示すように、実依存レイヤ復号部1223Caは、対象ピクチャの属するレイヤnuh_layer_idの各々の依存レイヤi(ここでiは、0〜依存レイヤ数NumDirectRefLayers[ nuh_layer_id ]-1)について、復号した実レイヤ依存フラグactive_direct_dependent_flag[i]が1である場合には、対象ピクチャの属するレイヤnuh_layer_idの依存レイヤiに対応するレイヤIDであるRefLayerId[ nuh_layer_id ][i]を、実依存レイヤリストRefPicLayerId[ j++ ]に格納する。このとき、実依存レイヤ数を示すインデックスjを、1だけインクリメントする。最終的に、全ての依存レイヤiの処理が終了した時点のインデックスjを、実依存レイヤ数NumActiveRefLayerPicsに格納する。
なお、図53(b)、図53(c)に示すように、実依存レイヤと同様に、レイヤ間依存タイプから導出されるサンプル依存フラグSamplePredEnabledFlag[][]、動き依存フラグMotionPredEnabledFlag[][]を用いて、実サンプル依存フラグ、実動き依存フラグを導出しても良い。すなわち、復号した実レイヤ依存フラグactive_direct_dependent_flag[i]が1であり、かつ、SamplePredEnabledFlag nuh_layer_id ][i]が1である場合には、対象ピクチャの属するレイヤnuh_layer_idの依存レイヤiに対応するレイヤIDであるRefLayerId[ nuh_layer_id ][i]を、実サンプル依存レイヤリストActiveSamplePredRefLayerId[k++]に格納する。このとき、実依存レイヤ数を示すインデックスkを、1だけインクリメントする。最終的に、全ての依存レイヤiの処理が終了した時点のインデックスkを、実サンプル依存レイヤ数NumActiveSamplePredRefLayersに格納する。動き実サンプル依存レイヤについても、上記処理の、サンプル依存フラグSamplePredEnabledFlag、実サンプル依存レイヤActiveSamplePredRefLayerId、実サンプル依存レイヤ数NumActiveSamplePredRefLayers、インデックスkを、各々、動き依存フラグMotionPredEnabledFlag、実動き依存レイヤActiveMotionPredRefLayerId、実動き依存レイヤ数NumMotionSamplePredRefLayers、インデックスlに置き換えることで処理できる。
上記の構成によれば、対象ピクチャにおいて用いられる実依存レイヤを、依存レイヤi毎のフラグactive_direct_dependent_flag[i]に応じて復号する。このとき、依存レイヤi毎に対応するレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ref_layer_id](ref_layer_idはiから定まるレイヤID)があることから、実依存フラグactive_direct_dependent_flag[i]を、対象ピクチャのTIDと、依存レイヤiを参照可能なサブレイヤの制限を示すレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ref_layer_id]に応じて導出する。
上記構成の階層動画像復号装置1Caによれば、対象ピクチャが、依存レイヤリストに属する各レイヤのピクチャが前記対象ピクチャから参照されるか否かを示す実レイヤ依存フラグ復号手段を備え、前記実レイヤ依存フラグ復号手段は、実レイヤ依存フラグを、対象ピクチャのTemporalIDが、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1未満の場合(general_max_tid_il_ref_pics_plus1から1を減算した値よりも以下の場合)に、符号化データから復号することを特徴とする。
上記構成の動画像復号装置によれば、対象ピクチャのTemporalIDが、依存レイヤのmax_tid_il_ref_pics_plus1以上の場合には、該依存レイヤを参照するか否かを示すフラグである実レイヤ依存フラグを復号しないため、符号量を低減する効果を奏する。
(階層動画像復号装置1Cb)
階層動画像復号装置1Cbは、可変長復号部12Cb、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Cbは、NALユニットヘッダ復号部11、パラメータセット復号部121Cb、スライスセグメントヘッダ復号部122Cb、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、NALユニットヘッダ復号部11は、階層動画像復号装置1で説明済みであるため説明は省略する。階層動画像復号装置1Cbでは、依存レイヤ情報が、TemporalIDで管理される場合を示す。
パラメータセット復号部121Cbは、レイヤ依存情報復号部4011bを含んで構成される。レイヤ依存情報復号部4011bは、対象レイヤが参照する可能性のある対象レイヤとは異なるレイヤを示す情報である依存レイヤ情報を復号する。
具体的には、対象レイヤiが、参照レイヤjに依存するか否かを示すレイヤ依存フラグdirect_dependent_flag[i][j]を復号し、依存レイヤリストRefLayers[][]と依存レイヤ数NumDirectRefLayers[]を導出する。依存レイヤリストRefLayers[][][]は、レイヤIDのリストで表現される。依存レイヤリストRefLayers[ nuh_layer_id ][TemporalID][]は、nuh_layer_idで指定される対象レイヤが参照する、対照レイヤとは異なるレイヤのリストである。依存レイヤリストRefLayers[][][]は、依存レイヤ識別子RefLayers[i][j][k]のセット(リスト)である。以下、RefLayersを単に依存レイヤ、と呼ぶこともある。 図57は、レイヤ依存情報復号部4011bにおける依存レイヤRefPicLayerId[]の導出処理を示す図である。
レイヤ依存情報復号部4011bは、対象レイヤiが、参照レイヤjのレイヤ依存フラグdirect_dependent_flag[ i ][ j ]と、参照レイヤjのレイヤ間予測最大TIDであるmax_tid_il_ref_pics_plus1[j]に応じて、依存レイヤリストRefLayerId[i] [k] []を導出する。なおkは、テンポラルIDのインデックスを示し0から所定の値(ここでは7)の値をとる。
レイヤ依存情報復号部4011bは、SC1001bに示すように、i(0〜63)、j(0〜63)、k(0〜7)に対して、依存レイヤリストRefLayerId[i] [k][j]および、依存レイヤ数NumDirectRefLayers[ i ][ k ]を0に初期化する。
レイヤ依存情報復号部4011bは、SC1002bに示すように、i(0〜63)、j(i〜63)に対して、対象レイヤiが、参照レイヤjのレイヤ依存フラグdirect_dependent_flag[ i ][ j ]を復号する。direct_dependent_flag[ i ][ j ]が1である場合には、0からレイヤ間予測最大TID−1max_tid_il_ref_pics_plus1[j]までのテンポラルIDを示すインデックスkに対して、以下の式により、依存レイヤリストRefLayerIdに、レイヤIDを追加し、依存レイヤ数をNumDirectRefLayers[ iNuhLId ][ k ]を1だけインクリメントする。
RefLayerId[ iNuhLId ] [k] [ NumDirectRefLayers[ iNuhLId ][ k ]++ ] = layer_id_in_nuh[ j ]
なおレイヤIDは、レイヤを示すインデックスiをレイヤIDに変換するテーブルlayer_id_in_nuh[]を用いて、layer_id_in_nuh[ j ]により導出される。
全ての対象レイヤiが、参照レイヤjについて上記処理を行うことにより、依存レイヤリストRefLayers[][][]と依存レイヤ数NumDirectRefLayers[][]が導出される。すなわち、
対象レイヤi、テンポラルIDkにおいて、依存レイヤリストRefLayers[i][k][]と依存レイヤ数NumDirectRefLayers[i][k]が導出される。なお、配列として表現する場合のi、j、kは上記[i][k][j]の順によらず、[i][j][k]等としても良い。
図59は、スライスセグメントヘッダ復号部122Cbの構成を例示した機能ブロック図である。図59に示すようにスライスセグメントヘッダ復号部122Cbは、実依存レイヤ復号部1223として、実依存レイヤ復号部1223Cbを含んで構成される。
図58は、実依存レイヤ復号部1223Cbの復号する符号化データの構成を説明する図である。図中に示すように、スライスセグメントヘッダの符号化データは、実レイヤ間依存情報active_inter_layer_info()に示す情報、具体的には、実レイヤ依存フラグactive_direct_dependent_flag[i]を含む。
本実施形態の階層動画像復号装置1Cbが復号する符号化データは、図58に示すように、実レイヤ間依存情報として、対象ピクチャの属するレイヤnuh_layer_idの各々の依存レイヤi(ここでiは、0〜依存レイヤ数NumDirectRefLayers[ nuh_layer_id ] [TemporalID]-1)において、対象ピクチャのTemporalIDが、依存レイヤiのレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ref_layer_id]より小さい場合に実レイヤ依存フラグactive_direct_dependent_flag[i]を含む。
ここで、ref_layer_idは、図58に示すように依存レイヤiのレイヤIDを示し、依存レイヤリストRefLayerId[][]の対象レイヤnuh_layer_id、インデックスiの識別子RefLayerId[ nuh_layer_id][i] から導出することができる。
ref_layer_id = RefLayerId[ nuh_layer_id][i] [TemporalID]
スライスセグメントヘッダ復号部122Cbは、レイヤIDnuh_layer_idが0より大きく、かつ、依存レイヤNumDirectRefLayers[ nuh_layer_id ]が0より大きい場合に、実依存レイヤ復号部1223Cbにより、実依存レイヤを復号する。
実依存レイヤ復号部1223Cbは、対象ピクチャのTemporalIDが、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1より小さい場合に符号化データから実レイヤ依存フラグを復号する。
実依存レイヤ復号部1223Cbは、図58の符号化データから、実レイヤ依存フラグactive_direct_dependent_flag[i]を復号し、実依存レイヤRefPicLayerId[]を導出する。すなわち、実依存レイヤ復号部1223Cbは、対象ピクチャの属するレイヤnuh_layer_idの各々の依存レイヤi(ここでiは、0〜依存レイヤ数NumDirectRefLayers[ nuh_layer_id ] [TemporalID]-1)について、依存レイヤiのレイヤ間予測最大TIDであるmax_tid_il_ref_pics_plus1[ref_layer_id]よりも、対象ピクチャのTemporalIDが小さい場合には、対象ピクチャにおいて依存レイヤが用いられるか否かを示す実レイヤ依存フラグactive_direct_dependent_flag[i]を復号する。なお、実依存レイヤ復号部1223Cbは、参照レイヤiの実レイヤ依存フラグactive_direct_dependent_flag[i]が符号化データに含まれない場合には0が導出する。
また、上記では、依存レイヤiが、0〜依存レイヤ数NumDirectRefLayers[ nuh_layer_id ]-1に対する
active_direct_dependent_flag[i]を復号すると説明したが、予め実依存レイヤ数(例えばmax_active_ref_layers)が定まる場合には、active_direct_dependent_flag[i]を復号する度に、active_direct_dependent_flag[i]が1となるレイヤ数をNumActiveRefLayerPicsとしてカウントし、そのレイヤ数NumActiveRefLayerPicsが既に復号された実依存レイヤ数max_active_ref_layersに達するまで、active_direct_dependent_flag[i]を復号する構成にしても良い。すなわち、実依存レイヤ数max_active_ref_layersに達っした時点でループを終了しても良い。
図60は、実依存レイヤ復号部1223Cbにおける実依存レイヤRefPicLayerId[]の導出処理を示す図である。図60(a)に示すように、実依存レイヤ復号部1223Cbは、対象ピクチャの属するレイヤnuh_layer_idの各々の依存レイヤi(ここでiは、0〜依存レイヤ数NumDirectRefLayers[ nuh_layer_id ][TemporalID]-1)について、復号した実レイヤ依存フラグactive_direct_dependent_flag[i]が1である場合には、対象ピクチャの属するレイヤnuh_layer_idの依存レイヤiに対応するレイヤIDであるRefLayerId[ nuh_layer_id ][i][TemporalID]を、実依存レイヤリストRefPicLayerId[ j++ ]に格納する。このとき、実依存レイヤ数を示すインデックスjを、1だけインクリメントする。最終的に、全ての依存レイヤiの処理が終了した時点のインデックスjを、実依存レイヤ数NumActiveRefLayerPicsに格納する。
なお、図60(b)、図60(c)に示すように、実依存レイヤと同様に、レイヤ間依存タイプから導出されるサンプル依存フラグSamplePredEnabledFlag[][]、動き依存フラグMotionPredEnabledFlag[][]を用いて、実サンプル依存フラグ、実動き依存フラグを導出しても良い。すなわち、復号した実レイヤ依存フラグactive_direct_dependent_flag[i]が1であり、かつ、SamplePredEnabledFlag nuh_layer_id ][i]が1である場合には、対象ピクチャの属するレイヤnuh_layer_idの依存レイヤiに対応するレイヤIDであるRefLayerId[ nuh_layer_id ][i][TemporalID]を、実サンプル依存レイヤリストActiveSamplePredRefLayerId[k++]に格納する。このとき、実依存レイヤ数を示すインデックスkを、1だけインクリメントする。最終的に、全ての依存レイヤiの処理が終了した時点のインデックスkを、実サンプル依存レイヤ数NumActiveSamplePredRefLayersに格納する。動き実サンプル依存レイヤについても、上記処理の、サンプル依存フラグSamplePredEnabledFlag、実サンプル依存レイヤActiveSamplePredRefLayerId、実サンプル依存レイヤ数NumActiveSamplePredRefLayers、インデックスkを、各々、動き依存フラグMotionPredEnabledFlag、実動き依存レイヤActiveMotionPredRefLayerId、実動き依存レイヤ数NumMotionSamplePredRefLayers、インデックスlに置き換えることで処理できる。
上記の構成によれば、対象ピクチャにおいて用いられる実依存レイヤを、各依存レイヤi毎のフラグactive_direct_dependent_flag[i]に応じて復号する。このとき、依存レイヤi毎に対応するレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ref_layer_id]があることから、実依存フラグactive_direct_dependent_flag[i]を、対象ピクチャのTIDと、依存レイヤiを参照可能なサブレイヤの制限を示すレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[ref_layer_id]に応じて導出する。
上記構成の階層動画像復号装置1Cbによれば、対象ピクチャが、依存レイヤリストに属する各レイヤのピクチャが前記対象ピクチャから参照されるか否かを示す実レイヤ依存フラグ復号手段を備え、前記実レイヤ依存フラグ復号手段は、実レイヤ依存フラグを、対象ピクチャのTemporalIDが、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1未満の場合(max_tid_il_ref_pics_plus1から1を減算した値よりも以下の場合)に、符号化データから復号することを特徴とする。
上記構成の動画像復号装置によれば、対象ピクチャのTemporalIDが、依存レイヤのmax_tid_il_ref_pics_plus1以上の場合には、該依存レイヤを参照するか否かを示すフラグである実レイヤ依存フラグを復号しないため、符号量を低減する効果を奏する。
(階層動画像復号装置1Cc)
階層動画像復号装置1Ccは、可変長復号部12Cc、ピクチャ復号部13、復号ピクチャ管理部14を備える。可変長復号部12Ccは、NALユニットヘッダ復号部11、パラメータセット復号部121Cc、スライスセグメントヘッダ復号部122Cc、スライスセグメントデータ復号部123を備える。ピクチャ復号部13、復号ピクチャ管理部14、NALユニットヘッダ復号部11は、階層動画像復号装置1で説明済みであるため説明は省略する。
パラメータセット復号部121Caは、レイヤ依存情報復号部4011aを含んで構成される。レイヤ依存情報復号部4011aは、既に説明したように対象レイヤが参照する可能性のある対象レイヤとは異なるレイヤを示す情報である依存レイヤ情報を復号する。
図62は、スライスセグメントヘッダ復号部122Ccの構成を例示した機能ブロック図である。図62に示すようにスライスセグメントヘッダ復号部122Ccは、実依存レイヤ復号部1223として、実依存レイヤ復号部1223Ccを含んで構成される。
図61は、実依存レイヤ復号部1223Ccの復号する符号化データの構成を説明する図である。図に示すように、スライスセグメントヘッダの符号化データは、実レイヤ間依存情報active_inter_layer_info()に示す情報、具体的には、実レイヤ依存フラグactive_direct_dependent_flag[i]を含む。
本実施形態の階層動画像復号装置1Ccが復号する符号化データは、図61に示すように、実レイヤ間依存情報として、対象ピクチャの属するレイヤnuh_layer_idの各々の参照レイヤi(ここでiは、0〜nuh_layer_id-1)において、参照レイヤiが対象レイヤnuh_layer_idの依存レイヤである場合、つまり、レイヤ依存フラグdirect_dependent_flag[nuh_layer_id][i]が1の場合には、実レイヤ依存フラグactive_direct_dependent_flag[i]を含む。
スライスセグメントヘッダ復号部122Ccは、レイヤIDnuh_layer_idが0より大きく、かつ、依存レイヤNumDirectRefLayers[ nuh_layer_id ]が0より大きい場合に、実依存レイヤ復号部1223Ccにより、実依存レイヤを復号する。
実依存レイヤ復号部1223Ccは、対象ピクチャのTemporalIDが、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1より小さい場合に符号化データから実レイヤ依存フラグを復号する。
実依存レイヤ復号部1223Ccは、図61の符号化データから、実レイヤ依存フラグactive_direct_dependent_flag[i]を復号し、実依存レイヤRefPicLayerId[]を導出する。すなわち、実依存レイヤ復号部1223Ccは、対象ピクチャの属するレイヤnuh_layer_idの各々の参照レイヤi(ここでiは、0〜nuh_layer_id-1)について、参照レイヤiが依存レイヤであり(レイヤ依存フラグdirect_dependent_flag[nuh_layer_id][i]が1)、依存レイヤiのレイヤ間予測最大TIDであるmax_tid_il_ref_pics_plus1[i]よりも、対象ピクチャのTemporalIDが小さい場合には、対象ピクチャにおいて依存レイヤが用いられるか否かを示す実レイヤ依存フラグactive_direct_dependent_flag[i]を復号する。なお、実依存レイヤ復号部1223Ccは、参照レイヤiの実レイヤ依存フラグactive_direct_dependent_flag[i]が符号化データに含まれない場合には0が導出する。
また、上記では、依存レイヤiが、0〜依存レイヤ数NumDirectRefLayers[ nuh_layer_id ]-1に対する
active_direct_dependent_flag[i]を復号すると説明したが、予め実依存レイヤ数(例えばmax_active_ref_layers)が定まる場合には、active_direct_dependent_flag[i]を復号する度に、active_direct_dependent_flag[i]が1となるレイヤ数をNumActiveRefLayerPicsとしてカウントし、そのレイヤ数NumActiveRefLayerPicsが既に復号された実依存レイヤ数max_active_ref_layersに達するまで、active_direct_dependent_flag[i]を復号する構成にしても良い。すなわち、実依存レイヤ数max_active_ref_layersに達っした時点でループを終了しても良い。
図63は、実依存レイヤ復号部1223Ccにおける実依存レイヤRefPicLayerId[]の導出処理を示す図である。図63(a)に示すように、実依存レイヤ復号部1223Ccは、対象ピクチャの属するレイヤnuh_layer_idの各々の参照レイヤi(ここでiは、0〜nuh_layer_id -1)について、復号した実レイヤ依存フラグactive_direct_dependent_flag[i]が1である場合には、対象ピクチャの属するレイヤnuh_layer_idの依存レイヤiに対応するレイヤIDであるRefLayerId[ nuh_layer_id ][i2]を、実依存レイヤリストRefPicLayerId[ j++ ]に格納する。このとき、実依存レイヤ数を示すインデックスjを、1だけインクリメントする。最終的に、全ての依存レイヤiの処理が終了した時点のインデックスjを、実依存レイヤ数NumActiveRefLayerPicsに格納する。ここで、i2は、依存レイヤのインデックスであり、初期値を0として、レイヤ依存フラグdirect_dependent_flag[nuh_layer_id][i]が1のときに、インクリメントすることで導出すすることができる。
図64は、実依存レイヤ復号部1223Ccにおける実依存レイヤRefPicLayerId[]の導出処理を示す別の例である。図63で説明した方法では、依存レイヤのインデックスとしてi2を用いていたが、他の方法で、レイヤIDを導出することも可能である。具体的には、RefLayerId[ nuh_layer_id ][i2]のかわりに、レイヤを示すインデックスiをレイヤIDに変換するテーブルlayer_id_in_nuh[]を用いて、layer_id_in_nuh[ j ]により導出されるiNuhLIdを用いる。
なお、図63(b)、図63(c)に示すように、実依存レイヤと同様に、レイヤ間依存タイプから導出されるサンプル依存フラグSamplePredEnabledFlag[][]、動き依存フラグMotionPredEnabledFlag[][]を用いて、実サンプル依存フラグ、実動き依存フラグを導出しても良い。
上記の構成によれば、対象ピクチャにおいて用いられる実依存レイヤを、各依存レイヤi毎のフラグactive_direct_dependent_flag[i]に応じて復号する。このとき、依存レイヤi毎に対応するレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[i]があることから、実依存フラグactive_direct_dependent_flag[i]を、対象ピクチャのTIDと、依存レイヤiを参照可能なサブレイヤの制限を示すレイヤ間予測最大TIDmax_tid_il_ref_pics_plus1[i]に応じて導出する。
上記構成の階層動画像復号装置1Ccによれば、対象ピクチャが、依存レイヤリストに属する各レイヤのピクチャが前記対象ピクチャから参照されるか否かを示す実レイヤ依存フラグ復号手段を備え、前記実レイヤ依存フラグ復号手段は、実レイヤ依存フラグを、対象ピクチャのTemporalIDが、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1未満の場合(max_tid_il_ref_pics_plus1から1を減算した値よりも以下の場合)に、符号化データから復号することを特徴とする。
上記構成の動画像復号装置によれば、対象ピクチャのTemporalIDが、依存レイヤのmax_tid_il_ref_pics_plus1以上の場合には、該依存レイヤを参照するか否かを示すフラグである実レイヤ依存フラグを復号しないため、符号量を低減する効果を奏する。
(復号ピクチャ管理部)
図5を用いて、復号ピクチャ管理部14の詳細構成を説明する。図5は、復号ピクチャ管理部14の構成を例示した機能ブロック図である。
図5に示すように、復号ピクチャ管理部14は、DPB141、RPS導出部142、参照ピクチャ制御部143、レイヤ間参照ピクチャ制御部144、RPL導出部145、出力制御部146を備える。
<DPB141>
DPB141は、復号ピクチャバッファ(Decoded Picture Buffer)とも呼ばれ、ピクチャ復号部13で復号された対象レイヤの各ピクチャの復号ピクチャを記録する。DPBには、対象レイヤの各ピクチャに対応する復号ピクチャが出力順(POC: Picture Order Count)に関連付けて記録されている。加えて、DPBの各ピクチャに対しては、参照マークおよび出力マークを設定できる。
参照マークは、DPB上のピクチャが対象ピクチャ以降の復号処理における予測画像生成処理(例えば、インター予測やレイヤ間画像予測)への利用可否を示す情報である。参照マークは、具体的には、「短期参照使用」(「used for short-term reference」)、「長期参照使用」(「used for long-term reference」)、「参照不使用」(「not used for reference」)のいずれかの値を取る。
なお、参照マークの取り得る値を上記とするがそれに限らない。例えば、「レイヤ間参照使用」(「used for inter-layer reference」)の値に参照マークを設定できてもよい。また、「短期参照使用」と「長期参照使用」の区別をせず、両者の和集合を「参照使用」(「used for reference」)と定義してもよい。
出力マークは、DPB上のピクチャを外部へ出力する必要性の有無を示す情報である。出力マークは、具体的には、「出力要」(「needed for output」)、「出力不要」(「not needed for output」)のいずれかの値を取る。
<RPS導出部142>
RPS導出部142は、入力されたRPSに係るシンタックス値に基づいて対象ピクチャの復号処理に用いるRPS(参照ピクチャセット)を導出してレイヤ間参照ピクチャ制御部144、参照ピクチャ制御部143、および、RPL導出部145に出力する。
(RPS導出処理)
次にRPS情報に基づくRPS導出処理の詳細を説明する。
RPS導出処理は複数のRPSのサブセットを導出処理に分けられる。RPSのサブセットは以下のように定義される。
RPSは参照可能ピクチャの種類に応じて次の2つのサブセットに分けられる。
・現ピクチャ参照可能リストListCurr:対象ピクチャにおける参照可能ピクチャのリスト
・後続ピクチャ参照可能リストListFoll:対象ピクチャでは参照されないが、対象ピクチャに復号順で後続のピクチャで参照可能なピクチャのリスト
なお、現ピクチャ参照可能リストに含まれるピクチャの数を、現ピクチャ参照可能ピクチャ数NumCurrListと呼ぶ。
現ピクチャ参照可能リストは、さらに4つの部分リストから構成される。
・現ピクチャ長期参照可能リストRefPicSetLtCurr:SPS長期RP情報またはSH長期RP情報により指定される現ピクチャ参照可能ピクチャ
・現ピクチャ短期前方参照可能リストRefPicSetStCurrBefore:SPS短期RPS情報またはSH短期RPS情報により指定される現ピクチャ参照可能ピクチャであって、表示順が対象ピクチャより早いもの
・現ピクチャ短期後方参照可能リストRefPicSetStCurrAfter:SPS短期RPS情報またはSH短期RPS情報により指定される現ピクチャ参照可能ピクチャであって、表示順が対象ピクチャより早いもの
・現ピクチャレイヤ間参照可能リストRefPicSetInterLayer:ILRP情報により指定される現ピクチャ参照可能ピクチャ
後続ピクチャ参照可能リストは、さらに2つの部分リストから構成される。
・後続ピクチャ長期参照可能リストRefPicSetLtFoll:SPS長期RP情報またはSH長期RP情報により指定される後続ピクチャ参照可能ピクチャ。
・後続ピクチャ短期参照可能リストRefPicSetStFoll:SPS短期RPS情報またはSH短期RPS情報により指定される後続ピクチャ参照可能ピクチャ。
<RPS導出部142>
RPS導出部142は、RPSを構成する、現ピクチャ短期前方参照可能リストRefPicSetStCurrBefore、現ピクチャ短期後方参照可能リストRefPicSetStCurrAfter、現ピクチャ長期参照可能リストRefPicSetLtCurr、現ピクチャレイヤ間参照可能リストRefPicSetInterLayer、後続ピクチャ短期参照可能リストRefPicSetStFoll、および、後続ピクチャ長期参照可能リストRefPicSetLtFollを次の手順で生成する。加えて、現ピクチャ参照可能ピクチャ数NumPocTotalCurrを導出する。なお、前記各参照可能リストは、以下の処理の開始前に空に設定されている。
(S101)SPS短期RPS情報、および、SH短期RPS情報に基づいて、対象ピクチャの復号に用いる単一の短期参照ピクチャセットを特定する。具体的には、SH短期RPS情報に含まれるshort_term_ref_pic_set_spsの値が0である場合、SH短期RPS情報に含まれるスライスセグメントヘッダで明示的に伝送された短期RPSを選択する。それ以外(short_term_ref_pic_set_spsの値が1の場合、SH短期RPS情報に含まれるshort_term_ref_pic_set_idxが示す短期RPSを、SPS短期RPS情報に含まれる複数の短期RPSの中から選択する。
(S102)選択された短期RPSに含まれる参照ピクチャ各々のPOCを導出する。参照ピクチャのPOCは、参照ピクチャが前方短期参照ピクチャの場合、対象ピクチャのPOCから「delta_poc_s0_minus1[i]+1」の値を減算して導出する。一方、参照ピクチャが後方短期参照ピクチャの場合、対象ピクチャのPOCに「delta_poc_s1_minus1[i]+1」の値を加算して導出する。
(S103)短期RPSに含まれる前方参照ピクチャを伝送された順に確認し、関連付けられているused_by_curr_pic_s0_flag[i]の値が1である場合、当該前方参照ピクチャを現ピクチャ短期前方参照可能リストRefPicSetStCurrBeforeに追加する。それ以外(used_by_curr_pic_s0_flag[i]の値が0)の場合、当該前方参照ピクチャを後続ピクチャ短期参照可能リストRefPicSetStFollに追加する。
(S104)短期RPSに含まれる後方参照ピクチャを伝送された順に確認し、関連付けられているused_by_curr_pic_s1_flag[i]の値が1である場合、当該後方参照ピクチャを現ピクチャ短期後方参照可能リストRefPicSetStCurrAfterに追加する。それ以外(used_by_curr_pic_s1_flag[i]の値が0の場合、当該前方参照ピクチャを後続ピクチャ短期参照可能リストRefPicSetStFollに追加する。
(S105) SPS長期RP情報、および、SH長期RP情報に基づいて、対象ピクチャの復号に用いる長期参照ピクチャを特定する。具体的には、num_long_term_spsの数の参照ピクチャをSPS長期RP情報に含まれる参照ピクチャの中から選択して、順に長期RPSに追加する。選択される参照ピクチャは、lt_idx_sps[i]の示す参照ピクチャである。続いて、num_long_term_picsの数の参照ピクチャをSH長期RP情報に含まれる参照ピクチャを順に長期RPSに追加する。
(S106)長期RPSに含まれる参照ピクチャ各々のPOCを導出する。長期参照ピクチャのPOCは、関連付けて復号されたpoc_lst_lt[i]、または、lt_ref_pic_poc_lsb_sps[i]の値から直接導出される。
(S107)長期RPSに含まれる参照ピクチャを順に確認し、関連付けられているused_by_curr_pic_lt_flag[i]、または、used_by_curr_pic_lt_sps_flag[i]の値が1である場合、当該長期参照ピクチャを現ピクチャ長期参照可能リストRefPicSetLtCurrに追加する。それ以外(used_by_curr_pic_lt_flag[i]、または、used_by_curr_pic_lt_sps_flag[i]の値が0)の場合、当該長期参照ピクチャを後続ピクチャ長期参照可能リストRefPicSetLtFollに追加する。
(S108)ILRP情報により指定された実依存レイヤ(もしくは実サンプル依存レイヤ)で指定される参照ピクチャを現ピクチャレイヤ間参照可能リストRefPicSetInterLayerに追加する。
(S109)変数NumPocTotalCurrの値を、現ピクチャから参照可能な参照ピクチャの和に設定する。すなわち、変数NumPocTotalCurrの値を、現ピクチャ短期前方参照可能リストRefPicSetStCurrBefore、現ピクチャ短期後方参照可能リストRefPicSetStCurrAfter、現ピクチャ長期参照可能リストRefPicSetLtCurr、および、現ピクチャレイヤ間参照可能リストRefPicSetInterLayerの4つのリストの各要素数の和に設定する。
<参照ピクチャ制御部143>
参照ピクチャ制御部143は、入力されるRPSに基づいて、DPB141を更新する。概略的には、参照ピクチャ制御部143は、入力されたRPSにおいて 対象ピクチャ(現ピクチャ)のインター予測で参照可能と示されているピクチャの参照マークを「参照使用」(「短期参照使用」または「長期参照使用」)に設定する。加えて、DPBに記録されている対象レイヤの復号ピクチャであって、前記の処理で「参照使用」とマークされないピクチャを「参照不使用」に設定する。なお、DPB上のレイヤ間参照ピクチャの参照マークは参照ピクチャ制御部143では変更しない。言い換えると、参照レイヤピクチャに由来するDPB上のピクチャの参照マークの変更は参照ピクチャ制御部143では行わず、後述のレイヤ間参照ピクチャ制御部144で行う。
参照ピクチャ制御部143での参照マーク設定処理は以下の手順で実行される。
(S201)DPB上のレイヤ間参照ピクチャを除く全てのピクチャの参照マークを「参照不使用」に設定する。
(S202)次の(a)または(b)の条件を満たすピクチャ各々について、対応するDPB上のピクチャ、すなわち同一のPOCが割り当てられているピクチャ、を特定して参照マークを「短期参照使用」に設定する。
(a)RPSの現ピクチャ短期前方参照可能リストRefPicSetStCurrBeforeに含まれているピクチャ。
(b)RPSの現ピクチャ長期後方参照可能リストRefPicSetStCurrAfterに含まれている各ピクチャ。
(S203)次の(c)の条件を満たすピクチャ各々について、対応するDPB上のピクチャを特定して参照マークを「長期参照使用」に設定する。
(c)RPSの現ピクチャ長期参照可能リストRefPicSetLtCurrに含まれているピクチャ。
なお、上記の参照マーク設定手順は一例であり、DPB上のピクチャの参照マークが同じになる限りは別の手順で参照マークを設定してもよい。例えば、上記手順のS202とS203の処理を先に実行し、両手順で参照マークが変更されなかったピクチャであって、かつ、対象レイヤの復号ピクチャであるDPB上の各ピクチャのマークを「参照不使用」に設定してもよい。
<レイヤ間参照ピクチャ制御部144>
レイヤ間参照ピクチャ制御部144は、入力される参照レイヤピクチャとRPSに基づいて、DPB141を更新する。概略的には、レイヤ間参照ピクチャ制御部144は、入力されたRPSにおいて 対象ピクチャ(現ピクチャ)のレイヤ間インター予測で参照可能と示されているピクチャに対応する参照レイヤピクチャをDPBに記録する。加えて、DPB上で当該ピクチャの参照マークを「参照使用」(「短期参照使用」または「長期参照使用」に設定する。加えて、DPB上で当該ピクチャの出力マークを「出力不要」に設定する。
より具体的には、レイヤ間参照ピクチャ制御部144における参照マーク設定処理は、次の手順で実行される。
(S301)次の(d)の条件を満たすピクチャ各々について、DPB上のピクチャバッファを確保し、入力される参照レイヤピクチャを当該ピクチャバッファに記録する。
(d)RPSの現ピクチャレイヤ間参照可能リストRefPicSetInterLayerに含まれているピクチャ。
なお、参照レイヤピクチャを記録する際に、必要に応じてスケーリングやフィルタリングを適用した後に前記ピクチャバッファに記録してもよい。特に、参照レイヤと対象レイヤの出力ピクチャの解像度が異なる場合(空間スケーラビリティの場合)、参照レイヤの復号ピクチャである参照レイヤピクチャを、対象レイヤの出力ピクチャの解像度に合わせてスケーリングする必要がある。
(S302)S301でDPBに記録した各ピクチャの参照マークを「参照使用」に設定する。
(S303)S301でDPBに記録した各ピクチャの出力マークを「出力不要」に設定する。
<RPL導出部145>
RPL導出部145は、入力RPS、および、入力シンタックス値に含まれるRPL情報に基づいて対象ピクチャの対象スライスのインター予測またはレイヤ間画像予測で利用する参照ピクチャリストを導出して出力する。
(RPL導出処理)
参照ピクチャリスト構築処理の詳細を説明する。参照ピクチャリスト導出部は、参照ピクチャセットRPSと、RPL修正情報に基づいて参照ピクチャリストRPLを生成する。
参照ピクチャリストはL0参照リストとL1参照リストの2つのリストから構成される。始めに、L0参照リストの構築手順を説明する。L0参照リストは、以下のS301〜S307に示す手順で構築される。(S301)暫定L0参照リストを生成して、空のリストに初期化する。
(S302)暫定L0参照リストに対し、現ピクチャ短期前方参照可能リストに含まれる参照ピクチャを順に追加する。
(S303)暫定L0参照リストに対し、現ピクチャ短期後方参照可能リストに含まれる参照ピクチャを順に追加する。
(S304)暫定L0参照リストに対し、現ピクチャ長期参照可能リストに含まれる参照ピクチャを順に追加する。
(S305)参照ピクチャリストが修正される場合(RPL修正情報に含まれるlists_modification_present_flagの値が1の場合)、以下のS306a〜S306bの処理を実行する。そうでない場合(lists_modification_present_flagの値が0の場合)、S307の処理を実行する。
(S306a)L0参照ピクチャの修正が有効な場合(RPL修正情報に含まれるref_pic_list_modification_flag_l0の値が1の場合)であって、かつ、現ピクチャ参照可能ピクチャ数NumCurrListが2に等しい場合、S306bを実行する。そうでない場合、S306cを実行する。
(S306b)RPL修正情報に含まれるリスト並べ替え順序list_entry_l0[i]の値を下記の式により設定し、その後、S306cを実行する。
list_entry_l0[0] = 1
list_entry_l0[1] = 0
(S306c)参照リスト並べ替え順序list_entry_l0[i]の値に基づいて、暫定L0参照リストの要素を並べ換えて、L0参照リストとする。参照ピクチャインデックスrIdxに対応するL0参照リストの要素RefPicList0[rIdx]は、次式により導出される。ここで、RefListTemp0[i]は、暫定L0参照リストのi番目の要素を表す。
RefPicList0[ rIdx ] = RefPicListTemp0[ list_entry_l0[ rIdx ] ]
上記の式によれば、参照リスト並べ替え順序list_entry_l0[i]において、参照ピクチャインデックスrIdxの示す位置に記録されている値を参照し、暫定L0参照リストにおいて前記値の位置に記録されている参照ピクチャを、L0参照リストのrIdxの位置の参照ピクチャとして格納する。
(S307)暫定L0参照リストをL0参照リストとする。
次にL1参照リストを構築する。なお、L1参照リストも、上記L0参照リストと同様の手順で構築できる。上記L0参照リストの構築手順(S301〜S307)において、L0参照ピクチャ、L0参照リスト、暫定L0参照リスト、list_entry_l0をそれぞれ、L1参照ピクチャ、L1参照リスト、暫定L1参照リスト、list_entry_l1と置き換えればよい。
<出力制御部146>
出力制御部146は、概略的には、所定のタイミングでDPB141のピクチャを外部に出力するとともに出力マークを更新する。具体的には、出力制御部146によるピクチャ出力処理は次の手順で実行される。
(S401)DPB上のピクチャであって、出力マークが「出力要」であるピクチャのうちPOCが最小であるピクチャを出力する。
(S402)S401で出力されたピクチャの出力マークを「出力不要」に設定する。
(S403)DPB上のピクチャの中から、参照マークが「参照不使用」であり、かつ、出力マークが「出力不要」であるピクチャを選択して、当該ピクチャをDPBから削除する。
なお、上記の処理は一般的なDPB上の不要ピクチャ削除処理(一般的なバンピング処理)と呼称できる。一般的なバンピング処理では、DPB上の各ピクチャが対象レイヤの復号ピクチャであるかレイヤ間参照ピクチャ(参照レイヤの復号ピクチャに由来するピクチャ)であるかの判定を行うことなくDPB上のピクチャの出力およびDPB上の不要ピクチャの削除を実行できる。
(ピクチャ管理処理手順)
次に、復号ピクチャ管理部14におけるピクチャ管理処理を図1を参照して説明する。図1は、復号ピクチャ管理部14における対象ピクチャ復号時のピクチャ管理処理の概略を示したフロー図である。対象ピクチャ復号時のピクチャ管理処理は、以下のS501〜S510の手順で実行される。
(S501)RPS導出部142は、入力されたシンタックス値から対象ピクチャのRPSを導出する。導出されたRPSは参照ピクチャ制御部143、レイヤ間参照ピクチャ制御部144、および、RPL導出部145に出力する。S502に進む。
(S502)参照ピクチャ制御部143は、入力RPSに基づきDPB上の対象レイヤの復号ピクチャの参照マークを更新する。S503に進む。
(S503)レイヤ間参照ピクチャ制御部144は、入力のRPSにレイヤ間参照ピクチャの参照マークが含まれるか判定する。含まれる場合(S503でYESの場合)、S504に進む。一方、含まれない場合(S503でNOの場合)、S506に進む。
(S504)レイヤ間参照ピクチャ制御部144は、入力の参照レイヤピクチャをレイヤ間参照ピクチャとしてDPB141上のピクチャバッファに記録する。S505に進む。
(S505)レイヤ間参照ピクチャ制御部144は、S504で記録したレイヤ間参照ピクチャの出力マークを「出力不要」に設定する。S506に進む。
(S506)出力制御部146は、DPB141上のピクチャを必要に応じて外部に出力して当該ピクチャの出力マークを更新する。S507に進む。
(S507)RPL導出部145は、入力のRPSとシンタックス値に基づき、対象ピクチャ復号時に用いられる参照ピクチャリストを生成して外部に出力する。S508に進む。なお、このタイミングで、外部では当該参照ピクチャリストおよびDPB141上の参照ピクチャを利用して対象ピクチャの復号処理を実行して、対象ピクチャの復号ピクチャを生成する。
(S508)入力される対象ピクチャの復号ピクチャをDPB141上のピクチャバッファに記録する。S509に進む。
(S509)廃棄可能フラグ(discardable_flag)の値に応じて対象ピクチャの参照マークを更新する。廃棄可能フラグは、対象ピクチャが後続のピクチャ復号時に参照ピクチャまたはレイヤ間参照ピクチャとして利用される可能性の有無を示すフラグである。廃棄可能フラグの値が1の場合、参照マークを「参照不使用」に更新する。廃棄可能フラグの値が0の場合、参照マークを「参照使用」に更新する。
(S510)DPB上に記録されているピクチャのうち、下記条件D1、D2、およびD3を全て満たすピクチャの参照マークを「参照不使用」に設定する。
D1:対象ピクチャのPOCと同一POCを有するピクチャ。
D2:対象ピクチャより復号順の遅い対象ピクチャのPOCと同一POCを有するピクチャの復号時にレイヤ間参照ピクチャとして利用されないピクチャ。
D3:同一レイヤ内の予測(例えばインター予測)により利用されないピクチャ。
なお、図32は、レイヤ間予測最大TIDに関するD3の処理を示す図である。
復号ピクチャ管理部14は、参照レイヤピクチャに対するremainingInterLayerReferencesFlagを導出する。図32に示すように、復号ピクチャ管理部14は、対象ピクチャのTemporalID(currTid)が、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1から1を減算した値以下であるか否かを判定する。真の場合には、lastestDecからnumTargetDecLayersの間のインデックスについて、依存レイヤテーブルNumDirectRefLayersと レイヤIDRefLayerIdを比較し、一致する場合に、remainingInterLayerReferencesFlagを1とする。以上の処理により、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1から1を減算した値以下のTemporalIDを有し、かつ、依存レイヤテーブルNumDirectRefLayersにあるレイヤのみで、remainingInterLayerReferencesFlagが1となる。そして、復号ピクチャ管理部14は、remainingInterLayerReferencesFlagが1となったピクチャには、参照する(used for reference)事を示す参照マークを付ける。復号ピクチャ管理部14は、remainingInterLayerReferencesFlagが0となったピクチャには、参照しない(unused for reference)事を示す参照マークを付ける。すなわち、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1から1を減算した値より大きいTemporalIDを有するか、もしくは、依存レイヤテーブルNumDirectRefLayersにないレイヤに、参照しない事を示す参照マークが付加される。この導出規則を規則(MT1)と呼ぶ。
復号ピクチャ管理部14は、参照する(used for reference)の参照マークの付いた参照レイヤピクチャのみを、参照ピクチャセットに用いる。
参照レイヤピクチャ管理部154は、入力される参照レイヤピクチャを内部のDPBに記録するとともに、入力されるシンタックス値に基づいて参照ピクチャリスト生成や出力する参照レイヤピクチャの決定を行う。生成された参照ピクチャリストは参照レイヤピクチャ復号部153に出力され、参照レイヤピクチャは外部に出力される。なお、参照レイヤピクチャ管理部154における処理は、図4の復号ピクチャ管理部14における処理と同様であり詳細説明は省略する。
〔階層動画像符号化装置〕
以下では、本実施形態に係る階層動画像符号化装置2の構成について、図47を参照して説明する。
(階層動画像符号化装置の構成)
図47を用いて、階層動画像符号化装置2の概略構成を説明する。図47は、階層動画像符号化装置2の概略的構成を示した機能ブロック図である。階層動画像符号化装置2は、対象レイヤの入力画像PIN#Tを、参照レイヤ符号化データDATA#Rを参照しながら符号化して、対象レイヤの階層符号化データDATAを生成する。なお、参照レイヤ符号化データDATA#Rは、参照レイヤに対応する階層動画像符号化装置において符号化済みであるとする。
図47に示すように階層動画像符号化装置2は、ピクチャ符号化部21、可変長符号化部22、復号ピクチャ管理部14を備える。
ピクチャ符号化部21は、入力画像PIN#Tを符号化して対応するシンタックス値を生成して出力する。また、同時に出力したシンタックス値を用いて復号処理を行うことで復号ピクチャを生成して出力する。ピクチャ符号部21は、シンタックス値または復号ピクチャの生成に、入力される参照ピクチャリストを利用したインター予測またはレイヤ間画像予測を用いる。
可変長符号化部22は、入力されるシンタックス値を可変長符号化して対象レイヤ符号化データDATA#Tとして出力する。
復号ピクチャ管理部14は、既に説明した階層動画像復号装置1の備える復号ピクチャ管理部14と同一の構成要素である。ただし、階層動画像符号化装置2の備える復号ピクチャ管理部14では、DPBに記録されたピクチャを出力ピクチャとして出力する必要はないため、当該出力は省略できる。なお、階層動画像復号装置1の復号ピクチャ管理部14の説明において「復号」として説明した記載は「符号化」と置き換えることで、階層動画像符号化装置2の復号ピクチャ管理部14にも適用できる。
可変長符号化部22は、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを符号化するNALユニットヘッダ符号化部221を備え、NALユニットヘッダ符号化部221は、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを符号化する。また、復号ピクチャ管理部14は、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する。
また、可変長符号化部22は、さらに、レイヤ間サブレイヤアライメントフラグを符号化するパラメータセット符号化部222を備え、
NALユニットヘッダ符号化部221は、レイヤ間サブレイヤアライメントフラグが1である場合に、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを符号化しても良い。
また、可変長符号化部22は、さらに、プロファイルを符号化するパラメータセット符号化部222を備え、NALユニットヘッダ符号化部221は、プロファイルがステレオ画像のプロファイルである場合には、レイヤ間サブレイヤアライメントフラグが1である場合に、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを符号化しても良い。
以上の階層動画像符号化装置2が生成する符号化データは、階層動画像復号装置1、階層動画像復号装置1S1´、階層動画像復号装置1S1´´で復号される。
(階層動画像符号化装置2S2)
以下、階層動画像符号化装置2の変形例である階層動画像符号化装置2S2を説明する。階層動画像符号化装置2Sが生成する符号化データは、階層動画像復号装置1S2、S2´、S2´´で復号される。階層動画像符号化装置2は、ピクチャ符号化部21、可変長符号化部22S2、復号ピクチャ管理部14を備える。ピクチャ符号化部21、復号ピクチャ管理部14、前述の実施形態と同様であるので説明を省略する。同様に、既に説明した手段と同一の符号を付した手段は、本実施形態でも同様の構成であるので、以降説明を省略する。
可変長符号化部22S2の備えるNALユニットヘッダ符号化部221S2は、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを符号化し、
NALユニットヘッダ符号化部S2は、ベースレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じアクセスユニットに属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを符号化する。
上記の構成の画像符号化装置2が生成する符号化データを再生する場合には、同じアクセスユニットに属する全てのレイヤのTIDが共通であることが示されている場合には、あるレイヤで可能であった時間的な間引き再生が、別のレイヤで可能である。そのため、間引き再生中にあるレイヤ(例えば低解像度のレイヤ)から、別のレイヤ(例えば、高解像度のレイヤ)に再生を変えることや、複数の視点(例えば、視点画像0であるレイヤ0と視点画像0であるレイヤ1)を同じ間引き再生において、再生することができるという効果を奏する。
また、可変長符号化部22S2は、さらに、レイヤ間サブレイヤアライメントフラグを符号化するパラメータセット符号化部222を備え、
NALユニットヘッダ符号化部221S2は、レイヤ間サブレイヤアライメントフラグが1である場合に、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを符号化しても良い。
また、可変長符号化部22S2は、さらに、プロファイルを符号化するパラメータセット符号化部222を備え、
NALユニットヘッダ符号化部221S2は、プロファイルがステレオ画像のプロファイルである場合には、レイヤ間サブレイヤアライメントフラグが1である場合に、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを符号化しても良い。
(階層動画像符号化装置2A)
以下、階層動画像符号化装置2の変形例である階層動画像符号化装置2Aを説明する。階層動画像符号化装置2Aが生成する符号化データは、階層動画像復号装置1Aa、階層動画像復号装置1Ab、階層動画像復号装置1Acで復号される。階層動画像符号化装置2は、ピクチャ符号化部21、可変長符号化部22A、復号ピクチャ管理部14を備える。ピクチャ符号化部21、復号ピクチャ管理部14、前述の実施形態と同様であるので説明を省略する。同様に、既に説明した手段と同一の符号を付した手段は、本実施形態でも同様の構成であるので、以降説明を省略する。
可変長符号化部22Aは、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを符号化するNALユニットヘッダ符号化部221Aと、少なくともレイヤ間予測最大TIDを符号化するパラメータセット符号化部222Aを備える。
NALユニットヘッダ符号化部221は、同じアクセスユニットに属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを符号化する。また、ラメータセット符号化部222Aは、全てのレイヤで共通のレイヤ間予測最大TIDが用いられる場合には、全てのレイヤに対して1つのレイヤ間予測最大TIDを共通レイヤ間予測最大TIDとして符号化し、全てのレイヤで共通のレイヤ間予測最大TIDが用いられる場合には、レイヤ毎にレイヤ間予測最大TIDを符号化する。また、復号ピクチャ管理部14は、復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する。
上記の構成の画像符号化装置Aによれば、共通レイヤ間予測最大TIDが用いられる場合にはレイヤ毎にレイヤ間予測最大TIDの符号化を行う必要がないため、符号化データから冗長なフラグの符号をなくし符号量を削減する効果を奏する。
また、パラメータセット符号化部222Aは、全てのレイヤで共通のレイヤ間予測最大TIDが用いられる場合には、レイヤ間予測最大TIDアライメントフラグを1として符号化し、全てのレイヤに復号した1つのレイヤ間予測最大TIDを符号化し、全てのレイヤで共通のレイヤ間予測最大TIDが用いらない場合には、レイヤ間予測最大TIDアライメントフラグを0として符号化し、レイヤ毎にレイヤ間予測最大TIDを符号化しても良い。
また、パラメータセット符号化部222Aは、全てのレイヤで共通のレイヤ間予測最大TIDが用いられる場合には、所定の値以外(ここでは7未満)の共通レイヤ間予測最大TIDを符号化し、全てのレイヤで共通のレイヤ間予測最大TIDが用いらない場合には、共通レイヤ間予測最大TIDとして、所定の値(ここでは7)を符号化し、レイヤ毎にレイヤ間予測最大TIDを符号化することを特徴とする。
また、パラメータセット符号化部222Aは、全てのレイヤで共通のレイヤ間予測最大TIDが用いられる場合には、レイヤ間サブレイヤアライメントフラグを1として符号化し、ベースレイヤのレイヤ間予測最大TIDを所定の値以外(ここでは7未満)として符号化し、1つのレイヤ間予測最大TIDを共通レイヤ間予測最大TIDとして符号化し、てのレイヤで共通のレイヤ間予測最大TIDが用いられない場合には、レイヤ毎にレイヤ間予測最大TIDを符号化しても良い。
(階層動画像符号化装置2B)
以下、階層動画像符号化装置2の変形例である階層動画像符号化装置2Bを説明する。階層動画像符号化装置2Bが生成する符号化データは、階層動画像復号装置1Ba、階層動画像復号装置1Bb、階層動画像復号装置1Bc、階層動画像復号装置1Babcで復号される。
階層動画像符号化装置2Bは、ピクチャ符号化部21、可変長符号化部22B、復号ピクチャ管理部14を備える。ピクチャ符号化部21、復号ピクチャ管理部14、前述の実施形態と同様であるので説明を省略する。同様に、既に説明した手段と同一の符号を付した手段は、本実施形態でも同様の構成であるので、以降説明を省略する。
可変長符号化部22Bは、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを符号化するNALユニットヘッダ符号化部221Aと、少なくともレイヤ間予測最大TIDを符号化するパラメータセット符号化部222Aと、レイヤ間予測が可能であるか否かを示すフラグであるレイヤ間予測可能フラグを符号化するレイヤ間予測可能フラグ符号化部223Bを備える。レイヤ間予測可能フラグ符号化部223Bは、全てのレイヤで共通のレイヤ間予測最大TIDが用いられる場合には、TIDが、該共通のレイヤ間予測最大TID未満の場合にのみ、上記レイヤ間予測可能フラグを符号化し、それ以外の場合には、レイヤ間予測可能フラグを0として符号化しない。
また、可変長符号化部22Bは、レイヤ間予測のみを用いるか否かを示すフラグであるレイヤ間予測限定フラグを符号化するレイヤ間予測限定フラグ符号化部224Bを備える。レイヤ間予測可能フラグ符号化部224Bは、全てのレイヤで共通のレイヤ間予測最大TIDが用いられる場合には、TIDが、該共通のレイヤ間予測最大TID未満の場合にのみ、上記レイヤ間予測限定フラグを符号化し、それ以外の場合には、レイヤ間予測限定フラグを0として符号化しない。
また、可変長符号化部22Bは、テンポラル動き予測用の参照ピクチャを、レイヤIDによって指定するか否かを示すフラグである代替コロケート指示フラグを符号化する代替コロケート指示フラグ符号化部225Bを備える。代替コロケート指示フラグ符号化部225Bは、全てのレイヤで共通のレイヤ間予測最大TIDが用いられる場合には、TIDが、該共通のレイヤ間予測最大TID未満の場合にのみ、上記代替コロケート指示フラグを符号化し、それ以外の場合には、代替コロケート指示フラグを0として符号化しない。
(階層動画像符号化装置2C)
以下、階層動画像符号化装置2の変形例である階層動画像符号化装置2Cを説明する。階層動画像符号化装置2Bが生成する符号化データは、階層動画像復号装置1Ca、階層動画像復号装置1Cb、階層動画像復号装置1Ccで復号される。
階層動画像符号化装置2Cは、ピクチャ符号化部21、可変長符号化部22B、復号ピクチャ管理部14を備える。ピクチャ符号化部21、復号ピクチャ管理部14、前述の実施形態と同様であるので説明を省略する。同様に、既に説明した手段と同一の符号を付した手段は、本実施形態でも同様の構成であるので、以降説明を省略する。
可変長符号化部22Cは、NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを符号化するNALユニットヘッダ符号化部221Cと、少なくともレイヤ間予測最大TIDを符号化するパラメータセット符号化部222Cと、実依存レイヤ符号化部223Cを備える。実依存レイヤ符号化部223Cは、対象ピクチャのTemporalIDが、レイヤ間予測最大TIDmax_tid_il_ref_pics_plus1より小さい場合(max_tid_il_ref_pics_plus1から1を減算した値よりも以下の場合)に、依存レイヤリストに属する各レイヤのピクチャが前記対象ピクチャから参照されるか否かを示す実レイヤ依存フラグactive_direct_dependent_flagを符号化する。
上記構成の動画像符号化装置によれば、対象ピクチャのTemporalIDが、依存レイヤのmax_tid_il_ref_pics_plus1以上の場合には、該依存レイヤを参照するか否かを示すフラグである実レイヤ依存フラグを符号化しないため、符号量を低減する効果を奏する。
なお、上述した実施形態における階層動階層動画像符号化装置2、階層動画像復号装置1の全部もしくは一部をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、階層動画像復号装置1、階層動階層動画像符号化装置2のいずれかに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
また、上述した実施形態における階層動画像符号化装置2、階層動画像復号装置1の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。階層動画像符号化装置2、階層動画像復号装置1の各機能ブロックは個別にプロセッサ化しても良いし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、画像データが階層的に符号化された符号化データを復号する階層画像復号装置、および、画像データが階層的に符号化された符号化データを生成する階層画像符号化装置に好適に適用できる。また、階層画像符号化装置によって生成され、階層画像復号装置によって参照される階層符号化データのデータ構造に好適に適用できる。
1 階層動画像復号装置(画像復号装置)
11 NALユニットヘッダ復号部
11S1 NALユニットヘッダ復号部
11S2 NALユニットヘッダ復号部
12 可変長復号部(可変長復号手段)
121 パラメータセット復号部
121a パラメータセット復号部
121b パラメータセット復号部
121b パラメータセット復号部
121Ca パラメータセット復号部
121Cb パラメータセット復号部
121Cc パラメータセット復号部
122a スライスセグメントヘッダ復号部
122b スライスセグメントヘッダ復号部
122c スライスセグメントヘッダ復号部
122Ca スライスセグメントヘッダ復号部
122Cb スライスセグメントヘッダ復号部
122Cc スライスセグメントヘッダ復号部
1212a レイヤ間予測最大TIDアライメントフラグ復号部
1212b 共通レイヤ間予測最大TID復号部
1213a レイヤ間予測最大TID復号部
1213b レイヤ間予測最大TID復号部
1213c レイヤ間予測最大TID復号部
1221 RPS情報復号部
1222 RPL情報復号部
1223 実依存レイヤ復号部(レイヤ間参照ピクチャ情報復号部)
1223Ca 実依存レイヤ復号部
1223Cb 実依存レイヤ復号部
1223Cc 実依存レイヤ復号部
12231 レイヤ間予測可能フラグ復号部
12232 レイヤ間予測限定フラグ復号部
1224 代替コロケート指示情報復号部
123 スライスセグメントデータ復号部
13 ピクチャ復号部(ピクチャ復号手段)
14 復号ピクチャ管理部(復号ピクチャ管理手段)
141 DPB
142 RPS導出部
143 参照ピクチャ制御部
144 レイヤ間参照ピクチャ制御部(ベース参照ピクチャ制御手段)
145 RPL導出部
146 出力制御部(出力制御手段)
151 可変長復号部(可変長復号手段)
153 参照レイヤピクチャ復号部
154 参照レイヤピクチャ管理部(参照レイヤピクチャ管理手段)
2 階層動画像符号化装置(画像符号化装置)
21 ピクチャ符号化部
22 可変長符号化部
22S2 可変長符号化部
22A 可変長符号化部
22B 可変長符号化部
22C 可変長符号化部
221S2 NALユニットヘッダ符号化部
221A NALユニットヘッダ符号化部
222 パラメータセット符号化部
222A パラメータセット符号化部
223B レイヤ間予測可能フラグ符号化部
224B レイヤ間予測限定フラグ符号化部
225B 代替コロケート指示フラグ符号化部
223C 実レイヤ依存フラグ符号化部

Claims (14)

  1. NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、
    復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、
    前記NALユニットヘッダ復号部は、同じ表示時刻に属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号することを特徴とする画像復号装置。
  2. 前記画像復号装置であって、
    パラメータセットから少なくともレイヤ間サブレイヤアライメントフラグを復号するパラメータセット復号部を備え、
    前記NALユニットヘッダ復号部は、レイヤ間サブレイヤアライメントフラグが1の場合には、同じ表示時刻に属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号することを特徴とする請求項1に記載の画像復号装置。
  3. 前記画像復号装置であって、
    パラメータセットから少なくともプロファイルを復号するパラメータセット復号部を備え、
    前記NALユニットヘッダ復号部は、プロファイルがステレオ画像のプロファイルを示す場合には、同じ表示時刻に属する全てのレイヤの符号化データに同じ値のTIDが設定されているNALユニットヘッダを復号することを特徴とする請求項1から請求項2に記載の画像復号装置
  4. NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部を備え、
    復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、
    前記NALユニットヘッダ復号部は、あるレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じ表示時刻に属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを復号することを特徴とする画像復号装置。
  5. 前記画像復号装置であって、
    パラメータセットから少なくともレイヤ間サブレイヤアライメントフラグを復号するパラメータセット復号部を備え、
    前記NALユニットヘッダ復号部は、レイヤ間サブレイヤアライメントフラグが1の場合には、あるレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じ表示時刻に属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを復号することを特徴とする請求項4に記載の画像復号装置。
  6. 前記画像復号装置であって、
    パラメータセットから少なくともプロファイルを復号するパラメータセット復号部を備え、
    前記NALユニットヘッダ復号部は、プロファイルがステレオ画像のプロファイルを示す場合には、ベースレイヤのNALユニットタイプがTSAピクチャ、もしくは、STSAピクチャである場合には、同じ表示時刻に属する全てのレイヤの符号化データが同じTSAピクチャ、もしくは、STSAピクチャの値を有するNALユニットヘッダを復号することを特徴とする請求項4に記載の画像復号装置。
  7. NALユニットヘッダから少なくともレイヤIDと時間識別情報TIDを復号するNALユニットヘッダ復号部と、
    パラメータセットから少なくともレイヤ間予測最大TIDを復号するパラメータセット復号部と、
    復号対象ピクチャと同じレイヤの復号対象ピクチャのTID以下のTIDを有するピクチャ、もしくは、復号対象ピクチャとは異なるレイヤのレイヤ間予測最大TIDより小さいTIDを有するピクチャを参照ピクチャに設定する復号ピクチャ管理部を備え、
    パラメータセット復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合には、全てのレイヤに共通のレイヤ間予測最大TIDを割り当て、共通のレイヤ間予測最大TIDが用いられないと判定される場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする画像復号装置。
  8. 上記パラメータセット復号部は、レイヤ間予測最大TIDアライメントフラグを復号し、レイヤ間予測最大TIDアライメントフラグが1の場合には、1つのレイヤ間予測最大TIDを復号し、全てのレイヤに復号した1つのレイヤ間予測最大TIDを割り当て、レイヤ間予測最大TIDアライメントフラグが0の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする請求項7に記載の画像復号装置。
  9. 上記パラメータセット復号部は、共通レイヤ間予測最大TIDを復号し、共通レイヤ間予測最大TIDが所定の値以外の場合には、全てのレイヤに復号した共通レイヤ間予測最大TIDを割り当て、共通レイヤ間予測最大TIDが所定の値の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする請求項7に記載の画像復号装置。
  10. 上記パラメータセット復号部は、ベースレイヤのレイヤ間予測最大TIDが所定の値以外の場合には、全てのレイヤに復号したベースレイヤのレイヤのレイヤ間予測最大TIDを割り当て、ベースレイヤのレイヤ間予測最大TIDが所定の値の場合には、レイヤ毎にレイヤ間予測最大TIDを復号することを特徴とする請求項7に記載の画像復号装置。
  11. 上記画像復号装置は、さらに、レイヤ間予測が可能であるか否かを示すフラグであるレイヤ間予測可能フラグを復号するレイヤ間予測可能フラグ復号部を備え、
    上記レイヤ間予測可能フラグ復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合で、TIDが、該共通のレイヤ間予測最大TID未満の場合にのみ、上記レイヤ間予測可能フラグを復号し、それ以外の場合には、レイヤ間予測可能フラグを0に設定することを特徴とする請求項7から請求項10に記載の画像復号装置。
  12. 上記画像復号装置は、さらに、レイヤ間予測のみを用いるか否かを示すフラグであるレイヤ間予測限定フラグを復号するレイヤ間予測限定フラグ復号部を備え、
    上記レイヤ間予測限定フラグ復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合で、TIDが、該共通のレイヤ間予測最大TID未満の場合にのみ、上記レイヤ間予測限定フラグを復号し、それ以外の場合には、レイヤ間予測限定フラグを0に設定することを特徴とする請求項7から請求項10に記載の画像復号装置。
  13. 上記画像復号装置は、さらに、テンポラル動き予測用の参照ピクチャを、レイヤIDによって指定するか否かを示すフラグである代替コロケート指示フラグを復号する代替コロケート指示情報復号部を備え、
    上記代替コロケート指示情報復号部は、全てのレイヤで共通のレイヤ間予測最大TIDが用いられると判定される場合で、TIDが、該共通のレイヤ間予測最大TID未満の場合にのみ、上記代替コロケート指示フラグを復号し、それ以外の場合には、代替コロケート指示フラグを0に設定することを特徴とする請求項7から請求項10に記載の画像復号装置。
  14. 対象レイヤが参照する可能性のある対象レイヤとは異なるレイヤを示す情報である依存レイヤ情報を復号するレイヤ依存情報復号手段と、
    前記対象レイヤのある対象ピクチャが参照する、前記対象レイヤとは異なるレイヤのピクチャを示す情報を復号する実依存レイヤ情報復号手段と、
    前記実依存レイヤ情報に基づいて、少なくともレイヤ間参照ピクチャセットを生成する参照ピクチャセット導出手段を備え、
    前記レイヤ依存情報復号手段は、依存レイヤリストに属する各レイヤのピクチャが前記対象ピクチャから参照されるか否かを示す実レイヤ依存フラグを、前記対象ピクチャのTIDが、前記依存レイヤのレイヤ間予測最大TID未満にのみ、上記レイヤ間予測可能フラグに復号することを特徴とする動画像復号装置。
JP2013152608A 2013-07-10 2013-07-23 画像復号装置、および画像符号化装置 Pending JP2015035642A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013152608A JP2015035642A (ja) 2013-07-10 2013-07-23 画像復号装置、および画像符号化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013144616 2013-07-10
JP2013144616 2013-07-10
JP2013152608A JP2015035642A (ja) 2013-07-10 2013-07-23 画像復号装置、および画像符号化装置

Publications (1)

Publication Number Publication Date
JP2015035642A true JP2015035642A (ja) 2015-02-19

Family

ID=52543900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013152608A Pending JP2015035642A (ja) 2013-07-10 2013-07-23 画像復号装置、および画像符号化装置

Country Status (1)

Country Link
JP (1) JP2015035642A (ja)

Similar Documents

Publication Publication Date Title
KR102106190B1 (ko) 비디오 코딩을 위한 디코딩된 화상 버퍼 오퍼레이션들
JP6284661B2 (ja) 画像符号化装置、および画像符号化方法
JP6456535B2 (ja) 画像符号化装置、画像符号化方法および記録媒体
KR100908062B1 (ko) 비디오 신호의 디코딩/인코딩 방법 및 장치
TWI652940B (zh) 於視訊寫碼中用於基於子解碼圖像緩衝器(sub-dpb)之解碼圖像緩衝器操作之傳信
JP6352248B2 (ja) 画像復号装置、および画像符号化装置
US8855199B2 (en) Method and device for video coding and decoding
DK2786574T3 (en) ENABLING THE PARAMETER SET FOR MULTI-EXPOSURE VIDEO CODING (MVC) COMPATIBLE THREE-DIMENSIONAL VIDEO CODING (3DVC)
US20190082188A1 (en) Image decoding device, image decoding method, image coding device, and image coding method
US10205961B2 (en) View dependency in multi-view coding and 3D coding
US20170324981A1 (en) Method for decoding a video bitstream
JP2017192157A (ja) ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
MX2011013100A (es) Codificacion de video multivista sobre sistemas mpeg-2.
JP2010520697A (ja) ビデオ信号のデコーディング/エンコーディング方法及び装置
KR20140057533A (ko) 랜덤 액세스 픽처를 청정하게 하기 위해 가장 낮은 계층 식별을 할당하기 위한 인코더 및 방법
JPWO2014050597A1 (ja) 画像復号装置
CN114787921A (zh) 用于假设参考解码器和用于输出层集的视频数据流、视频编码器、装置和方法
Sjöberg et al. HEVC high-level syntax
JP2015119402A (ja) 画像復号装置、画像符号化装置、及び符号化データ
JP2014013975A (ja) 画像復号装置、符号化データのデータ構造、および画像符号化装置
JP2015035642A (ja) 画像復号装置、および画像符号化装置
JP2015002495A (ja) 画像復号装置、および画像符号化装置
JP2015050506A (ja) 画像復号装置および画像符号化装置
JPWO2015098713A1 (ja) 画像復号装置および画像符号化装置
JP2015076806A (ja) 画像復号装置および画像符号化装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150423