JP6465863B2 - 画像復号装置、画像復号方法及び記録媒体 - Google Patents

画像復号装置、画像復号方法及び記録媒体 Download PDF

Info

Publication number
JP6465863B2
JP6465863B2 JP2016507815A JP2016507815A JP6465863B2 JP 6465863 B2 JP6465863 B2 JP 6465863B2 JP 2016507815 A JP2016507815 A JP 2016507815A JP 2016507815 A JP2016507815 A JP 2016507815A JP 6465863 B2 JP6465863 B2 JP 6465863B2
Authority
JP
Japan
Prior art keywords
layer
decoding
output
target
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016507815A
Other languages
English (en)
Other versions
JPWO2015137432A1 (ja
Inventor
健史 筑波
健史 筑波
知宏 猪飼
知宏 猪飼
山本 智幸
智幸 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPWO2015137432A1 publication Critical patent/JPWO2015137432A1/ja
Application granted granted Critical
Publication of JP6465863B2 publication Critical patent/JP6465863B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像が階層的に符号化された階層符号化データを復号する画像復号装置、および画像復号方法に関する。
通信システムで伝送される情報、あるいは蓄積装置に記録される情報の1つに画像あるいは動画像がある。従来、これらの画像(以降、動画像を含む)の伝送・蓄積のため、画像を符号化する技術が知られている。
動画像符号化方式としては、AVC(H.264/MPEG-4 Advanced Video Coding)や、その後継コーデックであるHEVC(High-Efficiency Video Coding)が知られている(非特許文献1)。
これらの動画像符号化方式では、通常、入力画像を符号化/復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像(原画像)から減算して得られる予測残差(「差分画像」または「残差画像」と呼ぶこともある)が符号化される。また、予測画像の生成方法としては、画面間予測(インター予測)、および、画面内予測(イントラ予測)が挙げられる。
また、近年、必要なデータレートに従って、画像を階層的に符号化するスケーラブル符号化技術、又は階層符号化技術が提案されている。代表的なスケーラブル符号化方式(階層符号化方式)としてSHVC(Scalable HEVC)、及びMV-HEVC(MultiView HEVC)が知られている。
SHVCでは、空間スケーラビリティ、時間スケーラビリティ、SNRスケーラビリティをサポートする。例えば空間スケーラビリティの場合、原画像から所望の解像度にダウンサンプリングした画像を下位レイヤとして符号化する。次に上位レイヤではレイヤ間の冗長性を除去するためにレイヤ間予測を行う(非特許文献2)。
MV-HEVCでは、視点スケーラビリティ(ビュースケーラビリティ)をサポートする。例えば、視点画像0(レイヤ0)、視点画像1(レイヤ1)、視点画像2(レイヤ2)の3つの視点画像を符号化する場合、下位レイヤ(レイヤ0)から、上位レイヤである視点画像1、視点画像2をレイヤ間予測により予測することによりレイヤ間の冗長性の除去が可能である(非特許文献3)。
SHVCやMV-HEVCでは、入力される階層符号化データから、指定された対象出力レイヤセットに属する各レイヤを復号し、出力レイヤとして指定されたレイヤの復号ピクチャが出力される。出力レイヤセットに関する情報として、レイヤの集合を示すレイヤセット、及びレイヤセットのどのレイヤを出力レイヤとするかを指定する出力レイヤフラグ、各レイヤセットに対応するプロファイル/レベル情報(以降、PTL情報)、HRD情報、DPB情報等が復号/符号化される。
従来技術では、出力レイヤセットOLS#0〜OLS#(VpsNumLayerSets-1)までの出力レイヤセットには、各出力レイヤセットの添え字(出力レイヤセット識別子ともいう)に対応するレイヤセットLS#0〜LS#(VpsNumLayerSets - 1)と対応付けられ、各出力レイヤセットの出力レイヤは、デフォルト出力レイヤ識別子 (default_target_ouput_layer_idc)の値によって決まる。例えば、デフォルト出力レイヤ識別子の値が0の場合、出力レイヤセットの全レイヤが出力レイヤとなり、デフォルト出力レイヤ識別子の値が1の場合、出力レイヤセットの中で、最上位のレイヤIDを有するプライマリピクチャレイヤが出力レイヤとなり、デフォルト出力レイヤ識別子の値が2の場合、各出力レイヤセットOLS#i(i=1.. (VpsNumLayerSets-1))の出力レイヤは、明示的に通知される出力レイヤフラグ(output_layer_flag)によって指定される。
また、追加出力レイヤセットが定義される場合(追加出力レイヤセット数(num_add_output_layer_sets)が0より大きい場合)、各出力レイヤセットOLS#i(i=VpsNumLayerSets.. NumOuputLayerSets-1, 出力レイヤセット数NumOutputLayerSets = VpsNumlayerSets + num_add_output_layer_sets))は、明示的に通知されるレイヤセット識別子(LayerSetIdx[i] = output_layer_set_idx_minus1[i]+1)によって指定されるレイヤセットLS#(LayerSetIdx[i])と対応付けられ、さらに、明示的に通知される出力レイヤフラグ(output_layer_flag)によって出力レイヤが指定される。
非特許文献4は、MV-HEVCのステレオプロファイルの制約(プロファイル制約)として、ステレオプロファイルで抽出されるサブビットストリームは、補助ピクチャレイヤを含まないことが示されている。
「Recommendation H.265 (04/13)」, ITU-T (2013年6月7日公開) JCTVC-P1008_v4「High efficiency video coding (HEVC) scalable extensions Draft 5」, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 16th Meeting: San Jose, US, 9-17 Jan. 2014 (2014年1月22日公開) JCT3V-G1004_v6「MV-HEVC Draft Text 7」, Joint Collaborative Team on 3D Video Coding Extension Development of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 7th Meeting: San Jose, US, 11-17 Jan. 2014.(2014年1月24日公開) JCT3V-H0126_v2「MV-HEVC: On phrasing used in specifying the Stereo Main profile」, Joint Collaborative Team on 3D Video Coding Extension Development of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 8th Meeting: Valencia, ES, 29 Mar. - 4 Apr. 2014.(2014年4月04日公開)
しかしながら、従来技術では、出力レイヤセットに含まれる全レイヤを復号対象とし、復号処理が実行される。そのため、出力レイヤの復号に必要としないレイヤの復号処理を実行する必要があるという課題がある。例えば、図1において、出力レイヤセットOLS#1において、レイヤL#1、レイヤL#0が互いに独立である(参照しない)とする。このとき、従来技術では、出力レイヤL#1、及び非出力・非参照レイヤであるレイヤL#0の復号も実行される。
さらに、従来技術は、出力レイヤセットに含まれる全レイヤを復号対象とするため、同一のレイヤセット、例えば、図1のLS#1を参照し、異なる出力レイヤを有する出力レイヤセット、例えば、図1のOLS#1〜OLS#3の復号に必要とするDPB情報、及びPTL情報は同一となると考えられる。そのため、同一レイヤセットを参照する出力レイヤセットに対して、個別にDPB情報、及びPTL情報を指定するPTL指定識別子(profile_level_tier_idx)を通知することは多く場合、冗長であるという課題がある。
本発明は、上記問題に鑑みてされたものであり、その目的は、出力レイヤセットにおいて、非出力・非参照レイヤの復号処理を省略することで、非出力・非参照レイヤの復号に要する処理量、及びメモリサイズを削減することが可能な画像復号装置を実現することにある。また、同一レイヤセットを参照する出力レイヤセットに関するDPB情報、及びPTL情報の冗長性を削減することで、より少ない符号量でDPB情報、及びPTL情報を復号/符号化可能な画像復号装置、及び画像符号化装置を実現することにある。
さらに、非特許文献4では、必須とはいえない補助ピクチャの復号を省略するために、サブビットストリームに補助ピクチャレイヤを含まないことを求めているが、出力レイヤセットに補助ピクチャレイヤがある場合、補助ピクチャレイヤの復号処理を省略することができないという課題がある。
本発明は、上記問題に鑑みてされたものであり、その目的は、出力レイヤセットにおいて補助ピクチャレイヤが含まれる場合、補助ピクチャレイヤの復号処理を省略することで、補助ピクチャレイヤの復号に要する処理量、及びメモリサイズを削減することが可能な画像復号装置を実現することにある。
上記の課題を解決するために、本発明に係る画像復号装置は、階層画像符号化データを復号する画像復号装置であって、
レイヤセット単位で各レイヤが前記レイヤセットに含まれるか否かを示す第1のフラグを復号する第1のフラグ復号手段と、
上記第1のフラグに基づいて、前記レイヤセットのレイヤIDリストを導出するレイヤセット情報復号手段と、
出力レイヤセット単位で、
a)レイヤセット識別子、と
b)前記出力レイヤセットに含まれる各レイヤが出力レイヤであるか否かを示す出力レイヤフラグ
を含む出力レイヤセット情報を復号する出力レイヤセット情報復号手段と、
第1のレイヤが、第2のレイヤの参照レイヤであるか否かを示す依存フラグを導出する依存フラグ導出手段と、
上記出力レイヤセットに対応するレイヤセットの構成を示すレイヤIDリスト、上記出力レイヤセットの出力レイヤフラグ、及び上記依存フラグに基づいて、上記出力レイヤセットにおいて、復号するレイヤを示す復号レイヤIDリストを導出する復号レイヤIDリスト導出手段と、
上記導出された復号レイヤIDリストに含まれる各レイヤのピクチャを復号するピクチャ復号手段を備えることを特徴とする。
また、本発明に係る画像復号方法は、階層画像符号化データを復号する画像復号方法であって、
レイヤセット単位で各レイヤが前記レイヤセットに含まれるか否かを示す第1のフラグを復号する第1のフラグ復号ステップと、
上記第1のフラグに基づいて、前記レイヤセットのレイヤIDリストを導出するレイヤセット情報復号ステップと、
出力レイヤセット単位で、
a)レイヤセット識別子、と
b)前記出力レイヤセットに含まれる各レイヤが出力レイヤであるか否かを示す出力レイヤフラグ
を含む出力レイヤセット情報を復号する出力レイヤセット情報復号ステップと、
第1のレイヤが、第2のレイヤの参照レイヤであるか否かを示す依存フラグを導出する依存フラグ導出ステップと、
上記出力レイヤセットに対応するレイヤセットの構成を示すレイヤIDリスト、上記出力レイヤセットの出力レイヤフラグ、及び上記依存フラグに基づいて、上記出力レイヤセットにおいて、復号するレイヤを示す復号レイヤIDリストを導出する復号レイヤIDリスト導出ステップと、
上記導出された復号レイヤIDリストに含まれる各レイヤのピクチャを復号するピクチャ復号ステップを備えることを特徴とする。
本発明の一態様によれば、出力レイヤセットおいて、非出力・非参照レイヤの復号処理を省略することで、非出力・非参照レイヤの復号に要する処理量、及びメモリサイズを削減することが可能である。
本発明の一態様によれば、出力レイヤセットおいて、補助ピクチャレイヤの復号処理を省略することで、補助ピクチャレイヤの復号に要する処理量、及びメモリサイズを削減することができる。
本発明の一態様によれば、同一レイヤセットを参照する出力レイヤセットに関するDPB情報、及びPTL情報の冗長性を削減することが可能である。
従来技術における出力レイヤセットに関する課題を説明するための図であって、出力レイヤを有さない出力レイヤセット、及び出力レイヤの組み合わせが同じである重複した出力レイヤセットの例の一例である。 本発明の一実施形態に係る階層符号化データのレイヤ構造を説明するための図であって、(a)は、階層動画像符号化装置側について示しており、(b)は、階層動画像復号装置側について示している。 ビットストリーム抽出処理を説明するための図であって、レイヤセットA、及びそのサブセットであるレイヤセットBの構成を示す図である。 NALユニットレイヤを構成するデータ構造の例を示す図である。 NALユニットレイヤに含まれるシンタックスの例を示す図である。(a)はNALユニットレイヤを構成するシンタックス例を示し、(b)はNALユニットヘッダのシンタックス例を示す図である。 本発明の実施形態に係るNALユニットタイプの値とNALユニットの種別の関係を示す図である。 アクセスユニットに含まれるNALユニットの構成の一例を示す図である。 本発明の実施形態に係る階層符号化データの構成を説明するための図であって、(a)は、シーケンスSEQを既定するシーケンスレイヤ、(b)は、ピクチャPICTを規定するピクチャレイヤ、(c)は、スライスSを規定するスライスレイヤ、(d)は、スライスデータを規定するスライスデータレイヤ、(e)は、スライスデータに含まれる符号化ツリーユニットを規定する符号化ツリーレイヤ、(f)は、符号化ツリーに含まれる符号化単位(Coding Unit; CU)を規定する符号化ユニットレイヤを示す図である。 本実施形態に係るパラメータセットの参照関係を説明するための図である。 参照ピクチャリスト、及び参照ピクチャを説明するための図である。(a)は、参照ピクチャリストの一例を示し、(b)参照ピクチャの一例を示す概念図である。 本発明の実施形態に係るVPSのシンタックステーブルの一例である。 本発明の実施形態に係るVPS拡張データのシンタックステーブルの一例である。 本実施形態に係るPTL情報のシンタックステーブルの一例である。 本発明の実施形態に係るスケーラブル識別子について説明するための図である。(a)は、スケーラブル識別子とスケーラビリティタイプの対応表を示す図であり、(b)はスケーラブル識別の導出処理の一例を示す疑似コードであり、(c)はスケーラブル識別子に係るシンタックステーブルの一例である。 本発明の実施形態に係るDPB情報のシンタックステーブルの一例である。(a)は、出力レイヤセットOLS#0のDPB情報の一例であり、(b)は、出力レイヤセットOLS#i(i=1..NumOutputLayerSets-1)のDPB情報の一例である。 本発明におけるDPB情報の推定方法を説明するための図である。 本発明の実施形態に係るSPS/PPS/スライスレイヤのシンタックステーブルの一例である。(a)は、SPSのシンタックステーブルの一例であり、(b)は、PPSのシンタックステーブルの一例であり、(c)は、スライスレイヤに含まれるスライスヘッダ、及びスライスデータのシンタックステーブルの一例を示し、(d)は、スライスヘッダのシンタックステーブルの一例を示し、(e)スライスデータのシンタックステーブルの一例を示す。 本実施形態に係る階層動画像復号装置の構成を示す概略図である。 本実施形態に係る出力制御部16における対象復号レイヤIDリストの導出を説明するためのフローチャートである。 本実施形態に係るターゲットセットピクチャ復号部の構成を示す概略図である。 本実施形態に係るピクチャ復号部の動作を説明するためのフローチャートである。 本実施形態に係るビットストリーム抽出部におけるビットストリーム抽出処理1を説明するためのフローチャートである。 本実施形態に係るビットストリーム抽出部におけるビットストリーム抽出処理2を説明するためのフローチャートである。 本実施形態に係るサブビットストリーム特性情報に係るシンタックステーブルの一例である。 本実施形態に係る階層動画像符号化装置の構成を示す概略図である。 本実施形態に係るターゲットセットピクチャ符号化部の構成を示す概略図である。 本実施形態に係るピクチャ符号化部の動作を説明するためのフローチャートである。 上記階層動画像符号化装置を搭載した送信装置、および、上記階層動画像復号装置を搭載した受信装置の構成について示した図である。(a)は、階層動画像符号化装置を搭載した送信装置を示しており、(b)は、階層動画像復号装置を搭載した受信装置を示している。 上記階層動画像符号化装置を搭載した記録装置、および、上記階層動画像復号装置を搭載した再生装置の構成について示した図である。(a)は、階層動画像符号化装置を搭載した記録装置を示しており、(b)は、階層動画像復号装置を搭載した再生装置を示している。
図2〜図29に基づいて、本発明の一実施形態に係る階層動画像復号装置1および階層動画像符号化装置2を説明すれば以下のとおりである。
〔概要〕
本実施の形態に係る階層動画像復号装置(画像復号装置)1は、階層動画像符号化装置(画像符号化装置)2によって階層符号化された符号化データを復号する。階層符号化とは、動画像を低品質のものから高品質のものにかけて階層的に符号化する符号化方式のことである。階層符号化は、例えば、SVCやSHVCにおいて標準化されている。なお、ここでいう動画像の品質とは、主観的および客観的な動画像の見栄えに影響する要素のことを広く意味する。動画像の品質には、例えば、“解像度”、“フレームレート”、“画質”、および、“画素の表現精度”が含まれる。よって、以下、動画像の品質が異なるといえば、例示的には、“解像度”等が異なることを指すが、これに限られない。例えば、異なる量子化ステップで量子化された動画像の場合(すなわち、異なる符号化雑音により符号化された動画像の場合)も互いに動画像の品質が異なるといえる。
また、階層符号化技術は、階層化される情報の種類の観点から、(1)空間スケーラビリティ、(2)時間スケーラビリティ、(3)SNR(Signal to Noise Ratio)スケーラビリティ、および(4)ビュースケーラビリティに分類されることもある。空間スケーラビリティとは、解像度や画像のサイズにおいて階層化する技術である。時間スケーラビリティとは、フレームレート(単位時間のフレーム数)において階層化する技術である。SNRスケーラビリティは、符号化雑音において階層化する技術である。また、ビュースケーラビリティは、各画像に対応付けられた視点位置において階層化する技術である。
本実施形態に係る階層動画像符号化装置2及び階層動画像復号装置1の詳細な説明に先立って、まず(1)階層動画像符号化装置2によって生成され、階層動画像復号装置1によって復号される階層符号化データのレイヤ構造を説明し、次いで(2)各レイヤで採用できるデータ構造の具体例について説明を行う。
〔階層符号化データのレイヤ構造〕
ここで、図2を用いて、階層符号化データの符号化および復号について説明すると次のとおりである。図2は、動画像を、下位階層L3、中位階層L2、および上位階層L1の3階層により階層的に符号化/復号する場合について模式的に表わす図である。つまり、図2(a)および(b)に示す例では、3階層のうち、上位階層L1が最上位層となり、下位階層L3が最下位層となる。
以下において、階層符号化データから復号され得る特定の品質に対応する復号画像は、特定の階層の復号画像(または、特定の階層に対応する復号画像)と称される(例えば、上位階層L1の復号画像POUT#A)。
図2(a)は、入力画像PIN#A〜PIN#Cをそれぞれ階層的に符号化して符号化データDATA#A〜DATA#Cを生成する階層動画像符号化装置2#A〜2#Cを示している。図2(b)は、階層的に符号化された符号化データDATA#A〜DATA#Cをそれぞれ復号して復号画像POUT#A〜POUT#Cを生成する階層動画像復号装置1#A〜1#Cを示している。
まず、図2(a)を用いて、符号化装置側について説明する。符号化装置側の入力となる入力画像PIN#A、PIN#B、およびPIN#Cは、原画は同じだが、画像の品質(解像度、フレームレート、および画質等)が異なる。画像の品質は、入力画像PIN#A、PIN#B、およびPIN#Cの順に低くなる。
下位階層L3の階層動画像符号化装置2#Cは、下位階層L3の入力画像PIN#Cを符号化して下位階層L3の符号化データDATA#Cを生成する。下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報が含まれる(図2において“C”にて示している)。下位階層L3は、最下層の階層であるため、下位階層L3の符号化データDATA#Cは、基本符号化データとも称される。
また、中位階層L2の階層動画像符号化装置2#Bは、中位階層L2の入力画像PIN#Bを、下位階層の符号化データDATA#Cを参照しながら符号化して中位階層L2の符号化データDATA#Bを生成する。中位階層L2の符号化データDATA#Bには、符号化データDATA#Cに含まれる基本情報“C”に加えて、中位階層の復号画像POUT#Bを復号するのに必要な付加的情報(図2において“B”にて示している)が含まれる。
また、上位階層L1の階層動画像符号化装置2#Aは、上位階層L1の入力画像PIN#Aを、中位階層L2の符号化データDATA#Bを参照しながら符号化して上位階層L1の符号化データDATA#Aを生成する。上位階層L1の符号化データDATA#Aには、下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報“C”および中位階層L2の復号画像POUT#Bを復号するのに必要な付加的情報“B”に加えて、上位階層の復号画像POUT#Aを復号するのに必要な付加的情報(図2において“A”にて示している)が含まれる。
このように上位階層L1の符号化データDATA#Aは、異なる複数の品質の復号画像に関する情報を含む。
次に、図2(b)を参照しながら復号装置側について説明する。復号装置側では、上位階層L1、中位階層L2、および下位階層L3それぞれの階層に応じた復号装置1#A、1#B、および1#Cが、符号化データDATA#A、DATA#B、およびDATA#Cを復号して復号画像POUT#A、POUT#B、およびPOUT#Cを出力する。
なお、上位の階層符号化データの一部の情報を抽出(ビットストリーム抽出とも呼ぶ)して、より下位の特定の復号装置において、当該抽出した情報を復号することで特定の品質の動画像を再生することもできる。
例えば、中位階層L2の階層復号装置1#Bは、上位階層L1の階層符号化データDATA#Aから、復号画像POUT#Bを復号するのに必要な情報(すなわち、階層符号化データDATA#Aに含まれる“B”および“C”)を抽出して、復号画像POUT#Bを復号してもよい。言い換えれば、復号装置側では、上位階層L1の階層符号化データDATA#Aに含まれる情報に基づいて、復号画像POUT#A、POUT#B、およびPOUT#Cを復号できる。
なお、以上の3階層の階層符号化データに限られず、階層符号化データは、2階層で階層符号化されていてもよいし、3階層よりも多い階層数にて階層符号化されていてもよい。
また、特定の階層の復号画像に関する符号化データの一部または全部を他の階層とは独立して符号化し、特定の階層の復号の際に、他の階層の情報を参照しなくても済むように階層符号化データを構成してもよい。例えば、図2(a)および(b)を用いて上述した例では、復号画像POUT#Bの復号に“C”および“B”を参照すると説明したが、これに限られない。復号画像POUT#Bが“B”だけを用いて復号できるように階層符号化データを構成することも可能である。例えば、復号画像POUT#Bの復号に、“B”だけから構成される階層符号化データと、復号画像POUT#Cを入力とする階層動画像復号装置も構成できる。
なお、SNRスケーラビリティを実現する場合、入力画像PIN#A、PIN#B、およびPIN#Cとして同一の原画を用いた上で、復号画像POUT#A、POUT#B、およびPOUT#Cが異なる画質となるよう階層符号化データを生成することもできる。その場合、下位階層の階層動画像符号化装置が、上位階層の階層動画像符号化装置に較べて、より大きい量子化幅を用いて予測残差を量子化することで階層符号化データを生成する。
本書では、説明の便宜上、次のとおり用語を定義する。以下の用語は、特に断りがなければ、下記の技術的事項のことを表わすのに用いる。
プロファイル(Profile): プロファイルとは、特定のアプリケーションを想定し、規格に準拠するデコーダが備えるべき処理機能を規定するものであり、符号化ツール(要素技術)の組み合わせ、あるいは集合によって定義される。プロファイルを規定することで、個々のアプリケーションでは、規格全体でなく、適したプロファイルのみを実装すればよく、デコーダ/エンコーダの複雑度を低減することが可能となるメリットがある。
レベル(Level): レベルは、デコーダの処理能力上限や回路規模の範囲を規定するものであり、単位時間当たりの最大処理画素数、画像の最大解像度、最大ビットレート、最大参照画像バッファサイズ、最低限の圧縮率などのパラメータの制限を規定している。すなわち、レベルはデコーダの処理能力やビットストリームの複雑さを規定するものである。また、レベルでは、各プロファイルで規定されたツールを、どの範囲までサポートするかについても規定されている。そのため、上位のレベルでは、下位のレベルをサポートする必要がある。例えば、レベル制限される各種パラメータには、最大輝度ピクチャサイズ(Max luma picture size)、最大ビットレート(Max bitrate)、最大CPBサイズ(Max CPB size)、ピクチャ単位当りの最大スライスセグメント数(Max slice segments per picture)、ピクチャ単位当たりの最大タイル行数(Max number of tile rows)、ピクチャ単位当たりの最大タイル列数(Max number of tile columns)等がある。また、特定のプロファイルに対して適用される、レベル制限される各種パラメータには、最大輝度サンプルレート(Max luma sample rate)、最大ビットレート(Max bit rate)、及び最低圧縮比率(Mincompression Ratio)が挙げられる。なお、レベルのサブ概念として、各レベルに対応するビットストリーム(符号化データ)の最大ビットレート、及びビットストリームを格納する最大CPBサイズがメインティア(Main tier:コンシューマ用)で規定される値か、または、ハイティア(High tier:業務用)で規定される値であるか表す“ティア”(tier)がある。
HRD (Hypothetical Reference Decoder、仮想参照デコーダ) : HRDとは、バッファの動作を中心としたデコーダの仮想モデルであり、バッファモデルとも呼ばれる。HRDは、(1)ビットストリームの伝送バッファであるCPB(Coded Picture Buffer、符号化済ピクチャバッファ)、(2)瞬時に復号動作を行う復号処理部、(3)復号したピクチャを保存するDPB(Decoded Picture Buffer、復号ピクチャバッファ)、(4)切り出し処理を行うクロッピング処理部(画像の有効領域のみ切り出す処理)から構成される。
HRDの基本動作は以下の通りである。
(SA01)入力ビットストリームをCPBへ蓄積する;
(SA02)CPBに蓄積されたAUを瞬時復号処理する;
(SA03)瞬時復号処理して得られた復号済ピクチャをDPBへ保存する;
(SA04)DPBに保存された復号ピクチャをクロップして出力する;
HRDパラメータ(HRD parameters) : HRDパラメータとは、入力されたビットストリームが、HRDにおいて、コンフォーマンス条件を満たすか検証するために利用されるバッファモデルを示すパラメータである。
ビットストリームコンフォーマンス : ビットストリームコンフォーマンスとは、階層動画像復号装置(ここでは本発明の実施形態に係る階層動画像復号装置)が復号するビットストリームが満たす必要がある条件である。同様に、階層動画像符号化装置(ここでは本発明の実施形態に係る階層動画像符号化装置)が生成するビットストリームに関しても、上記階層動画像復号装置が復号可能なビットストリームであることを保障するため、上記ビットストリームコンフォーマンスを満たす必要がある。
VCL NALユニット : VCL(Video Coding Layer、ビデオ符号化レイヤ) NALユニットとは、動画像(映像信号)の符号化データを含むNALユニットである。例えば、VCL NALユニットには、スライスデータ(CTUの符号化データ)、及び当該スライスの復号を通じて共通で利用されるヘッダ情報(スライスヘッダ)が含まれる。
non-VCL NALユニット : non-VCL(non-Video Coding Layer、非ビデオ符号化レイヤ、非VCL) NALユニットとは、ビデオパラメータセットVPS、シーケンスパラメータセットSPS、ピクチャパラメータセットPPS等の各シーケンスやピクチャを復号する時に利用される符号化パラメータの集合であるヘッダ情報や補助情報SEI等の符号化データを含むNALユニットである。
レイヤ識別子 : レイヤ識別子(レイヤIDとも称する)は、階層(レイヤ)を識別するためのものであり、階層と1対1に対応する。階層符号化データには特定の階層の復号画像の復号に必要な部分符号化データを選択するために用いられる識別子が含まれる。特定のレイヤに対応するレイヤ識別子に関連付けられた階層符号化データの部分集合は、レイヤ表現とも呼称される。
一般に、特定の階層の復号画像の復号には、当該階層のレイヤ表現、および/または、当該階層の下位レイヤに対応するレイヤ表現が用いられる。すなわち、対象レイヤの復号画像の復号においては、対象レイヤのレイヤ表現、および/または、対象レイヤの下位レイヤに含まれる1つ以上階層のレイヤ表現が用いられる。
レイヤ : 特定の階層(レイヤ)のレイヤ識別子の値(nuh_layer_id, nuhLayerId)をもつVCL NAL UNIT及びそのVCL NALユニットに関連付けられたnon-VCL NAL UNITの集合、あるいは、階層的な関係をもつシンタックス構造の集合の一つである。
上位レイヤ : ある階層よりも上位に位置する階層のことを、上位レイヤと称する。例えば、図2において、下位階層L3の上位レイヤは、中位階層L2および上位階層L1である。また、上位レイヤの復号画像とは、より品質の高い(例えば、解像度が高い、フレームレートが高い、画質が高い等)復号画像のことをいう。
下位レイヤ : ある階層よりも下位に位置する階層のことを、下位レイヤと称する。例えば、図2において、上位階層L1の下位レイヤは、中位階層L2および下位階層L3である。また、下位レイヤの復号画像とは、より品質の低い復号画像のことをいう。
対象レイヤ : 復号または符号化の対象となっている階層のことをいう。なお、対象レイヤに対応する復号画像を対象レイヤピクチャと呼ぶ。また、対象レイヤピクチャを構成する画素を対象レイヤ画素と呼ぶ。
参照レイヤ : 対象レイヤに対応する復号画像を復号するのに参照される特定の下位レイヤのことを参照レイヤと称する。なお、参照レイヤに対応する復号画像を参照レイヤピクチャと呼ぶ。また、参照レイヤを構成する画素を参照レイヤ画素と呼ぶ。
図2(a)および(b)に示した例では、上位階層L1の参照レイヤは、中位階層L2および下位階層L3である。しかしながら、これに限られず、特定の上記レイヤの復号において、下位レイヤのすべてを参照しなくてもよいように階層符号化データを構成することもできる。例えば、上位階層L1の参照レイヤが、中位階層L2および下位階層L3のいずれか一方となるように階層符号化データを構成することも可能である。また、参照レイヤは、対象レイヤの復号に用いられる符号化パラメータ等を予測する際に利用(参照)される、対象レイヤとは異なるレイヤであるとも表現できる。対象レイヤのレイヤ間予測で、直接的に参照される参照レイヤは、直接参照レイヤと呼ばれる。また、対象レイヤの直接参照レイヤAのレイヤ間予測で参照される直接参照レイヤBは、対象レイヤが、間接的に依存するため、対象レイヤの間接参照レイヤとも呼ばれる。換言すれば、レイヤiが、1又は複数のレイヤk(i<k<j)を介して、レイヤjに対して、間接的に依存す場合、レイヤjは、レイヤiの間接参照レイヤである。なお、対象レイヤに対する直接参照レイヤ、及び間接参照レイヤを総称して、依存レイヤと呼ぶ。
基本レイヤ(base layer) : 最下層に位置する階層のことを基本レイヤと称する。基本レイヤの復号画像は、符号化データから復号され得るもっとも低い品質の復号画像であり、基本復号画像と呼称される。別の言い方をすれば、基本復号画像は、最下層の階層に対応する復号画像のことである。基本復号画像の復号に必要な階層符号化データの部分符号化データは基本符号化データと呼称される。例えば、上位階層L1の階層符号化データDATA#Aに含まれる基本情報“C”が基本符号化データである。また、基本レイヤは、少なくとも、同一のレイヤ識別子を有し、かつそのレイヤ識別子(nuh_layer_id)の値は0である、1又は複数のVCL NALユニットからなるレイヤである。
拡張レイヤ(non-base layer) : 基本レイヤの上位レイヤは、拡張レイヤと称される。また、拡張レイヤは、少なくとも、同一のレイヤ識別子を有し、そのレイヤ識別子(nuh_layer_id)の値が0より大きい、1又は複数のVCL NALユニットからなるレイヤである。
レイヤ間予測 : レイヤ間予測とは、対象レイヤのレイヤ表現と異なる階層(参照レイヤ)のレイヤ表現に含まれるシンタックス要素値、シンタックス要素値より導出される値、および復号画像に基づいて、対象レイヤのシンタックス要素値や対象レイヤの復号に用いられる符号化パラメータ等を予測することである。動き予測に関する情報を参照レイヤの情報から予測するレイヤ間予測のことをレイヤ間動き情報予測と称することもある。また、下位レイヤの復号画像から予測するレイヤ間予測のことをレイヤ間画像予測(あるいはレイヤ間テクスチャ予測)と称することもある。なお、レイヤ間予測に用いられる階層は、例示的には、対象レイヤの下位レイヤである。また、参照レイヤを用いず対象レイヤ内で予測を行うことをレイヤ内予測と称することもある。
テンポラル識別子: テンポラル識別子(テンポラルID)は、時間スケーラビリティに関するレイヤ(以降、サブレイヤ)を識別するための識別子である。テンポラル識別子は、サブレイヤを識別するためのものであり、サブレイヤと1対1に対応する。符号化データには特定のサブレイヤの復号画像の復号に必要な部分符号化データを選択するために用いられるテンポラル識別子が含まれる。特に、最高次(最上位)のサブレイヤのテンポラル識別子を最高次(最上位)テンポラル識別子(highest TemporalId, highestTid)と称する。
サブレイヤ: サブレイヤとは、テンポラル識別子により特定される時間スケーラビリティに関するレイヤである。空間スケーラビリティ、SNRスケーラビリティ等、そのほかのスケーラビリティと区別するため、以降サブレイヤと称する(テンポラルレイヤとも称する)。また、以降では、時間スケーラビリティは、基本レイヤの符号化データ、またはあるレイヤを復号するために必要な階層符号化データ、に含まれるサブレイヤによって実現されるものとする。
レイヤセット: レイヤセットとは、1以上のレイヤからなるレイヤの集合である。特に、レイヤセットの構成は、レイヤIDリストLayerSetLayerIdList[](あるいは、LayerIdList[])によって表現され、レイヤセットに含まれるレイヤを識別するレイヤID(または、VPS上でのレイヤの順番を示すインデクス)は、レイヤIDリストLayerIdList[K](K=0.. N-1, Nはレイヤセットに含まれるレイヤ数)の各要素に、格納される。
出力レイヤセット: 出力レイヤセットとは、上記レイヤセットに含まれるレイヤに対して、出力レイヤであるかどうか指定されたレイヤの集合である。また、出力レイヤセットは、レイヤセットと出力レイヤを指定する出力レイヤフラグの組み合わせにより表現される集合とも表現される。以下、識別子iで識別される出力レイヤセットをOLS#iと記載する。
出力レイヤ : 出力レイヤとは、上記出力レイヤセットにおいて、復号または符号化の対象となるレイヤのうち、該レイヤの復号ピクチャを、出力ピクチャとして出力することが指定されたレイヤのことである。
代替出力レイヤ: 代替出力レイヤとは、上記出力レイヤセットにおいて、出力レイヤとして指定されたレイヤの復号画像が何らかの理由により復号できない場合、該出力レイヤとは別のレイヤの復号画像を代替として出力されるレイヤである。
ビットストリーム抽出処理 : ビットストリーム抽出処理とは、あるビットストリーム(階層符号化データ、符号化データ)から、対象最高次テンポラル識別子(highestTid)、及び対象レイヤセットに含まれるレイヤを表わすレイヤIDリストLayerIdList[]によって定まる集合(ターゲットセットTargetSetと呼ぶ)に含まれないNALユニットを除去(破棄)し、ターゲットセットTargetSetに含まれるNALユニットから構成されるビットストリームを抽出する処理である。なお、ビットストリーム抽出は、サブビットストリーム抽出とも呼ばれる。
また、対象最高次テンポラル識別子をTargetHighestTidと称し、対象レイヤセットをTargetLayerSetと称し、対象レイヤセットのレイヤIDリスト(対象レイヤIDリスト)をTargetLayerIdListとも称する。特に、復号対象となるレイヤIDリストを、TargetDecLayerIdListとも呼ぶ。また、ビットストリーム抽出により生成された、ターゲットセットTargetSetに含まれるNALユニットから構成されるビットストリームを符号化データBitstreamToDecodeとも称する。
次に、図3を参照して、ビットストリーム抽出処理により、あるレイヤセットAを含む階層符号化データより、レイヤセットAのサブセットとなるレイヤセットBを含む階層符号化データを抽出する例について説明する。
図3は、3つのレイヤ(L#0, L#1, L#2)、及び各レイヤは3つのサブレイヤ(TID1, TID2, TID3)からなるレイヤセットA、及びそのサブセットであるレイヤセットBの構成を表わす。なお、以降では、レイヤセットを構成するレイヤ、及びサブレイヤを、{LayerIdList={L#0,…,L#N}, HighestTid=K}と表わす。例えば、図3のレイヤセットAは、{LayerIdList={L#0, L#1, L#2}, HighestTid=3}と表現される。ここで、符号L#Nは、あるレイヤNを示し、図3中の各ボックスは、ピクチャを表わし、ボックス内の番号は、復号順の一例を表わす。以降、ピクチャで番号Nを、P#Nと表記する。
また、各ピクチャ間の矢印は、ピクチャ間の依存方向(参照関係)を表わす。同一レイヤ内の矢印であれば、インター予測に利用される参照ピクチャであることを示す。レイヤ間の矢印であれば、レイヤ間予測に利用される参照ピクチャ(参照レイヤピクチャともいう)であることを表わす。
また、図3中のAUは、アクセスユニットを表わし、符号#Nは、アクセスユニット番号を表わす。AU#Nは、ある起点(例えば、ランダムアクセス開始点)のAUをAU#0とすれば、(N−1)番目のアクセスユニットであることを表わし、ビットストリームに含まれるAUの順番を表わす。すなわち、図3の例であれば、ビットストリーム上で、アクセスユニットは、AU#0、AU#1、AU#2、AU#3、AU#4..の順で並んでいる。なお、アクセスユニットとは、特定の分類ルールにより集約されたNALユニットの集合を表わす。図3のAU#0は、ピクチャP#1、P#1、及びP#3の符号化データを含むVCL NALの集合とみることができる。なお、アクセスユニットの詳細については後述する。なお、本明細書では、X番目と記す場合、先頭要素が0番目であり、0番目から数えることとする(以下同様)。
図3の例では、ターゲットセットTargetSet(レイヤセットB)は、{LayerIdList={L#0,L#1}、HighestTid=2}であるから、レイヤセットAを含むビットストリームから、ターゲットセットTargetSetに含まれないレイヤ、及び最高次テンポラルID(HighestTid=2)より大きいサブレイヤを、ビットストリーム抽出により破棄する。すなわち、レイヤIDリストに含まれないレイヤL#2、及びサブレイヤ(TID3)を有するNALユニットが破棄され、最終的には、レイヤセットBを含むビットストリームが抽出される。図3では、点線のボックスは、破棄されたピクチャを表わし、点線の矢印は、破棄されたピクチャと参照ピクチャ間の依存方向を示す。なお、レイヤL#3、及びTID3のサブレイヤのピクチャを構成するNALユニットは破棄済のため、依存関係は既に断ち切られている。
SHVCやMV-HEVCでは、SNRスケーラビリティ、空間スケーラビリティ、時間スケーラビリティ等を実現するために、レイヤ、及びサブレイヤの概念が導入されている。図3で既に説明したように、フレームレートを変更し時間スケーラビリティを実現する場合、ビットストリーム抽出処理により、まず他のピクチャから参照されないピクチャ(最高次テンポラルID(TID3))の符号化データを破棄する。図3の場合、ピクチャ(10、13、11、14、12、15)の符号化データを破棄することにより、フレームレートが1/2となる符号化データが生成される。
また、SNRスケーラビリティ、空間スケーラビリティや、ビュースケーラビリティを実現する場合、ビットストリーム抽出により、ターゲットセットTargetSetに含まれない、レイヤの符号化データを破棄することで、各スケーラビリティの粒度を変更することができる。図3の場合、ピクチャ(3、6、9、12、15)の符号化データを破棄することで、スケーラビリティの粒度を粗くした符号化データが生成される。上記処理を繰り返すことで、段階的にレイヤ、サブレイヤの粒度を調整することができる。
なお、以上の用語は、飽くまで説明の便宜上のものであり、上記の技術的事項を別の用語にて表現してもかまわない。
〔階層符号化データのデータ構造について〕
以下、各階層の符号化データを生成する符号化方式として、HEVCおよびその拡張方式を用いる場合について例示する。しかしながら、これに限られず、各階層の符号化データを、MPEG-2や、H.264/AVCなどの符号化方式により生成してもよい。
また、下位レイヤと上位レイヤとが異なる符号化方式によって符号化されていてもよい。また、各階層の符号化データは、互いに異なる伝送路を介して階層動画像復号装置1に供給されてもよいし、同一の伝送路を介して階層動画像復号装置1に供給されてもよい。
例えば、超高精細映像(動画像、4K映像データ)を基本レイヤおよび1つの拡張レイヤによりスケーラブル符号化して伝送する場合、基本レイヤは、4K映像データをダウンスケーリングし、インタレース化した映像データをMPEG-2またはH.264/AVCにより符号化してテレビ放送網で伝送し、拡張レイヤは、4K映像(プログレッシブ)をHEVCにより符号化して、インターネットで伝送してもよい。
<階層符号化データDATAの構造>
本実施形態に係る画像符号化装置2および画像復号装置1の詳細な説明に先立って、画像符号化装置2によって生成され、画像復号装置1によって復号される階層符号化データDATAのデータ構造について説明する。
(NALユニットレイヤ)
図4は、階層符号化データDATAにおけるデータの階層構造を示す図である。階層符号化データDATAは、NAL(Network Abstraction Layer)ユニットと呼ばれる単位で符号化される。
NALは、動画像符号化処理を行う層であるVCL(Video Coding Layer)と、符号化データを伝送・蓄積する下位システムとの間における通信を抽象化するために設けられる層である。
VCLは、画像符号化処理を行う層のことであり、VCLにおいて符号化が行われる。一方、ここでいう、下位システムは、H.264/AVCおよびHEVCのファイルフォーマットや、MPEG-2システムに対応する。以下に示す例では、下位システムは、対象レイヤおよび参照レイヤにおける復号処理に対応する。なお、NALでは、VCLで生成されたビットストリームが、NALユニットという単位で区切られて、宛先となる下位システムへ伝送される。
図5(a)は、NALユニットのシンタックステーブルを示す。NALユニットには、VCLで符号化された符号化データ、および、当該符号化データが宛先の下位システムに適切に届けられるためのヘッダ(NALユニットヘッダ:nal_unit_header())が含まれる。NALユニットヘッダは、例えば、図5(b)に示すシンタックスで表わされる。NALユニットヘッダには、NALユニットに格納された符号化データの種類を表わす“nal_unit_type”、格納された符号化データが属するサブレイヤの識別子(テンポラル識別子)を表わす”nuh_temporal_id_plus1”や、格納された符号化データが属するレイヤの識別子(レイヤ識別子)を表わす”nuh_layer_id”(または、nuh_reserved_zero_6bits)が記述されている。一方、NALユニットデータには、後述のパラメータセット、SEI、スライスなどが含まれる。
図6は、NALユニットタイプの値とNALユニットの種別の関係を示す図である。図6に示す通り、SYNA101で示される0から15の値のNALユニットタイプを持つNALユニットは、非RAP (ランダムアクセスピクチャ)のスライスである。SYNA102で示される16から21の値のNALユニットタイプを持つNALユニットは、RAP (ランダムアクセスピクチャ、IRAPピクチャ)のスライスである。RAPピクチャには、大きく分けて、BLAピクチャ、IDRピクチャ、CRAピクチャがあり、BLAピクチャは、さらに、BLA_W_LP、BLA_W_DLP、BLA_N_LPに分類される。IDRピクチャは、さらに、IDR_W_DLP、IDR_N_LPに分類される。RAPピクチャ以外のピクチャには、リーディングピクチャ(LPピクチャ)、テンポラルアクセスピクチャ(TSAピクチャ、STSAピクチャ)、トレイリングピクチャ(TRAILピクチャ)などがある。なお、各階層における符号化データは、NALユニットに格納されることでNAL多重化されて階層動画像復号装置1に伝送される。
図6、特にNAL Unit Type Classで示されるように、各NALユニットは、NALユニットタイプに応じて、ピクチャを構成するデータ(VCLデータ)と、それ以外のデータ(non-VCL)に分類される。ピクチャは、ランダムアクセスピクチャ、リーディングピクチャ、トレイリングピクチャなどのピクチャ種別によらず、全てVCL NALユニットに分類され、ピクチャの復号に必要なデータであるパラメータセットや、ピクチャの補助情報であるSEI、シーケンスの区切りを表わすアクセスユニットデリミタ(AUD)、エンドオブシーケンス(EOS)、エンドオブビットストリーム(EOB)などは、non-VCL NALユニットに分類される。
(アクセスユニット)
特定の分類ルールにより集約されたNALユニットの集合のことをアクセスユニットと呼ぶ。レイヤ数が1の場合には、アクセスユニットは1ピクチャを構成するNALユニットの集合である。レイヤ数が1より大きい場合には、アクセスユニットは同じ時刻(同一出力タイミング)の複数のレイヤのピクチャを構成するNALユニットの集合である。なお、アクセスユニットの区切りを示すために、符号化データはアクセスユニットデリミタ(AUD:Access unit delimiter)と呼ばれるNALユニットを含んでも良い。アクセスユニットデリミタは、符号化データ中にあるアクセスユニットを構成するNALユニットの集合と、別のアクセスユニットを構成するNALユニットの集合の間に含まれる。
図7は、アクセスユニットに含まれるNALユニットの構成の一例を示す図である。同図において、AUには、AUの先頭であることを示すアクセスユニットデリミタ(AUD)、各種パラメータセット(VPS, SPS, PPS)、各種SEI(Prefix SEI, Suffix SEI)、レイヤ数が1の場合は1ピクチャを構成するVCL(slice)、レイヤ数が1より大きい場合はレイヤ数分のピクチャを構成するVCL、シーケンスの終端を示すEOS(End of Sequence)、ビットストリームの終端を示すEOB(End of Bitstream)等のNALユニットから構成される。なお、図7において、VPS, SPS, SEI, VCLの後の符号L#K(K=Nmin.. Nmax)は、レイヤID(あるいは、VPS上で定義されたレイヤの順番を示すインデクス)を表わす。図7の例では、AU内に、VPSを除き、各レイヤL#Nmin〜レイヤL#NmaxのSPS, PPS, SEI, VCLが、レイヤID(あるいは、VPS上で定義されたレイヤの順番を示すインデクス)の昇順で存在する。図7の例では、VPSは、最低次のレイヤIDでのみ送られる。なお、図7において、特定NALユニットがAU内に存在するか、または繰り返し存在するかを、矢印によって示している。
例えば、特定のNALユニットがAU内に存在すれば、そのNALユニットを通過する矢印で示し、特定のNALユニットがAU内に存在しなければ、そのNALユニットをスキップする矢印で示している。例えば、AUDを通らずに、VPSへ向かう矢印は、AUDがAU内に存在しない場合を示す。また、VCLを通過してから再びVCLへ戻る矢印は、1以上のVCLが存在する場合を示す。
また、最低次以外の上位のレイヤIDを有するVPSがAU内に含まれてもよいが、画像復号装置は、最低次以外のレイヤIDを有するVPSを無視するものとする。また、各種パラメータセット(VPS,SPS,PPS)や補助情報であるSEIは、図7のように、アクセスユニットの一部として含まれてもよいし、ビットストリームとは別の手段でデコーダに伝達されてもよい。なお、図7は、アクセスユニットに含まれるNALユニットの構成の一実施形態に過ぎず、アクセスユニットに含まれるNALユニットの構成は、ビットストリームを復号することが可能な範囲で変更が可能である。
特に、レイヤ識別子nuhLayerId=0のIRAPピクチャを含むアクセスユニットを、IRAPアクセスユニット(ランダムアクセスポイント・アクセスユニット)と呼ぶ。また、ターゲットセットに含まれる全レイヤの復号処理の初期化を実施するIRAPアクセスユニットを初期化IRAPアクセスユニットと呼ぶ。また、復号順で、初期化IRAPアクセスユニットから、0以上の非初期化IRAPアクセスユニット(初期化IRAPアクセスユニット以外のアクセスユニット)が続き、次の初期化IRAPアクセスユニットまでのアクセスユニットの集合(ただし、次の初期化IRAPアクセスユニットは除く)を、CVS(Coded Video Sequence;符号化ビデオシーケンス、以降ではシーケンスSEQとも称する)とも称する。
図8は、階層符号化データDATAにおけるデータの階層構造を示す図である。階層符号化データDATAは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。図8の(a)〜(f)は、それぞれ、シーケンスSEQを既定するシーケンスレイヤ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、スライスデータを規定するスライスデータレイヤ、スライスデータに含まれる符号化ツリーユニットを規定する符号化ツリーレイヤ、符号化ツリーに含まれる符号化単位(Coding Unit;CU)を規定する符号化ユニットレイヤを示す図である。
(シーケンスレイヤ)
シーケンスレイヤでは、処理対象のシーケンスSEQ(以下、対象シーケンスとも称する)を復号するために画像復号装置1が参照するデータの集合が規定されている。シーケンスSEQは、図8の(a)に示すように、ビデオパラメータセット(Video Parameter Set)シーケンスパラメータセットSPS(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、ピクチャPICT、及び、付加拡張情報SEI(Supplemental Enhancement Information)を含んでいる。ここで#の後に示される値はレイヤIDを示す。図8では、#0と#1すなわちレイヤIDが0とレイヤIDが1の符号化データが存在する例を示すが、レイヤの種類およびレイヤの数はこれに限定されない。
(ビデオパラメータセット)
図11は、ビデオパラメータセットVPSのシンタックス表の一例であり、図12は、ビデオパラメータセットVPSの拡張データのシンタックス表の一例である。ビデオパラメータセットVPSでは、1以上のレイヤから構成される符号化データを復号するために画像復号装置1が参照する符号化パラメータの集合が規定されている。例えば、後述のシーケンスパラメータセットや他のシンタックス要素が参照するVPSを識別するために用いるVPS識別子(video_parameter_set_id)(図11上のSYNVPS01)や、符号化データに含まれるレイヤ数(vps_max_layers_minus1) (図11上のSYNVPS02)、レイヤに含まれるサブレイヤ数(vps_sub_layers_minus1) (図11上のSYNVPS03)、符号化データ中で表現される1以上のレイヤからなるレイヤの集合を規定するレイヤセットの数(vps_num_layer_sets_minus1) (図11上のSYNVPS06)、レイヤセットを構成するレイヤの集合を規定するレイヤセット情報(レイヤセット、layer_id_included_flag[i][j]) (図11上のSYNVPS07)や、レイヤ間の依存関係(直接依存フラグdirect_dependency_flag[i][j])(図12上のSYNVPS0C)、出力レイヤセットを構成する出力レイヤの集合や、PTL情報等を規定した出力レイヤセット情報 (デフォルト出力レイヤ識別子default_target_output_layer_idc、関連するレイヤセット識別子output_layer_set_idx_minus1、出力レイヤフラグoutput_layer_flag[i][j]、代替出力レイヤフラグalt_output_layer_flag[i]、PTL指定識別子profile_level_tier_idx[i]など)(図12上のSYNVPS0G〜SYNVPS0M)などが規定されている。VPSは符号化データ内に複数存在してもよい。その場合、対象シーケンス毎に復号に用いられるVPSが複数の候補から選択される。
あるレイヤに属する特定シーケンスの復号に使用されるVPSは、アクティブVPSと呼ばれる。以下では、特に断りがなければ、VPSは、あるレイヤに属する対象シーケンスに対するアクティブVPSを意味する。
(シーケンスパラメータセット)
図17(a)は、シーケンスパラメータセットSPSのシンタックス表の一例である。シーケンスパラメータセットSPSでは、対象シーケンスを復号するために画像復号装置1が参照する符号化パラメータの集合が規定されている。例えば、対象SPSが参照するアクティブVPSを表わすアクティブVPS識別子(sps_video_parameter_set_id)(図17(a)上のSYNSPS01)、後述のピクチャパラメータセットや他のシンタックス要素が参照するSPSを識別するために用いるSPS識別子(sps_seq_parameter_set_id)(図17(a)上のSYNSPS02)や、ピクチャの幅や高さが規定される。SPSは符号化データ内に複数存在してもよく、その場合には、対象シーケンス毎に復号に用いられるSPSが複数の候補から選択される。
あるレイヤに属する特定シーケンスの復号に使用されるSPSは、アクティブSPSとも呼ばれる。以下では、特に断りがなければ、SPSは、あるレイヤに属する対象シーケンスに対するアクティブSPSを意味する。
(ピクチャパラメータセット)
図17(b)は、ピクチャパラメータセットPPSのシンタックス表の一例である。ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために画像復号装置1が参照する符号化パラメータの集合が規定されている。例えば、対象PPSが参照するアクティブSPSを表わすアクティブSPS識別子(pps_seq_parameter_set_id)(図17(b)のSYNPPS01)、後述のスライスヘッダや他のシンタックス要素が参照するPPSを識別するために用いるPPS識別子(pps_pic_parameter_set_id)(図17(b)のSYNPPS02)や、ピクチャの復号に用いられる量子化幅の基準値(pic_init_qp_minus26)や重み付き予測の適用を示すフラグ(weighted_pred_flag)、スケーリングリスト(量子化マトリックス)が含まれる。なお、PPSは複数存在してもよく、その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。
あるレイヤに属する特定ピクチャの復号に使用されるPPSはアクティブPPSと呼ばれる。以下では、特に断りがなければ、PPSは、あるレイヤに属する対象ピクチャに対するアクティブPPSを意味する。なお、アクティブSPS、及びアクティブPPSは、レイヤ毎に異なるSPSやPPSに設定してもよい。すなわち、レイヤ毎に異なるSPSやPPSを参照して復号処理を実行することができる。
(ピクチャレイヤ)
ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。ピクチャPICTは、図8(b)に示すように、スライスS0〜SNS-1を含んでいる(NSはピクチャPICTに含まれるスライスの総数)。なお、以下、スライスS0〜SNS-1のそれぞれを区別する必要が無い場合、符号の添字を省略して記述することがある。また、以下に説明する階層符号化データDATAに含まれるデータであって、添字を付している他のデータについても同様である。
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する、スライスセグメント)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。スライスSは、図8(c)に示すように、スライスヘッダSH、および、スライスデータSDATAを含んでいる。
スライスヘッダSHには、対象スライスの復号方法を決定するために階層動画像復号装置1が参照する符号化パラメータ群が含まれる。図17(d)は、スライスヘッダのシンタックス表の一例である。例えば、対象スライスを復号するために参照するPPS(アクティブPPS)を指定するアクティブPPS識別子(slice_pic_parameter_set_id)(図17(d)のSYNSH02)が含まれる。なお、アクティブPPSが参照するSPSは、アクティブPPSに含まれるアクティブSPS識別子(pps_seq_parameter_set_id)により指定される。さらに、アクティブSPSが参照するVPS(アクティブVPS)は、アクティブSPSに含まれるアクティブVPS識別子(sps_video_parameter_set_id)により指定される。
図9を例に、パラメータセットのアクティベートについて説明する。同図は、ヘッダ情報とアクセスユニット(AU)を構成する符号化データの参照関係を説明する。同図の例では、各AU内のレイヤL#K(K=Nmin.. Nmax)に属するピクチャを構成する各スライスは、参照すべきPPSを指定するアクティブPPS識別子をスライスヘッダ内に含んでおり、各スライスの復号開始時に該識別子によって復号に用いるPPS(アクティブPPS)を指定する(アクティベートするともいう)。なお、同一ピクチャ内のスライスが参照する各PPS, SPS, VPSの識別子は同一でなければならない。アクティベートされたPPSの中には、復号処理上参照すべきSPS(アクティブSPS)を指定するアクティブSPS識別子が含まれており、該識別子によって復号に用いるSPS(アクティブSPS)を指定する。同様に、アクティベートされたSPSの中には、各レイヤに属するシーケンスの復号処理上参照すべきVPS(アクティブVPS)を指定するアクティブVPS識別子が含まれており、該識別子によって復号に用いるVPS(アクティブVPS)を指定する。以上の手順により、各レイヤの符号化データの復号処理を実行するにあたって必要なパラメータセットが確定する。
なお、各ヘッダ情報(スライスヘッダSH、PPS、SPS)が参照する上位のパラメータセットの識別子は、同図の例に限定されない。VPSであれば、VPS識別子k=0.. 15の中から選択されてよいし、SPSであれば、SPS識別子m=0.. 15の中から選択されてよいし、PPSであれば、PPS識別子n=0.. 63の中から選択されてよい。
また、スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、または、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、または、イントラ予測を用いるBスライスなどが挙げられる。
(スライスデータレイヤ)
スライスデータレイヤでは、処理対象のスライスデータSDATAを復号するために階層動画像復号装置1が参照するデータの集合が規定されている。スライスデータSDATAは、図8(d)に示すように、符号化ツリーブロック(CTB:Coded Tree Block)を含んでいる。CTBは、スライスを構成する固定サイズ(例えば64×64)のブロックであり、最大符号化単位(LCU:Largest Cording Unit)と呼ぶこともある。
(符号化ツリーレイヤ)
符号化ツリーレイヤは、図8(e)に示すように、処理対象の符号化ツリーブロックを復号するために階層動画像復号装置1が参照するデータの集合が規定されている。符号化ツリーユニットは、再帰的な4分木分割により分割される。再帰的な4分木分割により得られる木構造のノードのことを符号化ツリー(coding tree)と称する。4分木の中間ノードは、符号化ツリーユニット(CTU:Coded Tree Unit)であり、符号化ツリーブロック自身も最上位のCTUとして規定される。CTUは、分割フラグ(split_flag)を含み、split_flagが1の場合には、4つの符号化ツリーユニットCTUに分割される。split_flagが0の場合には、符号化ツリーユニットCTUは4つの符号化ユニット(CU:Coded Unit)に分割される。符号化ユニットCUは符号化ツリーレイヤの末端ノードであり、このレイヤではこれ以上分割されない。符号化ユニットCUは、符号化処理の基本的な単位となる。
なお、符号化ツリーユニットより復号される対象ピクチャ上の部分領域を符号化ツリーブロック(CTB: Coding Tree block)と呼ぶ。対象ピクチャの輝度成分である輝度ピクチャに対応するCTBは輝度CTBと呼ばれる。換言すると、CTUから復号される輝度ピクチャ上の部分領域は輝度CTBと呼ばれる。一方、CTUから復号される色差ピクチャに対応する部分領域は色差CTBと呼ばれる。一般に、画像の色フォーマットが決まっていれば、輝度CTBサイズと色差CTBサイズは相互に変換可能である。例えば、色フォーマットが4:2:2の場合は、色差CTBサイズは輝度CTBサイズの各半分である。以下の記載では、特に断りがなければ、CTBサイズとは輝度CTBサイズを意味する。また、CTUサイズは、CTUに対応する輝度CTBサイズである。
(符号化ユニットレイヤ)
符号化ユニットレイヤは、図8(f)に示すように、処理対象の符号化ユニットを復号するために階層動画像復号装置1が参照するデータの集合が規定されている。具体的には、符号化ユニットCU(coding unit)は、CUヘッダCUH、予測ツリー、変換ツリーから構成される。CUヘッダCUHでは、符号化ユニットが、イントラ予測を用いるユニットであるか、インター予測を用いるユニットであるかなどが規定される。符号化ユニットは、予測ツリー(prediction tree;PT)および変換ツリー(transform tree;TT)のルートとなる。なお、CUに対応するピクチャ上の領域は符号化ブロック(CB:Coding Block)と呼ばれる。輝度ピクチャ上のCBを輝度CB、色差ピクチャ上のCBを色差CBと呼ぶ。CUサイズ(符号化ノードのサイズ)とは、輝度CBサイズを意味する。
(変換ツリー)
変換ツリー(以下、TTと略称する)は、符号化ユニットCUが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ユニットCUを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。なお、CUに含まれる変換ツリーに関する情報、及び変換ツリーに包含される情報を、TT情報と呼ぶ。
変換ツリーにおける分割には、符号化ユニットと同一のサイズの領域を変換ブロックとして割り付けるものと、上述したツリーブロックの分割と同様、再帰的な4分木分割によるものがある。変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。
変換ツリーTTには、対象CUの各変換ブロックへの分割パターンを指定するTT分割情報SP_TT、及び量子化予測残差QD 1〜QD NT(NTは、対象CUに含まれる変換単位TUの総数)を含んでいる。
TT分割情報SP_TTは、具体的には、対象CUに含まれる各変換ブロックの形状、および、対象CU内での位置を決定するための情報である。例えば、TT分割情報SP_TTは、対象ノードの分割を行うのか否かを示す情報(split_transform_unit_flag)と、その分割の深度を示す情報(trafoDepth)とから実現できる。
各量子化予測残差QDは、階層動画像符号化装置2が以下の処理1〜3を、処理対象の変換ブロックである対象ブロックに施すことによって生成した符号化データである。
処理1:符号化対象画像から予測画像を減算した予測残差を周波数変換(例えば、DCT変換(Discrete Cosine Transform)およびDST変換(Discrete Sine Transform)等)する;
処理2:処理1にて得られた変換係数を量子化する;
処理3:処理2にて量子化された変換係数を可変長符号化する;
なお、上述した量子化パラメータqpは、階層動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表わす(QP=2qp/6)。
(予測ツリー)
予測ツリー(以下、PTと略称する)は、符号化ユニットCUが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ユニットCUを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。なお、CUに含まれる予測ツリーに関する情報、及び予測ツリーに包含される情報を、PT情報と呼ぶ。
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。
予測ツリーにおける分割の種類は、イントラ予測の場合と、インター予測の場合との2つがある。イントラ予測とは、同一ピクチャ内の予測であり、インター予測とは、互いに異なるピクチャ間(例えば、表示時刻間、レイヤ画像間)で行われる予測処理を指す。すなわち、インター予測では、対象レイヤと同一レイヤの参照ピクチャ(レイヤ内参照ピクチャ)または、対象レイヤの参照レイヤ上の参照ピクチャ(レイヤ間参照ピクチャ)のいずれかを参照ピクチャとして、参照ピクチャ上の復号画像から予測画像を生成する。
イントラ予測の場合、分割方法は、2N×2N(符号化ユニットと同一サイズ)と、N×Nとがある。
また、インター予測の場合、分割方法は、符号化データのpart_modeにより符号化され、2N×2N(符号化ユニットと同一サイズ)、2N×N、2N×nU、2N×nD、N×2N、nL×2N、nR×2N、および、N×Nなどがある。
(予測パラメータ)
予測ユニットの予測画像は、予測ユニットに付随する予測パラメータによって導出される。予測パラメータには、イントラ予測の予測パラメータ、もしくはインター予測の予測パラメータがある。
イントラ予測パラメータは、各イントラPUについてのイントラ予測(予測モード)を復元するためのパラメータである。予測モードを復元するためのパラメータには、MPM(Most Probable Mode、以下同様)に関するフラグであるmpm_flag、MPMを選択するためのインデクスであるmpm_idx、及び、MPM以外の予測モードを指定するためのインデクスであるrem_idxが含まれる。
インター予測パラメータは、予測リスト利用フラグpredFlagL0、predFlagL1と、参照ピクチャインデックスrefIdxL0、refIdxL1と、ベクトルmvL0、mvL1から構成される。予測リスト利用フラグpredFlagL0、predFlagL1は、各々L0参照リスト、L1参照リストと呼ばれる参照ピクチャリストが用いられるか否かを示すフラグであり、値が1の場合に対応する参照ピクチャリストが用いられる。2つの参照ピクチャリストが用いられる場合、つまり、predFlagL0=1, predFlagL1=1の場合が、双予測に対応し、1つの参照ピクチャリストを用いる場合、すなわち、(predFlagL0, predFlagL1) = (1, 0)もしくは(predFlagL0, predFlagL1) = (0, 1)の場合が単予測に対応する。
(参照ピクチャリストの一例)
次に、参照ピクチャリストの一例について説明する。参照ピクチャリストとは、復号ピクチャバッファに記憶された参照ピクチャからなる列である。図10 (a)は、参照ピクチャリストの一例を示す概念図である。参照ピクチャリストRPL0において、左右に一列に配列された5個の長方形は、それぞれ参照ピクチャを示す。左端から右へ順に示されている符号P1、P2、Q0、P3、P4は、それぞれの参照ピクチャを示す符号である。同様に、参照ピクチャリストRPL1において、左端から右へ順に示されている符号P4、P3、R0、P2、P1は、それぞれの参照ピクチャを示す符号である。P1等のPとは、対象レイヤPを示し、そしてQ0のQとは、対象レイヤPとは異なるレイヤQを示す。同様に、R0のRとは、対象レイヤP、及びレイヤQとは異なるレイヤRを示す。P、Q及びRの添字は、ピクチャ順序番号POC(Picture Ordering Count)を示す。refIdxL0の真下の下向きの矢印は、参照ピクチャインデックスrefIdxL0が、復号ピクチャバッファにおいて、参照ピクチャリストRPL0より参照ピクチャQ0を参照するインデックスであることを示す。同様に、refIdxL1の真下の下向きの矢印は、参照ピクチャインデックスrefIdxL1が、復号ピクチャバッファにおいて、参照ピクチャリストRPL1より参照ピクチャP3を参照するインデックスであることを示す。
(参照ピクチャの例)
次に、ベクトルを導出する際に用いる参照ピクチャの例について説明する。図10 (b)は、参照ピクチャの例を示す概念図である。図10 (b)において、横軸は表示時刻を示し、縦軸はレイヤ数を示す。図示されている、縦3行、横3列(計9個)の長方形は、それぞれピクチャを示す。9個の長方形のうち、下行の左から2列目の長方形は復号対象のピクチャ(対象ピクチャ)を示し、残りの8個の長方形がそれぞれ参照ピクチャを示す。対象ピクチャから下向きの矢印で示される参照ピクチャQ2、及びR2は対象ピクチャと同じ表示時刻であってレイヤが異なるピクチャである。対象ピクチャcurPic(P2)を基準とするレイヤ間予測においては、参照ピクチャQ2、またはR2が用いられる。対象ピクチャから左向きの矢印で示される参照ピクチャP1は、対象ピクチャと同じレイヤであって、過去のピクチャである。対象ピクチャから右向きの矢印で示される参照ピクチャP3は、対象ピクチャと同じレイヤであって、未来のピクチャである。対象ピクチャを基準とする動き予測においては、参照ピクチャP1又はP3が用いられる。
(動きベクトルと変位ベクトル)
ベクトルmvLXには、動きベクトルと変位ベクトル(disparity vector、視差ベクトル)がある。動きベクトルとは、あるレイヤのある表示時刻でのピクチャにおけるブロックの位置と、異なる表示時刻(例えば、隣接する離散時刻)における同一のレイヤのピクチャにおける対応するブロックの位置との間の位置のずれを示すベクトルである。
変位ベクトルとは、あるレイヤのある表示時刻でのピクチャにおけるブロックの位置と、同一の表示時刻における異なるレイヤのピクチャにおける対応するブロックの位置との間の位置のずれを示すベクトルである。異なるレイヤのピクチャとしては、同一解像度でかつ品質が異なるピクチャである場合、異なる視点のピクチャである場合、もしくは、異なる解像度のピクチャである場合などがある。特に、異なる視点のピクチャに対応する変位ベクトルを視差ベクトルと呼ぶ。
〔階層動画像復号装置〕
以下では、本実施形態に係る階層動画像復号装置1の構成について、図18〜図21を参照して説明する。
(階層動画像復号装置の構成)
本実施形態に係る階層動画像復号装置1の構成について説明する。図18は、本実施形態に係る階層動画復号装置1の構成を示す概略図である。
階層動画像復号装置1は、階層動画像符号化装置2から供給される階層符号化データDATAを復号して、外部より供給される出力指定情報によって定まるターゲットセットTargetSetに含まれる各レイヤの復号ピクチャを生成し、出力レイヤの復号ピクチャを出力ピクチャPOUT#Tとして出力する。
すなわち、階層動画像復号装置1は、出力指定情報が示す対象出力レイヤセットTargetOptLayerSetの復号に必要とするレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdListの要素TargetDecLayerIdList [0].. TargetDecLayerIdList [N-1](Nはターゲットセットに含まれるレイヤ数)の順で、レイヤiのピクチャの符号化データを復号し、その復号ピクチャを生成し、該レイヤiの出力レイヤ情報OutputLayerFlag[i]が“出力レイヤ”を示す場合、該レイヤiの復号ピクチャを所定のタイミングに出力する。
図18に示すように階層動画像復号装置1は、NAL逆多重化部11、及びターゲットセットピクチャ復号部10を含んで構成される。さらに、ターゲットセットピクチャ復号部10は、non-VCL復号部12、パラメータメモリ13、ピクチャ復号部14、復号ピクチャ管理部15、及び出力制御部16を含んで構成される。また、NAL逆多重化部11は、さらにビットストリーム抽出部17を備える。
階層符号化データDATAには、VCLにより生成されたNALU(NAL Unit)の他に、パラメータセット(VPS、SPS、PPS)やSEI等を含むNALUが含まれる。それらのNALはVCL NALUに対して非VCL NALU(non-VCL NAL unit)と呼ばれる。
出力制御部16は、外部より供給される出力指定情報と、パラメータメモリ13に保持されたアクティブVPSのシンタックス、及びシンタックスから導出されるパラメータに基づいて、出力制御情報を導出する。より具体的には、出力制御部16は、出力指定情報に含まれる出力レイヤセットを特定する出力レイヤセット識別子TargetOLSIdx、及びパラメータメモリ13に保持されたアクティブVPSのレイヤセット情報(レイヤセット)、及び出力レイヤセット情報(レイヤセット識別子および出力レイヤフラグ)に基づいて対象出力レイヤセットTargetOptLayerSetの出力レイヤのレイヤ構成を示す対象出力レイヤIDリストTargetOptLayerIdListを導出し、出力制御情報の一部として、復号ピクチャ管理部15へ供給する。
さらに、出力制御部16は、出力指定情報に含まれる出力レイヤセット識別子TargetOLSIdx、及びパラメータメモリ13に保持されたアクティブVPSのレイヤセット情報、及び出力レイヤセット情報、レイヤ間依存情報より導出される依存フラグ、及び出力制御部16で導出される対象出力レイヤIDリストTargetOptLayerIdListに基づいて、非出力レイヤかつ非依存レイヤを除く、対象出力レイヤセットの復号に必要とするレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdListを導出し、出力制御情報の一部として、ビットストリーム抽出部17、及びターゲットセットピクチャ部10へ供給する。なお、出力制御部16における対象出力レイヤIDリスト、及び対象復号レイヤIDリストの導出処理の詳細については後述する。
NAL逆多重化部11の備えるビットストリーム抽出部17は、概略的には、ビットストリーム抽出処理を行い、階層符号化データDATAから、出力制御部16より供給された対象復号レイヤIDリスト、及び復号対象最高次サブレイヤ識別子TargetHighestTidによって定まる集合、ターゲットTargetSetに含まれるNALユニットから構成されるターゲットセット符号化データDATA#T(BitstreamToDecode)を抽出する。なお、ビットストリーム抽出部17における本発明との関連性の高い処理の詳細について後述する。
続いて、NAL逆多重化部11は、ビットストリーム抽出部17より抽出されたターゲットセット符号化データDATA#T(BitstreamToDecode)を逆多重化して、NALユニットに含まれるNALユニットタイプ、レイヤ識別子(レイヤID)、テンポラル識別子(テンポラルID)を参照し、ターゲットセットに含まれるNALユニットを、ターゲットセットピクチャ復号部10へ供給する。
ターゲットセットピクチャ復号部10は、供給されたターゲットセット符号化データDATA#Tに含まれるNALUのうち、non-VCL NALUをnon-VCL復号部12に、VCL NALUをピクチャ復号部14にそれぞれ供給する。すなわち、ターゲットセットピクチャ復号部10は、供給されたNALユニットのヘッダ(NALユニットヘッダ)を復号し、復号したNALユニットヘッダに含まれるNALユニットタイプ、レイヤ識別子、及びテンポラル識別子に基づいて、non-VCL NALUの符号化データをnon-VCL復号部12へ、VCL NALUの符号化データをピクチャ復号部14へ、復号したNALユニットタイプ、レイヤ識別子、及びテンポラル識別子と合わせて供給する。
non-VCL復号部12は、入力されるnon-VCL NALUからパラメータセット、すなわち、VPS、SPS、および、PPSを復号してパラメータメモリ13に供給する。なお、non-VCL復号部12における本発明との関連性の高い処理の詳細について後述する。
パラメータメモリ13は、復号されたパラメータセットを各パラメータセットの識別子毎に、パラメータセットの符号化パラメータを保持する。具体的には、VPSであれば、VPS識別子(video_parameter_set_id)毎に、VPSの符号化パラメータを保持する。SPSであれば、SPS識別子(sps_seq_parameter_set_id)毎に、SPSの符号化パラメータを保持する。PPSであれば、PPS識別子(pps_pic_parameter_set_id)毎に、PPSの符号化パラメータを保持する。なお、パラメータメモリ13に保持される符号化パラメータには、各パラメータセットのレイヤ識別子、及びテンポラル識別子が含まれていてもよい。
また、パラメータメモリ13は、後述のピクチャ復号部14が、ピクチャを復号するために参照するパラメータセット(アクティブパラメータセット)の符号化パラメータを、ピクチャ復号部14へ供給する。具体的には、まず、ピクチャ復号部14で復号されたスライスヘッダSHに含まれるアクティブPPS識別子(slice_pic_parameter_set_id)により、アクティブPPSが指定される。次に、指定されたアクティブPPSに含まれるアクティブSPS識別子(pps_seq_parameter_set_id)により、アクティブSPSが指定される。最後に、アクティブSPSに含まれるアクティブVPS識別子(sps_video_parameter_set_id)により、アクティブVPSが指定される。その後、指定されたアクティブPPS、アクティブSPS、アクティブVPSの符号化パラメータを、ピクチャ復号部14へ供給する。また、パラメータメモリ13は、同様に、出力制御部16が出力制御情報を導出するために参照するアクティブパラメータセットの符号化パラメータを、出力制御部16へ供給する。
ピクチャ復号部14は、入力されるVCL NALU、アクティブパラメータセット(アクティブPPS、アクティブSPS、アクティブVPS),及び参照ピクチャに基づいて復号ピクチャを生成して復号ピクチャ管理部15へ供給する。供給された復号ピクチャは、復号ピクチャ管理部15内のバッファに記録される。なお、ピクチャ復号部14の詳細な説明は後述する。
復号ピクチャ管理部15は、入力される復号ピクチャを内部の復号ピクチャバッファ(DPB: Decoded Picture Buffer)に記録するとともに、参照ピクチャリスト生成や出力ピクチャ決定を行う。また、復号ピクチャ管理部15は、DPBに記録されている復号ピクチャのうち、出力制御部16により導出された対象出力レイヤIDリストTargetOptLayerIdListに含まれる出力レイヤの復号ピクチャを出力ピクチャPOUT#Tとして、所定のタイミングに外部に出力する。
(non-VCL復号部12)
non-VCL復号部12は、入力されるターゲットセット符号化データから、ターゲットセットの復号に用いられるパラメータセット(VPS, SPS, PPS)を復号する。復号されたパラメータセットの符号化パラメータは、パラメータメモリ13に供給され、各パラメータセットの有する識別子毎に記録される。なお、non-VCL復号部12は、パラメータセットに限定されず、図6において、non-VCLに分類されるNALユニット(nal_unit_type=32.. 63)を復号してもよい。パラメータセットと同様に、復号されたnon-VCLの符号化パラメータは、パラメータメモリ13において、各々記録される。
一般に、パラメータセットの復号は既定のシンタックス表に基づいて実行される。すなわち、シンタックス表の定める手順に従って符号化データからビット列を読み出して、シンタックス表に含まれるシンタックスを復号する。また、必要に応じて、復号したシンタックスに基づいて変数を導出して、出力するパラメータセットに含めてもよい。したがって、non-VCL復号部12から出力されるパラメータセットは、符号化データに含まれるパラメータセット(VPS、SPS、PPS)に係るシンタックスおよび、該シンタックスより導出される変数の集合と表現することもできる。
また、non-VCL復号部12は、図示されない、規定のシンタックス表に基づいてパラメータセット(VPS/SPS/PPS)を復号するパラメータセット復号手段を含んで構成される。さらに、パラメータセット復号手段には、さらに、図示されない、レイヤセット情報を復号するレイヤセット復号手段、レイヤ間依存情報を復号するレイヤ間依存情報復号手段、出力レイヤセット情報を復号する出力レイヤセット情報復号手段、出力レイヤセットに対応するPTL情報を復号するPTL情報復号手段、出力レイヤセットに対応DPB情報を復号するDPB情報復号手段、各レイヤのスケーラブル識別子(ScalabilityID)及び補助ピクチャレイヤID(AuxID)を復号するスケーラブル識別子復号手段等を備える。
以下では、non-VCL復号部12において復号に使用されるシンタックス表のうち、本発明との関連性が高いシンタックス表を中心に説明する。
(レイヤセット情報)
レイヤセット情報は、階層符号化データに含まれるレイヤセットを構成するレイヤの集合を表わすリスト(以下、レイヤIDリストLayerIdList)であり、レイヤセット情報復号手段によってVPSから復号される。レイヤセット情報には、VPS上に定義されるレイヤセットの数を示すシンタックス(vps_num_layer_sets_minus1) (図11上のSYNPVS06)及び、VPS上のレイヤ定義の順番で、j番目のレイヤ(レイヤj)が、i番目のレイヤセット(レイヤセットi)に含まれるか否かを示すシンタックス“layer_id_included_flag[i][j]”(SYNVPS07)が含まれている。レイヤセット数VpsNumLayerSetsは、(vps_num_layer_sets_minus1 + 1)に設定される。また、レイヤセットiは、シンタックス”layer_id_included_flag[i][j]”の値が1であるレイヤjから構成される。すなわち、レイヤセットiを構成するレイヤjは、レイヤIDリストLayerIdList[i]に含まれる。
また、レイヤセットiに含まれるレイヤ数NumLayersInIdList[i]は、シンタックス“layer_id_included_flag[i][j]”のうち、レイヤセットiに関して、該シンタックスの値が1であるフラグの個数から導出される。
より具体的には、レイヤセット情報復号手段は、各レイヤセットiのレイヤIDリストLayerIdList[i]、及びレイヤセットiに含まれるレイヤ数NumLayersInIdList[i]は、以下の疑似コードにより導出する。
(各レイヤセットのレイヤIDリストの導出を示す疑似コード)
for( i = 0; i < VpsNumLayerSets; i++){
NumLayersInIdList[i] = 0;
for( m = 0; m <= vps_max_layer_id; m++ ){
if( layer_id_included_flag[ i ][ m ] ){
LayerIdList[ i ][ NumLayersInIdList[i] ] = m;
NumLayersInIdList[i]++;
}
} // end of loop on for(m=0; m<= vps_max_layer_id; m++)
} // end of loop on for(i=0; i<VpsNumLayerSets; i++)
なお、上記疑似コードをステップで表わせば、次の通りである。
(SA01)レイヤセットiのレイヤIDリストの導出に係るループの開始点である。ループの開始前に、変数iは0に初期化される。以下の繰り返し処理のループ変数は変数iであり、0から (NumLayerSets-1)の変数iに対して、SA0A2〜SA0Aに示す処理が実行される。
(SA02)レイヤセットiのレイヤ数NumLayresInIdList[i]を0へ初期化する(すなわち、NumLayersInIdList[i] = 0;)。
(SA03)レイヤセットiのレイヤIDリストへm番目のレイヤ(レイヤm)の要素追加に係るループの開始点である。ループの開始前に、変数mは0に初期化される。以下の繰り返し処理のループ変数は変数mであり、0から最大レイヤ識別子“vps_max_layer_id”の変数mに対して、SA04からSA06に示す処理が実行される。なお、最大レイヤ識別子“vps_max_layer_id”の代わりに、最大レイヤ数VpsMaxLayersを用いて、変数mが、最大レイヤ数VpsMaxLayers未満のときに、ループ内の処理が実行されるようにしてもよい。すなわち、for文の“m<=vps_max_layer_id”の判定式を“m<VpsMaxLayers”へ変更してもよい。
(SA04)レイヤmがレイヤセットiに含まれるか否か(layer_id_included_flag[i][m])を判定する。layer_id_included_flag[i][m]が1であれば、ステップSA05へ遷移する。layer_id_included_flag[i][m]が0であれば、ステップSA05〜SA06の処理を省略し、SA0Aへ遷移する。
(SA05)レイヤセットiのレイヤIDリストLayerIdList[i][]のNumLayersInIdList[i]番目の要素へ、レイヤmを追加する(すなわち、LayerIdList[i][NumLayersInIdList[i]] = m;)。
(SA06)レイヤセットiのレイヤ数NumLayersInIdList[i]の値を“1”加算する(すなわち、NumLayersInIdList[i]++;)。
(SA0A)ステップSA03のループ終端である。
(SA0B)ステップSA01のループ終端である。
以上の手順により、各レイヤセットiのレイヤIDリストLayerIdList[i]を導出することができる。レイヤIDリストLayerIdList[]を参照することで、レイヤセットiで、m番目の要素であるレイヤが、全レイヤ(VPSで定義されるレイヤ)の中で、何番目のレイヤであるかを把握することができる。また、レイヤセットiに含まれるレイヤ数は、レイヤセットiのレイヤ数を表す変数NumLayersInIdList[i]を参照することで把握することができる。なお、導出の手順は、上記ステップに限定されず、実施可能な範囲で変更してもよい。
(レイヤ間依存情報)
レイヤ間依存情報には、直接依存フラグ“direct_dependency_flag[i][j]”(図12のSYNVPS0C)が含まれる。レイヤ間依存情報は、レイヤ間依存情報復号手段により、例えば、VPS拡張データから復号される。
直接依存フラグdirect_dependency_flag[i][j]は、i番目のレイヤ(以降、レイヤi)が、j番目のレイヤ(以降、レイヤj)に直接的に依存しているか否かを示し、直接的に依存している場合に1の値、直接的に依存していない場合に0の値をとる。
ここで、レイヤiがレイヤjに直接的に依存している場合、レイヤiを対象レイヤとして復号処理を実行する場合に、レイヤjに関するパラメータセット、復号ピクチャや関連する復号済シンタックスが、対象レイヤにより直接的に参照される可能性があることを意味する。逆に、レイヤiがレイヤjに直接的に依存していない場合、レイヤiを対象レイヤとして復号処理を実行する場合に、レイヤjに関するパラメータセット、復号ピクチャや関連する復号済シンタックスが直接的に参照されないことを意味する。言い換えると、レイヤiのレイヤjに対する直接依存フラグdirect_dependency_flag[i][j]が1である場合、レイヤjはレイヤiの直接参照レイヤである。逆に、同フラグが0である場合、レイヤjはレイヤiの非直接参照レイヤである。
レイヤ依存情報復号手段は、直接依存フラグ”direct_dependency_flag[i][j]”に基づいて、レイヤiのの直接参照レイヤのリスト(参照レイヤIDリストともいう)RefLayerId[][]、及びレイヤiの直接参照レイヤ数NumDirectRefLayers[]を導出する。ここで、参照レイヤIDリストRefLayerId[][]は2次元の配列であり、1次元目のインデックスは、対象レイヤ(レイヤi)のレイヤ識別子(layer_id_in_nuh [i])であり、2次元目のインデックスは、対象レイヤ(レイヤi)の参照レイヤIDリストの要素のインデックスである。。ここで、layer_id_in_nuh []は、レイヤiのレイヤ識別子nuh_layer_idを導出するための配列である(以下同様)。
(参照レイヤIDリスト、及び直接参照レイヤ数の導出)
参照レイヤIDリスト、及び直接参照レイヤ数の導出は以下の疑似コードにより実行される。
for(i=0; i< VpsMaxLayers; i++){
iNuhLId = layer_id_in_nuh [i];
NumDirectRefLayers[iNuhLId] = 0;
for(j=0; j<i; j++){
if( direct_dependency_flag[i][j]){
RefLayerId[iNuhLId][NumDirectRefLayers[iNuhLId]] = layer_id_in_nuh[j];
NumDirectRefLayers[iNuhLId]++;
}
} // end of loop on for(j=0; j<i; i++)
} // end of loop on for(i=0; i< VpsMaxLayers ; i++)
なお、上記疑似コードをステップで表わせば、次の通りである。
(SL01)レイヤiに関する参照レイヤIDリスト、及び直接参照レイヤ数の導出に係るループの開始点である。ループの開始前に、変数iは0に初期化される。ループ内の処理は、変数iがレイヤ数VpsMaxLayers 未満のときに実行され、ループ内の処理が1回実行される度に、変数iは“1”加算される。
(SL02)変数iNuhLidに、レイヤiのレイヤ識別子layer_id_in_nuh[i]を設定する。さらに、レイヤ識別子layer_id_in_nuh[i]の直接参照レイヤ数NumDirectRefLyaers[iNuhLId]を0へ設定する。
(SL03)レイヤiに関する参照レイヤIDリストへの要素追加(レイヤj)に係るループの開始点である。ループの開始前に、変数jは0に初期化される。ループ内の処理は、変数j(レイヤj)がi未満(j<i)のときに実行され、ループ内の処理が1回実行される度に、変数jは“1”加算される。
(SL04)レイヤjがレイヤiの直接参照レイヤであるか、直接依存フラグ(direct_dependency_flag[i][j])に基づいて判定する。直接依存フラグが1(直接参照レイヤである)であれば、ステップSL05〜SL07の処理を実行するため、ステップSL05へ遷移する。直接依存フラグが0(非直接参照レイヤである)であれば、ステップSL05〜SL07の処理を省略し、SL0Aへ遷移する。
(SL05)参照レイヤIDリストRefLayerId[iNuhLId][]のNumDirectRefLayers[iNuhLId]番目の要素へ、レイヤjのレイヤ識別子layer_id_in_nuh[j]を設定する。すなわち、RefLayerId[iNuhLId][NumDirectRefLayers[iNuhLId]] = layer_id_in_nuh[j];
(SL06)直接参照レイヤ数NumDirectRefLayers[iNuhLId]の値を“1”加算する。すなわち、NumDirectRefLayers[iNuhLId]++;
(SL0A)レイヤiに関する参照レイヤIDリストへの要素追加(レイヤj) に係るループの終端である。
(SL0B)レイヤiの参照レイヤIDリスト、及び直接参照レイヤ数の導出に係るループの終端である。
なお、上記参照レイヤIDリスト、及び直接参照レイヤ数の導出手順は、上記ステップに限定されず、実施可能な範囲で変更してもよい。
(依存フラグの導出)
また、レイヤ依存情報復号手段は、導出した参照レイヤIDリストRefLayerId[][]、直接参照レイヤ数NumDirectRefLayers[]に基づいて、レイヤjがレイヤiの依存レイヤ(直接参照レイヤ、又は間接参照レイヤ)であるかを示す依存フラグrecursiveRefLayerFlag[][]を導出する。例えば、以下に示す疑似コードによって依存フラグを導出する。
(疑似コード)
for(i=0; i<VpsMaxLayers; i++){
currLayerId = layer_id_in_nuh[i];
for(j=0; j<NumDirectRefLayers[currLayerId]; j++){
refLayerId = RefLayerId[currLayerId][j];
recursiveRefLayerId[currLayerId][refLayerId] = 1;
for(k=0; k<VpsMaxLayers; k++){
if ( recursiveRefLayerFlag[refLayerId][k] ){
recursiveRefLayerFlag[currLayerId][k] |=
(recursiveFlag[refLayerId][k]);
}
} // end of loop on for (k=0; k<VpsMaxLayers; k++)
} // end of loop on for (j=0; j<NumDirectRefLayers[currLayerId]; j++)
} // end of loop on for(i=0; i< VpsMaxLayers ; i++)
なお、上記疑似コードをステップで表わせば、次の通りである。なお、ステップSO01の開始前に、依存フラグrecursiveRefLayerFlag [][]の全ての要素の値は、0で初期化済であるものとする。
(SO01)レイヤiに関する依存フラグの導出に係るループの開始点である。ループの開始前に、変数iは0に初期化される。ループ内の処理は、変数iがレイヤ数VpsMaxLayers未満のときに実行され、ループ内の処理が1回実行される度に、変数iは“1”加算される。
(S002)変数currLayerIdに、レイヤiのレイヤ識別子layer_id_in_nuh[i]を設定する(すなわち、currLayerId = layer_id_in_nuh[i])。
(SO03)レイヤiの直接参照レイヤjに関するループの開始点である。ループの開始前に、変数jは0に初期化される。ループ内の処理は、変数j(直接参照レイヤj)が直接参照レイヤ数NumDirectRefLayers[currLayerId]未満(j<NumDirectRefLayers[currLayerId])のときに実行され、ループ内の処理が1回実行される度に、変数jは“1”加算される。
(SO04)変数refLayerIdにレイヤi(currLayerId)の直接参照レイヤjのレイヤ識別子RefLayerId[currLayerId][j]を設定する(refLayerId = RefLayerId[currLayerId][j])。
(S005)レイヤiに対する直接参照レイヤjの依存フラグを1に設定する(recursiveRefLayerFlag[currLayerId][refLayerId] = 1)。
(S006)レイヤkがレイヤiの依存レイヤであるか探索するループ開始点である。ループの開始前に、変数kは0に初期化される。ループ内の処理は、変数k(レイヤk)がレイヤ数VpsMaxLayers未満(j<VpsMaxLayers)のときに実行され、ループ内の処理が1回実行される度に、変数kは“1”加算される。
(S007)レイヤkがレイヤiの直接参照レイヤjの依存レイヤであるか否かを、依存フラグrecursiveRefLayerFlag[refLayerId][k]によって判定する。レイヤkがレイヤiの直接参照レイヤjの依存レイヤである場合(依存フラグが1)、ステップS008へ遷移する。レイヤkがレイヤiの直接参照レイヤjの依存レイヤでない場合(依存フラグが0)、ステップS009へ遷移する。
(S008)レイヤiに対するレイヤkの依存フラグとレイヤiの直接参照レイヤjに対するレイヤkの依存フラグとの論理和を、レイヤiに対するレイヤkの依存フラグへ設定する。
(S009)ステップS006に対応するループの終端である。
(S010)ステップS003に対応するループの終端である。
(S011)ステップS001に対応するループの終端である。
なお、上記依存フラグの導出手順は、上記ステップに限定されず、実施可能な範囲で変更してもよい。
(PTL情報)
PTL情報は、出力レイヤセットを復号するために必要とするプロファイル及びレベルを示す情報であり、PTL情報復号手段によってVPSまたはSPSから復号される。
出力レイヤセットOLS#0に対応するPTL情報は、VPS上の図11に示すSYNVPS04、又はSPS上の図17(a)において通知される。また、出力レイヤセットOLS#i(i=1.. NumOutputLayerSets-1)に対応するPTL情報は、VPS上で定義される”PTL情報の数−1”を示すシンタックス”vps_num_profile_tier_level_minus1”(図12上のSYNVPS0D)、i番目(i=1…num_profile_tier_level_minus1)のPTL情報のプロファイル情報の有無を示プロファイル有無フラグ”vps_profile_present_flag[i]” (図12上のSYNVPS0E)、及びi番目のPTL情報”profile_tier_level()” (図12上のSYNVPS0F)からなる。
各PTL情報は、後述の出力レイヤセットOLS#iに含まれるPTL指定識別子 (profile_level_tier_idx[i]) (図12上のSYNVPS0J)によって、出力レイヤセットOLS#iと対応付けられる。例えば、出力レイヤセットOLS#3のPTL指定識別子が、profile_level_tier_idx[3] = 10であれば、図12のSYNVPS0F上のPTL情報のリストにおいて、先頭から10番目のPTL情報が出力レイヤセットOLS#3に適用されるPTL情報である。
なお、図13に示すようにPTL情報(SYNVPS04及びSYNVPS0H)は、プロファイル及びレベルに関するシンタックス群(SYNPTL01、SYNPTL02、SYNPTL03、SYNPTL04、SYNPTL05、SYNPTL06)が含まれ、PTL情報復号手段によって復号される。
シンタックス群SYNPTL01には下記シンタックスが含まれる。
・プロファイル空間general_profile_space
・ティアフラグgeneral_tier_flag
・プロファイル識別子general_profile_idc
・プロファイル互換フラグgeneral_profile_compatibility_flag[ i ]
・プロファイル予約シンタックスgeneral_reserved_zero_44bits
シンタックス群SYNPTL02は、レベル識別子general_level_idcが含まれる。
シンタックス群SYNPTL03は、サブレイヤのサブレイヤプロファイル有無フラグ、およびサブレイヤレベル有無フラグを含む。
シンタックス群SYNPTL04は、サブレイヤ数(MaxNumSbuLayersMinus1,またはMaxNumSubLayers-1)に基づいて定まるビット数分のバイトアラインデータ(reserved_zero_2bits[i])である。
シンタックス群SYNPTL05には、下記シンタックスが含まれる。
・サブレイヤプロファイル空間sub_layer_profile_space[ i ]
・サブレイヤティアフラグsub_layer_tier_flag[ i ]
・サブレイヤプロファイル識別子sub_layer_profile_idc[ i ]
・サブレイヤプロファイル互換フラグsub_layer_profile_compatibility_flag[ i ][ j ]・サブレイヤプロファイル予約シンタックスsub_layer_reserved_zero_44bits[ i ]
シンタックス群SYNPTL05には、サブレイヤのサブレイヤレベル情報として、サブレイヤレベル識別子sub_layer_level_idc[ i ]が含まれる。
(スケーラブル識別子、及び補助ピクチャレイヤID)
図字されない、スケーラブル識別子復号手段は、入力される対象レイヤ符号化データから、レイヤ単位に割り当てられるスケーラブル識別子(ScalabilityId)を復号する。スケーラブル識別子ScalabilityIdは、レイヤ間でレイヤの性質を区別するためのIDであり、スケーラブルIDとも呼ばれる。1つのレイヤに対して複数の次元のスケーラブルIDを有することができる。以下のレイヤiのj次元目のスケーラブルIDは符号化データのdimension_id[i][j]から導出される。インデックスjは、0から15までをとる。
図14(c)は、VPS拡張データの構成を示すシンタックステーブルの一例である。スケーラブル識別子復号手段は、符号化データから分離フラグsplitting_flag、スケーラブルマスクフラグscalability_mask_flag、次元ID長dimension_id_len_minus1、次元IDdimension_idを復号する。
splitting_flagは、dimension_idの符号化位置を示すシンタックス要素である。splitting_flagが1の場合には、dimension_idは、VPSにおいて明示的に符号化されず、各レイヤiに対応するレイヤ識別子(”layer_id_in_nuh[i]”)から導出される。splitting_flagが0の場合には、dimension_idはVPS拡張で符号化される。
scalability_mask_flag[j]は、インデックスjで示される次元IDが用いられるか否かを示す。スケーラブル識別子復号手段は、scalability_mask_flag[]に基づいて、scalability_mask_flag[j]が1である次元の数NumScalabilityTypesを導出する。scalability_mask_flag[j]が0の場合には対応するインデックスjのdimension_id[i][j]は復号されない。
dimension_id_len_minus1は、インデックスjの(dimension_id[i][j]のビット長―1)を示す。スケーラブル識別子復号手段は、splitting_flagが0の場合には、レイヤiのj次元目の次元ID(dimension_id[i][j])を復号する。
図14(b)は、スケーラブル識別子ScalabilityIdの導出方法を示す擬似コードである。スケーラブル識別子復号手段は、0から最大レイヤ数―1(MaxLayersMinus1)までのインデックスiについて、次元ID(dimension_id[i][j])から、スケーラブル識別子ScalabilityId[i][smIdx]を導出する。
具体的には、図14(b)のSTEP1において、次元を示す変数smIdxのスケーラブルマスクscalability_mask_flag[smIdx]が真(1)の場合に、j番目のdimension_id[i][j]を、ScalabilityId[i][smIdx]に設定する。jは、ScalabilityId[i][smIdx]に設定する度に1だけ増分される。なお、符号化データにスケーラブル識別子ScalabilityId[i][smIdx]に対応するdimension_idが含まれない場合には、ScalabilityId[i][smIdx]を0とすれば良い。すなわち、スケーラブル識別子復号手段は、インデックスsmIdxのスケーラブルマスクscalability_mask_flag[smIdx]が0の場合には、ScalabilityId[ i ][ smIdx ]=0とする。
さらに、スケーラブル識別子復号手段は、図14(b)のSPEP2において、各レイヤインデックスi(レイヤi)について、図14(b)のSPTEP1において導出されたスケーラブル識別子scalabilityId[ i ][ 0 ]、ScalabilityId[ i ][ 1 ]、ScalabilityId[ i ][ 2 ]、ScalabilityId[ i ][ 3 ]を各々、デプスIDDepthId[ lId ]、ビューオーダーIDViewOrderIdx[ lId ]、依存IDDependencyId[ lId ]、補助ピクチャレイヤIDAuxId[ lId]へ設定して導出する。すなわち、補助ピクチャレイヤID(AuxId[])は、ScalabilityId[i][3]より導出される。
なお、次元IDとスケーラブルIDの種類の関係は、上述の図14(b)に限定されず、別の対応関係でも良い。例えば、ScalabilityId[ i ][ 0 ]、ScalabilityId[ i ][ 1 ]、ScalabilityId[ i ][ 2 ]、ScalabilityId[ i ][ 3 ]を各々、ViewOrderIdx[ lId ]、DependencyId[ lId ]、AuxId[ lId ]、DepthId[ lId ]にマッピングしても良い。この場合には、ScalabilityI[i][3]ではなく、ScalabilityI[i][2]からAuxIdが導出される。
デプスIDDepthId[lld]は、テクスチャかデプスを示し、0がテクスチャ、1がデプスに対応する。
ビューオーダーIDViewOrderIdx[lld]は、視点の順序を示す。視点の順序は、カメラの位置に対応している必要はない。また、ビューオーダーIDとは別にビューIDを定めることもできる。
依存IDDependencyId[0]は、SNRスケーラビリティや空間スケーラビリティの階層を示すIDであり、例えばベースレイヤ、ベースレイヤを参照するエンハンスレイヤ1、エンハンスメントレイヤ1を参照するエンハンスメント2から、レイヤが構成される場合には、各々0、1、2の値をとる。
補助ピクチャレイヤIDAuxId[ lld ]は、プライマリピクチャレイヤと補助ピクチャレイヤの識別、及び、補助ピクチャレイヤの種類の識別に用いられる。0がプライマリピクチャレイヤ、0以外が補助ピクチャレイヤに対応する。また、1、2は各々、アルファピクチャ(レイヤ)、デプスピクチャ(レイヤ)であることを示す。なお、補助ピクチャレイヤIDとしてさらに2以上の値を用いることもできる。
(出力レイヤセット情報)
出力レイヤセット情報は、出力するレイヤの集合(出力レイヤ情報)と、レイヤの集合(レイヤセット情報)の組み合わせにより定義され、階層動画像復号装置の備える図示しない出力レイヤセット情報復号手段で復号される。階層動画像復号装置は、出力レイヤセット情報復号手段で復号される出力レイヤセットに含まれるレイヤセット(出力レイヤセットに対応づけらるレイヤセット)に含まれるレイヤを復号対象とし、該レイヤの復号ピクチャを復号してバッファに記録し、出力レイヤセットに含まれる出力レイヤ情報を対象として、バッファに記録された特定のレイヤの復号ピクチャを選択して出力する。
出力レイヤセット情報には、以下のシンタックス要素(E1〜E7)を含む。
E1:追加出力レイヤセット数(num_add_output_layer_sets)(図12上のSYNVPS0G)
E2:デフォルト出力レイヤ識別子(default_target_output_layer_idc)(図12上のSYNVPS0H)
E3:レイヤセット識別子(output_layer_set_idx_minus1)(図12上のSYNVPS0I)
E4:出力レイヤ情報(output_layer_flag)(図12上のSYNVPS0J)
E5:代替出力レイヤフラグ(alt_output_layer_flag)(図12上のSYNVPS0K)
E6:PTL・DPB情報有無フラグ(ptl_dpb_info_present_flag)(図12上のSYNVPS0L)
E7:PTL指定識別子(profile_level_tier_idx)(図12上のSYNVPS0M)
本実施形態の出力レイヤセット情報復号手段は少なくとも出力レイヤセットのレイヤセット識別子と出力レイヤフラグを復号する。
(E1:追加出力レイヤセット)
出力レイヤセットは対応するレイヤセットと、レイヤセット内の出力レイヤの指定を組み合わせた情報である。出力レイヤセットに対応するレイヤセットとして、レイヤセット識別子により特定されるレイヤセットが利用できる。出力レイヤの指定には、出力レイヤ情報が利用できる。そのため、各出力レイヤセットは一つの関連するレイヤセットを有する。
出力レイヤセットは、基本出力レイヤセットと追加出力レイヤセットに分類できる。出力レイヤセットが同じレイヤセットに関連付けられる場合、その中の1つを基本出力レイヤセット、同じレイヤセットの関連づけらる基本出力レイヤセット以外の出力レイヤセットが拡張出力レイヤセットである。基本出力レイヤセットは、また、VPSで復号されたレイヤセットに基づいて導出される出力レイヤセットである。本実施形態においては、VPSで復号される各レイヤセットに一つの対応する出力レイヤセットが基本出力レイヤセットとして導出される。本実施形態では、レイヤセット数をVpsNumLayerSetsとする場合、0〜VpsNumLayerSets-1の識別子の出力レイヤセットは、0〜VpsNumLayerSets-1の識別子のレイヤセットと1対1に対応する。これらを基本出力レイヤセットとする。VpsNumLayerSets以上の識別子に対応する出力レイヤセットは、基本出力レイヤセット以外の出力レイヤセットであるから、拡張出力レイヤセットである。
より具体的には、本実施形態の出力レイヤセット情報復号手段は、レイヤセット数(VpsNumLayerSets)を復号し、該レイヤセット数の数のレイヤセットをVPSから復号する。そして、復号された識別子0から(VpsNumLayerSets - 1)のレイヤセットから、識別子0から(VpsNumLayerSets - 1)の出力レイヤセットをそれぞれ導出し、基本出力レイヤセットを導出する。ここで、識別子i(レイヤセット識別子i)のレイヤセットに関連づけられる、識別子i(出力レイヤセット識別子i)の出力レイヤセットのことを、レイヤセット識別子iのレイヤセットに対応する基本出力レイヤセットと呼ぶ。逆に、出力レイヤセット識別子iの基本出力レイヤセットに対応するレイヤセットは、レイヤセット識別子iのレイヤセットである。
追加レイヤセットは、基本出力レイヤセットに追加して定義される出力レイヤセットである。本実施形態では、追加出力レイヤセット数(num_add_output_layer_sets)がVPS拡張から復号されて、該追加出力レイヤセット数の個数の出力レイヤセットがVPS拡張から復号されるレイヤセット識別子と出力レイヤ情報に基づいて導出される。
なお、基本出力レイヤセットと追加出力レイヤセットは、次のように定義することもできる。すなわち、基本出力レイヤセットは、対応するレイヤセットを表すレイヤセット識別子が明示的には復号されない出力レイヤセットであり、追加出力レイヤセットは、対応するレイヤセットを表すレイヤセット識別子が明示的に復号される出力される出力レイヤセットである。
出力レイヤセット数NumOutputLayerSetsはレイヤセット数VpsNumlayerSets+追加出力レイヤセット数num_add_output_layer_setsにより導出される。以下、識別子が0から(VpsNumLayerSets - 1)までの出力レイヤセットが基本出力レイヤセットである。また、識別子がVpsNumLayerSetsから(NumOutputLayerSet-1)の出力レイヤセットが追加出力レイヤセットである。
(E2:デフォルト出力レイヤ識別子)
デフォルト出力レイヤ識別子default_target_output_layer_idcは、出力レイヤセット(出力レイヤ情報)の導出処理を指定するシンタックス要素である。本実施形態の出力レイヤセット情報復号手段は、デフォルト出力レイヤ識別子を復号し、デフォルト出力レイヤ識別子の値に応じた処理により、出力レイヤ情報の復号制御または導出を実行する。
(1)デフォルト出力レイヤ識別子=0の場合:基本出力レイヤセットに対し後述の出力レイヤ情報(output_layer_flag[i][j])の復号を省略し、各出力レイヤセットに含まれる全べてのプライマイリピクチャレイヤを出力レイヤ(OutputLayerFlag[i][j]=1)とし、全べての補助ピクチャレイヤを非出力レイヤ(OutputLayerFlag[i][j]=0)とする。追加出力レイヤセットについては明示的に出力レイヤ情報(output_layer_flag)を復号し、該出力レイヤ情報に従って出力レイヤを設定する。
(2)デフォルト出力レイヤ識別子=1の場合:基本出力レイヤセットにおいて、各出力レイヤセットに含まれる最高次のレイヤ識別子を有するプライマリピクチャレイヤを出力レイヤとする。追加出力レイヤセットについては明示的に出力レイヤ情報(output_layer_flag)を復号し、該出力レイヤ情報に従って出力レイヤを設定する。
(3)デフォルト出力レイヤ識別子=2の場合:全ての出力レイヤセット(基本出力レイヤセットおよび追加出力レイヤセット)において、明示的に出力レイヤ情報(output_layer_flag)を復号し、該出力レイヤ情報に従って出力レイヤを設定する。
なお、デフォルト出力レイヤ識別子の値のうち、3以上の値は将来の規格拡張のための予約値である。
(E3:レイヤセット識別子)
レイヤセット識別子は、出力レイヤセットに関連付けられるレイヤセットを特定する値である。本実施形態の出力レイヤセット情報復号手段は、シンタックス要素output_layer_set_idx_minus1[i]を復号し、該シンタックス要素値に1を加えた値を識別子iの出力レイヤセットに対するレイヤセット識別子として用いる。レイヤセット識別子が指すレイヤセット(LS#(output_layer_set_idx_minus1[i] + 1))は識別子iの出力レイヤセット(OLS#i)に関連付けられる。
なお、出力レイヤセット情報復号手段は、符号化データに、出力レイヤセットOLS#iのレイヤセット識別子が存在しない場合(省略された場合)には、推定してもよい。例えば、出力レイヤセット識別子がiである基本出力レイヤセットの場合には、レイヤセット識別子を(i - 1)と推定する。なお、本実施形態において、レイヤセット識別子に係るシンタックス要素は、”レイヤセット識別子の値−1”で表現されるが、これに限定されず、”レイヤセット識別子の値”そのものでもよい。
(E4:出力レイヤ情報)
出力レイヤ情報は、出力レイヤセットに関連付けられるレイヤセットに含まれる各レイヤを出力対象レイヤとするかを示すフラグ(OutputLayerFlag[i][j])の集合である。本実施形態の出力レイヤセット情報復号手段は、復号したシンタックス要素output_layer_flag[i][j]から、出力レイヤ情報OutputLayerFlag[i][j]を設定する。output_layer_flag[i][j]は、出力レイヤセットiに含まれるj番目のレイヤを出力対象レイヤとするか否かを表すフラグであって、値が真(1)の場合には出力対象レイヤとすることを示し、値が偽(0)の場合には出力対象レイヤとしないことを表す。
なお、出力レイヤセット情報復号手段は、一部または全ての出力レイヤ情報の復号を省略し、推定、または、他のシンタックス要素の値に基づいた導出処理により出力レイヤ情報を決定してもよい。例えば、デフォルト出力レイヤ識別子(default_target_output_layer_idc)に基づいて、次の(1)〜(3)に示す何れかの導出処理を選択して、基本出力レイヤセットの出力レイヤ情報を決めてもよい。なお、出力レイヤセット情報復号手段は、ベースレイヤのみから構成される出力レイヤセットOLS#0の出力レイヤ情報は、OutputLayerFlag[0][0]=1と推定する。より具体的には、出力レイヤセット情報復号手段は、以下の処理によりOutputLayerFlag[][]を導出する。i=0,j=0を除く、開始値siから出力レイヤセット数―1(NumOutputLayerSets 1)までのi、0から出力レイヤセット識別子iの出力レイヤセット(OLS#i)に対応するレイヤセットのレイヤ数(NumLayersInIdList[ LayerSetIdx [ i ] ] - 1)までのjについて、OutputLayerFlag[i][j] = output_layer_flag[i][j]によりOutputLayerFlag[i][j]を導出する。i=0、j=0のOutputLayerFlag[i][j]については、OutputLayerFlag[i][j]=1。すなわちOutputLayerFlag[0][0]=1により、出力レイヤフラグを導出する。これにより、明示的に出力レイヤ情報output_layer_flagを復号しない識別子0の出力レイヤセットの出力レイヤ情報OutputLayerFlagを復号するように導出することができ、ベースレイヤのみから構成される出力レイヤセットであるOLS#0を復号する場合にも、出力ピクチャが得られるように画像復号装置を動作させることができる。なお、開始値siは、デフォルト出力レイヤ識別子=2の場合は0、それ以外の場合は、基本レイヤ数(vps_number_layer_sets_minus1 + 1)とする。
(1)デフォルト出力レイヤ識別子=0の場合:出力レイヤセット情報復号手段は、以下の疑似コードに示すように、i=0..VpsNumLayerSets-1の基本出力レイヤセットに対して、全てのプライマリピクチャレイヤ(AuxID[]==0)の出力レイヤフラグOutputLayerFlag[i][j]を1に推定し、また、全ての補助ピクチャレイヤ(AuxID[]>0)の出力レイヤフラグOutputLayerFlag[i][j]を0と推定する。ここで、変数LayerSetIdx[i]は、出力レイヤセットOLS#iに関連付けられたレイヤセットを示すレイヤセット識別子を表わし、(output_layer_set_idx_minus1[i] + 1)に設定されており、変数NumLayersInIdList[LayerSetIdx[i]]は、レイヤセットLS#(LayerSetIdx[i])に含まれるレイヤ数である(以下、同様)。
for( j=0; j<NumLayersInIdList[LayerSetIdx[i]]; j++){
if( AuxID[ nuh_layer_id[ LayerIdList[LayerSetIdx[i]][j]]]==0)
OutputLayerFlag[i][j] = 1;
else
OuptutLayerFlag[i][j] = 0;
}
(2)デフォルト出力レイヤ識別子=1の場合:出力レイヤセット情報復号手段は、i=0..vps_number_layer_sets_minus1の基本出力レイヤに対して、各出力レイヤセットに含まれる最高次レイヤ識別子を有するプライマリピクチャレイヤを出力レイヤとする。出力レイヤ情報(OutputLayerFlag)は、以下に示す疑似コードによって導出される。
for( j=0; j<NumLayersInIdList[LayerSetIdx[i]]; j++){
if( レイヤjがLayerIdList[LayerSetIdx[i]]中にある最高次レイヤ識別子を有するプライマリピクチャレイヤである){
OutputLayerFlag[i][j] = 1;
} else{
OutputLayerFlag[i][j] = 0;
}
}
なお、レイヤjがプライマリピクチャレイヤであるか否かは、レイヤjに関する次元IDを示すシンタックス”dimension_id[i][j]”から導出されるスケーラブル識別子(スケーラビリティID)(ScalabilityId)と、図14(a)上に示すスケーラブル識別子(スケーラビリティID)とスケーラビリティタイプ(Scalability Diemnsion)との対応表を参照して、同表のうち、“Auxiliary”の項目(補助ピクチャレイヤID AuxId[j] = ScalabilityId[j][3])の値によって決まる。すなわち、同項目の値が0である場合(AuxId[j]==0)、レイヤjがプライマリピクチャレイヤであることを示し、0より大きい場合(AuxId[j]>0)、レイヤjが補助ピクチャレイヤ(あるいは、AUXレイヤ)であることを示す。なお、補助ピクチャレイヤとは、プライマリピクチャレイヤに属するピクチャに対するデプスマップや、アルファチャネルなどの補助ピクチャを通知するためのレイヤである。なお、スケーラブル識別子、及び補助ピクチャレイヤIDの詳細については、(スケーラブル識別子、及び補助ピクチャレイヤID)において、説明済である。
(3)デフォルト出力レイヤ識別子=2の場合:出力レイヤセット情報復号手段は、i=0を除くすべての出力レイヤセット(i=1.. NumOutputLayerSetsの出力レイヤセット)に対して、シンタックス要素output_layer_flag[i][j]を復号し、出力レイヤを導出する。すなわち、以下の疑似コードに示すように、出力レイヤセットOLS#iのj番目のレイヤjの出力レイヤ情報(OutputLayerFlag[i][j])に、シンタックス要素output_layer_flag[i][j]の値を設定する。
for( j=0; j<NumLayersInIdList[LayerSetIdx[i]]; j++){
OutputLayerFlag[i][j] = output_layer_flag[i][j];
}
なお、出力レイヤセット情報復号手段は、導出された出力レイヤ情報(OutputLayerFlag)に基づいて、各出力レイヤセットOLS#i(i=0..NumOutputLayerSets-1)の出力レイヤ数NumOptLayersInOLS[i]、及び最高次出力レイヤのレイヤ識別子OlsHighestOutputLayerId[i]を、以下に示す疑似コードによって導出してもよい。すなわち、出力レイヤセットOLS#iの出力レイヤ数NumOptLayersInOLS[i]は、レイヤjの出力レイヤフラグOutputLayerFlag[i][j]が”出力レイヤ”を示すフラグの個数である。また、最高次出力レイヤのレイヤ識別子は、出力レイヤセットOLS#iのレイヤIDリストLayerIdList[LayerSetIdx[i]][]の中で、OuputLayerFlag[i][]が1(真)である最高次レイヤのレイヤ識別子である。
NumOptLayersInOLS[i] = 0;
for(j=0; j<NumLayersInIdList[LayerSetIdx[i]]; j++){
NumOptLayersInOLS[i] += OuputLayerFlag[i][j];
if (OuputLayerFlag[i][j]){
OlsHighestOutputLayerId[i] = LayerIdList[ LayerSetIdx[i] ][j];
}
}
(E5:代替出力レイヤフラグ)
代替出力レイヤフラグ(alt_output_layer_flag[i])(図12上のSYNVPS0K)は、代替レイヤ復号ピクチャ出力の適用可否を示す情報である。代替レイヤ復号ピクチャ出力の適用時には、出力レイヤ情報で指定されたレイヤの復号ピクチャが存在しない場合に、代替レイヤが設定されて該代替レイヤの復号ピクチャが代わりに出力される。本実施形態では、シンタックス要素値alt_output_layer_flag[i]が出力レイヤセットiに対する代替出力レイヤ情報である。alt_output_layer_flag[i]の値が真(1)の場合には、出力レイヤセットOLS#iの復号時に代替レイヤ復号ピクチャ出力が適用され、値が偽(0)の場合には、代替レイヤ復号ピクチャ出力が適用されない。
出力レイヤセット情報復号手段は、例えば、次の条件(A1)〜(A2)をともに満たす場合にシンタックス要素alt_output_layer_flag[i]を符号化データより復号し、代替出力レイヤフラグAltOutputLayerFlag[i]へ、alt_output_layer_flag[i]の値を設定する。
(A1)出力レイヤセットOLS#iの出力レイヤ数NumOptLayersInOLS[i]が1である場合。図12のSYNVPS0Kにおいて、「NumOuputlayersInOLS[i]==0」の条件に相当する。
(A2)出力レイヤセットOLS#iにおいて、最高次レイヤ識別子を有する出力レイヤの直接参照レイヤ数が1以上である場合。図12のSYNVPS0Kにおいて、「NumDirectRefLayers[OlsHighestOutputLayerId[i]]>0」の条件に相当する。
出力レイヤセット情報復号手段は、シンタックス要素alt_output_layer_flag[i]を復号しない場合、該シンタックス要素の値を0であると推定し、代替レイヤ出力フラグAltOutputLayerFlag[i]に、代替レイヤ復号ピクチャ出力を適用しないことに対応する値を設定する。本実施形態においては、AltOutputLayerFlag[i]の値が0に設定される。
(E6:PTL・DPB情報有無フラグ)
PTL・DPB情報有無フラグ(ptl_dpb_present_flag[i])(図12上のSYNVPS0L)は、出力レイヤセットに適用するPTL指定識別子、及びDPB情報が符号化データ中に存在するか否かを示すフラグである。
出力レイヤセット情報復号手段は、出力レイヤセットiに対するPTL・DPB情報有無フラグptl_dpb_info_present_flag[i]を復号する。具体的には、PTL・DPB情報有無フラグは、i<= vps_num_layer_sets_minus1、すなわち、基本出力レイヤセットに関するPTL・DPB情報有無フラグの復号を省略する。PTL・DPB情報有無フラグptl_dpb_info_present_flag[i]が符号化データに存在しない場合には、出力レイヤセット情報復号手段は、PTL・DPB情報有無フラグの値を1(真)であると推定する(ptl_dpb_info_present_flag[i]=1)。さらに、出力レイヤセット情報復号手段は、i>vps_num_layer_sets_minus1の場合、すなわち、追加出力レイヤセットに関するPTL・DPB情報有無フラグを符号化データより復号する。
上記構成の出力レイヤセット情報復号手段によれば、基本出力レイヤセットに関するPTL・DPB情報有無フラグに係る復号を省略できる。すなわち、より少ない符号量で、基本出力レイヤセット、及び追加出力レイヤセットに関するPTL・DPB情報有無フラグを復号/符号化することができる効果がある。
なお、PTL識別子とDPB情報を制御するフラグであるPTL・DPB情報有無フラグptl_dpb_info_present_flagの代わりにPTL識別子を制御するフラグptl_info_present_flagもしくはDPB情報を制御するフラグ、DPB情報有無フラグdpb_info_present_flagであっても良い。この場合、出力レイヤセット情報復号手段は、上記PTL・DPB情報有無フラグptl_dpb_info_present_flagの代わりにPTL情報有無フラグptl_info_present_flagもしくは、DPB情報有無フラグdpb_info_present_flagを同様の処理により復号する。また、出力レイヤセット情報復号手段は、PTL情報有無フラグptl_info_present_flagとDPB情報有無フラグdpb_info_present_flagを同様の処理により復号しても良い。
また、出力レイヤセット情報復号手段は、個々の出力レイヤセットiに対するptl_dpb_info_present_flag[i]を復号することなく、一つのPTL・DPB情報有無フラグをptl_dpb_info_present_flagとして復号しても良い。
(E7:PTL指定識別子)
PTL指定識別子(profile_level_tier_idx)(図12上のSYNVPS0M)は、出力レイヤセットに適用するPTL情報を指定するためのシンタックス要素である。PTL指定識別子(profile_level_tier_idx[i])で指定されるPTL情報が、出力レイヤセットOLS#iに適用される。
出力レイヤセット情報復号手段は、出力レイヤセットOLS#iのPTL・DPB情報有無フラグ(ptl_dpb_info_present_flag[i])の値が1(真)の場合、符号化データより、PTL指定識別子(profile_level_tier_idx[i])を復号する。
本実施形態の出力レイヤセット情報復号手段は、同じレイヤセットに関連付けられる出力レイヤセットが複数ある場合には、1つの出力レイヤセット(基本出力レイヤセット)のPTL指定識別子を符号化データから復号する。それ以外の出力レイヤセット(追加出力レイヤセット)のPTL指定識別子は符号化データに存在せず、出力レイヤセット情報復号手段は、存在しない出力レイヤセットのPTL指定識別子を、同じレイヤセットに関連付けられた出力レイヤセットの既に復号されたPTL指定識別子を割り当てて導出する。
具体的には、出力レイヤセット情報復号手段は、出力レイヤセットOLS#iのPTL・DPB情報有無フラグ(ptl_dpb_info_present_flag[i])の値が0(偽)の場合、PTL指定識別子の復号を省略し、同識別子の値を、出力レイヤセットOLS#iのレイヤセット識別子(lsIdx = output_layer_set_index_minus1[i] + 1)が示す基本出力レイヤセットOLS#lsIdxのPTL指定識別子と等しいと推定する。
出力レイヤセット情報復号手段は、復号又は推定されたPTL指定識別子(profile_level_tier_idx [i])で指定されるPTL情報を、出力レイヤセットOLS#iへ適用する。
上記構成の出力レイヤセット情報復号手段によれば、出力レイヤセットOLS#iのPTL・DPB情報有無フラグが0の場合、PTL指定識別子(profile_level_tier_idx[i])の復号/符号化を省略することができる。すなわち、より少ない符号量で、基本出力レイヤセット、及び追加出力レイヤセットに関するPTL指定識別子を復号/符号化することができる効果がある。
本実施例では、図16に示すように、同じレイヤセットに関連付けられた出力レイヤセットの内の1つである基本出力レイヤセットOLS#Aに関しては、PTL指定識別子及びDPB情報を明示的に復号し、同じレイヤセットに関連付けられたそれ以外の出力レイヤである追加出力レイヤセットOLS#Xに対して、PTL・DPB情報有無フラグが1(真)であれば、OLS#XのPTL指定識別子およびDPB情報を明示的に復号し、追加出力レイヤセットOLS#YのPTL・DPB情報有無フラグが0(偽)であれば、追加出力レイヤセットと同一のレイヤセットと関連付けられた基本出力レイヤセットOLS#AのPTL指定識別子およびDPB情報から推定する。従って、より少ない符号量で、出力レイヤセットのPTL指定識別子及びDPB情報を復号/符号化することが可能となる。
なお、PTL指定識別子とDPB情報を制御するフラグであるPTL・DPB情報有無フラグptl_dpb_info_present_flagの代わりにPTL識別子の符号化を制御するフラグdpb_info_present_flagを備える場合には、出力レイヤセット情報復号手段は、上記処理において、PTL・DPB情報有無フラグptl_dpb_info_present_flagをPTL情報有無フラグdpb_info_present_flagに置き替えて実行する。この場合も、PTL指定識別子に対する上記の効果が得られる。
また、個々の出力レイヤセットiに対するptl_dpb_info_present_flag[i]ではなく、一つのPTL・DPB情報有無フラグptl_dpb_info_present_flagを用いる場合には、インデックスiの出力レイヤセットのうち、i<=vps_num_layer_sets_minus1の出力レイヤセット(基本出力レイヤセット)に対しては、常にPTL指定識別子を復号し、それ以外のi> vps_num_layer_sets_minus1の出力レイヤセット(拡張出力レイヤセット)に対しては、ptl_dpb_info_present_flagが1の場合に復号する。存在しない出力レイヤセットのPTL指定識別子はprofile_level_tier_idx[i]= profile_level_tier_idx[output_layer_set_idx_minus1[i]]により導出される。
(出力レイヤセット情報復号手段の変形例)
上記出力レイヤセット情報復号手段は、PTL・DPB情報有無フラグに基づいて、PTL指定識別子を復号又は推定するが、これに限定されない。例えば、出力レイヤセット情報復号手段は、PTL・DPB情報有無フラグを復号せずに、出力レイヤセットが、基本出力レイヤセット、又は追加出力レイヤセットであるかに基づいて、PTL指定識別子の復号を行ってもよい。
すなわち、出力レイヤセット情報復号手段は、出力レイヤセットOLS#iが基本出力レイヤセットOLS#i(i=1..VpsNumLayerSets-1)である場合、符号化データよりPTL指定識別子(profile_level_tier_idx[i])を復号する。一方、出力レイヤセット情報復号手段は、出力レイヤセットOLS#iが追加出力レイヤセットOLS#i(i=VpsNumLayerSets..NumOutputLayerSets-1)である場合、PTL指定識別子の復号を省略し、同識別子の値を、出力レイヤセットOLS#iのレイヤセット識別子(lsIdx = output_layer_set_index_minus1[i] + 1)が示す基本出力レイヤセットOLS#lsIdxのPTL指定識別子と等しいと推定する。換言すれば、出力レイヤセットOLS#iのインデックスが、i<VpsNumLayerSetsの場合、PTL指定識別子を復号し、i>=VpsNumLayerSetsの場合、PTL指定識別子を推定する。従って、追加出力レイヤセットOLS#i(i=VpsNumLayerSets..NumOutputLayerSets-1)に関するPTL指定識別子(profile_level_tier_idx[i])の復号/符号化を省略することができ、より少ない符号量で、より少ない符号量で、基本出力レイヤセット、及び追加出力レイヤセットに関するPTL指定識別子を復号/符号化することができる効果がある。
(DPB情報)
DPB情報は、出力レイヤセットを復号するためにデコーダがバッファ(DPB)で保持する復号ピクチャの最大サイズ等を示す情報であり、DPB情報復号手段によって、VPSまたはSPSから復号される。
DPB情報復号手段は、出力レイヤセットOLS#0に対応するDPB情報を、符号化データに含まれるVPS上の図15(a)に示すシンタックスSYNDPB01〜SYNDPB04(vps_sub_layer_ordering_info_present_flag, vps_max_dec_pic_buffering_minus1[], vps_max_num_reorder_pics[], vps_max_latency_increase_plus1[])、又はSPS上で、前記シンタックスSYNDPB01〜SYNDPB04の”vps”を”sps”へ置き換えたシンタックスから復号する。なお、各シンタックスの意味は次の通りである。なお、以下のシンタックスで、先頭の”x”は、”vps”又は、”sps”のことである。
x_sub_layer_ordering_info_present_flag:同フラグが1の場合、出力レイヤセットOLS#0の全てのサブレイヤにDPB情報(x_dec_pic_buffering_minus1[],x_max_num_reorder_pics[],x_max_latency_increase_plus1[])が存在することを示す。同フラグが0の場合、前記3種類のシンタクス配列のvps_max_sub_layers_minus1番目の値が全てのサブレイヤへ適用される。
x_max_dec_pic_buffering_minus1 []:バッファ(DPB)に格納するピクチャ数の“最大要求数―1”を示す。
x_max_num_reorder_pics[]:Bピクチャなどの階層構造でデコード順序と表示順序が異なる場合において、デコード順序で当該ピクチャに先行して、かつ表示順序で当該ピクチャに後続できる最大許容ピクチャ枚数を示す。
x_max_latency_inclease_plus1[]:表示順序で、当該ピクチャに先行して、かつ、デコード順序で当該ピクチャに後続する最大ピクチャ枚数を示す変数x_MaxLatencyPictures[]の算出に用いられる値である。なお、変数x_MaxLatencyPictures[]=(x_max_num_reorder_pics[] + x_max_vps_latency_increase_plus1[][] - 1)である。
また、DPB情報復号手段は、出力レイヤセットOLS#i(i=1.. NumOutputLayerSets-1)に対応するDPB情報を符号化データに含まれるVPS上のSYNVPS0Mに示すDPB_SIZE() (図15(b))において、図15(b)に示すシンタックスSYNDPB05〜SYNDPB10から復号する。なお、各シンタックスの意味は次の通りである。
sub_layer_flag_info_present_flag[i](SYNDPB05):サブレイヤ情報有無フラグ[i](同フラグ)が1の場合、出力レイヤセットOLS#iのサブレイヤDPB情報有無フラグ(sub_layer_dpb_info_present_flag[i][j])が符号化データに存在することを示す。同フラグが0の場合、サブレイヤDPB情報有無フラグが符号化データに存在せず、サブレイヤDPB情報有無フラグの値は0と推定される。
sub_layer_dpb_info_prenset_flag[i][j](SYNDPB06):配列[i][j](同フラグ)が1の場合、サブレイヤjに関するmax_vps_dec_pic_buffering_minus1[i][k][j], max_vps_num_reorder_pics[i][k][j], max_vps_latency_increase_plus1[i][k][j])が存在することを示す。同フラグが0の場合、前記3種類のシンタクスは、サブレイヤ(j-1)のシンタックス配列の値と等しいと推定される。
max_vps_dec_pic_buffering_minus1[i][k][j](SYNDPB07): 出力レイヤセットOLS#iにおいて、k番目のサブバッファ(sub-DPB)に格納するピクチャ数の“最大要求数―1”を示す。
max_vps_layer_dec_pic_buiff_minus1[i][k][j] (SYNDPB08): 出力レイヤセットOLS#iにおいて、バッファ(DPB)に格納するk番目のレイヤのピクチャ数の“最大要求数―1”を示す。
max_vps_num_reorder_pic[i][j] (SYNDPB09): 出力レイヤセットOLS#iにおいて、k番目のレイヤkにおいて、Bピクチャなどの階層構造でデコード順序と表示順序が異なる場合において、デコード順序で当該ピクチャに先行して、かつ表示順序で当該ピクチャに後続できる最大許容ピクチャ枚数を示す。
max_vps_latency_increase_plus1[i][j] (SYNDPB10): 表示順序で、当該ピクチャに先行して、かつ、デコード順序で当該ピクチャに後続する最大ピクチャ枚数を示す変数MaxLatencyPictures[]の算出に用いられる値である。なお、変数MaxLatencyPictures[i][j]=(max_vps_num_reorder_pics[i][j] + max_vps_latency_increase_plus1[i][j] - 1)である。
本実施形態の出力レイヤセット情報復号手段は、同じレイヤセットに関連付けられる出力レイヤセットが複数ある場合には、1つの出力レイヤセット(基本出力レイヤセット)のPTL指定識別子を符号化データから復号する。それ以外の出力レイヤセット(追加出力レイヤセット)のPTL指定識別子は符号化データに存在せず、出力レイヤセット情報復号手段は、存在しない出力レイヤセットのPTL指定識別子を、同じレイヤセットに関連付けられた出力レイヤセットの既に復号されたPTL指定識別子を割り当てて導出する。
より具体的には、DPB情報復号手段は、出力レイヤセットOLS#i(i=1..NumOutputLayerSets-1)のPTL・DPB情報有無フラグ (ptl_dpb_info_present_flag[i])の値が1(真)の場合、符号化データより、上記DPB_INFO#iとして、図15(b)に示すシンタックスSYNDPB05〜SYNDPB10を復号する。
DPB情報復号手段は、出力レイヤセットOLS#iのPTL・DPB情報有無フラグ(ptl_dpb_info_present_flag[i])の値が0(偽)の場合、図15(b)に示すシンタックスSYNDPB05〜SYNDPB10の復号を省略し、出力レイヤセットOLS#iのDPB情報DPB_INFO#iを、出力レイヤセットOLS#iのレイヤセット識別子(lsIdx = output_layer_set_index_minus1[i] + 1)が示す基本出力レイヤセットOLS#lsIdxのDPB情報DPB_INFO#lsIdxと等しいと推定する。すなわち、DPB_INFO#i = DPB_INFO#lsIdxとする。
DPB情報復号手段は、復号又は推定されたDPB情報DPB_INFO#iを、出力レイヤセットOLS#iへ適用する。従って、出力レイヤセットOLS#iのPTL・DPB情報有無フラグが0の場合、DPB情報DPB_INFO#i(図15(b)に示すシンタックスSYNDPB05〜SYNDPB10)の復号/符号化を省略することができる。すなわち、より少ない符号量で、基本出力レイヤセット、及び追加出力レイヤセットのDPB情報DPB_INFO#iを復号/符号化することができる効果がある。
本実施例では、図16に示すように、同じレイヤセットに関連付けられた出力レイヤの内の1つである基本出力レイヤセットOLS#Aに関しては、DPB情報、及びPTL指定識別子を明示的に復号し、同じレイヤセットに関連付けられたそれ以外の出力レイヤである追加出力レイヤセットOLS#Xに対しては、PTL・DPB情報有無フラグが1(真)であれば、OLS#XのDPB情報、及びPTL指定識別子を明示的に復号し、追加出力レイヤセットOLS#YのPTL・DPB情報有無フラグが0(偽)であれば、追加出力レイヤセットと同一のレイヤセットと関連付けられた基本出力レイヤセットOLS#AのDPB情報、及びPTL指定識別子から推定する。従って、より少ない符号量で、出力レイヤセットのDPB情報およびPTL指定識別子を復号/符号化することが可能となる。なお、PTL識別子とDPB情報を制御するフラグであるPTL・DPB情報有無フラグptl_dpb_info_present_flagの代わりにDPB情報の符号化を制御するフラグdpb_info_present_flagを備える場合には、出力レイヤセット情報復号手段は、上記処理において、PTL・DPB情報有無フラグptl_dpb_info_present_flagをDPB情報有無フラグdpb_info_present_flagに置き替えて実行する。この場合も、DPB情報に対する上記の効果が得られる。
また、個々の出力レイヤセットiに対するptl_dpb_info_present_flag[i]ではなく、一つのPTL・DPB情報有無フラグptl_dpb_info_present_flagを用いる場合には、インデックスiの出力レイヤのうち、i<=vps_num_layer_sets_minus1の出力レイヤセット(基本出力レイヤセット)に対しては、DPB情報を復号し、それ以外のi> vps_num_layer_sets_minus1の出力レイヤセット(拡張出力レイヤセット)に対しては、ptl_dpb_info_present_flagが1の場合にDPB情報を復号する。存在しない識別子iの出力レイヤセットのDPB情報は識別子output_layer_set_idx_minus1[i]のDPBにより導出される。
(DPB情報復号手段の変形例)
上記DPB情報復号手段は、PTL・DPB情報有無フラグに基づいて、DPB情報を復号又は推定するが、これに限定されない。例えば、DPB情報復号手段は、PTL・DPB情報有無フラグによらず、出力レイヤセットが、基本出力レイヤセット、又は追加出力レイヤセットであるかに基づいて、DPB情報の復号を行ってもよい。
すなわち、DPB情報復号手段は、出力レイヤセットOLS#iが基本出力レイヤセットOLS#i(i=1..VpsNumLayerSets-1)である場合、符号化データより、出力レイヤセットOLS#iに対応するDPB情報DPB_INFO#iを復号する。一方、DPB情報復号手段は、出力レイヤセットOLS#iが追加出力レイヤセットOLS#i(i=VpsNumLayerSets..NumOutputLayerSets-1)である場合、出力レイヤセットOLS#iに対応するDPB情報DPB_INOF#iを符号化データより復号せず、出力レイヤセットOLS#iのレイヤセット識別子(lsIdx = output_layer_set_index_minus1[i] +1)が示す基本出力レイヤセットOLS#lsIdxのDPB情報DPB_INOF#lsIdxと等しいと推定する。換言すれば、出力レイヤセットOLS#iのインデックスが、i<VpsNumLayerSetsの場合、DPB情報DPB_INFO#iを復号し、i>=VpsNumLayerSetsの場合、DPB情報DPB_INFO#iを推定する。従って、追加出力レイヤセットOLS#i(i=VpsNumLayerSets..NumOutputLayerSets-1)に関するDPB情報DPB_INFO#iの復号/符号化を省略することができ、より少ない符号量で、基本出力レイヤセット、及び追加出力レイヤセットに関するDPB情報DPB_INFO#iを復号/符号化することができる効果がある。
(出力制御部16)
出力制御部16は、対象出力レイヤIDリストTargetOptLayerIdList[]と復号レイヤIDリストを導出し、復号ピクチャ管理部15に出力する。
出力制御部16は、外部より供給される出力指定情報である出力レイヤセット識別子TargetOLSIdx)と、レイヤセットLayerIdList[][]および出力レイヤフラグOutputLayerFlag[][]に基づいて、対象出力レイヤIDリストTargetOptLayerIdList[]を出力制御情報として導出する。
なお、出力制御部16が参照するアクティブパラメータセット(アクティブVPS)のシンタックス、及びシンタックスより導出される変数は、復号済であり、パラメータメモリ13に格納されているものとする。また、アクティブVPSを特定するために、アクティブVPS識別子を、出力指定情報に含めてもよい。
まず、出力制御部16は、出力指定情報に含まれる出力レイヤセット識別子TargetOLSIdxによって指定される出力レイヤセットOLS#TargetOLSIdxを処理対象として選択する。さらに、出力制御部16は、以下の疑似コードによって対象出力レイヤIDリストTargetOptLayerIdList[]を導出する(出力レイヤIDリスト導出手段)。
(TargetOptLayerIdListの導出を示す疑似コード)
for(k=0; j=0; j< NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx ]]; j++){ //SA01
if( OutputLayerFlag[ TargetOLSIdx ][j] ){ //SA02
TargetOptLayerIdList[k] = LayerIdList[LayerSetIdx[ TargetOLSIdx ] ][j]; //SA03
k++; //SA04
}
} // end of loop //SA05
なお、上記疑似コードをステップで表わせば、次の通りである。
(SA01)対象出力レイヤIDリストTargetOptLayerIdList[]の導出に係るループの開始点である。ループの開始前に、変数k、変数jは0に初期化される。以下の繰り返し処理のループ変数は変数jであり、出力制御部16は、0から(NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx] ]-1)の変数jに対して、SA02〜SA04に示す処理を実行する。
ここで、LayerSetIdx[ TargetOLSIdx ]は、TargetOLSIdxが示すレイヤセット識別子であり、NumLayersInIdList[x]は、レイヤセット識別子xが示すレイヤセットのレイヤ数であるから、NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx] ]は、対象出力レイヤセットOLS#(TargetOLSIdx)に関連付けられたレイヤセットLS#(LayerSetIdx[TargetOLSIdx])に含まれるレイヤ数である。
(SA02)対象出力レイヤセットに含まれる各レイヤが出力レイヤであるか否かを判定する。具体的には、対象出力レイヤセットにおいて、変数jの示すレイヤの出力レイヤフラグOutputLayerFlag[ TargetOLSIdx ][j]が1(真)である場合(出力レイヤである)、ステップSA04へ遷移する。出力レイヤフラグOutputLayerFlag[ TargetOLSIdx ][j]が0(偽)である場合(出力レイヤでない)、ステップSA0Aへ遷移する。
(SA03)対象出力レイヤセットの内、出力レイヤフラグが1(出力レイヤ)であるレイヤを、出力レイヤIDリストTargetOptLayerIdList[]として導出する。具体的には、出力レイヤセットOLS#(TargetOLSIdx)に関連付けられたレイヤセットLS#(LayerSetIdx[ TargetOLSIdx ])のj番目の要素を、出力レイヤセットOLS#(TargetOLSIdx)の出力レイヤIDリストTargetOptLayerIdList[]のk番目の要素へ追加する。すなわち、TargetOptLayerIdList[k] = LayerIdList[LayerSetIdx[ TargetOLSIdx ] ][j];
(SA04)変数kに”1”加算する。
(SA05)対象出力レイヤセットOLS#(TargetOLSIdx)のレイヤIDリストTargetOptLayerIdList[]、の導出に係るループの終端である。
(対象復号レイヤIDリスト導出)
さらに、出力制御部16の備える図示しない復号レイヤIDリスト導出手段は、対象出力レイヤIDリストTargetOptLayerIdList、パラメータメモリ13に保持されたアクティブVPSのレイヤセットLayerIdList[][]、レイヤ間依存情報より導出される依存フラグに基づいて、対象出力レイヤセットの復号に必要とするレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdList[]を導出する。導出されたTargetDecLayerIdList[]は、出力制御情報の一部として、ビットストリーム抽出部17、及びターゲットセットピクチャ部10へ供給する。
復号レイヤIDリスト導出手段は、対象復号レイヤIDリストを、例えば、以下の疑似コードによって導出される。
(TargetDecLayerIdListの導出を示す疑似コード1)
for(i=0,j=0; j< NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx ]]; j++){ //SB01
iNuhLId = layer_id_in_nuh[ LayerIdList[ LayerSetIdx[ TargetOLSIdx ] ][ j ] ];
//SB02
for(refLayerFlag=0, k=0; k< NumOptLayersInOLS[TargetOLSIdx]; k++){ //SB03
iOptLayerId = layer_id_in_nuh[ TargetOptLayerIdList[k] ]; //SB04
refLayerFlag =
(refLayerFlag | recursiveRefLayerFlag[ iOptLayerId ][ iNuhLId ]); //SB05
} //SB06
if( OutputLayerFlag[ TargetOLSIdx ][j] || refLayerFlag ){ //SB07
TargetDecLayerId[i] = LayerIdList[ LayerSetIdx[ TargetOLSIdx ] ][j]; //SB08
i++; //SB09
}
} //SB10
なお、上記疑似コードをステップで表わせば、次の通りである。なお、各ステップ番号SB01.. SB10は、疑似コード、及び図19に示す対象復号レイヤIDリストの導出に係るフロー図のステップ番号SB01.. SB10と対応する。
(SB01)対象復号レイヤIDリストTargetDecLayerIdList[]の導出に係るループの開始点である。変数i、変数jは0に初期化される。以下の繰り返し処理のループ変数は変数jであり、復号レイヤIDリスト導出手段は、0から(NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx] ]-1)の変数jに対して、SB02〜SB08に示す処理を実行する。
(SB02)復号レイヤIDリスト導出手段は、出力レイヤセットに含まれる変数jで識別されるレイヤ(以下、対象レイヤj)のレイヤ識別子を導出する。具体的には、出力レイヤセットOLS#(TargetOLSIdx)に関連付けられたレイヤセットLS#(LayerSetIdx[ TargetOLSIdx ])のj番目の要素(対象レイヤj)(LayerIdList[LayerSetIdx[TargetOLSIdx]][j])のレイヤ識別子を、変数iNuhLIdへ設定する。
(SB03)復号レイヤIDリスト導出手段は、出力レイヤセットに関連付けられたレイヤセットのレイヤ(対象レイヤj)が、出力レイヤフラグが1のレイヤである対象出力レイヤTargetOptLayerIdList[k]の依存レイヤ(直接参照レイヤ、又は間接参照レイヤ)であるか否かを示すフラグrefLayerFlagをSB03〜SB05により導出する。
復号レイヤIDリスト導出手段は、対象出力レイヤTargetOptLayerIdList[k]に属する各々のレイヤ(以下、出力レイヤk)に対して、対象レイヤjが出力レイヤkに依存するか否かを示す依存フラグrecursiveRefLayerFlag[出力レイヤkのレイヤID][対象レイヤjのレイヤID]を判定し、1つでも依存フラグrecursiveRefLayerFlag[][]が1のレイヤが存在すれば、対象レイヤjが出力レイヤkの依存レイヤであるか否かを示す対象レイヤ依存フラグrefLayerFlagを1にする。
SB03では、ループの開始前に、変数k、フラグrefLayerFlagを0に初期化する。ループ内の処理は、変数kが、出力レイヤ数“NumOptLayerIdList[TargetOptLayerIdx]”未満のときに実行され、ループ内の処理が1回実行される度に、変数kは“1”加算される。
(SB04)変数iOptLayerIdへ、出力レイヤTargetOptLayerIdList[k]のレイヤ識別子を設定する。
(SB05)フラグrefLayerFlagと、レイヤ識別子iOptLayerIdを有する出力レイヤTargetOptLayerIdList[k]に対するレイヤ識別子iNuhLIdを有する対象レイヤjの依存フラグrecursiveRefLayerFlagとの論理和の値を、フラグrefLayerFlagへ設定する。
(SB06)ステップSB03のループ終端である。
(SB07)復号レイヤIDリスト導出手段は、対象レイヤjが出力レイヤであるか、又は対象出力レイヤセットTargetOptLayerSet内の出力レイヤの依存レイヤであるかを判定する。対象レイヤjの出力レイヤフラグOutputLayerFlag[TargetOLSIdx][j]が1(真)、又は対象レイヤjの対象レイヤ依存フラグrefLayerFlagが1(真)である場合、ステップSB08-SB09を実行する。
(SB08)復号レイヤIDリスト導出手段は、対象レイヤjが出力レイヤであるか、又は出力レイヤの依存レイヤである場合に、対象レイヤjを対象復号レイヤIDリストTargetDecLayerIdList[]の要素として導出する。具体的には、対象復号レイヤIDリストTargetDecLayerIdList[]のi番目の要素へ、対象出力レイヤセットTargetOptLayerSetに関連付けられたレイヤセットLayerSetIdx[ TargetOLSIdx ]のj番目の要素を追加する。
上記処理では、非出力(出力レイヤフラグOutputLayerFlag[TargetOLSIdx][j]が0)かつ非依存(refLayerFlagが0)のレイヤは除外される。つまり、復号レイヤIDリスト導出手段は、出力レイヤセットTargetOptLayerSetにおいて、非出力かつ非参照レイヤであるレイヤを除く、全てのレイヤ(出力レイヤ、又は依存レイヤ)を対象復号レイヤIDリストへ含める。
(SB09)変数iへ”1”を加算する。
(SB10)ステップSB01のループ終端である。
なお、上記依存フラグの導出手順は、上記ステップに限定されず、実施可能な範囲で変更してもよい。例えば、ステップSB05において、フラグrefLayerFlagの値は、論理和の演算子’|’代わりに、和の演算子’+’としてもよい。
なお、既に説明したように、対象出力レイヤIDリストTargetOptLayerIdListは、出力制御部16において、出力レイヤフラグOutputLayerFlag[][]から導出される情報である。従って、全体とすれば、出力制御部16は、出力レイヤセット識別子TargetOLSIdx、レイヤセットLayerIdList[][]、出力レイヤフラグOutputLayerFlag[][]および依存フラグrecursiveRefLayerFlagにより、対象復号レイヤIDリストを導出する。
上記構成の出力制御部16は、対象出力レイヤセットTargetOptLayerSetに関連づけられるレイヤセットの各レイヤが、対象出力レイヤセットの出力レイヤもしくは出力レイヤの依存レイヤであるかに応じて、復号対象とするレイヤである対象復号レイヤIDリストTargetDecLayerIdList[]を導出する。すなわち、出力制御部16は、対象出力レイヤセットの出力レイヤの復号に必須でないレイヤ(非出力かつ非参照レイヤ)を、対象復号レイヤIDリストTargetDecLayerIdList[]に含めない。これにより、ターゲットセットピクチャ復号部10は、非出力かつ非参照レイヤの復号を省略することが可能である。また、同様に、上記構成の出力制御部16は、対象出力レイヤセットの出力レイヤの復号に必須でない、非出力かつ非参照レイヤのレイヤ識別子を有するNALユニットを、対象復号レイヤIDリストTargetDecLayerIdListに含めないため、ビットストリーム抽出部17ではこれらのレイヤが破棄される。
(対象復号レイヤIDリストTargetDecLayerIdListの導出の変形例1)
また、出力制御部は、出力レイヤ、又は出力レイヤの依存レイヤに関わらず、特定レイヤのレイヤ識別子を有するレイヤを、対象復号レイヤIDリストTargetDecLayerIdListに含めるようにした出力制御部16aであってもよい。例えば、特定レイヤとしてレイヤ識別子=0であるレイヤ(ベースレイヤ)を含め、対象復号レイヤIDリストTargetDecLayerIdListを導出しても良い。この場合、対象復号レイヤIDリストTargetDecLayerIdListの導出を示す擬似コードのステップSB07の条件式を次の条件式(A1)又は(A2)へ変更する。
(SB07a)
if( OutputLayerFlag[ TargetOLSIdx ][j]
|| refLayerFlag
|| LayerIdList[ LayerSetIdx[TargetOLSIdx]][ j ] == 0 ) ・・(A1)

if( OutputLayerFlag[ TargetOLSIdx ][j]
|| refLayerFlag
|| layer_id_in_nuh[(LayerIdList[ LayerSetIdx[TargetOLSIdx]][ j ]) == 0 ) ・・(A2)
上記式(A1)または(A2)によれば、出力制御部16aは、対象レイヤjが出力レイヤであるか、又は対象出力レイヤセットTargetOptLayerSet内の出力レイヤに対する依存レイヤであるか、対象レイヤjのレイヤ識別子が0であるかを判定する。出力制御部16aは、さらに、出力レイヤフラグOutputLayerFlag[TargetOLSIdx][j]が1(真)、又はフラグrefLayerFlagが1(真)、又は対象レイヤjがベースレイヤ(レイヤjのレイヤ識別子が0)である場合、ステップSB08-SB09を実行する。
上記構成の出力制御部16aは、対象出力レイヤセットTargetOptLayerSetに対して、対象出力レイヤセットの出力レイヤ、及び出力レイヤの依存レイヤ、及びプロファイル等で必須であると指定されたレイヤ(ベースレイヤ)を、復号対象とするレイヤに設定して、対象復号レイヤIDリストTargetDecLayerIdList[]を導出する。すなわち、出力制御部16aは、対象出力レイヤセットの出力レイヤの復号に必須でない、非出力かつ非参照レイヤかつ非ベースレイヤのレイヤは、対象復号レイヤIDリストTargetDecLayerIdList[]に含めない。これにより、ターゲットセットピクチャ復号部10は、出力レイヤの復号に必須でない非出力かつ非参照レイヤを、プロファイルで必須であるとして指定されるレイヤ(ここではベースレイヤ)でない場合に省略することが可能である。また、同様に、上記構成の出力制御部16は、対象出力レイヤセットの出力レイヤの復号に必須でない、非出力かつ非参照レイヤのレイヤ識別子を有するNALユニットを、プロファイルで必須であるとして指定されるレイヤ(ここではベースレイヤ)でない場合に対象復号レイヤIDリストTargetDecLayerIdListに含めないため、ビットストリーム抽出部17ではこれらのレイヤが破棄される。
(対象復号レイヤIDリストTargetDecLayerIdListの導出の変形例2)
また、出力制御部は、対象出力レイヤセットにおいて、プライマリピクチャレイヤを、対象復号レイヤIDリストTargetDecLayerIdListに含めるようにした出力制御部16bであってもよい。
すなわち、出力制御部16bの備える図示しない復号レイヤIDリスト導出手段は、パラメータメモリ13に保持されたアクティブVPSのレイヤセットLayerIdList[][]、スケーラブル識別子より導出される補助ピクチャレイヤID(AuxId[])に基づいて、対象出力レイヤセットの復号に必要とするレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdList[]を導出する。導出されたTargetDecLayerIdList[]は、出力制御情報の一部として、ビットストリーム抽出部17、及びターゲットセットピクチャ部10へ供給する。なお、出力制御部16bの備える対象出力レイヤIDリスト手段は、出力制御部16の備える対象出力レイヤIDリスト導出手段と同一であるため、説明を省略する。
復号レイヤIDリスト導出手段は、対象復号レイヤIDリストを、例えば、以下の疑似コードによって導出される。
(TargetDecLayerIdListの導出を示す疑似コード2)
for(i=0,j=0; j< NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx ]]; j++){ //SC01
iNuhLId = layer_id_in_nuh[ LayerIdList[ LayerSetIdx[ TargetOLSIdx ] ][ j ] ];
//SC02
if( AuxId[ iNuhLId ] == 0 ){ //SC03
TargetDecLayerId[i] = LayerIdList[ LayerSetIdx[ TargetOLSIdx ] ][j]; //SC04
i++; //SC05
}
} //SC06
なお、上記疑似コードをステップで表わせば、次の通りである。なお、各ステップ番号SC01.. SC06は、疑似コードのステップ番号SC01.. SC06と対応する。
(SC01)対象復号レイヤIDリストTargetDecLayerIdList[]の導出に係るループの開始点である。変数i、変数jは0に初期化される。以下の繰り返し処理のループ変数は変数jであり、復号レイヤIDリスト導出手段は、0から(NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx] ]-1)の変数jに対して、SC02〜SC06に示す処理を実行する。
(SC02)復号レイヤIDリスト導出手段は、出力レイヤセットに含まれる変数jで識別されるレイヤ(以下、対象レイヤj)のレイヤ識別子を導出する。具体的には、出力レイヤセットOLS#(TargetOLSIdx)に関連付けられたレイヤセットLS#(LayerSetIdx[ TargetOLSIdx ])のj番目の要素(対象レイヤj)(LayerIdList[LayerSetIdx[TargetOLSIdx]][j])のレイヤ識別子を、変数iNuhLIdへ設定する。
(SC03)復号レイヤIDリスト導出手段は、対象レイヤjがプライマリピクチャレイヤであるかを判定する。対象レイヤjの補助ピクチャレイヤID(AuxId[iNuhLId])が0の場合、対象レイヤjを、プライマリピクチャレイヤであると判定し、ステップSC04-SC05を実行する。
(SC04)復号レイヤIDリスト導出手段は、対象レイヤjがプライマリピクチャレイヤである場合に、対象レイヤjを対象復号レイヤIDリストTargetDecLayerIdList[]の要素として導出する。具体的には、対象復号レイヤIDリストTargetDecLayerIdList[]のi番目の要素へ、対象出力レイヤセットTargetOptLayerSetに関連付けられたレイヤセットLayerSetIdx[ TargetOLSIdx ]のj番目の要素を追加する。
上記処理では、補助ピクチャレイヤIDが0より大きい(補助ピクチャレイヤである)レイヤは除外される。つまり、復号レイヤIDリスト導出手段は、出力レイヤセットTargetOptLayerSetにおいて、補助ピクチャレイヤを除く、全てのプライマリピクチャレイヤを対象復号レイヤIDリストへ含める。
(SC05)変数iへ”1”を加算する。
(SC06)ステップSC01のループ終端である。
なお、上記対象復号レイヤIDリストの導出手順は、上記ステップに限定されず、実施可能な範囲で変更してもよい。
上記構成の出力制御部16bは、対象出力レイヤセットTargetOptLayerSetに関連づけられるレイヤセットの各レイヤが、プライマリピクチャレイヤであるか(補助ピクチャレイヤでない)に応じて、復号対象とするレイヤである対象復号レイヤIDリストTargetDecLayerIdList[]を導出する。すなわち、出力制御部16bは、対象出力レイヤセットのプライマイリピクチャレイヤの復号に必須でない補助ピクチャレイヤ(AuxId[]>0)を、対象復号レイヤIDリストTargetDecLayerIdList[]に含めない。これにより、ターゲットセットピクチャ復号部10は、補助ピクチャレイヤの復号を省略することが可能である。また、同様に、上記構成の出力制御部16bは、対象出力レイヤセットのプライマリピクチャレイヤの復号に必須でない、補助ピクチャレイヤのレイヤ識別子を有するNALユニットを、対象復号レイヤIDリストTargetDecLayerIdListに含めないため、ビットストリーム抽出部17では、補助ピクチャレイヤのレイヤ識別子を有するNALユニットが破棄される。
(対象復号レイヤIDリストTargetDecLayerIdListの導出の変形例3)
また、出力制御部16は、対象出力レイヤセットにおいて、プライマリピクチャレイヤ、及び出力レイヤである補助ピクチャレイヤを、対象復号レイヤIDリストTargetDecLayerIdListに含めるようにした出力制御部16cであってもよい。
すなわち、出力制御部16cの備える図示しない復号レイヤIDリスト導出手段は、対象出力レイヤセットの出力レイヤフラグOutputLayerFlag[TargetOLSIdx][]、パラメータメモリ13に保持されたアクティブVPSのレイヤセットLayerIdList[][]、スケーラブル識別子より導出される補助ピクチャレイヤID(AuxId[])に基づいて、対象出力レイヤセットの復号に必要とするレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdList[]を導出する。導出されたTargetDecLayerIdList[]は、出力制御情報の一部として、ビットストリーム抽出部17、及びターゲットセットピクチャ部10へ供給する。なお、出力制御部16cの備える対象出力レイヤIDリスト手段は、出力制御部16の備える対象出力レイヤIDリスト導出手段と同一であるため、説明を省略する。
復号レイヤIDリスト導出手段は、対象復号レイヤIDリストを、例えば、以下の疑似コードによって導出される。
(TargetDecLayerIdListの導出を示す疑似コード3)
for(i=0,j=0; j< NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx ]]; j++){ //SD01
iNuhLId = layer_id_in_nuh[ LayerIdList[ LayerSetIdx[ TargetOLSIdx ] ][ j ] ];
//SD02
if( AuxId[ iNuhLId ] == 0 ||
( AuxId[ iNuhLId ] > 0 && OutputLayerFlag[ TargetOLSIdx ][ j ]>0 ) ){ //SD03
TargetDecLayerId[i] = LayerIdList[ LayerSetIdx[ TargetOLSIdx ] ][j]; //SD04
i++; //SB05
}
} //SB06
なお、上記疑似コードをステップで表わせば、次の通りである。なお、各ステップ番号SD01.. SD06は、疑似コードのステップ番号SD01.. SD06と対応する。
(SD01)対象復号レイヤIDリストTargetDecLayerIdList[]の導出に係るループの開始点である。変数k、変数jは0に初期化される。以下の繰り返し処理のループ変数は変数jであり、復号レイヤIDリスト導出手段は、は、0から(NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx] ]-1)の変数jに対して、SD02〜SD06に示す処理を実行する。
(SD02)復号レイヤIDリスト導出手段は、出力レイヤセットに含まれる変数jで識別されるレイヤ(以下、レイヤj)のレイヤ識別子を導出する。具体的には、出力レイヤセットOLS#(TargetOLSIdx)に関連付けられたレイヤセットLS#(LayerSetIdx[ TargetOLSIdx ])のj番目の要素(対象レイヤj)(LayerIdList[LayerSetIdx[TargetOLSIdx]][j])のレイヤ識別子を、変数iNuhLIdへ設定する。
(SD03)復号レイヤIDリスト導出手段は、対象レイヤjがプライマリピクチャレイヤ、又は出力レイヤである補助ピクチャレイヤであるかを判定する。対象レイヤjの補助ピクチャレイヤID(AuxId[iNuhLId])が0、又は、対象レイヤjの補助ピクチャレイヤIDが0より大きい、かつ、対象レイヤjの出力レイヤフラグが1である場合、ステップSD04-SD05を実行する。
(SD04)復号レイヤIDリスト導出手段は、対象レイヤjがプライマリピクチャレイヤ、又は出力レイヤである補助ピクチャレイヤである場合に、対象レイヤjを対象復号レイヤIDリストTargetDecLayerIdList[]の要素として導出する。具体的には、対象復号レイヤIDリストTargetDecLayerIdList[]のi番目の要素へ、対象出力レイヤセットTargetOptLayerSetに関連付けられたレイヤセットLayerSetIdx[ TargetOLSIdx ]のj番目の要素を追加する。
上記処理では、出力レイヤフラグが0、かつ、補助ピクチャレイヤIDが0より大きい(補助ピクチャレイヤである)レイヤは除外される。つまり、復号レイヤIDリスト導出手段は、出力レイヤセットTargetOptLayerSetにおいて、出力レイヤでない補助ピクチャレイヤを除く、全てのレイヤ(プライマリピクチャレイヤ、又は出力レイヤである補助ピクチャレイヤ)を対象復号レイヤIDリストへ含める。
(SD05)変数iへ”1”を加算する。
(SD06)ステップSD01のループ終端である。
なお、上記対象復号レイヤIDリストの導出手順は、上記ステップに限定されず、実施可能な範囲で変更してもよい。
上記構成の出力制御部16cは、対象出力レイヤセットTargetOptLayerSetに関連づけられるレイヤセットの各レイヤが、プライマリピクチャレイヤであるか(補助ピクチャレイヤでない)、又は出力レイヤである補助ピクチャであるかに応じて、復号対象とするレイヤである対象復号レイヤIDリストTargetDecLayerIdList[]を導出する。すなわち、出力制御部16cは、対象出力レイヤセットのプライマイリピクチャレイヤの復号に必須でない、出力レイヤフラグが0である補助ピクチャレイヤ(AuxId[]>0)を、対象復号レイヤIDリストTargetDecLayerIdList[]に含めない。これにより、ターゲットセットピクチャ復号部10は、出力レイヤフラグが0である補助ピクチャレイヤの復号を省略することが可能である。また、同様に、上記構成の出力制御部16cは、対象出力レイヤセットのプライマリピクチャレイヤの復号に必須でない、出力レイヤフラグが0である補助ピクチャレイヤのレイヤ識別子を有するNALユニットを、対象復号レイヤIDリストTargetDecLayerIdListに含めないため、ビットストリーム抽出部17では、出力レイヤでない補助ピクチャレイヤのレイヤ識別子を有するNALユニットが破棄される。
なお、出力制御部16(及びその変形例を含む)において、指定された出力レイヤセットOLS#(TargetOLSIdx)が出力レイヤを有さない場合は、出力レイヤセットに含まれる、少なくとも1以上のレイヤを出力レイヤとして指定することが好ましい。例えば、出力レイヤセットに含まれる全レイヤ、あるは最高次レイヤ識別子を有するプライマリピクチャレイヤを出力レイヤと指定すればよい。
(対象復号レイヤIDリストTargetDecLayerIdListの導出の変形例4)
また、出力制御部16は、コンフォーマンステストのための復号であるか否かに応じて、動作を変更する出力制御部16dであってもよい。コンフォーマンステストのための復号であるか否かは、階層動画像復号装置の外部から与えられる。コンフォーマンステストのための復号とは、指定されたパラメータ(例えば、DPBパラメータ通り)に動作するかどうかをテストするための復号であり、それ以外の場合は、実際に動画像を視聴するために使用される通常の復号である。出力制御部16dは、コンフォーマンステストのための復号であるか否かに応じて、動作を変更する。
出力制御部16dは、コンフォーマンステストのための復号である場合には、復号レイヤIDリスト導出手段は、対象復号レイヤIDリストを、例えば、以下の疑似コードによって導出する。
for(i=0,j=0; j< NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx ]]; j++){
iNuhLId = layer_id_in_nuh[ LayerIdList[ LayerSetIdx[ TargetOLSIdx ] ][ j ] ];
TargetDecLayerId[i] = LayerIdList[ LayerSetIdx[ TargetOLSIdx ] ][j];
i++;
}
すなわち、復号レイヤIDリスト導出手段は、コンフォーマンステストのための復号である場合には、TargetOLSIdxで示される出力レイヤセットに対応するレイヤセット(LayerSetIdx[ TargetOLSIdx ]で示されるレイヤセット)に含まれる全てのレイヤのレイヤIDを対象復号レイヤIDリストTargetDecLayerIdListに追加する。
また、出力制御部16dは、コンフォーマンステストのための復号ではない場合には、既に説明した出力制御部16、出力制御部16b、出力制御部16cのいずれかによって対象復号レイヤIDリストTargetDecLayerIdListを導出する。すなわち、出力レイヤに関係しない非出力・非参照のレイヤを追加しない(出力制御部16)、補助ピクチャレイヤを追加しない(出力制御部16b)、非出力の補助ピクチャレイヤを追加しない(出力制御部16c)のいずれかにより、対象復号レイヤIDリストTargetDecLayerIdListを導出する。
以上の構成では、コンフォーマンステストのための復号である場合には、出力レイヤセットに含まれる全てのレイヤが復号され、それ以外の場合(通常の再生の場合)には、出力レイヤセットに対応するレイヤセットに含まれるレイヤの内、出力に関連するレイヤ(もしくは補助ピクチャレイヤに関連しないレイヤ)のみが復号される。コンフォーマンステストでテストされるDPBパラメータは、全ての出力レイヤセットに含まれる全てのレイヤを復号するとしてテストされる。
逆にいえば、コンフォーマンステストを満たすように付加される出力レイヤセットに付加されるDPBパラメータは、補助ピクチャレイヤを含む全てのレイヤを復号する場合に対応する値となる。従って、出力レイヤセットに付加されるDPBパラメータに応じて、階層動画像復号装置は、補助ピクチャレイヤを含むレイヤを復号する場合のDPBパラメータに従って復号の可否や、復号メモリの準備を行うことができるという効果がある。さらに、コンフォーマンステストのための復号以外である場合(通常の再生)では、既に説明したように、出力に関係ないレイヤの復号や、補助レイヤの復号を省略するため、処理が簡単になるという効果がある。
(ピクチャ復号部14)
ピクチャ復号部14は、入力されるVCL NALユニット、および、アクティブパラメータセットに基づいて復号ピクチャを生成して出力する。
図20を用いて、ピクチャ復号部14の概略的構成を説明する。図20は、ピクチャ復号部14の概略的構成を示した機能ブロック図である。
ピクチャ復号部14は、スライスヘッダ復号部141、CTU復号部142を備えている。CTU復号部142は、さらに、予測残差復元部1421、予測画像生成部1422、及びCTU復号画像生成部1423を含んでいる。
(スライスヘッダ復号部141)
スライスヘッダ復号部141は、入力されるVCL NALユニットとアクティブパラメータセットに基づいてスライスヘッダを復号する。復号したスライスヘッダは、入力されるVCL NALユニットと合わせてCTU復号部142に出力する。
(CTU復号部142)
CTU復号部142は、概略的には、入力されるVCL NALユニットに含まれるスライスセグメント(スライスヘッダおよびスライスデータ)、及びアクティブパラメータセットに基づいて、ピクチャを構成するスライスに含まれる各CTUに対応する領域の復号画像を復号することで、スライスの復号画像を生成する。CTUの復号画像は、CTU復号部142内部の予測残差復元部1421、予測画像生成部1422、及びCTU復号画像生成部1423により生成される。
予測残差復元部1421は、入力のスライスデータに含まれる予測残差情報(TT情報)を復号して対象CTUの予測残差を生成して出力する。
予測画像生成部1422は、入力のスライスデータに含まれる予測情報(PT情報)の示す予測方法と予測パラメータに基づいて予測画像を生成して出力する。その際、必要に応じて、参照ピクチャの復号画像や符号化パラメータが利用される。例えば、インター予測、または、レイヤ間画像予測を使用する場合は、復号ピクチャ管理部15より対応する参照ピクチャを読み出す。
CTU復号画像生成部1423は、入力される予測画像と予測残差を加算して対象CTUの復号画像を生成して出力する。
<ピクチャ復号部14の復号プロセス>
以下、図21を参照して、ピクチャ復号部14における対象レイヤiのピクチャの復号の概略的な動作について説明する。図21は、ピクチャ復号部14における対象レイヤiのピクチャを構成するスライス単位の復号プロセスを示すフロー図である。
(SD101)復号対象スライスの先頭スライスフラグ(first_slice_segment_in_pic_flag)(図17(d)のSYNSH01)を復号する。先頭スライスフラグが1の場合、復号対象スライスは、ピクチャ内の復号順(以降、処理順)で先頭スライスであり、復号対象スライスの先頭CTUのピクチャ内でのラスタスキャン順での位置(以降、CTUアドレス)を0に設定する。さらに、ピクチャ内の処理済みCTU数のカウンタnumCtu(以降、処理済CTU数numCtu)を0に設定する。先頭スライスフラグが0の場合、後述のSD106で復号されるスライスアドレスに基づいて、復号対象スライスの先頭CTUアドレスを設定する。
(SD102)復号対象スライスの復号時に参照するアクティブPPSを指定するアクティブPPS識別子(slice_pic_paramter_set_id)(図17(d)のSYNSH02)を復号する。
(SD104)アクティブパラメータセットをパラメータメモリ13よりフェッチする。すなわち、復号対象スライスが参照するアクティブPPS識別子(slice_pic_parameter_set_id)と同一のPPS識別子(pps_pic_parameter_set_id)を有するPPSをアクティブPPSとし、パラメータメモリ13から、アクティブPPSの符号化パラメータをフェッチする(読み出す)。さらに、アクティブPPS内のアクティブSPS識別子(pps_seq_parameter_set_id)と同一のSPS識別子(sps_seq_parameter_set_id)を有するSPSをアクティブSPSとし、パラメータメモリ13から、アクティブSPSの符号化パラメータをフェッチする。さらに、アクティブSPS内のアクティブVPS識別子(sps_video_parameter_set_id)と同一のVPS識別子(vps_video_parameter_set_id)を有するVPSをアクティブVPSとし、パラメータメモリ13から、アクティブVPSの符号化パラメータをフェッチする。
(SD105)復号対象スライスが、ピクチャ内の処理順で先頭スライスであるか否かを先頭スライスフラグに基づいて判定する。先頭スライスフラグが0の場合(SD105でYes)、ステップSD106へ遷移する。それ以外の場合(SD105でNo)、ステップSD106の処理をスキップする。なお、先頭スライスフラグが1の場合、復号対象スライスのスライスアドレスは0である。
(SD106)復号対象スライスのスライスアドレス(slice_segment_address)(図17(d)のSYNSH03)を復号し、復号対象スライスの先頭CTUアドレスを設定する。例えば、先頭スライスCTUアドレス=slice_segment_addressである。
(SD10A)CTU復号部142は、入力されるスライスヘッダ、アクティブパラメータセット、及びVCL NALユニットに含まれるスライスデータ内の各CTU情報(図17(e)のSYNSD01)に基づいて、ピクチャを構成するスライスに含まれる各CTUに対応する領域のCTU復号画像を生成する。さらに、各CTU情報の後に、該CTUが復号対象スライスの終端であるかを示すスライス終端フラグ(end_of_slice_segment_flag)(図17(e)のSYNSD2)。また、各CTUの復号後に、処理済CTU数numCtuの値を1加算する(numCtu++)。
(SD10B)該CTUが復号対象スライスの終端であるか否かをスライス終端フラグに基づいて判定する。スライス終端フラグが1の場合(SD10BでYes)、ステップSD10Cへ遷移する。それ以外の場合(SD10BでNo)、後続のCTU情報を復号するため、ステップSD10Aへ遷移する。
(SD10C)処理済CTU数numCtuが、ピクチャを構成するCTUの総数(PicSizeInCtbsY)に達したか判定する。すなわち、numCtu==PicSizeInCtbsYであるか判定する。numCtuがPicSizeInCtbsYと等しい場合(SD10CでYes)、復号対象ピクチャを構成するスライス単位の復号処理を終了する。それ以外の場合(numCtu<PicSizeInCtbsY)(SD10CでNo)、復号対象ピクチャを構成するスライス単位の復号処理を継続するため、ステップSD101へ遷移する。
以上、実施例1に係るピクチャ復号部14の動作について説明したが、上記ステップに限定されず、実施可能な範囲で、ステップを変更しても構わない。
(ビットストリーム抽出部17)
ビットストリーム抽出部17は、出力制御部16より供給される出力制御情報(出力レイヤセットのうち、復号対象となるレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdList、及び対象最高次テンポラル識別子TargetHighestTidに基づいて、ビットストリーム抽出処理を行い、入力される階層符号化データDATAから、対象最高次テンポラル識別子TargetHighestTid、及び対象復号レイヤIDリストTargetDecLayerIdListによって定まる集合(ターゲットセットTargetSetと呼ぶ)に含まれないNALユニットを除去(破棄)し、ターゲットセットTargetSetに含まれるNALユニットから構成される対象レイヤセット符号化データDATA#T(BitstreamToDecode)を抽出し、出力する。
より具体的には、上記ビットストリーム抽出部17は、図示しないNALユニットヘッダを復号するNALユニット復号手段を備える。
(ビットストリーム抽出処理1)
以下、図22を参照して、本実施例に係るビットストリーム抽出部17の概略的な動作について説明する。図22は、ビットストリーム抽出部17におけるアクセスユニット単位のビットストリーム抽出処理を示すフロー図である。
(SG101)ビットストリーム抽出部17は、図5(b)に示すシンタックス表に従って、供給された対象NALユニットのNALユニットヘッダを復号する。すなわち、NALユニットタイプ(nal_unit_type)、レイヤ識別子(nuh_layer_id)、及びテンポラル識別子(nuh_temporal_id_plus1)を復号する。なお、対象NALユニットのレイヤ識別子nuhLayerIdは、“nuh_layer_id”に設定され、対象NALユニットのテンポラル識別子temporalIdは、“nuh_temporal_id_plus1 - 1”に設定される。
(SG102)対象NALユニットのレイヤ識別子、テンポラル識別子がターゲットセットTargetSetに含まれるか否かを、対象復号レイヤIDリストTargetDecLayerIdList、及び対象最高次テンポラル識別子に基づいて判定する。より具体的には、以下の(C1)〜(C2)の条件のうち、少なくとも何れかの条件が偽である場合(SG102でNo)、ステップSG103へ遷移する。それ以外((C1)、(C2)ともに真)の場合(SG102でYes)、ステップSG103を省略する。
(C1)「対象復号レイヤIDリストTargetDecLayerIdListに、対象NALユニットのレイヤ識別子と同一の値がある」場合、真と判定し、それ以外の場合(対象復号レイヤIDリストTargetDecLayerIdListに、対象NALユニットのレイヤ識別子と同一の値がない)、偽と判定する。
(C2)「対象NALユニットのテンポラル識別子が対象最高次テンポラル識別子TargetHighestTid以下である」場合、真と判定し、それ以外の場合(対象NALユニットのテンポラル識別子が対象最高次テンポラル識別子TargetHighestTidより大きい)、偽と判定する。
(SG103)対象NALユニットを破棄する。すなわち、対象NALユニットは、ターゲットセットTargetSetに含まれないため、ビットストリーム抽出部17は、入力された階層符号化データDATAから、対象NALユニットを除去する。
(SG10A)同一アクセスユニット内に、未処理のNALユニットがあるか判定する。未処理のNALユニットがある場合(SG10AでNo)、対象アクセスユニットを構成するNALユニット単位のビットストリーム抽出を継続するため、ステップSG101へ遷移する。それ以外の場合(SG10AでYes)、ステップSG10Bへ遷移する。
(SG10B)入力された階層符号化データDATAに、対象アクセスユニットの次のアクセスユニットがあるか判定する。次のアクセスユニットがある場合(SG10BでYes)、次のアクセスユニットの処理を継続するため、ステップSG101へ遷移する。次のアクセスユニットがない場合(SG10BでNo)、ビットストリーム抽出処理を終了する。
以上、実施例1に係るビットストリーム抽出部17の動作について説明したが、上記ステップに限定されず、実施可能な範囲で、ステップを変更しても構わない。
以上説明したビットストリーム抽出部17によれば、外部より供給される対象レイヤセットLayerSetTargetを構成するレイヤのレイヤIDリストLayerIdListTarget、及び対象最高次テンポラル識別子HighestTidTargetに基づいて、ビットストリーム抽出処理を行い、入力される階層符号化データDATAから、対象最高次テンポラル識別子HighestTidTarget、及び対象レイヤセットLayerSetTargetのレイヤIDリストLayerIdListTargetによって定まるターゲットセットTargetSetに含まれないNALユニットを除去(破棄)し、ターゲットセットTargetSetに含まれるNALユニットから構成される符号化データBitstreamToDecodeを抽出し、生成することができる。
(動画像復号装置1の効果)
以上説明した本実施形態に係る階層動画像復号装置1(階層画像復号装置)は、外部より供給される出力レイヤセット識別子TargetOLSIdx、及びパラメータメモリ13に保持されたアクティブVPSのレイヤセット情報、及び出力レイヤセット情報に基づいて対象出力レイヤセットTargetOptLayerSetの出力レイヤのレイヤ構成を示す対象出力レイヤIDリストを導出し、さらに、出力レイヤセット識別子TargetOLSIdx、及びパラメータメモリ13に保持されたアクティブVPSのレイヤセット情報、及び出力レイヤセット情報、レイヤ間依存情報より導出される依存フラグ、及び導出された対象出力レイヤIDリストTargetOptLayerIdListに基づいて、対象出力レイヤセットTargetOptLayerSetの復号に必要とするレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdListを導出する出力制御部16(又は出力制御部16a)を備える。
特に、出力制御部16(及び出力制御部16a)は、出力レイヤの復号に必須でない、非出力レイヤかつ非依存レイヤを対象復号レイヤIDリストから除外する。すなわち、出力制御部16は、対象出力レイヤセットの出力レイヤの復号に必須でない、非出力・非参照レイヤの復号を省略するよう、階層動画像復号装置1へ指示することが可能である。従って、対象復号レイヤIDリストTargetDecLayerIdListに含まれるレイヤを復号する階層動画像復号装置1は、対象出力レイヤセットTargetOptLayerSetのうち、復号に必須である出力レイヤ、及び出力レイヤの依存レイヤの符号化データを復号し、非出力レイヤかつ非依存レイヤの復号処理を省略することができる。
また、出力制御部16は、対象出力レイヤセットの出力レイヤの復号に必須でない、非出力・非参照レイヤのレイヤ識別子を有するNALユニットを破棄するように、ビットストリーム抽出部17へ指示することが可能である。すなわち、階層動画像復号装置1の備えるビットストリーム抽出部17は、出力制御部16より供給される対象復号レイヤIDリストTargetDecLayerIdList、及び外部より供給される復号対象とするレイヤに付随する最高次のサブレイヤを指定する対象最高次テンポラル識別子TargetHighestTidによって定まるターゲットセットTargetSetに含まれないNALユニットを除去(破棄)し、ターゲットセットTargetSetに含まれるNALユニットから構成されるターゲットセット符号化データDATA#T(BitstreamToDecode)を抽出することができる。
また、以上説明した本実施形態に係る階層動画像復号装置1(階層画像復号装置)は、出力制御部16(又は出力制御部16a)の代わりに、出力制御部16b〜出力制御部16cを備えてもよい。
出力制御部16bは、対象出力レイヤセットにおいて、プライマリピクチャレイヤの復号に必須でない、補助ピクチャレイヤを対象復号レイヤIDリストから除外する。すなわち、補助ピクチャレイヤを含まない対象復号レイヤIDリストを構築する。そのため、出力制御部16bは、対象出力レイヤセットのプライマリピクチャレイヤの復号に必須でない、補助ピクチャレイヤの復号を省略するよう、階層動画像復号装置1へ指示することが可能である。従って、対象復号レイヤIDリストTargetDecLayerIdListに含まれるレイヤを復号する階層動画像復号装置1は、対象出力レイヤセットTargetOptLayerSetのうち、プライマリピクチャレイヤの符号化データを復号し、補助ピクチャレイヤの復号処理を省略することができる。
また、出力制御部16bは、対象出力レイヤセットのプライマリピクチャレイヤの復号に必須でない、補助ピクチャレイヤのレイヤ識別子を有するNALユニットを破棄するように、ビットストリーム抽出部17へ指示することが可能である。すなわち、階層動画像復号装置1の備えるビットストリーム抽出部17は、出力制御部16bより供給される対象復号レイヤIDリストTargetDecLayerIdList、及び外部より供給される復号対象とするレイヤに付随する最高次のサブレイヤを指定する対象最高次テンポラル識別子TargetHighestTidによって定まるターゲットセットTargetSetに含まれないNALユニットを除去(破棄)し、ターゲットセットTargetSetに含まれるNALユニットから構成されるターゲットセット符号化データDATA#T(BitstreamToDecode)を抽出することができる。
さらに、出力制御部16cは、対象出力レイヤセットにおいて、出力レイヤでない補助ピクチャレイヤを対象復号レイヤIDリストから除外する。すなわち、非出力レイヤである補助ピクチャレイヤを含まない対象復号レイヤIDリストを構築する。そのため、出力制御部16cは、対象出力レイヤセットの出力レイヤフラグが0である補助ピクチャレイヤの復号を省略するよう、階層動画像復号装置1へ指示することが可能である。従って、対象復号レイヤIDリストTargetDecLayerIdListに含まれるレイヤを復号する階層動画像復号装置1は、対象出力レイヤセットTargetOptLayerSetのうち、プライマリピクチャレイヤ、及び出力レイヤである補助ピクチャレイヤの符号化データを復号し、出力レイヤでない補助ピクチャレイヤの復号処理を省略することができる。
また、出力制御部16cは、出力レイヤでない補助ピクチャレイヤのレイヤ識別子を有するNALユニットを破棄するように、ビットストリーム抽出部17へ指示することが可能である。すなわち、階層動画像復号装置1の備えるビットストリーム抽出部17は、出力制御部16cより供給される対象復号レイヤIDリストTargetDecLayerIdList、及び外部より供給される復号対象とするレイヤに付随する最高次のサブレイヤを指定する対象最高次テンポラル識別子TargetHighestTidによって定まるターゲットセットTargetSetに含まれないNALユニットを除去(破棄)し、ターゲットセットTargetSetに含まれるNALユニットから構成されるターゲットセット符号化データDATA#T(BitstreamToDecode)を抽出することができる。
(階層動画像復号装置1の変形例1:階層動画像復号装置1A)
階層動画像復号装置1Aは、階層動画像符号化装置2から供給される階層符号化データDATAを復号して、外部より供給される出力指定情報によって定まるターゲットセットTargetSetに含まれる各レイヤの復号ピクチャを生成し、出力レイヤの復号ピクチャを出力ピクチャPOUT#Tとして出力する。
すなわち、階層動画像復号装置1Aは、出力指定情報が示す対象出力レイヤセットTargetOptLayerSetの復号に必要とするレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdListの要素TargetDecLayerIdList [0].. TargetDecLayerIdList [N-1](Nはターゲットセットに含まれるレイヤ数)の順で、レイヤiのピクチャの符号化データを復号し、その復号ピクチャを生成し、該レイヤiの出力レイヤ情報OutputLayerFlag[i]が“出力レイヤ”を示す場合、該レイヤiの復号ピクチャを所定のタイミングに出力する。
階層動画像復号装置1Aは、NAL逆多重化部11、及びターゲットセットピクチャ復号部10を含んで構成される。さらに、ターゲットセットピクチャ復号部10は、non-VCL復号部12、パラメータメモリ13、ピクチャ復号部14、復号ピクチャ管理部15、及び出力制御部16Aを含んで構成される。また、NAL逆多重化部11は、さらにビットストリーム抽出部17Aを備える。なお、階層動画像復号装置1と同一の要素については、同一の符号を付し、説明を省略する。
(出力制御部16A)
出力制御部16Aは、基本的には、出力制御部16と機能は同じである。すなわち、出力制御部16Aは、出力指定情報に含まれる出力レイヤセット識別子TargetOLSIdxによって指定される出力レイヤセットOLS#TargetOLSIdxを処理対象として選択する。続いて、出力制御部16Aは、出力制御部16における出力レイヤIDリストの導出と同一の処理によって、出力レイヤIDリストTargetOptLayerIdListを導出する。
以下では、機能の異なる出力制御部16Aの備える図示しない対象復号レイヤIDリスト導出手段における復号レイヤIDリストTargetDecLayerIdListの導出処理についてのみ説明する。
出力制御部16Aの備える図示しない復号レイヤIDリスト導出手段は、出力指定情報に含まれる出力レイヤセット識別子TargetOLSIdx、及びパラメータメモリ13に保持されたアクティブVPSのレイヤセット情報、及び出力レイヤセット情報に基づいて、対象出力レイヤセットの復号に必要とするレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdListを導出し、出力制御情報の一部として、ビットストリーム抽出部17A、及びターゲットセットピクチャ部10へ供給する。対象復号レイヤIDリストは、例えば、以下の疑似コードによって導出される。すなわち、復号レイヤIDリスト導出手段は、対象出力レイヤセットTargetOptLayerSetに関連付けられたレイヤセットのレイヤIDリストLayerIdList[ LayerSetIdx[TargetOLSIdx]]を、対象復号レイヤIDリストTargetDecLayerIdListとする。
(TargetDecLayerIdListの導出を示す疑似コード4)
for(j=0; j< NumLayersInIdList[ LayerSetIdx[ TargetOLSIdx ]]; j++){ //SC01
TargetDecLayerId[i] = LayerIdList[LayerSetIdx[ TargetOLSIdx ] ][j]; //SC02
} //SC03
なお、上記導出手順は、上記ステップに限定されず、実施可能な範囲で、ステップを変更しても構わない。
(ビットストリーム抽出部17A)
ビットストリーム抽出部17A、出力制御部16Aより供給される出力制御情報(出力レイヤセット)のうち、復号対象となるレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdList、及び、及び対象最高次テンポラル識別子TargetHighestTidに基づいて、ビットストリーム抽出処理を行い、入力される階層符号化データDATAから、対象最高次テンポラル識別子TargetHighestTid、及び対象復号レイヤIDリストTargetDecLayerIdListによって定まる集合(ターゲットセットTargetSetと呼ぶ)に含まれないNALユニットを除去(破棄)する。
さらに、ビットストリーム抽出部17Aは、復号対象となるレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdList、及び対象出力レイヤIDリストTargetOptLayerIdList[]とパラメータメモリ13に保持されたアクティブVPSのレイヤセットLayerIdList[][]及びレイヤ間依存情報より導出される依存フラグrecursiveRefLayerFlag[][]に基づいて、対象出力レイヤセットの非出力レイヤかつ非依存レイヤのNALユニットを破棄し、入力される階層符号化データDATAから、ビットストリーム抽出処理によって、ターゲットセットTargetSetに含まれないNALユニットを除去(破棄)し、ターゲットセットTargetSetに含まれるNALユニットから構成されるターゲットセット符号化データDATA#T(BitstreamToDecode)を抽出し、出力する。
(ビットストリーム抽出処理2)
以下では、図23を参照して、本実施例に係るビットストリーム抽出部17Aにおける動作について説明する。なお、ビットストリーム抽出部17と共通の動作は、SG101〜SG103、及びSG10A〜SG10Bであり、同一のステップ番号を付し、説明を省略する。以下では、SG101〜SG103の後へ追加されるステップSG104〜SG105についてのみ説明する。
(SG104)対象NALユニットのレイヤ識別子を有するレイヤが、対象出力レイヤIDリストTargetOptLayerIdList[]に含まれる出力レイヤであるか、又は前記出力レイヤの依存レイヤであるかを判定する。
より具体的には、ビットストリーム抽出部17Aは、下記(C3)〜(C4)の条件判定を行う。すなわち、(C3)〜(C4)の条件の全てが、偽である場合 (SG104でNo)、ステップSG105へ遷移する。それ以外((C3)、(C4)のいずれかが真)の場合(SG104でYes)、ステップSG10Aへ遷移する。
(C3)「対象出力レイヤIDリストTargetOptLayerIdList[]に、対象NALユニットのレイヤ識別子と同一の値がある」場合(対象NALユニットのレイヤ識別子は、出力レイヤのレイヤ識別子に等しい場合)、真と判定し、それ以外の場合(対象出力レイヤIDリストTargetOptLayerIdListに、対象NALユニットのレイヤ識別子と同一の値がない)、偽と判定する。
(C4)「対象NALユニットのレイヤ識別子を有するレイヤは、対象出力レイヤIDリストTargetOptLayerIdList[]に含まれるいずれかの出力レイヤの依存レイヤである」場合、真と判定し、それ以外の場合(対象NALユニットのレイヤ識別子を有するレイヤは、出力レイヤの非依存レイヤである)、偽と判定する。
(SG105)対象NALユニットを破棄する。すなわち、対象NALユニットは、非出力レイヤかつ非依存レイヤのNALユニットであるため、ビットストリーム抽出部17Aは、入力された階層符号化データDATAから、対象NALユニットをさらに除去する。なお、非出力レイヤかつ非依存レイヤのVCL NALユニットのみを破棄するようにしてもよい。
以上、ビットストリーム抽出部17Aの動作について説明したが、上記ステップに限定されず、実施可能な範囲で、ステップを変更しても構わない。
ここで、ステップSG104における条件(C4)は、例えば、以下の疑似コードによって導出されるフラグrefLayerFlagの真偽値を判定すればよい。
(疑似コード)
iNuhLId = nuh_layer_id; //SC01
for(refLayerFlag=0, k=0; k< NumOptLayersInOLS[TargetOLSIdx]; k++){ //SC02
iOptLayerId = layer_id_in_nuh[( TargetOptLayerIdList[k] )]; //SC03
refLayerFlag =
(refLayerFlag | recursiveRefLayerFlag[ iOptLayerId ][ iNuhLId ]); //SC04
} //SC05
なお、上記疑似コードをステップで表わせば、次の通りである。
(SC01)対象NALユニットのレイヤ識別子nuh_layer_idを、変数iNuhLIdへ設定する。
(SC02)レイヤ識別子nuh_layer_idであるレイヤが出力レイヤTargetOptLayerIdList[k]の依存レイヤ(直接参照レイヤ、又は間接参照レイヤ)であるかを示すフラグrefLayerFlagの導出に係るループの開始点である。ループの開始前に、変数k、フラグrefLayerFlagは0に初期化され、0から(NumOptLayersInOLS[ TargetOLSIdx ] - 1)の変数kに対して、SC03..SC04に示す処理を実行する。
(SC03)変数iOptLayerIdへ、出力レイヤTargetOptLayerIdList[k]のレイヤ識別子を設定する。
(SC04)フラグrefLayerFlagと、レイヤ識別子iOptLayerIdを有する出力レイヤTargetOptLayerIdList[k]に対するレイヤ識別子iNuhLIdを有するレイヤの依存フラグrecursiveRefLayerFlagとの論理和の値を、フラグrefLayerFlagへ設定する。
(SC05)ステップSC01のループ終端である。
以上、ビットストリーム抽出部17Aにおける、対象NALユニットが出力レイヤの依存レイヤであるかを示すフラグrefLayerFlagの導出処理について説明したが、上記ステップに限定されず、実施可能な範囲で、ステップを変更しても構わない。
上記構成のビットストリーム抽出部17Aは、ターゲットセットTargetSetに含まれるNALユニットから、さらに、非出力かつ非参照レイヤのレイヤ識別子を有するNALユニットを破棄する。すなわち、ビットストリーム抽出部17Aは、対象出力レイヤセットの出力レイヤの復号に必須でないレイヤのNALユニットを含まないターゲットセット符号化データBitstreamToDecodeを生成する効果を奏する。これにより、ビットストリーム抽出部17Aから供給されるターゲットセット符号化データBitstreamToDecodeを復号するターゲットセットピクチャ復号部10は、非出力かつ非参照レイヤの復号を省略することが可能である。
(ビットストリーム抽出部17AのステップSG102の変形例1)
ビットストリーム抽出部17AのSGB104の条件判定(C3)、(C4)に加えて、下記条件(D1)を加えてもよい。
(D1)「対象NALユニットのレイヤ識別子は、ベースレイヤのレイヤ識別子に等しい」(nuh_layer_id ==0)場合、真と判定し、それ以外の場合(nuh_layer_id>0)は偽と判定する。
上記構成のビットストリーム抽出部17Aの変形例は、ターゲットセットTargetSetへベースレイヤを含む。従って、あるレイヤセットAを含む符号化データからビットストリーム抽出処理によって生成された、レイヤセットAのサブセットであるレイヤセットBを含む符号化データを復号する際に、レイヤセットBのあるレイヤC(レイヤ識別子>0)において、ベースレイヤにレイヤ識別子を有するパラメータセット(VPS/SPS/PPS)をアクティブパラメータセットとして参照する場合、ベースレイヤがレイヤセットBを含む符号化データに含まれず、あるレイヤCを復号できないというケースを防止することができる。
(ビットストリーム抽出部17Aの変形例1:ビットストリーム抽出部17A1)
以上説明したビットストリーム抽出17Aでは、出力レイヤの復号に必須でない、非出力レイヤかつ非依存レイヤをターゲットセットから除外したが、これに限定されない。例えば、出力レイヤセットが、1以上のプライマリピクチャレイヤ、及び1以上の補助ピクチャレイヤから構成される場合、プライマリピクチャレイヤの復号に必須でない、補助ピクチャレイヤをターゲットセットより除外し、補助ピクチャレイヤのレイヤ識別子を有するNALユニットを破棄するビットストリーム抽出部17A1としてもよい。
以下では、ビットストリーム抽出部17A1について、具体的に説明する。ビットストリーム抽出部17A1は、復号対象となるレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdList、及び対象出力レイヤIDリストTargetOptLayerIdList[]とパラメータメモリ13に保持されたアクティブVPSのレイヤセットLayerIdList[][]、及びスケーラブル識別子より導出される補助ピクチャレイヤIDに基づいて、対象出力レイヤセットの補助ピクチャレイヤのレイヤ識別子を有するNALユニット、及びターゲットセットTargetSetに含まれないNALユニットを除去(破棄)し、ターゲットセットTargetSetに含まれるNALユニットから構成されるターゲットセット符号化データDATA#T(BitstreamToDecode)を抽出し、出力する。
(ビットストリーム抽出処理3)
以下では、本実施例に係るビットストリーム抽出部17A1における動作について説明する。なお、ビットストリーム抽出部17と共通の動作は、SG101〜SG103、及びSG10A〜SG10Bであり、同一のステップ番号を付し、説明を省略する。以下では、SG101〜SG103の後へ追加されるステップSG104A〜SG105Aについてのみ説明する。
(SG104A)対象NALユニットのレイヤ識別子を有するレイヤが、プライマリピクチャレイヤであるかを判定する。
より具体的には、ビットストリーム抽出部17A1は、下記(C5)の条件判定を行う。すなわち、(C5)の条件が、偽である場合 (SG104AでNo)、ステップSG105Aへ遷移する。それ以外((C5)、が真)の場合(SG104AでYes)、ステップSG10Aへ遷移する。
(C5)「対象NALユニットのレイヤ識別子を有するレイヤに関する補助ピクチャレイヤIDの値が0である」場合(対象NALユニットのレイヤ識別子を有するレイヤは、プライマリピクチャレイヤである場合)、真と判定し、それ以外の場合(対象NALユニットのレイヤ識別子を有するレイヤに関する補助ピクチャレイヤIDの値が0より大きい(対象NALユニットのレイヤ識別子を有するレイヤは、補助ピクチャレイヤである))、偽と判定する。
以上、ビットストリーム抽出部17A1の動作について説明したが、上記ステップに限定されず、実施可能な範囲で、ステップを変更しても構わない。
上記構成のビットストリーム抽出部17A1は、ターゲットセットTargetSetに含まれるNALユニットから、さらに、補助ピクチャレイヤのレイヤ識別子を有するNALユニットを破棄する。すなわち、ビットストリーム抽出部17A1は、対象出力レイヤセットのプライマリピクチャレイヤの復号に必須でない補助ピクチャレイヤのNALユニットを含まないターゲットセット符号化データBitstreamToDecodeを生成する効果を奏する。これにより、ビットストリーム抽出部17A1から供給されるターゲットセット符号化データBitstreamToDecodeを復号するターゲットセットピクチャ復号部10は、補助ピクチャレイヤの復号を省略することが可能である。
(ビットストリーム抽出部17Aの変形例2:ビットストリーム抽出部17A2)
ビットストリーム抽出17Aは、出力レイヤセットにおいて、非出力レイヤである補助ピクチャレイヤのレイヤ識別子を有するNALユニットを破棄するビットストリーム抽出部17A2としてもよい。
以下では、ビットストリーム抽出部17A2について、具体的に説明する。ビットストリーム抽出部17A2は、復号対象となるレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdList、パラメータメモリ13に保持されたアクティブVPSのレイヤセットLayerIdList[][]、出力レイヤフラグOutputLayerFlag[][]、及びスケーラブル識別子より導出される補助ピクチャレイヤIDに基づいて、対象出力レイヤセットの非出力レイヤである補助ピクチャレイヤのレイヤ識別子を有するNALユニット、及びターゲットセットTargetSetに含まれないNALユニットを除去(破棄)し、ターゲットセットTargetSetに含まれるNALユニットから構成されるターゲットセット符号化データDATA#T(BitstreamToDecode)を抽出し、出力する。
(ビットストリーム抽出処理4)
以下では、本実施例に係るビットストリーム抽出部17A2における動作について説明する。なお、ビットストリーム抽出部17と共通の動作は、SG101〜SG103、及びSG10A〜SG10Bであり、同一のステップ番号を付し、説明を省略する。以下では、SG101〜SG103の後へ追加されるステップSG104B〜SG105Bについてのみ説明する。
(SG104B)対象NALユニットのレイヤ識別子を有するレイヤが、プライマリピクチャレイヤ、又は出力レイヤである補助ピクチャレイヤであるかを判定する。
より具体的には、ビットストリーム抽出部17A2は、下記(C5)〜(C6)の条件判定を行う。すなわち、(C5)〜(C6)の全ての条件が、偽である場合 (SG104BでNo)、ステップSG105Bへ遷移する。それ以外((C5)又は(C6)が真)の場合(SG104BでYes)、ステップSG10Aへ遷移する。なお、条件(C5)は、ビットストリーム抽出処理3における条件(C5)と同一であるため、説明を省略する。
(C6)「対象NALユニットのレイヤ識別子を有するレイヤに関する補助ピクチャレイヤIDの値が0より大きい、かつ、出力レイヤフラグが1である」場合(対象NALユニットのレイヤ識別子を有するレイヤは、出力レイヤ、かつ、補助ピクチャレイヤである場合)、真と判定し、それ以外の場合、偽と判定する。
以上、ビットストリーム抽出部17A2の動作について説明したが、上記ステップに限定されず、実施可能な範囲で、ステップを変更しても構わない。
上記構成のビットストリーム抽出部17A2は、ターゲットセットTargetSetに含まれるNALユニットから、さらに、非出力レイヤである補助ピクチャレイヤのレイヤ識別子を有するNALユニットを破棄する。すなわち、ビットストリーム抽出部17A2は、対象出力レイヤセットの非出力レイヤである補助ピクチャレイヤのNALユニットを含まないターゲットセット符号化データBitstreamToDecodeを生成する効果を奏する。これにより、ビットストリーム抽出部17A2から供給されるターゲットセット符号化データBitstreamToDecodeを復号するターゲットセットピクチャ復号部10は、補助ピクチャレイヤの復号を省略することが可能である。
(階層動画像復号装置1Aの効果)
以上説明した本実施形態に係る階層動画像復号装置1A(階層画像復号装置)の備えるビットストリーム抽出部17Aは、出力制御部16Aから供給される出力レイヤIDリストTargetOptLayerIdList、対象復号レイヤIDリストTargetDecLayerIdList、及び対象最高次テンポラル識別子TargetHighestTIdと、レイヤ間依存情報より導出される依存フラグrecursiveRefLayerFlag[][]に基づいて、外部より入力された符号化データから、ビットストリーム抽出処理によって、ターゲットセットに含まれるNALユニットから構成されるターゲットセット符号化データBitstreamToDecodeを生成する。
特に、ビットストリーム抽出部17Aは、出力レイヤの復号に必須でない、非出力レイヤかつ非依存レイヤをターゲットセットから除外する。従って、ビットストリーム抽出部17Aによって生成されたターゲットセット符号化データBitstreamToDecodeを復号する、階層動画像復号装置1Aは、対象出力レイヤセットの出力レイヤの復号に必須でない、非出力レイヤかつ非参照レイヤの復号を省略することができる効果を奏する。
また、ビットストリーム抽出部17A1は、補助ピクチャレイヤをターゲットセットから除外する。従って、ビットストリーム抽出部17A1によって生成ターゲットセット符号化データBitstreamToDecodeを復号する階層動画像復号装置1Aは、補助ピクチャレイヤの復号を省略することができる効果を奏する。
さらに、ビットストリーム抽出部17A1は、非出力レイヤである補助ピクチャレイヤをターゲットセットから除外する。従って、ビットストリーム抽出部17A2によって生成されたターゲットセット符号化データBitstreamToDecodeを復号する階層動画像復号装置1Aは、非出力レイヤである補助ピクチャレイヤの復号を省略することができる効果を奏する。
(階層動画像復号装置1の変形例2:階層動画像復号装置1B)
階層動画像復号装置1Bは、階層動画像符号化装置2から供給される階層符号化データDATAから、外部より供給される出力指定情報、及び階層動画像復号装置1Bの備えるnon-VCL復号部12Bから復号されるサブビットストリーム特性情報によって指定される符号化データ抽出処理をビットストリーム抽出部17Bにおいて動作させ、ターゲットセット符号化データBitstreamToDecodeを生成し、生成されたターゲットセット符号化データbitstreamToDecodeを復号して、ターゲットセットTargetSetに含まれる各レイヤの復号ピクチャを生成し、出力レイヤの復号ピクチャを出力ピクチャPOUT#Tとして出力してもよい。
すなわち、階層動画像復号装置1Bは、出力指定情報が示す対象出力レイヤセットTargetOptLayerSetの復号に必要とするレイヤの構成を示す対象復号レイヤIDリストTargetDecLayerIdListの要素TargetDecLayerIdList [0].. TargetDecLayerIdList [N-1](Nはターゲットセットに含まれるレイヤ数)の順で、レイヤiのピクチャの符号化データを復号し、その復号ピクチャを生成し、該レイヤiの出力レイヤ情報OutputLayerFlag[i]が“出力レイヤ”を示す場合、該レイヤiの復号ピクチャを所定のタイミングに出力する。
階層動画像復号装置1Bは、NAL逆多重化部11、及びターゲットセットピクチャ復号部10を含んで構成される。さらに、ターゲットセットピクチャ復号部10は、non-VCL復号部12B、パラメータメモリ13、ピクチャ復号部14、復号ピクチャ管理部15、及び出力制御部16Aを含んで構成される。また、NAL逆多重化部11は、さらにビットストリーム抽出部17Bを備える。なお、階層動画像復号装置1又は階層動画像復号装置1Aと同一の要素については、同一の符号を付し、説明を省略する。
(non-VCL復号部12B)
non-VCL復号部12Bは、階層動画像復号装置1が備えるnon-VCL復号部12と同一の機能を有し、さらに、出力レイヤセット単位のビットストリーム抽出処理、及び前記ビットストリーム抽出処理によって生成されるサブビットストリームの特性(ビットレート情報など)を示すサブビットストリーム特性情報を復号するサブビットストリーム特性情報復号手段を備える。
(サブビットストリーム特性情報)
サブビットストリーム特性情報は、概略的には、アクティブVPSで定義される出力レイヤセットの出力レイヤの復号に影響がない(必須でない)レイヤのピクチャ(NAL ユニット)を破棄して生成されるサブビットストリームのビットレート情報を提供する。また、サブビットストリーム特性情報が存在する場合、初期IRAPアクセスユニットに関連付けられ、初期IRAPに関連付けられたCVSに対して適用される。
サブビットストリーム特性情報には、F1〜F7に示すシンタックスが含まれ、これらのシンタックスはサブビットストリーム特性情報復号手段によって、パラメータセット又はSEIから復号され、ビットストリーム抽出手段17Bへ供給される。
F1:アクティブVPS識別子active_vps_id(図24のSYNSBP01)は、サブビットストリーム特性情報が参照するアクティブVPSを特定するための識別子である。
F2:追加サブビットストリーム数num_additional_sub_stream_minus1(図24のSYNSBP02)は、サブビットストリーム特性情報において規定されるサブビットストリーム数−1の値である。追加サブビットストリーム数NumAddSubStreamは、num_additional_sbu_stream_minus1 +1である。サブビットストリーム特性情報復号手段は、サブビットストリーム0〜サブビットストリーム(NumAddSubStream-1)について、F3〜F7のシンタックスを符号化データより復号する。
F3:ビットストリーム抽出モードsub_bitstream_mode[i](図24のSYNSBP03)は、インデックスiのサブビットストリーム(サブストリームiともよぶ)を生成するためのビットストリーム抽出処理を指定するシンタックスである。各ビットストリーム抽出モードに対応するビットストリーム抽出処理は、ビットストリーム抽出部17Bにおいて説明する。
F4:出力レイヤセット識別子output_layer_set_idx_to_vps[i](図24のSYNSBP04)は、サブストリームiに対応する出レイヤセットのインデクスである。すなわち、サブストリームiは、出力レイヤセットOLS#(output_layer_set_idx_to_vps[i])に対応する。
F5:最高次テンポラル識別子highest_sublayer_id[i](図24のSYNSBP05)は、サブビットストリームiに対応する出力レイヤセットの最高次テンポラル識別子である。
F6:平均ビットレートavg_bit_rate[i](図24_SYNSBP06)は、サブビットストリームiの平均ビットレート(bits/sec)である。
F7:最大ビットレートmax_bit_rate[i](図24_SYNSBP07)は、サブビットストリームiの最大ビットレート(bits/sec)である。
(F5:ビットストリーム抽出モードsub_bit_stream_mode[i])
以下、ビットストリーム抽出モードsub_bitstream_mode[i]が示すビットストリーム抽出処理について説明する。
ビットストリーム抽出モードsub_bitstream_mode[i]=0の場合:ビットストリーム抽出モードの値が0である場合、ビットストリーム抽出部17Bにおいて、レイヤIDリストLayerIdList[ output_layer_set_idx_to_vps[i]]と、最高次テンポラル識別子highest_sublayer_id[i]を入力として、前述のビットストリーム抽出処理1が実行されて、サブビットストリーム特性情報と関連付けられたCVSから、出力レイヤセットOSL#(output_layer_set_idx_to_vps[i])に対応するサブビットストリームiが生成されることを示す。
ビットストリーム抽出モードsub_bitstream_mode[i]=1の場合:ビットストリーム抽出モードの値が1である場合、ビットストリーム抽出部17Bにおいて、レイヤIDリストLayerIdList[ LayerSetIdx[output_layer_set_idx_to_vps[i] ] ]と、最高次テンポラル識別子highest_sublayer_id[i]、さらに、出力レイヤセットOLS#output_layer_set_idx_to_vps[i]の出力レイヤIDリストTargetOptLayeridList、及び依存フラグrecursiveRefLayrFlag[][]を入力として、前述のビットストリーム抽出処理2が実行されて、サブビットストリーム特性情報と関連付けられたCVSから、出力レイヤセットOSL#(output_layer_set_idx_to_vps[i])に対応するサブビットストリームiが生成されることを示す。なお、出力レイヤセットOLS#ouptut_layer_set_idx_to_vps[i]の出力レイヤIDリストTargetOptLayerIdListは、例えば、前述のTargetOptLayerIdListの導出を示す疑似コードによって導出する。
さらに、ビットストリーム抽出モードsub_bitstream_mode[i]の値がX(例えば、2)である場合、ビットストリーム抽出部17Bにおいて、レイヤIDリストLayerIdList[ LayerSetIdx[output_layer_set_idx_to_vps[i] ] ]と、最高次テンポラル識別子highest_sublayer_id[i]、さらに、補助ピクチャレイヤID AuxID[]を入力として、前述のビットストリーム抽出処理3が実行されて、サブビットストリーム特性情報と関連付けられたCVSから、出力レイヤセットOSL#(output_layer_set_idx_to_vps[i])に対応するサブビットストリームiが生成されることを示すようにしてもよい。
また、ビットストリームストリーム抽出モードsub_bitstream_mode[i]の値がY(例えば、3)である場合、ビットストリーム抽出部17Bにおいて、レイヤIDリストLayerIdList[ LayerSetIdx[output_layer_set_idx_to_vps[i] ] ]と、最高次テンポラル識別子highest_sublayer_id[i]、さらに、補助ピクチャレイヤID AuxID[]、及び出力レイヤフラグOutputLayerFlag[ LayerSetIdx[output_layer_set_idx_to_vps[i]]][]を入力として、前述のビットストリーム抽出処理4が実行されて、サブビットストリーム特性情報と関連付けられたCVSから、出力レイヤセットOSL#(output_layer_set_idx_to_vps[i])に対応するサブビットストリームiが生成されることを示すようにしてもよい。
(ビットストリーム抽出部17B)
ビットストリーム抽出部17Bは、少なくともビットストリーム抽出部17におけるビットストリーム抽出処理1、及びビットストリーム抽出部17Aにおけるビットストリーム抽出処理2を備える。さらに、ビットストリーム抽出部17Bは、ビットストリーム抽出部17A1におけるビットストリーム抽出処理3、及び/又は、ビットストリーム抽出部17A2におけるビットストリーム抽出処理4を備えてもよい。
復号されたビットストリーム特性情報が示すビットストリーム抽出モードsub_bitstream_mode[i]に対応した、ビットストリーム抽出処理を実行する。
ビットストリーム抽出モードsub_bitstream_mode[i]が0の場合、ビットストリーム抽出部17Bは、レイヤIDリストLayerIdList[ LayerSetIdx[ output_layer_set_idx_to_vps[i] ] ]と、最高次テンポラル識別子highest_sublayer_id[i]を入力として、前述のビットストリーム抽出処理2を実行し、サブビットストリーム特性情報と関連付けられたCVSから、出力レイヤセットOSL#(output_layer_set_idx_to_vps[i])に対応するサブビットストリームiを生成する。
ビットストリーム抽出モードsub_bitstream_mode[i]が1の場合、ビットストリーム抽出部17Bは、レイヤIDリストLayerIdList[ LayerSetIdx[ output_layer_set_idx_to_vps[i] ] ]と、最高次テンポラル識別子highest_sublayer_id[i]、さらに、出力レイヤセットOLS#output_layer_set_idx_to_vps[i]の出力レイヤIDリストTargetOptLayeridList、及び依存フラグrecursiveRefLayrFlag[][]を入力として、前述のビットストリーム抽出処理2を実行し、サブビットストリーム特性情報と関連付けられたCVSから、出力レイヤセットOSL#(output_layer_set_idx_to_vps[i])に対応するサブビットストリームiを生成する。
ビットストリーム抽出モードsub_bitstream_mode[i]の値がX(例えば、2)である場合、ビットストリーム抽出部17Bは、レイヤIDリストLayerIdList[ LayerSetIdx[output_layer_set_idx_to_vps[i] ] ]と、最高次テンポラル識別子highest_sublayer_id[i]、さらに、補助ピクチャレイヤID AuxID[]を入力として、前述のビットストリーム抽出処理3が実行されて、サブビットストリーム特性情報と関連付けられたCVSから、出力レイヤセットOSL#(output_layer_set_idx_to_vps[i])に対応するサブビットストリームiを生成してもよい。
また、ビットストリームストリーム抽出モードsub_bitstream_mode[i]の値がY(例えば、3)である場合、ビットストリーム抽出部17Bは、レイヤIDリストLayerIdList[ LayerSetIdx[output_layer_set_idx_to_vps[i] ] ]と、最高次テンポラル識別子highest_sublayer_id[i]、さらに、補助ピクチャレイヤID AuxID[]、及び出力レイヤフラグOutputLayerFlag[ LayerSetIdx[output_layer_set_idx_to_vps[i]]][]を入力として、前述のビットストリーム抽出処理4を実行し、サブビットストリーム特性情報と関連付けられたCVSから、出力レイヤセットOSL#(output_layer_set_idx_to_vps[i])に対応するサブビットストリームiが生成してもよい。
上記構成のビットストリーム抽出部17Bによれば、サブビットストリーム特性情報のビットストリーム抽出モードsub_bitstream_mode[i]に対応するビットストリーム抽出処理を実行し、サブビットストリームiを生成する。特に、ビットストリーム抽出モードsub_bitstream_mode[i]=1の場合には、サブビットストリーム特性情報に関連付けられたCVS(符号化データ)から、出力レイヤセットOLS#(output_layer_set_to_vps[i])の出力レイヤの復号に必須でない、非出力レイヤかつ非参照レイヤ(非依存レイヤ)のNALユニットを破棄したサブビットストリームiを生成する。従って、サブビットストリームiを復号する画像復号装置1Bは、出力レイヤセットOLS#(output_layer_set_to_vps[i])の復号に必須でない、非出力レイヤかつ非依存レイヤの復号を省略することができる効果を奏する。
また、ビットストリーム抽出モードsub_bitstream_mode[i]=X(例えば、2)の場合には、サブビットストリーム特性情報に関連付けられたCVS(符号化データ)から、出力レイヤセットOLS#(output_layer_set_to_vps[i])のプライマリピクチャの復号に必須でない、補助ピクチャレイヤのNALユニットを破棄したサブビットストリームiを生成する。従って、サブビットストリームiを復号する画像復号装置1Bは、出力レイヤセットOLS#(output_layer_set_to_vps[i])の補助ピクチャレイヤの復号を省略することができる効果を奏する。
また、ビットストリーム抽出モードsub_bitstream_mode[i]=Y(例えば、3)の場合には、サブビットストリーム特性情報に関連付けられたCVS(符号化データ)から、出力レイヤセットOLS#(output_layer_set_to_vps[i])のプライマリピクチャの復号に必須でない、非出力レイヤである補助ピクチャレイヤのNALユニットを破棄したサブビットストリームiを生成する。従って、サブビットストリームiを復号する画像復号装置1Bは、出力レイヤセットOLS#(output_layer_set_to_vps[i])の非出力レイヤである補助ピクチャレイヤの復号を省略することができる効果を奏する。
(制限された出力レイヤセットの符号化データを符号化・復号する装置1)
以下、出力レイヤセットに関する制限(ビットストリームコンフォーマンス)を満たす符号化データを符号化する階層動画像符号化装置および復号する階層動画像復号装置について説明する。
階層動画像復号装置1(及びその変形例(階層動画像復号装置1A、階層動画像復号装置1B)を含む)/階層動画像符号化装置2は、以下に示す出力レイヤセットに関連付けられたレイヤセットに関するコンフォーマンス条件CC1を満たす符号化データを復号/生成する。
条件CC1:レイヤセットLS#i(i=0..VpsNumLayerSets-1)は、ベースレイヤを含む。
上記条件CC1は、条件CC2〜CC4とも言い換えることができる。
CC2:レイヤセットLS#i(i=0..VpsNumLayerSets-1)は、レイヤ識別子が0であるレイヤを含む。
CC3:レイヤセットLS#i(i=0..VpsNumLayerSets-1)のレイヤIDリストLayerIdList[i][]の0番目の要素LayerIdList[i][0]は、レイヤ識別子が0であるレイヤである。
CC4:レイヤ0がレイヤセットLS#i(i=0..VpsNumLayerSets-1)に含まれるか否かを示すフラグlayer_id_included_flag[i][0]の値は1である。(i=0..VpsNumLayerSets-1に対しlayer_id_included_flag[i][0]=1である)。
条件CC1〜CC4は、換言すれば、出力レイヤセットにおいて、復号対象とするレイヤとして、ベースレイヤ(レイヤ識別子が0のレイヤ)を常に含めることを意味する。出力レイヤセットに関連付けられたレイヤセット(すなわち全てのレイヤセット)に関して上記コンフォーマンス条件CC(CCは、CC1〜CC4のいずれか)を満たす符号化データを復号する階層動画像復号装置1は必ずベースレイヤを復号することが保障される。従って、あるレイヤセットAを含む符号化データからビットストリーム抽出処理によって生成された、レイヤセットAのサブセットであるレイヤセットBを含む符号化データを復号する際に、ベースレイヤ(レイヤ識別子0のレイヤ)の復号のみに対応した復号装置V1(例えばHEVC Main profileで規定されるを復号処理を行う)においても、以下の理由により問題なく動作できる。
・抽出されたレイヤセットBを含む符号化データは、レイヤ識別子0のVCL(スライスセグメント)およびnonVCL(パラメータセット(VPS/SPS/PPS)を含む。
・復号装置V1は、レイヤ識別子0のスライスセグメントを復号し、レイヤ識別子0のスライスセグメントから参照されるSPSのプロファイルが復号可能であることを示す場合には復号を行い、レイヤ識別子0のスライスセグメントから参照されるSPSのプロファイルなどのPTL情報が復号可能を示さない場合には、符号化データの復号を停止することができる。
復号装置V1は復号もしくは復号停止することができる。すなわち、復号装置V1は問題なく復号可能(対応可能)である。
逆に、条件CC1〜CC4を満たさない符号化データをレイヤセット復号装置V1で復号する。つまり、ベースレイヤを含まないレイヤセットを復号装置V1で復号する場合には以下の問題が発生する。
・符号化データ中にレイヤ識別子0のスライスセグメントが存在しないため、復号装置V1は、スライスセグメントを復号しない。
・スライスセグメントのslice_pic_parameter_set_idを復号しないため、PPSがアクティベートされない(同様に、SPS、VPSもアクティベートされない)
・復号装置V1は、アクティベートされるSPS(及びVPS)を復号しないため、SPS(VPS)に含まれるプロファイルなどのPTL情報を復号しないため、復号されない。
・復号装置V1は、内部バッファの符号化データが尽きると、符号化装置(もしくは符号化データ送信装置、符号化データバッファリング装置)に符号化データのリクエストを要求する。要求した符号化データもまた復号する対象を有しないため、要求された出力画像(例えばピクチャ1枚)を復号しようと永久に、符号化データの要求と復号を継続する可能性がある。
コンフォーマンス条件CC(CCはCC1〜CC4)を満たす場合には、レイヤセットA(もしくはレイヤセットAを含む符号化データから、ビットストリーム抽出により生成されたレイヤセットAのサブセットであるレイヤセットB)を含む符号化データが復号可能(対応可能)であることを保障する効果がある。
(制限された出力レイヤセットの符号化データを符号化・復号する装置2)
以下、出力レイヤセットに関する制限(ビットストリームコンフォーマンス)を満たす符号化データを符号化する階層動画像符号化装置および復号する階層動画像復号装置について説明する。
階層動画像復号装置1(及びその変形例(階層動画像復号装置1A、階層動画像復号装置1B)を含む)/階層動画像符号化装置2は、以下に示す出力レイヤセットに関連付けられたレイヤセットに関するコンフォーマンス条件CX1を満たす符号化データを復号/生成する。
条件CX1:出力レイヤセットOLS#i(i=0..NumOuputLayerSets-1)は、1以上のプライマリピクチャレイヤを含む。
上記条件CX1は、条件CX2とも言い換えることができる。
CX2:出力レイヤセットOLS#i(i=0.. NumOutputLayerSets-1)は、1以上の補助ピクチャレイヤIDが0であるレイヤ(AuxID[]==0)を含む。
条件CX1〜CX2は、換言すれば、出力レイヤセットにおいて、復号対象とするレイヤとして、少なくとも1以上のプライマリピクチャレイヤを含めることを意味する。出力レイヤセットに関して上記コンフォーマンス条件CX(CXは、CX1〜CX2のいずれか)を満たす符号化データを階層動画像復号装置1において復号することによって、上記符号化データから復号される出力レイヤセットでは、必ず1以上のプライマリピクチャが復号されることが保障される。すなわち、出力制御部16b、及び出力制御16cにおいて導出される対象復号レイヤIDリストにおいて、復号すべきレイヤ(プライマリピクチャレイヤ)がないというケースを防止することができる。
また、階層動画像復号装置1(及びその変形例(階層動画像復号装置1A、階層動画像復号装置1Bを含む)/階層動画像符号化装置2は、コンフォーマンス条件CX(CXは、CX1〜CX2のいずれか)を満たし、さらに、コンフォーマンス条件CY1を満たす符号化データを復号/生成することが好ましい。
条件CY1:出力レイヤセットOLS#i(i=0..NumOuputLayerSets-1)において、レイヤj(j=0..NumLayersInIdList[LayerSetIdx[i]]-1)が補助ピクチャレイヤである(AuxID[nuh_layer_id[ LayerIdList[LayerSetIdx]][j]]>0)場合、該レイヤjは、該出力レイヤセットの非出力レイヤである。
上記条件CY1は、条件CY2、及びCY3とも言い換えることができる。
条件CY2:出力レイヤセットOLS#i(i=0..NumOuputLayerSets-1)において、レイヤj(j=0..NumLayersInIdList[LayerSetIdx[i]]-1)が補助ピクチャレイヤである(AuxID[nuh_layer_id[ LayerIdList[LayerSetIdx]][j]]>0)場合、該レイヤjの出力レイヤフラグは0である(OutputLayerFlag[i][j] = 0)。
条件CY3:出力レイヤセットOLS#(i=0..NumOutputLayerSets - 1)において、レイヤj(j=0..NumLayersInIdList[LayerSetIdx[i]]-1)が補助ピクチャレイヤである場合(AuxID[nuh_layer_id[ LayerIdList[LayerSetIdx]][j]]>0)、該レイヤjの出力レイヤ情報output_layer_flag[i][j]の値は0である。
コンフォーマンス条件CX(CXは、CX1〜CX2のいずれか)、及びコンフォーマンス条件CY(CYは、CY1〜CY3のいずれか)を満たす符号化データを復号する、出力制御部16b、又は出力制御部16cを備える階層動画像復号装置1は、上記符号化データから復号される出力レイヤセットでは、補助ピクチャレイヤが復号対象レイヤIDリストから除外されることが保障されるため、該補助ピクチャレイヤの復号を省略することが可能となる。
〔階層動画像符号化装置〕
以下では、本実施形態に係る階層動画像符号化装置2の構成について、図25を参照して説明する。
(階層動画像符号化装置の構成)
図25を用いて、階層動画像符号化装置2の概略構成を説明する。同図は、階層動画像符号化装置2の概略的構成を示した機能ブロック図である。階層動画像符号化装置2は、符号化対象とするターゲットセットに含まれる各レイヤ/サブレイヤの入力画像PIN#T(ピクチャ)を符号化して、ターゲットセットの階層符号化データDATAを生成する。すなわち、動画像符号化装置2は、ターゲットセットTargetSetのレイヤIDリストの要素TargetLayerIdList [0]…TargetLayerIdList [N-1](Nはターゲットセット(対象レイヤセット)に含まれるレイヤ数)の順で、各レイヤのピクチャを符号化し、その符号化データを生成する。なお、階層動画像復号装置1(及びその変形例を含む)において、レイヤセットにベースレイヤが含まれることを保障するために、前述のコンフォーマンス条件CC(CCはCC1〜CC4)を満たすように、ターゲットセットの階層符号化データDATAを生成することが好ましい。さらに、出力制御部16b又は出力制御部16cを備える階層動画像復号装置1(及びその変形例を含む)において、出力レイヤセットにプライマリピクチャレイヤが含まれることを保障するために、前述のコンフォーマンス条件CX(CXはCX1〜CX2のいずれか)を満たすように、ターゲットセットの階層符号化データDATAを生成することが好ましい。さらに、出力制御部16b又は出力制御部16cを備える階層動画像復号装置1(及びその変形例を含む)において、補助ピクチャレイヤの復号処理が省略できることを保障するために、前述のコンフォーマンス条件CX(CXは、CX1〜CX2のいずれか)に加えて、コンフォーマンス条件CY(CYは、CY1〜CY3のいずれか)を満たすように、ターゲットセットの階層符号化データDATAを生成することが好ましい。
図25に示すように階層動画像符号化装置2は、ターゲットセットピクチャ符号化部20、及びNAL多重化部21を含んで備える。さらに、ターゲットセットピクチャ符号化部20は、non-VCL符号化部22、ピクチャ符号化部24、復号ピクチャ管理部15、および符号化パラメータ決定部26を含んで構成される。
復号ピクチャ管理部15は、既に説明した階層動画像復号装置1の備える復号ピクチャ管理部15と同一の構成要素である。ただし、階層動画像符号化装置2の備える復号ピクチャ管理部15では、内部のDPBに記録されたピクチャを出力ピクチャとして出力する必要はないため、当該出力は省略可能である。なお、階層動画像復号装置1の復号ピクチャ管理部15の説明において「復号」として説明した記載は「符号化」と置き換えることで、階層動画像符号化装置2の備える復号ピクチャ管理部15にも適用できる。
NAL多重化部21は、入力されるターゲットセットの各レイヤのVCL、及びnon-VCLを、NALユニットに格納することでNAL多重化した階層動画像符号化データDATA#Tを生成し、外部へ出力する。言い換えれば、NAL多重化部21は、ターゲットセットピクチャ符号化部20から供給されるnon-VCLの符号化データ、VCLの符号化データ、及び各non-VCL、VCLに対応するNALユニットタイプ、レイヤ識別子、テンポラル識別子を、NALユニットに格納して(符号化して)、NAL多重化した階層符号化データDATA#Tを生成する。
符号化パラメータ決定部26は、符号化パラメータの複数のセットのうち、1つのセットを選択する。符号化パラメータとは、各パラメータセット(VPS、SPS、PPS)に関連した各種パラメータや、ピクチャを符号化するための予測パラメータや、該予測パラメータに関連して生成される符号化の対象となるパラメータである。符号化パラメータ決定部26は、上記符号化パラメータの複数のセットの各々について情報量の大きさと符号化誤差を示すコスト値を算出する。コスト値は、例えば、符号量と二乗誤差に係数λを乗じた値との和である。符号量は、量子化誤差と符号化パラメータを可変長符号化して得られるターゲットセットの各レイヤ/サブレイヤの符号化データの情報量である。二乗誤差は、入力画像PIN#Tと予測画像との差分値の二乗値についての画素間の総和である。係数λは、予め設定されたゼロよりも大きい実数である。符号化パラメータ決定部26は、算出したコスト値が最小となる符号化パラメータのセットを選択し、選択した各符号化パラメータのセットをパラメータセット符号化部22、及びピクチャ符号化部24へ供給する。
Non-VCL符号化部22は、階層動画像復号装置1におけるNon-VCL復号部12の逆処理に対応し、符号化パラメータ決定部26から入力される各non-VCLの符号化パラメータと入力画像に基づいて、入力画像の符号化に用いるパラメータセット(VPS、SPS、およびSPS)やその他にnon-VCLを設定し、各パラメータセットやその他のnon-VCLをnon-VCL NALユニットに格納されるデータとして、NAL多重化部21へ供給する。なお、Non-VCL符号化部22で符号化されるnon-VCLには、階層動画像復号装置1の備えるnon-VCL復号部12の説明で記載したレイヤセット情報、出力レイヤセット情報、PTL情報、及びDPB情報を含んでいる。すなわち、non-VCL符号化部22は、図示しない、パラメータセット符号化手段を備える。さらに、パラメータセット符号化手段は、図示しない、レイヤセット情報を符号化(生成)するレイヤセット情報符号化手段、出力レイヤセット情報を符号化(生成)する出力レイヤセット情報符号化手段、PTL情報を符号化するPTL情報符号化手段、DPB情報を符号化するDPB情報符号化手段、サブビットストリーム特性情報を符号化するサブビットストリーム特性情報符号化手段、各レイヤのスケーラブル識別子を符号化するスケーラブル識別子符号化手段をさらに含んで構成される。各符号化部、符号化手段の機能及び動作は、対応する復号部、復号手段の逆処理に相当し、復号部、復号手段において、“復号”を“符号化”と読み替えて解釈するものとする。なお、Non-VCL符号化部22は、NAL多重化部21へnon-VCLの符号化データを供給するときに、non-VCLに対応するNALユニットタイプ、レイヤ識別子、及びテンポラル識別子も付与して出力する。
また、Non-VCL符号化部22で生成されるパラメータセットには、該パラメータセットを識別する識別子、及び各レイヤのピクチャを復号するために参照する該パラメータセットが参照するパラメータセット(アクティブパラメータセット)を指定するアクティブパラメータセット識別子が含まれる。具体的には、ビデオパラメータセットVPSであれば、該VPSを識別するVPS識別子が含まれる。シーケンスパラメータセットSPSであれば、該SPSを識別するSPS識別子(sps_seq_parameter_set_id)、及び該SPSや他のシンタックスが参照するVPSを特定するアクティブVPS識別子(sps_video_parameter_set_id)が含まれる。ピクチャパラメータセットPPSであれば、該PPSを識別するPPS識別子(pps_pic_parameter_set_id)、及び該PPSや他のシンタックスが参照するSPSを特定するアクティブSPS識別子(pps_seq_parameter_set_id)が含まれる。
ピクチャ符号化部24は、入力される各レイヤの入力画像PIN#T、符号化パラメータ決定部26より供給されるNon-VCL(特に、パラメータセット)、および復号ピクチャ管理部15に記録されている参照ピクチャに基づいて、ピクチャを構成するスライスに対応する各レイヤの入力画像の一部を符号化して、当該部分の符号化データを生成し、VCL NALユニットに格納されるデータとして、NAL多重化部21へ供給する。ピクチャ符号化部24の詳細な説明は後述する。なお、ピクチャ符号化部24は、NAL多重化部21へVCLの符号化データを供給するときに、VCLに対応するNALユニットタイプ、レイヤ識別子、及びテンポラル識別子も付与して出力する。
(ピクチャ符号化部24)
図26を参照して、ピクチャ符号化部24の構成の詳細を説明する。図26は、ピクチャ符号化部24の概略的構成を示した機能ブロック図である。
図26に示すように、ピクチャ符号化部24は、スライスヘッダ符号化部241、及びCTU符号化部242を含んで構成される。
スライスヘッダ符号化部241は、入力されるアクティブパラメータセットに基づいてスライス単位で入力される各レイヤの入力画像の符号化に用いるスライスヘッダを生成する。生成されたスライスヘッダは、スライス符号化データの一部として出力されるとともに、入力画像と共にCTU符号化部242へ供給される。なお、スライスヘッダ符号化部241で生成されるスライスヘッダには、各レイヤのピクチャを復号するために参照するピクチャパラメータセットPPS(アクティブPPS)を指定するアクティブPPS識別子が含まれる。
CTU符号化部242は、入力されるアクティブパラメータセット、スライスヘッダに基づいて、入力画像(対象スライス部分)をCTU単位で符号化して、対象スライスに係るスライスデータおよび復号画像(復号ピクチャ)を生成して出力する。より具体的には、CTU符号化部242は、パラメータセットが含むCTBサイズの大きさのCTBを単位として対象スライスの入力画像を分割し、各CTBに対応する画像を一つのCTUとして符号化する。CTUの符号化は、予測残差符号化部2421、予測画像符号化部2422、CTU復号画像生成部2423により実行される。
予測残差符号化部2421は、入力される入力画像と予測画像の差分画像を、変換・量子化して得られる量子化残差情報(TT情報)を、スライス符号化データに含まれるスライスデータの一部として出力する。また、量子化残差情報に逆変換・逆量子化を適用して予測残差を復元し、復元した予測残差をCTU復号画像生成部2423に出力する。
予測画像符号化部2422は、符号化パラメータ決定部26で決定された、対象スライスに含まれる対象CTUの予測方式および予測パラメータに基づいて、予測画像を生成して予測残差符号化部2421とCTU復号画像生成部2423に出力する。なお、予測方式や予測パラメータの情報は予測情報(PT情報)として可変長符号化されて、スライス符号化データに含まれるスライスデータの一部として出力される。なお、インター予測、または、レイヤ間画像予測を使用する場合は、復号ピクチャ管理部15より対応する参照ピクチャを読み出す。
CTU復号画像生成部2423は、階層動画像復号装置1の備えるCTU復号画像制生成部1423と同一の構成要素であるため、説明を省略する。なお、対象CTUの復号画像は、復号ピクチャ管理部15へ供給され、内部のDPBに記録される。
<ピクチャ符号化部24の符号化プロセス>
以下、図27を参照して、ピクチャ符号化部24における対象レイヤiのピクチャの符号化の概略的な動作について説明する。図27は、ピクチャ符号化部24における対象レイヤiのピクチャを構成するスライス単位の符号化プロセスを示すフロー図である。
(SE101)符号化対象スライスの先頭スライスフラグ(first_slice_segment_in_pic_flag) (図17(d)のSYNSH01)を符号化する。すなわち、スライス単位に分割された入力画像(以降、符号化対象スライス)が、ピクチャ内の符号化順(復号順)(以降、処理順)で先頭スライスであれば、先頭スライスフラグ(first_slice_segment_in_pic_flag)が1である。符号化対象スライスが先頭スライスでなければ、先頭スライスフラグは0である。なお、先頭スライスフラグが1の場合、符号化対象スライスの先頭CTUアドレスを0に設定する。さらに、ピクチャ内の処理済みCTU数のカウンタnumCtuを0に設定する。先頭スライスフラグが0の場合、後述のSE106で符号化されるスライスアドレスに基づいて、符号化対象スライスの先頭CTUアドレスを設定する。
(SE102)符号化対象スライスの符号化時に参照するアクティブPPSを指定するアクティブPPS識別子(slice_pic_paramter_set_id)(図17(d)のSYNSH02)を符号化する。
(SE104)符号化パラメータ決定部26で決定されたアクティブパラメータセットをフェッチする。すなわち、符号化対象スライスが参照するアクティブPPS識別子(slice_pic_parameter_set_id)と同一のPPS識別子(pps_pic_parameter_set_id)を有するPPSをアクティブPPSとし、符号化パラメータ決定部26から、アクティブPPSの符号化パラメータをフェッチする(読み出す)。さらに、アクティブPPS内のアクティブSPS識別子(pps_seq_parameter_set_id)と同一のSPS識別子(sps_seq_parameter_set_id)を有するSPSをアクティブSPSとし、符号化パラメータ決定部26から、アクティブSPSの符号化パラメータをフェッチする。さらに、アクティブSPS内のアクティブVPS識別子(sps_video_parameter_set_id)と同一のVPS識別子(vps_video_parameter_set_id)を有するVPSをアクティブVPSとし、符号化パラメータ決定部26から、アクティブVPSの符号化パラメータをフェッチする。
なお、ピクチャ符号化部24は、アクティブVPSに含まれるレイヤセット情報、出力レイヤセット情報、及びPTL情報、該アクティブパラメータセット(VPS, SPS, PPS)のレイヤ識別子、対象レイヤのレイヤ識別子等を参照し、ターゲットセットがコンフォーマンス条件満たすか検証してもよい。コンフォーマンス条件は、階層動画像復号装置1において説明済みであるため省略する。なお、コンフォーマンス条件を満たせば、生成されるターゲットセットの階層符号化データDATAが、階層画像符号化装置2に対応する階層動画像復号装置1において、復号可能であることが保障される。
(SE105)符号化対象スライスが、ピクチャ内の処理順で先頭スライスであるか否かを先頭スライスフラグに基づいて判定する。先頭スライスフラグが0の場合(SE105でYes)、ステップSE106へ遷移する。それ以外の場合(SE105でNo)、ステップSE106の処理をスキップする。なお、先頭スライスフラグが1の場合、符号化対象スライスのスライスアドレスは0である。
(SE106)符号化対象スライスのスライスアドレス(slice_segment_address)(図17(d)のSYNSH03)を符号化する。なお、符号化対象スライスのスライスアドレス(符号化対象スライスの先頭CUTアドレス)は、例えば、ピクチャ内の処理済CTU数のカウンタnumCtuに基づいて設定可能である。この場合、スライスアドレスslice_segment_adress=numCtuである。すなわち、符号化対象スライスの先頭CTUアドレス=numCtuでもある。なお、スライスアドレスの決定方法はこれに限定されず、実施可能な範囲で変更可能である。
(SE10A)CTU符号化部242は、入力されるアクティブパラメータセット、スライスヘッダに基づいて、入力画像(符号化対象スライス)をCTU単位で符号化して、符号化対象スライスのスライスデータの一部として、CTU情報の符号化データ(図17(d)のSYNSD01)を出力する。また、CTU符号化部242は、各CTUに対応する領域のCTU復号画像を生成し出力する。さらに、各CTU情報の符号化データの後に、該CTUが符号化対象スライスの終端であるかを示すスライス終端フラグ(end_of_slice_segment_flag) (図17(d)のSYNSD02)を符号化する。該CTUが符号化対象スライスの終端である場合、スライス終端フラグを1へ設定し、それ以外の場合は0へ設定し、符号化する。また、各CTUの符号化後に、処理済CTU数numCtuの値を1加算する(numCtu++)。
(SE10B)該CTUが符号化対象スライスの終端であるか否かをスライス終端フラグに基づいて判定する。スライス終端フラグが1の場合(SE10BでYes)、ステップSE10Cへ遷移する。それ以外の場合(SE10BでNo)、後続のCTUを符号化するため、ステップSE10Aへ遷移する。
(SE10C)処理済CTU数numCtuが、ピクチャを構成するCTUの総数(PicSizeInCtbsY)に達したか判定する。すなわち、numCtu==PicSizeInCtbsYであるか判定する。numCtuがPicSizeInCtbsYと等しい場合(SE10CでYes)、符号化対象ピクチャを構成するスライス単位の符号化処理を終了する。それ以外の場合(numCtu<PicSizeInCtbsY)(SE10CでNo)、符号化対象ピクチャを構成するスライス単位の符号化処理を継続するため、ステップSE101へ遷移する。
以上、実施例1に係るピクチャ符号化部24の動作について説明したが、上記ステップに限定されず、実施可能な範囲で、ステップを変更しても構わない。
(動画像符号化装置2の効果)
以上説明した本実施形態に係る階層動画像符号化装置2は、階層動画像復号装置1(及びその変形例(階層動画像復号装置1A、階層動画像復号装置1B)において、レイヤセットにベースレイヤが含まれることを保障するために、前述のコンフォーマンス条件CC1(又はCC2〜CC4)を満たすように、ターゲットセットの階層符号化データDATAを生成する。従って、階層画像復号装置1において、上記符号化データから復号される出力レイヤセットは、必ずベースレイヤを復号することが保障される。従って、あるレイヤセットAを含む符号化データからビットストリーム抽出処理によって生成された、レイヤセットAのサブセットであるレイヤセットBを含む符号化データを復号する際に、レイヤセットBのあるレイヤC(レイヤ識別子>0)において、ベースレイヤにレイヤ識別子を有するパラメータセット(VPS/SPS/PPS)をアクティブパラメータセットとして参照する場合、ベースレイヤがレイヤセットBを含む符号化データに含まれず、あるレイヤCを復号できないというケースを防止することができる。すなわち、コンフォーマンス条件CC1(C2C〜CC4)を満たすことで、レイヤセットAを含む符号化データから、ビットストリーム抽出により生成されたレイヤセットAのサブセットであるレイヤセットBを含む符号化データが復号可能であることを保障することができる。
さらに、階層動画像符号化装置2は、階層動画像復号装置1(及びその変ケ例を含む)において、符号化データから復号される出力レイヤセットでは、必ず1以上のプライマリピクチャが復号されることを保障するため、前述のコンフォーマンス条件CX(CXは、CX1〜CX2のいずれか)を満たすように、ターゲットセットの階層符号化データDATAを生成する。従って、階層動画像復号装置1において、上記符号化データから復号される出力レイヤセットでは、必ず1以上のプライマリピクチャレイヤを復号することが保障される。すなわち、出力制御部16b、及び出力制御16cにおいて導出される対象復号レイヤIDリストにおいて、復号すべきレイヤ(プライマリピクチャレイヤ)がないというケースを防止することができる。
さらに、階層動画像符号化装置2は、出力制御部16b、又は出力制御16cを備える階層動画像復号装置において、補助ピクチャレイヤの復号処理を省略可能とするために、前述のコンフォーマンス条件CX(CXは、CX1〜CX2のいずれか)に加えて、コンフォーマンス条件CY(CYは、CY1〜CY3のいずれか)を満たすように、ターゲットセットの階層符号化データDATAを生成する。従って、出力制御部16b、又は出力制御部16cを備える階層動画像復号装置1において、上記符号化データから復号される出力レイヤセットでは、補助ピクチャレイヤの復号処理を省略可能であることを保障することができる。
(他の階層動画像符号化/復号システムへの適用例)
上述した階層動画像符号化装置2及び階層動画像復号装置1は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用できる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
図28に基づいて、上述した階層動画像符号化装置2および階層動画像復号装置1を、動画像の送信および受信に利用できることを説明する。図28の(a)は、階層動画像符号化装置2を搭載した送信装置PROD_Aの構成を示したブロック図である。
図28の(a)に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3とを備えている。上述した階層動画像符号化装置2は、この符号化部PROD_A1として利用される。
送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部A7を更に備えていてもよい。図28の(a)においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。
図28の(b)は、階層動画像復号装置1を搭載した受信装置PROD_Bの構成を示したブロック図である。図28の(b)に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3とを備えている。上述した階層動画像復号装置1は、この復号部PROD_B3として利用される。
受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図28の(b)においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。
例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。
また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置PROD_A/受信装置PROD_Bの一例である(通常、LANにおいては伝送媒体として無線又は有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。
なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。
図29に基づいて、上述した階層動画像符号化装置2および階層動画像復号装置1を、動画像の記録および再生に利用できることを説明する。図29の(a)は、上述した階層動画像符号化装置2を搭載した記録装置PROD_Cの構成を示したブロック図である。
図29の(a)に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した階層動画像符号化装置2は、この符号化部PROD_C1として利用される。
なお、記録媒体PROD_Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)等のように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリ等のように、記録装置PROD_Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)等のように、記録装置PROD_Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部C6を更に備えていてもよい。図29の(a)においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。
なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD(Hard Disk Drive)レコーダなどが挙げられる(この場合、入力端子PROD_C4又は受信部PROD_C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラPROD_C3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部PROD_C5又は画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラPROD_C3又は受信部PROD_C5が動画像の主な供給源となる)なども、このような記録装置PROD_Cの一例である。
図29の(b)は、上述した階層動画像復号装置1を搭載した再生装置PROD_Dの構成を示したブロックである。図29の(b)に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した階層動画像復号装置1は、この復号部PROD_D2として利用される。
なお、記録媒体PROD_Mは、(1)HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図29の(b)においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。
なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイPROD_D3が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子PROD_D4又は送信部PROD_D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)なども、このような再生装置PROD_Dの一例である。
(ハードウェア的実現およびソフトウェア的実現について)
最後に、階層動画像復号装置1、階層動画像符号化装置2の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
後者の場合、上記各装置は、各機能を実現する制御プログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(またはCPUやMPU(Micro Processing Unit))が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM(Compact Disc Read-Only Memory)/MO(Magneto-Optical)/MD(Mini Disc)/DVD(Digital Versatile Disk)/CD−R(CD Recordable)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(Erasable Programmable Read-only Memory)/EEPROM(登録商標)(ElectricallyErasable and Programmable Read-only Memory)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、ISDN(Integrated Services Digital Network)、VAN(Value-Added Network)、CATV(Community Antenna Television)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(Institute of Electrical and Electronic Engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric DigitalSubscriber Line)回線等の有線でも、IrDA(Infrared Data Association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance)(登録商標)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
〔まとめ〕
本発明には、少なくとも態様1から23に示す画像復号装置、及び態様24から33に示す画像符号化装置が含まれている。
本発明の態様1に係る画像復号装置は、階層画像符号化データを復号する画像復号装置であって、
レイヤセットを復号するレイヤセット情報復号手段と、
出力レイヤセットのレイヤセット識別子と出力レイヤフラグを復号する出力レイヤセット情報復号手段と、
スケーラブル識別子を復号するスケーラブル識別子復号手段と、
上記出力レイヤセットの一つを対象出力レイヤセットとして選択する出力レイヤセット選択手段と、
上記出力レイヤセットに対応するレイヤセット、及び上記出力レイヤフラグに基づいて上記対象出力レイヤの構成を示す出力レイヤIDリストを導出する出力レイヤIDリスト導出手段と、
上記レイヤセットに対応するレイヤセット、及び上記スケーラブル識別子に基づいて、復号対象とするレイヤの構成を示す復号レイヤIDリストを導出する復号レイヤIDリスト導出手段と、
上記導出された復号レイヤIDリストに含まれる各レイヤの復号ピクチャを生成するピクチャ復号手段を備えることを特徴とする。
本発明の態様2に係る画像復号装置は、上記態様1において、さらに、上記復号レイヤIDリスト導出手段は、上記出力レイヤセットに含まれるレイヤにおいて、上記スケーラブル識別子がプライマリピクチャレイヤを示すレイヤを復号レイヤIDリストとして導出することを特徴とする。
本発明の態様3に係る画像復号装置は、上記態様1から2において、さらに、上記復号レイヤIDリスト導出手段は、上記出力レイヤセットに含まれる各レイヤに対して、プライマリピクチャレイヤであるかを判定し、
上記レイヤがプライマリピクチャレイヤである場合には、上記復号レイヤIDリストの要素に追加し、
上記レイヤが補助ピクチャレイヤである場合には、上記復号レイヤIDリストの要素に追加しないことを特徴とする。
本発明の態様4に係る画像復号装置は、階層画像符号化データを復号する画像復号装置であって、
レイヤセットを復号するレイヤセット情報復号手段と、
出力レイヤセットのレイヤセット識別子と出力レイヤフラグを復号する出力レイヤセット情報復号手段と、
スケーラブル識別子を復号するスケーラブル識別子復号手段と、
上記出力レイヤセットの一つを対象出力レイヤセットとして選択する出力レイヤセット選択手段と、
上記出力レイヤセットに対応するレイヤセット、及び上記出力レイヤフラグに基づいて上記対象出力レイヤの構成を示す出力レイヤIDリストを導出する出力レイヤIDリスト導出手段と、
上記レイヤセットに対応するレイヤセット、上記出力レイヤフラグ、及び上記スケーラブル識別子に基づいて、復号対象とするレイヤの構成を示す復号レイヤIDリストを導出する復号レイヤIDリスト導出手段と、
上記導出された復号レイヤIDリストに含まれる各レイヤの復号ピクチャを生成するピクチャ復号手段を備えることを特徴とする。
本発明の態様5に係る画像復号装置は、上記態様4において、さらに、上記復号レイヤIDリスト導出手段は、上記出力レイヤセットに含まれるレイヤにおいて、上記スケーラブル識別子がプライマリピクチャレイヤを示すレイヤ、または、上記スケーラブル識別子が補助ピクチャレイヤを示し、かつ、出力レイヤフラグが1であるレイヤを復号レイヤIDリストとして導出することを特徴とする。
本発明の態様6に係る画像復号装置は、上記態様4から5において、さらに、上記復号レイヤIDリスト導出手段は、上記選択された出力レイヤセットに含まれる各レイヤに対して、プライマリピクチャレイヤであるか、又は出力レイヤフラグが1である補助ピクチャレイヤであるかを判定し、
上記レイヤが、プライマリピクチャレイヤ、又は出力レイヤフラグが1である補助ピクチャレイヤである場合には、上記復号レイヤIDリストの要素に追加し、
上記レイヤが、出力レイヤフラグが0である補助ピクチャレイヤである場合には、上記復号レイヤIDリストの要素に追加しないことを特徴とする。
本発明の態様7に係る画像復号装置は、上記態様1から6において、さらに、上記復号レイヤIDリスト導出手段は、コンフォーマンステストである場合、上記出力レイヤセットに対応するレイヤセットに含まれる全レイヤを、上記復号レイヤIDリストとして導出することを特徴とする。
本発明の態様8に係る画像復号装置は、上記態様1から7において、さらに、上記出力レイヤセットは、少なくとも1以上のプライマリピクチャレイヤから構成されることを特徴とする。
本発明の態様9に係る画像復号装置は、上記態様1から8において、さらに、上記出力レイヤセットにおいて、補助ピクチャレイヤがある場合、該補助ピクチャレイヤの出力レイヤフラグは0であることを特徴とする。
本発明の態様10に係る画像復号装置は、階層画像符号化データを復号する画像復号装置であって、
レイヤセットを復号するレイヤセット情報復号手段と、
出力レイヤセットのレイヤセット識別子と出力レイヤフラグを復号する出力レイヤセット情報復号手段と、
レイヤ間依存情報を復号するレイヤ間依存情報復号手段と、
上記出力レイヤセットの一つを対象出力レイヤセットとして選択する出力レイヤセット選択手段と、
上記出力レイヤセットに対応するレイヤセット、及び上記出力レイヤセットフラグに基づいて上記対象出力レイヤの構成を示す出力レイヤIDリストを導出する出力レイヤIDリスト導出手段と、
上記レイヤセットに対応するレイヤセット、上記出力レイヤフラグ、及び上記レイヤ間依存情報に基づいて、復号対象とするレイヤの構成を示す復号レイヤIDリストを導出する復号レイヤIDリスト導出手段と、
上記導出された復号レイヤIDリストに含まれる各レイヤの復号ピクチャを生成するピクチャ復号手段を備えることを特徴とする。
本発明の態様11に係る画像復号装置は、上記態様10において、さらに、上記復号レイヤIDリスト導出手段は、上記出力レイヤフラグが1である出力レイヤ、及び上記出力レイヤの依存レイヤを復号レイヤIDリストとして導出することを特徴とする。
本発明の態様12に係る画像復号装置は、上記態様11において、さらに、上記復号レイヤIDリスト導出手段は、さらに、上記復号レイヤIDリストに、レイヤ識別子が0であるレイヤを含めることを特徴とする。
本発明の態様13に係る画像復号装置は、上記態様10から11において、さらに、上記復号レイヤIDリスト導出手段は、上記出力レイヤセットに含まれる各レイヤに対して、出力レイヤフラグが1であるか、又は出力レイヤの依存レイヤであるかを判定し、
上記レイヤが出力レイヤ、又は出力レイヤの依存レイヤである場合には、上記復号レイヤIDリストの要素に追加し、
上記レイヤが非出力レイヤかつ出力レイヤの非依存レイヤである場合には、上記復号レイヤIDリストの要素に追加しないことを特徴とする。
本発明の態様14に係る画像復号装置は、上記態様10または12において、さらに、上記復号レイヤIDリスト導出手段は、上記選択された出力レイヤセットに含まれる各レイヤに対して、出力レイヤであるか、又は出力レイヤの依存レイヤであるか、又はレイヤ識別子が0であるかを判定し、
上記レイヤが出力レイヤ、又は出力レイヤの依存レイヤ、又はレイヤ識別子が0である場合には、上記復号レイヤIDリストの要素に追加し、
上記レイヤが非出力レイヤかつ出力レイヤの非依存レイヤである場合には、上記復号レイヤIDリストの要素に追加しないことを特徴とする。
本発明の態様15に係る画像復号装置は、上記態様10において、さらに、上記出力レイヤセット情報復号手段は、出力レイヤセットのDPB情報、又は出力レイヤセットのPTL指定識別子の有無を示すPTL・DPB情報有無フラグを復号し、
上記PTL・DPB情報有無フラグが真の場合、符号化データより、上記PTL指定識別子を復号し、
上記PTL・DPB情報有無フラグが偽の場合、上記PTL指定識別子の復号を省略し、上記出力レイヤセットのレイヤセット識別子と対応する基本出力レイヤセットのPTL指定識別子と等しいと推定することを特徴とする。
本発明の態様16に係る画像復号装置は、上記態様10において、さらに、出力レイヤセットのDPB情報を復号するDPB情報復号手段を備え、
上記出力レイヤセット情報復号手段は、出力レイヤセットのDPB情報、又は出力レイヤセットのPTL指定識別子の有無を示すPTL・DPB情報有無フラグを復号し、
上記PTL・DPB情報有無フラグが真の場合、上記DPB情報復号手段は、符号化データより、上記出力レイヤセットのDPB情報を復号し、
上記PTL・DPB情報有無フラグが偽の場合、上記DPB情報復号手段は、上記出力レイヤセットのDPB情報を復号せず、上記出力レイヤセットのレイヤセット識別子と対応する基本出力レイヤセットのDPB情報と等しいと推定することを特徴とする。
本発明の態様17に係る画像復号装置は、上記態様15または16において、さらに、上記出力レイヤセット情報復号手段は、基本出力レイヤセットのPTL・DPB情報有無フラグの復号をせず、前記PTL・DPB情報有無フラグを1と推定することを特徴とする。
本発明の態様18に係る画像復号装置は、上記態様10において、さらに、上記出力レイヤセット情報復号手段は、上記出力レイヤセットが基本出力レイヤセットである場合、符号化データより、上記PTL指定識別子を復号し、上記出力レイヤセットが追加出力レイヤセットである場合、上記出力レイヤセットのレイヤセット識別子と対応する基本出力レイヤセットのPTL指定識別子と等しいと推定することを特徴とする。
本発明の態様19に係る画像復号装置は、上記態様10において、さらに、出力レイヤセットのDPB情報を復号するDPB情報復号手段を備え、
上記DPB情報復号手段は、上記出力レイヤセットが基本出力レイヤセットである場合、符号化データより、上記出力レイヤセットのDPB情報を復号し、
上記出力レイヤセットが追加出力レイヤセットである場合、上記出力レイヤセットのDPB情報を復号せず、上記出力レイヤセットのレイヤセット識別子と対応する基本出力レイヤセットのDPB情報と等しいと推定することを特徴とする。
本発明の態様20に係る画像復号装置は、上記態様10において、さらに、サブビットストリーム特性情報を復号するサブビットストリーム特性情報復号手段と、
入力された符号化データより、上記選択された出力レイヤセットに対応するサブビットストリーム特性情報に基づいて、ビットストリーム抽出処理をし、ターゲットセットのビットストリームを抽出する符号化データ抽出手段を備えることを特徴とする。
本発明の態様21に係る画像復号装置は、上記態様20において、さらに、上記符号化データ抽出手段は、少なくとも、上記選択された出力レイヤセットのうち、非出力レイヤかつ出力レイヤの非依存レイヤのレイヤ識別子を有するNALユニットを破棄することを特徴とする。
本発明の態様22に係る画像復号装置は、上記態様20において、さらに、上記符号化データ抽出手段は、少なくとも、上記選択された出力レイヤセットのうち、補助ピクチャレイヤのレイヤ識別子を有するNALユニットを破棄することを特徴とする。
本発明の態様23に係る画像復号装置は、上記態様20において、さらに、上記符号化データ抽出手段は、少なくとも、上記選択された出力レイヤセットのうち、非出力レイヤである補助ピクチャレイヤのレイヤ識別子を有するNALユニットを破棄することを特徴とする。
本発明の態様24に係る画像符号化装置は、階層的符号化データを生成する画像符号化装置であって、
レイヤセットを符号化するレイヤセット情報符号化手段と、
レイヤ間依存情報を符号化するレイヤ間依存情報符号化手段と、
出力レイヤセットのレイヤセット識別子と出力レイヤフラグを符号化する出力レイヤセット情報符号化手段と、
上記出力レイヤセットに対応するサブビットストリーム特性情報を符号化するサブビットストリーム特性情報符号化手段と、
上記出力レイヤセットに対応するDPB情報を符号化するDPB情報符号化手段と、
上記出力レイヤセットに対応するレイヤセットに含まれる各レイヤのピクチャを符号化するピクチャ符号化手段とを備えることを特徴とする。
本発明の態様25に係る画像符号化装置は、上記態様24において、さらに、上記サブビットストリーム特性情報には、少なくとも出力レイヤセットのビットストリームから、非出力レイヤかつ出力レイヤの非依存レイヤのレイヤ識別子のNALユニットを破棄するビットストリーム抽出処理を指定するビットストリーム抽出モードを含むことを特徴とする。
本発明の態様26に係る画像符号化装置は、上記態様24または25において、さらに、上記出力レイヤセット情報符号化手段は、さらに、出力レイヤセットのDPB情報、又は出力レイヤセットのPTL指定識別子の有無を示すPTL・DPB情報有無フラグを符号化することを特徴とする。
本発明の態様27に係る画像符号化装置は、上記態様26において、さらに、上記出力レイヤセット情報符号化手段は、上記PTL・DPB情報有無フラグが真の場合、上記PTL指定識別子を符号化し、
上記PTL・DPB情報有無フラグが偽の場合、上記PTL指定識別子の符号化を省略し、上記出力レイヤセットのレイヤセット識別子と対応する基本出力レイヤセットのPTL指定識別子と等しいと推定することを特徴とする。
本発明の態様28に係る画像符号化装置は、上記態様26において、さらに、上記DPB情報符号化手段は、上記PTL・DPB情報有無フラグが真の場合、上記出力レイヤセットのDPB情報を符号化し、
上記PTL・DPB情報有無フラグが偽の場合、上記DPB情報符号化手段は、上記出力レイヤセットのDPB情報の符号化を省略し、上記出力レイヤセットのレイヤセット識別子と対応する基本出力レイヤセットのDPB情報と等しいと推定することを特徴とする。
本発明の態様29に係る画像符号化装置は、上記態様25または26において、さらに、
上記出力レイヤセット情報符号化手段は、基本出力レイヤセットのPTL・DPB情報有無フラグの符号化をせず、前記PTL・DPB情報有無フラグを1と推定することを特徴とする。
本発明の態様30に係る画像符号化装置は、上記態様24において、上記出力レイヤセット情報符号化手段は、上記出力レイヤセットが基本出力レイヤセットである場合、上記PTL指定識別子を符号化し、上記出力レイヤセットが追加出力レイヤセットである場合、上記出力レイヤセットのレイヤセット識別子と対応する基本出力レイヤセットのPTL指定識別子と等しいと推定することを特徴とする。
本発明の態様31に係る画像符号化装置は、上記態様24において、上記DPB情報符号化手段は、上記出力レイヤセットが基本出力レイヤセットである場合、上記出力レイヤセットのDPB情報を符号化し、
上記出力レイヤセットが追加出力レイヤセットである場合、上記出力レイヤセットのDPB情報を符号化せず、上記出力レイヤセットのレイヤセット識別子と対応する基本出力レイヤセットのDPB情報と等しいと推定することを特徴とする。
本発明の態様32に係る画像符号化装置は、上記態様24において、上記サブビットストリーム特性情報には、出力レイヤセットのビットストリームから、補助ピクチャレイヤのレイヤ識別子のNALユニットを破棄するビットストリーム抽出処理を指定するビットストリーム抽出モードを含むことを特徴とする。
本発明の態様33に係る画像符号化装置は、上記態様24において、上記サブビットストリーム特性情報には、出力レイヤセットのビットストリームから、非出力レイヤである補助ピクチャレイヤのレイヤ識別子のNALユニットを破棄するビットストリーム抽出処理を指定するビットストリーム抽出モードを含むことを特徴とする。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、画像データが階層的に符号化された符号化データを復号する階層動画像復号装置、および、画像データが階層的に符号化された符号化データを生成する階層動画像符号化装置に好適に適用することができる。また、階層動画像符号化装置によって生成され、階層動画像復号装置によって参照される階層符号化データのデータ構造に好適に適用することができる。
1…階層動画像復号装置
2…階層動画像符号化装置
10…ターゲットセットピクチャ復号部
11…NAL逆多重化部(NALユニット復号手段、レイヤ識別子復号手段)
12…Non-VCL復号部(パラメータセット復号手段、レイヤセット情報復号手段、出力レイヤセット情報復号手段、PTL情報復号手段、DPB情報復号手段、サブビットストリーム特性情報復号手段、レイヤ間依存情報復号手段、スケーラブル識別子復号手段)
13…パラメータメモリ
14…ピクチャ復号部(VCL復号手段)
141…スライスヘッダ復号部
142…CTU復号部
1421…予測残差復元部
1422…予測画像生成部
1423…CTU復号画像生成部
15…復号ピクチャ管理部
16…出力制御部(出力レイヤセット選択手段、対象出力レイヤID導出手段、対象復号レイヤIDリスト導出手段)
17…ビットストリーム抽出手段(符号化データ抽出手段)
20…ターゲットセットピクチャ符号化部
21…NAL多重化部(NALユニット符号化手段)
22…Non-VCL符号化部(パラメータセット符号化手段、レイヤセット情報符号化手段、出力レイヤセット情報符号化手段、PTL情報符号化手段、DPB情報符号化手段、サブビットストリーム特性情報符号化手段、レイヤ間依存情報符号化手段、スケーラブル識別子符号化手段)
24…ピクチャ符号化部(VCL符号化手段)
26…符号化パラメータ決定部
241…スライスヘッダ符号化部
242…CTU符号化部
2421…予測残差符号化部
2422…予測画像符号化部
2423…CTU復号画像生成部

Claims (3)

  1. 階層画像符号化データを復号する画像復号装置であって、
    レイヤセット単位で各レイヤが前記レイヤセットに含まれるか否かを示す第1のフラグを復号する第1のフラグ復号手段と、
    上記第1のフラグに基づいて、前記レイヤセットのレイヤIDリストを導出するレイヤセット情報復号手段と、
    出力レイヤセット単位で、
    a)レイヤセット識別子、と
    b)前記出力レイヤセットに含まれる各レイヤが出力レイヤであるか否かを示す出力レイヤフラ
    復号する出力レイヤセット情報復号手段と、
    第1のレイヤが、第2のレイヤの参照レイヤであるか否かを示す依存フラグを導出する依存フラグ導出手段と、
    上記出力レイヤセットに対応する上記レイヤIDリスト、上記出力レイヤセットの出力レイヤフラグ、及び上記依存フラグに基づいて、上記出力レイヤセットにおいて、復号するレイヤを示す復号レイヤIDリストを導出する復号レイヤIDリスト導出手段と、
    上記導出された復号レイヤIDリストに含まれる各レイヤに対応する上記階層符号化データから、上記各レイヤのピクチャを復号するピクチャ復号手段を備えることを特徴とする画像復号装置。
  2. 階層画像符号化データを復号する画像復号方法であって、
    レイヤセット単位で各レイヤが前記レイヤセットに含まれるか否かを示す第1のフラグを復号する第1のフラグ復号ステップと、
    上記第1のフラグに基づいて、前記レイヤセットのレイヤIDリストを導出するレイヤセット情報復号ステップと、
    出力レイヤセット単位で、
    a)レイヤセット識別子、と
    b)前記出力レイヤセットに含まれる各レイヤが出力レイヤであるか否かを示す出力レイヤフラ
    復号する出力レイヤセット情報復号ステップと、
    第1のレイヤが、第2のレイヤの参照レイヤであるか否かを示す依存フラグを導出する依存フラグ導出ステップと、
    上記出力レイヤセットに対応する上記レイヤIDリスト、上記出力レイヤセットの出力レイヤフラグ、及び上記依存フラグに基づいて、上記出力レイヤセットにおいて、復号するレイヤを示す復号レイヤIDリストを導出する復号レイヤIDリスト導出ステップと、
    上記導出された復号レイヤIDリストに含まれる各レイヤに対応する上記階層符号化データから、上記各レイヤのピクチャを復号するピクチャ復号ステップを備えることを特徴とする画像復号方法。
  3. コンピュータに、階層画像符号化データを復号させるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
    レイヤセット単位で各レイヤが前記レイヤセットに含まれるか否かを示す第1のフラグを復号する第1のフラグ復号ステップと、
    上記第1のフラグに基づいて、前記レイヤセットのレイヤIDリストを導出するレイヤセット情報復号ステップと、
    出力レイヤセット単位で、
    a)レイヤセット識別子、と
    b)前記出力レイヤセットに含まれる各レイヤが出力レイヤであるか否かを示す出力レイヤフラグ
    を復号する出力レイヤセット情報復号ステップと、
    第1のレイヤが、第2のレイヤの参照レイヤであるか否かを示す依存フラグを導出する依存フラグ導出ステップと、
    上記出力レイヤセットに対応する上記レイヤIDリスト、上記出力レイヤセットの出力レイヤフラグ、及び上記依存フラグに基づいて、上記出力レイヤセットにおいて、復号するレイヤを示す復号レイヤIDリストを導出する復号レイヤIDリスト導出ステップと、
    上記導出された復号レイヤIDリストに含まれる各レイヤに対応する上記階層符号化データから、上記各レイヤのピクチャを復号するピクチャ復号ステップを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2016507815A 2014-03-14 2015-03-12 画像復号装置、画像復号方法及び記録媒体 Expired - Fee Related JP6465863B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2014051864 2014-03-14
JP2014051864 2014-03-14
JP2014084519 2014-04-16
JP2014084519 2014-04-16
PCT/JP2015/057251 WO2015137432A1 (ja) 2014-03-14 2015-03-12 画像復号装置、及び画像復号方法

Publications (2)

Publication Number Publication Date
JPWO2015137432A1 JPWO2015137432A1 (ja) 2017-04-06
JP6465863B2 true JP6465863B2 (ja) 2019-02-06

Family

ID=54071871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016507815A Expired - Fee Related JP6465863B2 (ja) 2014-03-14 2015-03-12 画像復号装置、画像復号方法及び記録媒体

Country Status (3)

Country Link
US (1) US20170019673A1 (ja)
JP (1) JP6465863B2 (ja)
WO (1) WO2015137432A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014015323A1 (en) * 2012-07-20 2014-01-23 Merlin Technology, Inc. Inground operations, system, communications and associated apparatus
EP3944241A3 (en) * 2014-08-07 2022-05-04 Panasonic Intellectual Property Corporation of America Decoding system and decoding method
WO2019230904A1 (ja) * 2018-06-01 2019-12-05 シャープ株式会社 画像復号装置、および画像符号化装置
US10986353B2 (en) * 2019-03-15 2021-04-20 Tencent America LLC Decoded picture buffer management for video coding
EP4022928A4 (en) * 2019-09-24 2022-11-16 Huawei Technologies Co., Ltd. DPB PARAMETER REPORTING FOR MULTILAYER VIDEO BITSTREAMS
CN114514747A (zh) 2019-09-24 2022-05-17 华为技术有限公司 用于ols的可伸缩嵌套式sei消息
KR20220063261A (ko) * 2019-09-24 2022-05-17 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 코딩에서 멀티뷰를 위한 동시 송출 레이어
WO2021061531A1 (en) 2019-09-24 2021-04-01 Futurewei Technologies, Inc. Ols for multiview scalability
JP7381732B2 (ja) 2019-09-24 2023-11-15 華為技術有限公司 マルチレイヤービデオビットストリームにおける未使用レイヤーの禁止
JP7439249B2 (ja) * 2019-10-07 2024-02-27 ホアウェイ・テクノロジーズ・カンパニー・リミテッド サブビットストリーム抽出におけるエラー回避
US12088848B2 (en) * 2019-12-11 2024-09-10 Sharp Kabushiki Kaisha Systems and methods for signaling output layer set information in video coding
JP7431330B2 (ja) 2019-12-26 2024-02-14 バイトダンス インコーポレイテッド ビデオコーディングにおけるプロファイル、層及びレイヤの指示
CN114868158A (zh) 2019-12-26 2022-08-05 字节跳动有限公司 层级视频中的解码图片缓冲区参数的信令通知
CN114902677A (zh) 2019-12-27 2022-08-12 字节跳动有限公司 信令通知视频子图片的语法
CN117395441A (zh) 2020-01-09 2024-01-12 字节跳动有限公司 视频流中的填充数据单元的处理
US11330305B2 (en) * 2020-02-24 2022-05-10 Qualcomm Incorporated Signaling constraints and sequence parameter set sharing in video coding
US11778215B2 (en) 2020-02-28 2023-10-03 Qualcomm Incorporated Coding output layer set data and conformance window data of high level syntax for video coding
US11943429B2 (en) * 2020-03-04 2024-03-26 Qualcomm Incorporated Subpicture signaling in video coding
US11297350B1 (en) * 2020-03-27 2022-04-05 Tencent America LLC Method for output layer set for multilayered video stream
KR20220162742A (ko) * 2020-03-30 2022-12-08 엘지전자 주식회사 Sps 내 ptl, dpb 및 hrd 관련 정보를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체
WO2021233422A1 (en) * 2020-05-22 2021-11-25 Beijing Bytedance Network Technology Co., Ltd. Subpicture sub-bitstream extraction improvements
CN115668929A (zh) * 2020-05-22 2023-01-31 字节跳动有限公司 视频子比特流提取过程中的sei消息处理
CN117528004A (zh) 2020-06-09 2024-02-06 字节跳动有限公司 多层视频比特流的子比特流提取

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109729364A (zh) * 2013-04-07 2019-05-07 杜比国际公司 用信号通知输出层集的改变
US10595031B2 (en) * 2013-07-12 2020-03-17 Qualcomm Incorporated Selection of target output layers in high efficiency video coding extensions

Also Published As

Publication number Publication date
WO2015137432A1 (ja) 2015-09-17
JPWO2015137432A1 (ja) 2017-04-06
US20170019673A1 (en) 2017-01-19

Similar Documents

Publication Publication Date Title
JP6585223B2 (ja) 画像復号装置
JP6465863B2 (ja) 画像復号装置、画像復号方法及び記録媒体
JP6800837B2 (ja) 画像復号装置、及び画像復号方法
CN105519119B (zh) 图像解码装置
US20190082188A1 (en) Image decoding device, image decoding method, image coding device, and image coding method
JP6290088B2 (ja) 画像復号装置、画像復号方法、および記録媒体
WO2014050597A1 (ja) 画像復号装置
JP2015195543A (ja) 画像復号装置、画像符号化装置
WO2014007131A1 (ja) 画像復号装置、および画像符号化装置
JP2015119402A (ja) 画像復号装置、画像符号化装置、及び符号化データ
JP2015126507A (ja) 画像復号装置、画像符号化装置、及び符号化データ
WO2015098713A1 (ja) 画像復号装置および画像符号化装置
JP2015076807A (ja) 画像復号装置、画像符号化装置、および符号化データのデータ構造

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180208

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190108

R150 Certificate of patent or registration of utility model

Ref document number: 6465863

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees