JP2015050506A - 画像復号装置および画像符号化装置 - Google Patents

画像復号装置および画像符号化装置 Download PDF

Info

Publication number
JP2015050506A
JP2015050506A JP2013179067A JP2013179067A JP2015050506A JP 2015050506 A JP2015050506 A JP 2015050506A JP 2013179067 A JP2013179067 A JP 2013179067A JP 2013179067 A JP2013179067 A JP 2013179067A JP 2015050506 A JP2015050506 A JP 2015050506A
Authority
JP
Japan
Prior art keywords
rps
layer
inter
sub
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013179067A
Other languages
English (en)
Inventor
山本 智幸
Tomoyuki Yamamoto
智幸 山本
知宏 猪飼
Tomohiro Igai
知宏 猪飼
健史 筑波
Kenji Tsukuba
健史 筑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2013179067A priority Critical patent/JP2015050506A/ja
Publication of JP2015050506A publication Critical patent/JP2015050506A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】少ない符号量で符号化データを復号する画像復号装置を提供する。
【解決手段】画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、上位レイヤの復号ピクチャを復元する装置であって、参照ピクチャセットを導出するRPS導出部を備え、上記RPS導出部は、上記参照ピクチャセットを構成するサブRPSとして、少なくとも第一のサブRPSと、第二のサブRPSを導出し、上記第一のサブRPSは、画素依存のレイヤ間参照ピクチャを含み、上記第二のサブRPSは、画素非依存のレイヤ間参照ピクチャを含む。
【選択図】図4

Description

本発明は、画像が階層的に符号化された階層符号化データを復号する画像復号装置、および画像を階層的に符号化することによって階層符号化データを生成する画像符号化装置に関する。
通信システムで伝送される情報、あるいは蓄積装置に記録される情報の1つに画像あるいは動画像がある。従来、これらの画像(以降、動画像を含む)の伝送・蓄積のため、画像を符号化する技術が知られている。
動画像符号化方式としては、AVC(H.264/MPEG-4 Advanced Video Coding)や、その後継コーデックであるHEVC(High-Efficiency Video Coding)が知られている(非特許文献1)。
これらの動画像符号化方式では、通常、入力画像を符号化/復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像(原画像)から減算して得られる予測残差(「差分画像」または「残差画像」と呼ぶこともある)が符号化される。また、予測画像の生成方法としては、画面間予測(インター予測)、および、画面内予測(イントラ予測)が挙げられる。
イントラ予測では、同一ピクチャ内の局所復号画像に基づいて、当該ピクチャにおける予測画像が順次生成される。
インター予測では、ピクチャ間の動き補償により予測画像が生成される。インター予測で予測画像生成に用いられる復号済のピクチャは参照ピクチャと呼ばれる。
また、複数の相互に関連性のある動画像をレイヤ(階層)に分けて符号化することで、複数の動画像から符号化データを生成する技術も知られており、階層符号化技術と呼ばれる。階層符号化技術により生成される符号化データは階層符号化データとも呼ばれる。
代表的な階層符号化技術としてHEVCを基礎とするSHVC(Scalable HEVC)が知られている(非特許文献2)。
SHVCでは、空間スケーラビリティ、時間スケーラビリティ、SNRスケーラビリティをサポートする。例えば空間スケーラビリティの場合、複数の異なる解像度の動画像をレイヤに分けて符号化して階層符号化データを生成する。例えば、原画像から所望の解像度にダウンサンプリングした画像を下位レイヤとして符号化する。次に原画像をレイヤ間の冗長性を除去するためにレイヤ間予測を適用した上で、上位レイヤとして符号化する。
別の代表的な階層符号化技術としてHEVCを基礎とするMV-HEVC(Multi View HEVC)が知られている(非特許文献3)。
MV-HEVCではビュースケーラビリティをサポートする。ビュースケーラビリティでは、複数の異なる視点(ビュー)に対応する動画像をレイヤに分けて符号化して階層符号化データを生成する。例えば、基本となる視点(ベースビュー)に対応する動画像を下位レイヤとして符号化する。次に、異なる視点に対応する動画像を、レイヤ間予測を適用した上で、上位レイヤとして符号化する。
SHVCやMV-HEVCにおけるレイヤ間予測には、レイヤ間画像予測とレイヤ間動き予測がある。レイヤ間画像予測では、下位レイヤの復号画像を利用して、予測画像を生成する。レイヤ間動き予測では、下位レイヤの動き情報を利用して、動き情報の予測値を導出する。レイヤ間予測において予測に用いられるピクチャはレイヤ間参照ピクチャと呼ばれる。また、レイヤ間参照ピクチャを含むレイヤは参照レイヤと呼ばれる。なお、以下では、インター予測に用いられる参照ピクチャと、レイヤ間予測に用いられる参照ピクチャを総称して単に参照ピクチャと呼称する。
SHVCやMV-HEVCでは、予測画像の生成に、インター予測、イントラ予測、レイヤ間画像予測のいずれかを利用できる。
SHVCやMV-HEVCにおけるインター予測やレイヤ間予測では、複数の参照ピクチャを所定の順序で並べて構成される参照ピクチャリストを生成し、当該参照ピクチャリスト内の特定参照ピクチャを示す識別子である参照ピクチャインデックスにより、インター予測やレイヤ間予測に用いる参照ピクチャを特定する。参照ピクチャインデックスは、小さい値ほど(参照ピクチャリストの先頭に対応する値ほど)より少ない符号量で符号化データに含まれている。
「Recommendation H.265 (04/13)」, ITU-T (2013年6月7日公開) JCT3V-E1004_v6 「MV-HEVC Draft Text 5」, Joint Collaborative Team on 3D Video Coding Extension Development of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 115th Meeting: Vienna, AT, 27 Jul. -2 Aug. 2013 (2013年8月7日公開) JCTVC-N1008_v1 「SHVC Draft 3」, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 14th Meeting: Vienna, AT, 25 July - 2 Aug. 2013 (2013年8月20日公開)
しかしながら、従来技術として挙げたSHVCやMV-HEVCでは、参照ピクチャリスト生成において、参照ピクチャの性質が十分考慮されておらず、インター予測やレイヤ間予測における選択頻度が低い参照ピクチャが既定の参照ピクチャリスト(暫定参照リスト)の先頭に近い位置に来る場合があるという課題があった。そのため、参照ピクチャインデックスの符号量が多く、結果として符号化データの符号量が多いという課題があった。
本発明は、上記問題に鑑みてされたものであり、その目的は、階層符号化方式において、インター予測やレイヤ間予測における選択頻度が比較的高い参照ピクチャのグループを、暫定参照リストにおいて先頭に近い位置に配置することで、参照ピクチャインデックスの符号量を低減し、結果としてより少ない符号量で符号化データを符号化/復号する画像符号化装置および画像復号装置を実現することにある。
上記課題を解決するために、本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、上位レイヤの復号ピクチャを復元する画像復号装置であって、参照ピクチャセットを導出するRPS導出部を備え、上記RPS導出部は、上記参照ピクチャセットを構成するサブRPSとして、少なくとも第一のサブRPSと、第二のサブRPSを導出し、上記第一のサブRPSは、画素依存のレイヤ間参照ピクチャを含み、上記第二のサブRPSは、画素非依存のレイヤ間参照ピクチャを含むことを特徴としている。
また、上記画像復号装置において、参照ピクチャリストを導出するRPL導出部を備え、上記RPL導出部は、上記第一のサブRPSが上記第二のサブRPSに較べてリスト前方に位置する暫定参照リストを少なくとも一つ生成し、該暫定参照リストに基づいて上記参照ピクチャリストを導出することが好ましい。
また、上記RPS導出部は、上記参照ピクチャセットを構成するサブRPSとして、さらに、前方短期RPS、後方短期RPSを導出し、上記RPL導出部は、上記第二のサブRPSを、上記、前方短期RPS、後方短期RPSよりも後方に位置する暫定参照リストを少なくとも一つ生成し、該暫定参照リストに基づいて上記参照ピクチャリストを導出する、ことが好ましい。
また、上記画像復号装置において、上記第一のサブRPSは、関連付けられた依存タイプが、画素依存かつ動き依存を示し、上記第二のサブRPSは、関連付けられた依存タイプが、画素非依存かつ動き依存を示す、ことが好ましい。
また、上記画像復号装置において、上記暫定参照リスト内のサブRPS順序に係るサブRPS順序情報を復号する可変長復号部を備え、上記RPL導出部は、上記サブRPS順序情報に基づいて、上記暫定参照リストを生成する、ことが好ましい。
また、上記画像復号装置において、上記サブRPS順序情報は、複数のピクチャから参照可能であるパラメータセットに含まれている、ことが好ましい。
また、上記画像復号装置において、上記サブRPS順序情報は、レイヤ間サブRPSを上記暫定参照リストの先頭に設定するか否かを示すフラグを含む、ことが好ましい。
また、上記画像復号装置において、上記サブRPS順序情報は、上記第一のサブRPSと上記第二のサブRPSの暫定参照リスト内での位置として、既定の暫定参照リスト内での位置を用いるか、既定の暫定参照リスト内での位置に対して上記第一のサブRPSと上記第二のサブRPSを入れ替えた位置を用いるかを示すフラグを含む、ことが好ましい。
上記課題を解決するために、本発明に係る画像符号化装置は、入力画像から上位レイヤの符号化データを生成する画像符号化装置であって、参照ピクチャセットを導出するRPS導出部を備え、上記RPS導出部は、上記参照ピクチャセットを構成するサブRPSとして、少なくとも第一のサブRPSと、第二のサブRPSを導出し、上記第一のサブRPSは、復号画素が参照される可能性のあるレイヤ間参照ピクチャを含み、上記第二のサブRPSは、復号画素が参照される可能性のないレイヤ間参照ピクチャを含むことを特徴としている。
本発明に係る画像復号装置はRPS導出部を備えており、前記RPS導出部は、復号画素が参照される可能性のあるレイヤ間参照ピクチャを含む第一のサブRPSと、復号画素が参照される可能性のないレイヤ間参照ピクチャを含む第二のサブRPSを導出する。また、本発明に係る階層動画像復号装置は、RPL導出部を備えており、前記RPL導出部は、前記第一のサブRPSが前記第二のサブRPSに較べてリスト先頭に近い位置にある暫定参照リストを生成し、当該暫定参照リストに基づいて参照リストを生成する。したがって、本発明に係る画像復号装置は、レイヤ間予測における選択頻度の高いレイヤ間参照ピクチャである上記第一のRPSに含まれるレイヤ間参照ピクチャを指定する参照ピクチャインデックスが少ない符号量で符号化された符号化データを復号できる。
本発明の一実施形態に係る階層動画像復号装置において生成されるレイヤ間RPSに含まれるサブRPS(レイヤ間画素RPSとレイヤ間動き限定RPS)と依存タイプの関係を例示する図である。 本発明の実施形態に係る階層符号化データのレイヤ構造を説明するための図であって、(a)は、階層動画像符号化装置側について示しており、(b)は、階層動画像復号装置側について示している。 本発明の実施形態に係る階層符号化データの構成を説明するための図であって、(a)は、シーケンスSEQを規定するシーケンスレイヤを示しており、(b)は、ピクチャPICTを規定するピクチャレイヤを示しており、(c)は、スライスSを規定するスライスレイヤを示しており、(d)は、符号化ツリーユニットCTUを規定するCTUレイヤを示しており、(e)は、符号化ツリーユニットCTUに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示している。 上記階層動画像復号装置の概略的構成を示す機能ブロック図である。 上記階層動画像復号装置に含まれる復号ピクチャ管理部の構成を例示した機能ブロック図である。 上記階層動画像復号装置の可変長復号部からSPS復号時に利用されるシンタックス表の一部であって、参照ピクチャセットおよび参照ピクチャリストに係る部分を示す図である。 上記階層動画像復号装置の可変長復号部から短期参照ピクチャセット情報の復号時に利用されるシンタックス表を示す図である。 上記階層動画像復号装置の可変長復号部からスライスヘッダ復号時に利用されるシンタックス表の一部であって、参照ピクチャセットに係る部分を示す図である。 VPSに含まれるVPS拡張(vps_extension)の復号時に参照されるシンタックス表の一部であって、IL-RPS情報に相当する部分を示す図である。 スライス復号時に参照されるシンタックス表の一部であって、IL-RPS情報に相当する部分を示す図である。 レイヤ間予測の種類にレイヤ間画像予測とレイヤ間動き予測がある場合の依存タイプと各レイヤ間予測の使用可否の関係を示す図である。 レイヤ間RPSに含まれるサブRPS(レイヤ間画素RPSとレイヤ間動き限定RPS)の導出処理を表わすフロー図である。 上記階層動画像復号装置の可変長復号部からスライスヘッダ復号時に利用されるシンタックス表の一部であって、参照ピクチャリストに係る部分を示す図である。 上記階層動画像復号装置の可変長復号部から参照ピクチャリスト修正情報の復号時に利用されるシンタックス表を示す図である。 上記階層動画像復号装置のRPL導出部におけるL0参照リストとL1参照リスト導出の中間過程で生成される暫定L0参照リストと暫定L1参照リストの概略を示す図である。 上記階層動画像復号装置に含まれるベース復号部の構成を例示する機能ブロック図である。 レイヤ間画素動きRPSとレイヤ間限定RPSを例示する図である。 レイヤ間画素動きRPSとレイヤ間画素限定RPSとレイヤ間動き限定RPSを例示する図である。 参照レイヤに対応する視点位置と対象レイヤに対する視点位置の相対関係によるサブRPSの分類と、依存タイプに基づくサブRPSの分類を組み合わせる場合のサブRPSを例示する図である。 レイヤ間サブRPS先頭フラグが「1」の場合に生成される暫定参照リストを例示する図である。 レイヤ間サブRPS順序交換フラグが「1」の場合に生成される暫定参照リストを例示する図である。 レイヤ間サブRPS順序情報の復号に係るシンタックス表の一部を示す図である。 本発明の一実施形態に係る階層動画像符号化装置の概略的構成を示す機能ブロック図である。 上記階層動画像符号化装置を搭載した送信装置、および、上記階層動画像復号装置を搭載した受信装置の構成を示した図である。(a)は、階層動画像符号化装置を搭載した送信装置を示しており、(b)は、階層動画像復号装置を搭載した受信装置を示している。 上記階層動画像符号化装置を搭載した記録装置、および、上記階層動画像復号装置を搭載した再生装置の構成を示した図である。(a)は、階層動画像符号化装置を搭載した記録装置を示しており、(b)は、階層動画像復号装置を搭載した再生装置を示している。
図1〜図25に基づいて、本発明の一実施形態に係る階層動画像復号装置1および階層動画像符号化装置2を説明すれば以下のとおりである。
〔概要〕
本実施の形態に係る階層動画像復号装置(画像復号装置)1は、階層動画像符号化装置(画像符号化装置)2によって階層符号化された符号化データを復号する。階層符号化とは、動画像を低品質のものから高品質のものにかけて階層的に符号化する符号化方式のことである。階層符号化は、例えば、SVCやSHVCにおいて標準化されている。なお、ここでいう動画像の品質とは、主観的および客観的な動画像の見栄えに影響する要素のことを広く意味する。動画像の品質には、例えば、“解像度”、“フレームレート”、“画質”、および、“画素の表現精度”が含まれる。よって、以下、動画像の品質が異なるといえば、例示的には、“解像度”等が異なることを指すが、これに限られない。例えば、異なる量子化ステップで量子化された動画像の場合(すなわち、異なる符号化雑音により符号化された動画像の場合)も互いに動画像の品質が異なるといえる。
また、階層符号化技術は、階層化される情報の種類の観点から、(1)空間スケーラビリティ、(2)時間スケーラビリティ、(3)SNR(Signal to Noise Ratio)スケーラビリティ、および(4)ビュースケーラビリティに分類されることもある。空間スケーラビリティとは、解像度や画像のサイズにおいて階層化する技術である。時間スケーラビリティとは、フレームレート(単位時間のフレーム数)において階層化する技術である。SNRスケーラビリティは、符号化雑音において階層化する技術である。また、ビュースケーラビリティは、各画像に対応付けられた視点位置において階層化する技術である。
本実施形態に係る階層動画像符号化装置2及び階層動画像復号装置1の詳細な説明に先立って、まず(1)階層動画像符号化装置2によって生成され、階層動画像復号装置1によって復号される階層符号化データのレイヤ構造を説明し、次いで(2)各レイヤで採用できるデータ構造の具体例について説明を行う。
〔階層符号化データのレイヤ構造〕
ここで、図2を用いて、階層符号化データの符号化および復号について説明すると次のとおりである。図2は、動画像を、下位階層L3、中位階層L2、および上位階層L1の3階層により階層的に符号化/復号する場合について模式的に表す図である。つまり、図2(a)および(b)に示す例では、3階層のうち、上位階層L1が最上位層となり、下位階層L3が最下位層となる。
以下において、階層符号化データから復号され得る特定の品質に対応する復号画像は、特定の階層の復号画像(または、特定の階層に対応する復号画像)と称される(例えば、上位階層L1の復号画像POUT#A)。
図2(a)は、入力画像PIN#A〜PIN#Cをそれぞれ階層的に符号化して符号化データDATA#A〜DATA#Cを生成する階層動画像符号化装置2#A〜2#Cを示している。図2(b)は、階層的に符号化された符号化データDATA#A〜DATA#Cをそれぞれ復号して復号画像POUT#A〜POUT#Cを生成する階層動画像復号装置1#A〜1#Cを示している。
まず、図2(a)を用いて、符号化装置側について説明する。符号化装置側の入力となる入力画像PIN#A、PIN#B、およびPIN#Cは、原画は同じだが、画像の品質(解像度、フレームレート、および画質等)が異なる。画像の品質は、入力画像PIN#A、PIN#B、およびPIN#Cの順に低くなる。
下位階層L3の階層動画像符号化装置2#Cは、下位階層L3の入力画像PIN#Cを符号化して下位階層L3の符号化データDATA#Cを生成する。下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報が含まれる(図2において“C”にて示している)。下位階層L3は、最下層の階層であるため、下位階層L3の符号化データDATA#Cは、基本符号化データとも称される。
また、中位階層L2の階層動画像符号化装置2#Bは、中位階層L2の入力画像PIN#Bを、下位階層の符号化データDATA#Cを参照しながら符号化して中位階層L2の符号化データDATA#Bを生成する。中位階層L2の符号化データDATA#Bには、符号化データDATA#Cに含まれる基本情報“C”に加えて、中位階層の復号画像POUT#Bを復号するのに必要な付加的情報(図2において“B”にて示している)が含まれる。
また、上位階層L1の階層動画像符号化装置2#Aは、上位階層L1の入力画像PIN#Aを、中位階層L2の符号化データDATA#Bを参照しながら符号化して上位階層L1の符号化データDATA#Aを生成する。上位階層L1の符号化データDATA#Aには、下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報“C”および中位階層L2の復号画像POUT#Bを復号するのに必要な付加的情報“B”に加えて、上位階層の復号画像POUT#Aを復号するのに必要な付加的情報(図2において“A”にて示している)が含まれる。
このように上位階層L1の符号化データDATA#Aは、異なる複数の品質の復号画像に関する情報を含む。
次に、図2(b)を参照しながら復号装置側について説明する。復号装置側では、上位階層L1、中位階層L2、および下位階層L3それぞれの階層に応じた復号装置1#A、1#B、および1#Cが、符号化データDATA#A、DATA#B、およびDATA#Cを復号して復号画像POUT#A、POUT#B、およびPOUT#Cを出力する。
なお、上位の階層符号化データの一部の情報を抽出して、より下位の特定の復号装置において、当該抽出した情報を復号することで特定の品質の動画像を再生することもできる。
例えば、中位階層L2の階層復号装置1#Bは、上位階層L1の階層符号化データDATA#Aから、復号画像POUT#Bを復号するのに必要な情報(すなわち、階層符号化データDATA#Aに含まれる“B”および“C”)を抽出して、復号画像POUT#Bを復号してもよい。言い換えれば、復号装置側では、上位階層L1の階層符号化データDATA#Aに含まれる情報に基づいて、復号画像POUT#A、POUT#B、およびPOUT#Cを復号できる。
なお、以上の3階層の階層符号化データに限られず、階層符号化データは、2階層で階層符号化されていてもよいし、3階層よりも多い階層数にて階層符号化されていてもよい。
また、特定の階層の復号画像に関する符号化データの一部または全部を他の階層とは独立して符号化し、特定の階層の復号の際に、他の階層の情報を参照しなくても済むように階層符号化データを構成してもよい。例えば、図2(a)および(b)を用いて上述した例では、復号画像POUT#Bの復号に“C”および“B”を参照すると説明したが、これに限られない。復号画像POUT#Bが“B”だけを用いて復号できるように階層符号化データを構成することも可能である。例えば、復号画像POUT#Bの復号に、“B”だけから構成される階層符号化データと、復号画像POUT#Cを入力とする階層動画像復号装置も構成できる。
なお、SNRスケーラビリティを実現する場合、入力画像PIN#A、PIN#B、およびPIN#Cとして同一の原画を用いた上で、復号画像POUT#A、POUT#B、およびPOUT#Cが異なる画質となるよう階層符号化データを生成することもできる。その場合、下位階層の階層動画像符号化装置が、上位階層の階層動画像符号化装置に較べて、より大きい量子化幅を用いて予測残差を量子化することで階層符号化データを生成する。
本書では、説明の便宜上、次のとおり用語を定義する。以下の用語は、特に断りがなければ、下記の技術的事項のことを表わすのに用いる。
上位レイヤ : ある階層よりも上位に位置する階層のことを、上位レイヤと称する。例えば、図2において、下位階層L3の上位レイヤは、中位階層L2および上位階層L1である。また、上位レイヤの復号画像とは、より品質の高い(例えば、解像度が高い、フレームレートが高い、画質が高い等)復号画像のことをいう。
下位レイヤ : ある階層よりも下位に位置する階層のことを、下位レイヤと称する。例えば、図2において、上位階層L1の下位レイヤは、中位階層L2および下位階層L3である。また、下位レイヤの復号画像とは、より品質の低い復号画像のことをいう。
対象レイヤ : 復号または符号化の対象となっている階層のことをいう。
参照レイヤ(reference layer) : 対象レイヤに対応する復号画像を復号するのに参照される特定の下位レイヤのことを参照レイヤと称する。
図2(a)および(b)に示した例では、上位階層L1の参照レイヤは、中位階層L2および下位階層L3である。しかしながら、これに限られず、特定の上記レイヤの復号において、下位レイヤのすべてを参照しなくてもよいように階層符号化データを構成することもできる。例えば、上位階層L1の参照レイヤが、中位階層L2および下位階層L3のいずれか一方となるように階層符号化データを構成することも可能である。
基本レイヤ(base layer) : 最下層に位置する階層のことを基本レイヤと称する。基本レイヤの復号画像は、符号化データから復号され得るもっとも低い品質の復号画像であり、基本復号画像と呼称される。別の言い方をすれば、基本復号画像は、最下層の階層に対応する復号画像のことである。基本復号画像の復号に必要な階層符号化データの部分符号化データは基本符号化データと呼称される。例えば、上位階層L1の階層符号化データDATA#Aに含まれる基本情報“C”が基本符号化データである。
拡張レイヤ : 基本レイヤの上位レイヤは、拡張レイヤと称される。
レイヤ識別子 : レイヤ識別子は、階層を識別するためのものであり、階層と1対1に対応する。階層符号化データには特定の階層の復号画像の復号に必要な部分符号化データを選択するために用いられる階層識別子が含まれる。特定のレイヤに対応するレイヤ識別子に関連付けられた階層符号化データの部分集合は、レイヤ表現とも呼称される。
一般に、特定の階層の復号画像の復号には、当該階層のレイヤ表現、および/または、当該階層の下位レイヤに対応するレイヤ表現が用いられる。すなわち、対象レイヤの復号画像の復号においては、対象レイヤのレイヤ表現、および/または、対象レイヤの下位レイヤに含まれる1つ以上階層のレイヤ表現が用いられる。
レイヤ間予測 : レイヤ間予測とは、対象レイヤのレイヤ表現と異なる階層(参照レイヤ)のレイヤ表現に含まれるシンタックス要素値、シンタックス要素値より導出される値、および復号画像に基づいて、対象レイヤのシンタックス要素値や対象レイヤの復号に用いられる符号化パラメータ等を予測することである。動き予測に関する情報を参照レイヤの情報から予測するレイヤ間予測のことを動き情報予測と称することもある。また、下位レイヤの復号画像から予測するレイヤ間予測のことをレイヤ間画像予測(あるいはレイヤ間テクスチャ予測)と称することもある。なお、レイヤ間予測に用いられる階層は、例示的には、対象レイヤの下位レイヤである。また、参照レイヤを用いず対象レイヤ内で予測を行うことをレイヤ内予測と称することもある。
なお、以上の用語は、飽くまで説明の便宜上のものであり、上記の技術的事項を別の用語にて表現してもかまわない。
〔階層符号化データのデータ構造について〕
以下、各階層の符号化データを生成する符号化方式として、HEVCおよびその拡張方式を用いる場合について例示する。しかしながら、これに限られず、各階層の符号化データを、MPEG-2や、H.264/AVCなどの符号化方式により生成してもよい。
また、下位レイヤと上位レイヤとが異なる符号化方式によって符号化されていてもよい。また、各階層の符号化データは、互いに異なる伝送路を介して階層動画像復号装置1に供給されてもよいし、同一の伝送路を介して階層動画像復号装置1に供給されてもよい。
例えば、超高精細映像(動画像、4K映像データ)を基本レイヤおよび1つの拡張レイヤによりスケーラブル符号化して伝送する場合、基本レイヤは、4K映像データをダウンスケーリングし、インタレース化した映像データをMPEG-2またはH.264/AVCにより符号化してテレビ放送網で伝送し、拡張レイヤは、4K映像(プログレッシブ)をHEVCにより符号化して、インターネットで伝送してもよい。
(基本レイヤ)
図3は、基本レイヤにおいて採用できる符号化データ(図2の例でいえば、階層符号化データDATA#C)のデータ構造を例示する図である。階層符号化データDATA#Cは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。
階層符号化データDATA#Cにおけるデータの階層構造を図3に示す。図3の(a)〜(e)は、それぞれ、シーケンスSEQを規定するシーケンスレイヤ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、符号化ツリーユニット(Coding Tree Unit;CTU)を規定するCTUレイヤ、符号化ツリーユニットCTUに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示す図である。
(シーケンスレイヤ)
シーケンスレイヤでは、処理対象のシーケンスSEQ(以下、対象シーケンスとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。シーケンスSEQは、図3の(a)に示すように、ビデオパラメータセットVPS(Video Parameter Set)、シーケンスパラメータセットSPS(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、ピクチャPICT〜PICTNP(NPはシーケンスSEQに含まれるピクチャの総数)、及び、付加拡張情報SEI(Supplemental Enhancement Information)を含んでいる。
ビデオパラメータセットVPSでは、符号化データに含まれるレイヤ数、レイヤ間の依存関係が規定されている。
シーケンスパラメータセットSPSでは、対象シーケンスを復号するために階層動画像復号装置1が参照する符号化パラメータの集合が規定されている。SPSは符号化データ内に複数存在してもよい。その場合、対象シーケンス毎に復号に用いられるSPSが複数の候補から選択される。特定シーケンスの復号に使用されるSPSは、アクティブSPSとも呼ばれる。以下では、特に断りがなければ、対象シーケンスに対するアクティブSPSを意味する。
ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために階層動画像復号装置1が参照する符号化パラメータの集合が規定されている。なお、PPSは符号化データ内に複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。特定ピクチャの復号に使用されるPPSはアクティブPPSとも呼ばれる。以下では、特に断りがなければ、PPSは対象ピクチャに対するアクティブPPSを意味する。
(ピクチャレイヤ)
ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。ピクチャPICTは、図3の(b)に示すように、スライスヘッダSH1〜SHNS、及び、スライスS1〜SNSを含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
なお、以下、スライスヘッダSH1〜SHNSやスライスS1〜SNSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する階層符号化データDATA#Cに含まれるデータであって、添え字を付している他のデータも同様である。
スライスヘッダSHkには、対応するスライスSkの復号方法を決定するために階層動画像復号装置1が参照する符号化パラメータ群が含まれている。例えば、SPSを指定するSPS識別子(seq_parameter_set_id)や、PPSを指定するPPS識別子(pic_parameter_set_id)が含まれる。また、スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、又は、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、又は、イントラ予測を用いるBスライスなどが挙げられる。
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。スライスSは、図3の(c)に示すように、符号化ツリーユニットCTU1〜CTUNC(NCはスライスSに含まれるCTUの総数)を含んでいる。
(CTUレイヤ)
CTUレイヤでは、処理対象の符号化ツリーユニットCTU(以下、対象CTUとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。なお、符号化ツリーユニットのことを符号化ツリーブロック(CTB: Coding Tree block)、または、最大符号化単位(LCU:Largest Cording Unit)と呼ぶこともある。
符号化ツリーユニットCTUは、CTUヘッダCTUHと、符号化単位情報CU〜CUNL(NLはCTUに含まれる符号化単位情報の総数)とを含む。ここで、まず、符号化ツリーユニットCTUと、符号化単位情報CUとの関係について説明すると次のとおりである。
符号化ツリーユニットCTUは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するための単位に分割される。
符号化ツリーユニットCTUの上記単位は、再帰的な4分木分割により分割されている。この再帰的な4分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。
以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応する単位を、符号化ノード(coding node)として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。
つまり、符号化単位情報(以下、CU情報と称する)CU〜CUNLは、符号化ツリーユニットCTUを再帰的に4分木分割して得られる各符号化ノード(符号化単位)に対応する情報である。
また、符号化ツリーのルート(root)は、符号化ツリーユニットCTUに対応付けられる。換言すれば、符号化ツリーユニットCTUは、複数の符号化ノードを再帰的に含む4分木分割の木構造の最上位ノードに対応付けられる。
なお、各符号化ノードのサイズは、当該符号化ノードの親ノードとなる符号化ノード(すなわち、当該符号化ノードの1階層上位のノード)のサイズの縦横とも半分である。
また、符号化ツリーユニットCTUのサイズ、および、各符号化ユニットのとり得るサイズは、シーケンスパラメータセットSPSに含まれる、最小符号化ノードのサイズ指定情報、および最大符号化ノードと最小符号化ノードの階層深度の差分に依存する。例えば、最小符号化ノードのサイズが8×8画素であって、最大符号化ノードと最小符号化ノードの階層深度の差分が3である場合、符号化ツリーユニットCTUのサイズが64×64画素であって、符号化ノードのサイズは、4種類のサイズ、すなわち、64×64画素、32×32画素、16×16画素、および、8×8画素の何れかをとり得る。
(CTUヘッダ)
CTUヘッダCTUHには、対象CTUの復号方法を決定するために階層動画像復号装置1が参照する符号化パラメータが含まれる。具体的には、図3の(d)に示すように、対象CTUの各CUへの分割パターンを指定するCTU分割情報SP_CTU、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
CTU分割情報SP_CTUは、CTUを分割するための符号化ツリーを表す情報であり、具体的には、対象CTUに含まれる各CUの形状、サイズ、および、対象CTU内での位置を指定する情報である。
なお、CTU分割情報SP_CTUは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばCTU分割情報SP_CTUは、対象CTU全体またはCTUの部分領域を四分割するか否かを示すフラグの集合であってもよい。その場合、CTUの形状やサイズを併用することで各CUの形状やサイズを特定できる。
また、量子化パラメータ差分Δqpは、対象CTUにおける量子化パラメータqpと、当該対象CTUの直前に符号化されたCTUにおける量子化パラメータqp’との差分qp−qp’である。
(CUレイヤ)
CUレイヤでは、処理対象のCU(以下、対象CUとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。
ここで、CU情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー(prediction tree;PT)および変換ツリー(transform tree;TT)のルートのノードとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。
予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。換言すれば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。
予測ツリーにおける分割(以下、PU分割と略称する)の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との2つがある。
イントラ予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)と、N×Nとがある。
また、インター予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)、2N×N、2N×nU、2N×nD、N×2N、nL×2N、および、nR×2Nなどがある。
また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。換言すれば、変換ブロックは、符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
変換ツリーにおける分割には、符号化ノードと同一のサイズの領域を変換ブロックとして割り付けるものと、上述したツリーブロックの分割と同様、再帰的な4分木分割によるものがある。
変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。
(CU情報のデータ構造)
続いて、図3(e)を参照しながらCU情報CUに含まれるデータの具体的な内容を説明する。図3(e)に示すように、CU情報CUは、具体的には、スキップフラグSKIP、予測ツリー情報(以下、PT情報と略称する)PTI、および、変換ツリー情報(以下、TT情報と略称する)TTIを含む。
スキップフラグSKIPは、対象のPUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、そのCU情報CUにおけるPT情報PTIの一部、および、TT情報TTIは省略される。なお、スキップフラグSKIPは、Iスライスでは省略される。
[PT情報]
PT情報PTIは、CUに含まれる予測ツリー(以下、PTと略称する)に関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合であり、階層動画像復号装置1により予測画像を生成する際に参照される。PT情報PTIは、図3(e)に示すように、予測タイプ情報PType、および、予測情報PInfoを含んでいる。
予測タイプ情報PTypeは、対象PUについての予測画像生成方法を指定する情報である。ベースレイヤにおいては、イントラ予測を用いるのか、または、インター予測を用いるのかを指定する情報である。
予測情報PInfoは、予測タイプ情報PTypeで指定される予測方法において用いられる予測情報である。ベースレイヤにおいては、イントラ予測の場合にイントラ予測情報PP_Intraが含まれる。また、インター予測の場合にはインター予測情報PP_Interを含む。
インター予測情報PP_Interは、階層動画像復号装置1が、インター予測によってインター予測画像を生成する際に参照される予測情報を含む。より具体的には、インター予測情報PP_Interは、対象CUの各インターPUへの分割パターンを指定するインターPU分割情報、および、各インターPUについてのインター予測パラメータ(動き補償パラメータ)を含む。インター予測パラメータとしては、例えば、マージフラグ(merge_flag)、マージインデックス(merge_idx)、推定動きベクトルインデックス(mvp_idx)、参照ピクチャインデックス(ref_idx)、インター予測フラグ(inter_pred_flag)、および動きベクトル残差(mvd)を含む。
イントラ予測情報PP_Intraは、階層動画像復号装置1が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータを含む。より具体的には、イントラ予測情報PP_Intraには、対象CUの各イントラPUへの分割パターンを指定するイントラPU分割情報、および、各イントラPUについてのイントラ予測パラメータが含まれる。イントラ予測パラメータは、各イントラPUについてのイントラ予測方法(予測モード)を指定するためのパラメータである。
ここで、イントラ予測パラメータは、各イントラPUについてのイントラ予測(予測モード)を復元するためのパラメータである。予測モードを復元するためのパラメータには、MPM(Most Probable Mode、以下同様)に関するフラグであるmpm_flag、MPMを選択するためのインデックスであるmpm_idx、および、MPM以外の予測モードを指定するためのインデックスであるrem_idxが含まれる。ここで、MPMとは、対象パーティションで選択される可能性が高い推定予測モードである。例えば、対象パーティションの周辺のパーティションに割り付けられた予測モードに基づいて推定された推定予測モードや、一般的に発生確率の高いDCモードやPlanarモードがMPMに含まれ得る。
また、以下において、単に“予測モード”と表記する場合、特にことわりのない限り、輝度予測モードのことを指すものとする。色差予測モードについては、“色差予測モード”と表記し、輝度予測モードと区別する。また、予測モードを復元するパラメータには、色差予測モードを指定するためのパラメータであるchroma_modeが含まれる。
[TT情報]
TT情報TTIは、CUに含まれる変換ツリー(以下、TTと略称する)に関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数の変換ブロックそれぞれに関する情報の集合であり、階層動画像復号装置1により残差データを復号する際に参照される。
TT情報TTIは、図3(e)に示すように、対象CUの各変換ブロックへの分割パターンを指定するTT分割情報SP_TT、および、量子化予測残差QD1〜QDNT(NTは、対象CUに含まれるブロックの総数)を含んでいる。
TT分割情報SP_TTは、具体的には、対象CUに含まれる各変換ブロックの形状、および、対象CU内での位置を決定するための情報である。例えば、TT分割情報SP_TTは、対象ノードの分割を行うのか否かを示す情報(split_transform_unit_flag)と、その分割の深度を示す情報(trafoDepth)とから実現できる。
また、例えば、CUサイズが、64×64の場合、分割により得られる各変換ブロックは、32×32画素から4×4画素までのサイズをとり得る。
各量子化予測残差QDは、階層動画像符号化装置2が以下の処理1〜3を、処理対象の変換ブロックである対象ブロックに施すことによって生成した符号化データである。
処理1:符号化対象画像から予測画像を減算した予測残差を周波数変換(例えば、DCT変換(Discrete Cosine Transform)およびDST変換(Discrete Sine Transform)等)する;
処理2:処理1にて得られた変換係数を量子化する;
処理3:処理2にて量子化された変換係数を可変長符号化する;
なお、上述した量子化パラメータqpは、階層動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2qp/6)。
(PU分割情報)
PU分割情報によって指定されるPU分割タイプには、対象CUのサイズを2N×2N画素とすると、次の合計8種類のパターンがある。すなわち、2N×2N画素、2N×N画素、N×2N画素、およびN×N画素の4つの対称的分割(symmetric splittings)、並びに、2N×nU画素、2N×nD画素、nL×2N画素、およびnR×2N画素の4つの非対称的分割(asymmetric splittings)である。なお、N=2(mは1以上の任意の整数)を意味している。以下、対象CUを分割して得られる予測単位のことを予測ブロック、または、パーティションと称する。
(拡張レイヤ)
拡張レイヤのレイヤ表現に含まれる符号化データ(以下、拡張レイヤ符号化データ)についても、例えば、図3に示すデータ構造とほぼ同様のデータ構造を採用できる。ただし、拡張レイヤ符号化データでは、以下のとおり、付加的な情報を追加したり、パラメータを省略できる。
スライスレイヤでは、空間スケーラビリティ、時間スケーラビリティ、および、SNRスケーラビリティ、ビュースケーラビリティの階層の識別情報(それぞれ、dependency_id、temporal_id、quality_id、および、view_id)が符号化されていてもよい。
また、CU情報CUに含まれる予測タイプ情報PTypeは、対象CUについての予測画像生成方法がイントラ予測、インター予測、または、レイヤ間画像予測のいずれかを指定する情報である。予測タイプ情報PTypeには、レイヤ間画像予測モードの適用有無を指定するフラグ(レイヤ間画像予測フラグ)を含む。なお、レイヤ間画像予測フラグは、texture_rl_flag、inter_layer_pred_flag、または、base_mode_flagと呼ばれることもある。
拡張レイヤにおいて、対象CUのCUタイプが、イントラCU、レイヤ間CU、インターCU、スキップCUのいずれであるかが指定されていてもよい。
イントラCUは、ベースレイヤにおけるイントラCUと同様に定義できる。イントラCUでは、レイヤ間画像予測フラグが“0”に、予測モードフラグが“0”に設定される。
レイヤ間CUは、参照レイヤのピクチャの復号画像を予測画像生成に用いるCUと定義できる。レイヤ間CUでは、レイヤ間画像予測フラグが“1”に、予測モードフラグが“0”に設定される。
スキップCUは、上述のHEVC方式の場合と同様に定義できる。例えば、スキップCUでは、スキップフラグに“1”が設定される。
インターCUは、非スキップかつ動き補償(MC;Motion Compensation)を適用するCUと定義されていてもよい。インターCUでは、例えば、スキップフラグに“0”が設定され、予測モードフラグに“1”が設定される。
また、上述のとおり拡張レイヤの符号化データを、下位レイヤの符号化方式と異なる符号化方式により生成しても構わない。すなわち、拡張レイヤの符号化・復号処理は、下位レイヤのコーデックの種類に依存しない。
下位レイヤが、例えば、MPEG-2や、H.264/AVC方式によって符号化されていてもよい。
拡張レイヤ符号化データでは、VPSが拡張されて、レイヤ間の参照構造を表すパラメータが含まれていてもよい。
また、拡張レイヤ符号化データでは、SPS、PPS、スライスヘッダが拡張されて、レイヤ間画像予測に用いる参照レイヤの復号画像に係る情報(例えば、後述のレイヤ間参照ピクチャセット、レイヤ間参照ピクチャリスト、ベース制御情報等を直接、または、間接的に導出するためのシンタックス)が含まれていてもよい。
なお、以上に説明したパラメータは、単独で符号化されていてもよいし、複数のパラメータが複合的に符号化されていてもよい。複数のパラメータが複合的に符号化される場合は、そのパラメータの値の組み合わせに対してインデックスが割り当てられ、割り当てられた当該インデックスが符号化される。また、パラメータが、別のパラメータや、復号済みの情報から導出可能であれば、当該パラメータの符号化を省略できる。
〔階層動画像復号装置〕
以下では、本実施形態に係る階層動画像復号装置1の構成について、図1〜図22を参照して説明する。
(階層動画像復号装置の構成)
図4を用いて、階層動画像復号装置1の概略的構成を説明すると次のとおりである。図4は、階層動画像復号装置1の概略的構成を示した機能ブロック図である。階層動画像復号装置1は、階層動画像符号化装置2から供給される階層符号化データDATAを復号して、対象レイヤの復号画像POUT#Tを生成する。なお、以下では、対象レイヤは拡張レイヤであるとして説明する。そのため、対象レイヤは、参照レイヤに対する上位レイヤでもある。逆に、参照レイヤは、対象レイヤに対する下位レイヤでもある。
図4に示すように階層動画像復号装置1は、NAL逆多重化部11、可変長復号部12、ピクチャ復号部13、復号ピクチャ管理部14、および、ベース復号部15を備える。
NAL逆多重化部11は、NAL(Network Abstraction Layer)におけるNALユニット単位で伝送される階層符号化データDATAを逆多重化する。
NALは、VCL(Video Coding Layer)と、符号化データを伝送・蓄積する下位システムとの間における通信を抽象化するために設けられる層である。
VCLは、動画像符号化処理を行う層のことであり、VCLにおいて符号化が行われる。一方、ここでいう、下位システムは、H.264/AVCおよびHEVCのファイルフォーマットや、MPEG-2システムに対応する。
なお、NALでは、VCLで生成されたビットストリームが、NALユニットという単位で区切られて、宛先となる下位システムへ伝送される。NALユニットには、VCLで符号化された符号化データ、および、当該符号化データが宛先の下位システムに適切に届けられるためのヘッダが含まれる。また、各階層における符号化データは、NALユニット格納されることでNAL多重化されて階層動画像復号装置1に伝送される。
NAL逆多重化部11は、階層符号化データDATAを逆多重化して、対象レイヤ符号化データDATA#Tおよび参照レイヤ符号化データDATA#Rを取り出す。また、NAL逆多重化部11は、対象レイヤ符号化データDATA#Tを可変長復号部12に供給するとともに、参照レイヤ符号化データDATA#Rをベース復号部15に供給する。
可変長復号部12は、対象レイヤ符号化データDATA#Tに含まれるバイナリから各種のシンタックス値を復号して出力する。
可変長復号部12で復号されるシンタックス値には、変換係数や予測情報に係るシンタックス値が含まれる。
また、可変長復号部12で復号されるシンタックス値には、対象レイヤの復号に用いるパラメータセット、すなわち、VPS、SPS、PPSに含まれるシンタックス値が含まれる。また、スライスヘッダに含まれるシンタックス値も含まれる。
可変長復号部12は、スライスヘッダ、予測情報、および、変換係数に係るシンタックス値をピクチャ復号部13に供給する。また、可変長復号部12は、パラメータセット、および、スライスヘッダに係るシンタックス値を復号ピクチャ管理部14に供給する。
ピクチャ復号部13は、対象ピクチャに関するスライスヘッダ、予測情報、および、変換係数に係るシンタックス値に基づいて、対象ピクチャの復号ピクチャを復号する。復号ピクチャは復号ピクチャ管理部14に出力される。
なお、ピクチャ復号部13におけるインター予測による予測画像生成には、復号ピクチャ管理部14内のDPBに記録されている復号ピクチャであって、入力される参照ピクチャリストに含まれるピクチャが参照ピクチャとして利用される。また、ピクチャ復号部13におけるレイヤ間画像予測による予測画像生成には、復号ピクチャ管理部14内のDPBに記録されているレイヤ間参照ピクチャであって、入力される参照ピクチャリストに含まれるピクチャが参照ピクチャとして利用される。
復号ピクチャ管理部14は、入力される復号ピクチャやベース復号ピクチャを内部のDPBに記録するとともに、入力されるシンタックス値に基づいて参照ピクチャリスト生成や出力ピクチャ決定を行う。なお、復号ピクチャ管理部14は本実施形態における重要な構成要素であるため、詳細を後述する。
ベース復号部15は、参照レイヤ符号化データDATA#Rからベース復号ピクチャを復号する。ベース復号ピクチャは、対象レイヤの復号ピクチャ復号時に利用される参照レイヤの復号ピクチャである。ベース復号部15は、復号したベース復号ピクチャを復号ピクチャ管理部14に供給する。なお、ベース復号部15の詳細は後述する。
以下では、復号ピクチャ管理部14とベース復号部15の詳細を説明する。
(復号ピクチャ管理部)
図5を用いて、復号ピクチャ管理部14の詳細構成を説明する。図5は、復号ピクチャ管理部14の構成を例示した機能ブロック図である。
図5に示すように、復号ピクチャ管理部14は、DPB141、RPS導出部142、参照ピクチャ制御部143、ベース参照ピクチャ制御部144、RPL導出部145、出力制御部146を備える。
<DPB141>
DPB141は、復号ピクチャバッファ(Decoded Picture Buffer)とも呼ばれ、ピクチャ復号部13で復号された対象レイヤの各ピクチャの復号ピクチャを記録する。DPBには、対象レイヤの各ピクチャに対応する復号ピクチャが出力順(POC: Picture Order Count)に関連付けて記録されている。加えて、DPBの各ピクチャに対しては、参照マークおよび出力マークを設定できる。
参照マークは、DPB上のピクチャが対象ピクチャ以降の復号処理における予測画像生成処理(例えば、インター予測やレイヤ間画像予測)への利用可否を示す情報である。参照マークは、具体的には、「短期参照使用」(「used for short-term reference」)、「長期参照使用」(「used for long-term reference」)、「参照不使用」(「not used for reference」)のいずれかの値を取る。
なお、参照マークの取り得る値を上記とするがそれに限らない。例えば、「レイヤ間参照使用」(「used for inter-layer reference」)の値に参照マークを設定できてもよい。また、「短期参照使用」と「長期参照使用」の区別をせず、両者の和集合を「参照使用」(「used for reference」)と定義してもよい。
出力マークは、DPB上のピクチャを外部へ出力する必要性の有無を示す情報である。出力マークは、具体的には、「出力要」(「needed for output」)、「出力不要」(「not needed for output」)のいずれかの値を取る。
なお、参照マークや出力マークは復号処理や符号化処理の特定のタイミングで明示的に設定されていなくてもよく、その場合、参照マークまたは出力マークは「未定義」と判定する。
<RPS導出部142>
RPS導出部142は、入力されるシンタックス値に基づいて対象ピクチャの復号処理に用いるRPS(Reference Picture Set;参照ピクチャセット)を導出してベース参照ピクチャ制御部144、参照ピクチャ制御部143、および、RPL導出部145に出力する。
RPSは、概略的には、対象ピクチャの復号処理、または、復号順で対象ピクチャに後続するピクチャの復号処理において利用されうる参照ピクチャの集合を表わす。
(サブRPSの定義)
RPSは、参照ピクチャの性質に基づいて複数のサブRPSに分割できる。本実施形態では、RPSは以下の5種類のサブRPSから構成される。
(1)前方短期RPS:対象ピクチャを基準とする表示順の相対位置により指定される参照ピクチャであって、対象ピクチャと同一レイヤに属し、かつ、表示順が対象ピクチャより前の参照ピクチャを含むサブRPS。
(2)後方短期RPS:対象ピクチャを基準とする表示順の相対位置により指定される参照ピクチャであって、対象ピクチャと同一レイヤに属し、かつ、表示順が対象ピクチャより後の参照ピクチャを含むサブRPS。
(3)長期RPS:表示順の絶対位置により指定される参照ピクチャであって、対象ピクチャと同一レイヤに属する参照ピクチャを含むサブRPS。
(4)レイヤ間画素RPS:対象ピクチャと異なるレイヤに属し、かつ、レイヤ間予測で画素値が参照される参照ピクチャを含むサブRPS。
(5)レイヤ間動き限定RPS:対象ピクチャと異なるレイヤに属し、かつ、レイヤ間予測で動き情報が参照されて画素値が参照されない参照ピクチャを含むサブRPS。
なお、以下では、前方短期RPSと後方短期RPSの和集合を短期RPSとも称する。つまり、短期RPSは、対象ピクチャを基準とする表示順の相対位置により指定される参照ピクチャであって、対象ピクチャと同一レイヤに属するピクチャを含む。また、レイヤ間画素RPSとレイヤ間動き限定RPSの和集合をレイヤ間RPSとも称する。つまり、レイヤ間RPSは、対象ピクチャと異なるレイヤに属する参照ピクチャ(レイヤ間参照ピクチャ)を含む。
(サブRPSの導出)
サブRPS導出部142におけるRPS導出はサブRPS毎に実行される。以下では、前述のサブRPS毎に関連シンタックスを説明するとともに、当該シンタックスからサブRPSを導出する処理を説明する。
(短期RPS)
短期RPS(前方短期RPSと後方短期RPS)に係るシンタックスに、SPSに含まれる短期参照ピクチャセット情報であるSPS短期RPS情報と、スライスヘッダに含まれる短期参照ピクチャセット情報であるSH短期RPS情報がある。
(SPS短期RPS情報)
SPS短期RPS情報は、SPSを参照する各ピクチャにおいて短期SPSとして選択され得る複数の短期RPS候補の情報を含む。なお、短期RPSは、対象ピクチャに対する相対的な位置(例えば対象ピクチャとのPOC差分)により指定される参照ピクチャ(短期参照ピクチャ)となり得るピクチャの集合である。
SPS短期RPS情報を、図6を参照して説明する。図6は、SPS復号時に利用されるSPSシンタックス表の一部を例示している。図6の(A)の部分がSPS短期RPS情報に相当する。SPS短期RPS情報には、SPSに含まれる短期RPS数(num_short_term_ref_pic_sets)、および、各短期RPSの定義(short_term_ref_pic_set(i))が含まれる。
短期RPS情報について、図7を参照して説明する。図7は、SPS復号時、および、スライスヘッダ復号時に利用される短期RPSのシンタックス表を例示している。
短期RPS情報には、対象ピクチャより表示順が早い短期参照ピクチャ数(num_negative_pics)、および、対象ピクチャより表示順が遅い短期参照ピクチャ数(num_positive_pics)が含まれる。なお、以下では、対象ピクチャより表示順が早い短期参照ピクチャを前方短期参照ピクチャ、対象ピクチャより表示順が遅い短期参照ピクチャを後方短期参照ピクチャと呼ぶ。
また、短期RPS情報には、各前方短期参照ピクチャに対して、対象ピクチャに対するPOC差分の絶対値(delta_poc_s0_minus1[i])、および、対象ピクチャの参照ピクチャとして使用される可能性の有無(used_by_curr_pic_s0_flag[i])が含まれる。加えて、各後方短期参照ピクチャに対して、対象ピクチャに対するPOC差分の絶対値(delta_poc_s1_minus1[i])、および、対象ピクチャの参照ピクチャとして使用される可能性の有無(used_by_curr_pic_s1_flag[i])が含まれる。
(SH短期RPS情報)
SH短期RPS情報は、スライスヘッダを参照するピクチャから利用され得る単一の短期RPSの情報を含む。
SPS短期RPS情報の復号について、図8を参照して説明する。図8は、スライスヘッダ復号時に利用されるスライスヘッダシンタックス表の一部を例示している。図8の(A)の部分がSH短期RPS情報に相当する。SH短期RPS情報は、短期RPSをSPSで復号済みの短期RPS候補の中から選択するか、スライスヘッダに明示的に含めるかを示すフラグ(short_term_ref_pic_set_sps_flag)を含む。短期RPS候補から選択する場合、何れか一つの短期RPS候補を選択する識別子(short_term_ref_pic_set_idx)が含まれる。スライスヘッダに明示的に含める場合は、前述の図7を参照して説明したシンタックス表(short_term_ref_pic_set(idx))に相当する情報が、SPS短期RPS情報に含まれる。
(短期RPS導出処理)
短期RPS情報から短期RPS、すなわち、前方短期RPSと後方短期RPSが導出される。また、後続参照短期RPSも導出される。
・前方短期RPS:SPS短期RPS情報またはSH短期RPS情報により指定される現ピクチャ参照可能ピクチャであって、表示順が対象ピクチャより早いピクチャを含む。
・後方短期RPS:SPS短期RPS情報またはSH短期RPS情報により指定される現ピクチャ参照可能ピクチャであって、表示順が対象ピクチャより遅いピクチャを含む。
・後続参照短期RPS:現ピクチャでは参照されないが、復号順で現ピクチャに後続するピクチャにおいて参照されえるピクチャを含む。
前方短期RPS(ListStCurrBefore)、後方短期RPS(ListStCurrAfter)、後続参照短期RPS(ListStFoll)を以下の手順で導出する。なお、前方短期RPS、後方短期RPS、および、後続参照短期RPSは、以下の処理の開始前に空に設定されている。
(S101)SPS短期RPS情報、および、SH短期RPS情報に基づいて、対象ピクチャの復号に用いる短期RPS情報を特定する。具体的には、SH短期RPS情報に含まれるshort_term_ref_pic_set_spsの値が0である場合、SH短期RPS情報に含まれるスライスヘッダで明示的に伝送された短期RPSを選択する。それ以外(short_term_ref_pic_set_spsの値が1の場合、SH短期RPS情報に含まれるshort_term_ref_pic_set_idxが示す短期RPSを、SPS短期RPS情報に含まれる複数の短期RPS候補から選択する。
(S102)選択された短期RPSに含まれる参照ピクチャ各々のPOCを導出する。参照ピクチャのPOCは、参照ピクチャが前方短期RPSに属する場合、対象ピクチャのPOCから「delta_poc_s0_minus1[i]+1」の値を減算して導出する。一方、参照ピクチャが後方短期RPSに属する場合、対象ピクチャのPOCに「delta_poc_s1_minus1[i]+1」の値を加算して導出する。
(S103)短期RPSに含まれる前方参照ピクチャを伝送された順に確認し、関連付けられているused_by_curr_pic_s0_flag[i]の値が1である場合、当該前方参照ピクチャをListStCurrBeforeに追加する。それ以外(used_by_curr_pic_s0_flag[i]の値が0)の場合、当該前方参照ピクチャをListStFollに追加する。
(S104)短期RPSに含まれる後方参照ピクチャを伝送された順に確認し、関連付けられているused_by_curr_pic_s1_flag[i]の値が1である場合、当該後方参照ピクチャをListStCurrAfterに追加する。それ以外(used_by_curr_pic_s1_flag[i]の値が0)の場合、当該後方参照ピクチャをListStFollに追加する。
(長期RPS)
長期RPSに係るシンタックスに、SPSに含まれる長期参照ピクチャ情報であるSPS長期RPS情報と、スライスヘッダに含まれる長期参照ピクチャ情報であるSH長期RPS情報がある。
(SPS長期RPS情報)
SPS長期RPS情報は、SPSを参照する各ピクチャから利用され得る複数の長期参照ピクチャの情報を含む。なお、長期参照ピクチャとは、シーケンス内の絶対的な位置(例えばPOC)により指定される参照ピクチャである。
SPS長期RPS情報の復号について、図6を再び参照して説明する。図6の(B)の部分がSPS長期RPS情報に相当する。SPS長期RPS情報には、SPSでの長期参照ピクチャ伝送有無を示すフラグ(long_term_ref_pics_present_flag)、SPSで伝送される長期参照ピクチャ数(num_long_term_ref_pics_sps)、および、各長期参照ピクチャの情報が含まれる。長期参照ピクチャの情報には、参照ピクチャのPOC(lt_ref_pic_poc_lsb_sps[i])、および、長期参照ピクチャが対象ピクチャにおいて参照される可能性の有無(used_by_curr_pic_lt_sps_flag[i])が含まれる。
なお、上記参照ピクチャのPOCは、参照ピクチャに関連付けられたPOCの値自体であってもよいし、POCのLSB(Least Significant Bit)、すなわち、POCを既定の2の冪乗の数で割った余りの値を用いてもよい。
(SH長期RPS情報)
SH長期RPS情報は、スライスヘッダを参照するピクチャから利用され得る長期参照ピクチャの情報を含む。
SH長期RPS情報の復号について、図8を再び参照して説明する。図8の(B)の部分がSH長期RPS情報に相当する。SH長期RPS情報は、長期参照ピクチャを利用することがフラグ(long_term_ref_pic_present_flag)で示されている場合にスライスヘッダに含まれる。SPS長期RPS情報が1以上の長期参照ピクチャを含む場合(num_long_term_ref_pics_sps>0)、SPSで復号済の長期参照ピクチャの中で対象ピクチャで参照され得る参照ピクチャの数(num_long_term_sps)がSH長期RPS情報に含まれる。また、スライスヘッダで明示的に伝送される長期参照ピクチャ数(num_long_term_pics)がSH長期RPS情報に含まれる。加えて、上記num_long_term_spsの数の長期参照ピクチャをSPS長期RPS情報に含まれる長期参照ピクチャから選択する情報(lt_idx_sps[i])がSH長期RPS情報に含まれる。さらに、スライスヘッダに明示的に含める長期参照ピクチャの情報として、上記num_long_term_picsの数だけ、参照ピクチャのPOC(poc_lsb_lt [i])、および、対象ピクチャの参照ピクチャとして使用される可能性の有無(used_by_curr_pic_lt_flag[i])が含まれる。
(長期RPS導出処理)
長期RPS情報から長期RPSが導出される。また、後続参照長期RPSも導出される。
・長期RPS:SPS長期RPS情報またはSH長期RPS情報により指定される現ピクチャ参照可能ピクチャを含む。
・後続参照長期RPS:現ピクチャでは参照されないが、復号順で現ピクチャに後続するピクチャにおいて参照されえる参照ピクチャを含む。
長期RPS(ListLtCurr)、後続参照長期RPS(ListLtFoll)を以下の手順で導出する。なお、長期RPS、および、後続参照長期RPSは、以下の処理の開始前に空に設定されている。
(S201) SPS長期RPS情報、および、SH長期RP情報に基づいて、対象ピクチャの復号に用いる長期参照ピクチャを特定する。具体的には、num_long_term_spsの数の参照ピクチャをSPS長期RPS情報に含まれる参照ピクチャの中から選択して、長期RPSに追加すする。選択される参照ピクチャは、lt_idx_sps[i]の示す参照ピクチャである。
(S202)続いて、num_long_term_picsの数のSH長期RPS情報に含まれる参照ピクチャを順に長期RPSに追加する。
(S203)長期RPSに含まれる参照ピクチャ各々のPOCを導出する。長期参照ピクチャのPOCは、関連付けて復号されたpoc_lst_lt[i]、または、lt_ref_pic_poc_lsb_sps[i]の値から直接導出される。
(S204)長期RPSに含まれる参照ピクチャを順に確認し、関連付けられているused_by_curr_pic_lt_flag[i]、または、used_by_curr_pic_lt_sps_flag[i]の値が1である場合、当該長期参照ピクチャをListLtCurrに追加する。それ以外(used_by_curr_pic_lt_flag[i]、または、used_by_curr_pic_lt_sps_flag[i]の値が0)の場合、当該長期参照ピクチャを後続参照長期RPS(ListLtFoll)に追加する。
(レイヤ間RPS)
レイヤ間画素RPSとレイヤ間動き限定RPSに係るシンタックスに、IL-RPS情報(レイヤ間RPS情報、レイヤ間参照ピクチャセット情報)がある。
(IL-RPS情報)
IL-RPS情報は、スライスヘッダを含むピクチャからレイヤ間予測で参照され得るレイヤ間参照ピクチャの情報を含む。
IL-RPS情報について、図9と図10を参照して説明する。
図9はVPSに含まれるVPS拡張(vps_extension)の復号時に参照されるシンタックス表の一部であって、IL-RPS情報に相当する部分である。図9に示すように、VPSには、IL-RPS情報に含まれるシンタックスであるmax_one_active_ref_layer_flag、direct_dep_type_len_minus2、direct_dependency_type[i][j]が含まれる。
シンタックスmax_one_active_ref_layer_flagは、任意レイヤの任意ピクチャの復号時に参照されるレイヤの最大値が1以下であるかを示すフラグである。最大値が1以下の場合に当該フラグの値に1、それ以外(最大値が2以上)の場合に当該フラグの値に0が設定される。
シンタックスdirect_dep_type_len_minus2は、シンタックスdirect_dependency_type[i][j]のビット数を表わす値である。direct_dependency_type[i][j]のビット数は(direct_dep_type_len_minus2+2)となる。
シンタックスdirect_dependency_type[i][j]は、“i”で示されるレイヤから“j”で示されるレイヤを参照する際に使用可能なレイヤ間予測の種類を示す値である。以降の説明では、direct_dependency_type[i][j]のことを、対象レイヤ(レイヤi)から参照レイヤ(レイヤj)参照時の依存タイプ、とも称する。また、レイヤiとレイヤjを省略して、依存タイプ(direct_dependency_type)とも称する。
レイヤ間予測の種類にレイヤ間画像予測とレイヤ間動き予測がある場合の依存タイプと各レイヤ間予測の使用可否の関係を図11に示す。依存タイプが「0」の場合、画素依存であり、かつ、動き依存である。依存タイプが「1」の場合、画素依存であり、かつ、動き依存ではない。依存タイプが「2」の場合、動き依存であり、かつ、画素依存ではない。
ここで、依存タイプが画素依存を示す場合には、対象レイヤiは、参照レイヤjの画素を予測に用いることができる。例えば、レイヤ間画像予測に用いることができる。依存タイプが動き依存を示す場合には、対象レイヤiは、参照レイヤjの動き情報(動きベクトルおよび参照ピクチャインデックス)を予測に用いることができる。例えば、レイヤ間動き予測に用いることができる。レイヤ間画像予測は、参照レイヤの復号画像の画素値を用いて対象ピクチャの予測画像を生成する処理である。また、レイヤ間動き予測は、参照レイヤの動き情報(動きベクトル、参照ピクチャインデックス、インター予測タイプ)を直接または間接的に用いて対象ピクチャの予測画像を生成する処理である。
したがって、依存タイプが「0」の場合は、参照レイヤの復号画素(復号画像の画素値)と動き情報のいずれも対象ピクチャの復号処理で利用される可能性があることを意味する。依存タイプが「1」の場合は、参照レイヤの復号画素は利用される可能性があるが、動き情報は利用される可能性がないことを意味する。依存タイプが「2」の場合は、参照レイヤの動き情報は利用される可能性があるが、復号画素は利用される可能性がないことを意味する。
依存タイプが参照レイヤの復号画素を参照することを示す場合(上記の定義でいえば、依存タイプが「0」または「1」)の場合、依存タイプが画素依存を示すと表現できる。一方、依存タイプが参照レイヤの復号画素を参照しないことを示す場合(上記の定義でいえば、依存タイプが「2」)の場合、依存タイプが画素非依存を示すと表現できる。
同様に、依存タイプが参照レイヤの動き情報を参照することを示す場合(上記の定義でいえば、依存タイプが「0」または「2」)の場合、依存タイプが動き依存を示すと表現できる。一方、依存タイプが参照レイヤの復号画素を参照しないことを示す場合(上記の定義でいえば、依存タイプが「2」)の場合、依存タイプが動き非依存を示すと表現できる。
例えば、対象レイヤiが参照レイヤjの復号画素を用いるか否か(画素依存)を示す画素依存フラグSampleEnableFlag[i][j]、対象レイヤiが参照レイヤjの動き情報を用いるか否か(動き依存)を示す動き依存フラグMotionEnableFlag[i][j]は、以下の式において導出することができる。
SampleEnableFlag[i][j] = (3 - direct_dependency_type[i][j]) & 2) >> 1
MotionEnableFlag[i][j] = (3 - direct_dependency_type[i][j]) & 1)
なお、依存タイプの値の意味は必ずしも上記に限らない。例えば、依存タイプが「0」の場合に画素依存かつ動き非依存を示し、依存タイプが「1」の場合に動き依存かつ画素非依存を示し、依存タイプが「2」の場合に画素依存かつ動き依存を示していてもよい。
この例では、上記、画素依存フラグSampleEnableFlag[i][j]、動き依存フラグMotionEnableFlag[i][j]は以下の式から導出される。
SampleEnableFlag[i][j] = (direct_dependency_type[i][j] + 1) & 1)
MotionEnableFlag[i][j] = (direct_dependency_type[i][j] + 1) & 2) >> 1
また、対象レイヤが、参照レイヤの復号画素および動き情報以外を参照することを示すために、依存タイプによって、画素依存および動き依存以外の依存の種類を示しても良い。例えば、依存の種類には、ブロック分割情報、変換係数情報(変換係数の有無など)、ループフィルタ情報などが可能である。この場合も、画素依存フラグ、動き依存フラグは、上述の式などにより、導出することが可能であり、追加の依存があるか否かを示すフラグ(例えば、XXX依存フラグXXXEnableFlag、XXXは、ブロック分割情報、変換係数情報、ループフィルタ情報など)は以下の式により導出することができる。
XXXEnableFlag[i][j] = (direct_dependency_type[i][j] + 1) & 4) >> 2 図10はスライスヘッダ復号時に参照されるシンタックス表の一部であって、IL-RPS情報に相当する部分である。
IL-RPS情報は、レイヤ間予測有効フラグ(inter_layer_pred_enabled_flag)を含む。さらに、レイヤ間予測有効フラグが1であり(レイヤ間予測が有効であり)、かつ、対象ピクチャから参照可能な参照レイヤ数(NumDirectRefLayers[nuh_layer_id])が1より大きい場合、レイヤ間参照ピクチャ数を表すシンタックス(num_inter_layr_ref_pics_minus1)がIL-RPS情報に含まれる。アクティブレイヤ間参照ピクチャ数(NumActiveRefLayerPics)は“num_inter_layer_ref_pics_minus1 + 1”の値に設定される。アクティブレイヤ間参照ピクチャ数は、対象ピクチャにおいてレイヤ間予測により参照可能なレイヤ間参照ピクチャ数に相当する。加えて、各レイヤ間参照ピクチャの属するレイヤを示すレイヤ識別子(inter_layer_pred_layer_idc[i])がIL-RPS情報に含まれる。
なお、IL-RPS情報に含まれる上記の各シンタックスは、自明である場合は省略されてもよい。例えば、1つのピクチャから参照可能なレイヤ間参照ピクチャ数が1枚に制限されている場合、レイヤ間参照ピクチャ数に係るシンタックスは不要である。
(レイヤ間RPS導出処理)
IL-RPS情報からレイヤ間RPS、すなわちレイヤ間画素RPSとレイヤ間動き限定RPSが導出される。
導出処理の説明に先立って、本実施形態のRPS導出部142により導出されるレイヤ間画素RPSとレイヤ間動き限定RPSと依存タイプの関係について図1を用いて説明する。図1はレイヤ間RPSに含まれるサブRPS(レイヤ間画素RPSとレイヤ間動き限定RPS)と依存タイプの関係を例示する図である。
図1に示すように、レイヤ間RPSはレイヤ間画素RPSとレイヤ間動き限定RPSの2つのサブRPSを含む。以下、レイヤ識別子がx、依存タイプがyであるレイヤ間参照ピクチャを「LID=x,DT=y」と表記する。図1の例では、レイヤ間RPSは3枚のレイヤ間参照ピクチャ(「LID=0,DT=0」、「LID=1,DT=1」、「LID=3,DT=0」)を含む。レイヤ間動き限定RPSは2枚のレイヤ間参照ピクチャ(「LID=2,DT=2」、「LID=4,DT=2」)を含む。
すなわち、レイヤ間画素RPSは依存タイプが「0」の参照ピクチャと依存タイプが「1」のレイヤ間参照ピクチャを含む。一方、レイヤ間動き限定RPSは依存タイプが「2」のレイヤ間参照ピクチャを含む。換言すると、レイヤ間画素RPSは、復号画素が参照される可能性のあるレイヤ間参照ピクチャを含む。一方、レイヤ間動き限定RPSは、復号画素が参照される可能性のあるレイヤ間参照ピクチャを含まず、動き情報が参照される可能性のあるレイヤ間参照ピクチャを含む。
レイヤ間画素RPS(IL-RPS0)、レイヤ間動き限定RPS(IL-RPS1)の導出手順を図12を用いて説明する。図12は、レイヤ間RPSに含まれるサブRPS(レイヤ間画素RPSとレイヤ間動き限定RPS)の導出処理を表わすフロー図である。
(S301)レイヤ間画素RPSを表わすリストIL-RPS0、および、レイヤ間動き限定RPSを表わすリストIL-RPS1をそれぞれ空に設定する。
(S302)変数iを「0」に設定する。S303に進む。
(S303)i番目のアクティブレイヤ間参照ピクチャの依存タイプが「0」または「1」の場合(YESの場合)、S304に進む。それ以外の場合(NOの場合)、S305に進む。
(S304)i番目のアクティブレイヤ間参照ピクチャをIL-RPS0(レイヤ間画素RPS)の末尾に追加して、S307に進む。
(S305)i番目のアクティブレイヤ間参照ピクチャの依存タイプが「2」の場合(YESの場合)、S306に進む。それ以外の場合(NOの場合)、S307に進む。
(S306)i番目のアクティブレイヤ間参照ピクチャをIL-RPS1(レイヤ間動き限定RPS)の末尾に追加して、S307に進む。
(S307)iの値がアクティブレイヤ間参照ピクチャ数(NumActiveRefLayerPics)より小さい場合(YESの場合)、S308に進む。それ以外の場合(NOの場合)、処理を終了する。
(S308)変数iの値を1加算して、S303に進む。
以上の処理により、図1を用いて説明した性質を持つレイヤ間画素RPSとレイヤ間動き限定RPSをIL-RPS情報に基づいて導出できる。
なお、S303とS305の判定は、より一般的には次のように表現できる。
(S303r1)i番目のアクティブレイヤ間参照ピクチャの依存タイプが、レイヤ間参照ピクチャの復号画素が参照される可能性のあることを示す場合(i番目のアクティブレイヤ間参照ピクチャに対応する参照ピクチャのSampleEnableFlagが1の場合)、S304に進む。それ以外の場合、S305に進む。
(S305r1)i番目のアクティブレイヤ間参照ピクチャの依存タイプが、レイヤ間参照ピクチャの動き情報が参照される可能性のあることを示す場合(i番目のアクティブレイヤ間参照ピクチャに対応する参照ピクチャのSampleEnableFlagが0かつMotionEnableFlagが1の場合)、S306に進む。それ以外の場合、S307に進む。 上記の図12を用いて説明したレイヤ間画素RPSとレイヤ間動き限定RPSの導出方法はあくまで一例である。レイヤ間画素RPSとレイヤ間動き限定RPSが特定の性質、すなわち、レイヤ間画素RPSは復号画素が参照される可能性のあるレイヤ間参照ピクチャを含み、また、レイヤ間動き限定RPSは復号画素が参照される可能性のあるレイヤ間参照ピクチャを含まず、動き情報が参照される可能性のあるレイヤ間参照ピクチャを含む、という性質を満たす限りにおいては、異なる方法で導出しても構わない。
なお、上記では、レイヤ間画素RPSとレイヤ間動き限定RPSのサブRPSを導出したが、レイヤ間画素RPSとレイヤ間画素非依存RPSのサブRPSを導出しても良い。この場合、S303とS305の判定を、各々、以下の判定S303r2とS305r2に置き換える。
(S303r2)i番目のアクティブレイヤ間参照ピクチャの依存タイプが、レイヤ間参照ピクチャの復号画素が参照される可能性のあることを示す場合(i番目のアクティブレイヤ間参照ピクチャに対応する参照ピクチャのSampleEnableFlagが1の場合)、S304に進む。それ以外の場合、S305に進む。
(S305r2)i番目のアクティブレイヤ間参照ピクチャの依存タイプが、レイヤ間参照ピクチャの復号画素が参照されることを示さない場合(i番目のアクティブレイヤ間参照ピクチャに対応する参照ピクチャのSampleEnableFlagが0の場合)、S306に進む。それ以外の場合、S307に進む。
なお、依存タイプの種類が、画素依存と動き依存の2つのみの場合は、レイヤ間動き限定RPSとレイヤ間画素非依存RPSは等しくなる。
<参照ピクチャ制御部143>
参照ピクチャ制御部143は、入力されるRPSに基づいて、DPB141を更新する。概略的には、参照ピクチャ制御部143は、入力されたRPSにおいて 対象ピクチャ(現ピクチャ)のインター予測で参照可能と示されているピクチャの参照マークを「参照使用」(「短期参照使用」または「長期参照使用」)に設定する。加えて、DPBに記録されている対象レイヤの復号ピクチャであって、前記の処理で「参照使用」とマークされないピクチャを「参照不使用」に設定する。なお、DPB上のレイヤ間参照ピクチャの参照マークは参照ピクチャ制御部143では変更しない。言い換えると、ベース復号ピクチャに由来するDPB上のピクチャの参照マークの変更は参照ピクチャ制御部143では行わず、後述のベース参照ピクチャ制御部144で行う。
<ベース参照ピクチャ制御部144>
ベース参照ピクチャ制御部144は、入力されるベース復号ピクチャとRPSに基づいて、DPB141を更新する。概略的には、ベース参照ピクチャ制御部144は、入力されたRPSにおいて 対象ピクチャ(現ピクチャ)のレイヤ間インター予測で参照可能と示されているピクチャに対応するベース復号ピクチャをDPBに記録する。加えて、DPB上で当該ピクチャの参照マークを「参照使用」(「短期参照使用」または「長期参照使用」に設定する。加えて、DPB上で当該ピクチャの出力マークを「出力不要」に設定する。
なお、ベース復号ピクチャを記録する際に、必要に応じてスケーリングやフィルタリングを適用した後に前記ピクチャバッファに記録してもよい。特に、参照レイヤと対象レイヤの出力ピクチャの解像度が異なる場合(空間スケーラビリティの場合)、参照レイヤの復号ピクチャであるベース復号ピクチャを、対象レイヤの出力ピクチャの解像度に合わせてスケーリングする必要がある。
<RPL導出部145>
RPL導出部145は、入力RPS、および、入力シンタックス値に含まれるRPL情報に基づいて対象ピクチャの対象スライスのインター予測またはレイヤ間予測で利用する参照ピクチャリストを導出して出力する。
(RPL情報)
RPL情報は、参照ピクチャリストRPLを構築するためにSPSまたはスライスヘッダより復号されるシンタックス値である。RPL情報は、SPSリスト修正情報、および、SHリスト修正情報から構成される。
SPSリスト修正情報はSPSに含まれる情報であり、参照ピクチャリスト修正の制約に係る情報である。SPSリスト修正情報について、図6を再び参照して説明する。図6の(C)の部分がSPSリスト修正情報に相当する。SPSリスト修正情報には、ピクチャに含まれる前スライスで参照ピクチャリストが共通か否かを示すフラグ(restricted_ref_pic_lists_flag)、および、スライスヘッダ内にリスト並べ替えに関する情報が存在するか否かを示すフラグ(lists_modification_present_flag)が含まれる。
SHリスト修正情報はスライスヘッダに含まれる情報であり、対象ピクチャに適用される参照ピクチャリストの長さ(参照リスト長)の更新情報、および、参照ピクチャリストの並べ替え情報(参照リスト並べ替え情報)が含まれる。SHリスト修正情報について、図13を参照して説明する。図13はスライスヘッダ復号時に利用されるスライスヘッダシンタックス表の一部を例示している。図13の(C)の部分がSHリスト修正情報に相当する。
参照リスト長更新情報として、リスト長の更新有無を示すフラグ(num_ref_idx_active_override_flag)が含まれる。加えて、L0参照リストの変更後の参照リスト長を表す情報(num_ref_idx_l0_active_minus1)、および、L1参照リストの変更後の参照リスト長を表す情報(num_ref_idx_l1_active_minus1)が含まれる。
参照リスト並べ替え情報としてスライスヘッダに含まれる情報について、図14を参照して説明する。図14はスライスヘッダ復号時に利用される参照リスト並べ替え情報のシンタックス表を例示している。
参照リスト並べ替え情報には、L0参照リスト並べ替え有無フラグ(ref_pic_list_modification_flag_l0)が含まれる。前記フラグの値が1(L0参照リストの並べ替えが有る場合)、かつ、NumPocTotalCurrが2より大きい場合、L0参照リスト並べ替え順序(list_entry_l0[i])が参照リスト並べ替え情報に含まれる。ここで、NumPocTotalCurrは、現ピクチャにおいて利用可能な参照ピクチャの数を表す変数である。したがって、L0参照リストの並べ替えが有る場合であって、かつ、現ピクチャにおいて利用可能な参照ピクチャ数が2より大きい場合にのみ、L0参照リスト並べ替え順序がスライスヘッダに含まれる。
同様に、参照ピクチャがBスライスである場合、つまり、対象ピクチャにおいてL1参照リストが利用可能である場合、L1参照リスト並べ替え有無フラグ(ref_pic_list_modification_flag_l1)が参照リスト並べ替え情報に含まれる。前記フラグの値が1、かつ、NumPocTotalCurrが2より大きい場合、L1参照リスト並べ替え順序(list_entry_l1[i])が参照リスト並べ替え情報に含まれる。言い換えると、L1参照リストの並べ替えが有る場合であって、かつ、現ピクチャにおいて利用可能な参照ピクチャ数が2より大きい場合にのみ、L1参照リスト並べ替え順序がスライスヘッダに含まれる。
(RPL導出処理)
参照ピクチャリスト導出処理(RPL導出処理)の詳細を説明する。参照ピクチャリスト導出部は、参照ピクチャセットRPSと、RPL修正情報に基づいて、対象ピクチャの復号に用いる参照ピクチャリストRPLを生成する。
参照ピクチャリストにはL0参照リストとL1参照リストの2つのリストがある。各参照ピクチャリスト導出の説明に先立って、導出処理の過程で生成される暫定L0参照リストと暫定L1参照リストの特徴を図15を用いて説明しておく。図15は、RPL導出部145におけるL0参照リストとL1参照リスト導出の中間過程で生成される暫定L0参照リストと暫定L1参照リストの概略を示す図である。
図15(a)に示すように、暫定L0参照リストは、リストの先頭から順に(優先度の高い順に)前方短期RPS(図中でStBef)、レイヤ間画素RPS(図中でILSample)、後方短期RPS(図中でStAft)、長期RPS(図中でLt)、レイヤ間動き限定RPS(図中でILMotion)の順にサブRPSを含む。
図15(b)に示すように、暫定L1参照リストは、リストの先頭から順に(優先度の高い順に)後方短期RPS(図中でStAft)、前方短期RPS(図中でStBef)、長期RPS(図中でLt)、レイヤ間画素RPS(図中でILSample)、レイヤ間動き限定RPS(図中でILMotion)の順にサブRPSを含む。
つまり、RPL導出部145にて生成される暫定参照リスト(暫定参照L0参照リストおよび暫定L1参照リスト)は、レイヤ間画素RPSを、レイヤ間動き限定RPSに較べて、よりリストの先頭に近い位置に含んでいる。換言すると、暫定参照リストは、レイヤ間画素RPSを、レイヤ間動き限定RPSに較べてより高い優先度に対応する位置に含んでいる。
続いて、L0参照リストとL1参照リストの導出手順を説明する。L0参照リストは、以下のS401〜S409に示す手順で構築される。
(S401)暫定L0参照リストを生成して、空のリストに初期化する。
(S402)暫定L0参照リストに対し、前方短期RPSに含まれる参照ピクチャを順に追加する。
(S403)暫定L0参照リストに対し、レイヤ間画素RPSに含まれる参照ピクチャを順に追加する。
(S404)暫定L0参照リストに対し、後方短期RPSに含まれる参照ピクチャを順に追加する。
(S405)暫定L0参照リストに対し、長期RPSに含まれる参照ピクチャを順に追加する。
(S406)暫定L0参照リストに対し、レイヤ間動き限定RPSに含まれる参照ピクチャを順に追加する。
(S407)参照ピクチャリストが修正される場合(RPL修正情報に含まれるlists_modification_present_flagの値が1の場合)、以下のS408に進む。それ以外の場合(lists_modification_present_flagの値が0の場合)、S409に進む。
(S408)参照リスト並べ替え順序list_entry_l0[i]の値に基づいて、暫定L0参照リストの要素を並べ換えて、L0参照リストとする。参照ピクチャインデックスrIdxに対応するL0参照リストの要素RefPicList0[rIdx]は、次式により導出される。ここで、RefListTemp0[i]は、暫定L0参照リストのi番目の要素を表す。
RefPicList0[ rIdx ] = RefPicListTemp0[ list_entry_l0[ rIdx ] ]
上記の式によれば、参照リスト並べ替え順序list_entry_l0[i]において、参照ピクチャインデックスrIdxの示す位置に記録されている値を参照し、暫定L0参照リストにおいて前記値の位置に記録されている参照ピクチャを、L0参照リストのrIdxの位置の参照ピクチャとして格納する。
(S409)暫定L0参照リストをL0参照リストとする。
次にL1参照リストの構築手順を説明する。L1参照リストの構築は、以下のS501〜S509に記載の手順で実行される。
(S501)暫定L1参照リストを生成して、空のリストに初期化する。
(S502)暫定L1参照リストに対し、後方短期RPSに含まれる参照ピクチャを順に追加する。
(S503)暫定L1参照リストに対し、前方短期RPSに含まれる参照ピクチャを順に追加する。
(S504)暫定L1参照リストに対し、長期RPSに含まれる参照ピクチャを順に追加する。
(S505)暫定L1参照リストに対し、レイヤ間画素RPSに含まれる参照ピクチャを順に追加する。
(S506)暫定L1参照リストに対し、レイヤ間動き限定RPSに含まれる参照ピクチャを順に追加する。
(S507)参照ピクチャリストが修正される場合(RPL修正情報に含まれるlists_modification_present_flagの値が1の場合)、以下のS508に進む。それ以外の場合(lists_modification_present_flagの値が0の場合)、S509に進む。
(S508)参照リスト並べ替え順序list_entry_l1 [i]の値に基づいて、暫定L1参照リストの要素を並べ換えて、L1参照リストとする。参照ピクチャインデックスrIdxに対応するL1参照リストの要素RefPicList1[rIdx]は、次式により導出される。ここで、RefListTemp1[i]は、暫定L1参照リストのi番目の要素を表す。
RefPicList1[ rIdx ] = RefPicListTemp1[ list_entry_l1[ rIdx ] ]
上記の式によれば、参照リスト並べ替え順序list_entry_l1[i]において、参照ピクチャインデックスrIdxの示す位置に記録されている値を参照し、暫定L1参照リストにおいて前記値の位置に記録されている参照ピクチャを、L1参照リストのrIdxの位置の参照ピクチャとして格納する。
(S509)暫定L1参照リストをL1参照リストとする。
上記の参照ピクチャリスト導出手順によれば、参照ピクチャリスト(参照リストL0と参照リストL1)が、対応する暫定参照リスト(暫定参照リストL0と暫定参照リストL1)をRPL修正情報に基づいて選択および並べ替えることにより生成される。その際、暫定参照リストは、レイヤ間画素RPSを、レイヤ間動き限定RPSに較べてより高い優先度に対応する位置に含んでいる。言い換えると、暫定参照リストは、レイヤ間画素RPSを、レイヤ間動き限定RPSに較べてよりリストの先頭に近い位置に含んでいる。
RPL修正情報が並べ替えを行わないことを示す場合、レイヤ間画素RPSに含まれるレイヤ間参照ピクチャが、レイヤ間動き限定RPSに含まれるレイヤ間参照ピクチャ較べて参照ピクチャリストの先頭に近い位置(より小さい参照ピクチャインデックスに対応する位置)に関連付けられる。したがって、レイヤ間画素RPSに含まれるレイヤ間参照ピクチャを、レイヤ間動き限定RPSに含まれるレイヤ間参照ピクチャ較べてより小さい値の参照ピクチャインデックスで指定できる。レイヤ間画素RPSに含まれるレイヤ間参照ピクチャは、レイヤ間画素予測に使われる可能性のあるレイヤ間参照ピクチャである。一方、レイヤ間動き限定RPSに含まれるレイヤ間参照ピクチャは、レイヤ間画素予測に使われる可能性はなく、レイヤ間動き予測に使われる可能性のあるレイヤ間参照ピクチャである。一般に、レイヤ間画像予測に用いる参照ピクチャを指定するための参照ピクチャインデックスの方が、レイヤ間動き予測に用いる参照ピクチャを指定するための参照ピクチャインデックスに較べてより多数含まれている。例えば、前者は予測単位毎に含まれるのに対し、後者はスライス毎に含まれる。したがって、レイヤ間画素RPSに含まれるレイヤ間参照ピクチャを、レイヤ間動き限定RPSに含まれるレイヤ間参照ピクチャに較べて小さい参照ピクチャインデックスを割り当てて、より少ない符号量で指定できるようにすることで、符号化データ全体の符号量を低減できる。
RPL修正情報が並べ変えを行うことを示す場合、参照リスト並べ替え情報(list_entry_l0、list_entry_l1)により暫定参照リスト中の位置を指定することで、暫定参照リストを並べ替えて参照リストを生成する。この場合、参照ピクチャリストの先頭に並べ替えられる可能性の高い参照ピクチャを、より小さい値の参照リスト並べ替え情報で指定できるようにすることで、RPL修正情報の符号量を削減できる。暫定参照リストでは、レイヤ間画素RPSに含まれるレイヤ間参照ピクチャが、参照ピクチャリストの先頭に並べ替えられる可能性のより低いレイヤ間動き限定RPSに含まれるレイヤ間参照ピクチャに較べて、暫定参照リストの先頭に近い位置にあるため、より小さい値の参照リスト並べ替え情報で指定できる。したがって、上記手順で導出した暫定参照リストを用いることで、RPL修正情報の符号量を低減できる。
加えて、上記の暫定参照リストは、動き限定RPSを暫定参照リストの末尾に含んでいる。また、上記の暫定参照リストは、動き限定RPSを短期RPSよりもリストの後方に近い位置に含んでいる。動き限定参照リストに含まれるレイヤ間参照ピクチャは、同一レイヤ内のインター予測に係るサブRPSである短期RPSや長期RPSに含まれる参照ピクチャよりも選択頻度が低いため、上記のように暫定参照リストを構成することで、参照ピクチャの選択に係る情報をより少ない符号量で復号できる。
なお、レイヤ間画素RPSとレイヤ間動き限定RPSのサブRPSの代わりに、レイヤ間画素RPSとレイヤ間画素非依存RPSのサブRPSを導出する場合には、上記、参照ピクチャリスト導出処理(RPL導出処理)において、レイヤ間動き限定RPSを、レイヤ間画素非依存RPSに読み替えて処理する。より具体的には、S406とS506の処理を以下の処理に置き換える。
(S406r2)暫定L0参照リストに対し、レイヤ間画素非依存RPSに含まれる参照ピクチャを順に追加する。
(S506r2)暫定L1参照リストに対し、レイヤ間画素非依存RPSに含まれる参照ピクチャを順に追加する。
これにより、暫定参照リストは、レイヤ間画素RPSを、レイヤ間画素非依存RPSに較べてより高い優先度に対応する位置に含んでいる。言い換えると、暫定参照リストは、レイヤ間画素RPSを、レイヤ間画素非依存RPSに較べてよりリストの先頭に近い位置に含んでいる。また、上記の暫定参照リストは、画素非依存限定RPSを暫定参照リストの末尾に含んでいる。また、上記の暫定参照リストは、画素非依存RPSを短期RPSよりもリストの後方に近い位置に含んでいる。
上述のように、レイヤ間画像予測に用いる参照ピクチャを指定するための参照ピクチャインデックスは予測単位毎に含まれるため、一般の場合においても、レイヤ間画像予測以外の予測(例えば、動き情報依存の場合のレイヤ間動き予測)の場合に、参照ピクチャを指定するための参照ピクチャインデックスよりも、多数含まれると考えられる。従って、レイヤ間画素RPSに含まれるレイヤ間参照ピクチャを、レイヤ間画素非依存RPSに含まれるレイヤ間参照ピクチャに較べて小さい参照ピクチャインデックスを割り当てて、より少ない符号量で指定できるようにすることで、符号化データ全体の符号量を低減できる。
<出力制御部146>
出力制御部146は、概略的には、所定のタイミングでDPB141のピクチャを外部に出力するとともに出力マークを更新する。具体的には、出力制御部146によるピクチャ出力処理は次の手順で実行される。
まず、DPB上のピクチャであって、出力マークが「出力要」であるピクチャのうちPOCが最小であるピクチャを出力する。次に、出力されたピクチャの出力マークを「出力不要」に設定する。最後に、DPB上のピクチャの中から、参照マークが「参照不使用」であり、かつ、出力マークが「出力不要」であるピクチャを選択して、当該ピクチャをDPBから削除する。
(ベース復号部)
図16を用いて、ベース復号部15の詳細構成を説明する。図16は、ベース復号部15の構成について例示した機能ブロック図である。
図16に示すように、ベース復号部15は、可変長復号部151、ベースピクチャ復号部153、ベース復号ピクチャ管理部154を備える。
可変長復号部151は、参照レイヤ符号化データDATA#Rに含まれるバイナリから各種符号化パラメータ(代表的には変換係数、予測情報、RPS情報、RPL情報)に係る各種シンタックス値を復号する。可変長復号部151が復号する予測情報および変換係数のシンタックスは、図4の可変長復号部12と同様であるため詳細説明は省略する。
可変長復号部151は、復号したシンタックス値をベースピクチャ復号部153およびベース復号ピクチャ管理部154に供給する。
ベースピクチャ復号部153は、参照レイヤ上の対象ピクチャに関するスライスヘッダ、予測情報、および、変換係数に係るシンタックス値に基づいて、参照レイヤ上の対象ピクチャの復号ピクチャ(ベース復号ピクチャ)を復号して出力される。なお、ベースピクチャ復号部153におけるベース復号ピクチャ復号処理は、図4のピクチャ復号部13におけるピクチャ復号処理と同様であるため詳細説明は省略する。
ベース復号ピクチャ管理部154は、入力されるベース復号ピクチャを内部のDPBに記録するとともに、入力されるシンタックス値に基づいて参照ピクチャリスト生成や出力するベース復号ピクチャの決定を行う。生成された参照ピクチャリストはベースピクチャ復号部153に出力され、ベース復号ピクチャは外部に出力される。なお、ベース復号ピクチャ管理部154における処理は、図4の復号ピクチャ管理部14における処理と同様であり詳細説明は省略する。
(動画像復号装置1の効果)
以上説明した本実施形態に係る階層動画像復号装置1は、RPS導出部142を備えており、前記RPS導出部は、復号画素(復号画像の画素値)が参照される可能性のあるレイヤ間参照ピクチャを含むレイヤ間画素RPS(依存タイプが画素依存のサブRPS)と、復号画素が参照される可能性のないレイヤ間参照ピクチャを含むレイヤ間動き限定RPS(依存タイプが画素非依存のサブRPS)を導出する。また、階層動画像復号装置1は、RPL導出部145を備えており、前記RPL導出部は、レイヤ間画素RPSがレイヤ間動き限定RPSに較べてリスト先頭に近い位置にある暫定参照リストを生成し、当該暫定参照リストに基づいて参照リストを生成する。したがって、階層動画像復号装置1は、レイヤ間画素RPSに含まれるレイヤ間参照ピクチャを指定する参照ピクチャインデックスが少ない符号量で符号化された符号化データを復号できる。
より一般には、階層動画像復号装置1を次のように表現できる。すなわち、階層動画像復号装置1は第一のサブRPS(レイヤ間画素RPS)と第二のサブRPS(レイヤ間動き限定RPS)を導出するRPS導出部を備え、上記第一のサブRPSが含むレイヤ間参照ピクチャの復号画素が利用される頻度は、上記第二のサブRPSが含むレイヤ間参照ピクチャの復号画素が利用される頻度に較べて低い。したがって、階層動画像復号装置1は、上記第一のサブRPSに含まれるレイヤ間参照ピクチャを、上記第二のサブRPSに含まれるレイヤ間参照ピクチャに較べてより少ない符号量で選択できるよう暫定参照リストにおけるサブRPSの並び順を設定することで、符号化データの符号量を低減できる。
[変形例1:サブRPS定義の別の例]
上記の階層動画像復号装置1の説明では、RPS導出部142においてレイヤ間RPSとしてレイヤ間画素RPSとレイヤ間動き限定RPSを導出する例を挙げたが、それに限らない。以下で別のレイヤ間RPSを導出する例を記載する。
(1−1.レイヤ間画素動きRPSとレイヤ間限定RPS)
レイヤ間RPSとレイヤ間動き限定RPSの代わりに、レイヤ間画素動きRPSとレイヤ間限定RPSを導出する。図17は、レイヤ間画素動きRPSとレイヤ間限定RPSを例示する図である。図17に示すように、レイヤ間画素動きRPSは、依存タイプが「0」のレイヤ間参照ピクチャを含む。一方、レイヤ間限定RPSは、依存タイプが「1」または「2」のレイヤ間参照ピクチャを含む。換言すると、レイヤ間画素動きRPSは、復号画素と動き情報の両方が参照される可能性のあるレイヤ間参照ピクチャを含む。一方、レイヤ間限定RPSは、復号画素、または、動き情報の何れか一方のみが参照される可能性のあるレイヤ間参照ピクチャを含む。
RPL導出部145では、暫定参照リストにおいて、レイヤ間画素動きRPSが、レイヤ間限定RPSよりもリスト先頭に近い位置に設定する。
一般に、レイヤ間の依存関係を設定する場合、対象レイヤと近い性質を有するレイヤに対して復号画素と動き情報の両方が参照できるように設定する場合が多い。そのため、レイヤ間画素動きRPSに含まれるレイヤ間参照ピクチャは、復号画素と動き情報の何れか一方のみしか参照されない、レイヤ間限定RPSに含まれるレイヤ間参照ピクチャに較べて、より高い頻度でレイヤ間画像予測の参照ピクチャとして選択される可能性が高い。したがって、レイヤ間画素RPSとレイヤ間動き限定RPSを用いる場合と同様に、参照ピクチャインデックスの符号量を低減できる。
なお、レイヤ間限定RPS内では、依存タイプが「1」のレイヤ間参照ピクチャが、依存タイプが「2」のレイヤ間参照ピクチャに較べて、よりサブRPS内の先頭に近い位置に置くことが好ましい。これは、復号画素が参照されるレイヤ間参照ピクチャが、動き情報が参照されるレイヤ間参照ピクチャに較べて、レイヤ間予測で選択される頻度が高いためである。なお、必ずしも、全ての依存タイプが「1」のレイヤ間参照ピクチャが、全ての依存タイプが「2」のレイヤ間参照ピクチャよりもサブRPS内で前に位置する必要はなく、平均的に前に位置すれば効果は得られる。
(1−2.3種類以上のサブRPS)
レイヤ間RPSとして3種類以上のサブRPSを導出してもよい。例えば、レイヤ間画素動きRPSとレイヤ間画素限定RPSとレイヤ間動き限定RPSを導出する。図18は、レイヤ間画素動きRPSとレイヤ間画素限定RPSとレイヤ間動き限定RPSを例示する図である。図18に示すように、レイヤ間画素動きRPSは、依存タイプが「0」のレイヤ間参照ピクチャを含む。また、レイヤ間画素限定RPSは、依存タイプが「1」のレイヤ間参照ピクチャを含む。また、レイヤ間動き限定RPSは、依存タイプが「2」のレイヤ間参照ピクチャを含む。換言すると、レイヤ間画素動きRPSは、復号画素と動き情報の両方が参照される可能性のあるレイヤ間参照ピクチャを含む。他方、レイヤ間画素限定RPSは復号画素のみが参照される可能性のあるレイヤ間参照ピクチャを含む。他方、他方、レイヤ間動き限定RPSは動き情報のみが参照される可能性のあるレイヤ間参照ピクチャを含む。
RPL導出部145では、暫定参照リストにおいて、レイヤ間画素動きRPSが、レイヤ間画素限定RPSよりもリスト先頭に近い位置に設定する。加えて、レイヤ間画素限定RPSが、レイヤ間動き限定RPSよりもリスト先頭に近い位置に設定する。必ずしも全ての暫定参照リストにおいて、上記の位置にサブRPSを設定する必要はないが、少なくとも一つのサブRPSでは、上記の位置にサブRPSを設定することが好ましい。
上記の例によれば、性質の異なる3種類のサブRPS(レイヤ間画素動きRPS、レイヤ間画素限定RPS、レイヤ間動き限定RPS)を、参照頻度の高い順に並べて暫定参照リストを構築できるため、符号量を低減できる。
(1−3.別の性質との組み合わせ)
依存タイプにより特定されるレイヤ間参照の種別とは別の性質を組み合わせてレイヤ間RPSに分類されるサブRPSを構築してもよい。例えば、ビュースケーラビリティを用いる場合に、参照レイヤに対応する視点位置と対象レイヤに対する視点位置の相対関係によるサブRPSの分類と、依存タイプに基づくサブRPSの分類を組み合わせてもよい。さらに具体的な例を挙げると、一つのサブRPSを依存タイプを、「2」のレイヤ間参照ピクチャ(動き情報のみ利用)を除く視点位置が基礎視点(ベースビュー)と同じ方向に位置するレイヤ間参照ピクチャから構成する。もう一方のサブRPSを上記以外のレイヤ間参照ピクチャ(視点位置がベースビューと反対側、または、依存タイプが「2」のレイヤ間参照ピクチャ)から構成する。
図19は、参照レイヤに対応する視点位置と対象レイヤに対する視点位置の相対関係によるサブRPSの分類と、依存タイプに基づくサブRPSの分類を組み合わせる場合のサブRPSを例示する図である。図19に示すように、レイヤ間サブRPS0は、視点位置が基礎視点と同じ側(図中でVD=0)、かつ、依存タイプが「0」または「1」(図中でDT=0またはDT=1)のレイヤ間参照ピクチャを含む。一方、レイヤ間サブRPS1は、それ以外のレイヤ間参照ピクチャ、例えば、視点位置が基礎視点と反対側(図中でVD=1)のレイヤ間参照ピクチャや、依存タイプが「2」(図中でDT=2)のレイヤ間参照ピクチャを含む。
RPL導出部145では、暫定参照リストにおいて、上記レイヤ間サブRPS0(視点位置が基礎視点と同じ側で、かつ、復号画素を利用可能なレイヤ間参照ピクチャを含むサブRPS)を、上記レイヤ間サブRPS1(視点位置が基礎視点と反対側、または、動き情報のみを利用可能なレイヤ間参照ピクチャを含むサブRPS)よりもリスト内で前に位置するように設定する。必ずしも全ての暫定参照リストにおいて、レイヤ間サブRPS0をレイヤ間サブRPS1よりも前に設定する必要はないが、少なくとも一部の暫定参照リストにおいてそのように設定することが好ましい。
上記の例によれば、選択頻度の比較的低い、動き情報のみを利用可能なレイヤ間参照ピクチャを含むサブRPSであるサブRPS1が、サブRPS0に対して暫定参照リストにおいて後方に設定される。したがって、選択頻度が比較的高いサブRPS0に属するレイヤ間参照ピクチャの選択に係る符号量を低減できる。
なお、レイヤ間サブRPS1内におけるレイヤ間参照ピクチャの並べ順において、依存タイプ「2」のレイヤ間参照ピクチャを、他のレイヤ間参照ピクチャより後にする順序にすることが好ましい。
さらに、2つの参照ピクチャリストが存在する場合、Pスライスで使用される参照ピクチャリスト(例えばSHVCにおけるL0参照ピクチャリスト)を構築するための暫定参照リストにおいて、上記の順番でサブRPSの位置を設定することが好ましい。
Pスライスで使用される参照ピクチャリストは、他方の参照ピクチャリストに較べて使用頻度が高いため、レイヤ間サブRPSの順番を上記のように設定することで符号量を低減できる。
(1−4.スケーラビリティに関するピクチャ種別に基づくサブRPS)
対象レイヤと参照レイヤのスケーラビリティに関するピクチャの種別(スケーラビリティID)に基づいてレイヤ間サブRPSを導出してもよい。ここで、スケーラビリティIDは、用いられるスケーラビリティ(デプススケーラビリティ、ビュースケーラビリティ、空間/SNRスケーラビリティ)及びその組み合わせに応じて、対象レイヤに付加されるピクチャの種別を示すIDである。例えば、ビュースケーラビリティの場合には、ピクチャに付随する視点を区別することが必要になり、この視点を区別するためのIDであるビューIDが、スケーラブルIDとなる(ビューIDがスケーラブルとしてレイヤに付加される)。デプススケーラビリティの場合にはピクチャが、デプスであるかテクスチャであるかを区別する必要があるため、デプスであるか否かを示すデプスフラグがスケーラブルIDとなる。また、空間/SNRスケーラビリティの場合には、スケーラビリティIDの一つは、依存IDとなる。なお、複数のスケーラビリティが用いられる場合(例えば、デプススケーラブルかつビュースケーラブルの場合)には、スケーラビリティIDは、使用されるスケーラブルの数分(例えば、デプスフラグとビュIDの2個)のスケーラブルIDが各々のレイヤに付加される。
対象レイヤのスケーラビリティIDは、例えばVPSで伝送されるシンタックスdimension_id[i][j]として伝送される。dimension_id[i][j]は、レイヤiに対して定義されているj番目のスケーラビリティIDである。例えば、デプススケーラビリティとビュースケーラビリティが用いられる場合には、最初(j=0)のスケーラビリティIDは、デプスフラグを示し、次の(j=1)のスケーラビリティIDはビューIDを示す。すなわち、デプスフラグDepthFlagと、ビューID(ViewID)は次の式により導出される。
DepthFlag = dimension_id[i][0]
ViewID = dimension_id[i][1]
なお、スケーラブルID(デプスフラグ、ビューID、依存ID)は、dimension_id[i][j]で伝送される方法の他、NALユニットヘッダに付加されるレイヤIDなどから導出しても良い。
本実施形態のRPS導出部142は、対象レイヤと参照レイヤのスケーラブルIDが同じであるか異なるかに応じて、レイヤ間サブRPSを導出する。具体的には、参照レイヤのスケーラブルIDと対象レイヤのスケーラブルIDが等しい場合には、レイヤ間参照ピクチャをIL-RPS0(同一スケーラブルRPS)に設定し、参照レイヤのスケーラブルIDと対象レイヤのスケーラブルIDが異なる場合には、レイヤ間参照ピクチャをIL-RPS1(異スケーラブルRPS)に設定する。
ここで、複数のスケーラビリティが用いられる場合、(例えば、デプススケーラブルかつビュースケーラブルの場合)には、一つのレイヤに複数のスケーラブルIDが付加される。この場合には、複数のスケーラブルIDから一つのスケーラブルIDを選択して、対象レイヤと参照レイヤのスケーラブルIDが等しいか否かの一致判定を行う。このとき、複数のスケーラブルIDとして、以下のIDが付加されている場合には、次のスケーラブルIDを優先して、スケーラブルIDの一致判定に用いる。
デプススケーラビリティ(デプスフラグ)、ビュースケーラビリティ(ビューID)、空間/SNRスケーラビリティ(依存ID)
また、一致判定に用いるスケーラブルIDを、パラメータセット(VPS)で伝送しても構わない。この場合、例えば、dimension_id[i][j]を、レイヤiに対して定義されているj番目のスケーラビリティIDとして伝送する場合、一致判定に用いるスケーラブルIDのインデックスを判定用ID(reference_picture_order_decision_id)をパラメータセットから復号し、RPS導出部142は、dimension_id[i][reference_picture_order_decision_id]で示されるIDを用いて上記、一致判定を行う。また、reference_picture_order_decision_idに応じて、例えば値が0であれば、デプスフラグ、値が1であればビューID、値が2であれば依存IDを用いて判定を行っても良い。
特に、スケーラブルIDとして、デプススケーラビリティがあれば、デプススケーラビリティに対応するスケーラブルID(デプスフラグ)を用いることが好適である。
参照ピクチャリスト導出処理(RPL導出処理)において、本実施形態のRPL導出部145は、同一スケーラブルRPSを、異スケーラブルRPSに較べて、よりリストの先頭に近い位置に含むように暫定参照リスト(暫定参照L0参照リストおよび暫定L1参照リスト)を導出する。換言すると、暫定参照リストは、同一スケーラブルRPSを、異スケーラブルRPSに較べてより高い優先度に対応する位置に含んでいる。より具体的には、図15を参照して説明した暫定参照リスト導出処理におけるS403、S406、S505、S506の処理を以下の処理に置き換える。
(S403r3)暫定L0参照リストに対し、同一スケーラブルRPSに含まれる参照ピクチャを順に追加する。
(S406r3)暫定L0参照リストに対し、異スケーラブルRPSに含まれる参照ピクチャを順に追加する。
(S505r3)暫定L1参照リストに対し、同一スケーラブルRPSに含まれる参照ピクチャを順に追加する。
(S506r3)暫定L1参照リストに対し、異スケーラブルRPSに含まれる参照ピクチャを順に追加する。
一般に、スケーラブルIDが異なる場合には、スケーラブルIDが同じ場合よりも、復号画素および符号化パラメータ(動き情報、ブロック分割情報、変換係数情報、ループフィルタ情報)の相関が小さい、従って、復号画像および符号化パラメータを、予測のために、参照ピックチャから参照する場合において、対象ピクチャとスケーラブルIDが同じ(同一スケーラブルRPSに含まれる)参照ピクチャの方が、対象ピクチャとスケーラブルIDが異なる(異なスケーラブルRPSに含まれる)参照ピクチャよりも選択頻度が高い。レイヤ間参照ピクチャの選択に係る情報(例えば参照ピクチャインデックス)の符号量は、参照ピクチャリストの前方に位置する参照ピクチャの方が小さくなる。
上記のRPL導出処理によれば、選択頻度の比較的低い、対象ピクチャとスケーラブルIDが異なるレイヤ間参照ピクチャを含むサブRPSであるサブRPS1が、サブRPS0に対して暫定参照リストにおいて後方に設定される。したがって、選択頻度が比較的高いサブRPS0に属するレイヤ間参照ピクチャの選択に係る符号量を低減できる。特に、
上記のRPL導出処理は、サブRPSの区分けを行うスケーラブルIDがデプススケーラビリティに関する値である場合(デプスフラグに応じてサブRPSを導出する場合)に特に有効である。つまり、対象ピクチャと参照ピクチャのデプスフラグが等しい場合には、同一スケーラブルRPS(同一デプスフラグRPS)とし、対象ピクチャと参照ピクチャのデプスフラグが異なる場合には、異スケーラブルRPS(異デプスフラグRPS)とし、同一デプスフラグRPSを、異デプスフラグRPSに較べて、よりリストの先頭に近い位置に含むように暫定参照リスト(暫定参照L0参照リストおよび暫定L1参照リスト)を導出する構成が好適である。
また、上記のRPL導出処理によれば、異スケーラブルRPSを短期RPSよりもリストの後方に近い位置に含める。また、上記の暫定参照リストは、異スケーラブルRPSを暫定参照リストの末尾に含める。この構成は、サブRPSの区分けを行うスケーラブルIDがデプススケーラビリティに関する値である場合(デプスフラグに応じてサブRPSを導出する場合)に特に有効である。
対象ピクチャと参照ピクチャのビュースケーラビリティのスケーラビリティIDが異なる場合(ビューIDが異なる場合)や、対象ピクチャと参照ピクチャの空間/SNRスケーラビリティのスケーラビリティIDが異なる場合(解像度や量子化ステップ、ビット深度が異なる場合)にも、対象レイヤと参照レイヤの間で、画素間の依存性は比較的高い。しかしながら、対象ピクチャと参照ピクチャのデプススケーラビリティのスケーラビリティIDが異なる場合、には、対象レイヤがデプスであり、参照レイヤがテクスチャである場合、もしくは、対象レイヤがテクスチャであり、参照レイヤがデプスである場合であるには、画素間の相関は低い。これは、テクスチャの場合には、対象オブジェクトの明るさや色に応じて画素値が定まり、デプスの場合には、対象オブジェクトの奥行きに応じて画素値が定まるためである。なお、オブジェクトの動きを示す動き情報や、オブジェクト境界の位置に依存するその他の符号化パラメータの相関は比較的高い。
レイヤ間画像予測に用いる参照ピクチャを指定するための参照ピクチャインデックスは予測単位毎に含まれる(高頻度で符号化される)ため、画素間の相関が低いピクチャを、参照ピクチャリストの前方に配置すると、参照ピクチャインデックスの符号量が大きくなるという問題が生じる。従って、画素間の相関が低い対象レイヤと参照レイヤのデプスフラグが異なる場合の異スケーラブルRPS(異デプスフラグRPS)を、画素間の相関が高い短期RPSよりも方向に配置することで符号量が低減できる。また、同じレイヤに属する短期RPS、長期RPS、及び、同一スケーラブルRPSに含まれる参照ピクチャは全てデプスフラグが等しいため、異デプスフラグRPSに含まれる参照ピクチャよりも画素間の相関が高いと考えら得る。従って、相関の低い異デプスフラグRPSを暫定参照リストの末尾に含めることで符号量の低減が可能である。
(1−5.スケーラビリティタイプに基づくサブRPS)
対象レイヤと参照レイヤの間のスケーラビリティの種別(スケーラビリティタイプ)に基づいてレイヤ間サブRPSを導出してもよい。対象レイヤと参照レイヤの間のスケーラビリティタイプは、例えばVPSで伝送されるシンタックスdimension_id[i][j]として伝送される。dimension_id[i][j]は、レイヤiに対して定義されているj番目のスケーラビリティの種類を示す値であり、例えば、j番目のスケーラビリティとしてjについて「0」がデプススケーラビリティ、「1」がビュースケーラビリティ、「2」が空間またはSNRスケーラビリティを示す。
レイヤ間サブRPSは、例えば、ビューRPSとしてビュースケーラビリティを示す参照レイヤ(対象レイヤとビューIDが異なる参照レイヤ)に属する参照ピクチャを含むサブRPSを生成し、SNR空間RPSとして空間またはSNRスケーラビリティを含むサブRPS(対象レイヤと依存IDが異なる参照レイヤ)を生成できる。
また、参照レイヤkのスケーラビリティタイプが奥行き情報(デプスフラグが1)を示し、かつ、対象レイヤがテクスチャ情報(デプスフラグが0)である場合に、前記参照レイヤkに含まれる参照ピクチャを含むサブRPS(奥行き情報RPS)を生成してもよい。その場合、前記奥行き情報RPSは、他のサブRPSに対して暫定参照リスト内で後方に設定することが好ましい。なぜならば、奥行き情報の性質は通常のテクスチャ情報と異なるため、奥行き情報RPSに含まれる参照ピクチャの選択頻度が低いためである。逆に、参照レイヤkのスケーラビリティタイプがテクスチャ情報(デプスフラグが0)を示し、かつ、対象レイヤが奥行き情報(デプスフラグが1)である場合も、前記参照レイヤkに含まれる参照ピクチャを含むサブRPS(テクスチャ情報RPS)を生成してもよい。その場合、前記テクスチャ情報RPSは、他のサブRPSに対して暫定参照リスト内で後方に設定することが好ましい。この場合も、テクスチャ情報の性質は、通常のデプス情報と異なるため、テクスチャ情報RPSに含まれる参照ピクチャの選択頻度が低いためである。
[変形例2:サブRPSの並べ替え]
上記の階層動画像復号装置1の説明では、RPL導出部145における暫定参照リストの生成時に、レイヤ間サブRPSを規定の順序で並べることで暫定参照リストを生成する例を挙げたが、それに限らない。暫定参照リスト内のサブRPSの順序に係る情報(サブRPS順序情報)を伝送して、当該サブRPS順序情報に基づいて暫定参照リストを構築してもよい。符号化対象の入力動画像の特性に合わせて異なるサブRPS順序を適用することで、サブRSP順序が固定の場合に較べて、より少ない符号量で参照ピクチャの選択に係る情報を符号化できるため、符号化データの符号量を低減できる。以下、サブRPS順序情報を伝送する例を説明する。
なお、以下では、階層動画像復号装置1で図1を用いて説明したレイヤ間サブRPS(レイヤ間画素RPSとレイヤ間動き限定RPS)を例として説明を記載する。なお、本変形例に記載する技術は、上記以外のレイヤ間サブRPS定義を用いる場合にも適用可能であり、同様の効果を奏する。例えば、変形例1で説明した各種のレイヤ間サブRPS定義に対しても適用できる。
(2−1.レイヤ間サブRPSの先頭への移動)
特定のレイヤ間サブRPSを暫定参照リスト内で先頭に配置するか否かを示すフラグ(レイヤ間サブRPS先頭フラグ)を伝送し、当該フラグの値に基づいて暫定参照リストを設定できる。
レイヤ間サブRPS先頭フラグは、パラメータセット(VPSまたはSPS)に含まれるフラグであって、レイヤ毎に伝送される。なお、ベースレイヤにはレイヤ間参照ピクチャが存在しないため、レイヤ間サブRPS先頭フラグのシグナルを省略することが好ましい。
レイヤ間サブRPS先頭フラグが「0」の場合、規定の順序でサブRPSを並べて暫定参照リストを生成することを意味する。具体的には、RPL導出部145は、図15を用いて説明した方法で暫定参照リスト(暫定L0参照リスト、および、暫定L1参照リスト)を生成する。
レイヤ間サブRPS先頭フラグが「1」の場合、レイヤ間画素RPSを暫定L0参照リストの先頭に配置することを示す。具体的には、レイヤ間サブRPS先頭フラグが「0」の場合と同じ並び順で暫定L0参照リストを構築した後に、レイヤ間画素RPSを暫定参照リストの先頭に配置する。生成される暫定参照リストの例を図20に示す。図20はレイヤ間サブRPS先頭フラグが「1」の場合に生成される暫定参照リストを例示する図である。レイヤ間画素RPSが、暫定L0参照リストの先頭に配置されている。
なお、レイヤ間サブRPS先頭フラグが「1」の場合、に暫定L0参照リスト、および、暫定L1参照リストの両方でレイヤ間画素RPSを先頭に配置してもよい。
一般に、同一レイヤ内の参照ピクチャ(例えば前方短期RPSに含まれる参照ピクチャ)は、レイヤ間参照ピクチャ(例えばレイヤ間画素RPSに含まれる参照ピクチャ)に較べて選択頻度が高い。しかしながら、スケーラビリティの種類や、入力動画像の性質によっては、レイヤ間参照ピクチャの選択頻度が高くなる場合もある。したがって、そのような場合に、上記のレイヤ間サブRPS先頭フラグを用いることで、暫定参照リスト内で選択頻度の比較的高いレイヤ間参照ピクチャを前方に配置できるため、レイヤ間参照ピクチャの選択に係る情報(例えば参照ピクチャインデックス)をより少ない符号量で符号化できるため、符号化データの符号量を低減できる。
なお、上記の例では2種類あるレイヤ間サブRPSのうち、レイヤ間画素RPSを暫定参照リストの先頭に配置すると説明した。一般に、複数のレイヤ間サブRPSが存在する場合、選択頻度が比較的高いレイヤ間参照ピクチャを含むレイヤ間サブRPSの位置が先頭か否かを、レイヤ間サブRPS先頭フラグで指定することが好ましい。換言すると、既定の暫定参照リスト生成方法(レイヤ間サブRPS先頭フラグが「0」の場合の暫定参照リスト生成方法)において、暫定参照リスト内で最も先頭に近い位置にあるレイヤ間サブRPSを対象として、当該レイヤ間サブRPSが暫定参照リストの先頭か否かの情報をレイヤ間サブRPS先頭フラグで伝送することが好ましい。
なお、レイヤ間サブRPS先頭フラグが「1」の場合に、必ずしも全ての暫定参照リストで特定のレイヤ間サブRPSを先頭に配置する必要はない。少なくとも一つの暫定参照リストにおいて、特定のレイヤ間サブRPSが先頭に配置されていれば、効果が得られる。
また、参照ピクチャリストの種類毎に独立にレイヤ間サブRPS先頭フラグを伝送しても構わない。例えば、暫定L0参照リストに対するレイヤ間サブRPS先頭フラグと、暫定L1参照リストに対するレイヤ間サブRPS先頭フラグをそれぞれ伝送し、各フラグの値に基づいて、暫定L0参照リストと暫定L1参照リストを設定してもよい。
(2−2.レイヤ間サブRPSの入れ替え)
複数のレイヤ間サブRPSの順序を暫定参照リスト内で入れ替えるか否かを示すフラグ(レイヤ間サブRPS順序交換フラグ)を伝送し、当該フラグの値に基づいて暫定参照リストを設定できる。
レイヤ間サブRPS順序交換フラグは、パラメータセット(VPSまたはSPS)に含まれるフラグであって、レイヤ毎に伝送される。なお、ベースレイヤにはレイヤ間参照ピクチャが存在しないため、レイヤ間サブRPS順序交換フラグのシグナルを省略することが好ましい。
レイヤ間サブRPS順序交換フラグが「0」の場合、規定の順序でサブRPSを並べて暫定参照リストを生成することを意味する。具体的には、RPL導出部145は、図15を用いて説明した方法で暫定参照リスト(暫定L0参照リスト、および、暫定L1参照リスト)を生成する。
レイヤ間サブRPS順序交換フラグが「1」の場合、2つのレイヤ間サブRPS(レイヤ間画素RPSとレイヤ間動き限定RPS)の暫定参照リスト内での順序を交換することを示す。具体的には、レイヤ間サブRPS順序交換フラグが「0」の場合と同じ並び順で暫定参照リストを構築した後に、レイヤ間画素RPSとレイヤ間動き限定RPSの順序を交換する。生成される暫定参照リストの例を図21に示す。図21はレイヤ間サブRPS順序交換フラグが「1」の場合に生成される暫定参照リストを例示する図である。既定の順序でレイヤ間動き限定RPSの前方にあったレイヤ間画素RPSが、レイヤ間動き限定RPSの後方に設定されている。
一般に、復号画素が利用不可能であり、かつ、動き情報が参照可能なレイヤ間参照ピクチャ(例えばレイヤ間動き限定RPSに含まれる参照ピクチャ)の選択頻度は低い。しかしながら、メモリの低減を目的として、特定のピクチャに対して、レイヤ間画像予測を禁止する場合がある。そのような場合、レイヤ間画像予測が利用できないため、レイヤ間動き限定RPSに含まれるレイヤ間参照ピクチャの選択頻度が、レイヤ間画素RPSに含まれるレイヤ間参照ピクチャに較べて高くなる。したがって、そのような場合に、上記のレイヤ間サブRPS順序交換フラグを用いることで、暫定参照リスト内で選択頻度の比較的高いレイヤ間参照ピクチャ(この場合、レイヤ間動き限定RPSに含まれるレイヤ間参照ピクチャ)を前方に配置できるため、レイヤ間参照ピクチャの選択に係る情報(例えば参照ピクチャインデックス)をより少ない符号量で符号化できるため、符号化データの符号量を低減できる。
なお、レイヤ間サブRPSが3以上ある場合には、複数のレイヤ間サブRPS順序交換フラグを伝送してもよいし、特定の2つのレイヤ間サブRPS(例えば、既定の暫定参照リストの順序で先頭に近い2つのレイヤ間サブRPS)に対してのみレイヤ間サブRPS順序交換フラグを伝送してもよい。
(2−3.一般的表現)
複数のレイヤ間サブRPSの順序を明示的に指定する情報(レイヤ間サブRPS順序情報)を伝送し、当該情報に基づいて暫定参照リストを設定できる。
レイヤ間サブRPS順序情報は、パラメータセット(VPSまたはSPS)に含まれる情報である。レイヤ間サブRPS順序情報に係るシンタックスは対応するシンタックス表に基づいて可変長復号部12において符号化データより復号される。図22は、レイヤ間サブRPS順序情報の復号に係るシンタックス表の一部を示す。
図22に示すように、レイヤ間サブRPS順序情報は、サブRPS並べ替え有効フラグ(sub_rps_reorder_enabled_flag)を含む。サブRPS並べ替え有効フラグが「0」の場合、サブRPS並べ替えが無効であることを示す。サブRPS並べ替え有効フラグが「1」の場合(真の場合)、サブRPS並べ替えが有効であることを示す。サブRPS並べ替えが有効である場合、以降に説明するシンタックスが追加で復号される。なお、サブRPS並べ替え有効フラグは省略して、常に残りのレイヤ間サブRPS順序情報を復号してもよい。サブRPS並べ替え有効フラグを用いることで、典型的なケースである、サブRPS並べ替えを行わない場合の符号量のオーバーヘッドを低減できるため、好ましい。
レイヤ間サブRPS順序情報は、サブRPSの最大数(MaxNumSubRps)が2より大きい場合(MaxNumSubRps>2の場合)、並べ替え対象サブRPS個数を示すシンタックス(num_reordered_sub_rps_minus2)を復号する。実際の並べ替え対象サブRPS個数(NumReorderedSubRps)はシンタックスnum_reoredered_sub_rps_minus2に2を加算した値に設定される。num_reoredered_sub_rps_minus2が伝送されない場合、num_reoredered_sub_rps_minus2の値は0と推定される。なお、サブRPS最大個数の値に係らず、並べ替え対象サブRPS個数を示すシンタックスを復号してもよいが、サブRPS最大個数が2より大きい場合のみ復号することで符号量を削減できる。
次に、並べ替え対象サブRPS個数分のサブRPS位置(sub_rps_position[i])が復号される。ここで、0からNumReorderedSubRps-1の範囲のiに対応するシンタックスsub_rps_position[i]が復号される。NumReorderedSubRpsからMaxNumSubRps-1の範囲のiに対応するsub_rps_position[i]の値は伝送されず、sub_rps_position[i]の値はiと推定される。これは、NumReorderedSubRpsからMaxNumSubRps-1の範囲のサブRPSの並べ替えを実行しないことを意味する。なお、0からMaxNumSubRps-1の範囲のサブRPS(全てのサブRPS)に対してサブRPSを明示的に伝送してもよい。しかしながら、0からNumReorderedSubRps-1の範囲のiにのみサブRPSを明示的に伝送する方が、例えば典型的なケースである2つのサブRPSの順序のみを入れ替える場合に、より少ない符号量でサブRPS位置を伝送できるため、好ましい。
次にRPL導出部145において、前述のレイヤ間サブRPS順序情報に基づいて暫定参照リストを導出する手順を説明する。なお、前提として、レイヤ間サブRPSには、暫定参照リスト内での既定位置を表わす番号(既定位置番号)が割り当てられているものとする。既定位置番号は0から始まる昇順の整数であって、暫定参照リスト内での既定の位置が先頭に近いレイヤ間サブRPSほど小さい番号が対応付けられている。例えば、暫定参照リスト内での既定位置が先頭に近い方から順に3つのレイヤ間サブRPS(IL-subRPS0、IL-subRPS1、IL-subRPS2)がある場合、IL-subRPS0の既定位置番号は「0」、IL-subRPS1の既定位置番号は「1」、IL-subRPS2の既定位置番号は「2」となる。
サブRPS位置(sub_rps_position[i])は、既定位置番号が「i」のレイヤ間参照ピクチャの、サブRPS並べ替え適用後の暫定参照リスト内の位置を示す。例えば、IL-subRPS0のサブRPS位置が「2」、IL-subRPS1のサブRPS位置が「1」、IL-subRPS2のサブRPS位置が「0」の場合、並べ替え後の暫定参照リストでは、リスト前方に近い方から、IL-subRPS2、IL-subRPS1、IL-subRPS0の順にレイヤ間サブRPSが含まれている。
上記の変形例によると、複数のレイヤ間サブRPSの暫定参照リスト内での並び順を、符号化データより復号されたサブRPS位置を用いて変更できる。入力動画像の特性に応じて、より選択頻度の高いサブRPSが暫定参照リスト内で先頭に近い位置に設定できるため、参照ピクチャ選択に係る情報をより少ない符号量で復号できるため、符号化データの符号量を低減できる。
なお、上記の説明ではレイヤ間サブRPSの位置のみを並べ替える例を挙げたが、同一レイヤ内の参照ピクチャを含むRPS(例えば、前方短期RPS、後方短期RPS、長期RPS)を含めた位置を指定してサブRPSを並べ替えることで暫定参照リストを生成してもよい。
(2−4.スケーラビリティタイプに基づくサブRPSの並べ替え)
複数のレイヤ間サブRPSの順序を暫定参照リスト内で並べ替える情報を追加で伝送せず、レイヤ間のスケーラビリティの種類を示すスケーラビリティタイプに基づいてレイヤ間サブRPSの順序を決定して暫定参照リストを設定できる。
例えば、対象レイヤと参照レイヤの間のスケーラビリティの種類がビュースケーラビリティの場合に、当該スケーラビリティの種類が空間スケーラビリティの場合に較べて、レイヤ間サブRPSがリストの前方に位置するように暫定参照リストを生成してもよい。
ビュースケーラビリティの場合、対象レイヤと参照レイヤの解像度が等しいため、両レイヤの解像度が異なる空間スケーラビリティの場合に較べて、レイヤ間参照ピクチャの選択頻度が高い。したがって、ビュースケーラビリティの場合に、レイヤ間参照ピクチャを含むレイヤ間サブRPSを暫定参照リスト内で前方に近い位置に設定することで、参照ピクチャ選択に係る情報をより少ない符号量で復号できるため、符号化データの符号量を低減できる。
なお、ビュースケーラビリティの場合だけではなく、SNRスケーラビリティの場合にも同様の技術が利用できる。すなわち、対象レイヤと参照レイヤの間のスケーラビリティの種類がSNRスケーラビリティの場合に、当該スケーラビリティの種類が空間スケーラビリティの場合に較べて、レイヤ間サブRPSがリストの前方に位置するように暫定参照リストを生成してもよい。
一般に、レイヤ間予測の精度(選択率)がより高くなるスケーラビリティの種類の場合に、レイヤ間予測の精度が低いスケーラビリティの種類に較べて、レイヤ間サブRPSがリストの前方に位置するように暫定参照リストを生成することが好ましい。
〔階層動画像符号化装置〕
以下では、本実施形態に係る階層動画像符号化装置2の構成について、図23を参照して説明する。
(2−5.サブRPS情報の伝送位置)
上記の2−1から2−3に示した例ではサブRPS順序情報(レイヤ間サブRPS先頭、フラグレイヤ間サブRPS順序交換フラグ、レイヤ間サブRPS順序情報)をパラメータセット(VPSまたはSPS)で伝送すると記載したが、それに限らない。例えば、ピクチャパラメータセットやスライスヘッダに含めて伝送しても構わない。
しかしながら、階層動画像復号装置がスライス単位やピクチャ単位で参照ピクチャリスト内の参照ピクチャの並び替えを行う機能を有する場合、複数のピクチャやスライスに共通して適用可能であるパラメータセット(VPSやSPS)においてサブRPS順序情報を伝送することが好ましい。パラメータセットでサブRPS単位の並べ替え情報を伝送し、スライスやピクチャで参照ピクチャ単位の並べ替え情報を伝送することで、より少ない符号量の符号化データから参照ピクチャ選択に係る情報を復号できる。 (階層動画像符号化装置の構成)
図23を用いて、階層動画像符号化装置2の概略構成を説明する。図23は、階層動画像符号化装置2の概略的構成を示した機能ブロック図である。階層動画像符号化装置2は、対象レイヤの入力画像PIN#Tを、参照レイヤ符号化データDATA#Rを参照しながら符号化して、対象レイヤの階層符号化データDATAを生成する。なお、参照レイヤ符号化データDATA#Rは、参照レイヤに対応する階層動画像符号化装置において符号化済みであるとする。
図23に示すように階層動画像符号化装置2は、ピクチャ符号化部21、可変長符号化部22、NAL多重化部23、復号ピクチャ管理部14、および、ベース復号部15を備える。
ピクチャ符号化部21は、入力画像PIN#Tを符号化して対応するシンタックス値を生成して出力する。また、同時に出力したシンタックス値を用いて復号処理を行うことで復号ピクチャを生成して出力する。ピクチャ符号部21は、シンタックス値または復号ピクチャの生成に、入力される参照ピクチャリストを利用したインター予測またはレイヤ間画像予測を用いる。
可変長符号化部は、入力されるシンタックス値を可変長符号化して対象レイヤ符号化データDATA#Tとして出力する。
NAL多重化部23は、入力される対象レイヤ符号化データDATA#Tと、参照レイヤ符号化データDATA#RとをNALユニットに格納することでNAL多重化した階層動画像符号化データDATAを生成し、外部に出力する。
復号ピクチャ管理部14は、既に説明した階層動画像復号装置1の備える復号ピクチャ管理部14と同一の構成要素である。ただし、階層動画像符号化装置2の備える復号ピクチャ管理部14では、DPBに記録されたピクチャを出力ピクチャとして出力する必要はないため、当該出力は省略できる。なお、階層動画像復号装置1の復号ピクチャ管理部14の説明において「復号」として説明した記載は「符号化」と置き換えることで、階層動画像符号化装置2の復号ピクチャ管理部14にも適用できる。
ベース復号部15は、既に説明した階層動画像復号装置1の備えるベース復号部15と同一の構成要素であり、詳細説明は省略する。
(動画像符号化装置2の効果)
以上説明した本実施形態に係る階層動画像符号化装置2は、ピクチャ管理部14内にRPS導出部142を備えており、前記RPS導出部は、復号画素(復号画像の画素値)が参照される可能性のあるレイヤ間参照ピクチャを含むレイヤ間画素RPSと、復号画素が参照される可能性のあるレイヤ間参照ピクチャを含まず、かつ、動き情報が参照される可能性のあるレイヤ間参照ピクチャを含むレイヤ間動き限定RPSを導出する。また、階層動画像符号化装置2は、ピクチャ管理部14内にRPL導出部145を備えており、前記RPL導出部は、レイヤ間画素RPSがレイヤ間動き限定RPSに較べてリスト先頭に近い位置にある暫定参照リストを生成し、当該暫定参照リストに基づいて参照リストを生成する。したがって、階層動画像復号装置1は、レイヤ間画素RPSに含まれるレイヤ間参照ピクチャを指定する参照ピクチャインデックスが少ない符号量で符号化して符号化データを生成できる。
(他の階層動画像符号化/復号システムへの適用例)
上述した階層動画像符号化装置2及び階層動画像復号装置1は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用できる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
図24に基づいて、上述した階層動画像符号化装置2および階層動画像復号装置1を、動画像の送信および受信に利用できることを説明する。図24の(a)は、階層動画像符号化装置2を搭載した送信装置PROD_Aの構成を示したブロック図である。
図24の(a)に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3とを備えている。上述した階層動画像符号化装置2は、この符号化部PROD_A1として利用される。
送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部A7を更に備えていてもよい。図24の(a)においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。
図24の(b)は、階層動画像復号装置1を搭載した受信装置PROD_Bの構成を示したブロック図である。図24の(b)に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3とを備えている。上述した階層動画像復号装置1は、この復号部PROD_B3として利用される。
受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図24の(b)においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。
例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。
また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置PROD_A/受信装置PROD_Bの一例である(通常、LANにおいては伝送媒体として無線又は有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。
なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。
図25に基づいて、上述した階層動画像符号化装置2および階層動画像復号装置1を、動画像の記録および再生に利用できることを説明する。図25の(a)は、上述した階層動画像符号化装置2を搭載した記録装置PROD_Cの構成を示したブロック図である。
図25の(a)に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した階層動画像符号化装置2は、この符号化部PROD_C1として利用される。
なお、記録媒体PROD_Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)等のように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリ等のように、記録装置PROD_Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)等のように、記録装置PROD_Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部C6を更に備えていてもよい。図25の(a)においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。
なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD(Hard Disk Drive)レコーダなどが挙げられる(この場合、入力端子PROD_C4又は受信部PROD_C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラPROD_C3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部PROD_C5又は画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラPROD_C3又は受信部PROD_C5が動画像の主な供給源となる)なども、このような記録装置PROD_Cの一例である。
図25の(b)は、上述した階層動画像復号装置1を搭載した再生装置PROD_Dの構成を示したブロックである。図25の(b)に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した階層動画像復号装置1は、この復号部PROD_D2として利用される。
なお、記録媒体PROD_Mは、(1)HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図25の(b)においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。
なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイPROD_D3が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子PROD_D4又は送信部PROD_D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)なども、このような再生装置PROD_Dの一例である。
(ハードウェア的実現およびソフトウェア的実現について)
最後に、階層動画像復号装置1、階層動画像符号化装置2の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
後者の場合、上記各装置は、各機能を実現する制御プログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(またはCPUやMPU(Micro Processing Unit))が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM(Compact Disc Read-Only Memory)/MO(Magneto-Optical)/MD(Mini Disc)/DVD(Digital Versatile Disk)/CD−R(CD Recordable)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(Erasable Programmable Read-only Memory)/EEPROM(登録商標)(Electrically Erasable and Programmable Read-only Memory)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、ISDN(Integrated Services Digital Network)、VAN(Value-Added Network)、CATV(Community Antenna Television)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(Institute of Electrical and Electronic Engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDA(Infrared Data Association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、画像データが階層的に符号化された符号化データを復号する階層画像復号装置、および、画像データが階層的に符号化された符号化データを生成する階層画像符号化装置に好適に適用できる。また、階層画像符号化装置によって生成され、階層画像復号装置によって参照される階層符号化データのデータ構造に好適に適用できる。
1 階層動画像復号装置(画像復号装置)
11 NAL逆多重化部
12 可変長復号部
13 ピクチャ復号部
14 復号ピクチャ管理部
141 DPB
142 RPS導出部
143 参照ピクチャ制御部
144 ベース参照ピクチャ制御部
145 RPL導出部
146 出力制御部
15 ベース復号部
151 可変長復号部
153 ベースピクチャ復号部
154 ベース復号ピクチャ管理部
2 階層動画像符号化装置(画像符号化装置)
21 ピクチャ符号化部
22 可変長符号化部
23 NAL多重化部

Claims (9)

  1. 階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、上位レイヤの復号ピクチャを復元する画像復号装置であって、
    参照ピクチャセットを導出するRPS導出部を備え、
    上記RPS導出部は、上記参照ピクチャセットを構成するサブRPSとして、少なくとも第一のサブRPSと、第二のサブRPSを導出し、
    上記第一のサブRPSは、画素依存のレイヤ間参照ピクチャを含み、
    上記第二のサブRPSは、画素非依存のレイヤ間参照ピクチャを含むことを特徴とする画像復号装置。
  2. 参照ピクチャリストを導出するRPL導出部を備え、
    上記RPL導出部は、上記第一のサブRPSが上記第二のサブRPSに較べてリスト前方に位置する暫定参照リストを少なくとも一つ生成し、該暫定参照リストに基づいて上記参照ピクチャリストを導出することを特徴とする請求項1に記載の画像復号装置。
  3. 上記RPS導出部は、上記参照ピクチャセットを構成するサブRPSとして、さらに、前方短期RPS、後方短期RPSを導出し、
    上記RPL導出部は、上記第二のサブRPSを、上記、前方短期RPS、後方短期RPSよりも後方に位置する暫定参照リストを少なくとも一つ生成し、該暫定参照リストに基づいて上記参照ピクチャリストを導出することを特徴とする請求項2に記載の画像復号装置。
  4. 上記第一のサブRPSは、関連付けられた依存タイプが、画素依存かつ動き依存を示し、
    上記第二のサブRPSは、関連付けられた依存タイプが、画素非依存かつ動き依存を示すことを特徴とする、請求項1から請求項3に記載の画像復号装置。
  5. 上記暫定参照リスト内のサブRPS順序に係るサブRPS順序情報を復号する可変長復号部を備え、
    上記RPL導出部は、上記サブRPS順序情報に基づいて、上記暫定参照リストを生成することを特徴とする請求項2または請求項3に記載の画像復号装置。
  6. 上記サブRPS順序情報は、複数のピクチャから参照可能であるパラメータセットに含まれていることを特徴とする請求項5に記載の画像復号装置。
  7. 上記サブRPS順序情報は、レイヤ間サブRPSを上記暫定参照リストの先頭に設定するか否かを示すフラグを含むことを特徴とする請求項5または請求項6に記載の画像復号装置。
  8. 上記サブRPS順序情報は、上記第一のサブRPSと上記第二のサブRPSの暫定参照リスト内での位置として、既定の暫定参照リスト内での位置を用いるか、既定の暫定参照リスト内での位置に対して上記第一のサブRPSと上記第二のサブRPSを入れ替えた位置を用いるかを示すフラグを含むことを特徴とする請求項5または請求項6に記載の画像復号装置。
  9. 入力画像から上位レイヤの符号化データを生成する画像符号化装置であって、
    参照ピクチャセットを導出するRPS導出部を備え、
    上記RPS導出部は、上記参照ピクチャセットを構成するサブRPSとして、少なくとも第一のサブRPSと、第二のサブRPSを導出し、
    上記第一のサブRPSは、画素依存のレイヤ間参照ピクチャを含み、
    上記第二のサブRPSは、画素非依存のレイヤ間参照ピクチャを含むことを特徴とする画像符号化装置。
JP2013179067A 2013-08-30 2013-08-30 画像復号装置および画像符号化装置 Pending JP2015050506A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013179067A JP2015050506A (ja) 2013-08-30 2013-08-30 画像復号装置および画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013179067A JP2015050506A (ja) 2013-08-30 2013-08-30 画像復号装置および画像符号化装置

Publications (1)

Publication Number Publication Date
JP2015050506A true JP2015050506A (ja) 2015-03-16

Family

ID=52700203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013179067A Pending JP2015050506A (ja) 2013-08-30 2013-08-30 画像復号装置および画像符号化装置

Country Status (1)

Country Link
JP (1) JP2015050506A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450433A (zh) * 2020-03-26 2021-09-28 阿里巴巴集团控股有限公司 图片生成方法、装置、计算机设备和介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450433A (zh) * 2020-03-26 2021-09-28 阿里巴巴集团控股有限公司 图片生成方法、装置、计算机设备和介质

Similar Documents

Publication Publication Date Title
US10237564B1 (en) Image decoding device, image decoding method, image coding device, and image coding method
JP6800837B2 (ja) 画像復号装置、及び画像復号方法
JP6456535B2 (ja) 画像符号化装置、画像符号化方法および記録媒体
CN105519119B (zh) 图像解码装置
JP6352248B2 (ja) 画像復号装置、および画像符号化装置
US10136151B2 (en) Image decoding device and image decoding method
WO2015083575A1 (ja) 画像復号装置、画像符号化装置、および、符号化データ変換装置
US10841600B2 (en) Image decoding device, an image encoding device and a decoding method
JP2015119402A (ja) 画像復号装置、画像符号化装置、及び符号化データ
JP2015073213A (ja) 画像復号装置、画像符号化装置、符号化データ変換装置、および、注目領域表示システム
JP2015050506A (ja) 画像復号装置および画像符号化装置
JP2015002495A (ja) 画像復号装置、および画像符号化装置
JP2015076806A (ja) 画像復号装置および画像符号化装置
JPWO2015098713A1 (ja) 画像復号装置および画像符号化装置
JP2015076807A (ja) 画像復号装置、画像符号化装置、および符号化データのデータ構造

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150423