JP2013243636A - 画像復号装置および画像符号化装置 - Google Patents

画像復号装置および画像符号化装置 Download PDF

Info

Publication number
JP2013243636A
JP2013243636A JP2012149983A JP2012149983A JP2013243636A JP 2013243636 A JP2013243636 A JP 2013243636A JP 2012149983 A JP2012149983 A JP 2012149983A JP 2012149983 A JP2012149983 A JP 2012149983A JP 2013243636 A JP2013243636 A JP 2013243636A
Authority
JP
Japan
Prior art keywords
image
filter
unit
prediction
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012149983A
Other languages
English (en)
Inventor
Tomoko Aono
友子 青野
Tomohiro Igai
知宏 猪飼
Masanobu Yasugi
将伸 八杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2012149983A priority Critical patent/JP2013243636A/ja
Priority to PCT/JP2013/061589 priority patent/WO2013161690A1/ja
Publication of JP2013243636A publication Critical patent/JP2013243636A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

【課題】下位レイヤからの復号画像の画質を向上させることで、上位レイヤにおける符号化効率を向上させ、上位レイヤの復号画像の客観・主観画質を向上させる。
【解決手段】階層画像復号装置1は、参照する下位レイヤからの復号画像に対して、フィルタ適用判定部1311が決定したフィルタを適用するフィルタ適用部1312と、を備えている。
【選択図】図1

Description

本発明は、画像データが階層的に符号化された符号化データを復号する画像復号装置、および、画像データが階層的に符号化された符号化データを生成する画像符号化装置に関する。
通信システムで伝送される情報、あるいは蓄積装置に記録される情報の1つに画像あるいは動画像がある。これらの画像(以降、動画像を含む)の伝送・蓄積においては、必要なデータレートに従って、画像を階層的に符号化する階層符号化が用いられる。
階層符号化の方式としては、ISO/IECとITU−Tの標準としてH.264/AVC Annex G Scalable Video Coding(SVC)が挙げられる。SVCでは空間スケーラビリティ、時間スケーラビリティ、SNRスケーラビリティをサポートする。例えば空間スケーラビリティの場合、原画像から所望の解像度にダウンサンプリングした画像を下位レイヤとしてH.264/AVCで符号化する。次に上位レイヤではレイヤ間の冗長性を除去するためにレイヤ間予測を行う。レイヤ間予測としては、動き予測に関する情報を同時刻の下位レイヤの情報から予測する動き情報予測、あるいは同時刻の下位レイヤの復号画像をアップサンプリングした画像から予測するテクスチャ予測がある(非特許文献1)。
図18は階層画像符号化装置200の一例を示すブロック図である。図18に示すように階層画像符号化装置200は、下位レイヤ画像符号化装置2001、上位レイヤ画像符号化装置2002、アップサンプリング部2003、切り替え部2004、ダウンサンプリング部2005、切り替え部2006を備える。
下位レイヤ画像符号化装置2001は、所定の符号化方式により下位レイヤにおける符号化を行うものであり、例えばSVCの場合はH.264/AVCで符号化する。下位レイヤ画像符号化装置2001は原画(入力画像)あるいは原画をダウンサンプリングした画像を符号化して、下位レイヤ符号化データを出力する。
上位レイヤ画像符号化装置2002は、原画を、下位レイヤの復号画像あるいは復号画像をアップサンプリングした画像、下位レイヤの符号化情報(動き予測に関する情報等)を用いて符号化し、上位レイヤ符号化データを出力する。
アップサンプリング部2003は空間スケーラビリティの場合に、下位レイヤの復号画像をアップサンプリングする。
切り替え部2004は空間スケーラビリティではアップサンプリングし、それ以外の場合はアップサンプリングをスキップするよう処理を切り替える。
ダウンサンプリング部2005は空間スケーラビリティの場合に原画をダウンサンプリングする。
切り替え部2006は空間スケーラビリティではダウンサンプリングし、それ以外の場合はダウンサンプリングをスキップするよう処理を切り替える。
図19は階層画像復号装置100の一例を示すブロック図である。図19に示すように階層画像復号装置100は、下位レイヤ画像復号装置1001、上位レイヤ画像復号装置1002、アップサンプリング部1003、および、切り替え部1004を備える構成である。
下位レイヤ画像復号装置1001は、下位レイヤ符号化データを所定の符号化方式により復号するものであり、例えばSVCの場合はH.264/AVCで復号する。下位レイヤ画像復号装置1001は下位レイヤ符号化データを復号して下位レイヤの復号画像を出力する。上位レイヤ画像復号装置1002は、上位レイヤ符号化データ、下位レイヤの復号画像あるいは復号画像をアップサンプリングした画像、および下位レイヤの符号化情報(動き予測に関する情報等)を用いて、上位レイヤ復号画像を出力する。アップサンプリング部1003、切り替え部1004は、それぞれ図18のアップサンプリング部2003、切り替え部2004と同じ構成要素であるため、説明を省略する。
また近年、画像符号化あるいは復号処理のループの中でフィルタ処理を施すループフィルタ技術が提案されている。
ループフィルタは、原画と、予測画像に予測誤差画像を加算した復号画像との差分を最小にする(客観画質を向上させる)、あるいは主観画質を向上させることを目的として設けられる。ループフィルタを適用した復号画像を、予測画像を生成するときの動き補償で用いる参照画像とすることで、参照画像の客観・主観画質を向上させ、さらには動き補償を用いて符号化する以降の画像の画質を向上させることができる。このループフィルタの例としては、デブロッキングフィルタ、SAO(サンプル適応オフセット)フィルタ、ALF(適応ループフィルタ)が挙げられる(非特許文献2)。
ITU-T H.264 「Advanced video coding for generic audiovisual services」(2007年11月公開) 「JCTVC-H1003_dk High efficiency video coding (HEVC) text specification draft6」, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: San Jose, US, 1-10 Feburary, 2012(2012年2月17日公開)
ところで階層符号化においては、上位レイヤの画像を下位レイヤの画像からテクスチャ予測する場合、空間スケーラビリティにおいては下位レイヤの復号画像をアップサンプリングして予測画像とし、時間スケーラビリティやSNRスケーラビリティにおいては下位レイヤの復号画像をそのまま予測画像として用いていた。そのため、下位レイヤの復号画像が多くの符号化歪(ブロック歪、量子化雑音等)を含む低品質画像であった場合、この復号画像を参照した上位レイヤの予測画像も低品質となり、結果的に上位レイヤの符号化データ量の増加を招くことになる。
本発明はこのような課題を解決するために、下位レイヤからの復号画像の画質を向上させることで、上位レイヤにおける符号化効率を向上させ、上位レイヤの復号画像の客観・主観画質を向上させる画像復号装置および画像符号化装置を提供する。
上記の課題を解決するために、本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、上記上位レイヤから参照する上記下位レイヤからの復号画像に対して適用するフィルタを決定するフィルタ適用決定手段と、参照する上記下位レイヤからの復号画像に対して、上記フィルタ適用決定手段が決定したフィルタを適用するフィルタ適用手段と、を備えていることを特徴とする。
上記構成によれば、上位レイヤの予測画像を生成する際、上位レイヤから下位レイヤからの復号画像を参照する際に、下位レイヤからの復号画像に対してフィルタを適用することができる。なお、“適用するフィルタを決定する”ことには、フィルタを適用しないことを決定することが含まれる。
このため上記構成によれば、フィルタの適用により下位レイヤからの復号画像の客観・主観画質を向上させることができる。フィルタを適用した下位レイヤからの復号画像を上位レイヤのテクスチャ予測に利用することで、上位レイヤでのレイヤ間予測をより正確に行うことができる。
その結果、下位レイヤからの復号画像の画質を向上させることで、上位レイヤにおける符号化効率を向上させ、上位レイヤの復号画像の客観・主観画質を向上させることができるという効果を奏する。
さらにいえば、原画と、予測画像に予測誤差画像を加算した上位レイヤの復号画像との差分を最小にする(客観画質を向上させる)こと、あるいは、主観画質を向上させることができる。
本発明に係る画像復号装置では、上記フィルタ適用決定手段は、所定の指標に関し要求される符号化効率に応じて、適用するフィルタを決定することが好ましい。
上記構成によれば、所定の指標に関し、要求される符号化効率に応じた種類のフィルタを適用することができる。フィルタの種類には、単一のフィルタおよび複数のフィルタの組み合わせが含まれる。
所定の指標としては、例えば、スケーラビリティの種類、ピクチャタイプ、および下位レイヤのコーデックの種類などが挙げられる。
所定の指標に関し、高画質が求められる場合、高い符号化効率が要求される。また、所定の指標に関し、それほど高画質でなくても構わない場合、符号化効率は、高画質が求められる場合よりも低くても構わない。
例えば、スケーラビリティの指標に関して言えば、次のとおりである。空間スケーラビリティの場合、上位レイヤの画像と下位レイヤの画像の解像度が異なるため、処理量は多いが、画質向上幅の高いALFが適している。
また、それ以外のスケーラビリティの場合、上位レイヤの画像と下位レイヤの画像の解像度が同じであるため、空間スケーラビリティほど高い画質向上効果を持つフィルタを適用しなくても構わない。
上記構成は、所定の指標について、画質に対する要求に応じたフィルタを適用することができる。
本発明に係る画像復号装置では、上記フィルタ適用決定手段は、上記所定の指標として、スケーラビリティを判定し、スケーラビリティが空間スケーラビリティであった場合、適用するフィルタとして、空間スケーラビリティでない場合より画質向上効果の高いフィルタを決定することが好ましい。
空間スケーラビリティの場合、上位レイヤの画像の解像度と下位レイヤの画像の解像度とが異なるため、処理量は多いが、画質向上幅の高いフィルタ、例えばALFが適している。それ以外のスケーラビリティの場合、上位レイヤの画像の解像度と下位レイヤの画像の解像度とが同じであるため、空間スケーラビリティほど高い画質向上効果を持つフィルタを適用しなくても構わない。従って処理量が小さく、主観画質向上効果のあるフィルタ、例えば、SAOあるいはデブロッキングフィルタ単体での適用が適している。
上記構成によれば、スケーラビリティが空間スケーラビリティであった場合、より画質向上効果の高いフィルタを適用することができる。
これにより、上位レイヤの画像の解像度と下位レイヤの画像の解像度が異なるようなときに、上位レイヤの予測画像を生成するために参照する下位レイヤの復号画像の画質を向上させることができる。
本発明に係る画像復号装置では、上記フィルタ適用決定手段は、上記所定の指標として、復号対象となる画像が後続の画像の復号の際に参照される参照画像であるか否かを判定し、復号対象となる画像が参照画像である場合、適用するフィルタとして、復号対象となる画像が参照画像でない場合よりも画質向上効果の高いフィルタを決定することが好ましい。
上位レイヤで後続の画像から参照される画像が、高画質であれば後続の画像を復号する際に正確な予測ができる。
そのため、復号対象となる画像が参照画像である場合、処理量は多いが、画質向上幅の高いフィルタ、例えば、ALFが適している。
また、復号対象となる画像が参照画像でない場合、参照される画像ほど高画質でなくてもよい。そのため処理量の点からフィルタを適用しなくてもよい。
上記構成によれば、復号対象となる画像が参照画像である場合、より画質向上効果の高いフィルタを適用することができる。
これにより、高画質が要求される参照画像の画質を向上させることができる。
本発明に係る画像復号装置では、上記フィルタ適用決定手段は、上記所定の指標として、下位レイヤで使用する符号化方式を判定し、符号化方式の画質に応じたフィルタを適用するフィルタとして決定することが好ましい。
上記構成によれば、符号化方式の画質に応じたフィルタを適用することができる。符号化方式としては、例えば、MPEG−2、H.264/AVC、およびHEVCなどが挙げられる。また、一般的に、画質は、MPEG−2、H.264/AVC、およびHEVCの順に高くなる。
上記構成によれば、画質がより低い符号化方式の場合、画質がより高い符号化方式の場合よりも、画質向上効果が高いフィルタを適用することができる。
本発明に係る画像復号装置では、上記フィルタ適用決定手段は、所定の指標に関する処理量に応じて、適用するフィルタを決定することが好ましい。
画像復号装置における復号処理の処理量が多くなるような場合、過負荷を防ぐためフィルタ処理の処理量を抑えることが望ましい。
これに対して、画像復号装置における復号処理の処理量が少なくなるような場合、画質および処理効率の向上のため処理量の多いフィルタ処理を適用することが望ましい。
上記構成によれば、所定の指標に関する処理量に応じて、適用するフィルタを決定する。所定の指標としては、例えば、解像度、アップサンプリングの位置(空間スケーラビリティの場合)が挙げられる。
上記構成により、復号処理およびフィルタ処理の処理量に応じたフィルタを適用することができ、これにより過負荷を防ぎ、画質および処理効率の向上を図ることができる。
本発明に係る画像復号装置では、空間スケーラビリティの場合に下位レイヤの画像を上位レイヤの画像にアップサンプリングするアップサンプリング手段を備え、上記フィルタ適用決定手段は、上記所定の指標として、アップサンプリング手段およびフィルタ適用手段の適用順序を判定し、適用するフィルタとして、上記適用順序に応じたフィルタを決定することが好ましい。
フィルタ適用後にアップサンプリングを行う場合、アップサンプリング前の低解像度の画像にフィルタを適用することになるのに対して、フィルタ適用前にアップサンプリングを行う場合、アップサンプリング後の高解像度の画像にフィルタを適用することになる。
よって、フィルタ適用後にアップサンプリングを行う場合のほうが、フィルタ適用前にアップサンプリングを行う場合よりも、フィルタ処理量が多くなる。
上記構成によれば、フィルタ適用後にアップサンプリングを行う場合、すなわちフィルタ処理量が比較的小さくなる場合、よりフィルタ処理量が高く画質向上効果の高いフィルタ処理を行うことができる。
これにより、復号処理およびフィルタ処理の処理量に応じたフィルタを適用することができる。よって、過負荷を防ぎ、画質および処理効率の向上を図ることができる。
本発明に係る画像復号装置では、上記フィルタ適用決定手段は、上記所定の指標として解像度を判定し、解像度が低解像度である場合、適用するフィルタとして、復号対象となる画像が高解像度である場合よりも、フィルタ処理量が多いフィルタを決定することが好ましい。
解像度が低解像度である場合、復号処理の処理量が小さいため、画像復号装置の処理能力の範囲で、よりフィルタ処理量が多いフィルタを適用することが、画質や処理効率の面で好ましい。
上記構成によれば、復号処理の処理量が小さい低解像度である場合において、よりフィルタ処理量が多いフィルタを適用することができる。
これにより、復号処理およびフィルタ処理の処理量に応じたフィルタを適用することができる。よって、過負荷を防ぎ、画質および処理効率の向上を図ることができる。
本発明に係る画像復号装置では、上記フィルタ適用決定手段は、フィルタ処理量に対する制約に応じて、適用するフィルタを決定することが好ましい。
上記構成によれば、フィルタ処理量に対する制約に応じた種類のフィルタを決定することができる。フィルタ処理量に対する制約とは、例えば、フィルタ処理量に対する画像復号装置の処理能力のことをさす。
アプリケーションや搭載する機器によっては、フィルタ処理量に対する制約が緩く、処理量が大きくても画質が良い方が好ましい場合もある。このような場合には、よりフィルタ処理量が大きく、かつ、画質向上効果がより高いフィルタを用いることが望ましい。
上記構成は、フィルタ処理量の許容量に応じたフィルタを適用し、上位レイヤの予測画像を生成するために参照する下位レイヤからの復号画像の画質を向上させることができる。
本発明に係る画像復号装置では、上記フィルタ適用手段が適用するフィルタのパラメータは、上記下位レイヤからの復号画像における上記フィルタの適用対象となる領域が含まれる単位領域毎に、当該単位領域と対応する上記上位レイヤの単位領域と一対となって該上位レイヤの符号化データに格納されているものであってもよい。
上記の構成によれば、下位レイヤからの復号画像に適用するフィルタのパラメータが上位レイヤに、単位領域と一対となって格納される。これにより、単位領域毎に必要なフィルタパラメータが符号化されるので、フィルタパラメータの復号時が、フィルタパラメータの使用時となり、復号したフィルタパラメータを格納するためのメモリが不要となる。よって、メモリを削減することができる。なお、単位領域とは、例えば、CTB(coded tree block)である。
本発明に係る画像復号装置では、単位領域を復号する際に用いられるパラメータであって、複数の単位領域で共通して用いられるパラメータを、符号化データの中で当該複数の単位領域のうちの最も前にある単位領域よりも前に集合させた群を共通群とし、上記フィルタ適用手段が適用するフィルタのパラメータは、上記下位レイヤからの復号画像における上記フィルタの適用対象となる領域が含まれる単位領域と対応する上記上位レイヤの単位領域を復号する際に用いられるパラメータが格納されている上記上位レイヤの上記共通群に格納されているものであってもよい。
上記の構成によれば、下位レイヤからの復号画像に適用するフィルタのパラメータが上位レイヤの共通群に格納される。下位レイヤからの画像を復号した時点で、フィルタ処理を行うことが可能となり、スループットを向上させることができる。
また、フィルタの適用を予測画像よりも大きな単位で行うことが可能となり、フィルタ処理を簡略化することができる。
上記共通群が、スライスヘッダの場合、上述した効果を奏することができる。
上記共通群が、APS(adaptation parameter set)の場合、上述した効果を奏することができる。
本発明に係る画像復号装置では、上記フィルタ適用手段は、下位レイヤからの復号画像のうち、同じ画像内の画素を用いて予測画像を生成するイントラ予測によって生成された予測画像を用いて復元された復号画像の領域についてのみ、フィルタを適用するものであってもよい。
上記の構成によれば、イントラ予測により生成された予測画像を用いて復元された復号画像の領域についてのみ、フィルタが適用され、これ以外の復号画像の領域に対しては、フィルタが適用されない。よって、不要なフィルタパラメータを符号化する必要がなくなり、符号化効率を向上させることができる。
また、イントラ予測により生成された予測画像を用いて復元された復号画像の領域については、フィルタが適用されるので、フィルタの効果を維持したまま、フィルタの処理量を削減することができる。
上記の課題を解決するために、本発明に係る画像符号化装置は、原画像から下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を減算して得られる残差を階層符号化して上位レイヤの符号化データを生成する画像符号化装置であって、上記上位レイヤから参照する上記下位レイヤからの復号画像に対して適用するフィルタを決定するフィルタ適用決定手段と、参照する上記下位レイヤからの復号画像に対して、上記フィルタ適用決定手段が決定したフィルタを適用するフィルタ適用手段と、
を備えていることを特徴とする。
このように、上記画像復号装置に対応する構成を備える画像符号化装置も本発明の範疇に入る。また、当該画像符号化装置によって生成される画像符号化データのデータ構造も本発明の範疇に入る。上記のように構成された画像符号化装置および画像符号化データのデータ構造によれば、本発明に係る画像復号装置と同様の効果を奏することができる。
本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、上記上位レイヤから参照する上記下位レイヤからの復号画像に対して適用するフィルタを決定するフィルタ適用決定手段と、参照する上記下位レイヤからの復号画像に対して、上記フィルタ適用決定手段が決定したフィルタを適用するフィルタ適用手段と、を備えている。
本発明に係る画像符号化装置は、原画像から、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を減算して得られる残差を階層符号化して上位レイヤの符号化データを生成する画像符号化装置であって、上記上位レイヤから参照する上記下位レイヤからの復号画像に対して適用するフィルタを決定するフィルタ適用決定手段と、参照する上記下位レイヤからの復号画像に対して、上記フィルタ適用決定手段が決定したフィルタを適用するフィルタ適用手段と、
を備えている。
よって、本発明によれば、上位レイヤにおける符号化効率を向上させ、上位レイヤの復号画像の客観・主観画質を向上させることができる。
本発明の一実施形態に係る階層画像復号装置に含まれるフィルタ処理部131の構成例を示すブロック図である。 本発明の一実施形態に係る階層画像復号装置の一構成例を示すブロック図である。 上記階層画像復号装置が備える下位レイヤ画像復号装置の一構成例を示すブロック図である。 上記階層画像復号装置が備える上位レイヤ画像復号装置の一構成例を示すブロック図である。 空間スケーラビリティを実現するためのフィルタ部の一例を示す図である。 時間スケーラビリティ、SNRスケーラビリティを実現するためのフィルタ部の一例を示す図である。 スケーラビリティの種類によって適用するフィルタを選択するフローチャートである。 デブロッキングフィルタ、SAO、ALFのカスケード接続を示す図である。 ピクチャタイプによって適用するフィルタを選択するフローチャートである。 解像度によって適用するフィルタを選択するフローチャートである。 アップサンプリングの位置によって適用するフィルタを選択するフローチャートである。 下位レイヤのコーデックの種類によって適用するフィルタを選択するフローチャートである。 本発明の階層画像符号化装置の一例である。 上記階層画像符号化装置が備える下位レイヤ画像符号化装置の一構成例を示すブロック図である。 上記階層画像符号化装置が備える上位レイヤ画像符号化装置の一構成例を示すブロック図である。 上記階層画像符号化装置が備えるフィルタ選択・処理部の一例を示す図である。 フィルタ情報の算出方法の一例を示すフローチャートである。 従来の階層画像符号化装置の一例を示す図である。 従来の階層画像復号装置の一例を示す図である。 上記階層画像符号化装置によって生成され、上記階層画像復号装置によって復号される符号化データのデータ構成を示す図であり、(a)〜(f)は、それぞれ、ピクチャレイヤ、スライスレイヤ、マクロブロックレイヤ、マクロブロックヘッダ、インター予測パーティションの予測パラメータ、及び、イントラ予測パーティションの予測パラメータの構造を示す図である。 上記階層画像符号化装置を搭載した送信装置、および、上記階層画像復号装置を搭載した受信装置の構成について示した図である。(a)は、階層画像符号化装置を搭載した送信装置を示しており、(b)は、階層画像復号装置を搭載した受信装置を示している。 上記階層画像符号化装置を搭載した記録装置、および、上記階層画像復号装置を搭載した再生装置の構成について示した図である。(a)は、階層画像符号化装置を搭載した記録装置を示しており、(b)は、階層画像復号装置を搭載した再生装置を示している。 スケーラビリティの種類によって処理を切り替えるフィルタ部の一例を示す図である。 階層符号化データについての説明図であり、(a)は、入力画像PIN#A〜PIN#Cをそれぞれ階層的に符号化して符号化データDATA#A〜DATA#Cを生成する階層動画像符号化装置を示す図であり、(b)は、階層的に符号化された符号化データDATA#A〜DATA#Cをそれぞれ復号して復号画像POUT#A〜POUT#Cを生成する階層動画像復号装置示す図である。 基本レイヤにおいて採用することができる符号化データのデータ構造について例示する図である。 CUにおけるPU分割の境界の位置を具体的に示す図である。 階層動画像復号装置の概略構成を示す図である。 予測パラメータ復元部の詳細構成を示す図である。 予測モードの定義を示す図である。 各予測モードに割り当てられている名称を示す図である。 テクスチャ復元部の詳細構成を示す図である。 ベース復号部の詳細構成を示す図である。 階層動画像符号化装置の概略構成を示す図である。 予測パラメータ符号化部の詳細構成を示す図である。 テクスチャ符号化部の詳細構成を示す図である。 基本レイヤの復号画像に適用するフィルタのフィルタパラメータを拡張レイヤに、CTB単位で格納する場合のシンタクス例を示す図である。 (a)、(b)は、基本レイヤの復号画像に適用するフィルタのフィルタパラメータを拡張レイヤに、CTB単位で格納する場合の詳細なシンタクス例を示す図である。 基本レイヤの復号画像に適用するフィルタのフィルタパラメータを拡張レイヤに、CTB単位で格納する場合の詳細なシンタクス例を示す図である。 レイヤ間イントラ予測部の動作を説明するための図であり、(a)はレイヤ間イントラ予測部の動作を示す図であり、(b)は従来の動作を示す図である。 参照ブロックにフィルタを適用する状態を説明するための図である。 基本レイヤの復号画像に適用するフィルタのフィルタパラメータを拡張レイヤのスライスヘッダ、またはAPSに格納する場合のシンタクス例を示す図である。 (a)、(b)は、基本レイヤの復号画像に適用するフィルタのフィルタパラメータを拡張レイヤのスライスヘッダ、またはAPSに格納する場合の詳細なシンタクス例を示す図である。 (a)、(b)、(c)は、基本レイヤの復号画像に適用するフィルタのフィルタパラメータを拡張レイヤのスライスヘッダ、またはAPSに格納する場合の詳細なシンタクス例を示す図である。 基本レイヤの復号画像に適用するフィルタのフィルタパラメータを拡張レイヤのスライスヘッダ、またはAPSに格納する場合の詳細なシンタクス例を示す図である。 レイヤ間イントラ予測部の動作を説明するための図である。 基本レイヤの復号画像に適用するフィルタのフィルタパラメータを拡張レイヤのイントラスライスのみに格納する場合のシンタクス例を示す図である。
以下、図面を参照して本発明の実施の形態を説明する。
〔符号化データのデータ構造〕
本実施形態に係る階層画像符号化装置2及び階層画像復号装置1の詳細な説明に先立って、階層画像符号化装置2によって生成され、階層画像復号装置1によって復号される符号化データのデータ構造について説明を行う。符号化データは、下位レイヤと上位レイヤとから構成される。
以下、符号化データを生成する符号化方式として、H.264/AVCのSVC技術を用いる場合について例示する。しかしながら、これに限られず、下位レイヤを、MPEG−2や、HEVCなどの符号化方式により符号化してもよい。また、下位レイヤと上位レイヤとが異なる符号化方式によって符号化されていてもよい。
また、下位レイヤの符号化データと上位レイヤの符号化データとは、互いに異なる伝送路を介して階層画像復号装置1に供給されるものであってもよいし、同一の伝送路を介して階層画像符号化装置1から階層画像復号装置2に供給されるものであってもよい。
(下位レイヤの符号化データ)
図20は、符号化データの下位レイヤのデータ構造を示す図である。符号化データは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。なお、シーケンスには、当該シーケンスを復号するために階層画像復号装置1が参照する符号化パラメータの集合であるシーケンスパラメータセット(SPS)が含まれる。SPSの後に、ピクチャパラメータセット(PPS)が通知される。PPSは対応ピクチャを復号するために階層画像復号装置1が参照する符号化パラメータの集合であり、PPSが参照するSPSを示す情報を含む。
データの階層構造を図20に示す。図20(a)〜(f)は、それぞれ、シーケンス、スライスレイヤS、マクロブロックレイヤMB、マクロブロックヘッダMBH、インター予測パーティションの予測パラメータPP、及び、イントラ予測パーティションの予測パラメータPPの構造を示す図である。
シーケンスは、図20(a)に示すように、SPS,PPS、及び、各ピクチャを構成するスライスレイヤS1〜SNsを含んでいる(Nsは1ピクチャに含まれるスライスレイヤの総数)。
各スライスレイヤSは、対応スライスを復号するために階層画像復号装置1が参照するデータの集合である。スライスレイヤSは、図20(b)に示すように、スライスヘッダSH、及び、マクロブロックレイヤMB1〜MBNm(NmはスライスSに含まれるマクロブロックの総数)を含んでいる。
スライスヘッダSHには、対応スライスの復号方法を決定するために階層画像復号装置1が参照する符号化パラメータ群が含まれる。(1)スライスが参照するPPSを示す情報、(2)スライスタイプを指定するスライスタイプ指定情報、(3)対応スライスを含むピクチャの表示順序(POC:Picture Order Count)を指定するPOC指定情報、及び、(4)動画像符号化装置2が符号化の際に用いた重み係数を指定する重み係数指定情報は、スライスヘッダSHに含まれる符号化パラメータの一例である。
なお、スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、又は、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、又は、イントラ予測を用いるBスライスなどが挙げられる。
スライスレイヤSに含まれる各マクロブロックレイヤMBは、対応マクロブロックを復号するために階層画像復号装置1が参照するデータの集合である。マクロブロックレイヤMBは、図20(c)に示すように、スキップフラグSKIP、マクロブロックヘッダMBH、予測パラメータPP1〜PPNp、及び、量子化予測誤差QD1〜QDNbを含んでいる。ここで、Npは、対応マクロブロックに含まれるパーティション(予測単位)の総数を表し、Nbは、対応マクロブロックに含まれるブロック(変換単位)の総数を表す。スキップフラグSKIPの値が1の場合、すなわち、対応マクロブロックがスキップブロックである場合、そのマクロブロックレイヤにおけるマクロブロックヘッダMBH、予測パラメータPP1〜PPNp、及び、量子化予測誤差QD1〜QDNbは省略される。
マクロブロックヘッダMBHには、対応マクロブロックの復号方法を決定するために階層画像復号装置1が参照する符号化パラメータが含まれる。具体的には、図20(d)に示すように、対応マクロブロックのマクロブロックタイプを指定するマクロブロックタイプ指定情報MBT(mb_type)、符号化ブロックパターンを指定するCBP(coded_block_pattern)、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(mb_qp_delta)が含まれる。マクロブロックタイプ指定情報MBTは、予測単位指定情報PTと変換単位指定情報TTとを含む。
予測単位指定情報PTは、対応マクロブロックのパーティション(予測単位)への分割パターンと、階層画像符号化装置2が各パーティションにおける予測画像を生成する際に用いた予測方法(L0単方向予測、L1単方向予測、双方向予測など)を指定する。パーティションは、16×16画素、16×8画素、8×16画素、8×8画素、8×4画素、又は4×8画素の領域である。一方、変換単位指定情報TTは、対応マクロブロックのブロック(変換単位)への分割パターンを指定する。ブロックは、4×4画素、又は8×8画素の正方形領域である。
量子化パラメータ差分Δqpは、対応マクロブロックにおける量子化パラメータqpと、そのマクロブロックの直前に符号化されたマクロブロックにおける量子化パラメータqp’との差分qp−qp’である。
マクロブロックレイヤMBに含まれる各量子化予測残差QDnは、階層画像符号化装置2が以下の処理1〜3を対応ブロックに施すことによって生成した符号化データである。
処理1:符号化対象画像から予測画像を減算した予測残差をDCT変換(Discrete Cosine Transform)する;
処理2:処理1にて得られたDCT係数を量子化する;
処理3:処理2にて量子化されたDCT係数を可変長符号化する;
なお、上述した量子化パラメータqpは、階層画像符号化装置2がDCT係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2pq/6)。
マクロブロックレイヤMBに含まれる予測パラメータPPのうち、インター予測によって予測画像が生成されるインター予測パーティションに関する予測パラメータPPは、図20(e)に示すように、参照画像インデックスRIと、推定動きベクトルインデックスPMVIと、動きベクトル残差MVDとを含んでいる。
動きベクトル残差MVDは、階層画像符号化装置2が以下の処理4〜6を実行することによって生成した符号化データである。
処理4:符号化/復号済みの局所復号画像を選択し、選択した符号化/復号済みの局所復号画像(以下「参照画像」とも呼称)を参照して対応パーティションに対する動きベクトルmvを導出する;
処理5:推定方法を選択し、選択した推定方法を用いて対応パーティションに割り付ける動きベクトルmvの推定値(以下「推定動きベクトル」とも呼称)pmvを導出する;
処理6:処理4にて導出した動きベクトルmvから処理5にて導出した推定動きベクトルpmvを減算した動きベクトル残差MVDを符号化する;
上述した参照画像インデックスRIは、処理4にて選択した符号化/復号済みの局所復号画像(参照画像)を指定するものであり、上述した推定動きベクトルインデックスPMVIは、処理5にて選択した推定方法を指定するものである。処理5にて選択可能な推定方法としては、(1)符号化/復号中の局所復号画像において、対応パーティションに隣接するパーティション(以下「隣接パーティション」とも呼称する)に割り付けられた動きベクトルのメジアンを推定動きベクトルpmvとする方法や、(2)符号化/復号済みの局所復号画像において、対応パーティションと同じ位置を占めるパーティション(しばしば「コロケートパーティション」と呼称される)に割り付けられた動きベクトルを推定動きベクトルpmvとする方法などが挙げられる。
なお、単方向予測を行うパーティションに関する予測パラメータPPには、図20(e)に示すように、参照画像インデックスRI、推定動きベクトルインデックスPMVI、及び、動きベクトル残差MVDがそれぞれ1つずつ含まれているが、双方向予測(重み付き予測)を行うパーティションに関する予測パラメータPPには、2つの参照画像インデックスRI1及びRI2、2つの推定動きベクトルインデックスPMVI1及びPMVI2、並びに、2つの動きベクトル残差MVD1及びMVD2が含まれる。
マクロブロックレイヤMBに含まれる予測パラメータPPのうち、イントラ予測によって予測画像が生成されるイントラ予測パーティションに関する予測パラメータPPは、図20(f)に示すように、予測モードフラグPMFと予測モード符号PMCとを含んでいる。予測モードフラグPMFは、対応パーティションにおける予測モードが隣接パーティションから推定した予測モードと一致する場合に値1を取り、そうでない場合に値0を取る。予測モード符号PMCは、対応パーティションにおける予測モードを指定する予測モード指定情報を符号化したものであり、予測モードフラグPMFの値が1である場合には省略される。
(上位レイヤの符号化データ)
上位レイヤの符号化データについても、例えば、図20に示すものとほぼ同様のデータ構造を採用することができる。ただし、SPSには階層符号化を示す情報が符号化されていてもよい。スライスレイヤでは、空間スケーラビリティ、時間スケーラビリティ、および、SNRスケーラビリティの階層の識別情報(それぞれ、dependency_id、temporal_id、および、quality_id)が符号化されていてもよい。フィルタ情報やフィルタのオン/オフ情報(後述)はPPS、スライスヘッダ、マクロブロックヘッダ等で符号化することが可能である。
なお、上位レイヤに含まれる動きベクトル情報のうち、下位レイヤに含まれる動きベクトル情報から導出可能な動きベクトル情報については、上位レイヤから省略する構成とすることができる。このような構成とすることによって、上位レイヤの符号量を削減することができるので、符号化効率が向上する。
また、上述のとおり上位レイヤの符号化データを、下位レイヤの符号化方式と異なる符号化方式により生成しても構わない。すなわち、上位レイヤの符号化・復号処理は、下位レイヤのコーデックの種類に依存しない。
上位レイヤが、例えば、MPEG−2や、HEVC(High Efficiency Video Coding)方式によって符号化されていてもよい。
〔階層画像復号装置〕
図2の階層画像復号装置は本発明を適用した階層画像復号装置1の一例である。図2に示すように階層画像復号装置1は、下位レイヤ画像復号装置11、上位レイヤ画像復号装置12、およびフィルタ部13を備える。
下位レイヤ画像復号装置11は、下位レイヤ画像符号化装置21(後述)から送信される下位レイヤの符号化データを所定の符号化方式により復号する。下位レイヤ画像復号装置11が復号に用いる符号化方式の一例は図19を用いて説明したようなH.264/AVCである。しかしながら、これに限らず、下位レイヤ画像復号装置11はMPEG−2や現在規格策定中のHEVCを復号に用いても構わない。
上位レイヤ画像復号装置12は上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して上位レイヤの復号画像を再生する。
フィルタ部13は下位レイヤからの復号画像を上位レイヤから参照するためにフィルタ処理を施す。
以下、下位レイヤ画像復号装置11、上位レイヤ画像復号装置12、およびフィルタ部13それぞれの構成例についてより詳しく説明する。
(下位レイヤ画像復号装置の構成例)
図3を用いて下位レイヤ画像復号装置11の構成例について説明する。図3は下位レイヤ画像復号装置11の構成例を示すブロック図である。
より具体的には、下位レイヤ画像復号装置11は、可変長復号部111、逆量子化・逆変換部112、加算部113、動き補償部114、メモリ115、およびループフィルタ部116を備える。
可変長復号部111は下位レイヤ符号化データを可変長復号する。可変長復号部111は、下位レイヤ符号化データから復号した量子化変換係数(予測誤差)を出力する。また、可変長復号部111は、下位レイヤ符号化データから復号した判定情報(後述)をフィルタ部13に供給する。
逆量子化・逆変換部112は復号された量子化変換係数(予測誤差)に逆量子化、逆変換を施す。
加算部113は逆量子化・逆変換部112の出力である予測誤差と、動き補償部114の出力である予測画像とを加算する。
ループフィルタ部116は加算部113の出力である復号画像にループフィルタを適用する。ループフィルタは、原画と、予測画像に予測誤差画像を加算した復号画像との差分を最小にする(客観画質を向上させる)、あるいは主観画質を向上させることを目的として設けられる。ループフィルタを適用した復号画像を動き補償部114で用いる参照画像とすることで、参照画像の客観・主観画質を向上させ、さらには動き補償を用いて符号化する以降の画像の画質を向上させることができる。このループフィルタの例としては、非特許文献2に記載されているようなデブロッキングフィルタ、SAO(サンプル適応オフセット)フィルタ、ALF(適応ループフィルタ)が挙げられる。
なお、符号化方式としてMPEG−2を採用する場合、ループフィルタ部116は省略される。
また、符号化方式としてH.264/AVCを採用する場合、ループフィルタ部116はデブロッキングフィルタである。
また、符号化方式としてHEVCを採用する場合、ループフィルタ部116には、デブロッキングフィルタ、SAO、ALFの3種類のフィルタが含まれる。
メモリ115はループフィルタを適用した復号画像を格納する。
動き補償部114はメモリ115に格納された画像を利用して動き補償を行い、予測画像を出力する。
(上位レイヤ画像復号装置の構成例)
図4を用いて、上位レイヤ画像復号装置12の構成例について説明する。図4は上位レイヤ画像復号装置12の構成例を示すブロック図である。図4に示すように、上位レイヤ画像復号装置12は、ループフィルタを適用した画像復号装置である。
具体的には、上位レイヤ画像復号装置12は、可変長復号部121、逆量子化・逆変換部122、加算部123、動き補償部124、メモリ125、およびループフィルタ部126、および切り替え部127を備える。
可変長復号部121は符号化データを可変長復号する。可変長復号部121は、復号した予測誤差を出力する。また、可変長復号部121は復号したフィルタのオン/オフ情報および判定情報(後述)をフィルタ部13および切り替え部127に供給する。
逆量子化・逆変換部122〜ループフィルタ部126は図3の逆量子化・逆変換部112〜ループフィルタ部116と同じ構成要素であるので、説明を省略する。
切り替え部127は下位レイヤからの復号画像と、動き補償部124の出力である動き補償画像とを切り替えて予測画像として出力する。なお、空間スケーラビリティの場合、上述した“下位レイヤからの復号画像”は、下位レイヤからの復号画像をアップサンプリングした画像である。しかしながら、下位レイヤからの復号画像と、下位レイヤからの復号画像をアップサンプリングした画像とを特に区別する必要がない場合、以降ではこれらを区別せず単に“下位レイヤからの復号画像”と呼ぶ。
切り替え部127は、上記切り替え処理を、可変長復号部121から出力される、符号化データ中の情報(例えばピクチャタイプ、スライスタイプ、処理単位毎の予測モード情報等)に従って行う。
イントラピクチャ、イントラスライスでは、切り替え部127は、上位レイヤの符号化データから可変長復号部121で復号された処理単位毎の予測モード情報等に従って、上位レイヤのイントラ予測部(図示しない)からの予測画像、あるいは下位レイヤからの復号画像を選択する。
また、P(片方向予測)/B(双方向予測)ピクチャ、P(片方向予測)/B(双方向予測)スライスでは、切り替え部127は、上位レイヤの符号化データから可変長復号部121で復号された処理単位毎の予測モード情報等に従って、動き補償部124からの出力の動き補償画像、あるいは下位レイヤからの復号画像を選択する。
(フィルタ部の構成例)
以下、図5、図6および図23を用いて、フィルタ部の構成例を説明する。以下では、図5を用いて上位レイヤと下位レイヤとで画像の解像度が異なる空間スケーラビリティのフィルタ部13Aの構成例について説明する。また、図6を用いて上位レイヤと下位レイヤとで画像の解像度が等しい時間スケーラビリティあるいはSNRスケーラビリティのフィルタ部13Bの構成例について説明する。また、図23を用いて、図5に示すフィルタ部13Aと、図6に示すフィルタ部13Bとを組み合わせたフィルタ部13の構成例について説明する。以下、図5、図6、および図23の順で説明する。
まず、図5(a)および(b)に示すフィルタ部13Aについて説明する。図5(a)に示すフィルタ部13Aは下位レイヤからの復号画像にフィルタを施すフィルタ処理部131と、その出力に対して下位レイヤの画像を上位レイヤの画像の解像度に戻すためのアップサンプリング部132からなる。図5(a)に示すフィルタ部13Aでは下位レイヤからの復号画像に対し、後述する原画(空間スケーラビリティの場合は原画をダウンサンプリングした画像であるが、以降では原画と呼ぶ)に近づけるためのフィルタを適用してからアップサンプリングフィルタを適用する。ここで原画に近づけるとは、復号画像と原画との差分値を小さくする(客観画質を向上させる)、あるいは復号画像の主観画質を向上させることである。復号画像の解像度においてフィルタを適用するため、フィルタ処理に必要な処理量が小さいというメリットがある。
図5(b)に示すフィルタ部13Aは下位レイヤからの復号画像に、上位レイヤの画像の解像度に戻すためのアップサンプリングを行うアップサンプリング部132と、アップサンプリング部132の出力に対してフィルタ処理を施すフィルタ処理部131からなる。
図5(a)および(b)を対比すると次のとおりである。図5(b)に示すフィルタ部13Aでは、図5(a)に示すフィルタ部13Aとはアップサンプリング部132とフィルタ処理部131との順序が逆である。
また、図5(b)に示すフィルタ部13Aのフィルタ処理部131がフィルタを適用する画像の解像度は、下位レイヤからの復号画像をアップサンプリングした後のものであるのに対して、図5(a)に示すフィルタ部13Aのフィルタ処理部131がフィルタを適用する画像の解像度は、下位レイヤからの復号画像のものである。
また、図5(b)に示すフィルタ部13Aでは、アップサンプリング部132において、下位レイヤからの復号画像を上位レイヤの画像の解像度に戻した後でフィルタを適用するため、図5(a)に示すフィルタ部13Aより原画に近い復号画像を参照することができる。フィルタ処理部131は図2の上位レイヤ画像復号装置12から出力されたフィルタ情報(後述)等を用いてフィルタ処理を施す。なお、アップサンプリング部132に、図19のアップサンプリング部1003と同じ構成要素を用いても構わない。
なお上述の説明では、フィルタ部13Aは、フィルタ処理を、フィルタ処理部131のフィルタとアップサンプリングフィルタ部132のフィルタとに分ける2段階処理として説明したが、これに限られず、1回のフィルタ処理として適用することも可能である。
次に、図6に示すフィルタ部13Bについて説明する。図6は時間スケーラビリティあるいはSNRスケーラビリティの場合に、下位レイヤからの復号画像に対し、原画に近づけるためのフィルタを適用するフィルタ部13Bである。図6に示すフィルタ部13Bは、フィルタ処理部131を備える。フィルタ処理部131については、図5を用いて説明したとおりであるので、その説明を省略する。
次に、図23に示すフィルタ部13について説明する。図23は、空間スケーラビリティの場合と、それ以外のスケーラビリティ(すなわち、時間スケーラビリティあるいはSNRスケーラビリティ)の場合とで、適用するフィルタを切り替えるフィルタ部13である。
図23に示すフィルタ部13は、下位レイヤ(下位レイヤ画像復号装置11)からの復号画像に対し、原画に近づけるためのフィルタを適用し、フィルタ画像を上位レイヤ(上位レイヤ画像復号装置12)に供給する。フィルタ部13は、フィルタ部13A、13B、切り替え部133を備える。フィルタ部13Aは、図5に示したものと同様であり、フィルタ部13Bは、図6に示したものと同様であるので、ここではその説明を省略する。
切り替え部133は、スケーラビリティの種類に応じて、下位レイヤからの復号画像をフィルタ部13Aまたはフィルタ部13Bのいずれかに入力する。
空間スケーラビリティの場合、フィルタ部13Aにスイッチする。この場合、フィルタ部13Aが、下位レイヤからの復号画像をアップサンプリングしフィルタを適用したフィルタ画像または下位レイヤからの復号画像にフィルタを適用しアップサンプリングしたフィルタ画像を、上位レイヤ画像復号装置12に供給する。
一方、空間スケーラビリティの以外のスケーラビリティの場合、フィルタ部13Bにスイッチする。この場合、フィルタ部13Bは、アップサンプリングなしでフィルタを適用したフィルタ画像を上位レイヤ画像復号装置12に供給する。
なお、この切り替え処理は、後述の階層画像符号化装置2が備える切り替え部26における切り替え処理に対応しているということもできる。
(フィルタ処理部の詳細)
次に、図1を用いて、図5および図6に示したようなフィルタ処理部131の詳細構成について説明する。図1は、フィルタ処理部131の詳細な構成について例示するブロック図である。
図1に示すように、フィルタ処理部131は、フィルタ適用判定部1311、フィルタ適用部1312、空間スケーラビリティ判定部1313、参照画像判定部1314、解像度判定部1315、フィルタ順序判定部1316、コーデック判定部1317を備える。
フィルタ適用判定部1311は、フィルタ情報、フィルタのオン/オフ情報、およびフィルタを決定するための指標を示す判定情報に基づいて、フィルタの適用要否、および、適用するフィルタの種類を決定するものである。フィルタ情報、フィルタのオン/オフ情報、および判定情報の詳細については後述する。
フィルタ適用部1312は、フィルタ適用判定部1311が決定したフィルタを復号画像に適用するものである。フィルタ適用部1312が適用することができるフィルタの種類や、その組み合わせについては後述する。
空間スケーラビリティ判定部1313は、適用されているスケーラビリティが、空間スケーラビリティか否かを判定するものである。
参照画像判定部1314は、ピクチャタイプが上位レイヤで復号する後続の画像から参照されるものであるか否かを判定するものである。
解像度判定部1315は、上位レイヤおよび下位レイヤの画像の解像度を判定するものである。
フィルタ順序判定部1316は、アップサンプリングとフィルタ処理の順番を判定するものである。
コーデック判定部1317は、下位レイヤのコーデック(符号化方式)の種類を判定するものである。
(フィルタ適用部において適用可能なフィルタおよびその組み合わせ)
ここで、フィルタ適用部1312において適用可能なデブロッキングフィルタ(DF;Deblocking Filter)、SAO、ALFについて簡単に説明する。
デブロッキングフィルタは、予測あるいは変換処理の境界で発生するブロック歪を低減する技術である。ブロック境界の種類(予測処理の境界と変換処理の境界)、予測モード(イントラと非イントラ)、非ゼロ直交変換係数の有無、参照フレーム、隣接する復号画素値、動き情報に依存して、ブロック境界に適用するフィルタの強度とフィルタのオン/オフを適応的に決定する。そしてブロック歪が存在すると判定されたフィルタオンのブロック境界には、フィルタの強度に応じて指定されたフィルタを適用し、ブロック境界近傍の画素値を平滑化する。
SAOは、原画と復号画像の差異を、画素レベルの特性に応じて適応的に設定されたオフセットを加算することで補償する技術である。SAOには処理対象画素値とその近傍の画素値からエッジの方向を検出し、処理対象画素値とその近傍の画素値の差分値(変動量)に応じて加算するオフセットを切り替えるエッジオフセット(EO)タイプと、処理対象画素値に応じて加算するオフセットを切り替えるバンドオフセット(BO)タイプがある。フィルタ情報として、処理対象単位毎にEOとBOのどちらのタイプを適用するかを示す情報、EOの場合はさらにエッジ方向を示す情報、各変動量に対し加算するオフセットを通知する。BOの場合は画素値に応じて加算するオフセットを通知する。処理対象単位毎に通知されたタイプに応じて、EOの場合は処理対象画素値とその近傍画素値から計算した変動量に対応するオフセットを加算し、BOの場合は処理対象画素値に対応するオフセットを加算する。
ALFは、原画と復号画像との差分(平均2乗誤差)を最小にするフィルタ係数、タップ数を算出し、下位レイヤからの復号画像にフィルタ処理を行うことでレート歪性能を改善する技術である。このフィルタとしてウィナーフィルタ(Wiener Filter)等が用いられる。算出したフィルタ係数、タップ数はフィルタ情報として、フィルタのオン/オフ情報と合わせて通知する。通知された情報を用いて、処理対象単位毎にALFを適用する。
なお、上述したような、SAO、およびALFで用いられるフィルタ情報、および処理単位毎のフィルタのオン/オフ情報は可変長復号部121からフィルタ適用判定部1311に通知される。デブロッキングフィルタではフィルタ適用判定部1311でフィルタのオン/オフを判定する。また、フィルタオンの処理単位では、フィルタ適用部1312が、フィルタ情報を用いてフィルタ処理を実行する。
以降ではこれらの通知される情報をまとめて、フィルタ情報およびフィルタのオン/オフ情報と呼ぶ。これらの情報は上位レイヤの符号化データの一部として符号化される。
次にフィルタ適用部1312におけるフィルタ処理の組み合わせついて説明する。フィルタ適用部1312によるフィルタ処理はブロック歪を除去するデブロッキングフィルタ、処理単位のオフセットを調整するSAO、原画との差分値を最小にするウィナーフィルタを用いたALFを単体、あるいは組み合わせて構成される。
フィルタ適用判定部1311は、フィルタ適用部1312が適用するフィルタを、可変長復号部121、または、可変長復号部121から通知される判定情報を用いて決定する。判定情報は、適用するフィルタを決定するための指標を含む情報である。例えば、フィルタ適用判定部1311は、フィルタを決定する指標と、適用するフィルタの種類とを対応付ける所定の対応関係に基づいて適用するフィルタの種類を決定する。適用するフィルタを決定するための指標と、適用するフィルタとの対応関係の例を表1に示す。
Figure 2013243636
表1に示す(1)〜(5)の指標は単なる例示であり、これらに限られない。要求される性能や処理量に応じた指標を用いることができる。
表1において適用するフィルタの種類の候補1は、フィルタ処理量への制約が大きい場合に適用するフィルタを示す。適用するフィルタの種類の候補2は、フィルタ処理量への制約が比較的緩い(処理量が大きくても構わない)場合に適用するフィルタを示す。
表1の(1)〜(5)以外に、適用するフィルタの種類をフラグで通知してもよい。どの指標を用いてフィルタを選択するかは、あらかじめ画像符号化装置と画像復号装置との間で決定しておけばよい。あるいはシーケンスヘッダやSPS(シーケンスパラメータセット)等で、どの指標を用いるかを通知してもよい。
また、表1の(1)〜(5)を示す判定情報が、上位レイヤの符号化データに含まれていてもよい。また、表1の(3)を示す下位レイヤの解像度および画像の構造(フィールド構造/フレーム構造)や(5)を示す判定情報を、下位レイヤの符号化データを復号して得られた復号データから取得してもよい。
(スケーラビリティの種類によって適用するフィルタを決定する場合)
図7に空間スケーラビリティ、時間スケーラビリティ、SNRスケーラビリティ等のスケーラビリティの種類によって、図1のフィルタ処理部131で適用するフィルタを選択するフローチャートを示す。
まず、空間スケーラビリティ判定部1313が、適用されているスケーラビリティが、空間スケーラビリティか否かを判定する(S101)。
空間スケーラビリティの場合(S101においてYES)、フィルタ適用判定部1311は、フィルタをALFに設定し、フィルタ適用部1312が設定されたALFを適用する(S104)。
一方、空間スケーラビリティ以外のスケーラビリティの場合(S101においてNO)、フィルタ適用判定部1311は、フィルタをSAOまたはデブロッキングフィルタに設定し、フィルタ適用部1312が設定されたSAOまたはデブロッキングフィルタを適用する。
空間スケーラビリティの場合、上位レイヤの画像と下位レイヤの画像の解像度が異なるため、処理量は多いが、画質向上幅の高いALFが適している。それ以外のスケーラビリティの場合、上位レイヤの画像と下位レイヤの画像の解像度が同じであるため、空間スケーラビリティほど高い画質向上効果を持つフィルタを適用しなくても構わない。従って処理量が小さく、主観画質向上効果のあるSAOあるいはデブロッキングフィルタ単体での適用が適している。
なお、アプリケーションや搭載する機器によっては、フィルタ処理量に対する制約が緩く、処理量が大きくても画質が良い方が好ましい場合もある。このような場合には、空間スケーラビリティで適用するフィルタはALF、SAO、デブロッキングフィルタを全て用いることが望ましい。ALF、SAO、デブロッキングフィルタを全て用いる場合、フィルタ適用部1312を図8に示すように構成してもよい。図8に示すように、フィルタ適用部1312では、下位レイヤからの復号画像の入力側から、デブロッキングフィルタ、SAO、およびALFの順でフィルタが設定されている。よって、フィルタ適用部1312は、図8に示すように、下位レイヤからの復号画像に対し、まずデブロッキングフィルタを適用し、その出力に対しSAOを適用し、その出力に対しALFを適用する順番で3つのフィルタを適用する。3フィルタの場合、以降の例でも図8に示す順番にフィルタを適用する。デブロッキングフィルタでブロック境界の歪を低減し、その後SAOで画素単位のオフセットを調整し、最後にALFで原画との誤差を最小にするカスケード接続の構成が、符号化効率の点で性能が良いためである。また時間スケーラビリティやSNRスケーラビリティで適用するフィルタはSAO、デブロッキングフィルタという2つのフィルタを用いることが望ましい。
(ピクチャタイプによって適用するフィルタを決定する場合)
図9にピクチャタイプによって図1のフィルタ処理部131で適用するフィルタを選択するフローチャートを示す。
まず、参照画像判定部1314が、復号対象となる上位レイヤの画像のピクチャタイプを判定する(S201)。ピクチャタイプがイントラ(I)、片方向予測(P)、参照に使用する双方向予測(B)ピクチャのような、上位レイヤで符号化する後続の画像から参照されるピクチャタイプの場合(S201においてYES)、フィルタ適用判定部1311は、フィルタをALFに設定し、フィルタ適用部1312が設定されたALFを適用する(S204)。
一方、ピクチャタイプが、参照に使用されない双方向予測(b)ピクチャの場合(S201においてNO)、フィルタは適用しない。
後続の画像から参照される画像が、高画質であれば正確な予測ができる。そのため、処理量は多いが、画質向上幅の高いALFが適している。上位レイヤで後続の画像から参照されない画像の場合、参照される画像ほど高画質でなくてもよい。そのため処理量の点からフィルタを適用しない。
なお、S201では、下位レイヤからの復号画像のピクチャタイプを判定してもよい。
また、アプリケーションや搭載する機器によっては、フィルタ処理量に対する制約が緩く、処理量が大きくても画質が良い方が好ましい場合もある。このような場合には、参照される画像に適用するフィルタはALF、SAO、デブロッキングフィルタを全て用いることが望ましい。また参照されない画像にはSAOあるいはデブロッキングフィルタを適用し、現時刻の画像に対応する上位レイヤの画像がより正確に予測できるようにすることが望ましい。ここではピクチャタイプによって適用するフィルタを決定する例を説明したが、スライスタイプによって適用するフィルタを決定してもよい。
(解像度によって適用するフィルタを決定する場合)
図10に解像度によって図1のフィルタ処理部131で適用するフィルタを選択するフローチャートを示す。
まず、解像度判定部1315が、復号対象となる上位レイヤの画像の解像度を判定する(S301)。HD画像のような高解像度の場合(S301においてYES)、フィルタ適用判定部1311は、フィルタをALFに設定し(S302)、フィルタ適用部1312が設定されたALFを適用する(S304)。
一方、比較的低解像度の場合(S301においてNO)、フィルタ適用判定部1311は、フィルタを、デブロッキングフィルタ、SAO、およびALFに設定し(S303)フィルタ適用部1312が、設定されたデブロッキングフィルタ、SAO、およびALFを適用する(S304)。これは、低解像度の画像に必要な処理量は小さいので、画質向上幅を増やす目的でデブロッキングフィルタ、SAO、ALFをすべて適用することが好ましいためである。
なお、アプリケーションや搭載する機器によっては、フィルタ処理量に対する制約が緩く、処理量が大きくても画質が良い方が好ましい場合もある。このような場合には、高解像度の画像に対してもALF、SAO、デブロッキングフィルタを全て用いることが望ましい。
(アップサンプリングの位置によって適用するフィルタを決定する場合)
空間スケーラビリティの場合、図11にアップサンプリングとフィルタ処理の順番によって図1のフィルタ処理部131で適用するフィルタを選択するフローチャートを示す。
まず、フィルタ順序判定部1316が、フィルタ処理の順序を判定する(S401)。
フィルタ処理の後でアップサンプリングする場合(S401においてYES)、フィルタ適用判定部1311は、フィルタを、デブロッキングフィルタ、SAO、ALFに設定し(S402)、フィルタ適用部1312が、設定されたデブロッキングフィルタ、SAO、ALFを適用する(S404)。
一方、フィルタ処理の前にアップサンプリングする場合(S401においてNO)、フィルタ適用判定部1311は、フィルタをALFに設定し(S403)、フィルタ適用部1312が、設定されたALFを適用する(S404)。これは解像度によって適用するフィルタを決定する場合と同じ理由で、アップサンプリング前にフィルタを適用する場合は、フィルタ処理に必要な処理量は小さいためである。
なお、アプリケーションや搭載する機器によっては、フィルタ処理量に対する制約が緩く、処理量が大きくても画質が良い方が好ましい場合もある。このような場合には、アップサンプリング後にフィルタを適用する場合でも、ALF、SAO、デブロッキングフィルタを全て用いることが望ましい。
(下位レイヤのコーデックの種類によって適用するフィルタを決定する場合)
図12に下位レイヤで使用するコーデックの種類によって図1のフィルタ処理部131で適用するフィルタを選択するフローチャートを示す。
まず、コーデック判定部1317が、下位レイヤで使用するコーデックを判定する(S501)。
下位レイヤで使用するコーデックがMPEG−2の場合(S501)、フィルタ適用判定部1311は、フィルタをALFに設定し(S502)、フィルタ適用部1312が、設定されたALFを適用する(S504)。
また、下位レイヤで使用するコーデックがH.264/AVCの場合(S505においてYES)、フィルタ適用判定部1311は、フィルタをSAOに設定し(S503)、フィルタ適用部1312が、設定されたSAOを適用する(S504)。
また、下位レイヤで使用するコーデックがHEVCの場合(S505においてNO)、フィルタは適用しない。
MPEG−2は処理量が小さく、コーデック内部でループフィルタを持たないため、他の符号化方式と較べて低画質である。そのため、処理量は多いが、画質向上幅の高いALFを適用することで、上位レイヤから参照される画像の品質を向上させ、正確な予測ができるようにする。
また、H.264/AVCはMPEG−2よりは複雑な処理を施しており、コーデック内部にデブロッキングフィルタをループフィルタとして持つため、MPEG−2に比べると高画質である。そのため、処理量が小さく、主観画質向上効果のあるSAOの適用が適している。
そして、HEVCは処理が複雑で、コーデック内部にデブロッキングフィルタ、SAO、ALFをループフィルタとして持つため、他の符号化方式より高画質である。そのため、処理量の点からフィルタを適用しない。
なお、アプリケーションや搭載する機器によっては、フィルタ処理量に対する制約が緩く、処理量が大きくても画質が良い方が好ましい場合もある。このような場合には、MPEG−2の復号画像に適用するフィルタはALF、SAO、デブロッキングフィルタを全て用いることが望ましい。またH.264/AVCの復号画像にはSAO、ALFを適用することが望ましい。
また以上では、HEVCの復号画像に対してはフィルタを適用しない構成について説明したが、これに限られない。HEVCの復号画像に関し、空間スケーラビリティにおいて、アップサンプリング後の画像にフィルタを適用する場合は、SAOを適用することが望ましい。
(作用・効果)
以上に示したように、階層画像復号装置1は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する。また、階層画像復号装置1は、上記上位レイヤから参照する上記下位レイヤからの復号画像に対して適用するフィルタを決定するフィルタ適用判定部1311と、参照する上記下位レイヤからの復号画像に対して、フィルタ適用判定部1311が決定したフィルタを適用するフィルタ適用部1312と、を備えている。
よって、下位レイヤからの復号画像の画質を向上させることで、上位レイヤにおける符号化効率を向上させ、上位レイヤの復号画像の客観・主観画質を向上させることができるという効果を奏する。
〔階層画像符号化装置〕
図13の階層画像符号化装置は本発明を適用した階層画像符号化装置2の一例である。図13に示すように階層画像符号化装置2は、下位レイヤ画像符号化装置21、上位レイヤ画像符号化装置22、フィルタ選択・処理部24、ダウンサンプリング部25、切り替え部26を備える。
下位レイヤ画像符号化装置21は下位レイヤの原画(空間スケーラビリティの場合は原画をダウンサンプリングした画像であるが、以降では原画と呼ぶ)を所定の符号化方式により符号化する。下位レイヤ画像符号化装置21が符号化に用いる符号化方式の一例は図14を用いて説明したようなH.264/AVCである。しかしながら、これに限らず、下位レイヤ画像符号化装置21はMPEG−2や現在規格策定中のHEVCを符号化に用いても構わない。
上位レイヤ画像符号化装置22は下位レイヤからの復号画像を参照して原画を符号化する。
ダウンサンプリング部25は、空間スケーラビリティの場合に原画をダウンサンプリングする。
切り替え部26は空間スケーラビリティの場合は原画をダウンサンプリングし、それ以外のスケーラビリティの場合は原画をそのまま下位レイヤ画像符号化装置21に入力する。
フィルタ選択・処理部24は下位レイヤからの復号画像を上位レイヤの予測画像として参照するためにフィルタを適用する。
以下、下位レイヤ画像符号化装置21、上位レイヤ画像符号化装置22、およびフィルタ選択・処理部24それぞれの構成例についてより詳しく説明する。
(下位レイヤ画像符号化装置の構成例)
図14を用いて下位レイヤ画像符号化装置21の構成例について説明する。図14は、下位レイヤ画像符号化装置21の構成例を示すブロック図である。
具体的には、下位レイヤ画像符号化装置21は、減算部211、直交変換・量子化部212、可変長符号化部213、逆量子化・逆変換部214、加算部215、ループフィルタ部216、メモリ217、および動き補償部218を備える。
減算部211は原画と予測画像の差分(予測誤差)を計算する。
直交変換・量子化部212は予測誤差に直交変換、量子化を施す。
可変長符号化部213は直交変換・量子化部212の出力等を可変長符号化し、下位レイヤ符号化データを出力する。
逆量子化・逆変換部214は直交変換・量子化部212の出力である量子化変換係数に逆量子化、逆変換を施す。
加算部215は逆量子化・逆変換部214の出力である復号された予測誤差と予測画像を加算する。
ループフィルタ部216は加算部215の出力である復号画像にループフィルタを適用する。
なお、符号化方式としてMPEG−2を採用する場合、ループフィルタ部2016は省略される。
また、符号化方式としてH.264/AVCを採用する場合、ループフィルタ部2016はデブロッキングフィルタである。
また、符号化方式としてHEVCを採用する場合、ループフィルタ部2016にはデブロッキングフィルタ、SAO、ALFの3種類のフィルタが含まれる。
メモリ217はループフィルタを適用した復号画像を格納する。
動き補償部218はメモリ217に格納された画像を利用して動き補償を行い、予測画像を出力する。
(上位レイヤ画像符号化装置の構成例)
図15を用いて、上位レイヤ画像符号化装置22の構成例について説明する。図15は、上位レイヤ画像符号化装置22の構成例を示すブロック図である。図15に示すように上位レイヤ画像符号化装置22は、ループフィルタを適用した画像符号化装置である。
具体的には、上位レイヤ画像符号化装置22は、減算部221、直交変換・量子化部222、可変長符号化部223、逆量子化・逆変換部224、加算部225、ループフィルタ部226、メモリ227、および動き補償部228、および切り替え部229を備える。
減算部221〜動き補償部228は図14の減算部211〜動き補償部218と同じ構成要素であるので、説明を省略する。
切り替え部229は下位レイヤからの復号画像と、動き補償部228の出力である動き補償画像とを切り替えて予測画像として出力する。
切り替え部229は、上記切り替え処理を、処理単位毎の予測モードや、ピクチャタイプ、スライスタイプに基づいて行う。
イントラピクチャ/イントラスライスでは、切り替え部229は、例えば原画と下位レイヤからのレイヤ間予測画像の差分、および原画と上位レイヤのイントラ予測画像(図示しない)との差分を比較し、差分値の小さい方を上位レイヤの符号化対象画像の予測画像として選択する。
また、P(片方向予測)/B(双方向予測)ピクチャ、P(片方向予測)/B(双方向予測)スライスでは、切り替え部229は、例えば原画と下位レイヤからのレイヤ間予測画像の差分、および原画と動き補償画像との差分を比較し、差分値の小さい方を上位レイヤの符号化対象画像の予測画像として選択する。また、切り替え部229は、どちらの予測を選択したかを示すフラグを可変長符号化部223に出力する(図15では図示していない)。
(フィルタ選択・処理部の構成例)
フィルタ選択・処理部24の具体例を図16に示す。図16に示すように、フィルタ選択・処理部24は、フィルタ選択・判定部241、フィルタ処理部242を備える。
フィルタ選択・判定部241は表1に従ってフィルタ部242で適用するフィルタを選択し、適用するフィルタ情報(タップ数、フィルタ係数等)、現在の処理対象画像に対してフィルタを適用するかどうかを決定する。フィルタ選択・判定部241における具体的なフィルタ情報の算出方法については後述する。
フィルタ部242は下位レイヤからの復号画像にフィルタを適用する。また、フィルタ部242の構成として、図2の13と同じ構成要素を採用することができる。
(フィルタ選択・判定部によるフィルタ情報の算出方法)
フィルタ選択・判定部241での最適なフィルタ情報の算出方法についての一例を、図17のフローチャートで示す。
図17はウィナーフィルタを用いたALFのフィルタ算出方法を説明する図である。以下で使用する符号化コストはcost=D+λ・R(ここでDは2乗誤差、Rは符号量、λはラグランジェ定数を表す)で計算する。
S601で、フィルタ選択・判定部241が、下位レイヤからの復号画像のフィルタ画像(FilterL)と、原画(Image0)との平均2乗誤差が最小になるようにフィルタ情報(フィルタ係数、タップ数等)を設定する。
S602で、フィルタ選択・判定部241が、処理単位毎に、下位レイヤからの復号画像のフィルタ画像(FilterL)と原画(Image0)との平均2乗誤差を計算する。
S603で処理単位毎に下位レイヤからの復号画像(ImageL)と原画(Image0)との平均2乗誤差を計算する。
S604で、フィルタ選択・判定部241が、フィルタを適用した場合の符号化コストcost_FilterLと、フィルタを適用しなかった場合の符号化コストcost_ImageLを算出する。
S605で、フィルタ選択・判定部241が、cost_FilterLとcost_ImageLとを比較し、フィルタの適用で符号化コストが削減できる場合(cost_FilterL<cost_ImageL)は、フィルタの適用(オン)を決定する(S606)。
フィルタの適用で符号化コストが削減できない場合(cost_FilterL≧cost_ImageL)、フィルタ選択・判定部241は、フィルタを適用しない(S607)。
フィルタ選択・判定部241は、S602〜S607のステップを全ての処理単位に対して実行する(S608)。
S609でフィルタ情報と処理単位毎のフィルタのオン/オフ情報とが、エンハンスメントレイヤの符号化データとして、図15の可変長符号化部223において符号化される。
以上はALFの例であるが、SAOにおいてもフィルタ選択・判定部241でフィルタ情報(タイプやエッジ方向を示す情報、オフセット等)と処理単位毎のフィルタのオン/オフ情報を求める。
なおフィルタ部242は1枚の画像全体を処理した後に、上位レイヤ画像符号化装置22、あるいは上位レイヤ画像復号装置12に対して1枚分のフィルタ画像を出力し、当該1枚分のフィルタ画像を上位レイヤでの符号化・復号処理で参照することができるようにしてもよい。しかしながら、これに限られず、フィルタ部242は、任意の処理単位でフィルタを適用することができる。例えば、フィルタ部242は、上位レイヤでの符号化・復号処理単位に合わせて、スライス、マクロブロック、LCU(Large Coding Unit)等の単位でアップサンプリングおよびフィルタ処理を施すことも可能である。
本発明では下位レイヤからの復号画像を、上位レイヤの符号化・復号処理の参照画像として用いる時に、下位レイヤからの復号画像にフィルタ処理を施し、客観・主観画質を向上させた後、上位レイヤで参照する画像の1つとして利用する。
本発明における上位レイヤの符号化・復号処理では、下位レイヤからの復号画像、アップサンプリングをする際に必要な下位レイヤの画像の解像度、ピクチャ構造(フレームストラクチャとフィールドストラクチャ、トップフィールドファーストとボトムフィールドファースト)が必要である。しかしながらこれらのデータは下位レイヤの画像をディスプレイに表示するために出力される情報であり、これらの情報を抽出するために下位レイヤのコーデックを変更する必要はない。従って実装にあたっては、既存のコーデックのハード、ソフトをそのまま利用して下位レイヤを構築し、上位レイヤのハード、ソフトを追加すればよい。
また本発明の上位レイヤの符号化・復号処理では上述以外の下位レイヤの情報を使用することなく処理することができる。つまり下位レイヤの符号化データに含まれる符号化情報を用いないため、下位レイヤのコーデックの種類に依存せず、上位レイヤの符号化・復号処理を進めることができる。
〔実施の形態2〕
本実施の形態では、上述したフィルタ部13で用いられるフィルタパラメータ(FP)の格納方法について説明する。まず、フィルタパラメータの格納方法の説明に先立ち、階層符号化について図24〜35を参照して説明する。
〔階層符号化の概要〕
本実施の形態に係る階層動画像復号装置(画像復号装置)1’は、階層動画像符号化装置(画像符号化装置)2’によってスケーラブル映像符号化(SVC;Scalable Video Coding)された符号化データを復号する。スケーラブル映像符号化とは、動画像を低品質のものから高品質のものにかけて階層的に符号化する符号化方式のことである。スケーラブル映像符号化は、例えば、H.264/AVC Annex G SVCにおいて標準化されている。なお、ここでいう動画像の品質とは、主観的および客観的な動画像の見栄えに影響する要素のことを広く意味する。動画像の品質には、例えば、“解像度”、“フレームレート”、“画質” 、および“画素の表現精度”が含まれる。よって、以下、動画像の品質が異なるといえば、例示的には、“解像度”等が異なることを指すが、これに限られない。例えば、異なる量子化ステップで量子化された動画像の場合(すなわち、異なる符号化雑音により符号化された動画像の場合)も互いに動画像の品質が異なるといえる。
また、SVCは、階層化される情報の種類の観点から、(1)空間スケーラビリティ、(2)時間スケーラビリティ、および(3)SNR(Signal to Noise Ratio)スケーラビリティに分類されることもある。空間スケーラビリティとは、解像度や画像のサイズにおいて階層化する技術である。時間スケーラビリティとは、フレーム・レート(単位時間のフレーム数)において階層化する技術である。また、SNRスケーラビリティは、符号化雑音において階層化する技術である。
本実施形態に係る階層動画像符号化装置2’及び階層動画像復号装置1’の詳細な説明に先立って、まず(1)階層動画像符号化装置2’によって生成され、階層動画像復号装置1’によって復号される階層符号化データのレイヤ構造について説明し、次いで(2)各レイヤで採用できるデータ構造の具体例について説明を行う。
〔階層符号化データのレイヤ構造〕
ここで、図24を用いて、階層符号化データの符号化および復号について説明すると次のとおりである。図24は、動画像を、下位階層L3、中位階層L2、および上位階層L1の3階層により階層的に符号化/復号する場合について模式的に表す図である。つまり、図2(a)および(b)に示す例では、3階層のうち、上位階層L3が最上位層となり、下位階層L3が最下位層となる。
以下において、階層符号化データから復号され得る特定の品質に対応する復号画像は、特定の階層の復号画像(または、特定の階層に対応する復号画像)と称される(例えば、上位階層L1の復号画像POUT#A)。
図24(a)は、入力画像PIN#A〜PIN#Cをそれぞれ階層的に符号化して符号化データDATA#A〜DATA#Cを生成する階層動画像符号化装置2’#A〜2’#Cを示している。図24(b)は、階層的に符号化された符号化データDATA#A〜DATA#Cをそれぞれ復号して復号画像POUT#A〜POUT#Cを生成する階層動画像復号装置1’#A〜1’#Cを示している。
まず、図24(a)を用いて、符号化装置側について説明する。符号化装置側の入力となる入力画像PIN#A、PIN#B、およびPIN#Cは、原画は同じだが、画像の品質(解像度、フレームレート、および画質等)が異なる。画像の品質は、入力画像PIN#A、PIN#B、およびPIN#Cの順に低くなる。
下位階層L3の階層画像符号化装置2’#Cは、下位階層L3の入力画像PIN#Cを符号化して下位階層L3の符号化データDATA#Cを生成する。下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報が含まれる(図24において“C”にて示している)。下位階層L3は、最下層の階層であるため、下位階層L3の符号化データDATA#Cは、基本符号化データとも称される。
また、中位階層L2の階層動画像符号化装置2’#Bは、中位階層L2の入力画像PIN#Bを、下位階層の符号化データDATA#Cを参照しながら符号化して中位階層L2の符号化データDATA#Bを生成する。中位階層L2の符号化データDATA#Bには、符号化データDATA#Cに含まれる基本情報“C”に加えて、中位階層の復号画像POUT#Bを復号するのに必要な付加的情報(図24において“B”にて示している)が含まれる。
また、上位階層L1の階層動画像符号化装置2’#Aは、上位階層L1の入力画像PIN#Aを、中位階層L2の符号化データDATA#Bを参照しながら符号化して上位階層L1の符号化データDATA#Aを生成する。上位階層L1の符号化データDATA#Aには、下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報“C”および中位階層L2の復号画像POUT#Bを復号するのに必要な付加的情報“B”に加えて、上位階層の復号画像POUT#Aを復号するのに必要な付加的情報(図24において“A”にて示している)が含まれる。
このように上位階層L1の符号化データDATA#Aは、異なる複数の品質の復号画像に関する情報を含む。
次に、図24(b)を参照しながら復号装置側について説明する。復号装置側では、上位階層L1、中位階層L2、および下位階層L3それぞれの階層に応じた復号装置1’#A、1’B、および1’#Cが、符号化データDATA#A、DATA#B、およびDATA#Cを復号して復号画像POUT#A、POUT#B、およびPOUT#Cを出力する。
なお、上位の階層符号化データの一部の情報を抽出して、より下位の特定の復号装置において、当該抽出した情報を復号することで特定の品質の動画像を再生することもできる。
例えば、中位階層L2の階層動画像復号装置1’#Bは、上位階層L1の階層符号化データDATA#Aから、復号画像POUT#Bを復号するのに必要な情報(すなわち、階層符号化データDATA#Aに含まれる“B”および“C”)を抽出して、復号画像POUT#Bを復号してもよい。言い換えれば、復号装置側では、上位階層L1の階層符号化データDATA#Aに含まれる情報に基づいて、復号画像POUT#A、POUT#B、およびPOUT#Cを復号することができる。
なお、以上の3階層の階層符号化データに限られず、階層符号化データは、2階層で階層符号化されていてもよいし、3階層よりも多い階層数にて階層符号化されていてもよい。
また、特定の階層の復号画像に関する符号化データの一部または全部を他の階層とは独立して符号化し、特定の階層の復号の際に、他の階層の情報を参照しなくても済むように階層符号化データを構成してもよい。例えば、図24(a)および(b)を用いて上述した例では、復号画像POUT#Bの復号に“C”および“B”を参照すると説明したが、これに限られない。復号画像POUT#Bが“B”だけを用いて復号できるように階層符号化データを構成することも可能である。
なお、SNRスケーラビリティを実現する場合、入力画像PIN#A、PIN#B、およびPIN#Cとして同一の原画を用いた上で、復号画像POUT#A、POUT#B、およびPOUT#Cが異なる画質となるよう階層符号化データを生成することもできる。その場合、下位階層の階層動画像符号化装置が、上位階層の階層動画像符号化装置に較べて、より大きい量子化幅を用いて予測残差を量子化することで階層符号化データを生成する。
本書では、説明の便宜上、次のとおり用語を定義する。以下の用語は、特に断りがなければ、下記の技術的事項のことを表わすのに用いる。
上位レイヤ : ある階層よりも上位に位置する階層のことを、上位レイヤと称する。例えば、図24において、下位階層L3の上位レイヤは、中位階層L2および上位階層L1である。また、上位レイヤの復号画像とは、より品質の高い(例えば、解像度が高い、フレームレートが高い、画質が高い等)復号画像のことをいう。
下位レイヤ : ある階層よりも下位に位置する階層のことを、下位レイヤと称する。例えば、図24において、上位階層L1の下位レイヤは、中位階層L2および下位階層L3である。また、下位レイヤの復号画像とは、より品質の低い復号画像のことをいう。
対象レイヤ : 復号または符号化の対象となっている階層のことをいう。
参照レイヤ(reference layer) : 対象レイヤに対応する復号画像を復号するのに参照される特定の下位レイヤのことをベースレイヤ(または、参照レイヤ)と称する。
図24(a)および(b)に示した例では、上位階層L1のベースレイヤ(参照レイヤ)は、中位階層L2および下位階層L3である。しかしながら、これに限られず、特定の上記レイヤの復号において、下位レイヤのすべてを参照しなくてもよいように階層符号化データを構成することもできる。例えば、上位階層L1のベースレイヤ(参照レイヤ)が、中位階層L2および下位階層L3のいずれか一方となるように階層符号化データを構成することも可能である。
基本レイヤ(base layer) : 最下層に位置する階層のことを基本レイヤと称する。基本レイヤの復号画像は、符号化データから復号され得るもっとも低い品質の復号画像であり、基本(base)復号画像と呼称される。別の言い方をすれば、基本復号画像は、最下層の階層に対応する復号画像のことである。基本復号画像の復号に必要な階層符号化データの部分符号化データは基本符号化データと呼称される。例えば、上位階層L1の階層符号化データDATA#Aに含まれる基本情報“C”が基本符号化データである。
拡張レイヤ : 基本レイヤの上位レイヤは、拡張レイヤと称される。
レイヤ識別子 : レイヤ識別子は、階層を識別するためのものであり、階層と1対1に対応する。階層符号化データには特定の階層の復号画像の復号に必要な部分符号化データを選択するために用いられる階層識別子が含まれる。特定のレイヤに対応するレイヤ識別子に関連付けられた階層符号化データの部分集合は、レイヤ表現とも呼称される。
一般に、特定の階層の復号画像の復号には、当該階層のレイヤ表現、および/または、当該階層の下位レイヤに対応するレイヤ表現が用いられる。すなわち、対象レイヤの復号画像の復号においては、対象レイヤのレイヤ表現、および/または、対象レイヤの下位レイヤに含まれる1つ以上階層のレイヤ表現が用いられる。
レイヤ間予測 : レイヤ間予測とは、対象レイヤのレイヤ表現と異なる階層(参照レイヤ)のレイヤ表現に含まれるシンタックス要素値、シンタックス要素値より導出される値、および復号画像に基づいて、対象レイヤのシンタックス要素値や対象レイヤの復号に用いられる符号化パラメータ等を予測することである。動き予測に関する情報を(同時刻の)参照レイヤの情報から予測するレイヤ間予測のことを動き情報予測と称することもある。また、(同時刻の)下位レイヤの復号画像をアップサンプリングした画像から予測するレイヤ間予測のことをテクスチャ予測(あるいはレイヤ間イントラ予測)と称することもある。なお、レイヤ間予測に用いられる階層は、例示的には、対象レイヤの下位レイヤである。また、参照レイヤを用いず対象レイヤ内で予測を行うことをレイヤ内予測と称することもある。
なお、以上の用語は、飽くまで説明の便宜上のものであり、上記の技術的事項を別の用語にて表現してもかまわない。
〔階層符号化データのデータ構造について〕
以下、各階層の符号化データを生成する符号化方式として、HEVCおよびその拡張方式を用いる場合について例示する。しかしながら、これに限られず、各階層の符号化データを、MPEG−2や、H.264/AVCなどの符号化方式により生成してもよい。
また、下位レイヤと上位レイヤとが異なる符号化方式によって符号化されていてもよい。また、階層の符号化データは、上記のように互いに異なる伝送路を介して階層動画像復号装置1’に供給されるものであってもよいし、同一の伝送路を介して階層動画像復号装置1’に供給されるものであってもよい。
例えば、超高精細映像(動画像、4K映像データ)を基本レイヤおよび1つの拡張レイヤによりスケーラブル符号化して伝送する場合、基本レイヤは、4K映像データをダウンスケーリングし、インタレース化した映像データをMPEG−2またはH.264/AVCにより符号化してテレビ放送網で伝送し、拡張レイヤは、4K映像(プログレッシブ)をHEVCにより符号化して、インターネットで伝送してもよい。
(基本レイヤ)
図25は、基本レイヤにおいて採用することができる符号化データ(図24の例でいえば、階層符号化データDATA#C)のデータ構造について例示する図である。階層符号化データDATA#Cは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。
階層符号化データDATA#Cにおけるデータの階層構造を図25に示す。図25の(a)〜(e)は、それぞれ、シーケンスSEQを規定するシーケンスレイヤ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、ツリーブロック(Tree block)TBLKを規定するツリーブロックレイヤ、ツリーブロックTBLKに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示す図である。
(シーケンスレイヤ)
シーケンスレイヤでは、処理対象のシーケンスSEQ(以下、対象シーケンスとも称する)を復号するために階層動画像復号装置1’が参照するデータの集合が規定されている。シーケンスSEQは、図25の(a)に示すように、シーケンスパラメータセットSPS(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、適応パラメータセットAPS(Adaptation Parameter Set)、ピクチャPICT〜PICTNP(NPはシーケンスSEQに含まれるピクチャの総数)、及び、付加拡張情報SEI(Supplemental Enhancement Information)を含んでいる。
シーケンスパラメータセットSPSでは、対象シーケンスを復号するために階層動画像復号装置1’が参照する符号化パラメータの集合が規定されている。
ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために階層動画像復号装置1’が参照する符号化パラメータの集合が規定されている。なお、PPSは複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。
適応パラメータセットAPSは、対象シーケンス内の各スライスを復号するために階層動画像復号装置1’が参照する符号化パラメータの集合が規定されている。APSは複数存在してもよい。その場合、対象シーケンス内の各スライスから複数のAPSの何れかを選択する。
(ピクチャレイヤ)
ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために階層動画像復号装置1’が参照するデータの集合が規定されている。ピクチャPICTは、図25の(b)に示すように、ピクチャヘッダPH、及び、スライスS1〜SNSを含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
なお、以下、スライスS1〜SNSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する階層符号化データDATA#Cに含まれるデータであって、添え字を付している他のデータについても同様である。
ピクチャヘッダPHには、対象ピクチャの復号方法を決定するために階層動画像復号装置1’が参照する符号化パラメータ群が含まれている。なお、符号化パラメータ群は、必ずしもピクチャヘッダPH内に直接含んでいる必要はなく、例えばピクチャパラメータセットPPSへの参照を含むことで、間接的に含めても良い。
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために階層動画像復号装置1’が参照するデータの集合が規定されている。スライスSは、図25の(c)に示すように、スライスヘッダSH、及び、ツリーブロックTBLK1〜TBLKNC(NCはスライスSに含まれるツリーブロックの総数)のシーケンスを含んでいる。
スライスヘッダSHには、対象スライスの復号方法を決定するために階層動画像復号装置1’が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、又は、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、又は、イントラ予測を用いるBスライスなどが挙げられる。
なお、スライスヘッダSHには、上記シーケンスレイヤに含まれる、ピクチャパラメータセットPPSへの参照(pic_parameter_set_id)、適応パラメータセットAPSへの参照(aps_id)を含んでいても良い。
また、スライスヘッダSHには、階層動画像復号装置1’の備える適応フィルタによって参照されるフィルタパラメータFPが含まれている。フィルタパラメータFPは、フィルタ係数群を含んでいる。フィルタ係数群には、(1)フィルタのタップ数を指定するタップ数指定情報、(2)フィルタ係数a0〜aNT-1(NTは、フィルタ係数群に含まれるフィルタ係数の総数)、および、(3)オフセットが含まれる。
(ツリーブロックレイヤ)
ツリーブロックレイヤでは、処理対象のツリーブロックTBLK(以下、対象ツリーブロックとも称する)を復号するために階層動画像復号装置1’が参照するデータの集合が規定されている。なお、ツリーブロックのことを符号化ツリーブロック(CTB:Coding Tree block)、または、最大符号化単位(LCU:Largest Cording Unit)と呼ぶこともある。
ツリーブロックTBLKは、ツリーブロックヘッダTBLKHと、符号化単位情報CU〜CUNL(NLはツリーブロックTBLKに含まれる符号化単位情報の総数)とを含む。ここで、まず、ツリーブロックTBLKと、符号化単位情報CUとの関係について説明すると次のとおりである。
ツリーブロックTBLKは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するためのパーティションに分割される。
ツリーブロックTBLKの上記パーティションは、再帰的な4分木分割により分割されている。この再帰的な4分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。
以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応するパーティションを、符号化ノード(coding node)として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。なお、符号化ノードは、符号化ブロック(CB: Coding Block)と呼ぶこともある。
つまり、符号化単位情報(以下、CU情報と称する)CU〜CUNLは、ツリーブロックTBLKを再帰的に4分木分割して得られる各符号化ノード(符号化単位)に対応する情報である。
また、符号化ツリーのルート(root)は、ツリーブロックTBLKに対応付けられる。換言すれば、ツリーブロックTBLKは、複数の符号化ノードを再帰的に含む4分木分割の木構造の最上位ノードに対応付けられる。
なお、各符号化ノードのサイズは、当該符号化ノードが直接に属する符号化ノード(すなわち、当該符号化ノードの1階層上位のノードのパーティション)のサイズの縦横とも半分である。
また、ツリーブロックTBLKのサイズ、および、各符号化ノードのとり得るサイズは、階層符号化データDATA#CのシーケンスパラメータセットSPSに含まれる、最小符号化ノードのサイズ指定情報、および最大符号化ノードと最小符号化ノードの階層深度の差分に依存する。例えば、最小符号化ノードのサイズが8×8画素であって、最大符号化ノードと最小符号化ノードの階層深度の差分が3である場合、ツリーブロックTBLKのサイズが64×64画素であって、符号化ノードのサイズは、4種類のサイズ、すなわち、64×64画素、32×32画素、16×16画素、および、8×8画素の何れかをとり得る。
(ツリーブロックヘッダ)
ツリーブロックヘッダTBLKHには、対象ツリーブロックの復号方法を決定するために階層動画像復号装置1’が参照する符号化パラメータが含まれる。具体的には、図25の(d)に示すように、対象ツリーブロックの各CUへの分割パターンを指定するツリーブロック分割情報SP_TBLK、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
ツリーブロック分割情報SP_TBLKは、ツリーブロックを分割するための符号化ツリーを表す情報であり、具体的には、対象ツリーブロックに含まれる各CUの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報である。
なお、ツリーブロック分割情報SP_TBLKは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばツリーブロック分割情報SP_TBLKは、対象ツリーブロック全体またはツリーブロックの部分領域を四分割するか否かを示すフラグの集合であってもよい。その場合、ツリーブロックの形状やサイズを併用することで各CUの形状やサイズを特定できる。
また、量子化パラメータ差分Δqpは、対象ツリーブロックにおける量子化パラメータqpと、当該対象ツリーブロックの直前に符号化されたツリーブロックにおける量子化パラメータqp’との差分qp−qp’である。
(CUレイヤ)
CUレイヤでは、処理対象のCU(以下、対象CUとも称する)を復号するために階層動画像復号装置1’が参照するデータの集合が規定されている。
ここで、CU情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー(prediction tree;PT)および変換ツリー(transform tree;TT)のルートのノードとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。
予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。
予測ツリーにおける分割(以下、PU分割と略称する)の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との2つがある。
イントラ予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)と、N×Nとがある。
また、インター予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)、2N×N、2N×nU、2N×nD、N×2N、nL×2N、nR×2N、および、N×Nなどがある。PU分割の種類については、後に図面を用いて説明する。
また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
変換ツリーにおける分割には、符号化ノードと同一のサイズの領域を変換ブロックとして割り付けるものと、上述したツリーブロックの分割と同様、再帰的な4分木分割によるものがある。
変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。
(CU情報のデータ構造)
続いて、図25(e)を参照しながらCU情報CUに含まれるデータの具体的な内容について説明する。図25(e)に示すように、CU情報CUは、具体的には、スキップフラグSKIP、予測ツリー情報(以下、PT情報と略称する)PTI、および、変換ツリー情報(以下、TT情報と略称する)TTIを含む。
スキップフラグSKIPは、対象のPUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、そのCU情報CUにおけるPT情報PTIの一部、および、TT情報TTIは省略される。なお、スキップフラグSKIPは、Iスライスでは省略される。
[PT情報]
PT情報PTIは、CUに含まれる予測ツリー(以下、PTと略称する)に関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合であり、階層動画像復号装置1’により予測画像を生成する際に参照される。PT情報PTIは、図25(e)に示すように、予測タイプ情報PType、および、予測情報PInfoを含んでいる。
予測タイプ情報PTypeは、対象PUについての予測画像生成方法として、イントラ予測を用いるのか、または、インター予測を用いるのかを指定する情報である。
予測情報PInfoは、予測タイプ情報PTypeが何れの予測方法を指定するのかに応じて、イントラ予測情報PP_Intra、または、インター予測情報PP_Interを含む。以下では、イントラ予測が適用されるPUをイントラPUとも呼称し、インター予測が適用されるPUをインターPUとも呼称する。
インター予測情報PP_Interは、階層動画像復号装置1’が、インター予測によってインター予測画像を生成する際に参照される符号化パラメータを含む。より具体的には、インター予測情報PP_Interは、対象CUの各インターPUへの分割パターンを指定するインターPU分割情報、および、各インターPUについてのインター予測パラメータを含む。
イントラ予測情報PP_Intraは、階層動画像復号装置1’が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータを含む。より具体的には、イントラ予測情報PP_Intraには、対象CUの各イントラPUへの分割パターンを指定するイントラPU分割情報、および、各イントラPUについてのイントラ予測パラメータが含まれる。イントラ予測パラメータは、各イントラPUについてのイントラ予測方法(予測モード)を指定するためのパラメータである。
また、PU分割情報には、対象PUの形状、サイズ、および、位置を指定する情報が含まれていてもよい。PU分割情報の詳細については後述する。
[TT情報]
TT情報TTIは、CUに含まれる変換ツリー(以下、TTと略称する)に関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数のTUそれぞれに関する情報の集合であり、階層動画像復号装置1’により残差データを復号する際に参照される。なお、以下、TUのことをブロックと称することもある。
TT情報TTIは、図25(e)に示すように、対象CUの各変換ブロックへの分割パターンを指定するTT分割情報SP_TT、および、量子化予測残差QD1〜QDNT(NTは、対象CUに含まれるブロックの総数)を含んでいる。
TT分割情報SP_TTは、具体的には、対象CUに含まれる各TUの形状、サイズ、および、対象CU内での位置を決定するための情報である。例えば、TT分割情報SP_TTは、対象となるノードの分割を行うのか否かを示す情報(split_transform_unit_flag)と、その分割の深度を示す情報(trafoDepth)とから実現することができる。
また、例えば、CUのサイズが、64×64の場合、分割により得られる各TUは、32×32画素から4×4画素までのサイズをとり得る。
各量子化予測残差QDは、階層動画像符号化装置2’が以下の処理1〜3を、処理対象のブロックである対象ブロックに施すことによって生成した符号化データである。
処理1:符号化対象画像から予測画像を減算した予測残差を周波数変換(例えば、DCT変換(Discrete Cosine Transform)およびDST変換(Discrete Sine Transform)等)する;
処理2:処理1にて得られた変換係数を量子化する;
処理3:処理2にて量子化された変換係数を可変長符号化する;
なお、上述した量子化パラメータqpは、階層動画像符号化装置2’が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2qp/6)。
(予測パラメータ)
インター予測およびイントラ予測における予測パラメータの詳細について説明する。上述のとおり、予測情報PInfoには、インター予測パラメータまたはイントラ予測パラメータが含まれる。
インター予測パラメータとしては、例えば、マージフラグ(merge_flag)、マージインデックス(merge_idx)、推定動きベクトルインデックス(mvp_idx)、参照画像インデックス(ref_idx)、インター予測フラグ(inter_pred_flag)、および動きベクトル残差(mvd)が挙げられる。
一方、イントラ予測パラメータとしては、例えば、推定予測モードフラグ、推定予測モードインデックス、および、残余予測モードインデックスが挙げられる。
(PU分割情報)
PU分割情報によって指定されるPU分割タイプには、対象CUのサイズを2N×2N画素とすると、次の合計8種類のパターンがある。すなわち、2N×2N画素、2N×N画素、N×2N画素、およびN×N画素の4つの対称的分割(symmetric splittings)、並びに、2N×nU画素、2N×nD画素、nL×2N画素、およびnR×2N画素の4つの非対称的分割(asymmetric splittings)である。なお、N=2(mは1以上の任意の整数)を意味している。以下、対象CUを分割して得られる領域のことをパーティションとも称する。
図26(a)〜(h)に、それぞれの分割タイプについて、CUにおけるPU分割の境界の位置を具体的に図示している。
図26(a)は、CUの分割を行わない2N×2NのPU分割タイプを示している。また、図26(b)、(c)、および(d)は、それぞれ、PU分割タイプが、2N×N、2N×nU、および、2N×nDである場合のパーティションの形状について示している。また、図26(e)、(f)、および(g)は、それぞれ、PU分割タイプが、N×2N、nL×2N、および、nR×2Nである場合のパーティションの形状について示している。また、図26(h)は、PU分割タイプが、N×Nである場合のパーティションの形状を示している。
図26(a)および(h)のPU分割タイプのことを、そのパーティションの形状に基づいて、正方形分割とも称する。また、図26(b)〜(g)のPU分割タイプのことは、非正方形分割とも称する。
また、図26(a)〜(h)において、各領域に付した番号は、領域の識別番号を示しており、この識別番号順に、領域に対して処理が行われる。すなわち、当該識別番号は、領域のスキャン順を表している。
[インター予測の場合の分割タイプ]
インターPUでは、上記8種類の分割タイプのうち、N×N(図26(h))以外の7種類が定義されている。なお、上記6つの非対称的分割は、AMP(Asymmetric Motion Partition)と呼ばれることもある。
また、Nの具体的な値は、当該PUが属するCUのサイズによって規定され、nU、nD、nL、および、nRの具体的な値は、Nの値に応じて定められる。例えば、128×128画素のインターCUは、128×128画素、128×64画素、64×128画素、64×64画素、128×32画素、128×96画素、32×128画素、および、96×128画素のインターPUへ分割することが可能である。
[イントラ予測の場合の分割タイプ]
イントラPUでは、次の2種類の分割パターンが定義されている。対象CUを分割しない、すなわち対象CU自身が1つのPUとして取り扱われる分割パターン2N×2Nと、対象CUを、4つのPUへと対称的に分割するパターンN×Nと、である。
したがって、イントラPUでは、図26に示した例でいえば、(a)および(h)の分割パターンを取ることができる。
例えば、128×128画素のイントラCUは、128×128画素、および、64×64画素のイントラPUへ分割することが可能である。
(拡張レイヤ)
拡張レイヤの符号化データについても、例えば、図25に示すデータ構造とほぼ同様のデータ構造を採用することができる。ただし、拡張レイヤの符号化データでは、以下のとおり、付加的な情報を追加したり、パラメータを省略したりすることができる。
SPSには階層符号化を示す情報が符号化されていてもよい。
また、スライスレイヤでは、空間スケーラビリティ、時間スケーラビリティ、および、SNRスケーラビリティの階層の識別情報(それぞれ、dependency_id、temporal_id、および、quality_id)が符号化されていてもよい。フィルタ情報やフィルタのオン/オフ情報(後述)はPPS、スライスヘッダ、マクロブロックヘッダ等で符号化することが可能である。
また、CU情報CUでは、スキップフラグ(skip_flag)、ベースモードフラグ(base_mode_flag)および予測モードフラグ(pred_mode_flag)が符号化されていてもよい。
また、これらのフラグにより対象CUのCUタイプが、イントラCU、インターCU、スキップCUおよびベーススキップCUのいずれであるかが指定されていてもよい。
イントラCUおよびスキップCUは、上述のHEVC方式の場合と同様に定義できる。例えば、スキップCUでは、スキップフラグに“1”が設定される。スキップCUでない場合、スキップフラグに“0”が設定される。また、イントラCUでは、予測モードフラグに“0”が設定される。
また、インターCUは、非スキップかつ動き補償(MC;Motion Compensation)を適用するCUと定義されていてもよい。インターCUでは、例えば、スキップフラグに“0”が設定され、予測モードフラグに“1”が設定される。
ベーススキップCUは、CUまたはPUの情報を参照レイヤから推定するCUタイプである。また、ベーススキップCUでは、例えば、スキップフラグに“1”が設定され、ベースモードフラグに“1”が設定される。
また、PT情報PTIでは、対象PUのPUタイプが、イントラPU、インターPU、マージPU、およびベースマージPUのいずれであるかが指定されていてもよい。
イントラPU、インターPU、マージPUは、上述のHEVC方式の場合と同様に定義できる。
ベースマージPUは、PUの情報を参照レイヤから推定するPUタイプである。また、例えば、PT情報PTIにおいて、マージフラグおよびベースモードフラグを符号化しておき、これらのフラグを用いて、対象PUがベースマージを行うPUであるか否かを判定してもよい。すなわち、ベースマージPUでは、マージフラグに“1”が設定され、ベースモードフラグに“1”が設定される。
なお、拡張レイヤに含まれる動きベクトル情報のうち、下位レイヤに含まれる動きベクトル情報から導出可能な動きベクトル情報については、拡張レイヤから省略する構成とすることができる。このような構成とすることによって、拡張レイヤの符号量を削減することができるので、符号化効率が向上する。
また、上述のとおり拡張レイヤの符号化データを、下位レイヤの符号化方式と異なる符号化方式により生成しても構わない。すなわち、拡張レイヤの符号化・復号処理は、下位レイヤのコーデックの種類に依存しない。
下位レイヤが、例えば、MPEG−2や、H.264/AVC方式によって符号化されていてもよい。
対象レイヤと参照レイヤとが異なる符号化方式によって符号化されている場合、参照レイヤのパラメータを、対象レイヤの対応するパラメータ、または、類似のパラメータに変換することでレイヤ間における相応の互換性を保つことができる。例えば、MPEG−2や、H.264/AVC方式におけるマクロブロックは、HEVCにおけるCTBに読み替えて解釈することが可能である。
なお、以上に説明したパラメータは、単独で符号化されていてもよいし、複数のパラメータが複合的に符号化されていてもよい。複数のパラメータが複合的に符号化される場合は、そのパラメータの値の組み合わせに対してインデックスが割り当てられ、割り当てられた当該インデックスが符号化される。また、パラメータが、別のパラメータや、復号済みの情報から導出可能であれば、当該パラメータの符号化を省略することができる。
〔階層動画像復号装置〕
以下では、本実施形態に係る階層動画像復号装置1’の構成について、図27〜32を参照して説明する。
(階層動画像復号装置の構成)
図27を用いて、階層動画像復号装置1’の概略的構成について説明すると次のとおりである。図27は、階層動画像復号装置1’の概略的構成について示した機能ブロック図である。階層動画像復号装置1’は、階層動画像符号化装置2’から供給される階層符号化データDATAを、HEVC方式により復号して、対象レイヤの復号画像POUT#Tを生成する。
図27に示すように階層動画像復号装置1’は、NAL逆多重化部51、可変長復号部52、予測パラメータ復元部54、テクスチャ復元部55、ベース復号部53、およびフィルタパラメータ復元部56を備える。
NAL逆多重化部51は、NAL(Network Abstraction Layer)におけるNALユニット単位で伝送される階層符号化データDATAを逆多重化する。
NALは、VCL(Video Coding Layer)と、符号化データを伝送・蓄積する下位システムとの間における通信を抽象化するために設けられる層である。
VCLは、動画像符号化処理を行う層のことであり、VCLにおいて符号化が行われる。一方、ここでいう、下位システムは、H.264/AVCおよびHEVCのファイルフォーマットや、MPEG−2システムに対応する。以下に示す例では、下位システムは、対象レイヤおよび参照レイヤにおける復号処理に対応する。
なお、NALでは、VCLで生成されたビットストリームが、NALユニットという単位で区切られて、宛先となる下位システムへ伝送される。NALユニットには、VCLで符号化された符号化データ、および、当該符号化データが宛先の下位システムに適切に届けられるためのヘッダが含まれる。また、各階層における符号化データは、NALユニット格納されることでNAL多重化されて階層動画像復号装置1’に伝送される。
NAL逆多重化部51は、階層符号化データDATAを逆多重化して、対象レイヤ符号化データDATA#Tおよび参照レイヤ符号化データDATA#Rを取り出す。また、NAL逆多重化部51は、対象レイヤ符号化データDATA#Tを可変長復号部52に供給するとともに、参照レイヤ符号化データDATA#Rをベース復号部16に供給する。
可変長復号部52は、対象レイヤ符号化データDATA#Tに含まれるバイナリから各種のシンタックス値を復号するための情報の復号処理を行う。
具体的には、可変長復号部52は、以下のように、予測情報、符号化情報、変換係数情報、およびフィルタパラメータ情報を符号化データDATA#Tから復号する。
すなわち、可変長復号部52は、各CUまたはPUに関する予測情報を、符号化データDATA#Tから復号する。予測情報には、例えば、CUタイプまたはPUタイプの指定が含まれる。
CUがインターCUである場合、可変長復号部12はPU分割情報を符号化DATA#Tから復号する。加えて、各PUにおいて、可変長復号部52は、さらに、予測情報として、参照画像インデックスRI、推定動きベクトルインデックスPMVI、及び、動きベクトル残差MVD等の動き情報、モード情報を符号化データDATA#Tから復号する。
一方、CUがイントラCUである場合、可変長復号部52は、さらに、予測情報として、(1)予測単位のサイズを指定するサイズ指定情報、および、(2)予測インデックスを指定する予測インデックス指定情報を含むイントラ予測情報を符号化データDATA#Tから復号する。
また、可変長復号部12は、符号化情報を符号化データDATA#Tから復号する。符号化情報には、CUの形状、サイズ、位置を特定するための情報が含まれる。より具体的には、符号化情報には、対象ツリーブロックの各CUへの分割パターンを指定するツリーブロック分割情報、すなわち、対象ツリーブロックに含まれる各CUの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報が含まれる。
可変長復号部52は、復号した予測情報および符号化情報を予測パラメータ復元部54に供給する。
また、可変長復号部52は、各ブロックに関する量子化予測残差QD、及び、そのブロックを含むツリーブロックに関する量子化パラメータ差分Δqpを符号化データDATA#Tから復号する。可変長復号部52は、復号した量子化予測残差QDおよび量子化パラメータ差分Δqpを変換係数情報としてテクスチャ復元部55に供給する。
また、可変長復号部52は、フィルタパラメータを導出するためのフィルタパラメータ情報を符号化データ#Tから復号してフィルタパラメータ復元部56に供給する。
ベース復号部53は、参照レイヤ符号化データDATA#Rから、対象レイヤに対応する復号画像を復号する際に参照される参照レイヤに関する情報であるベース復号情報を復号する。ベース復号情報には、ベース予測パラメータ、ベース変換係数、およびベース復号画像が含まれる。ベース復号部53は、復号したベース復号情報を予測パラメータ復元部54およびテクスチャ復元部55に供給する。
予測パラメータ復元部54は、予測情報およびベース復号情報を用いて、予測パラメータを復元する。予測パラメータ復元部54は、復元した予測パラメータを、テクスチャ復元部55に供給する。なお、予測パラメータ復元部14は、予測パラメータを復元する際に、テクスチャ復元部15が備えるフレームメモリ155(後述)に格納された動き情報を参照することができる。
フィルタパラメータ復元部56は、フィルタパラメータ情報を用いて、フィルタパラメータを導出し、テクスチャ復元部55に供給する。
テクスチャ復元部55は、変換係数情報、ベース復号情報、予測パラメータ、およびフィルタパラメータを用いて、復号画像POUT#Tを生成し、外部に出力する。なお、テクスチャ復元部15では、復元された復号画像に関する情報が、内部に備えるフレームメモリ155(後述)に格納される。
以下において、ベース復号部53、予測パラメータ復元部54、およびテクスチャ復元部55それぞれの詳細について説明する。
(予測パラメータ復元部)
図28を用いて、予測パラメータ復元部54の詳細構成について説明する。図28は、予測パラメータ復元部54の構成について例示した機能ブロック図である。
図28に示すように、予測パラメータ復元部54は、予測タイプ選択部141、スイッチ142、イントラ予測モード復元部143、動きベクトル候補導出部144、動き情報復元部145、マージ候補導出部146、およびマージ情報復元部147を備える。
予測タイプ選択部141は、CUタイプまたはPUタイプに応じてスイッチ142に切り替え指示を送り予測パラメータの導出処理を制御する。具体的には以下のとおりである。
イントラCUまたはイントラPUが指定されている場合、予測タイプ選択部141はイントラ予測モード復元部143を用いて予測パラメータを導出できるようスイッチ142を制御する。
インターCU(マージなし)およびインターPU(マージなし)のいずれかが指定されている場合、予測タイプ選択部141は動き情報復元部145を用いて予測パラメータを導出できるようスイッチ142を制御する。
ベーススキップCU、ベースマージCU、スキップCU、およびマージPUのいずれかが指定されている場合、予測タイプ選択部141はマージ情報復元部147を用いて予測パラメータを導出できるようスイッチ142を制御する。
スイッチ142は、予測タイプ選択部141の指示に応じて、予測情報を、イントラ予測モード復元部143、動き情報復元部145、およびマージ情報復元部147のいずれかに供給する。予測情報の供給先において予測パラメータが導出される。
イントラ予測モード復元部143は、予測情報から予測モードを導出する。すなわち、イントラ予測モード復元部143が予測パラメータとして復元するのは予測モードである。
ここで、図29を用いて、予測モードの定義について説明する。図29は、予測モードの定義を示している。同図に示すように、36種類の予測モードが定義されており、それぞれの予測モードは、「0」〜「35」の番号(イントラ予測モードインデックス)によって特定される。また、図30に示すように、各予測モードには次のような名称が割り当てられている。すなわち、「0」は、“Intra_Planar(プラナー予測モード、平面予測モード)”であり、「1」は、“Intra DC(イントラDC予測モード)”であり、「2」〜「34」は、“Intra Angular(方向予測)”であり、「35」は、“Intra From Luma”である。「35」は、色差予測モード固有のものであり、輝度の予測に基づいて色差の予測を行うモードである。言い換えれば、色差予測モード「35」は、輝度画素値と色差画素値との相関を利用した予測モードである。色差予測モード「35」はLMモードとも称する。予測モード数(intraPredModeNum)は、対象ブロックのサイズによらず「35」である。
動きベクトル候補導出部144は、ベース復号情報を用いて、レイヤ内動き情報推定処理、またはレイヤ間動き推定処理により推定動きベクトルの候補を導出する。動きベクトル候補導出部144は、導出した動きベクトルの候補を動き情報復元部145に供給する。
動き情報復元部145は、マージを行わない各インターPUに関する動き情報を復元する。すなわち、動き情報復元部145が予測パラメータとして復元するのは動き情報である。
動き情報復元部145は、対象PUがインターCUおよびインターPUである場合、予測情報から、動き情報を復元する。より具体的には、動き情報復元部145は、動きベクトル残差(mvd)、推定動きベクトルインデックス(mvp_idx)、インター予測フラグ(inter_pred_flag)および、参照画像インデックス(refIdx)を取得する。そして、インター予測フラグの値に基づいて、参照画像リストL0と参照画像リストL1各々について参照画像リスト利用フラグを決定する。続いて、対応する参照画像リスト利用フラグが、当該参照画像を利用することを示している場合、動き情報復元部145は、推定動きベクトルインデックスの値に基づいて、推定動きベクトルを導出するとともに、動きベクトル残差と推定動きベクトルとに基づいて動きベクトルを導出する。動き情報復元部145は、導出した動きベクトルと、参照画像リスト利用フラグ、および、参照画像インデックスと合わせて動き情報(動き補償パラメータ)として出力する。
マージ候補導出部146は、後述するフレームメモリ155から供給される復号済みの動き情報および/またはベース復号部16から供給されるベース復号情報等を用いて、各種のマージ候補を導出する。マージ候補導出部146は、導出したマージ候補をマージ情報復元部147に供給する。
マージ情報復元部147は、レイヤ内またはレイヤ間でマージを行う各PUに関する動き情報を復元する。すなわち、動き情報復元部145が予測パラメータとして復元するのは動き情報である。
具体的には、マージ情報復元部147は、対象CU(PU)がレイヤ内でマージを行うスキップCU(マージPU)である場合、マージ候補導出部146がレイヤ内マージにより導出した供給するマージ候補リストから、予測情報に含まれるマージインデックス(merge_idx)に対応する動き補償パラメータを導出することにより、動き情報を復元する。
また、マージ情報復元部147は、レイヤ間でマージを行うベーススキップCUである場合、マージ候補導出部146がレイヤ間マージにより導出したマージ候補リストから、予測情報に含まれるマージインデックス(merge_idx)に対応する動き補償パラメータを導出することにより、動き情報を復元する。
なお、マージ候補導出部146の詳細については後述する。
(テクスチャ復元部)
図31を用いて、テクスチャ復元部55の詳細構成について説明する。図31は、テクスチャ復元部55の構成について例示した機能ブロック図である。
図31に示すように、テクスチャ復元部55は、逆直交変換・逆量子化部151、テクスチャ予測部152、加算器153、ループフィルタ部154、およびフレームメモリ155を備える。
逆直交変換・逆量子化部151は、(1)可変長復号部52から供給される変換係数情報に含まれる量子化予測残差QDを逆量子化し、(2)逆量子化によって得られたDCT係数を逆直交変換(例えば、DCT(Discrete Cosine Transform)変換)し、(3)逆直交変換によって得られた予測残差Dを加算器153に供給する。なお、量子化予測残差QDを逆量子化する際に、逆直交変換・逆量子化部151は、変換係数情報に含まれる量子化パラメータ差分Δqpから量子化ステップQPを導出する。量子化パラメータqpは、直前に逆量子化/逆直交変換したツリーブロックに関する量子化パラメータqp’に量子化パラメータ差分Δqpを加算することによって導出でき、量子化ステップQPは、量子化パラメータqpからQP=2qp/6によって導出できる。また、逆直交変換・逆量子化部151による予測残差Dの生成は、ブロック(変換単位)を単位として行われる。
テクスチャ予測部152は、予測パラメータに応じて、ベース復号情報に含まれるベース復号画像またはフレームメモリに格納されている復号済みの復号画像を参照し、予測画像を生成する。
テクスチャ予測部152は、より詳細には、インター予測部152A、レイヤ内イントラ予測部152B、およびレイヤ間イントラ予測部152Cを備える。
インター予測部152Aは、各インター予測パーティションに関する予測画像をインター予測により生成する。具体的には、インター予測部152Aは、動き情報復元部145またはマージ情報復元部147から予測パラメータとして供給される動き情報を用いて、参照画像から予測画像を生成する。
レイヤ内イントラ予測部152Bは、各イントラ予測パーティションに関する予測画像をレイヤ内イントラ予測により生成する。具体的には、レイヤ内イントラ予測部152Bは、イントラ予測モード復元部143から予測パラメータとして供給される予測モードを用いて、対象パーティションにおいて復号済みの復号画像から予測画像を生成する。
レイヤ間イントラ予測部152Cは、各イントラ予測パーティションに関する予測画像をレイヤ間イントラ予測により生成する。具体的には、レイヤ間イントラ予測部152Cは、イントラ予測モード復元部143から予測パラメータとして供給される予測モードを用いて、ベース復号情報に含まれるベース復号画像に基づいて予測画像を生成する。ベース復号画像は、対象レイヤの解像度に合わせて適宜アップサンプリングされてもよい。
テクスチャ予測部152は、インター予測部152A、レイヤ内イントラ予測部152Bまたはレイヤ間イントラ予測部152Cが生成した予測画像を加算器153に供給する。
加算器153は、テクスチャ予測部152が生成した予測画像と、逆直交変換・逆量子化部151から供給された予測残差Dとを加算することによって復号画像を生成する。
ループフィルタ部154は、加算器153から供給される復号画像に対し、フィルタパラメータを用いて、デブロッキング処理や、適応フィルタパラメータによるフィルタ処理を施すものである。
フレームメモリ155は、ループフィルタ部154によるフィルタ済み復号画像を格納する。
(ベース復号部)
図32を用いて、ベース復号部53の詳細構成について説明する。図32は、ベース復号部53の構成について例示した機能ブロック図である。
図32に示すように、ベース復号部53は、可変長復号部161、ベース予測パラメータ復元部162、ベース変換係数復元部163、およびベーステクスチャ復元部164を備える。
可変長復号部161は、参照レイヤ符号化データDATA#Rに含まれるバイナリから各種のシンタックス値を復号するための情報の復号処理を行う。
具体的には、可変長復号部161は、予測情報および変換係数情報を符号化データDATA#Rから復号する。可変長復号部161が復号する予測情報および変換係数のシンタックスは、可変長復号部52と同様であるのでここではその詳細な説明を省略する。
可変長復号部161は、復号した予測情報を予測パラメータ復元部162に供給するとともに、復号した変換係数情報をベース変換係数復元部163に供給する。
ベース予測パラメータ復元部162は、可変長復号部161から供給される予測情報に基づいて、ベース予測パラメータを復元する。ベース予測パラメータ復元部162が、ベース予測パラメータを復元する方法については、予測パラメータ復元部54と同様であるので、ここではその詳細な説明を省略する。ベース予測パラメータ復元部162は、復元したベース予測パラメータを、ベーステクスチャ復元部164に供給するとともに、外部に出力する。
ベース変換係数復元部163は、可変長復号部161から供給される変換係数情報に基づいて、変換係数を復元する。ベース変換係数復元部163が変換係数を復元する方法については、逆直交変換・逆量子化部151と同様であるので、ここではその詳細な説明を省略する。ベース変換係数復元部163は、復元したベース変換係数を、ベーステクスチャ復元部164に供給するとともに、外部に出力する。
ベーステクスチャ復元部164は、ベース予測パラメータ復元部162から供給されるベース予測パラメータと、ベース変換係数復元部163から供給されるベース変換係数とを用いて、復号画像を生成する。具体的には、ベーステクスチャ復元部164は、ベース予測パラメータに基づき、テクスチャ予測部152と同様のテクスチャ予測を行って、予測画像を生成する。また、ベーステクスチャ復元部164は、ベース変換係数に基づいて予測残差を生成し、生成した予測残差と、テクスチャ予測により生成した予測画像とを加算することでベース復号画像を生成する。
なお、ベーステクスチャ復元部164は、ベース復号画像に対して、ループフィルタ部154と同様のフィルタ処理を施してもよい。また、ベーステクスチャ復元部164は、復号済みのベース復号画像を格納するためのフレームメモリを備えていてもよく、テクスチャ予測においてフレームメモリに格納されている復号済みのベース復号画像を参照してもよい。
〔階層動画像符号化装置〕
次に、本実施形態に係る階層動画像符号化装置2’の構成について、図33〜35を参照して説明する。
(階層動画像符号化装置の構成)
図33を用いて、階層動画像符号化装置2’の概略的構成について説明すると次のとおりである。図33は、階層動画像符号化装置2’の概略的構成について示した機能ブロック図である。階層動画像符号化装置2’は、対象レイヤの入力画像PIN#Tを、参照レイヤ符号化データDATA#Rを参照しながら符号化して、対象レイヤの階層符号化データDATAを生成する。なお、参照レイヤ符号化データDATA#Rは、参照レイヤに対応する階層動画像符号化装置において符号化済みであるとする。
図33に示すように階層動画像符号化装置2’は、予測パラメータ決定部61、予測情報生成部62、ベース復号部63、テクスチャ情報生成部64、可変長符号化部65、NAL多重化部66、およびフィルタパラメータ情報生成部67を備える。
予測パラメータ決定部61は、入力画像PIN#Tに基づいて、予測画像の予測に用いられる予測パラメータおよびその他の符号化の設定を決定する。
予測パラメータ決定部61は、予測パラメータをはじめとする符号化の設定を、以下のとおり行う。
まず、予測パラメータ決定部61は、入力画像PIN#Tを、スライス単位、ツリーブロック単位、CU単位に順次分割することにより、対象CUについてのCU画像を生成する。
また、予測パラメータ決定部61は、分割処理の結果に基づいて、符号化情報(ヘッダ情報とも称されることがある)を生成する。符号化情報は、(1)対象スライスに属するツリーブロックのサイズ、形状および対象スライス内での位置についての情報であるツリーブロック情報と、(2)各ツリーブロックに属するCUのサイズ、形状および対象ツリーブロック内での位置についての情報であるCU情報とを含んでいる。
さらに、予測パラメータ決定部61は、CU画像、ツリーブロック情報、およびCU情報を参照して、対象CUの予測タイプ、対象CUのPUへの分割情報、および、予測パラメータ(対象CUが、イントラCUであればイントラ予測モード、インターCUである場合には各PUにおける動き補償パラメータ)を導出する。
予測パラメータ決定部61は、(1)対象CUの予測タイプ、(2)対象CUの各PUへの可能な分割パターン、および、(3)各PUに割り付ける可能な予測モード(イントラCUであればイントラ予測モード、インターCUであれば動き補償パラメータ)、の全ての組み合わせについて、コストを算出し、最低コストの予測タイプ、分割パターン、および、予測モードを決定する。
予測パラメータ決定部61は、符号化情報および予測パラメータを予測情報生成部62およびテクスチャ情報生成部64に供給する。なお、説明の簡便のため図示しないが、予測パラメータ決定部61において決定された上記の符号化の設定は、階層動画像符号化装置2’の各部において参照可能とする。
予測情報生成部62は、予測パラメータ決定部61から供給される予測パラメータと、参照レイヤ符号化データDATA#Rとに基づいて予測パラメータに関するシンタックス値を含む予測情報を生成する。予測情報生成部62は、生成した予測情報を可変長符号化部65に供給する。なお、予測情報生成部62は、予測パラメータを復元する際に、テクスチャ情報生成部64が備えるフレームメモリ244(後述)に格納された動き情報を参照することができる。
ベース復号部63は、階層動画像復号装置1’のベース復号部53と同様であるので、ここではその説明を省略する。
テクスチャ情報生成部64は、入力画像PIN#Tから予測画像を減算して得られる予測残差を、直交変換・量子化した変換係数を含む変換係数情報を生成する。テクスチャ情報生成部64は、生成した変換係数情報を可変長符号化部65に供給する。なお、テクスチャ情報生成部64では、復元された復号画像に関する情報が、内部に備えるフレームメモリ244(後述)に格納される。
また、テクスチャ情報生成部64は、フィルタパラメータを設定し、フィルタパラメータ情報生成部67に供給する。
フィルタパラメータ情報生成部67は、テクスチャ情報生成部64から供給されたフィルタパラメータに関するシンタクス値を含むフィルタパラメータ情報を生成する。フィルタパラメータ情報生成部67は、生成したフィルタパラメータ情報を可変長符号化部65に供給する。
可変長符号化部65は、予測情報生成部62から供給される予測情報、テクスチャ情報生成部64から供給される変換係数情報、およびフィルタパラメータ情報生成部67から供給されるフィルタパラメータ情報を可変長符号化して対象レイヤ符号化データDATA#Tを生成する。可変長符号化部65は、生成した対象レイヤ符号化データDATA#TをNAL多重化部66に供給する。
NAL多重化部66は、可変長符号化部65から供給される対象レイヤ符号化データDATA#Tと、参照レイヤ符号化データDATA#RとをNALユニットに格納することでNAL多重化した階層動画像符号化データDATAを生成し、外部に出力する。
以下において、予測情報生成部62、およびテクスチャ情報生成部64それぞれの詳細について説明する。
(予測情報生成部)
図34を用いて、予測情報生成部62の詳細構成について説明する。図34は、予測情報生成部62の構成について例示した機能ブロック図である。
図34に示すように、予測情報生成部62は、予測タイプ選択部261、スイッチ262、イントラ予測モード導出部263、動きベクトル候補導出部264、動き情報生成部265、マージ候補導出部266、およびマージ情報生成部267を備える。
予測タイプ選択部261は、CUタイプまたはPUタイプに応じてスイッチ262に切り替え指示を送り予測パラメータの導出処理を制御する。具体的には以下のとおりである。
イントラCUまたはイントラPUが指定されている場合、予測タイプ選択部261はイントラ予測モード導出部263を用いて予測情報を導出できるようスイッチ262を制御する。
インターCU(マージなし)およびインターPU(マージなし)のいずれかが指定されている場合、予測タイプ選択部261は動き情報生成部265を用いて予測パラメータを導出できるようスイッチ262を制御する。
ベーススキップCU、ベースマージCU、スキップCU、およびマージPUのいずれかが指定されている場合、予測タイプ選択部261はマージ情報生成部267を用いて予測パラメータを導出できるようスイッチ262を制御する。
スイッチ262は、予測タイプ選択部261の指示に応じて、予測パラメータを、イントラ予測モード導出部263、動き情報生成部265、およびマージ情報生成部267のいずれかに供給する。予測情報の供給先において予測パラメータが導出される。
イントラ予測モード導出部263は、予測モードに関するシンタックス値を導出する。すなわち、イントラ予測モード導出部263が予測情報として生成するのは、予測モードに関するシンタックス値である。
動きベクトル候補導出部264は、ベース復号情報を用いて、レイヤ内動き推定処理、またはレイヤ間動き推定処理により動きベクトルの候補を導出する。動きベクトル候補導出部264は、導出した動きベクトルの候補を動き情報生成部265に供給する。
動き情報生成部265は、レイヤ内でマージを行わない各インター予測パーティションにおける動き情報に関するシンタックス値を生成する。すなわち、動き情報生成部265が予測情報として生成するのは動き情報に関するシンタックス値である。具体的には、動き情報生成部265は、各PUにおける動き補償パラメータから、対応するシンタックス要素値であるinter_pred_flag、mvd、mvp_idx、および、refIdxを導出する。
具体的には、動き情報生成部265は、対象PUがベーススキップCUまたはベースマージPUである場合、動きベクトル候補導出部264から供給される動きベクトルの候補に基づいて、上記シンタックス値を導出する。
一方、動き情報生成部265は、対象CU(PU)がマージを行わないインターCUおよびインターPUである場合、予測パラメータに含まれる動き情報に基づいて、上記シンタックス値を導出する。
マージ候補導出部266は、後述するフレームメモリ155から供給される復号済みの動き情報および/またはベース復号部53から供給されるベース復号情報等を用いて、各PUにおける動き補償パラメータと類似の動き補償パラメータを有するマージ候補を導出する。マージ候補導出部266は、導出したマージ候補をマージ情報生成部267に供給する。マージ候補導出部266の構成は、階層動画像復号装置1’に含まれるマージ候補導出部146の構成と同様であるので、その説明を省略する。
マージ情報生成部267は、レイヤ内でマージを行う各インター予測パーティションに関する動き情報に関するシンタックス値を生成する。すなわち、マージ情報生成部267が予測情報として生成するのは動き情報に関するシンタックス値である。具体的には、マージ情報生成部267は、各PUにおける動き補償パラメータと類似の動き補償パラメータを有するマージ候補を指定するシンタックス要素値merge_idxを出力する。
(テクスチャ情報生成部)
図35を用いて、テクスチャ情報生成部64の詳細構成について説明する。図34は、テクスチャ情報生成部64の構成について例示した機能ブロック図である。
図34に示すように、テクスチャ情報生成部64は、テクスチャ予測部271、減算器272、直交変換・量子化部273、逆直交変換・逆量子化部274、加算器275、ループフィルタ部276、フレームメモリ277、およびフィルタパラメータ導出部278を備える。
減算器272は、入力画像PIN#Tからテクスチャ予測部271から供給される予測画像を減算することによって、予測残差Dを生成する。減算器272は、生成した予測残差Dを、直交変換・量子化部273に供給する。
直交変換・量子化部273は、予測残差Dに対して、直交変換および量子化を行うことで量子化予測残差を生成する。なお、ここで直交変換とは、画素領域から周波数領域への直交変換のことをさす。また、直交変換の例としては、DCT変換(Discrete Cosine Transform)、およびDST変換(Discrete Sine Transform)等が挙げられる。また、具体的な量子化過程については、すでに説明した通りであるので、ここではその説明を省略する。直交変換・量子化部273は、生成した量子化予測残差を含む変換係数情報を逆直交変換・逆量子化部274および可変長符号化部65に供給する。
フィルタパラメータ導出部278は、入力画像PIN#Tおよび加算器275から供給された復号画像からフィルタパラメータを導出し、ループフィルタ部276、およびフィルタパラメータ情報生成部67に供給する。
テクスチャ予測部271、逆直交変換・逆量子化部274、加算器275、ループフィルタ部276、およびフレームメモリ277は、それぞれ、階層動画像復号装置1’に含まれるテクスチャ予測部152、逆直交変換・逆量子化部151、加算器153、ループフィルタ部154、およびフレームメモリ155と同様であるので、ここではその説明は省略する。ただし、テクスチャ予測部271は、加算器275だけでなく減算器272にも予測画像を供給する。
〔フィルタパラメータの格納方法〕
〔概要〕
現行の規格の階層符号化(H.264/AVCベースのSVC)では適応フィルタ(例、ALF、SAO)は用いられていない。しかしながら、階層符号化では、適応フィルタ処理がなされていない基本レイヤ画像が用いられる場合や、拡張レイヤと基本レイヤの解像度が異なる場合等があり、これらの場合、基本レイヤ画像に適応フィルタを適用することにより、大きな効果が見込める。
なお、現行の規格では、適応フィルタの処理方法や符号化データの構成は決められていない。
そこで、本実施の形態では、基本レイヤ画像(及びその拡大画像)に対し、適応フィルタを適用するとともに、適応フィルタパラメータを拡張レイヤの符号化データで符号化する。
〔フィルタパラメータの格納方法1〕
基本レイヤ画像に適用する適応フィルタのフィルタパラメータを、拡張レイヤに、各CTBでインターリーブすることが考えられる。
この構成により、フィルタパラメータの復号時が該フィルタパラメータの使用時となるため、復号したフィルタパラメータをメモリに格納する必要がなくなり、メモリの削減を図ることができる。なお、スライスヘッダ及びAPSでフィルタパラメータを復号する場合、1スライス及び1ピクチャ分のフィルタパラメータをメモリに格納する必要がある。
基本レイヤ画像に適用する適応フィルタのフィルタパラメータを、拡張レイヤに、各CTBでインターリーブする場合のシンタクス例について、図36〜38に示す。図36のシンタクス例に示すように、本実施形態では、CTB単位で以下のパラメータが符号化されている。
SAOパラメータ:base_layer_sao_unit_cabac
ALFパラメータの内のオンオフフラグ:base_layer_alf_ctb_enable_flag
図37(a)、(b)に、SAOパラメータ:base_layer_sao_unit_cabacの詳細を示すシンタクス例を示す。
また、図38(a)、(b)に、ALFのフィルタパラメータの詳細を示すシンタクス例を示す。図38(a)、(b)に示すシンタクス例のように、ALFのフィルタパラメータについては、フィルタ係数をAPSで符号化し、上述したようにオンオフフラグをCTBで符号化する。なお、フィルタ係数は、スライスヘッダで符号化してもよい。
なお、シンタクス例において、ue(v)は、この記述子に関連付けられたシンタックスは符号なしの数値であり、値が可変長符号化されることを示している。また、se(v)は、この記述子に関連付けられたシンタックスは符号付きの数値であり、符号と絶対値に分けて可変長符号化されることを示している。また、ae(v)は、この記述子に関連づけられたシンタックスが算術符号を用いて可変長符号化されることを示している。また、u(n)は、この記述子に関連付けられたシンタックスは符号なしの数値であり、nビットの固定長符号化が用いられることを示している。
〔レイヤ間イントラ予測部における動作〕
基本レイヤ画像に適用する適応フィルタのフィルタパラメータを、拡張レイヤに、各CTBでインターリーブする場合のレイヤ間イントラ予測部における動作について、図39を参照して説明する。
図39(a)に示すように、レイヤ間イントラ予測部152Cには、ブロック抽出部、アップサンプル部、適応オフセットフィルタ部、適応空間フィルタ部が備えられている。
なお、適応オフセットフィルタ部、適応空間フィルタ部のうちの何れかの適応フィルタを備える構成でも良い。すなわち、適応フィルタとして適応オフセットフィルタのみを備える構成(ブロック抽出部、アップサンプル部、適応オフセットフィルタ部)でも良いし、適応フィルタとして適応空間フィルタのみを備える構成(ブロック抽出部、アップサンプル部、適応空間フィルタ部)でも良い。
レイヤ間イントラ予測部152Cは、各イントラ予測パーティションに関する予測画像をレイヤ間イントラ予測により生成する。予測画像のブロック(PU)を生成は、PU単位もしくはCTB単位で行われる。一般に、予測画像の生成はPU単位で行われるが、本構成では、適応フィルタのフィルタパラメータを各CTBの先頭でインタリーブするため、各CTB内で得られるPUのパラメータを導出する前に、適応フィルタ処理を行うことができる。従って、レイヤ間イントラ予測部152Cは、PU単位に限らずCTB単位で適応フィルタ処理を含む予測画像導出処理を行うことができる。
<PU単位の予測画像生成(a)>
ブロック抽出部は、予測ブロックを生成するために必要な基本レイヤ上の領域(基本レイヤ参照ブロック)を導出する。まず、以下の手順で、拡張レイヤブロックの範囲を導出する。拡張レイヤブロックの範囲とは、ブロック抽出部およびアップサンプル部により生成される画像のブロックである。適応フィルタを適用した予測画像を生成する場合には、適応フィルタでの参照範囲を考慮して生成対象となる予測ブロック(PU単位処理ではPU)よりも大きなブロックを必要とする。以下、予測ブロックの幅をnPSW、高さをnPSHで表現する。
(1)拡張レイヤブロックの範囲=予測ブロックの範囲とする。
(2)対象PUを含むCTBにおいて、適応空間フィルタがオンの場合には、適応フィルタの参照範囲(左右ALFW画素、上下ALFH画素)だけ、拡張レイヤブロックの範囲を広げる。
(3)対象PUを含むCTBにおいて、適応オフセットフィルタがオンの場合には、適応フィルタの参照範囲(左右1画素、上下1画素)だけ、拡張レイヤブロックの範囲を広げる。
次に、以下の手順で、基本レイヤ参照ブロックの範囲を導出する。
(1)基本レイヤと拡張レイヤの解像度が等しい場合には、基本レイヤ参照ブロック=拡張レイヤブロックとする。
(2)基本レイヤと拡張レイヤの解像度が異なる場合には、拡張レイヤブロックから基本レイヤ参照ブロックを求める。
最後に、ベースレイヤ復号画像からベースレイヤ参照ブロックを抽出する。
アップサンプル部は、基本レイヤと拡張レイヤとの解像度が異なる場合には、基本レイヤ参照ブロックにアップサンプルを施し、拡張レイヤブロックを生成する。一方、基本レイヤと拡張レイヤとの解像度が等しい場合には、基本レイヤ参照ブロックを拡張レイヤブロックとする。
適応オフセットフィルタ部は、拡張レイヤブロックに、適応オフセットフィルタ処理を行う。
適応空間フィルタ部は、適応オフセットフィルタ部の出力に、適応空間フィルタ処理を行う。
換言すれば、レイヤ間イントラ予測部は、図40に示すように、(nPSW+ALFWx2+1) x (nPSH+ALFHx2+1)の基本レイヤ参照ブロック(拡張レイヤの座標系でのサイズ)について、アップサンプリングすることにより、(nPSW+ALFWx2+1) x (nPSH+ALFHx2+1)の拡張レイヤ参照ブロックとする。この拡張レイヤ参照ブロックに対し適応オフセットフィルタを適用し、(nPSW+ALFWx2) x (nPSH+ALFHx2)のブロックとする。さらに、適応空間フィルタを適用し、nPSW x nPSHの予測画像を生成する。
なお、従来の構成のレイヤ間イントラ予測部では、図39(b)に示すように、ブロック抽出部およびアップサンプル部のみを備えており、フィルタ処理は行われていない。
<CTB単位の予測画像生成(b)>
CTB単位での予測画像生成の動作は、上記のPU単位の予測画像生成の動作と同じである。そして、予測ブロックの幅nPSW、高さnPSHを、CTBの幅、高さに置き替えて動作させる。また、各PUでは、予測画像を生成する際に、CTB単位で導出されたブロックから、必要となる予測画像の範囲のみを切り取る。
上記のように、CTBの先頭でフィルタパラメータをインターリーブすることにより、予測画像生成で行われる、適応フィルタ処理を予測画像を復号するパラメータを復号する前の時点で行うことができる。
また、上記のように、CTB内の各PUにおいて共有のフィルタパラメータを用いることにより、PU単位ではなくCTB単位でフィルタ処理を行うことが可能となる。これにより、各PUで独立してフィルタ処理を行う場合に比べ、フィルタ処理の処理量を低減することができる。また、フィルタパラメータの符号量のオーバーヘッドを低減し、符号化効率を高めることができる。
〔フィルタパラメータの格納方法2〕
基本レイヤ画像に適用する適応フィルタのフィルタパラメータを、拡張レイヤのスライスヘッダ、またはパラメータセット(例えば、APS)で符号化することが考えられる。スライスヘッダやパラメータセットは、予測パラメータや残差を含むCTB単位で符号化されるスライスデータを復号する前に、復号される。
スライスヘッダ、またはAPSで符号化する場合、レイヤ間イントラ予測部は、以下の(a)、(b)、(c)のいずれかの処理を行う。
(a)PUを生成する時点で、PU単位で、ブロック抽出処理、アップサンプル処理、適応フィルタ処理を行う。
(b)CTBを復号する時点で、CTB単位でブロック抽出処理、アップサンプル処理、適応フィルタ処理を行う。
(c)基本レイヤ画像を復号した時点で、アップサンプル処理、適応フィルタ処理を行う。
上記(a)、(b)の処理は、各々、上記、PU単位の予測画像生成(a)、PU単位の予測画像生成(a)で既に説明した処理と同じため説明を省略する。
本実施形態に係るフィルタパラメータの格納方法2によれば、PUを生成する時点、CTBを復号する時点だけでなく、基本レイヤ画像を復号した時点で、適応フィルタ処理を行うことができる。そのため、CTB毎の符号化データの可変長復号、逆変換、予測画像生成などのパイプラインに適応フィルタ処理を入れる必要がない。よって、パイプラインに遅延を発生されるような適応フィルタ処理を避けることができ、全体のスループットが向上する。
また、復号装置の構成(プロセッサ数、アクセラレータ数、ハード規模、内部メモリ量、メモリバンド幅等)にあわせて、PU単位処理、CTB単位処理に加え、ピクチャ単位、スライス単位、CTBライン単位など、好適なフィルタ処理の単位を変更することができるため、復号装置の設計が容易になる。
また、基本レイヤを復号する時点で適応フィルタ処理を行う場合には、PU単位およびCTB単位よりも大きい単位(スライス、ピクチャ)でアップサンプル、適応フィルタ処理を行えばよいため、フィルタ処理の処理量を低減させることができる。
基本レイヤ画像に適用する適応フィルタのフィルタパラメータを、拡張レイヤのAPSヘッダで符号化する場合のシンタクス例について、図41〜44に示す。
図41のシンタクス例に示すように、本実施形態では、適応フィルタパラメータ(SAO、ALF)が、APSで符号化されている。なお、シーケンスパラメータセット、ピクチャパラメータセット、スライスヘッダで符号化されていてもよい。
図42(a)、(b)に、APSで符号化するSAOパラメータbase_layer_aps_sao_paramの詳細を示す、シンタクス例を示す。また、図43(a)、(b)、(c)に、SAOパラメータbase_layer_aps_sao_paramの構成を示すシンタクス例を示す。また、図44に、APSで符号化するALFパラメータbase_layer_alf_picture_infoの詳細を示すシンタクス例を示す。
〔レイヤ間イントラ予測部における動作〕
基本レイヤ画像に適用する適応フィルタのフィルタパラメータを、拡張レイヤのスライスヘッダ、またはパレメータセット(例えば、APS)で符号化する場合のレイヤ間イントラ予測部における動作について、図45を参照して説明する。
図45に示すように、レイヤ間イントラ予測部152Cには、ブロック抽出部、アップサンプル部、適応オフセットフィルタ部、適応空間フィルタ部が備えられている。
レイヤ間イントラ予測部152Cは、以下の(a)〜(c)のいずれかの処理を行う。
(a)PUを生成する時点で、PU単位で、ブロック抽出処理、アップサンプル処理、適応フィルタ処理を行う。
(b)CTBを復号する時点で、CTB単位でブロック抽出処理、アップサンプル処理、適応フィルタ処理を行う。
(c)基本レイヤ画像を復号した時点で、アップサンプル処理、適応フィルタ処理を行う。
上記(a)、(b)の場合の処理は、上記フィルタパラメータの格納方法1に記載した処理と同様である。
また、上記(c)の場合の処理も、上記フィルタパラメータの格納方法2に記載した処理と同様であるが、さらに、詳細を以下に説明する。
以下の通りである。
ブロック抽出部は、スライス単位もしくはピクチャ単位で、基本レイヤ参照ブロックを抽出する。アップサンプル部は、基本レイヤと拡張レイヤとの解像度が異なる場合、基本レイヤ参照ブロックをアップサンプルし、拡張レイヤ参照ブロックとする。また、基本レイヤと拡張レイヤとの解像度が同じ場合、基本レイヤ参照ブロックを拡張レイヤ参照ブロックとする。適応オフセットフィルタ部は、拡張レイヤ参照ブロックに、適応オフセットフィルタ処理を行う。適応空間フィルタ部は、適応オフセットフィルタ部の出力に、適応空間フィルタ処理を行う。
上記の構成によれば、下位レイヤからの復号画像に適用するフィルタのパラメータが上位レイヤの共通群(パラメータセットもしくはスライスヘッダ)に格納される。上位レイヤのスライスデータを復号する前に、すなわち、下位レイヤからの画像を復号した時点で、フィルタ処理を行うことが可能となり、スループットを向上させることができる。
また、フィルタの適用を予測画像よりも大きな単位(ピクチャ単位、スライス単位、CTB単位)で行うことが可能となり、フィルタ処理を簡略化することができる。
〔フィルタパラメータの格納方法3〕
イントラレイヤ間予測はPU単位で選択され、適応フィルタのフィルタパラメータはCTB単位で符号化されている。各CTBでは、PU単位で、イントラ予測を行うかインター予測を行うかを選択することから、CTBに含まれる全てのPUでインター予測だけが用いられることもある。また、イントラ予測を用いる場合も、方向予測などが用いられ、イントラレイヤ間予測が用いられないこともある。
このようなイントラレイヤ間予測が用いられないCTBで、適応フィルタを適用するか否かを示すフラグ(オンオフフラグ)などの、イントラレイヤ間予測で用いられるフィルタパラメータを符号化する場合、無駄なフラグを符号化することになり符号化効率が低下してしまう。
そこで、本実施形態では、基本レイヤに対する適応フィルタ処理は、イントラスライスのみに限定している。ここで、イントラスライスとは、当該スライスに含まれるCTBは、すべてイントラ予測によって予測画像が生成されているスライスである。CTBに含まれる全てのPUでイントラ予測が用いられ、イントラレイヤ予測のうちインターレイヤ間予測が用いられる割合が高いことから、該CTBにおいて多くの場合、インターレイヤ間予測が用いられる。従って、無駄なフラグの符号化がさけられる。
この構成により、基本レイヤに対する適応フィルタ処理は、イントラスライスのみに限定されるため、イントラレイヤ間予測が用いられないCTBで、適応フィルタパラメータを符号化することを避けることができる。これにより符号化効率が向上する。
また、基本レイヤに対する適応フィルタ処理を、イントラレイヤ間予測が主に用いられるイントラスライスのみに限定することにより、適応フィルタ処理の効果を維持したまま基本レイヤに対する適応フィルタ処理の処理量を削減することができる。
特に、基本レイヤに対する適応フィルタ処理は、重い処理であるので、処理量を削減することにより、処理負荷を軽くすることができる。
図46に、基本レイヤに対する適応フィルタ処理は、イントラスライスのみに限定する構成のシンタクス例を示す。図46のシンタクス例に示すように、イントラスライスのみで、以下のパラメータを符号化している。また、イントラスライス以外では0と推測する。
SAOパラメータ:base_layer_sao_unit_cabac
ALFパラメータの内のオンオフフラグ:base_layer_alf_ctb_enable_flag
(応用例)
図21および図22を用いて、上述した階層画像符号化装置2、階層動画像符号化装置2’、階層画像復号装置1、および階層動画像復号装置1’の応用例について説明する。上述した階層画像符号化装置2(階層動画像符号化装置2’)及び階層画像復号装置1(階層動画像符号化装置1’)は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
まず、上述した階層画像符号化装置2及び階層画像復号装置1を、動画像の送信及び受信に利用できることを、図21を参照して説明する。
図21の(a)は、階層画像符号化装置2を搭載した送信装置PROD_Aの構成を示したブロック図である。図21の(a)に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3と、を備えている。上述した階層画像符号化装置2は、この符号化部PROD_A1として利用される。
送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部A7を更に備えていてもよい。図21の(a)においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。
図21の(b)は、階層画像復号装置1を搭載した受信装置PROD_Bの構成を示したブロック図である。図21の(b)に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3と、を備えている。上述した階層画像復号装置1は、この復号部PROD_B3として利用される。
受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図21の(b)においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。
例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。
また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置PROD_A/受信装置PROD_Bの一例である(通常、LANにおいては伝送媒体として無線又は有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。
なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。
次に、上述した階層画像符号化装置2及び階層画像復号装置1を、動画像の記録及び再生に利用できることを、図22を参照して説明する。
図22の(a)は、上述した階層画像符号化装置2を搭載した記録装置PROD_Cの構成を示したブロック図である。図22の(a)に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した階層画像符号化装置2は、この符号化部PROD_C1として利用される。
なお、記録媒体PROD_Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)などのように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリなどのように、記録装置PROD_Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)などのように、記録装置PROD_Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部C6を更に備えていてもよい。図22の(a)においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。
なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD(Hard Disk Drive)レコーダなどが挙げられる(この場合、入力端子PROD_C4又は受信部PROD_C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラPROD_C3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部PROD_C5又は画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラPROD_C3又は受信部PROD_C5が動画像の主な供給源となる)なども、このような記録装置PROD_Cの一例である。
図22の(b)は、上述した階層画像復号装置1を搭載した再生装置PROD_Dの構成を示したブロックである。図22の(b)に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した階層画像復号装置1は、この復号部PROD_D2として利用される。
なお、記録媒体PROD_Mは、(1)HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図22の(b)においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。
なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイPROD_D3が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子PROD_D4又は送信部PROD_D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)なども、このような再生装置PROD_Dの一例である。
(ハードウェア的実現およびソフトウェア的実現)
また、上述した階層画像復号装置1、1’及び階層画像符号化装置2、2’の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
後者の場合、上記各装置は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM(Compact Disc Read-Only Memory)/MOディスク(Magneto-Optical disc)/MD(Mini Disc)/DVD(Digital Versatile Disc)/CD−R(CD Recordable)/ブルーレイディスク(Blu-ray Disc:登録商標)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(Erasable Programmable Read-Only Memory)/EEPROM(登録商標)(Electrically Erasable and Programmable Read-Only Memory)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、ISDN(Integrated Services Digital Network)、VAN(Value-Added Network)、CATV(Community Antenna television/Cable Television)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(Institute of Electrical and Electronic Engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDA(Infrared Data Association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は、画像データが階層的に符号化された符号化データを復号する階層画像復号装置、および、画像データが階層的に符号化された符号化データを生成する階層画像符号化装置に好適に適用することができる。また、階層画像符号化装置によって生成され、階層画像復号装置によって参照される階層符号化データのデータ構造に好適に適用することができる。
1 階層画像復号装置(動画像復号装置)
1’ 階層動画像復号装置(動画像復号装置)
11 下位レイヤ画像復号装置
12 上位レイヤ画像復号装置
13 フィルタ部
131 フィルタ処理部
132 アップサンプリング部(アップサンプリング手段)
1311 フィルタ適用判定部(フィルタ適用決定手段)
1312 フィルタ適用部(フィルタ適用手段)
1313 空間スケーラビリティ判定部
1314 参照画像判定部
1315 解像度判定部
1316 フィルタ順序判定部
1317 コーデック判定部
51 NAL逆多重化部
52 可変長復号部
53 ベース復号部
54 予測パラメータ復元部
55 テクスチャ復元部(フィルタ適用手段)
2 階層画像符号化装置
2’ 階層動画像符号化装置
21 下位レイヤ画像符号化装置
22 上位レイヤ画像符号化装置
24 フィルタ選択・処理部
241 フィルタ選択・判定部
242 フィルタ部

Claims (15)

  1. 階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、
    上記上位レイヤから参照する上記下位レイヤからの復号画像に対して適用するフィルタを決定するフィルタ適用決定手段と、
    参照する上記下位レイヤからの復号画像に対して、上記フィルタ適用決定手段が決定したフィルタを適用するフィルタ適用手段と、
    を備えていることを特徴とする画像復号装置。
  2. 上記フィルタ適用決定手段は、所定の指標に関し要求される符号化効率に応じて、適用するフィルタを決定することを特徴とする請求項1に記載の画像復号装置。
  3. 上記フィルタ適用決定手段は、上記所定の指標として、スケーラビリティを判定し、
    スケーラビリティが空間スケーラビリティであった場合、適用するフィルタとして、空間スケーラビリティでない場合より画質向上効果の高いフィルタを決定することを特徴とする請求項2に記載の画像復号装置。
  4. 上記フィルタ適用決定手段は、上記所定の指標として、復号対象となる画像が後続の画像の復号の際に参照される参照画像であるか否かを判定し、
    復号対象となる画像が参照画像である場合、適用するフィルタとして、復号対象となる画像が参照画像でない場合よりも画質向上効果の高いフィルタを決定することを特徴とする請求項2に記載の画像復号装置。
  5. 上記フィルタ適用決定手段は、上記所定の指標として、下位レイヤで使用する符号化方式を判定し、
    符号化方式に応じたフィルタを適用するフィルタとして決定することを特徴とする請求項2に記載の画像復号装置。
  6. 上記フィルタ適用決定手段は、所定の指標に関する処理量に応じて、適用するフィルタを決定することを特徴とする請求項1に記載の画像復号装置。
  7. 空間スケーラビリティの場合に下位レイヤの画像を上位レイヤの画像にアップサンプリングするアップサンプリング手段を備え、
    上記フィルタ適用決定手段は、上記所定の指標として、アップサンプリング手段およびフィルタ適用手段の適用順序を判定し、
    適用するフィルタとして、上記適用順序に応じたフィルタを決定することを特徴とする請求項6に記載の画像復号装置。
  8. 上記フィルタ適用決定手段は、上記所定の指標として解像度を判定し、
    解像度が低解像度である場合、適用するフィルタとして、復号対象となる画像が高解像度である場合よりも、フィルタ処理量が多いフィルタを決定することを特徴とする請求項6に記載の画像復号装置。
  9. 上記フィルタ適用決定手段は、フィルタ処理量に対する制約に応じて、適用するフィルタを決定することを特徴とする請求項1から8の何れか1項に記載の画像復号装置。
  10. 上記フィルタ適用手段が適用するフィルタのパラメータは、上記下位レイヤからの復号画像における上記フィルタの適用対象となる領域が含まれる単位領域毎に、当該単位領域と対応する上記上位レイヤの単位領域と一対となって該上位レイヤの符号化データに格納されていることを特徴とする請求項1に記載の画像復号装置。
  11. 単位領域を復号する際に用いられるパラメータであって、複数の単位領域で共通して用いられるパラメータを、符号化データの中で当該複数の単位領域のうちの最も前にある単位領域よりも前に集合させた群を共通群とし、
    上記フィルタ適用手段が適用するフィルタのパラメータは、上記下位レイヤからの復号画像における上記フィルタの適用対象となる領域が含まれる単位領域と対応する上記上位レイヤの単位領域を復号する際に用いられるパラメータが格納されている上記上位レイヤの上記共通群に格納されていることを特徴とする請求項1に記載の画像復号装置。
  12. 上記共通群は、スライスヘッダであることを特徴とする請求項11に記載の画像復号装置。
  13. 上記共通群は、APS(adaptation parameter set)であることを特徴とする請求項11に記載の画像復号装置。
  14. 上記フィルタ適用手段は、下位レイヤからの復号画像のうち、同じ画像内の画素を用いて予測画像を生成するイントラ予測によって生成された予測画像を用いて復元された復号画像の領域についてのみ、フィルタを適用することを特徴とする請求項1に記載の画像復号装置。
  15. 原画像から下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を減算して得られる残差を階層符号化して上位レイヤの符号化データを生成する画像符号化装置であって、
    上記上位レイヤから参照する上記下位レイヤからの復号画像に対して適用するフィルタを決定するフィルタ適用決定手段と、
    参照する上記下位レイヤからの復号画像に対して、上記フィルタ適用決定手段が決定したフィルタを適用するフィルタ適用手段と、
    を備えていることを特徴とする画像符号化装置。
JP2012149983A 2012-04-24 2012-07-03 画像復号装置および画像符号化装置 Pending JP2013243636A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012149983A JP2013243636A (ja) 2012-04-24 2012-07-03 画像復号装置および画像符号化装置
PCT/JP2013/061589 WO2013161690A1 (ja) 2012-04-24 2013-04-19 画像復号装置および画像符号化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012099295 2012-04-24
JP2012099295 2012-04-24
JP2012149983A JP2013243636A (ja) 2012-04-24 2012-07-03 画像復号装置および画像符号化装置

Publications (1)

Publication Number Publication Date
JP2013243636A true JP2013243636A (ja) 2013-12-05

Family

ID=49483011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012149983A Pending JP2013243636A (ja) 2012-04-24 2012-07-03 画像復号装置および画像符号化装置

Country Status (2)

Country Link
JP (1) JP2013243636A (ja)
WO (1) WO2013161690A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015536087A (ja) * 2012-09-28 2015-12-17 サムスン エレクトロニクス カンパニー リミテッド インターレイヤ予測誤差を符号化するためのsaoオフセット補償方法及びその装置
JP2021170727A (ja) * 2020-04-15 2021-10-28 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co., Ltd 装置、画像処理装置、撮像装置、移動体、プログラム及び方法
JP2021170728A (ja) * 2020-04-15 2021-10-28 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co., Ltd 装置、画像処理装置、撮像装置、移動体、プログラム及び方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014050554A1 (ja) * 2012-09-28 2014-04-03 シャープ株式会社 画像復号装置、および画像符号化装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007111292A1 (ja) * 2006-03-27 2007-10-04 Matsushita Electric Industrial Co., Ltd. 画像符号化装置および画像復号化装置
JP2008533908A (ja) * 2005-03-18 2008-08-21 シャープ株式会社 画像アップサンプリング方法およびシステム
WO2012050021A1 (ja) * 2010-10-14 2012-04-19 ソニー株式会社 画像処理装置および方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008533908A (ja) * 2005-03-18 2008-08-21 シャープ株式会社 画像アップサンプリング方法およびシステム
WO2007111292A1 (ja) * 2006-03-27 2007-10-04 Matsushita Electric Industrial Co., Ltd. 画像符号化装置および画像復号化装置
WO2012050021A1 (ja) * 2010-10-14 2012-04-19 ソニー株式会社 画像処理装置および方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015536087A (ja) * 2012-09-28 2015-12-17 サムスン エレクトロニクス カンパニー リミテッド インターレイヤ予測誤差を符号化するためのsaoオフセット補償方法及びその装置
JP2021170727A (ja) * 2020-04-15 2021-10-28 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co., Ltd 装置、画像処理装置、撮像装置、移動体、プログラム及び方法
JP2021170728A (ja) * 2020-04-15 2021-10-28 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co., Ltd 装置、画像処理装置、撮像装置、移動体、プログラム及び方法

Also Published As

Publication number Publication date
WO2013161690A1 (ja) 2013-10-31

Similar Documents

Publication Publication Date Title
JP6284661B2 (ja) 画像符号化装置、および画像符号化方法
JP6456535B2 (ja) 画像符号化装置、画像符号化方法および記録媒体
US10136151B2 (en) Image decoding device and image decoding method
JP6285020B2 (ja) コンポーネント間フィルタ処理
JP6352248B2 (ja) 画像復号装置、および画像符号化装置
US10841600B2 (en) Image decoding device, an image encoding device and a decoding method
JP6502357B2 (ja) マルチレイヤビデオコーディングにおける色域スケーラビリティのための3dルックアップテーブルに関する区分情報のシグナリング
US20140198846A1 (en) Device and method for scalable coding of video information
JP2017504249A (ja) マルチレイヤビデオコーディングにおける色域スケーラビリティのための3dルックアップテーブルに関する色値のシグナリング
US20190020877A1 (en) Image processing apparatus and method
WO2013161690A1 (ja) 画像復号装置および画像符号化装置
WO2014007131A1 (ja) 画像復号装置、および画像符号化装置
JPWO2014104242A1 (ja) 画像復号装置、および画像符号化装置
JP2014176039A (ja) 画像復号装置、および画像符号化装置
JP2014013975A (ja) 画像復号装置、符号化データのデータ構造、および画像符号化装置
WO2013161689A1 (ja) 動画像復号装置、および動画像符号化装置
WO2014050554A1 (ja) 画像復号装置、および画像符号化装置
JP2014082729A (ja) 画像復号装置、および画像符号化装置
JP2014013976A (ja) 画像復号装置、および画像符号化装置
JP2015076807A (ja) 画像復号装置、画像符号化装置、および符号化データのデータ構造

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160913

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170404