JP2018037936A - 画像符号化装置および画像復号装置 - Google Patents

画像符号化装置および画像復号装置 Download PDF

Info

Publication number
JP2018037936A
JP2018037936A JP2016170869A JP2016170869A JP2018037936A JP 2018037936 A JP2018037936 A JP 2018037936A JP 2016170869 A JP2016170869 A JP 2016170869A JP 2016170869 A JP2016170869 A JP 2016170869A JP 2018037936 A JP2018037936 A JP 2018037936A
Authority
JP
Japan
Prior art keywords
sub
prediction
coding unit
image
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016170869A
Other languages
English (en)
Inventor
碩 陸
Shuo Lu
碩 陸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dwango Co Ltd
Original Assignee
Dwango Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dwango Co Ltd filed Critical Dwango Co Ltd
Priority to JP2016170869A priority Critical patent/JP2018037936A/ja
Priority to PCT/JP2017/030179 priority patent/WO2018043256A1/ja
Publication of JP2018037936A publication Critical patent/JP2018037936A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

【課題】イントラ予測の符号化効率の改善を目的とする。【解決手段】本発明の一態様によれば、画像復号装置が提供される。画像復号装置は、復号器と、イントラ予測器とを含む。復号器は、符号化データを復号し、コーディングユニット(CU)を複数のサブコーディングユニット(Sub−CU)へと分割するSub−CU分割の適用/非適用を示す情報とを得て、Sub−CU分割の適用時にはSub−CU毎の予測モードを示す情報をさらに得る。イントラ予測器は、Sub−CU分割の適用時には、CUの左端と隣接する複数の画素とCUの上端と隣接する複数の画素とを含みCUの内部の画素を含まない参照画像に基づいて、Sub−CU毎に予測モードに応じたイントラ予測を行い、CUのイントラ予測画像を生成する。【選択図】図21

Description

本発明は、ビデオコーディングに関する。
例えば、H.264/AVCおよびHEVC(High Efficiency Video Coding)などのビデオコーディング規格は、イントラ予測と呼ばれる予測技術を利用する。イントラ予測は、画像の空間的な冗長性を削減することで符号化効率を向上させる。イントラ予測では、予測対象のブロックの左端または上端と隣接する符号化/復号済みの画素を含む参照画像に基づいて当該予測対象のブロック内の画素が予測される。
HEVCでは、ピクチャを分割することで得られる2N×2N画素の正方ブロック(CTU(Coding Tree Unit))単位でコーディングが行われる。図2に例示されるように、CTUは、再帰的に四分木分割することが可能であり、分割後のブロックはCU(Coding Unit:コーディングユニット)と呼ばれる。なお、図6に例示されるように、現在策定中のJEM(JointExploration Test Model)では四分木分割に加えて二分木分割も選択可能である。
前述のイントラ予測は、PU(Prediction Unit)単位で行われる。但し、インター予測とは異なり、図3左に例示されるように、イントラ予測に関してPUはCUと基本的に同一視することができる。例外的に、CUサイズが最小(N×N画素)である場合には、図3右に例示されるように、CUを構成する輝度CB(Coding Block)に限って4つのPUに分割することができる。
HEVCでは、図7左に例示されるように、Planar予測、DC予測および33種類の方向性予測からなる35種類のイントラ予測モード(予測方向(dir)と呼ぶこともできる)が選択可能である。また、JEMでは、図7右に例示されるように、Planar予測、DC予測および64種類の方向性予測からなる66種類の予測モードが選択可能である。予測モードを示す情報は、前述のPU毎に個別に設定可能である。換言すれば、予測モードを切り替えたい領域の大きさに合わせてCUを分割する必要がある。
CUの細分化は、イントラ予測に関わるレイテンシの増加を招き、ハードウェア実装時のボトルネックとなり得る。さらに、情報伝送のheadbin(すなわち、エントロピー符号化前のシンタックスの情報量)も増大するので、特に低レート時の符号化効率への悪影響が大きい。
また、HEVCにおいてCTUの最大サイズ(すなわち、PUの最大サイズ)は64×64画素である。近年のビデオの高解像度化を鑑みるに、将来のビデオコーディング規格ではこの最大サイズはさらに大きくなると予想される。実際に、JEMにおけるCTUの最大サイズは256×256画素へ拡張している。CTUの最大サイズの拡張は、PUの最大サイズの拡張も意味する。PUのサイズが大きくなれば、PUの特に下側および右側の画素と参照画像との距離が大きくなるので、これらの画素と参照画像との差分値が大きくなって予測効率が低下するおそれがある。
"Algorithm Description of Joint Exploration Test Model," JVET−B0021, Feb 2016 Conformance specification for ITU−T H.265 high efficiency video coding, ITU, 201504
本発明は、イントラ予測の符号化効率の改善を目的とする。
本発明の一態様によれば、画像復号装置が提供される。画像復号装置は、復号器と、イントラ予測器と、加算器とを含む。復号器は、符号化データを復号し、コーディングユニットの量子化変換係数と、コーディングユニットを複数のサブコーディングユニットへと分割するサブコーディングユニット分割の適用/非適用を示す情報とを得て、サブコーディングユニット分割の適用時にはサブコーディングユニット毎の予測モードを示す情報をさらに得る。イントラ予測器は、サブコーディングユニット分割の適用時には、コーディングユニットの左端と隣接する複数の画素とコーディングユニットの上端と隣接する複数の画素とを含みコーディングユニットの内部の画素を含まない参照画像に基づいて、サブコーディングユニット毎に予測モードに応じたイントラ予測を行い、コーディングユニットのイントラ予測画像を生成する。加算器は、量子化変換係数に基づいて復元された予測差分をイントラ予測画像に加算し、コーディングユニットの復号画像を生成する。
また、本発明の別の態様によれば、画像符号化装置が提供される。画像符号化装置は、分割器と、決定器と、イントラ予測器と、減算器と、符号化器とを含む。分割器は、コーディングユニットを複数のサブコーディングユニットへと分割する。決定器は、複数のサブコーディングユニットの各々の予測モードを決定する。イントラ予測器は、コーディングユニットを複数のサブコーディングユニットへと分割するサブコーディングユニット分割の適用時には、コーディングユニットの左端と隣接する複数の画素とコーディングユニットの上端と隣接する複数の画素とを含みコーディングユニットの内部の画素を含まない参照画像に基づいて、複数のサブコーディングユニットの各々に予測モードに応じたイントラ予測を行い、コーディングユニットのイントラ予測画像を生成する。減算器は、コーディングユニットからイントラ予測画像を減算し、予測差分を生成する。符号化器は、予測差分に基づいて生成された量子化変換係数と、サブコーディングユニット分割の適用/非適用を示す情報とを符号化し、サブコーディングユニット分割の適用時には前記予測モードを示す情報をさらに符号化する。
本発明によれば、イントラ予測の符号化効率を改善することができる。
第1の実施形態に係る画像符号化装置を例示するブロック図。 HEVCにおけるブロック構造の説明図。 HEVCにおけるイントラ予測のPU分割パターンの説明図。 HEVCにおけるCUのシンタックスを例示する図。 HEVCにおけるCUのシンタックスを例示する図。 HEVCにおけるMPM(Most Probable Mode)の説明図。 JEMにおけるブロック構造の説明図。 HEVCおよびJEMにおいて選択可能なイントラ予測モードの説明図。 CUを四分木分割して得られる4個のより小さなCUのうち左上の1個に対するイントラ予測処理の説明図。 CUを四分木分割して得られる4個のより小さなCUのうち右上の1個に対するイントラ予測に用いられる参照画像の説明図。 CUに対するイントラ予測に用いられる参照画像の説明図。 図10のCUを四分木分割して得られる4個のSub−CUに対するイントラ予測に共通に用いられる参照画像の説明図。 図10のCUを二分木(左右)分割して得られる2個のSub−CUに対するイントラ予測に共通に用いられる参照画像の説明図。 図10のCUを二分木(上下)分割して得られる2個のSub−CUに対するイントラ予測に共通に用いられる参照画像の説明図。 図1の画像符号化装置の使用するシンタックスを例示する図。 図14のシンタックスの変形例を示す図。 HEVCのDC予測の説明図。 図1のイントラ予測器によって行われる、画素位置を考慮したDC予測の説明図。 図1のイントラ予測器によって行われる、画素位置を考慮したVertical予測の説明図。 図1のイントラ予測器によって行われる、画素位置を考慮したHorizontal予測の説明図。 図1の画像符号化装置のイントラ予測に関する動作を例示するフローチャート。 第2の実施形態に係る画像復号装置を例示するブロック図。 図21の画像復号装置のイントラ予測に関する動作を例示するフローチャート。
以下、図面を参照しながら実施形態の説明が述べられる。尚、以降、説明済みの要素と同一または類似の要素には同一または類似の符号が付され、重複する説明は基本的に省略される。
(第1の実施形態)
図1に例示されるように、第1の実施形態に係る画像符号化装置は、A/D(Analog/Digital)変換器101と、リオーダ・バッファ102と、減算器103と、直交変換器104と、量子化器105と、逆量子化器106と、逆直交変換器107と、加算器108と、ループフィルタ109と、フレームメモリ110と、動き予測器111と、イントラ予測器112と、Sub−CU分割器113と、Sub−CU予測モード決定器114と、エントロピー符号化器115と、HRD(Hypothetical Reference Decoder)バッファ116とを含む。
A/D変換器101は、例えばビデオカメラなどの図示されない前段の装置から、入力信号を受け取る。この入力信号は、例えば、アナログのビデオ信号(輝度信号および色差信号)であってもよい。A/D変換器101は、ビデオ信号をアナログ/デジタル変換し、デジタルのビデオ信号を生成する。A/D変換器101は、デジタルのビデオ信号をリオーダ・バッファ102へと出力する。
リオーダ・バッファ102は、例えば半導体メモリである。リオーダ・バッファ102は、A/D変換器101からデジタルのビデオ信号を受け取る。リオーダ・バッファ102は、このビデオ信号を一時的に保存する。リオーダ・バッファ102に保存されたビデオ信号は、GOP(Group of Picture)によって決まる符号化順序で並び替えられ、それから減算器103、動き予測器111およびイントラ予測器112へと出力される。
減算器103は、リオーダ・バッファ102からビデオ信号を受け取り、動き予測器111またはイントラ予測器112のいずれか一方から予測画像(信号)(すなわち、インター予測画像(信号)またはイントラ予測画像(信号))を受け取る。減算器103は、ビデオ信号から予測画像を減算し、予測差分(信号)を得る。減算器103は、予測差分を直交変換器104へと出力する。
直交変換器104は、予測差分に直交変換を適用し、変換係数を生成する。この直交変換は、例えば、整数精度DCT(Discrete Cosine Transform)、整数精度DST(Discrete Sine Transform)などであってよい。直交変換器104は、例えば、4×4画素、8×8画素、16×16画素、32×32画素などのTU(Transform Unit)単位で直交変換を行う。なお、直交変換器104は、変換スキップ(すなわち、パススルー)を選択することもできる。直交変換器104は、変換係数を量子化器105へと出力する。
量子化器105は、直交変換器104から変換係数を受け取る。量子化器105は、図示されない符号化制御器によって決定された量子化パラメータを用いて変換係数を量子化し、量子化変換係数を得る。量子化器105は、直交変換器104と同じくTU単位で量子化を行う。量子化器105は、量子化変換係数を逆量子化器106およびエントロピー符号化器115へと出力する。
逆量子化器106は、量子化器105から量子化変換係数を受け取る。逆量子化器106は、前述の量子化パラメータを用いて量子化変換係数を逆量子化し、変換係数を復元する。逆量子化器106は、変換係数を逆直交変換器107へと出力する。
逆直交変換器107は、逆量子化器106から変換係数を受け取る。逆直交変換器107は、変換係数に逆直交変換を適用し、予測差分を復元する。この逆直交変換は、直交変換器104によって適用された直交変換の逆変換に相当する。逆直交変換は、例えば整数精度IDCT(Inverse DCT)、整数精度IDST(Inverse DST)などであってよい。なお、逆直交変換器107は、直交変換器104によって変換スキップが選択されている場合には、同様に変換スキップを選択する。逆直交変換器107は、予測差分を加算器108へと出力する。
加算器108は、逆直交変換器107から予測差分を受け取り、動き予測器111およびイントラ予測器112のいずれか一方から予測画像を受け取る。加算器108は、予測画像に予測差分を加算し、(ローカル)復号画像(信号)を生成する。加算器108は、復号画像をループフィルタ109またはフレームメモリ110へと出力する。すなわち、ループフィルタ109はオン/オフ可能である。
ループフィルタ109は、加算器108から復号画像を受け取る。ループフィルタ109は、復号画像に対してループフィルタ処理を適用する。ループフィルタ処理は、デブロッキング・フィルタ処理、画素適応オフセット(SAO:Sample Adaptive Offset)処理などであってよい。なお、デブロッキング・フィルタ処理は、PUまたはTUの境界画素に対して適用され、ブロック境界の主観歪みを低減する。画素適応オフセット処理は、ブロック内部のリンギング歪みを低減する。ループフィルタ109は、フィルタ処理済みの復号画像をフレームメモリ110へと出力する。
フレームメモリ110は、例えば半導体メモリである。フレームメモリ110は、加算器108およびループフィルタ109のいずれか一方から復号画像を受け取る。フレームメモリ110は、復号画像を参照画像(信号)の候補として保存する。フレームメモリ110は、復号ピクチャバッファ(Decoded Picture Buffer)とも呼ばれる。フレームメモリ110に保存された復号画像は、動き予測器111またはイントラ予測器112によって必要に応じて参照画像として読み出される。
動き予測器111は、CUの予測タイプがインター予測である場合に、リオーダ・バッファ102からビデオ信号を受け取り、フレーム間動き補償予測(インター予測と呼ぶこともできる)を行って、インター予測画像を生成する。動き予測器111は、例えば、4×4画素、8×4画素、4×8画素、4×16画素、12×16画素、16×4画素、16×12画素、64×64画素などのインターPB(Prediction Block)単位で、インター予測を行う。具体的には、動き予測器111は、フレームメモリ110内に保存された復号画像の中からインターPB毎に1フレームまたは複数フレームの参照画像を特定して予測を行うことができる。動き予測器111は、整数画素精度予測に限られず小数画素精度(例えば、1/4画素精度)予測をサポートしてもよい。動き予測器111は、インター予測画像を減算器103および加算器108へと出力する。さらに、動き予測器111は、PUをインター予測するために用いられる参照画像のフレームを示す参照ピクチャ情報(Reference Picture Set)などのインター予測に関する情報をエントロピー符号化器115へと出力する。
イントラ予測器112は、CUの予測タイプがイントラ予測である場合に、リオーダ・バッファ102からビデオ信号を受け取り、イントラ予測を行って、イントラ予測画像を生成する。イントラ予測器112は基本的には、図10に例示されるように、PU(≒CU)毎に最適な予測モードを設定し、当該PUの上端および左端に隣接する画素を含む参照画像をフレームメモリ110から読み出し、当該参照画像に基づいて当該予測モードに応じたイントラ予測を行ってイントラ予測画像を生成する。イントラPUのサイズは、例えば、4×4画素、8×8画素、16×16画素、32×32画素、64×64画素などである。なお、イントラ予測器112は、後述されるように画素位置を考慮したイントラ予測を行ってもよい。
但し、後述されるように、CUを複数のSub−CU(サブコーディングユニット)へと分割するSub−CU分割の適用時には、イントラ予測器112は、当該CUの左端または上端に隣接する画素を含む参照画像をフレームメモリ110から読み出し、Sub−CU毎に設定された予測モードに応じたイントラ予測を行ってイントラ予測画像を生成する。
イントラ予測器112は、イントラ予測画像を減算器103および加算器108へと出力する。さらに、イントラ予測器112は、Sub−CU分割の非適用時には、PUに設定された予測モードを示す情報などのイントラ予測に関する情報をエントロピー符号化器115へと出力する。
イントラ予測器112は、Sub−CU分割の適用/非適用の決定のために、当該CUに対応するビデオ信号および参照画像をSub−CU分割器113へと出力する。イントラ予測器112は、Sub−CU予測モード決定器114から、Sub−CU分割の適用/非適用を示す情報と、Sub−CU分割の適用時にはSub−CU分割法(CUを複数のSub−CUへと分割する方法)を示す情報および各Sub−CUに設定された予測モードを示す情報とを受け取る。
Sub−CU分割器113は、CUを分割し、複数のSub−CUを得る。CUは、様々な方法で分割することが可能である。例えば、Sub−CU分割器113は、四分木分割(図11を参照)または二分木分割(図12および図13を参照)を行ってよい。Sub−CU分割器113は、対称分割に限らず非対称分割を行ってもよい。
なお、Sub−CU分割法に関わらず、CUに属する全てのSub−CUのイントラ予測に用いられる参照画像(図11、図12および図13の斜線領域)は共通である。この点は、CUを複数のCUへと分割した場合と大きく異なる。すなわち、図8および図9に示されるように、異なるCUをイントラ予測するためには異なる参照画像を読み出す必要がある。より具体的には、下側または右側のCUをイントラ予測するために用いられる参照画像は、上側または左側のCUの復号画像の一部を含んでいるので、上側または左側のCUの復号(すなわち、イントラ予測、予測差分生成、直交変換、量子化、逆量子化、逆直交変換、(ループフィルタ処理)および復号画像生成)が終了するまで、下側または右側のCUのイントラ予測を開始することはできない。従って、CU分割によれば、イントラ予測に関わるレイテンシは増大する。他方、Sub−CU分割によれば、CUに属する全てのSub−CUに対して共通の参照画像に基づいてイントラ予測を行うことができるので、CU分割に比べるとレイテンシは抑制される。さらに、イントラ予測器112は、複数のSub−CUに対して並列的にイントラ予測を行うこともできる。
Sub−CU分割器113は、複数のSub−CUをSub−CU予測モード決定器114へと出力する。Sub−CU分割器113は、最適なSub−CU分割法を決定するために、利用可能な様々なSub−CU分割法を試行してもよい。或いは、利用可能なSub−CU分割法は一種類(例えば、対称四分木分割)であってもよい。この場合には、最適なSub−CU分割法を決定する必要はない。
Sub−CU予測モード決定器114は、Sub−CU分割器113から複数のSub−CUを受け取る。Sub−CU予測モード決定器114は、各Sub−CUに対して設定する予測モードを決定する。すなわち、図11のSub−CU分割例では、Sub−CU予測モード決定器114は合計4つのSub−CUに対して合計4つの予測モード(dir0、dir1、dir2およびdir3)を決定する。図12および図13のSub−CU分割例では、Sub−CU予測モード決定器114は合計2つのSub−CUに対して合計2つの予測モード(dir0およびdir1)を決定する。
Sub−CU予測モード決定器114は、各Sub−CUに対して最適な予測モードを決定するために、利用可能な様々な予測モードを試行してもよい。Sub−CU予測モード決定器114は、例えば公知の符号化コスト関数の値を比較することで、Sub−CU分割の適用/非適用、ならびに、Sub−CU分割の適用時には最適なSub−CU分割法および各Sub−CUの最適な予測モードを決定することができる。
Sub−CU予測モード決定器114は、Sub−CU分割の適用/非適用を示す情報と、Sub−CU分割の適用時にはSub−CU分割法(Sub−CU分割法が複数存在する場合)を示す情報および各Sub−CUに設定された予測モードを示す情報とをイントラ予測器112へと出力する。さらに、Sub−CU予測モード決定器114は、これらのSub−CU分割に関する情報をエントロピー符号化器115へも出力する。
なお、Sub−CU分割の適用/非適用を示す情報と、Sub−CU分割法(Sub−を示す情報とは、独立した情報であってもよいが、1つの情報として統合されてもよい。この情報は、例えば、「0」の値でSub−CU分割の非適用を示し、「1」の値でSub−CU分割の適用およびSub−CU分割法が四分木分割であることを示し、「2」および「3」の値でSub−CU分割の適用およびSub−CU分割が二分木分割(上下または左右)であることを示してもよい。
Sub−CU予測モード決定器114は、Sub−CUの予測モードを複数のMPM(以降、MPMリストとも称される)から選択してもよい。HEVCにおいて、MPMリストは図5に例示されるように決定される。すなわち、MPMリストの3要素は、現行PU(Cur)の左隣のPUに設定された予測モード(dirA)と、現行PU(Cur)の上隣のPUに設定された予測モード(dirB)と、PLANARモード、DCモードまたはVertical(VER)モードとから選択される。
MPMは、Sub−CUの最適な予測モードに一致する確率が高く、かつ、その総数はイントラ予測モードの総数に比べればはるかに少ない(HEVCの場合には、約1/12(=3/35)である)。故に、Sub−CUの予測モードを必ずMPMリストから選択するようにしたとしても、符号化歪をあまり悪化させることなくheadbinを削減することができる。
なお、Sub−CU分割は、CUのサイズが規定値(例えば、CUの最小サイズよりも1段階大きいサイズ)以上の場合に限って適用されてもよい。換言すれば、CUのサイズが上記規定値未満であるならばSub−CU分割は一律に非適用とされてよい。例えば、テクスチャの細かい領域に対してはCUを細かく分割して符号化を行うことが一般的に好ましいので、CUは最小サイズまで分割される可能性が高い。この場合には、CU(厳密には輝度CB)を複数のPUに分割することでSub−CU分割と類似の効果を得ることができるので、Sub−CU分割を一律に非適用としたとしても前述のレイテンシの問題を除けば悪影響は殆どない。他方、CUのサイズが大きいほど当該CU内で画像の傾向が局所的にばらつく可能性が高いので、Sub−CU分割を通じた予測モードの局所最適化による恩恵は大きいと予想される。
エントロピー符号化器115は、量子化器105から量子化変換係数を受け取る。さらに、エントロピー符号化器115は、CUの予測タイプがイントラ予測である場合には、Sub−CU分割に関する情報(すなわち、Sub−CU分割の適用/非適用を示す情報、ならびに、Sub−CU分割の適用時にはSub−CU分割法を示す情報および各Sub−CUに設定された予測モードを示す情報)をSub−CU予測モード決定器114から受け取り、イントラ予測に関する情報をイントラ予測器112から受け取る。エントロピー符号化器115は、CUの予測タイプがインター予測である場合には動き予測器111からインター予測に関する情報を受け取る。
エントロピー符号化器115は、受け取った種々の情報を、後述されるシンタックスに従ってエントロピー符号化および多重化し、符号化ビットストリームを生成する。エントロピー符号化器115は、Sub−CU分割に関する情報、インター予測に関する情報、イントラ予測に関する情報などを符号化ビットストリームのヘッダ内に多重化する。エントロピー符号化器115は、例えば、CABAC(Context−based Adaptive Binary Arithmetic Coding)などの算術符号化、CAVLC(Context−based Adaptive Variable Length Coding)などの可変長符号化を行ってよい。エントロピー符号化器115は、符号化ビットストリームをHRDバッファ116へと出力する。
図4Aおよび図4Bには、HEVCで使用されるシンタックスが比較例として示されている。このシンタックスによれば、CUの予測タイプがイントラ予測である場合には当該CUのサイズが最小のときに限って当該CUを複数のPUに分割することが許容され(L12〜L13)、1つのCU内に複数の予測モードが設定可能となる(L23〜L32)。
図14には、図1の画像符号化装置が使用するシンタックスの一例が示されている。エントロピー符号化器115は、CUの予測タイプがイントラ予測である場合(L3)に、当該CUが最小サイズでない場合であってもSub−CU分割は可能であるから、Sub−CU分割の適用/非適用を示す情報を符号化できる(L4)。エントロピー符号化器115は、PUまたはSub−CU毎に、輝度に関してMPMリストを使用するか否かを示す情報を符号化する(L9)。そして、エントロピー符号化器115は、MPMリストを使用する場合にはPUまたはSub−CUにどのMPMを使用するかを示す情報を符号化し(L13)、そうでなければPUまたはSub−CUに設定された予測モードを示す情報を符号化する(L15)。
図4Aおよび図4Bのシンタックスに比べて、図14のシンタックスは、図14のL3〜L4の記述が追加され、L6の条件文において条件が1つ増えているに過ぎない。他方、例えばCUを四分木分割すれば、headbinは単純計算で約4倍となる。従って、CU分割に比べれば、Sub−CU分割を適用することによるheadbinの増分はかなり少ない。さらに、Sub−CUの予測モードを必ずMPMリストから選択するように制約すれば、図14のシンタックスを図15に例示されるシンタックスに書き換える事ができる。
図15のシンタックスによれば、エントロピー符号化器115は、Sub−CU毎に、輝度に関してMPMリストを使用するか否かを示す情報を符号化する必要がない(L7〜L11)。また、エントロピー符号化器115は、Sub−CU分割の適用時には、無条件にSub−CU毎にどのMPMを使用するかを示す情報を符号化すればよく(L14〜L15)、当該Sub−CUに設定された予測モードそのものを示す情報を符号化する必要がない。故に、図15のシンタックスによれば、図14のシンタックスに比べてheadbinを削減することができる。
HRDバッファ116は、例えば半導体メモリである。HRDバッファ116は、エントロピー符号化器115から符号化ビットストリームを受け取り、これを一時的に保存する。HRDバッファ116は、例えば図示されない伝送路の帯域に見合ったレートで符号化ビットストリームを当該伝送路へと出力する。図示されない符号化制御器は、HRDバッファ116の空き容量に基づいて量子化器105および逆量子化器106へと指示する量子化パラメータを変更することで、レート制御を実現してもよい。
以下、イントラ予測器112において採用可能な、画素位置を考慮したイントラ予測について説明する。このイントラ予測のベースとなるHEVCのDC予測では、nTbS(変換ブロック(Transform Block(TB))のサイズ)×nTbS画素のPUの上端に隣接するnTbS個の画素(図16のa,b,cおよびd)とPUの左端に隣接するnTbS個の画素(図16のe,f,gおよびh)との平均値が当該PUの全ての画素にコピーされる。HEVCのVER予測では、nTbS×nTbS画素のPUの上端に隣接するnTbS個の画素(図16のa,b,cおよびd)の各々の値が、当該PUのうち同一の水平位置を持つ画素に垂直にコピーされる。HEVCのHorizontal予測では、nTbS×nTbS画素のPUの左端に隣接するnTbS個の画素(図16のe,f,gおよびh)の各々の値が、当該PUのうち同一の垂直位置を持つ画素に水平にコピーされる。
これらの予測モードは、いずれも、PUのサイズが大きくなれば、PUの特に下側および右側の画素と参照画像との距離が大きくなるので、これらの画素と参照画像との差分値が大きくなって予測効率が低下するおそれがある。
PUのサイズが大きくなれば参照画像のサイズも大きくなるので、参照画像が例えば絵柄の境界などを含む可能性は高くなる。この結果、参照画像の左側と右側とで、または、参照画像の上側と下側とで、画素の値が大きく異なるかもしれない。この場合に、HEVCのDC予測によって参照画像の平均値をPUの全体に一律にコピーしたとしても、この予測値はPU内の個々の画素とはあまり類似せず、高い符号化効率を達成できないかもしれない。
また、PUのサイズが大きくなれば、PUの下側の画素と当該PUの上端に隣接する画素との距離が大きくなる。この結果、PUの上端に隣接する画素と、当該画素と同じ水平位置を持つ当該PUの下側の画素とは大きく異なるかもしれない。この場合に、HEVCのVertical予測によってPUの上端に隣接する画素の値をそれぞれ垂直方向に一律にコピーしたとしても、この予測値はPU内の特に下側の画素とはあまり類似せず、高い符号化効率を達成できないかもしれない。
同様に、PUのサイズが大きくなれば、PUの右側の画素と当該PUの左端に隣接する画素との距離が大きくなる。この結果、PUの左端に隣接する画素と、当該画素と同じ垂直位置を持つ当該PUの右側の画素とは大きく異なるかもしれない。この場合に、HEVCのHorizontal予測によってPUの左端に隣接する画素の値をそれぞれ水平方向に一律にコピーしたとしても、この予測値はPU内の特に右側の画素とはあまり類似せず、高い符号化効率を達成できないかもしれない。
そこで、イントラ予測器112は、PUに関連付けられた予測モードがDC予測である場合に、参照画像の画素値の分布を考慮して、所定の条件下でPUを複数のサブセットへと区分してもよい。そして、イントラ予測器112は、各サブセットに対して参照画像のうち当該サブセットのいずれかの画素と同一の水平位置を持つ画素と当該サブセットのいずれかの画素と同一の垂直位置を持つ画素とに基づいて当該サブセットのDC予測を行ってよい。
イントラ予測器112は、PUの上端に隣接するnTbS個の画素(以降、Horと称される)の値が左側(以降、dcHorLeftと称される)と右側(以降、dcHorRightと称される)とで大きく変動していれば、当該PUを左右に区分してもよい。同様に、イントラ予測器112は、PUの左端に隣接するnTbS個の画素(以降、Verと称される)の値が上側(以降、dcVerUpと称される)と下側(以降、dcVerDownと称される)とで大きく変動していれば、当該PUを上下に区分してもよい。
(1) PUを上下左右に4つのサブセットへと区分する場合に、イントラ予測器112は、各サブセットの予測値を以下のように生成する。
左上のサブセット:dcHorLeftに属する画素およびdcVerUpに属する画素の平均値(図17を参照)。
右上のサブセット:dcHorRightに属する画素およびdcVerUpに属する画素の平均値。
左下のサブセット:dcHorLeftに属する画素およびdcVerDownに属する画素の平均値。
右下のサブセット:dcHorRightに属する画素およびdcVerDownに属する画素の平均値。
(2) PUを上下に2つのサブセットへと区分する場合に、イントラ予測器112は、各サブセットの予測値を以下のように生成する。
上側のサブセット:Horに属する画素およびdcVerUpに属する画素の平均値。
下側のサブセット:Horに属する画素およびdcVerDownに属する画素の平均値。
(3) PUを左右に2つのサブセットへと区分する場合に、イントラ予測器112は、各サブセットの予測値を以下のように生成する。
左側のサブセット:dcHorLeftに属する画素およびVerに属する画素の平均値。
右側のサブセット:dcHorRightに属する画素およびVerに属する画素の平均値。
イントラ予測器112は、PUを上下に区分するか否かを、dcVerUpに属する画素の値の総和とdcVerDownに属する画素の値の総和との差分の絶対値が第1の閾値よりも大きいか否かによって決定してもよい。同様に、イントラ予測器112は、PUを左右に区分するか否かを、dcHorLeftに属する画素の値の総和とdcHorRightに属する画素の値の総和との差分の絶対値が第2の閾値よりも大きいか否かによって決定してもよい。
なお、dcVerUpおよびdcVerDownは、サイズが同じであってもよいし、異なっていてもよい。両者のサイズが異なる場合には、総和に代えて平均値または中央値の差分を算出してもよい。同様に、dcHorLeftおよびdcHorRightは、サイズが同じであってもよいし、異なっていてもよい。両者のサイズが異なる場合には、総和に代えて平均値または中央値の差分を算出してもよい。
第1の閾値および第2の閾値は、同一であってもよいし、異なっていてもよい。第1の閾値および第2の閾値は、固定であってもよいが、例えば量子化器105および逆量子化器106によって使用された量子化パラメータに依存して変化してもよい。量子化パラメータが増加するほど量子化誤差は大きくなるので、差分に含まれる誤差も大きくなる可能性がある。故に、量子化パラメータの増加に応じて、第1の閾値および第2の閾値を増加させてもよい。
なお、図示されない画像復号装置に含まれるイントラ予測器は、イントラ予測器112と同一のアルゴリズムで動作することで、PUをどのようなサブセットに区分するかを決定することができる。故に、PUがどのようなサブセットに区分するかを示す情報を画像復号装置へとシグナリングする必要はない。但し、係る情報をシグナリングし、画像復号装置に含まれるイントラ予測器の処理負荷を軽減する実装も可能である。
イントラ予測器112は、PUに関連付けられた予測モードがVertical予測またはHorizontal予測である場合に、当該PUの各画素の予測値を当該画素の位置に応じて補正してもよい。
Vertical予測に関して、イントラ予測器112は、PUの所与の画素(例えば、図18のcur)の予測値(例えば、図18のr2の値)を、参照画像のうち当該PUの左上隅の画素の左上隣に位置する第1の参照画素(例えば、図18のr0)と参照画像のうち当該所与の画素と同一の水平位置を持つ第2の参照画素(例えば、図18のr2)との第1の差分値(difh)と、第1の参照画素と参照画像のうち当該所与の画素と同一の垂直位置を持つ第3の参照画素(例えば、図18のL2)との第2の差分値(difv)と、当該所与の画素の垂直位置とを用いて補正してもよい。具体的には、イントラ予測器112は、下記数式(1)に従って、PU内の各画素の予測値を補正してもよい。
数式(1)において、Verpred(x,y)は、水平位置=xおよび垂直位置=yの画素のVertical予測値を表す。なお、PUの左上隅の画素の位置が原点(0,0)である。weight(y)は垂直位置=yに対応する重みであって、yが大きくなるほど小さく設定されてよい。例えば、weight(y)=(nTbs−y)/nTbsである。ref(x)は、参照画像のうち水平位置=xの画素(すなわち、位置(x,−1)の画素)の値を表しており、これはHEVCにおける垂直位置=xの画素のVertical予測値に等しい。difhは前述の第1の差分値であって、位置(x,−1)の第2の参照画素の値から位置(−1,−1)の第1の参照画素の値を減算することで導出可能である。difvは、前述の第2の差分値であって、位置(−1,y)の第3の参照画素の値から第1の参照画素の値を減算することで導出可能である。
イントラ予測器112は、PUに関連付けられた予測モードがVertical予測である場合に、このような画素位置を考慮したVertical予測を、無条件に行ってもよいし、条件付きで(例えば、符号化コスト関数の値が減少する場合、PUのサイズが規定値以上である場合など)行ってもよい。イントラ予測器112が画素位置を考慮したVertical予測を無条件で行う場合には、headbinを増大させることなく当該Vertical予測を導入可能である。イントラ予測器112が画素位置を考慮したVertical予測を条件付きで行う場合に、画素位置を考慮したVertical予測が行われたか否かを示す情報が図示されない画像復号装置にシグナリングされてもよい。但し、条件次第では係る情報がシグナリングされなくても(すなわち、headbinの増大を招くことなく)、画像復号装置に含まれるイントラ予測器は、イントラ予測器112と同一のアルゴリズムで動作することで、画素位置を考慮したVertical予測を行うか否かを決定できる。
Horizontal予測に関して、イントラ予測器112は、PUの所与の画素(例えば、図19のcur)の予測値(例えば、図19のL2の値)を、第1の参照画素(例えば、図19のr0)と第2の画素(例えば、図19のr2)との第1の差分値(difh)と、第1の参照画素と第3の参照画素との第2の差分値(difv)と、当該所与の画素の水平位置とを用いて補正してもよい。具体的には、イントラ予測器112は、下記数式(2)に従って、PU内の各画素の予測値を補正してもよい。
数式(2)において、Horpred(x,y)は、水平位置=xおよび垂直位置=yの画素のHorizontal予測値を表す。weight(x)は水平位置=xに対応する重みであって、xが大きくなるほど小さく設定されてよい。例えば、weight(x)=(nTbs−x)/nTbsである。ref(y)は、参照画像のうち垂直位置=yの画素(すなわち、位置(−1,y)の画素)の値を表しており、これはHEVCにおける垂直位置=yの画素のHorizontal予測値に等しい。
イントラ予測器112は、PUに関連付けられた予測モードがHorizontal予測である場合に、このような画素位置を考慮したHorizontal予測を、無条件に行ってもよいし、条件付きで(例えば、符号化コスト関数の値が減少する場合、PUのサイズが規定値以上である場合など)行ってもよい。イントラ予測器112が画素位置を考慮したHorizontal予測を無条件で行う場合には、headbinを増大させることなく当該Horizontal予測を導入可能である。イントラ予測器112が画素位置を考慮したHorizontal予測を条件付きで行う場合には、画素位置を考慮したHorizontal予測が行われたか否かを示す情報が図示されない画像復号装置にシグナリングされてもよい。但し、条件次第では係る情報がシグナリングされなくても(すなわち、headbinの増大を招くことなく)、画像復号装置に含まれるイントラ予測器は、イントラ予測器112と同一のアルゴリズムで動作することで、画素位置を考慮したHorizontal予測を行うか否かを決定できる。
なお、イントラ予測器112は、PUに限らずSub−CUに対しても画素位置を考慮したイントラ予測を行ってもよい。
以下、図20のフローチャートを用いて、図1の画像符号化装置のイントラ予測に関する動作を説明する。なお、図20では、ステップS201、ステップS202、ステップS203およびステップS204を含むフローと、ステップS205のフローとが並列的に実行されているが、これらは逐次的に実行されてもよい。また、以降の説明において、符号化コスト関数の値の算出は、例示されていない要素(例えば、符号化制御器)によって行われてもよい。
ステップS201において、イントラ予測器112は、現行CUの参照画像を決定する。具体的には、この参照画像は、現行CUの左端と隣接する複数の画素と当該CUの上端に隣接する複数の画素とを含み当該CUの内部の画素を含まない。Sub−CU分割法に関わらず、ステップS201において決定された参照画像が各Sub−CUのイントラ予測に用いられる。
次に、Sub−CU予測モード決定器114は、Sub−CU毎に最適な予測モードを決定する(ステップS202)。例えば、Sub−CU分割器113が利用可能な様々なSub−CU分割法を現行CUに逐次適用することで複数組のSub−CUを生成し、Sub−CU予測モード決定器114は、それぞれの組に属する複数のSub−CUの各々に最適な予測モードを決定してもよい。
次に、Sub−CU予測モード決定器114は、ステップS202において決定した最適な予測モードに基づいて、現行CUの最適なSub−CU分割法を決定する(ステップS203)。例えば、Sub−CU予測モード決定器114は、Sub−CU分割法毎に、各Sub−CUにステップS202において決定した予測モードを設定した場合の符号化コスト関数の値を算出し、最小値を与えるSub−CU分割法を最適なSub−CU分割法と決定してもよい。なお、Sub−CU分割法が一意に定められる場合には、ステップS202は省略可能である。
次に、Sub−CU予測モード決定器114は、Sub−CU分割適用時の符号化コスト関数の値を算出する(ステップS204)。例えば、Sub−CU予測モード決定器114は、ステップS203において決定したSub−CU分割法を現行CUに適用することで得られる複数のSub−CUの各々にステップS202において決定した予測モードを設定した場合の符号化コスト関数の値を算出する。
他方、ステップS205において、イントラ予測器112は、Sub−CU分割非適用時の符号化コスト関数の値を算出する。例えば、イントラ予測器112は、現行CUに対応する1つまたは複数(当該CUのサイズが最小の場合に限る)のPUの各々に最適な予測モードを設定した場合の符号化コスト関数の値を算出する。
Sub−CU予測モード決定器114は、ステップS204において算出したSub−CU分割適用時の符号化コスト関数の値を、ステップS205において算出したSub−CU分割非適用時の符号化コスト関数の値と比較し、比較結果に基づいてSub−CU分割の適用/非適用を決定する(ステップS205)。例えば、Sub−CU分割適用時の符号化コスト関数の値がSub−CU分割非適用時の符号化コスト関数の値よりも小さい場合には、Sub−CU予測モード決定器114はSub−CU分割の適用を決定してもよい。同様に、Sub−CU分割適用時の符号化コスト関数の値がSub−CU分割非適用時の符号化コスト関数の値以上である場合には、Sub−CU予測モード決定器114はSub−CU分割の非適用を決定してもよい。
Sub−CU分割の適用を決定した場合に、Sub−CU予測モード決定器114は、Sub−CU分割の適用を示す情報(Sub−CU split flag(真))と、Sub−CU分割法を示す情報(Sub−CU分割法が一意に定められる場合には省略可能)と、各Sub−CUに設定された予測モードを示す情報とをエントロピー符号化器115へと出力する(ステップS207およびステップS208)。他方、Sub−CU予測モード決定器114がSub−CU分割の非適用を決定した場合に、イントラ予測器112は、Sub−CU分割の非適用を示す情報(Sub−CU split flag(偽))と、各PUに設定された予測モードを示す情報とをエントロピー符号化器115へと出力する(ステップS207およびステップS209)。
以上説明したように、第1の実施形態に係る画像符号化装置は、CUを複数のSub−CUへと分割し、各Sub−CUに対して個別に予測モードを設定し、各Sub−CUを共通の参照画像に基づいてイントラ予測する。従って、この画像符号化装置によれば、CUを複数のCUに分割した場合に比べて、イントラ予測に関わるレイテンシおよびheadbinの増分を抑制しながら、CU内で局所的に予測効率の高い予測モードを選択することができる。
さらに、第1の実施形態に係る画像符号化装置は、画素位置を考慮したイントラ予測を必要に応じて行う。従って、この画像符号化装置によれば、PUまたはSub−CU内の画素と参照画像との距離の増大に伴う予測効率の低下を抑制することができる。
纏めると、第1の実施形態に係る画像符号化装置は、イントラ予測の自由度を高め、符号化効率の向上を可能とする。
(第2の実施形態)
図21に例示されるように、第2の実施形態に係る画像復号装置は、HRDバッファ301と、エントロピー復号器302と、逆量子化器303と、逆直交変換器304と、加算器305と、ループフィルタ306と、フレームメモリ307と、動き予測器308と、イントラ予測器309と、リオーダ・バッファ310と、D/A(Digital/Analog)変換器311とを含む。
HRDバッファ301は、例えば半導体メモリである。HRDバッファ301は、図示されない伝送路から符号化ビットストリームを受け取り、これを一時的に保存する。この符号化ビットストリームは、例えば図1の画像符号化装置によって生成される。HRDバッファ301は、符号化ビットストリームをエントロピー復号器302へと出力する。
エントロピー復号器302は、HRDバッファ301から符号化ビットストリームを受け取る。エントロピー復号器302は、図14または図15に例示されるシンタックスに従って、符号化ストリームを逆多重化およびエントロピー復号する。エントロピー復号器302は、図示されない画像符号化装置において適用されたコーデックを用いてエントロピー復号を行う。具体的には、エントロピー復号器302は、例えば、CABACなどの算術符号化、CAVLCなどの可変長符号化を行ってよい。
符号化ストリームを逆多重化およびエントロピー復号することによって、エントロピー復号器302は、例えばCUの量子化変換係数を得る。さらに、エントロピー復号器302は、CUの予測タイプがイントラ予測である場合には、CUのSub−CU分割に関する情報(すなわち、CUへのSub−CU分割の適用/非適用を示す情報、ならびに、Sub−CU分割の適用時にはSub−CU分割法を示す情報および各Sub−CUに設定された予測モードを示す情報)と、イントラ予測に関する情報(例えば、Sub−CU分割の非適用時にPUに設定された予測モードを示す情報など)とを得る。エントロピー復号器302は、CUの予測タイプがインター予測である場合にはインター予測に関する情報(例えば、PUをインター予測するために用いられる参照画像のフレームを示す参照ピクチャ情報など)を得る。
エントロピー復号器302は、量子化変換係数を逆量子化器303へと出力し、インター予測に関する情報を動き予測器308へと出力し、イントラ予測に関する情報およびSub−CU分割に関する情報をイントラ予測器309へと出力する。
逆量子化器303は、エントロピー復号器302から量子化変換係数を受け取る。逆量子化器303は、図示されない画像符号化装置において使用された量子化パラメータを用いて量子化変換係数を逆量子化し、変換係数を復元する。逆量子化器303は、変換係数を逆直交変換器304へと出力する。
逆直交変換器304は、逆量子化器303から変換係数を受け取る。逆直交変換器304は、変換係数に逆直交変換を適用し、予測差分を復元する。この逆直交変換は、図示されない画像符号化装置において適用された直交変換の逆変換に相当する。逆直交変換は、例えば整数精度IDCT、整数精度IDSTなどであってよい。なお、逆直交変換器304は、上記画像符号化装置において変換スキップが選択されている場合には、同様に変換スキップを選択する。逆直交変換器304は、予測差分を加算器305へと出力する。
加算器305は、逆直交変換器304から予測差分を受け取り、動き予測器308およびイントラ予測器309のいずれか一方から予測画像を受け取る。加算器305は、予測画像に予測差分を加算し、復号画像を生成する。加算器305は、(1)ループフィルタ306、または、(2)フレームメモリ307およびリオーダ・バッファ310、のいずれか一方へと復号画像を出力する。すなわち、ループフィルタ306はオン/オフ可能である。
ループフィルタ306は、加算器305から復号画像を受け取る。ループフィルタ306は、復号画像に対してループフィルタ処理を適用する。ループフィルタ処理は、デブロッキング・フィルタ処理、画素適応オフセット処理などであってよい。なお、デブロッキング・フィルタ処理は、PUまたはTUの境界画素に対して適用され、ブロック境界の主観歪みを低減する。画素適応オフセット処理は、ブロック内部のリンギング歪みを低減する。ループフィルタ306は、フィルタ処理済みの復号画像をフレームメモリ307およびリオーダ・バッファ310へと出力する。
フレームメモリ307は、例えば半導体メモリである。フレームメモリ307は、加算器305およびループフィルタ306のいずれか一方から復号画像を受け取る。フレームメモリ307は、復号画像を参照画像の候補として保存する。フレームメモリ307は、復号ピクチャバッファとも呼ばれる。フレームメモリ307に保存された復号画像は、動き予測器308またはイントラ予測器309によって必要に応じて参照画像として読み出される。
動き予測器308は、CUの予測タイプがインター予測である場合に、エントロピー復号器302からインター予測に関する情報を受け取り、当該情報に基づいてインターPB単位でインター予測を行って、インター予測画像を生成する。具体的には、動き予測器308は、参照ピクチャ情報を用いてフレームメモリ307内に保存された復号画像の中からインターPB毎に1フレームまたは複数フレームの参照画像を特定し、予測を行うことができる。動き予測器308は、整数画素精度予測に限られず小数画素精度(例えば、1/4画素精度)予測をサポートしてもよい。動き予測器308は、インター予測画像を加算器305へと出力する。
イントラ予測器309は、CUの予測タイプがイントラ予測である場合に、エントロピー復号器302から、イントラ予測に関する情報と、CUへのSub−CU分割の適用/非適用を示す情報と、Sub−CU分割の適用時にはSub−CU分割法(Sub−CU分割法が複数存在する場合)を示す情報および各Sub−CUに設定された予測モードを示す情報とを受け取る。イントラ予測器309は、受け取った情報に基づいてイントラ予測を行って、イントラ予測画像を生成する。
Sub−CU分割の非適用時には、イントラ予測器309は、図10に例示されるように、イントラ予測に関する情報に基づいてPU(≒CU)毎に予測モードを設定し、当該PUの上端および左端に隣接する画素を含む参照画像をフレームメモリ307から読み出し、当該参照画像に基づいて当該予測モードに応じたイントラ予測を行ってイントラ予測画像を生成する。
他方、Sub−CU分割の適用時には、イントラ予測器309は、当該CUの左端または上端に隣接する画素を含む参照画像をフレームメモリ307から読み出し、Sub−CU毎に設定された予測モードに応じたイントラ予測を行ってイントラ予測画像を生成する。CUに属する全てのSub−CUに共通の参照画像を使用可能であるから、イントラ予測器309は複数のSub−CUに対して並列的にイントラ予測を行ってよい。
なお、イントラ予測器309は、第1の実施形態において説明された、画素位置を考慮したイントラ予測を行ってもよい。
イントラ予測器309は、前述の画素位置を考慮したDC予測に関して、図示されない画像符号化装置に含まれるイントラ予測器と同一のアルゴリズムで動作することで、PUをどのようなサブセットに区分するかを決定することができる。故に、画像符号化装置は、PUがどのようなサブセットに区分するかを示す情報をシグナリングする必要はない。但し、係る情報をシグナリングし、イントラ予測器309の処理負荷を軽減する実装も可能である。
イントラ予測器309は、PUに関連付けられた予測モードがVertical予測である場合に、前述の画素位置を考慮したVertical予測を、無条件に行ってもよいし、条件付きで(例えば、画素位置を考慮したVertical予測の適用を示す情報がシグナリングされた場合、PUのサイズが規定値以上である場合など)行ってもよい。
イントラ予測器309は、PUに関連付けられた予測モードがHorizontal予測である場合に、前述の画素位置を考慮したHorizontal予測を、無条件に行ってもよいし、条件付きで(例えば、画素位置を考慮したHorizontal予測の適用を示す情報がシグナリングされた場合、PUのサイズが規定値以上である場合など)行ってもよい。
リオーダ・バッファ310は、例えば半導体メモリである。リオーダ・バッファ310は、加算器305またはループフィルタ306のいずれか一方から復号画像を受け取る。リオーダ・バッファ310は、この復号画像を一時的に保存する。リオーダ・バッファ310に保存された復号画像は、表示順序で並び替えられ、それからD/A変換器311へと出力される。
D/A変換器311は、リオーダ・バッファ311から復号画像としてのデジタルのビデオ信号を受け取る。D/A変換器311は、ビデオ信号をデジタル/アナログ変換し、アナログの出力信号を生成する。D/A変換器311は、例えばディスプレイなどの図示されない後段の装置へと出力信号を供給する。
以下、図22のフローチャートを用いて、図21の画像復号装置のイントラ予測に関する動作を説明する。
ステップS401において、イントラ予測器309は、エントロピー復号器302からSub−CU分割の適用/非適用を示す情報(Sub−CU split flag)を受信する。
Sub−CU分割の適用時には、イントラ予測器309は、エントロピー復号器302からSub−CU分割法を示す情報と、各Sub−CUの予測モードを示す情報とをさらに受信する(ステップS402、ステップS403およびステップS404)。なお、Sub−CU分割法が一意に定められる場合には、ステップS403は省略可能である。
他方、SUb−CU分割の非適用時には、イントラ予測器309は、エントロピー復号器302から各PUの予測モードを示す情報をさらに受信する(ステップS402およびステップS405)。
ステップS404またはステップS405に続いて、イントラ予測器309は参照画像を設定する(ステップS406)。Sub−CU分割の適用/非適用に関わらず、このステップS406における処理は共通である。具体的には、イントラ予測器309は、現行CUの左端と隣接する複数の画素と当該CUの上端に隣接する複数の画素とを含み当該CUの内部の画素を含まない参照画像を設定する。
次に、イントラ予測器309は、ステップS406において設定された参照画像に基づいてイントラ予測画像を生成する(ステップS407)。具体的には、Sub−CU分割の適用時には、イントラ予測器309は、ステップS406において設定した参照画像に基づいて、ステップS403において受信した情報により特定されるSub−CU毎に、ステップS404において受信した情報の示す予測モードに応じたイントラ予測を行う。他方、Sub−CU分割の非適用時には、イントラ予測器309は、ステップS406において設定した参照画像に基づいて、PU毎にステップS405において受信した情報の示す予測モードに応じたイントラ予測を行う。
以上説明したように、第2の実施形態に係る画像復号装置は、Sub−CU分割の適用時には、各Sub−CUに個別に予測モードを設定し、各Sub−CUを共通の参照画像に基づいてイントラ予測する。従って、この画像復号装置によれば、CUを複数のCUに分割した場合に比べて、イントラ予測に関わるレイテンシおよびheadbinの増分を抑制しながら、CU内で局所的に予測効率の高い予測モードを選択することができる。
さらに、第2の実施形態に係る画像復号装置は、画素位置を考慮したイントラ予測を必要に応じて行う。従って、この画像復号装置によれば、PUまたはSub−CU内の画素と参照画像との距離の増大に伴う予測効率の低下を抑制することができる。
纏めると、第2の実施形態に係る画像復号装置は、イントラ予測の自由度を高め、符号化効率の向上を可能とする。
上述の実施形態は、本発明の概念の理解を助けるための具体例を示しているに過ぎず、本発明の範囲を限定することを意図されていない。実施形態は、本発明の要旨を逸脱しない範囲で、様々な構成要素の付加、削除または転換をすることができる。
上記各実施形態において説明された種々の機能部は、回路を用いることで実現されてもよい。回路は、特定の機能を実現する専用回路であってもよいし、プロセッサのような汎用回路であってもよい。
上記各実施形態の処理の少なくとも一部は、汎用のコンピュータを基本ハードウェアとして用いることでも実現可能である。上記処理を実現するプログラムは、コンピュータで読み取り可能な記録媒体に格納して提供されてもよい。プログラムは、インストール可能な形式のファイルまたは実行可能な形式のファイルとして記録媒体に記憶される。記録媒体としては、磁気ディスク、光ディスク(CD−ROM、CD−R、DVD等)、光磁気ディスク(MO等)、半導体メモリなどである。記録媒体は、プログラムを記憶でき、かつ、コンピュータが読み取り可能であれば、何れであってもよい。また、上記処理を実現するプログラムを、インターネットなどのネットワークに接続されたコンピュータ(サーバ)上に格納し、ネットワーク経由でコンピュータ(クライアント)にダウンロードさせてもよい。
101・・・A/D変換器
102,310・・・リオーダ・バッファ
103・・・減算器
104・・・直交変換器
105・・・量子化器
106,303・・・逆量子化器
107,304・・・逆直交変換器
108,305・・・加算器
109,306・・・ループフィルタ
110,307・・・フレームメモリ
111,308・・・動き予測器
112,309・・・イントラ予測器
113・・・Sub−CU分割器
114・・・Sub−CU予測モード決定器
115・・・エントロピー符号化器
116,301・・・HRDバッファ
302・・・エントロピー復号器
311・・・D/A変換器

Claims (10)

  1. 符号化データを復号し、コーディングユニットの量子化変換係数と、当該コーディングユニットを複数のサブコーディングユニットへと分割するサブコーディングユニット分割の適用/非適用を示す情報とを得て、前記サブコーディングユニット分割の適用時にはサブコーディングユニット毎の予測モードを示す情報をさらに得る復号器と、
    前記サブコーディングユニット分割の適用時には、前記コーディングユニットの左端と隣接する複数の画素と当該コーディングユニットの上端と隣接する複数の画素とを含み当該コーディングユニットの内部の画素を含まない参照画像に基づいて、前記サブコーディングユニット毎に前記予測モードに応じたイントラ予測を行い、前記コーディングユニットのイントラ予測画像を生成するイントラ予測器と、
    前記量子化変換係数に基づいて復元された予測差分を前記イントラ予測画像に加算し、前記コーディングユニットの復号画像を生成する加算器と
    を具備する、画像復号装置。
  2. 前記イントラ予測器は、前記複数のサブコーディングユニットに対して前記参照画像に基づいて並列的にイントラ予測を行う、請求項1に記載の画像復号装置。
  3. 前記サブコーディングユニット毎の予測モードは、前記コーディングユニットに関連付けられた複数のMPM(Most Probable Mode)から選択される、請求項1に記載の画像復号装置。
  4. 前記コーディングユニットのサイズが規定値未満である場合には、前記サブコーディングユニット分割は非適用である、請求項1に記載の画像復号装置。
  5. 前記イントラ予測器は、前記コーディングユニットまたは前記サブコーディングユニットの予測モードがDC予測である場合に、所定の条件下で当該コーディングユニットまたは当該サブコーディングユニットを複数のサブセットへと区分し、当該複数のサブセットの各々に対して前記参照画像のうち当該サブセットのいずれかの画素と同一の水平位置を持つ画素と当該サブセットのいずれかの画素と同一の垂直位置を持つ画素とに基づいて当該サブセットのDC予測を行う、請求項1に記載の画像復号装置。
  6. 前記イントラ予測器は、前記コーディングユニットまたは前記サブコーディングユニットを上下に区分するか否かを前記コーディングユニットの左端と隣接する複数の画素と第1の閾値とに基づいて決定し、前記コーディングユニットまたは前記サブコーディングユニットを左右に区分するか否かを前記コーディングユニットの上端と隣接する複数の画素と第2の閾値とに基づいて決定する、請求項5に記載の画像復号装置。
  7. 前記第1の閾値および前記第2の閾値は、前記量子化変換係数に適用された量子化パラメータに依存する、請求項6に記載の画像復号装置。
  8. 前記イントラ予測器は、
    前記コーディングユニットまたは前記サブコーディングユニットの予測モードがHorizontal予測である場合に、当該コーディングユニットまたは当該サブコーディングユニットの所与の画素の予測値を、前記参照画像のうち前記コーディングユニットの左上隅の画素の左上隣に位置する第1の参照画素と当該参照画像のうち当該所与の画素と同一の水平位置を持つ第2の参照画素との第1の差分値と、前記第1の参照画素と当該参照画像のうち当該所与の画素と同一の垂直位置を持つ第3の参照画素との第2の差分値と、前記第3の参照画素の値と、当該所与の画素の水平位置とに基づいて生成し、
    前記コーディングユニットまたは前記サブコーディングユニットの予測モードがVertical予測である場合に、当該コーディングユニットまたは当該サブコーディングユニットの所与の画素の予測値を、前記第1の差分値と、前記第2の差分値と、前記第2の参照画素の値と、当該所与の画素の垂直位置とに基づいて生成する、
    請求項5に記載の画像復号装置。
  9. コーディングユニットを複数のサブコーディングユニットへと分割する分割器と、
    前記複数のサブコーディングユニットの各々の予測モードを決定する決定器と、
    前記コーディングユニットを複数のサブコーディングユニットへと分割するサブコーディングユニット分割の適用時には、前記コーディングユニットの左端と隣接する複数の画素と当該コーディングユニットの上端と隣接する複数の画素とを含み当該コーディングユニットの内部の画素を含まない参照画像に基づいて、前記複数のサブコーディングユニットの各々に前記予測モードに応じたイントラ予測を行い、前記コーディングユニットのイントラ予測画像を生成するイントラ予測器と、
    前記コーディングユニットから前記イントラ予測画像を減算し、予測差分を生成する減算器と、
    前記予測差分に基づいて生成された量子化変換係数と、前記サブコーディングユニット分割の適用/非適用を示す情報とを符号化し、前記サブコーディングユニット分割の適用時には前記予測モードを示す情報をさらに符号化する符号化器と
    を具備する、画像符号化装置。
  10. 前記イントラ予測器は、前記コーディングユニットまたは前記サブコーディングユニットの予測モードがDC予測である場合に、所定の条件下で当該コーディングユニットまたは当該サブコーディングユニットを複数のサブセットへと区分し、当該複数のサブセットの各々に対して前記参照画像のうち当該サブセットのいずれかの画素と同一の水平位置を持つ画素と当該サブセットのいずれかの画素と同一の垂直位置を持つ画素とに基づいて当該サブセットのDC予測を行う、請求項9に記載の画像符号化装置。
JP2016170869A 2016-09-01 2016-09-01 画像符号化装置および画像復号装置 Pending JP2018037936A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016170869A JP2018037936A (ja) 2016-09-01 2016-09-01 画像符号化装置および画像復号装置
PCT/JP2017/030179 WO2018043256A1 (ja) 2016-09-01 2017-08-23 画像符号化装置および画像復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016170869A JP2018037936A (ja) 2016-09-01 2016-09-01 画像符号化装置および画像復号装置

Publications (1)

Publication Number Publication Date
JP2018037936A true JP2018037936A (ja) 2018-03-08

Family

ID=61301754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016170869A Pending JP2018037936A (ja) 2016-09-01 2016-09-01 画像符号化装置および画像復号装置

Country Status (2)

Country Link
JP (1) JP2018037936A (ja)
WO (1) WO2018043256A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020184263A1 (ja) 2019-03-11 2020-09-17 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
US11962801B2 (en) 2019-03-11 2024-04-16 Kddi Corporation Image decoding device, image decoding method, and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3912359A4 (en) * 2019-03-11 2022-04-20 Huawei Technologies Co., Ltd. ENCODERS, DECODERS AND RELATIVE METHODS FOR LIMITING THE SIZE OF SUBDIVISIONS FROM A TOOL WITH INTRADIVISION CODING MODE

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090003449A1 (en) * 2007-06-28 2009-01-01 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method and image decoding method
US8619857B2 (en) * 2010-04-09 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
US20130301713A1 (en) * 2012-05-14 2013-11-14 Qualcomm Incorporated Systems and methods for intra prediction video coding

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020184263A1 (ja) 2019-03-11 2020-09-17 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
JP2020150314A (ja) * 2019-03-11 2020-09-17 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
CN113545043A (zh) * 2019-03-11 2021-10-22 Kddi 株式会社 图像解码装置、图像解码方法和程序
US20220167010A1 (en) * 2019-03-11 2022-05-26 Kddi Corporation Image decoding device, image decoding method, and program
JP7145793B2 (ja) 2019-03-11 2022-10-03 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
US11962801B2 (en) 2019-03-11 2024-04-16 Kddi Corporation Image decoding device, image decoding method, and program

Also Published As

Publication number Publication date
WO2018043256A1 (ja) 2018-03-08

Similar Documents

Publication Publication Date Title
TWI788302B (zh) 用於視訊寫碼之樹型寫碼
JP6568242B2 (ja) 参照ピクチャリスト管理方法及びその方法を使用する装置
TWI812694B (zh) 以角度模式延伸之位置相關框內預測組合
WO2018061588A1 (ja) 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラム
KR20180029905A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
JP2017511620A (ja) オーバーラップエリア内の再構成されたサンプル値のブロックベクトル予測及び推定におけるイノベーション
JP7399973B2 (ja) イントラ予測ベースのビデオ信号処理方法及び装置
TW202034695A (zh) 用於視訊寫碼之限制仿射運動繼承
TW202029774A (zh) 藉由轉換域濾波之量化假影抑制及信號恢復
US10205952B2 (en) Method and apparatus for inter color component prediction
WO2018043256A1 (ja) 画像符号化装置および画像復号装置
US20230117245A1 (en) Image encoding method and image decoding method
JP7030246B2 (ja) イントラ予測装置、画像復号装置、及びプログラム
JP6590412B2 (ja) 映像符号化装置、方法及びプログラム、並びに映像復号装置、方法及びプログラム
CN114830642A (zh) 图像编码方法和图像解码方法
TW202029747A (zh) 對於視訊寫碼中最壞情況頻寬縮減之限制
US20220377354A1 (en) Image encoding method and image decoding method
US20230028434A1 (en) Image encoding method and image decoding method
US20230028160A1 (en) Image encoding method and image decoding method
US20230038870A1 (en) Image encoding method and image decoding method
JP7069421B2 (ja) 符号化装置、復号装置、及びプログラム
KR20240046574A (ko) 모션 벡터 예측자 정밀도를 암시적으로 지시하기 위한 방법 및 장치
KR20230123947A (ko) 고정 필터들을 갖는 적응적 루프 필터
JP5957513B2 (ja) 動画像復号化方法
KR20240006655A (ko) 일반화된 샘플 오프셋의 적응적 적용