JP2019530345A - 映像コーディングシステムにおける照度補償基盤インター予測方法及び装置 - Google Patents

映像コーディングシステムにおける照度補償基盤インター予測方法及び装置 Download PDF

Info

Publication number
JP2019530345A
JP2019530345A JP2019515789A JP2019515789A JP2019530345A JP 2019530345 A JP2019530345 A JP 2019530345A JP 2019515789 A JP2019515789 A JP 2019515789A JP 2019515789 A JP2019515789 A JP 2019515789A JP 2019530345 A JP2019530345 A JP 2019530345A
Authority
JP
Japan
Prior art keywords
block
current block
reference sample
sample
peripheral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019515789A
Other languages
English (en)
Other versions
JP6781340B2 (ja
Inventor
ネリ パク
ネリ パク
チェヒョン リム
チェヒョン リム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2019530345A publication Critical patent/JP2019530345A/ja
Application granted granted Critical
Publication of JP6781340B2 publication Critical patent/JP6781340B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明によるインター予測方法は、現在ブロックの動きベクトルを導き出すステップと、前記動きベクトルに基づいて前記現在ブロックに対する参照ブロックを導き出すステップと、前記参照ブロックの第1周辺参照サンプル及び前記現在ブロックの第2周辺参照サンプルに基づいてICパラメータを導き出すステップであって、前記ICパラメータは、スケーリングファクタa及びオフセットbを含む、ステップと、前記スケーリングファクタ及びオフセットに基づいて前記参照ブロックの参照サンプルに対するICを行って、前記現在ブロックに対する予測サンプルを導き出すステップと、を含むことを特徴とする。本発明によれば、付加情報のデータ量を減らしながら効率的にインター予測性能を高めることができる。【選択図】図5

Description

本発明は、映像コーディング技術に関し、さらに詳細には、映像コーディングシステムにおける照度補償(illumination compensation)基盤インター予測方法及び装置に関する。
最近、HD(High Definition)映像及びUHD(Ultra High Definition)映像のような高解像度、高品質の映像に対する需要が多様な分野において増加している。映像データが高解像度、高品質になるほど従来の映像データに比べて相対的に送信される情報量またはビット量が増加するから、従来の有線/無線広帯域回線のような媒体を利用して映像データを送信するか、または従来の格納媒体を利用して映像データを格納する場合、送信費用と格納費用が増加する。
これにより、高解像度、高品質映像の情報を効果的に送信または格納し、再生するために高効率の映像圧縮技術が求められる。
本発明の技術的課題は、映像コーディング効率を上げる方法及び装置を提供することにある。
本発明の他の技術的課題は、予測性能を高める方法及び装置を提供することにある。
本発明のさらに他の技術的課題は、照度補償基盤インター予測性能を高める方法及び装置を提供することにある。
本発明のさらに他の技術的課題は、照度補償のための付加情報のデータ量を減らしながら、前記照度補償のためのパラメータを効率的に導き出す方法を提供することにある。
本発明の一実施の形態によれば、エンコード装置によって行われるインター予測方法が提供される。前記方法は、現在ブロックに対する参照ブロックを検出するステッップと、前記現在ブロックの動きベクトルを導き出すステップと、前記参照ブロックの第1周辺参照サンプル及び前記現在ブロックの第2周辺参照サンプルに基づいてICパラメータを導き出すステップであって、前記ICパラメータは、スケーリングファクタa及びオフセットbを含む、ステップと、前記スケーリングファクタ及びオフセットに基づいて前記参照ブロックの参照サンプルに対するICを行って、前記現在ブロックに対する予測サンプルを導き出すステップと、予測情報をエンコードして出力するステップと、を含むことを特徴とする。
本発明の他の一実施の形態によれば、インター予測のためのエンコード装置が提供される。前記エンコード装置は、現在ブロックに対する参照ブロックを検出し、前記現在ブロックの動きベクトルを導き出し、前記参照ブロックの第1周辺参照サンプル及び前記現在ブロックの第2周辺参照サンプルに基づいてICパラメータを導き出すものの、前記ICパラメータは、スケーリングファクタa及びオフセットbを含み、前記スケーリングファクタ及びオフセットに基づいて前記参照ブロックの参照サンプルに対するICを行って、前記現在ブロックに対する予測サンプルを導き出す予測部と、予測情報をエンコードして出力するエントロピーエンコード部と、を含むことを特徴とする。
本発明のさらに他の一実施の形態によれば、デコード装置によって行われるインター予測方法が提供される。前記方法は、現在ブロックの動きベクトルを導き出すステップと、前記動きベクトルに基づいて前記現在ブロックに対する参照ブロックを導き出すステップと、前記参照ブロックの第1周辺参照サンプル及び前記現在ブロックの第2周辺参照サンプルに基づいてICパラメータを導き出すステップであって、前記ICパラメータは、スケーリングファクタa及びオフセットbを含む、ステップと、前記スケーリングファクタ及びオフセットに基づいて前記参照ブロックの参照サンプルに対するICを行って、前記現在ブロックに対する予測サンプルを導き出すステップと、を含むことを特徴とする。
本発明のさらに他の一実施の形態によれば、インター予測のためのデコード装置が提供される。前記デコード装置は、現在ブロックの動きベクトルを導き出し、前記動きベクトルに基づいて前記現在ブロックに対する参照ブロックを導き出すものの、前記参照ブロックは、参照ピクチャ内に位置し、前記参照ブロックの第1周辺参照サンプル及び前記現在ブロックの第2周辺参照サンプルに基づいてICパラメータを導き出すものの、前記ICパラメータは、スケーリングファクタa及びオフセットbを含み、前記スケーリングファクタ及びオフセットに基づいて前記参照ブロックの参照サンプルに対するICを行って、前記現在ブロックに対する予測サンプルを導き出す予測部と、前記参照ピクチャを格納するメモリと、を含むことを特徴とする。
本発明によれば、ブロック構造に基づいた照度補償を介して付加情報のデータ量を減らしながら効率的にインター予測性能を高めることができる。
本発明によれば、レジデュアル情報に必要なデータ量を減らすことができ、全般的なコーディング効率を上げることができる。
本発明が適用されることができるビデオエンコード装置の構成を概略的に説明する図である。 本発明が適用されることができるビデオデコード装置の構成を概略的に説明する図である。 QTBT(Quad Tree Binary Tree)構造を介して分割されたCU及び前記QTBT構造のシグナリング方法を例示的に示す。 照度補償(illumination compensation、IC)有無に応じる予測の例を示す。 ICパラメータ導出のために使用される周辺参照サンプルを示す例である。 ICパラメータ導出のために使用される周辺参照サンプルを示す例である。 非正方形ブロックに対して使用されるICパラメータ導出のための周辺参照サンプルの例を示す。 非正方形ブロックに対して使用されるICパラメータ導出のための右上側及び左下側周辺参照サンプルを含む周辺参照サンプルの例を示す。 ICパラメータ導出のための周辺サンプルの例を示す。 本発明による多様な基準に応じるIC適用を例示的に示す。 本発明による映像エンコードでのインター予測方法の一例を概略的に示す。 本発明による映像デコードでのインター予測方法の一例を概略的に示す。
本発明は、多様な変更を加えることができ、様々な実施の形態を有することができるから、特定の実施の形態を図面に例示し詳細に説明しようとする。しかし、これは、本発明を特定の実施の形態に限定しようとするものではない。本明細書において使用する用語は、ただ特定の実施の形態を説明するために使用されたものであって、本発明の技術的思想を限定しようとする意図として使用されるものではない。単数の表現は、文脈上明白に異なって意味しない限り、複数の表現を含む。本明細書において「含む」または「有する」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品またはこれらを組み合わせたものが存在することを指定するためであり、一つまたはそれ以上の他の特徴、数字、ステップ、動作、構成要素、部品またはこれらを組み合わせたものの存在または付加可能性を予め排除しないと理解されなければならない。
一方、本発明において説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の便宜のために独立的に示されたものであって、各構成が互いに別のハードウェアまたは別のソフトウェアにより実装されるということを意味しない。例えば、各構成のうち、二つ以上の構成が合わせられて一つの構成をなすこともでき、一つの構成が複数の構成に分けられることもできる。各構成が統合及び/または分離された実施の形態も本発明の本質から逸脱しない限り本発明の権利範囲に含まれる。
以下、添付した図面を参照して、本発明の好ましい実施の形態をさらに詳細に説明しようとする。以下、図面上の同じ構成要素に対しては、同じ参照符号を使用し、同じ構成要素に対して重複した説明は省略する。
本明細書においてピクチャ(picture)は、一般に特定時間帯の一つの映像を表す単位を意味し、スライス(sICe)は、コーディングにおいてピクチャの一部を構成する単位である。一つのピクチャは、複数のスライスから構成されることができ、必要によってピクチャ及びスライスは、互いに混用して使用されることができる。
ピクセル(pixel)またはペル(pel)は、一つのピクチャ(または映像)を構成する最小の単位を意味できる。また、ピクセルに対応する用語として「サンプル(sample)」が使用されることができる。サンプルは、一般にピクセルまたはピクセルの値を表すことができ、輝度(luma)成分のピクセル/ピクセル値だけを表すこともでき、彩度(chroma)成分のピクセル/ピクセル値だけを表すことができる。
ユニット(unit)は、映像処理の基本単位を表す。ユニットは、ピクチャの特定領域及び該当領域に関連した情報のうち、少なくとも一つを含むことができる。ユニットは、場合によってブロック(block)または領域(area)などの用語と混用して使用されることができる。一般的な場合、MxNブロックは、M個の列とN個の行からなるサンプルまたは変換係数(transform coefficient)の集合を表すことができる。
図1は、本発明が適用されることができるビデオエンコード装置の構成を概略的に説明する図である。
図1を参照すると、ビデオエンコード装置100は、ピクチャ分割部105、予測部110、レジデュアル処理部120、加算部140、フィルタ部150及びメモリ160を含むことができる。レジデュアル処理部120は、減算部121、変換部122、量子化部123、再整列部124、逆量子化部125及び逆変換部126を含むことができる。
ピクチャ分割部105は、入力されたピクチャを少なくとも一つの処理ユニット(processing unit)に分割できる。
一例として、処理ユニットは、コーディングユニット(coding unit、CU)と呼ばれることができる。この場合、コーディングユニットは、最大コーディングユニット(largest coding unit、LCU)からQTBT(Quad-tree binary-tree)構造に従って再帰的に(recursively)分割されることができる。例えば、一つのコーディングユニットは、クアッドツリー構造及び/またはバイナリツリー構造に基づいて、下位(deeper)デプスの複数のコーディングユニットに分割されることができる。この場合、例えばクアッドツリー構造がまず適用され、バイナリツリー構造が後ほど適用されることができる。または、バイナリツリー構造がまず適用されることもできる。もうこれ以上分割されない最終コーディングユニットに基づいて、本発明によるコーディング手順が行われることができる。この場合、映像特性に応じるコーディング効率などに基づいて、最大コーディングユニットが直に最終コーディングユニットとして使用されることができ、または必要によってコーディングユニットは、再帰的に(recursively)より下位デプスのコーディングユニットに分割されて、最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。
他の例として、処理ユニットは、コーディングユニット(coding unit、CU)予測ユニット(prediction unit、PU)または変換ユニット(transform unit、TU)を含むこともできる。コーディングユニットは、最大コーディングユニット(largest coding unit、LCU)からクアッドツリー構造に従って、下位(deeper)デプスのコーディングユニットに分割(split)されることができる。この場合、映像特性に応じるコーディング効率などに基づいて、最大コーディングユニットが直に最終コーディングユニットとして使用されることができ、または必要によってコーディングユニットは、再帰的に(recursively)より下位デプスのコーディングユニットに分割されて、最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。最小コーディングユニット(smallest coding unit、SCU)が設定された場合、コーディングユニットは、最小コーディングユニットより小さなコーディングユニットに分割されることができない。ここで、最終コーディングユニットとは、予測ユニットまたは変換ユニットにパーティショニングまたは分割される基盤になるコーディングユニットを意味する。予測ユニットは、コーディングユニットからパーティショニング(partitioning)されるユニットであって、サンプル予測のユニットでありうる。このとき、予測ユニットは、サブブロック(sub block)に分けられることもできる。変換ユニットは、コーディングユニットからクアッドツリー構造に従って分割されることができ、変換係数を誘導するユニット及び/または変換係数からレジデュアル信号(residual signal)を誘導するユニットでありうる。以下、コーディングユニットは、コーディングブロック(coding block、CB)、予測ユニットは、予測ブロック(prediction block、PB)、変換ユニットは、変換ブロック(transform block、TB)と呼ばれることができる。予測ブロックまたは予測ユニットは、ピクチャ内でブロック形態の特定領域を意味でき、予測サンプルのアレイ(array)を含むことができる。また、変換ブロックまたは変換ユニットは、ピクチャ内でブロック形態の特定領域を意味でき、変換係数またはレジデュアルサンプルのアレイを含むことができる。
予測部110は、処理対象ブロック(以下、現在ブロックという)に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成できる。予測部110で行われる予測の単位は、コーディングブロック、変換ブロック、または予測ブロックでありうる。
予測部110は、現在ブロックにイントラ予測が適用されるかインター予測が適用されるかを決定できる。一例として、予測部110は、CU単位としてイントラ予測またはインター予測が適用されるかを決定できる。
イントラ予測の場合に、予測部110は、現在ブロックが属するピクチャ(以下、現在ピクチャ)内の現在ブロック外部の参照サンプルに基づいて、現在ブロックに対する予測サンプルを誘導できる。このとき、予測部110は、(i)現在ブロックの周辺(neighboring)参照サンプルの平均(average)あるいはインターポレーション(interpolation)に基づいて予測サンプルを誘導でき、(ii)現在ブロックの周辺参照サンプルのうち、予測サンプルに対して特定(予測)方向に存在する参照サンプルに基づいて、前記予測サンプルを誘導することもできる。(i)の場合は、非方向性モードまたは非角度モード、(ii)の場合は、方向性(directional)モードまたは角度(angular)モードと呼ばれることができる。イントラ予測において予測モードは、例えば33個の方向性予測モードと少なくとも2個以上の非方向性モードを有することができる。非方向性モードは、DC予測モード及びプラナーモード(Planarモード)を含むことができる。予測部110は、周辺ブロックに適用された予測モードを利用して、現在ブロックに適用される予測モードを決定することもできる。
インター予測の場合に、予測部110は、参照ピクチャ上において動きベクトルにより特定されるサンプルに基づいて、現在ブロックに対する予測サンプルを誘導できる。予測部110は、スキップ(skip)モード、マージ(merge)モード、及びMVP(motion vector prediction)モードのうち、いずれか一つを適用して、現在ブロックに対する予測サンプルを誘導できる。スキップモードとマージモードの場合に、予測部110は、周辺ブロックの動き情報を現在ブロックの動き情報として利用できる。スキップモードの場合、マージモードとは異なり、予測サンプルと原サンプル間の差(レジデュアル)が送信されない。MVPモードの場合、周辺ブロックの動きベクトルを動きベクトル予測子(Motion Vector Predictor)として利用して、現在ブロックの動きベクトル予測子として利用して、現在ブロックの動きベクトルを誘導できる。
インター予測の場合に、周辺ブロックは、現在ピクチャ内に存在する空間的周辺ブロック(spatial neighboring block)と参照ピクチャ(reference picture)に存在する時間的周辺ブロック(temporal neighboring block)を含むことができる。前記時間的周辺ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)と呼ばれることができる。動き情報(motion information)は、動きベクトルと参照ピクチャインデックスを含むことができる。予測モード情報と動き情報などの情報は、(エントロピー)エンコードされてビットストリーム形態で出力されることができる。
スキップモードとマージモードにおいて時間的周辺ブロックの動き情報が利用される場合に、参照ピクチャリスト(reference picture list)上の最上位ピクチャが参照ピクチャとして利用されることもできる。参照ピクチャリスト(Picture Order Count)に含まれる参照ピクチャは、現在ピクチャと該当参照ピクチャとの間のPOC(Picture order count)差に基づいて整列されることができる。POCは、ピクチャのディスプレイ順序に対応し、コーディング順序と区分されることができる。
減算部121は、原サンプルと予測サンプルとの間の差であるレジデュアルサンプルを生成する。スキップモードが適用される場合には、上述のように、レジデュアルサンプルを生成しないことがある。
変換部122は、変換ブロック単位でレジデュアルサンプルを変換して変換係数(transform coefficient)を生成する。変換部122は、該当変換ブロックのサイズと、該当変換ブロックと空間的に重なるコーディングブロックまたは予測ブロックに適用された予測モードに応じて変換を行うことができる。例えば、前記変換ブロックと重なる前記コーディングブロックまたは前記予測ブロックにイントラ予測が適用され、前記変換ブロックが4×4のレジデュアルアレイ(array)であると、レジデュアルサンプルは、DST(Discrete Sine Transform)変換カーネルを利用して変換され、その他の場合であると、レジデュアルサンプルは、DCT(Discrete Cosine Transform)変換カーネルを利用して変換できる。
量子化部123は、変換係数を量子化して、量子化された変換係数を生成できる。
再整列部124は、量子化された変換係数を再整列する。再整列部124は、係数スキャニング(scanning)方法を介してブロック形態の量子化された変換係数を1次元ベクトル形態で再整列できる。ここで、再整列部124は、別の構成として説明したが、再整列部124は、量子化部123の一部でありうる。
エントロピーエンコード部130は、量子化された変換係数に対するエントロピーエンコードを行うことができる。エントロピーエンコードは、例えば指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などのようなエンコード方法を含むことができる。エントロピーエンコード部130は、量子化された変換係数の他にビデオ復元に必要な情報(例えば、シンタックス要素(syntax element)の値等)を共にまたは別にエンコードすることもできる。エントロピーエンコードされた情報は、ビットストリーム形態でNAL(network abstraction layer)ユニット単位で送信または格納されることができる。
逆量子化部125は、量子化部123で量子化された値(量子化された変換係数)を逆量子化し、逆変換部126は、逆量子化部125で逆量子化された値を逆変換して、レジデュアルサンプルを生成する。
加算部140は、レジデュアルサンプルと予測サンプルを合わせてピクチャを復元する。レジデュアルサンプルと予測サンプルは、ブロック単位で加えられて復元ブロックが生成されることができる。ここで、加算部140は、別の構成として説明したが、加算部140は、予測部110の一部でありうる。一方、加算部140は、復元部または復元ブロック生成部と呼ばれることもできる。
復元されたピクチャ(reconstructed picture)に対してフィルタ部150は、デブロッキングフィルタ及び/またはサンプル適応的オフセット(samplead aptive offset)を適用できる。デブロッキングフィルタリング及び/またはサンプル適応的オフセットを介して、復元ピクチャ内のブロック境界のアーチファクトまたは量子化過程での歪みが補正されることができる。サンプル適応的オフセットは、サンプル単位で適用されることができ、デブロッキングフィルタリングの過程が完了した後に適用されることができる。フィルタ部150は、ALF(Adaptive Loop Filter)を復元されたピクチャに適用することもできる。ALFは、デブロッキングフィルタ及び/またはサンプル適応的オフセットが適用された後の復元されたピクチャに対して適用されることができる。
メモリ160は、復元ピクチャ(デコードされたピクチャ)またはエンコード/デコードに必要な情報を格納することができる。ここで、復元ピクチャは、前記フィルタ部150によってフィルタリング手順が完了した復元ピクチャでありうる。前記格納された復元ピクチャは、他のピクチャの(インター)予測のための参照ピクチャとして活用されることができる。例えば、メモリ160は、インター予測に使用される(参照)ピクチャを格納することができる。このとき、インター予測に使用されるピクチャは、参照ピクチャセット(reference picture set)あるいは参照ピクチャリスト(reference picture list)により指定されることができる。
図2は、本発明が適用されることができるビデオデコード装置の構成を概略的に説明する図である。
図2を参照すると、ビデオデコード装置200は、エントロピーデコード部210、レジデュアル処理部220、予測部230、加算部240、フィルタ部250及びメモリ260を含むことができる。ここで、レジデュアル処理部220は、再整列部221、逆量子化部222、逆変換部223を含むことができる。
ビデオ情報を含むビットストリームが入力されると、ビデオデコード装置200は、ビデオエンコード装置でビデオ情報が処理されたプロセスに対応してビデオを復元できる。
例えば、ビデオデコード装置200は、ビデオエンコード装置で適用された処理ユニットを利用して、ビデオデコードを行うことができる。したがって、ビデオデコードの処理ユニットブロックは、一例としてコーディングユニットであり、他の例としてコーディングユニット、予測ユニットまたは変換ユニットでありうる。コーディングユニットは、最大コーディングユニットからクアッドツリー構造及び/またはバイナリツリー構造に従って分割されることができる。
予測ユニット及び変換ユニットが場合によってさらに使用されることができ、この場合、予測ブロックは、コーディングユニットから導出またはパーティショニングされるブロックであって、サンプル予測のユニットでありうる。このとき、予測ユニットは、サブブロックに分けられることもできる。変換ユニットは、コーディングユニットからクアッドツリー構造に従って分割されることができ、変換係数を誘導するユニットまたは変換係数からレジデュアル信号を誘導するユニットでありうる。
エントロピーデコード部210は、ビットストリームをパーシングしてビデオ復元またはピクチャ復元に必要な情報を出力できる。例えば、エントロピーデコード部210は、指数ゴロム符号化、CAVLCまたはCABACなどのコーディング方法に基づいてビットストリーム内の情報をデコードし、ビデオ復元に必要なシンタックスエレメントの値、レジデュアルに関する変換係数の量子化された値を出力できる。
さらに詳細に述べると、CABACエントロピーデコード方法は、ビットストリームで各構文要素に該当するビンを受信し、デコード対象構文要素情報と周辺及びデコード対象ブロックのデコード情報あるいは以前のステップでデコードされたシンボル/ビンの情報を利用して文脈(context)モデルを決定し、決定された文脈モデルに応じてビン(bin)の発生確率を予測して、ビンの算術デコード(arithmetic decoding)を行って各構文要素の値に該当するシンボルを生成できる。このとき、CABACエントロピーデコード方法は、文脈モデル決定後に次のシンボル/ビンの文脈モデルのためにデコードされたシンボル/ビンの情報を利用して、文脈モデルをアップデートできる。
エントロピーデコード部210においてデコードされた情報のうち、予測に関する情報は、予測部230に提供され、エントロピーデコード部210においてエントロピーデコードが行われたレジデュアル値、すなわち量子化された変換係数は、再整列部221に入力されることができる。
再整列部221は、量子化されている変換係数を2次元のブロック形態で再整列できる。再整列部221は、エンコード装置で行われた係数スキャニングに対応して再整列を行うことができる。ここで、再整列部221は、別の構成として説明したが、再整列部221は、逆量子化部222の一部でありうる。
逆量子化部222は、量子化されている変換係数を(逆)量子化パラメータに基づいて逆量子化して変換係数を出力できる。このとき、量子化パラメータを誘導するための情報は、エンコード装置からシグナリングされることができる。
逆変換部223は、変換係数を逆変換してレジデュアルサンプルを誘導できる。
予測部230は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成できる。予測部230で行われる予測の単位は、コーディングブロック、変換ブロック、または予測ブロックでありうる。
予測部230は、前記予測に関する情報に基づいて、イントラ予測を適用するかインター予測を適用するかを決定できる。このとき、イントラ予測とインター予測のうち、どれを適用するかを決定する単位と予測サンプルを生成する単位は、互いに異なることができる。なお、インター予測とイントラ予測において、予測サンプルを生成する単位もまた互いに異なることができる。例えば、インター予測とイントラ予測のうち、どれを適用するかは、CU単位で決定できる。また、例えば、インター予測においてPU単位で予測モードを決定し予測サンプルを生成でき、イントラ予測においてPU単位で予測モードを決定しTU単位で予測サンプルを生成することもできる。
イントラ予測の場合に、予測部230は、現在ピクチャ内の周辺参照サンプルに基づいて、現在ブロックに対する予測サンプルを誘導できる。予測部230は、現在ブロックの周辺参照サンプルに基づいて方向性モードまたは非方向性モードを適用して、現在ブロックに対する予測サンプルを誘導できる。このとき、周辺ブロックのイントラ予測モードを利用して、現在ブロックに適用する予測モードが決定されることもできる。
インター予測の場合に、予測部230は、参照ピクチャ上において動きベクトルにより参照ピクチャ上において特定されるサンプルに基づいて、現在ブロックに対する予測サンプルを誘導できる。予測部230は、スキップ(skip)モード、マージ(merge)モード及びMVPモードのうち、いずれか一つを適用して、現在ブロックに対する予測サンプルを誘導できる。このとき、ビデオエンコード装置から提供された現在ブロックのインター予測に必要な動き情報、例えば動きベクトル、参照ピクチャインデックスなどに関する情報は、前記予測に関する情報に基づいて獲得または誘導されることができる。
スキップモードとマージモードの場合に、周辺ブロックの動き情報が現在ブロックの動き情報として利用されることができる。このとき、周辺ブロックは、空間的周辺ブロックと時間的周辺ブロックを含むことができる。
予測部230は、利用可能な周辺ブロックの動き情報でマージ候補リストを構成し、マージインデックスがマージ候補リスト上において指示する情報を現在ブロックの動きベクトルとして使用することができる。マージインデックスは、エンコード装置からシグナリングされることができる。動き情報は、動きベクトルと参照ピクチャを含むことができる。スキップモードとマージモードにおいて時間的周辺ブロックの動き情報が利用される場合に、参照ピクチャリスト上の最上位ピクチャが参照ピクチャとして利用されることができる。
スキップモードの場合、マージモードとは異なり、予測サンプルと原サンプルとの間の差(レジデュアル)が送信されない。
MVPモードの場合、周辺ブロックの動きベクトルを動きベクトル予測子(Motion Vector Predictor)として利用して、現在ブロックの動きベクトルが誘導されることができる。このとき、周辺ブロックは、空間的周辺ブロックと時間的周辺ブロックを含むことができる。
一例として、マージモードが適用される場合、復元された空間的周辺ブロックの動きベクトル及び/または時間的周辺ブロックであるColブロックに対応する動きベクトルを利用して、マージ候補リストが生成されることができる。マージモードでは、マージ候補リストにおいて選択された候補ブロックの動きベクトルが現在ブロックの動きベクトルとして使用される。前記予測に関する情報は、前記マージ候補リストに含まれた候補ブロックのうち選択された最適の動きベクトルを有する候補ブロックを指示するマージインデックスを含むことができる。このとき、予測部230は、前記マージインデックスを利用して、現在ブロックの動きベクトルを導き出すことができる。
他の例として、MVP(Motion Vector Prediction)モードが適用される場合、復元された空間的周辺ブロックの動きベクトル及び/または時間的周辺ブロックであるColブロックに対応する動きベクトルを利用して、動きベクトル予測子候補リストが生成されることができる。すなわち、復元された空間的周辺ブロックの動きベクトル及び/または時間的周辺ブロックであるColブロックに対応する動きベクトルは、動きベクトル候補として使用されることができる。前記予測に関する情報は、前記リストに含まれた動きベクトル候補のうち選択された最適の動きベクトルを指示する予測動きベクトルインデックスを含むことができる。このとき、予測部230は、前記動きベクトルインデックスを利用して、動きベクトル候補リストに含まれた動きベクトル候補のうち、現在ブロックの予測動きベクトルを選択できる。エンコード装置の予測部は、現在ブロックの動きベクトルと動きベクトル予測子間の動きベクトルの差分(MVD)を求めることができ、これをエンコードしてビットストリーム形態で出力できる。すなわち、MVDは、現在ブロックの動きベクトルから前記動きベクトル予測子を引いた値で求めることができる。このとき、予測部230は、前記予測に関する情報に含まれた動きベクトルの差分を獲得し、前記動きベクトルの差分と前記動きベクトル予測字の加算を介して、現在ブロックの前記動きベクトルを導き出すことができる。予測部は、また参照ピクチャを指示する参照ピクチャインデックスなどを前記予測に関する情報から獲得または誘導できる。
加算部240は、レジデュアルサンプルと予測サンプルを足して現在ブロックあるいは現在ピクチャを復元できる。加算部240は、レジデュアルサンプルと予測サンプルをブロック単位で足して、現在ピクチャを復元することもできる。スキップモードが適用された場合には、レジデュアルが送信されないので、予測サンプルが復元サンプルになることができる。ここでは、加算部240を別の構成として説明したが、加算部240は、予測部230の一部でありうる。一方、加算部240は、復元部または復元ブロック生成部と呼ばれることもできる。
フィルタ部250は、復元されたピクチャにデブロッキングフィルタリングサンプル適応的オフセット、及び/またはALFなどを適用できる。このとき、サンプル適応的オフセットは、サンプル単位で適用されることができ、デブロッキングフィルタリング以後に適用されることもできる。ALFは、デブロッキングフィルタリング及び/またはサンプル適応的オフセット以後に適用されることもできる。
メモリ260は、復元ピクチャ(デコードされたピクチャ)またはデコードに必要な情報を格納することができる。ここで復元ピクチャは、前記フィルタ部250によってフィルタリング手順が完了した復元ピクチャでありうる。例えば、メモリ260は、インター予測に使用されるピクチャを格納することができる。このとき、インター予測に使用されるピクチャは、参照ピクチャセットあるいは参照ピクチャリストにより指定されることもできる。復元されたピクチャは、他のピクチャに対する参照ピクチャとして利用されることができる。また、メモリ260は、復元されたピクチャを出力順序にしたがって出力することもできる。
入力されたピクチャに対するコーディングが行われる場合、一つの処理ユニットに基づいて前記コーディングが行われることができる。前記処理ユニットは、コーディングユニット(coding unit、CU)で表すことができる。一方、前記ピクチャ内の類似の情報を含む領域単位でコーディングが行われるほど、変換効率が向上することができ、これを通じて全般的なコーディング効率が向上することができる。また、前記ピクチャ内の類似の情報を含む領域単位でコーディングが行われるほど、予測正確度が向上することができ、これを通じて全般的なコーディング効率が向上することができる。しかしながら、クアッドツリー(quadtree、QT)構造だけが適用されて、前記ピクチャが正方形のCUだけに分割される場合、前記CUが正確に類似の情報だけを含むように分割することには限界がありうる。このような場合、前記ピクチャを前記特定オブジェクトを表す情報を含む非正方形CUに分割されるようにすることがよりコーディング効率を向上させることができる。
図3は、QTBT(Quad Tree Binary Tree)構造を介して分割されたCU及び前記QTBT構造のシグナリング方法を例示的に示す。
前記QTBT構造は、CU(またはCTU)がQT構造を介して分割され、バイナリツリー(binary tree、BT)構造を介して分割される構造を表すことができる。すなわち、前記QTBTは、前記QT構造と前記BT構造が結合された形態で構成された分割構造を表すことができ、ピクチャがCTU単位でコーディングされる場合、CTUは、前記QT構造を介して分割されることができ、前記QT構造のリーフノード(leaf node)は、追加的にBT構造を介して分割されることができる。ここで、前記リーフノードは、前記QT構造においてもうこれ以上分割されないCUを表すことができ、前記リーフノードは、末端ノードと呼ばれることもできる。また、前記QT構造は、2Nx2NサイズのCU(またはCTU)が4個のNxNサイズのサブCUに分割される構造を表すことができ、前記BT構造は、2Nx2NサイズのCUが2個のNx2N(またはnLx2N、nRx2N)サイズのサブCUまたは2個の2NxN(または2NxnU、2NxnD)サイズのサブCUに分割される構造を表すことができる。図3の(a)を参照すると、CUは、QT構造を介して下位デプス(depth)の正方形CUに分割されることができ、追加的に前記正方形CUのうち、特定CUは、BT構造を介して下位デプスの非正方形CUに分割されることができる。
図3の(b)は、前記QTBT構造のシンタックスシグナリングの一例を示すことができる。図3の(b)に示す実線は、QT構造を表すことができ、点線は、BT構造を表すことができる。また、上から下へ行くほど、上位デプス(depth)で下位(deeper)デプスのCUに対するシンタックスを表すことができる。また、左から右への方向へ左上側、右上側、左下側、右下側CUに対するシンタックスを表すことができる。具体的に、最も上の数字は、nデプスのCUに対するシンタックスを表すことができ、上から2番目の位置の数字は、n+1デプスのCU、上から3番目の位置の数字は、n+2デプスのCU、上から4番目の位置の数字は、n+3デプスのCUに対するシンタックスを表すことができる。また、ボールド体で表示された数字は、QT構造に対するシンタックスの値を表すことができ、ボールド体で表示されない数字は、BT構造に対するシンタックスの値を表すことができる。
図3の(b)を参照すると、CUが前記QT構造を介して分割されるかどうかを表すQT分割フラッグが送信されることができる。すなわち、前記2Nx2NサイズのCUが4個のNxNサイズのサブCUに分割されるかどうかを表すフラッグが送信されることができる。例えば、前記CUに対する前記QT分割フラッグの値が1の場合、前記CUは、4個のサブCUに分割されることができ、前記CUに対する前記QT分割フラッグの値が0の場合、前記CUは、分割されないことができる。また、入力映像に対する前記QT構造を調節するために、前記QT構造での最大CUサイズ、最小CUサイズ、最大デプスなどに対する情報が送信されることができる。上述のQT構造に対する情報は、スライスタイプの各々に対して送信されることができ、または映像成分(輝度成分、彩度成分等)の各々に対して送信されることができる。一方、BT構造に対する情報は、QT構造においてもうこれ以上分割されない末端ノードに対して送信されることができる。すなわち、前記QT構造において末端ノードに該当するCUに対する前記BT構造に対する情報が送信されることができる。ここで、前記BT構造に対する情報を含む情報は、追加分割情報と呼ばれることができる。例えば、前記CUの前記BT構造を介して分割するかどうか、すなわち、前記CUに対する前記BT構造の適用有無を表すBT分割フラッグが送信されることができる。具体的に、前記BT分割フラッグに対する値が1の場合、前記CUは、2個のサブCUに分割されることができ、前記BT分割フラッグに対する値が0の場合、前記CUは分割されないことができる。また、入力映像に対する前記BT構造を調節するために、BT構造での最大CUサイズ、最小CUサイズ、最大デプスなどに対する情報が送信されることができる。上述のBT構造に対する情報は、スライスタイプの各々に対して送信されることができ、または映像成分の各々に対して送信されることができる。前記CUが前記BT構造を介して分割される場合、前記CUは、横または縦方向に分割されることができる。前記CUがどんな方向に分割されているか、すなわち、前記CUの分割タイプを表すBT分割モードインデックスがさらに送信されることができる。
一方、上述のようにインター予測が行われる場合、現在ブロックに対する予測サンプルを含む予測されたブロックを生成できる。ここで、前記予測されたブロックは、空間ドメイン(またはピクセルドメイン)での予測サンプルを含む。前記予測されたブロックは、エンコード装置及びデコード装置で同様に導出され、前記エンコード装置は、原ブロックの原サンプル値自体でない前記原ブロックと前記予測されたブロック間のレジデュアルに対する情報(レジデュアル情報)をデコード装置にシグナリングすることによって、映像コーディング効率を上げることができる。デコード装置は、前記レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導き出し、前記レジデュアルブロックと前記予測されたブロックを合せて復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成できる。
一方、映像内に光源または影が存在する場合、その影響を受ける領域に局地的(local)照度変化が発生する。この場合、ブロック内のオブジェクトに対する予測を行うにおいて、現在ピクチャの現在ブロックと参照ピクチャの参照ブロック間の照度の差によって、予測の性能が減少する。これは、ビデオエンコード/デコード過程において使用される一般的な動き推定(estimation)/補償(compensation)アルゴリズムによれば、このような局地的照度変化を補償できないためである。これに対し、このような局地的照度変化を補償する場合、より正確な予測を行うことができる。
図4は、照度補償(illumination compensation、IC)有無に応じる予測の例を示す。
図4の(a)において、(インター)予測の対象になる現在ピクチャの現在ブロック420に比べて、対応する参照ピクチャのブロック410は、光源によって局地的に高い照度を有することができる。これは、現在ピクチャの参照ピクチャ間の時間的な差、現在ピクチャのオブジェクトの位置及び参照ピクチャのオブジェクトの位置の間の差、及び/または参照ブロックと現在ブロックの位置の差などによって発生できる。この場合、エンコーダは、RD(rate-distortion)コストに基づいて前記ブロック410をインター予測のための参照ブロックとして使用することもでき、あるいは場合によってその周辺の他のブロックを参照ブロックとして使用することもできる。ただし、この場合、予測の効率が低下しレジデュアル信号に多くのデータが割り当てられなければならないという問題点がある。
一方、(b)のように、本発明による照度補償を適用して補償された参照ブロック430に基づいて、現在ブロック440を予測して予測の効率を上げることができ、この場合、予測された現在ブロックと原ブロック間のレジデュアルが減少して、レジデュアル信号に割り当てられるデータが減ってコーディング効率が向上することができる。このように参照ブロックの照度を補償して予測の効率を上げる方法は、局地的照度補償(location illumination compensation、LIC)と呼ばれることができる。LICは、IC(illumination compensation)と混用されることもできる。
ICのための付加情報として、ICを適用するかどうかを表すためのICフラッグ、及びICを適用するためのICパラメータが使用されることができる。ICパラメータは、後述するようにスケーリングファクタ(scaling factor)a及びオフセットbを含むことができる。ICの効率を上げるためには、ICのための付加情報を最小化しながら予測性能を高めることが重要である。例えば、付加情報を最小化するために、特定サイズのCUまたは2Nx2Nのパーティションタイプを有するPUに対して制限的に適用することのように、ブロックサイズまたはパーティションタイプを考慮してICを適用するかどうかを決定することもできる。また、上述のようにQTBT構造が使用される場合、CU、PU、TUの区分なしで多様なサイズのCUが使用されうるから、該当構造に適合するようにICを適用して予測の正確度を上げることができる。
ICは、線形モデルを基盤として、例えば次のような数式1に基づくことができる。
Figure 2019530345
ここで、ICパラメータであるa及びbは、それぞれスケーリングファクタ及びオフセットを表し、x及びyは、それぞれICパラメータを導き出すために使用される参照ブロックの周辺参照サンプル値及び現在ブロックの周辺参照サンプル値を表す。または、x及びyは、それぞれICパラメータを導き出すために使用される参照ブロック内の参照サンプル値及び現在ブロックに対応する原(original)ピクチャ内の原ブロックのサンプル値を表すこともできる。前記参照ブロックは、前記現在ブロックの動きベクトルに基づいて指示されることができる。前記ICパラメータ導出過程では、前記数式1の両辺の差をエラー(E)と見なすことができ、前記エラーを最小化させる条件を満たすICパラメータa、bを求めて、前記参照ブロックに適用できる。すなわち、ICパラメータが導き出された後には、前記参照ブロックの参照サンプルにサンプル単位でスケーリングファクタ及びオフセットを適用して修正された(照度補償された)参照サンプルを導き出すことができる。
前記数式1において求めようとするICパラメータa、bは、結局両辺のエラーを最小化する値であるから、ICパラメータを求めるための数式は、次のように表されることができる。
Figure 2019530345
ここで、E(a,b)は、エラーを最小化するa、b値を表し、ここでiは、各サンプルのインデックシングを、λ(ラムダ)は、制御パラメータ(control parameter)を表す。前記λは、予め決まることができ、または例えば、xに基づいて導き出されることができる。一例として、
Figure 2019530345
のように導き出されることができ、他の例としてλが0に設定されて前記数式2の後段は、省略されることもできる。これは、後述する数式においても同じである。
前記数式2を定理すると、次の通りに表すことができる。
Figure 2019530345
前記数式3に基づいて、前記ICパラメータa、bは、次のように導き出されることができる。
Figure 2019530345
Figure 2019530345
前記数式4中、Nは、正規化パラメータ(normalization parameter)を表す。ここで、Nは、前記数式3の
Figure 2019530345
部分から導き出されることができる。例えば、Nは、現在ブロック(または参照ブロック)のサイズに基づいて決定されることができ、例えば、該当ブロックの幅*広さまたは幅+広さのような値になることができる。または、該当ブロックの幅または広さ+nのような値などになることができる。
前記ICパラメータを導き出すために、上述のように1)参照ブロック内の参照サンプル及び現在ブロックに対応する原(original)ピクチャ内の原ブロックのサンプルが使用されることができ、または2)前記参照ブロックの周辺参照サンプル及び前記現在ブロックの周辺参照サンプルが使用されることもできる。
前記1)のように、参照ブロック内の参照サンプル及び現在ブロックに対応する原ピクチャ内の原ブロックのサンプルに基づいて、前記ICパラメータを求める場合、相対的に正確なパラメータを求めることができる。ただし、デコーダ段では、原ピクチャを獲得できないので、エンコーダ段において前記ICパラメータを求めた後、前記デコーダ段にシグナリングしなければならないから、付加情報のデータ量が増える。
一方、前記2)のように前記参照ブロックの周辺参照サンプル及び前記現在ブロックの周辺参照サンプルに基づいて前記ICパラメータを求める場合、この場合、周辺サンプルの関係を利用して求めたICパラメータを利用するので、前記1)の場合より相対的にICパラメータの正確度が低くなることができるが、デコーダ側面では、エンコーダからICパラメータ(すなわち、a及びb)を明示的に受信しなくても、直接該当パラメータを求めることができるから、コーディング効率の側面において長所がある。
本発明によれば、前記参照ブロックの周辺参照サンプル及び前記現在ブロックの周辺参照サンプルに基づいて前記ICパラメータを求める場合、具体的に次のような周辺サンプルが使用されることができる。
図5は、ICパラメータ導出のために使用される周辺参照サンプルを示す例である。
図5の(a)では、現在ブロック500の左側/上側周辺サンプル及び参照ブロック510の左側/上側周辺サンプルが1サンプル単位(1step)で周辺参照サンプルとして使用される場合を示す。現在ブロック500の左上段(top-left)サンプル位置を(0,0)とするとき、前記左側周辺サンプルの位置は、(-1,0),…,(-1,H-1)を含むことができ、前記上側周辺サンプルの位置は、(0,-1),…,(W-1,-1)を含むことができる。ここで、H及びWは、前記現在ブロックの高さ及び幅を表すことができる。(a)では、前記現在ブロック500の左側/上側境界に隣接した周辺サンプル及び前記参照ブロック510の左側/上側境界に隣接した周辺サンプルが全部周辺参照サンプルとして使用されることができる。
図5の(b)では、現在ブロック550の左側/上側周辺サンプル及び参照ブロック560の左側/上側周辺サンプルが2サンプル単位(2step)で周辺参照サンプルとして使用される場合を示す。(b)では、前記現在ブロック550の左側/上側境界に隣接した周辺サンプル及び前記参照ブロック550の左側/上側境界に隣接した周辺サンプルが2サンプル単位でサブサンプリング(sub-sampling)されて、周辺参照サンプルとして使用されることができる。
一例として、前記(a)及び(b)の区分は、現在ブロックのサイズ(または幅/高さ)に基づいて決定されることができる。例えば、該当ブロックのサイズが8×8より小さいか、または同じである場合、周辺サンプルが1サンプル単位として使用されることができ、該当ブロックのサイズが8×8より大きな場合、周辺サンプルが2サンプル単位として使用されることができる。このようにブロックサイズ(または幅/高さ)に基づいてICパラメータ導出のために使用される周辺サンプルのステップ(step)を適応的に決定することによって、IC性能を維持しながら複雑度を減少させることができる。たとえ前記(b)では2ステップに基づいて説明したが、これは例示に過ぎず、2より大きな値のステップが適用されることができる。または、左側周辺サンプルに適用されるステップサイズと上側周辺サンプルに適用されるステップサイズが異なりうる。前記ステップサイズは、サブサンプリングファクタで表されることができる。
一方、QTBT構造が適用される場合、現在ピクチャのコーディングのために多様な割合の非正方形ブロックが使用されることができ、例えば、次の表のようなサイズのブロックが使用されることができる。
Figure 2019530345
ブロックの種類は、QuadTreeの最小サイズ(min)、最大サイズ(max)、デプス(depth)、BinaryTreeの最小サイズ(min)、最大サイズ(max)、デプス(depth)によって変わることができる。
非正方形ブロックを考慮して、より効率的にICパラメータを導き出すために、例えば次のような周辺参照サンプルが使用されることができる。
図6は、ICパラメータ導出のために使用される周辺参照サンプルを示す例である。
図6を参照すると、現在ブロックの幅と高さが異なる場合、左側と上側に対するステップサイズが異なるように設定されることができる。この場合、幅及び/または高さの大きさに基づいてステップサイズを設定できる。この場合、一例として、ICパラメータ導出のために使用される左側周辺参照サンプルの数と上側周辺参照サンプルの数が同じく導き出されることができる。
例えば、ブロックの幅と高さが異なる場合、min(幅、高さ)>8であると、2ステップ、その他の場合、1ステップに基準ステップを決め、幅が高さより大きな場合、(幅/高さ)の割合で、その反対の場合、(高さ/幅)の割合で基準ステップを調整することができる。例えば、幅が高さより大きな場合、上側ステップに対して、前記基準ステップを(幅/高さ)の割合で増やすことができ、幅が高さより小さな場合、左側ステップに対して、前記基準ステップを(高さ/幅)の割合で増やすことができる。具体的に、例えば、(a)に示すように、基準ステップが1ステップで、ブロックの幅が8、高さが4の場合、左側ステップに対しては、基準ステップを適用し、上側ステップに対しては、基準ステップを(8/4)の割合で増やした2ステップが適用されることができる。また、例えば、(b)に示すように、基準ステップが2ステップで、ブロックの幅が8、高さが4の場合、左側ステップに対しては、基準ステップを適用し、上側ステップに対しては、基準ステップを(8/4)の割合で増やした4ステップが適用されることができる。また、例えば、(c)に示すように、基準ステップが1ステップで、ブロックの幅が8、高さが2の場合、左側ステップに対しては、基準ステップを適用し、上側ステップに対しては、基準ステップを(8/2)の割合で増やした4ステップが適用されることができる。また、例えば、(d)に示すように、基準ステップが2ステップで、ブロックの幅が8、高さが2の場合、左側ステップに対しては、基準ステップを適用し、上側ステップに対しては、基準ステップを(8/2)の割合で増やした8ステップが適用されることができる。
具体的な例として、非正方形ブロックのサイズ、幅及び高さを考慮した左側/上側ステップのサイズは、次のように導き出されることができる。
Figure 2019530345
表2を参照すると、8×16ブロックの場合、幅に対するステップ(すなわち、上側ステップ;ステップX)は1、高さに対するステップ(すなわち、左側ステップ;ステップY)は2になって、合計16個のサンプルを使用してICパラメータが導き出されることができる。ここで、ステップYは、ステップX*16/8に計算されることができる。16×32ブロックの場合、ステップXは2、ステップYは4(ステップX*32/16)になって、合計16個のサンプルを使用してICパラメータが導き出されることができる。16×62ブロックの場合、ステップXは2、ステップYは8(ステップX*64/8)になって、合計16個のサンプルを使用してICパラメータが導き出されることができる。前記のような方法によれば、現在ブロックが非正方形である場合にも、効率的にICパラメータ導出のための周辺サンプルを導き出すことができる。
一方、この場合、ブロックサイズによって特定面(左側または上側)に対しては、少ない数の参照サンプルだけが使用されてパラメータが計算されるので、ICパラメータの正確度が低くなることができ、次のような方法により改善されることができる。
上述のマージモード及びMVPモードにおいて表されたように、周辺ブロックの動きベクトルが現在ブロックの動きベクトル導出のために使用され、前記周辺ブロックは、現在ブロックの左側、上側に位置したブロックだけでなく、現在ブロックの左下側、右上側、左上側に位置したブロックが考慮されることができる。これは、前記現在ブロックの左側、上側ブロックだけでなく、左下側、右上側、左上側ブロックもまた、現在ブロックに対する高い関連性を有することができることを表す。すなわち、左側、上側に隣接した周辺サンプルだけでなく、左下側、右上側、左上側周辺サンプルもまた現在ブロックに対する照度変化を反映できる。したがって、QTBT構造が適用される場合、現在ブロックに隣接した左側周辺サンプル及び上側周辺サンプルだけでなく、その延長線に位置した左下側、右上側及び/または左上側周辺サンプルをさらに使用することによって、ICパラメータの正確性を高めることができる。
図7は、非正方形ブロックに対して使用されるICパラメータ導出のための周辺参照サンプルの例を示す。
図7を参照すると、ブロックの幅と高さが異なる場合、ブロックに隣接した左側周辺サンプル及び上側周辺サンプルだけでなく、max(幅、高さ)長さ分ほど延長線に置かれた左下側周辺サンプルまたは右上側周辺サンプルが周辺参照サンプルとしてさらに使用されることができる。この場合、max(幅、高さ)の値を有する正方形サイズで周辺参照サンプルが延びることができる。
この場合にも、上述したステップサイズに応じてサブサンプリングされたサンプルが使用されることができる。例えば、図7では、ステップX及びステップYが2の場合を例示的に示しており、ただし、ステップサイズは、1、2、4、8等ブロックのサイズ、幅及び/または高さによって多様に設定されることができ、ステップX及びステップYに対して異なって設定されうることは、上述のとおりである。
一方、図7では、幅及び高さのうち、より短い方向に対して周辺参照サンプルを延長して使用する例を説明したが、左側及び上側周辺サンプルを左下側及び右上側周辺参照サンプルまで延長して使用することもできる。
図8は、非正方形ブロックに対して使用されるICパラメータ導出のための右上側及び左下側周辺参照サンプルを含む周辺参照サンプルの例を示す。
図8を参照すると、ブロックの幅と高さが異なる場合、幅及び高さの両方を延長して延長線に置かれた(左下側/右上側)周辺参照サンプルをさらに使用する方法を示す例である。この場合、延びて使用されるサンプルの数は、多様な方法で設定されることができ、例えば幅及び高さの割合またはmin(幅、高さ)に基づいて決定されることができる。
例えば、図8の(a)において、ブロックの幅は8、高さは4であるから、幅と高さの割合が2の場合であり、この場合、min(幅、高さ)の半分である2ほど延長できる。すなわち、ICパラメータ導出のために、2個の左下側周辺参照サンプル及び2個の右上側周辺参照サンプルがさらに使用されることができる。また、例えば、ブロックの幅及び高さの比が4または8の場合には、図8の(b)のように、ICパラメータ導出のための左側周辺参照サンプル及び上側周辺参照サンプルの割合が2になるようにステップを調整した後、幅及び高さを延長できる。2ほど延長する場合、ICパラメータ導出のために2個の左下側周辺参照サンプル及び2個の右上側周辺参照サンプルがさらに使用されることができる。図8では、左、上段の延長周辺参照サンプル数を同様に適用したが、これは例示に過ぎず、ブロックの模様によって左、上段の延長サンプル数が変わることができる。
一方、非正方形ブロックに対してICパラメータ導出のために、左側または上側の少ない数の参照サンプルが使用される場合、これは、むしろエラー成分として作用してICパラメータの正確度を下げることもできる。したがって、ブロックの左側及び上側周辺参照サンプルを利用する代わりに、ブロックの模様によって左側または上側周辺参照サンプルだけを使用することができる。
図9は、ICパラメータ導出のための周辺サンプルの例を示す。
図9を参照すると、正方形ブロックに対しては、左側及び上側周辺参照サンプルを使用してICパラメータを導き出すことができ、幅>高さであるブロックの場合、上側周辺参照サンプルを使用してICパラメータを導き出すことができ、幅<高さであるブロックの場合、左側周辺参照サンプルを使用してICパラメータを導き出すことができる。これを通じてブロックの左側または上側との関連性が高い場合に、関連性が低い面のサンプルを考慮せずにICパラメータを導き出すことができる。このような方法は、ブロックのサイズ及び模様によって制限的に適用されることができ、左側及び/または上側ステップ数を調整して行われることもできる。
一方、現在ブロックに対してICが適用されるかどうかは、ICフラッグに基づいて決定されることができる。ICフラッグは、ICが利用可能な(enable)ブロックに対して送信されることがあり、この場合、ブロックのサイズ及び/またはブロックの幅、高さ、大きさまたは割合に応じて、ICが利用可能かどうか決定されることがある。例えば、ブロックのサイズが16×16より小さな場合、ICが利用可能でないことがある。または、ブロックの模様が非正方形である場合に、ICが利用可能でないことがある。またはブロックの模様が2N×2N、2N×N、N×2Nである場合においてのみICが利用可能であり、その他の場合には、利用可能でないことがある。または、ブロックの模様が2N×2N、2N×N、N×2N、2N×N/2、N/2×2Nである場合においてのみICが利用可能であり、その他の場合には、利用可能でないことがある。あるいは、ブロックのサイズとブロックの模様に応じて、限定的にICフラッグが送信されることができる。ここで、現在ブロックは、QTBT構造に応じるCUに対応でき、Nは、横、縦比を表すために使用されており、 QTBT構造が適用されない場合に使用されるPUのパーティションタイプ(モード)を表さない。また、QTBTのQuadTreeのリーフノードのブロックに対してのみICを適用するかどうかを決定し(すなわち、ICフラッグ送信)、または該当ブロックが正方形ブロックであるときにおいてのみICを適用することも可能である。
図10は、本発明による多様な基準に応じるIC適用を例示的に示す。図10において開示された動作は、コーディング装置によって行われることができ、コーディング装置は、エンコード装置及びデコード装置を含むことができる。
図10を参照すると、コーディング装置は、IC条件をチェックする(S1000)。コーディング装置は、本発明で上述の多様な条件を考慮して適応的に参照周辺サンプルを導き出し(S1010)、これに基づいてICパラメータ(S1020)を計算できる。
i)例えば、コーディング装置は、現在ブロックの幅(W)と高さ(H)が同じ場合、ブロックのサイズに応じてステップサイズを決定することができる。すなわち、W(=H)が16より大きなときには、幅、高さのステップサイズであるステップX、ステップYをそれぞれ2に設定し、ii)W(=H)が16より小さなときには、ステップX、ステップYをそれぞれ1に設定して、周辺参照サンプルを導き出すことができる。
一方、iii)コーディング装置は、幅と高さが異なる場合、仮に幅と高さの割合が2(例:8×4、16×8、32×16等)である場合、幅方向と高さ方向の参照サンプルの数が同一なように、ステップXは2に、ステップYは1に設定でき、または高さと幅の割合が2(例:4×8、8×16、16×32等)である場合、幅方向と高さ方向の参照サンプルの数が同一なように、ステップXは1に、ステップYは2に設定できる。iv)仮に幅と高さの割合が4(例:16×4、32×8等)である場合、ステップXは2に、ステップYは1に設定でき、または仮に高さと幅の割合が4(例:4×16、8×32等)である場合、ステップXは1に、ステップYは2に設定できる。この場合、図8において上述したように左下側周辺参照サンプル及び右上側周辺参照サンプルを含むように、周辺参照サンプルを拡張できる。
コーディング装置は、前記計算されたICパラメータを利用してICを適用する(S1030)。コーディング装置は、前記計算されたICパラメータに基づいてICを適用して、照度補償された予測サンプルを含む予測されたブロックを導き出すことができる。
図11は、本発明による映像エンコードでのインター予測方法の一例を概略的に示す。図11において開示された方法は、図1において開示されたエンコード装置によって行われることができる。具体的に例えば、図11のS1110ないしS1130は、前記エンコード装置の予測部、S1140は、前記エンコード装置のエントロピーエンコード部によって行われることができる。
図11を参照すると、エンコード装置は、現在ブロックに対する参照ブロックを検出する(S1100)。エンコード装置は、動き推定(motion estimation)手順を通じて参照ピクチャ上において最適なRD(rate-distortion)コストを有する参照ブロックをさがすことができる。
エンコード装置は、現在ブロックの動きベクトルを導き出す(S1110)。エンコード装置は、前記現在ブロックの位置及び前記参照ブロックの位置に基づいて、前記参照ブロックを指す前記動きベクトルを導き出すことができる。前記動きベクトルは、現在ブロックのインター予測モード(例:マージモード、MVPモード)に応じて定義された手順に従ってデコード装置にシグナリングされることができる。
エンコード装置は、前記参照ブロックの第1周辺参照サンプル及び前記現在ブロックの第2周辺参照サンプルを導き出し、前記第1周辺参照サンプル及び前記第2周辺参照サンプルを利用して、ICパラメータを導き出す(S1120)。前記ICパラメータは、上述のスケーリングファクタa及びオフセットbを含むことができる。前記ICパラメータは、上述の数式1ないし5に基づいて計算されることができる。前記第1周辺参照サンプル及び前記第2周辺参照サンプルは、図5ないし図9において上述したサンプルを含むことができる。
一例として、前記第1周辺参照サンプルは、前記参照ブロックの左側境界に隣接する第1左側周辺参照サンプル及び前記参照ブロックの上側境界に隣接する第1上側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記現在ブロックの左側境界に隣接する第2左側周辺参照サンプル及び前記現在ブロックの上側境界に隣接する第2上側周辺参照サンプルを含むことができる。この場合、前記第1左側周辺参照サンプルまたは前記第1上側周辺参照サンプルは、ステップサイズ2以上にサブサンプリングされたサンプルであり、前記第2左側周辺参照サンプルまたは前記第2上側周辺参照サンプルは、ステップサイズ2以上にサブサンプリングされたサンプルでありうる。また、前記現在ブロックは、非正方形ブロックであり、前記第1左側周辺参照サンプルに対する第1ステップサイズは、前記第1上側周辺参照サンプルに対する第2ステップサイズと異なり、前記第1ステップサイズは、前記第2左側周辺参照サンプルに対するステップサイズと同一で、前記第2ステップサイズは、前記第2上側周辺参照サンプルに対するステップサイズと同一でありうる。この場合、前記第1左側周辺参照サンプルの数と前記第1上側周辺参照サンプルの数は同一で、前記第2左側周辺参照サンプルの数と前記第2上側周辺参照サンプルの数は同一でありうる。ここで、前記第1ステップサイズ及び前記第2ステップサイズの割合は、前記現在ブロックの高さ及び幅の割合に基づいて決定されることができる。
他の例として、前記第1周辺参照サンプルは、前記参照ブロックの第1左下側周辺参照サンプルまたは前記参照ブロックの第1右上側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記現在ブロックの第2左下側周辺参照サンプルまたは前記現在ブロックの第2右上側周辺参照サンプルを含むことができる。例えば、前記現在ブロックの幅が高さより大きな場合、前記第1周辺参照サンプルは、前記第1左下側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記第2左下側周辺参照サンプルを含むことができる。この場合、前記第1左側周辺参照サンプルの数及び前記第1左下側周辺参照サンプルの数の和は、前記第1上側周辺参照サンプルの数と同一で、前記第2左側周辺参照サンプルの数及び前記第2左下側周辺参照サンプルの数の和は、前記第2上側周辺参照サンプルの数と同一でありうる。また、例えば、前記現在ブロックの幅が高さより小さな場合、前記第1周辺参照サンプルは、前記第1右上側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記第2右上側周辺参照サンプルを含むことができる。この場合、前記第1上側周辺参照サンプルの数及び前記第1右上側周辺参照サンプルの数の和は、前記第1左側周辺参照サンプルの数と同一で、前記第2上側周辺参照サンプルの数及び前記第2右上側周辺参照サンプルの数の和は、前記第2左側周辺参照サンプルの数と同一でありうる。
さらに他の例として、前記第1周辺参照サンプルは、前記参照ブロックの第1左下側周辺参照サンプル及び前記参照ブロックの第1右上側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記現在ブロックの第2左下側周辺参照サンプル及び前記現在ブロックの第2右上側周辺参照サンプルを含むこともできる。この場合、前記第1左下側周辺参照サンプルの数及び前記第1右上側周辺参照サンプルの数は、特定個数で同一で、前記特定個数は、前記現在ブロックの幅及び高さに基づいて決定されることができる。前記特定個数は、例えば、現在ブロックの幅及び高さの最小値の半分に決定されることができる。
さらに他の例として、前記現在ブロックが非正方形ブロックで、前記現在ブロックの幅が高さより大きな場合、前記第1周辺参照サンプルは、前記参照ブロックの左側境界に隣接する第1左側周辺参照サンプルだけを含むことができる。また、前記現在ブロックが非正方形ブロックで前記現在ブロックの幅が高さより小さな場合、前記第1周辺参照サンプルは、前記参照ブロックの上側境界に隣接する第1上側周辺参照サンプルだけを含むことができる。
エンコード装置は、前記計算されたICパラメータに基づいて照度補償(IC)を行って、前記現在ブロックに対する(照度補償された)予測サンプルを導き出す(S1130)。エンコード装置は、前記スケーリングファクタ及びオフセットbを前記参照ブロックの参照サンプルに適用して修正された参照サンプルを導き出すことができ、前記修正された参照サンプルに基づいて前記予測サンプルを獲得できる。
エンコード装置は、予測情報をエンコード及び出力する(S1140)。前記予測情報は、前記現在ブロックの前記動きベクトルに対する情報が含まれることができる。一例として、前記動きベクトルに対する情報は、前記現在ブロックに対するマージインデックスなどを含むことができる。他の例として、前記動きベクトルに対する情報は、MVPフラッグ及びMVD(motion vector difference)情報などを含むことができる。また、前記予測情報は、前記現在ブロックのインター予測モード情報を含むこともできる。また、前記予測情報は、ICフラッグを含むこともできる。前記ICフラッグは、前記現在ブロックに対して照度補償(IC)が利用可能な場合に限ってシグナリングされることができる。例えば、前記現在ブロックがQTBT構造に基づいて分割されたブロックである場合、前記ICが利用可能であるかどうかは、前記現在ブロックのサイズ、幅及び/または高さに基づいて決定されることができる。例えば、前記現在ブロックのサイズが特定サイズより大きいか、または現在ブロックの幅及び高さの比が2または4より小さな場合に限って、前記ICが利用可能であると決定されることができる。
エンコード装置は、前記予測情報をエンコードしてビットストリーム形態で出力できる。前記ビットストリームは、ネットワークまたは格納媒体を介してデコード装置に送信されることができる。
図12は、本発明による映像デコードでのインター予測方法の一例を概略的に示す。図12において開示された方法は、図2において開示されたデコード装置によって行われることができる。具体的な例として、図12のS1200ないしS1230は、前記デコード装置の予測部によって行われることができる。
図12を参照すると、デコード装置は、現在ブロックの動きベクトルを導き出す(S1200)。デコード装置は、ビットストリームを介して獲得した予測情報に基づいて、前記現在ブロックに前記動きベクトルを導き出すことができる。前記ビットストリームは、ネットワークまたは格納媒体を介してエンコード装置から受信されることができる。一例として、デコード装置は、前記現在ブロックの周辺ブロックに基づいてマージ候補リストを生成し、前記予測情報に含まれたマージインデックスを利用して、前記マージ候補リストの中で選択したマージ候補の動きベクトルを前記動きベクトルとして導き出すことができる。他の例として、デコード装置は、前記現在ブロックの周辺ブロックに基づいてMVP候補リストを生成し、前記インター予測情報に含まれたMVPフラッグに基づいて特定MVP候補を選択し、前記選択されたMVP候補の動きベクトルと前記予測情報に含まれたMVD情報から導き出されたMVDを利用して、前記動きベクトルを導き出すことができる。
デコード装置は、前記現在ブロックに対する参照ブロックを導き出す(S1210)。デコード装置は、前記動きベクトルに基づいて前記参照ブロックを導き出すことができる。デコード装置は、参照ピクチャ上において前記現在ブロックの位置を基準に前記動きベクトルが指す参照ブロックを導き出すことができる。
デコード装置は、前記参照ブロックの第1周辺参照サンプル及び前記現在ブロックの第2周辺参照サンプルを導き出し、前記第1周辺参照サンプル及び前記第2周辺参照サンプルを利用して、ICパラメータを導き出す(S1220)。前記ICパラメータは、上述したスケーリングファクタa及びオフセットbを含むことができる。前記ICパラメータは、上述した数式1ないし5に基づいて計算されることができる。前記第1周辺参照サンプル及び前記第2周辺参照サンプルは、図5ないし図9において上述したサンプルを含むことができる。
一例として、前記第1周辺参照サンプルは、前記参照ブロックの左側境界に隣接する第1左側周辺参照サンプル及び前記参照ブロックの上側境界に隣接する第1上側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記現在ブロックの左側境界に隣接する第2左側周辺参照サンプル及び前記現在ブロックの上側境界に隣接する第2上側周辺参照サンプルを含むことができる。この場合、前記第1左側周辺参照サンプルまたは前記第1上側周辺参照サンプルは、ステップサイズ2以上にサブサンプリングされたサンプルであり、前記第2左側周辺参照サンプルまたは前記第2上側周辺参照サンプルは、ステップサイズ2以上にサブサンプリングされたサンプルでありうる。また、前記現在ブロックは、非正方形ブロックであり、前記第1左側周辺参照サンプルに対する第1ステップサイズは、前記第1上側周辺参照サンプルに対する第2ステップサイズと異なり、前記第1ステップサイズは、前記第2左側周辺参照サンプルに対するステップサイズと同一で、前記第2ステップサイズは、前記第2上側周辺参照サンプルに対するステップサイズと同一でありうる。この場合、前記第1左側周辺参照サンプルの数と前記第1上側周辺参照サンプルの数は、同一で、前記第2左側周辺参照サンプルの数と前記第2上側周辺参照サンプルの数は、同一でありうる。ここで、前記第1ステップサイズ及び前記第2ステップサイズの割合は、前記現在ブロックの高さ及び幅の割合に基づいて決定されることができる。
他の例として、前記第1周辺参照サンプルは、前記参照ブロックの第1左下側周辺参照サンプルまたは前記参照ブロックの第1右上側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記現在ブロックの第2左下側周辺参照サンプルまたは前記現在ブロックの第2右上側周辺参照サンプルを含むことができる。例えば、前記現在ブロックの幅が高さより大きな場合、前記第1周辺参照サンプルは、前記第1左下側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記第2左下側周辺参照サンプルを含むことができる。この場合、前記第1左側周辺参照サンプルの数及び前記第1左下側周辺参照サンプルの数の和は、前記第1上側周辺参照サンプルの数と同一で、前記第2左側周辺参照サンプルの数及び前記第2左下側周辺参照サンプルの数の和は、前記第2上側周辺参照サンプルの数と同一でありうる。また、例えば、前記現在ブロックの幅が高さより小さな場合、前記第1周辺参照サンプルは、前記第1右上側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記第2右上側周辺参照サンプルを含むことができる。この場合、前記第1上側周辺参照サンプルの数及び前記第1右上側周辺参照サンプルの数の和は、前記第1左側周辺参照サンプルの数と同一で、前記第2上側周辺参照サンプルの数及び前記第2右上側周辺参照サンプルの数の和は、前記第2左側周辺参照サンプルの数と同一でありうる。
さらに他の例として、前記第1周辺参照サンプルは、前記参照ブロックの第1左下側周辺参照サンプル及び前記参照ブロックの第1右上側周辺参照サンプルを含み、前記第2周辺参照サンプルは、前記現在ブロックの第2左下側周辺参照サンプル及び前記現在ブロックの第2右上側周辺参照サンプルを含むこともできる。この場合、前記第1左下側周辺参照サンプルの数及び前記第1右上側周辺参照サンプルの数は、特定個数で同一であり、前記特定個数は、前記現在ブロックの幅及び高さに基づいて決定されることができる。前記特定個数は、例えば、現在ブロックの幅及び高さの最小値の半分に決定されることができる。
さらに他の例として、前記現在ブロックが非正方形ブロックで前記現在ブロックの幅が高さより大きな場合、前記第1周辺参照サンプルは、前記参照ブロックの左側境界に隣接する第1左側周辺参照サンプルだけを含むことができる。また、前記現在ブロックが非正方形ブロックで前記現在ブロックの幅が高さより小さな場合、前記第1周辺参照サンプルは、前記参照ブロックの上側境界に隣接する第1上側周辺参照サンプルだけを含むことができる。
デコード装置は、前記計算されたICパラメータに基づいて照度補償(IC)を行って、前記現在ブロックに対する(照度補償された)予測サンプルを導き出す(S1230)。エンコード装置は、前記スケーリングファクタ及びオフセットbを前記参照ブロックの参照サンプルに適用して修正された参照サンプルを導き出すことができ、前記修正された参照サンプルに基づいて前記予測サンプルを獲得できる。
一方、前記予測情報は、ICフラッグを含むこともできる。デコード装置は、前記ICフラッグに基づいて前記現在ブロックに前記ICが適用されるかどうかを判断できる。前記ICフラッグは、前記現在ブロックに対して前記ICが利用可能な場合に限ってシグナリングされることができる。例えば、前記現在ブロックがQTBT構造に基づいて分割されたブロックである場合、前記ICが利用可能であるかどうかは、前記現在ブロックのサイズ、幅及び/または高さに基づいて決定されることができる。例えば、前記現在ブロックのサイズが特定サイズより大きいか、または現在ブロックの幅及び高さの比が2または4より小さな場合に限って、前記ICが利用可能であると決定されることができる。
一方、たとえ図示していないが、デコード装置は、前記ビットストリームから前記現在ブロックに対するレジデュアルサンプルに関するレジデュアル情報を受信することができる。前記レジデュアル情報は、レジデュアルサンプルに関する変換係数を含むことができる。
デコード装置は、前記レジデュアル情報に基づいて前記現在ブロックに対する前記レジデュアルサンプル(またはレジデュアルサンプルアレイ)を導き出すことができる。デコード装置は、前記予測サンプルと前記レジデュアルサンプルに基づいて復元サンプルを生成でき、前記復元サンプルに基づいて復元ブロックまたは復元ピクチャを導き出すことができる。以後、デコード装置は、必要によって主観的/客観的画質を向上させるために、デブロッキングフィルタリング及び/またはSAO手順のようなインループフィルタリング手順を前記復元ピクチャに適用できることは、上述したとおりである。
上述した本発明による方法は、ソフトウェア形態で実装されることができ、本発明によるエンコード装置及び/またはデコード装置は、例えばTV、コンピュータ、スマートフォン、セットボックス、ディスプレイ装置などの映像処理を行う装置に含まれることができる。
本発明において実施の形態がソフトウェアにより実装されるとき、上述した方法は、上述した機能を行うモジュール(過程、機能など)により実装されることができる。モジュールは、メモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部または外部にあることができ、よく知られた多様な手段でプロセッサと接続されることができる。プロセッサは、ASIC(Application Specific Integrated Circuit)、他のチップセット、論理回路及び/またはデータ処理装置を含むことができる。メモリは、ROM(read-only memory)、RAM(random access memory)、フラッシュメモリ、メモリカード、格納媒体及び/または他の格納装置を含むことができる。

Claims (15)

  1. デコード装置によって行われるインター予測方法であって、
    現在ブロックの動きベクトルを導き出すステップと、
    前記動きベクトルに基づいて前記現在ブロックに対する参照ブロックを導き出すステップと、
    前記参照ブロックの第1周辺参照サンプル及び前記現在ブロックの第2周辺参照サンプルに基づいて照度補償(Illumination compensation、IC)パラメータを導き出すステップであって、前記ICパラメータは、スケーリングファクタa及びオフセットbを含む、ステップと、
    前記スケーリングファクタ及びオフセットに基づいて前記参照ブロックの参照サンプルに対するICを行って、前記現在ブロックに対する予測サンプルを導き出すステップと、を含むことを特徴とする、インター予測方法。
  2. 前記第1周辺参照サンプルは、前記参照ブロックの左側境界に隣接する第1左側周辺参照サンプル及び前記参照ブロックの上側境界に隣接する第1上側周辺参照サンプルを含み、
    前記第2周辺参照サンプルは、前記現在ブロックの左側境界に隣接する第2左側周辺参照サンプル及び前記現在ブロックの上側境界に隣接する第2上側周辺参照サンプルを含むことを特徴とする、請求項1に記載のインター予測方法。
  3. 前記第1左側周辺参照サンプルまたは前記第1上側周辺参照サンプルは、ステップサイズ2以上にサブサンプリングされたサンプルであり、
    前記第2左側周辺参照サンプルまたは前記第2上側周辺参照サンプルは、ステップサイズ2以上にサブサンプリングされたサンプルであることを特徴とする、請求項2に記載のインター予測方法。
  4. 前記現在ブロックは、非正方形ブロックであり、
    前記第1左側周辺参照サンプルに対する第1ステップサイズは、前記第1上側周辺参照サンプルに対する第2ステップサイズと異なり、
    前記第1ステップサイズは、前記第2左側周辺参照サンプルに対するステップサイズと同一であり、
    前記第2ステップサイズは、前記第2上側周辺参照サンプルに対するステップサイズと同一であることを特徴とする、請求項2に記載のインター予測方法。
  5. 前記第1左側周辺参照サンプルの数と前記第1上側周辺参照サンプルの数は、同一であり、
    前記第2左側周辺参照サンプルの数と前記第2上側周辺参照サンプルの数は、同一であることを特徴とする、請求項4に記載のインター予測方法。
  6. 前記第1ステップサイズ及び前記第2ステップサイズの割合は、前記現在ブロックの高さ及び幅の割合に基づいて決定されることを特徴とする、請求項5に記載のインター予測方法。
  7. 前記第1周辺参照サンプルは、前記参照ブロックの第1左下側周辺参照サンプルまたは前記参照ブロックの第1右上側周辺参照サンプルを含み、
    前記第2周辺参照サンプルは、前記現在ブロックの第2左下側周辺参照サンプルまたは前記現在ブロックの第2右上側周辺参照サンプルを含むことを特徴とする、請求項2に記載のインター予測方法。
  8. 前記現在ブロックの幅が高さより大きな場合、
    前記第1周辺参照サンプルは、前記第1左下側周辺参照サンプルを含み、
    前記第2周辺参照サンプルは、前記第2左下側周辺参照サンプルを含むことを特徴とする、請求項7に記載のインター予測方法。
  9. 前記第1左側周辺参照サンプルの数及び前記第1左下側周辺参照サンプルの数の和は、前記第1上側周辺参照サンプルの数と同一であり、
    前記第2左側周辺参照サンプルの数及び前記第2左下側周辺参照サンプルの数の和は、前記第2上側周辺参照サンプルの数と同じであることを特徴とする、請求項8に記載のインター予測方法。
  10. 前記第1周辺参照サンプルは、前記参照ブロックの第1左下側周辺参照サンプル及び前記参照ブロックの第1右上側周辺参照サンプルを含み、
    前記第2周辺参照サンプルは、前記現在ブロックの第2左下側周辺参照サンプル及び前記現在ブロックの第2右上側周辺参照サンプルを含むことを特徴とする、請求項2に記載のインター予測方法。
  11. 前記第1左下側周辺参照サンプルの数及び前記第1右上側周辺参照サンプルの数は、特定個数で同一であり、
    前記特定個数は、前記現在ブロックの幅及び高さに基づいて決定されることを特徴とする、請求項10に記載のインター予測方法。
  12. 前記特定個数は、幅及び高さの最小値の半分に決定されることを特徴とする、請求項11に記載のインター予測方法。
  13. 前記現在ブロックが非正方形ブロックであり、前記現在ブロックの幅が高さより大きな場合、前記第1周辺参照サンプルは、前記参照ブロックの左側境界に隣接する第1左側周辺参照サンプルだけを含み、
    前記現在ブロックが非正方形ブロックであり、前記現在ブロックの幅が高さより小さな場合、前記第1周辺参照サンプルは、前記参照ブロックの上側境界に隣接する第1上側周辺参照サンプルだけを含むことを特徴とする、請求項1に記載のインター予測方法。
  14. 前記現在ブロックに対する前記ICが利用可能な場合、ICフラッグを受信するステップと、
    前記ICフラッグに基づいて前記現在ブロックに前記ICが適用されるかどうかを判断するステップと、をさらに含み、
    前記現在ブロックは、QTBT(Quad Tree Binary Tree)構造に基づいて分割されたブロックであり、
    前記ICが利用可能かどうかは、前記現在ブロックのサイズに基づいて決定されることを特徴とする、請求項1に記載のインター予測方法。
  15. インター予測のためのデコード装置であって、
    現在ブロックの動きベクトルを導き出し、
    前記動きベクトルに基づいて、参照ピクチャ内に位置する、前記現在ブロックに対する参照ブロックを導き出し、
    前記参照ブロックの第1周辺参照サンプル及び前記現在ブロックの第2周辺参照サンプルに基づいて、スケーリングファクタa及びオフセットbを含む照度補償(Illumination compensation、IC)パラメータを導き出し、
    前記スケーリングファクタ及びオフセットに基づいて前記参照ブロックの参照サンプルに対するICを行って、前記現在ブロックに対する予測サンプルを導き出す予測部と、
    前記参照ピクチャを格納するメモリと、を含むことを特徴とする、デコード装置。
JP2019515789A 2016-09-22 2017-08-31 映像コーディングシステムにおける照度補償基盤インター予測方法及び装置 Active JP6781340B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662398506P 2016-09-22 2016-09-22
US62/398,506 2016-09-22
PCT/KR2017/009547 WO2018056603A1 (ko) 2016-09-22 2017-08-31 영상 코딩 시스템에서 조도 보상 기반 인터 예측 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2019530345A true JP2019530345A (ja) 2019-10-17
JP6781340B2 JP6781340B2 (ja) 2020-11-04

Family

ID=61689614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019515789A Active JP6781340B2 (ja) 2016-09-22 2017-08-31 映像コーディングシステムにおける照度補償基盤インター予測方法及び装置

Country Status (6)

Country Link
US (1) US20190200021A1 (ja)
EP (1) EP3503553A4 (ja)
JP (1) JP6781340B2 (ja)
KR (1) KR20190029737A (ja)
CN (1) CN109792529A (ja)
WO (1) WO2018056603A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022528331A (ja) * 2019-03-25 2022-06-10 オッポ広東移動通信有限公司 画像成分予測方法、エンコーダー、デコーダー及び記憶媒体
US11722694B2 (en) 2018-01-26 2023-08-08 Interdigital Vc Holdings, Inc. Method and apparatus for video encoding and decoding based on a linear model responsive to neighboring samples

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107810635A (zh) * 2015-06-16 2018-03-16 Lg 电子株式会社 图像编译系统中基于照度补偿预测块的方法和设备
CN109845260B (zh) * 2017-02-06 2021-06-22 华为技术有限公司 编解码方法及装置
CN110710215A (zh) * 2017-09-08 2020-01-17 株式会社Kt 视频信号处理方法及装置
WO2019071001A1 (en) * 2017-10-05 2019-04-11 Interdigital Vc Holdings, Inc METHOD AND APPARATUS FOR ADAPTIVE LIGHTING COMPENSATION IN VIDEO ENCODING AND DECODING
EP3468194A1 (en) * 2017-10-05 2019-04-10 Thomson Licensing Decoupled mode inference and prediction
US10715810B2 (en) 2018-02-20 2020-07-14 Qualcomm Incorporated Simplified local illumination compensation
CN112385219B (zh) * 2018-05-10 2024-04-19 三星电子株式会社 用于图像编码的方法和装置以及用于图像解码的方法和装置
US11272201B2 (en) 2019-01-03 2022-03-08 Qualcomm Incorporated Block size restriction for illumination compensation
US11206396B2 (en) * 2019-01-16 2021-12-21 Qualcomm Incorporated Local illumination compensation in video coding
US11172195B2 (en) * 2019-01-26 2021-11-09 Qualcomm Incorporated Excluding intra coded reference samples from local illumination compensation parameter derivation
CN113424531A (zh) 2019-02-08 2021-09-21 交互数字Vc控股公司 用于使用照明补偿进行图片编码和解码的方法和设备
WO2020233600A1 (en) * 2019-05-20 2020-11-26 Beijing Bytedance Network Technology Co., Ltd. Simplified local illumination compensation
WO2020236039A1 (en) * 2019-05-21 2020-11-26 Huawei Technologies Co., Ltd. Method and apparatus of local illumination compensation for inter prediction
US11277616B2 (en) * 2019-06-20 2022-03-15 Qualcomm Incorporated DC intra mode prediction in video coding
CN110446044B (zh) * 2019-08-21 2022-08-09 浙江大华技术股份有限公司 线性模型预测方法、装置、编码器及存储装置
US11438611B2 (en) 2019-12-11 2022-09-06 Hfi Innovation Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
US11445176B2 (en) * 2020-01-14 2022-09-13 Hfi Innovation Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
CN113365077B (zh) * 2020-03-04 2023-02-21 Oppo广东移动通信有限公司 帧间预测方法、编码器、解码器、计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009523355A (ja) * 2006-01-12 2009-06-18 エルジー エレクトロニクス インコーポレイティド 多視点ビデオの処理
JP2014195142A (ja) * 2013-03-28 2014-10-09 Kddi Corp 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7929610B2 (en) * 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
CN101267567A (zh) * 2007-03-12 2008-09-17 华为技术有限公司 帧内预测、编解码方法及装置
KR101560182B1 (ko) * 2008-01-07 2015-10-15 삼성전자주식회사 다시점 비디오 부호화 방법과 그 장치 및 다시점 비디오 복호화 방법과 그 장치
JP2013034163A (ja) * 2011-06-03 2013-02-14 Sony Corp 画像処理装置及び画像処理方法
KR101756843B1 (ko) * 2011-06-28 2017-07-11 삼성전자주식회사 휘도 성분 영상을 이용한 색차 성분 영상의 예측 방법 및 예측 장치
KR101444675B1 (ko) * 2011-07-01 2014-10-01 에스케이 텔레콤주식회사 영상 부호화 및 복호화 방법과 장치
KR20130049526A (ko) * 2011-11-04 2013-05-14 오수미 복원 블록 생성 방법
CN103096055B (zh) * 2011-11-04 2016-03-30 华为技术有限公司 一种图像信号帧内预测及解码的方法和装置
WO2014109547A1 (ko) * 2013-01-08 2014-07-17 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
KR20140138538A (ko) * 2013-05-24 2014-12-04 주식회사 케이티 복수의 레이어를 지원하는 비디오 코딩 방법 및 장치
JP6360053B2 (ja) * 2013-06-18 2018-07-18 シャープ株式会社 照度補償装置、画像復号装置、画像符号化装置
WO2015005418A1 (ja) * 2013-07-10 2015-01-15 Kddi株式会社 動画像符号化装置、動画像復号装置、動画像システム、動画像符号化方法、動画像復号方法、およびプログラム
US9860529B2 (en) * 2013-07-16 2018-01-02 Qualcomm Incorporated Processing illumination compensation for video coding
WO2016154963A1 (en) * 2015-04-01 2016-10-06 Mediatek Inc. Methods for chroma coding in video codec
CN107810635A (zh) * 2015-06-16 2018-03-16 Lg 电子株式会社 图像编译系统中基于照度补偿预测块的方法和设备
GB2596496B (en) * 2015-09-11 2022-05-18 Kt Corp Method and device for processing video signal
US10200719B2 (en) * 2015-11-25 2019-02-05 Qualcomm Incorporated Modification of transform coefficients for non-square transform units in video coding
WO2018021585A1 (ko) * 2016-07-26 2018-02-01 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측 방법 및 장치
US10652575B2 (en) * 2016-09-15 2020-05-12 Qualcomm Incorporated Linear model chroma intra prediction for video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009523355A (ja) * 2006-01-12 2009-06-18 エルジー エレクトロニクス インコーポレイティド 多視点ビデオの処理
JP2014195142A (ja) * 2013-03-28 2014-10-09 Kddi Corp 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
H. LIU ET AL., LOCAL ILLUMINATION COMPENSATION, JPN6020006697, 19 June 2015 (2015-06-19), ISSN: 0004295868 *
JIANLE CHEN ET AL., ALGORITHM DESCRIPTION OF JOINT EXPLORATION TEST MODEL 3, JPN6020006696, 6 July 2016 (2016-07-06), ISSN: 0004295867 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11722694B2 (en) 2018-01-26 2023-08-08 Interdigital Vc Holdings, Inc. Method and apparatus for video encoding and decoding based on a linear model responsive to neighboring samples
JP2022528331A (ja) * 2019-03-25 2022-06-10 オッポ広東移動通信有限公司 画像成分予測方法、エンコーダー、デコーダー及び記憶媒体

Also Published As

Publication number Publication date
EP3503553A4 (en) 2020-07-29
WO2018056603A1 (ko) 2018-03-29
CN109792529A (zh) 2019-05-21
JP6781340B2 (ja) 2020-11-04
KR20190029737A (ko) 2019-03-20
EP3503553A1 (en) 2019-06-26
US20190200021A1 (en) 2019-06-27

Similar Documents

Publication Publication Date Title
JP6781340B2 (ja) 映像コーディングシステムにおける照度補償基盤インター予測方法及び装置
US11570431B2 (en) Method and device for performing image decoding on basis of intra prediction in image coding system
JP6798015B2 (ja) 画像コーディングシステムにおけるブロック分割及びイントラ予測方法並びに装置
US11107253B2 (en) Image processing method, and image decoding and encoding method using same
KR102160667B1 (ko) 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
KR101857108B1 (ko) 영상 부호화/복호화 방법 및 그 장치
US10721479B2 (en) Intra prediction method and apparatus in image coding system
US10750190B2 (en) Video decoding method and device in video coding system
JP2020510374A (ja) 映像コーディングシステムにおける変換方法及びその装置
KR20160106018A (ko) 동영상 복호화 장치
KR20180030791A (ko) 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
US10812796B2 (en) Image decoding method and apparatus in image coding system
US11838546B2 (en) Image decoding method and apparatus relying on intra prediction in image coding system
KR20200072553A (ko) 영상 코딩 시스템에서 크로마 성분의 효율적 변환에 기반한 영상 디코딩 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190411

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201015

R150 Certificate of patent or registration of utility model

Ref document number: 6781340

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250