JP2016502817A - 複数のレイヤをサポートする映像符号化/復号化方法及び装置 - Google Patents

複数のレイヤをサポートする映像符号化/復号化方法及び装置 Download PDF

Info

Publication number
JP2016502817A
JP2016502817A JP2015545367A JP2015545367A JP2016502817A JP 2016502817 A JP2016502817 A JP 2016502817A JP 2015545367 A JP2015545367 A JP 2015545367A JP 2015545367 A JP2015545367 A JP 2015545367A JP 2016502817 A JP2016502817 A JP 2016502817A
Authority
JP
Japan
Prior art keywords
target block
prediction mode
scan order
block
transform coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015545367A
Other languages
English (en)
Other versions
JP6082123B2 (ja
Inventor
チュンソン キム
チュンソン キム
チュンヨン パク
チュンヨン パク
チョルクン キム
チョルクン キム
ヘンドリー ヘンドリー
ヘンドリー ヘンドリー
ピョンムン チョン
ピョンムン チョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2016502817A publication Critical patent/JP2016502817A/ja
Application granted granted Critical
Publication of JP6082123B2 publication Critical patent/JP6082123B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/645Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission by grouping of coefficients into blocks after the transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】複数のレイヤをサポートする映像符号化/復号化方法及び装置を提供する。【解決手段】前記映像復号化方法は、現在レイヤの復号化対象ブロックに対する情報を含むビットストリームを受信するステップと、前記ビットストリームをエントロピーデコーディングして前記復号化対象ブロックに対する変換係数の1次元配列を取得するステップと、前記変換係数の1次元配列をスキャン順序(scan order)によってスキャンして前記変換係数の2次元配列に再整列するステップと、前記変換係数の2次元配列を逆量子化して前記復号化対象ブロックに対する逆量子化された変換係数の2次元配列を取得するステップと、前記復号化対象ブロックに対する予測モードに基づいて前記復号化対象ブロックを予測するステップを含む。【選択図】図8

Description

本発明は、ビデオ圧縮技術に関し、より具体的には、スケーラブルビデオコーディング(Scalable Video Coding;SVC)を実行する方法及び装置に関する。
最近、高解像度、高品質の映像に対する要求が多様な応用分野で増加している。映像が高解像度で高品質になるほど該当映像に対する情報量も共に増加している。情報量の増加によって多様な性能の装置と多様な環境のネットワークが登場している。多様な性能の装置と多様な環境のネットワークが登場するにつれて、同じコンテンツが多様な品質で利用可能になった。
具体的には、端末装置がサポートできる品質の映像が多様化し、構築されたネットワーク環境が多様化することによって、ある環境では一般的な品質の映像を利用し、他の環境ではより高い品質の映像が利用可能になる。
例えば、携帯端末でビデオコンテンツを購買した消費者がホーム内の大画面のディスプレイを介して同じビデオコンテンツをより大きい画面とより高い解像度で鑑賞することができる。
最近、HD(High Definition)解像度を有する放送がサービスされながら、多くのユーザは既に高解像度、高画質の映像に慣れており、サービス提供者とユーザは、HDTVと共にHDTVの4倍以上の解像度を有するUHD(Ultra High Definition)のサービスにも関心を寄せている。
したがって、多様な環境でユーザが要求する映像サービスを品質によって多様に提供するために、高容量ビデオに対する高効率のエンコーディング/デコーディング方法に基づいて映像の品質、例えば、映像の画質、映像の解像度、映像の大きさ、ビデオのフレームレートなどにスケーラビリティを提供することが必要である。
本発明は、スケーラブルビデオエンコーディング/デコーディングにおいて、圧縮効率を上げる方法及び装置を提供する。
本発明は、スケーラブルビデオエンコーディング/デコーディングにおいて、変換係数のスキャン方法及び装置を提供する。
本発明の一実施形態によると、複数のレイヤをサポートする映像復号化方法が提供される。前記映像復号化方法は、現在レイヤの復号化対象ブロックに対する情報を含むビットストリームを受信するステップと、前記ビットストリームをエントロピーデコーディングして前記復号化対象ブロックに対する変換係数の1次元配列を取得するステップと、前記変換係数の1次元配列をスキャン順序(scan order)によってスキャンして前記変換係数の2次元配列に再整列するステップと、前記変換係数の2次元配列を逆量子化して前記復号化対象ブロックに対する逆量子化された変換係数の2次元配列を取得するステップと、前記復号化対象ブロックに対する予測モードに基づいて前記復号化対象ブロックを予測するステップを含む。
前記変換係数の2次元配列に再整列するステップでは、前記復号化対象ブロックに適用された予測モードに基づいて前記スキャン順序を誘導する。
本発明の他の実施形態によると、複数のレイヤをサポートする映像符号化方法が提供される。前記映像符号化方法は、現在レイヤの符号化対象ブロックに対する予測モードに基づいて予測を実行することで予測サンプルを取得するステップと、前記予測サンプルに基づいて取得されたレジデュアルサンプルに変換を実行することで前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップと、前記変換係数の2次元配列をスキャン順序(scan order)によってスキャンして前記変換係数の1次元配列に再整列するステップと、前記変換係数の1次元配列をエントロピーエンコーディングするステップを含む。
前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、前記符号化対象ブロックに適用された予測モードに基づいて前記スキャン順序を決定する。
本発明によると、スケーラブルビデオエンコーディング/デコーディングにおいて、効果的に変換係数をスキャンして再整列することによって変換及び/またはエントロピーコーディングの効率を上げることができる。
本発明によると、スケーラブルビデオエンコーディング/デコーディングにおいて、映像の予測方法によってスキャン順序を決定することができ、それによって、効率的にエンコーディング/デコーディングを実行することができる。
本発明の一実施例によってスケーラビリティをサポートするビデオエンコーディング装置を概略的に示すブロック図である。 本発明の一実施例によってスケーラビリティをサポートするビデオデコーディング装置を概略的に示すブロック図である。 本発明が適用されることができる複数レイヤを利用したスケーラブルビデオコーディング構造の一例を概略的に示す概念図である。 イントラ予測モードの一例を示す。 スキャン順序によるスキャン方法を概略的に説明するための図面である。 本発明が適用されることができるインターレイヤ予測を説明するための図面である。 本発明による複数のレイヤをサポートする映像符号化方法を概略的に示す流れ図である。 本発明による複数のレイヤをサポートする映像復号化方法を概略的に示す流れ図である。
本発明は、多様な変更を加えることができ、多様な実施例を有することができ、特定の実施例を図面に例示して詳細に説明する。しかし、これは本発明を特定の実施形態に対して限定するものではない。本明細書で使用する用語は、単に特定の実施例を説明するために使われたものであり、本発明の技術的思想を限定するために使われるものではない。単数の表現は、文脈上明白に異なる意味ではない限り、複数の表現を含む。本明細書において、「含む」または「有する」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品またはこれらを組合せたものが存在することを指定するものであり、一つまたはそれ以上の他の特徴、数字、ステップ、動作、構成要素、部品またはこれらを組合せたものの存在または付加可能性を予め排除しないと理解しなければならない。
一方、本発明で説明される図面上の各構成は、ビデオエンコーディング装置/デコーディング装置において、互いに異なる特徴的な機能に対する説明の便宜のために独立的に図示したものであり、各構成が互いに別個のハードウェアや別個のソフトウェアで具現されるということを意味しない。例えば、各構成のうち二つ以上の構成が統合されて一つの構成になることもでき、一つの構成が複数の構成に分けることもできる。各構成が統合及び/または分離された実施例も、本発明の本質から外れない限り本発明の権利範囲に含まれる。
以下、添付図面を参照して、本発明の好ましい実施例をさらに詳細に説明する。以下、図面上の同じ構成要素に対しては同じ参照符号を使用し、同じ構成要素に対する重複説明は省略する。
スケーラビリティをサポートするビデオコーディング方法(以下、「スケーラブルコーディング」という)では入力信号をレイヤ別に処理することができる。レイヤによって、入力信号(入力映像)は、解像度(resolution)、フレームレート(frame rate)、ビットデプス(bit−depth)、カラーフォーマット(color format)、アスペクト率(aspect ratio)のうち少なくとも一つが異なる。
本明細書において、スケーラブルコーディングとは、スケーラブルエンコーディングとスケーラブルデコーディングを含む。
スケーラブルエンコーディング/デコーディングではレイヤ間の差を利用して、即ち、スケーラビリティに基づいて、レイヤ間予測を実行することによって、情報の重複送信/処理を減らして圧縮効率を上げることができる。
図1は、本発明の一実施例によってスケーラビリティをサポートするビデオエンコーディング装置を概略的に示すブロック図である。
図1を参照すると、エンコーディング装置100は、レイヤ1に対するエンコーディング部105とレイヤ0に対するエンコーディング部135を含む。
レイヤ0は、ベースレイヤ、参照レイヤまたは下位レイヤであり、レイヤ1は、エンハンスメントレイヤ、現在レイヤまたは上位レイヤである。
レイヤ1のエンコーディング部105は、予測部110、変換/量子化部115、フィルタリング部120、DPB(Decoded Picture Buffer)125、エントロピーコーディング部130、及びMUX(Multiplexer)165を含む。
レイヤ0のエンコーディング部135は、予測部140、変換/量子化部145、フィルタリング部150、DPB155及びエントロピーコーディング部160を含む。
予測部110、140は、入力された映像に対してインター予測とイントラ予測を実行することができる。予測部110、140は、所定の処理単位に予測を実行することができる。予測の実行単位は、コーディングユニット(Coding Unit:CU)であってもよく、予測ユニット(Prediction Unit:PU)であってもよく、変換ユニット(Transform Unit:TU)であってもよい。
例えば、予測部110、140は、CU単位にインター予測を適用するかまたはイントラ予測を適用するかを決定し、PU単位に予測のモードを決定し、PU単位またはTU単位に予測を実行することもできる。実行される予測は、予測ブロックの生成とレジデュアルブロック(レジデュアル信号)の生成を含む。
インター予測を介しては現在ピクチャの以前ピクチャ及び/または以後ピクチャのうち少なくとも一つのピクチャの情報に基づいて予測を実行することで予測ブロックを生成することができる。イントラ予測を介しては現在ピクチャ内のピクセル情報に基づいて予測を実行することで予測ブロックを生成することができる。
インター予測のモードまたは方法として、スキップ(skip)モード、マージ(merge)モード、MVP(Motion Vector Predictor)モード方法などがある。インター予測では、予測対象である現在PUに対して参照ピクチャを選択し、参照ピクチャ内で現在PUに対応する参照ブロックを選択することができる。予測部110、140は、参照ブロックに基づいて予測ブロックを生成することができる。
予測ブロックは、整数サンプル単位に生成することもでき、整数以下ピクセル単位に生成することもできる。このとき、動きベクトルも整数ピクセル単位または整数ピクセル以下の単位に表現することができる。
インター予測において、動き情報、即ち、参照ピクチャのインデックス、動きベクトル、レジデュアル信号などの情報は、エントロピーエンコーディングされてデコーディング装置に伝達される。スキップモードが適用される場合は、レジデュアルを生成、変換、量子化、送信しない。
イントラ予測において、予測モードは、33個の方向性予測モードと少なくとも2個以上の非方向性モードを有することができる。非向性性モードは、DC予測モード及びプレーナモード(Planarモード)を含むことができる。イントラ予測では、参照サンプルにフィルタを適用した後、予測ブロックを生成することもできる。
PUは、多様なサイズ/形態のブロックであり、例えば、インター予測の場合、PUは、2N×2Nブロック、2N×Nブロック、N×2Nブロック、またはN×Nブロック(Nは、整数)などである。イントラ予測の場合、PUは、2N×2NブロックまたはN×Nブロック(Nは、整数)などである。このとき、N×Nブロック大きさのPUは、特定の場合にのみ適用するように設定することができる。例えば、最小大きさCUに対してのみN×Nブロック大きさのPUを利用するように定め、またはイントラ予測に対してのみ利用するように定めることもできる。また、前述した大きさのPU外に、N×mNブロック、mN×Nブロック、2N×mNブロックまたはmN×2Nブロック(m<1)などのPUをさらに定義して使用することもできる。
また、予測部110は、レイヤ0の情報を利用してレイヤ1に対する予測を実行することができる。本明細書では、他のレイヤの情報を利用して現在レイヤの情報を予測する方法を、説明の便宜のために、インターレイヤ予測という。
他のレイヤの情報を利用して予測される(即ち、インターレイヤ予測により予測される)現在レイヤの情報は、テクスチャ、動き情報、ユニット情報、所定のパラメータ(例えば、フィルタリングパラメータ等)などがある。
また、現在レイヤに対する予測に利用される(即ち、インターレイヤ予測に利用される)他のレイヤの情報は、テクスチャ、動き情報、ユニット情報、所定のパラメータ(例えば、フィルタリングパラメータなど)がある。
インターレイヤ予測の一例として、インターレイヤ動き予測は、インターレイヤインター予測とも呼ばれる。インターレイヤインター予測によると、レイヤ0(参照レイヤまたはベースレイヤ)の動き情報を利用してレイヤ1(現在レイヤまたはエンハンスメントレイヤ)の現在ブロックに対する予測を実行することができる。
インターレイヤインター予測を適用する場合は、参照レイヤの動き情報をスケーリングすることもできる。
インターレイヤ予測の他の例として、インターレイヤテクスチャ予測は、インターレイヤイントラ予測またはイントラBL(Base Layer)予測とも呼ばれる。インターレイヤテクスチャ予測は、参照レイヤ内の参照ブロックがイントラ予測により復元された場合に適用することができる。
インターレイヤイントラ予測では、参照レイヤ内の参照ブロックのテクスチャをエンハンスメントレイヤの現在ブロックに対する予測値として使用することができる。このとき、参照ブロックのテクスチャは、アップサンプリングによりスケーリングすることができる。
インターレイヤ予測の他の例であるインターレイヤユニットパラメータ予測では、ベースレイヤのユニット(CU、PU及び/またはTU)情報を誘導してエンハンスメントレイヤのユニット情報として使用し、またはベースレイヤのユニット情報に基づいてエンハンスメントレイヤのユニット情報を決定することができる。
また、ユニット情報は、各ユニットレベルでの情報を含むことができる。例えば、CU情報の場合、パーティション(CU、PU及び/またはTU)に対する情報、変換に対する情報、予測に対する情報、コーディングに対する情報を含むことができる。PU情報の場合、PUパーティションに対する情報、予測に対する情報(例えば、動き情報、予測モードに対する情報等)などを含むことができる。TUに対する情報は、TUパーティションに対する情報、変換に対する情報(変換係数、変換方法等)などを含むことができる。
また、ユニット情報は、処理単位(例えば、CU、PU、TU等)の分割情報のみを含むことができる。
インターレイヤ予測の他の例であるインターレイヤパラメータ予測では、ベースレイヤで使用したパラメータを誘導してエンハンスメントレイヤで再使用するようにし、またはベースレイヤで使用したパラメータに基づいてエンハンスメントレイヤに対するパラメータを予測することができる。
ここでは、インターレイヤ予測の例として、インターレイヤテクスチャ予測、インターレイヤ動き予測、インターレイヤユニット情報予測、インターレイヤパラメータ予測を説明したが、本発明で適用できるインターレイヤ予測は、これに限定されるものではない。
例えば、予測部110は、インターレイヤ予測として、他のレイヤのレジデュアル情報を利用して現在レイヤのレジデュアルを予測し、これに基づいて現在レイヤ内の現在ブロックに対する予測を実行するインターレイヤレジデュアル予測を利用することもできる。
また、予測部110は、インターレイヤ予測として、現在レイヤの復元ピクチャと他のレイヤの復元ピクチャをアップサンプリングまたはダウンサンプリングした映像間の差分(差分映像)映像を利用して現在レイヤ内の現在ブロックに対する予測を実行するインターレイヤ差分予測を実行することもできる。
また、予測部110は、インターレイヤ予測として、他のレイヤのシンタックス情報を利用して現在ブロックのテクスチャを予測し、または生成するインターレイヤシンタックス予測を利用することもできる。このとき、現在ブロックの予測に利用する参照レイヤのシンタックス情報は、イントラ予測モードに対する情報、動き情報などである。
このとき、参照レイヤでイントラ予測モードが適用されたブロック(intra)からはイントラ予測モードを参照し、インター予測モードが適用されたブロック(MV)からは動き情報を参照することで、インターレイヤシンタックス予測を実行することができる。
例えば、参照レイヤがPスライスやBスライスであるが、スライス内の参照ブロックは、イントラ予測モードが適用されたブロックである場合がある。このような場合、インターレイヤシンタックス予測を適用すると、参照レイヤのシンタックス情報のうち、参照ブロックのイントラ予測モードを利用して現在ブロックに対するテクスチャを生成/予測するインターレイヤ予測を実行することができる。
前述したインターレイヤを利用した多様な予測方法は、特定のブロックに対する予測時、複数個が利用されることもできる。例えば、現在ブロックを予測するために、レイヤ0の予測情報を利用しながら、対応するレイヤ0または対応ブロックのユニット情報またはフィルタリングパラメータ情報などを追加的に利用することができる。このようなインターレイヤ予測方法の結合は、本明細書の以下で説明される予測にも適用することができる。
変換/量子化部115、145は、変換ブロック単位にレジデュアルブロックに対する変換を実行することで、変換係数を生成し、変換係数を量子化することができる。
変換ブロックは、サンプルの方形ブロックであって、同じ変換が適用されるブロックである。変換ブロックは、変換ユニット(TU)であってもよく、クワッドツリー(quad tree)構造を有することができる。
変換/量子化部115、145は、レジデュアルブロックに適用された予測モードとブロックの大きさによって変換を実行することで、変換係数の2次元アレイを生成することができる。例えば、レジデュアルブロックにイントラ予測が適用され、ブロックが4×4のレジデュアル配列の場合は、レジデュアルブロックをDST(Discrete Sine Transform)を利用して変換し、その他の場合は、レジデュアルブロックをDCT(Discrete Cosine Transform)を利用して変換することができる。
変換/量子化部115、145は、変換係数を量子化することで、量子化された変換係数を生成することができる。
変換/量子化部115、145は、量子化された変換係数をエントロピーコーディング部130、180に伝達することができる。このとき、変換/量子化部145は、量子化された変換係数の2次元アレイを、所定のスキャン順序によって、1次元アレイに再整列してエントロピーコーディング部130、180に伝達することもできる。また、変換/量子化部115、145は、インター予測のためにレジデュアルと予測ブロックに基づいて生成された復元ブロックを変換/量子化せずに、フィルタリング部120、150に伝達することができる。
一方、変換/量子化部115、145は、必要によって、変換を省略(skip)して量子化のみを実行し、または変換と量子化を両方とも省略することもできる。例えば、変換/量子化部115、165は、特定の予測方法が適用され、または特定の大きさを有するブロック、または特定の予測ブロックが適用された特定の大きさのブロックに対して変換を省略することもできる。
エントロピーコーディング部130、160は、量子化された変換係数に対するエントロピーエンコーディングを実行することができる。エントロピーエンコーディングには、例えば、指数ゴロム(Exponential Golomb)、CABAC(Context−Adaptive Binary Arithmetic Coding)などのようなエンコーディング方法を使用することができる。
フィルタリング部120、150は、デブロッキングフィルタ、ALF(Adaptive Loop Filter)、SAO(Sample Adaptive Offset)を復元されたピクチャに適用することができる。
デブロッキングフィルタは、復元されたピクチャからブロック間の境界に発生した歪曲を除去することができる。ALF(Adaptive Loop Filter)は、デブロッキングフィルタを介してブロックがフィルタリングされた後、復元された映像と原映像を比較した値に基づいてフィルタリングを実行することができる。SAOは、デブロッキングフィルタが適用されたレジデュアルブロックに対し、ピクセル単位に原映像とのオフセット差を復元し、バンドオフセット(Band Offset)、エッジオフセット(Edge Offset)などの形態に適用される。
フィルタリング部120、150は、デブロッキングフィルタ、ALF、SAOを全て適用せずに、デブロッキングフィルタのみを適用し、またはデブロッキングフィルタとALFのみを適用し、またはデブロッキングフィルタとSAOのみを適用することもできる。
DPB125、155は、フィルタリング部120、150から復元ブロックまたは復元ピクチャの伝達を受けて格納することができる。DPB125、155は、復元ブロックまたはピクチャを、インター予測を実行する予測部110、140に提供することができる。
レイヤ0のエントロピーコーディング部160で出力される情報とレイヤ1のエントロピーコーディング部130で出力される情報は、MUX185でマルチプレキシングされてビットストリームで出力されることができる。
一方、ここでは、説明の便宜のために、レイヤ1のエンコーディング部105がMUX165を含むと説明したが、MUXは、レイヤ1のエンコーディング部105及びレイヤ0のエンコーディング部135とは別途の装置またはモジュールであってもよい。
また、図1の例では、スケーラビリティをサポートするビデオエンコーディング装置100がレイヤ別にエンコーディングを実行するために、レイヤ1に対するエンコーディング部105とレイヤ0に対するエンコーディング部135を含むと示したが、本発明がこれに限定されるものではない。スケーラビリティをサポートするビデオエンコーディング装置は、各レイヤに対するエンコーディング部を含まずに、レイヤ1に対するエンコーディング部105(または、レイヤ0に対するエンコーディング部135)に含まれているモジュールのみで構成されてスケーラビリティをサポートするための複数のレイヤに対するエンコーディングを実行することもできる。
図2は、本発明の一実施例によってスケーラビリティをサポートするビデオデコーディング装置を概略的に示すブロック図である。
図2を参照すると、デコーディング装置200は、レイヤ1のデコーディング部210とレイヤ0のデコーディング部250を含む。
レイヤ0は、ベースレイヤ、参照レイヤまたは下位レイヤであり、レイヤ1は、エンハンスメントレイヤ、現在レイヤまたは上位レイヤである。
レイヤ1のデコーディング部210は、エントロピーデコーディング部215、再整列部220、逆量子化部225、逆変換部230、予測部235、フィルタリング部240、メモリ245を含むことができる。
レイヤ0のデコーディング部250は、エントロピーデコーディング部255、再整列部260、逆量子化部265、逆変換部270、予測部275、フィルタリング部280、メモリ285を含むことができる。
エンコーディング装置から映像情報を含むビットストリームが送信されると、DEMUX205は、レイヤ別に情報をデマルチプレキシングして各レイヤ別のデコーディング装置に伝達することができる。
エントロピーデコーディング部215、255は、エンコーディング装置で使用したエントロピーコーディング方式に対応してエントロピーデコーディングを実行することができる。例えば、エンコーディング装置でCABACが使われた場合、エントロピーデコーディング部215、255もCABACを利用してエントロピーデコーディングを実行することができる。
エントロピーデコーディング部215、255でデコーディングされた情報のうち、予測ブロックを生成するための情報は、予測部235、275に提供され、エントロピーデコーディング部215、255でエントロピーデコーディングが実行されたレジデュアル値、即ち、量子化された変換係数は、再整列部220、260に入力することができる。
再整列部220、260は、エントロピーデコーディング部215、255でエントロピーデコーディングされたビットストリームの情報、即ち、量子化された変換係数をエンコーディング装置で再整列した方法に基づいて再整列することができる。
例えば、再整列部220、260は、1次元アレイの量子化された変換係数を再び2次元アレイの係数に再整列することができる。再整列部220、260は、現在ブロック(変換ブロック)に適用された予測モード及び/または変換ブロックの大きさに基づいてスキャニングを実行することで、係数(量子化された変換係数)の2次元アレイを生成することができる。
逆量子化部225、265は、エンコーディング装置で提供された量子化パラメータと再整列されたブロックの係数値に基づいて逆量子化を実行することで、変換係数を生成することができる。
逆量子化部225、265は、所定の条件によってまたはエンコーディング装置での量子化方式によって、エントロピーデコーディングされたレジデュアルを逆量子化せずに、逆変換部230、270に伝達することもできる。
逆変換部230、270は、変換係数に対してエンコーディング装置の変換部が実行した変換に対する逆変換を実行することができる。逆変換部230、270は、エンコーディング装置で実行されたDCT(Discrete Cosine Transform)及びDST(Discrete Sine Transform)に対して逆DCT及び/または逆DSTを実行することができる。
エンコーディング装置において、DCT及び/またはDSTは、予測方法、現在ブロックの大きさ及び予測方向など、複数の情報によって選択的に実行することができ、デコーディング装置の逆変換部230、270は、エンコーディング装置で実行された変換情報に基づいて逆変換を実行することができる。
例えば、逆変換部230、270は、予測モード/ブロック大きさによって逆DCTと逆DSTを適用することができる。例えば、逆変換部230、270は、イントラ予測が適用された4×4ルマブロックに対して逆DSTを適用することもできる。
また、逆変換部230、270は、予測モード/ブロック大きさに関係なく、特定の逆変換方法を固定的に使用することもできる。例えば、逆変換部230、270は、全ての変換ブロックに逆DSTのみを適用することができる。また、逆変換部230、270は、全ての変換ブロックに逆DCTのみを適用することもできる。
逆変換部230、270は、変換係数または変換係数のブロックを逆変換してレジデュアルまたはレジデュアルブロックを生成することができる。
また、逆変換部230、270は、必要によってまたはエンコーディング装置でエンコーディングされた方式によって、変換を省略(skip)することもできる。例えば、逆変換部230、270は、特定の予測方法が適用され、または特定の大きさを有するブロック、または特定の予測ブロックが適用された特定の大きさのブロックに対して変換を省略することもできる。
予測部235、275は、エントロピーデコーディング部215、255から伝達された予測ブロック生成関連情報と、メモリ245、285で提供された以前にデコーディングされたブロック及び/またはピクチャ情報に基づいて現在ブロックに対する予測ブロックを生成することができる。
現在ブロックに対する予測モードがイントラ予測(intra prediction)モードの場合、予測部235、275は、現在ピクチャ内のピクセル情報に基づいて現在ブロックに対するイントラ予測を実行することができる。
現在ブロックに対する予測モードがインター予測(inter prediction)モードの場合、予測部235、275は、現在ピクチャの以前ピクチャまたは以後ピクチャのうち少なくとも一つのピクチャに含まれている情報に基づいて現在ブロックに対するインター予測を実行することができる。インター予測に必要な動き情報の一部または全部は、エンコーディング装置から受信した情報を確認し、これに対応して誘導することができる。
インター予測のモードとしてスキップモードが適用される場合は、エンコーディング装置からレジデュアルが送信されず、予測ブロックを復元ブロックにすることができる。
一方、レイヤ1の予測部235は、レイヤ1内の情報のみを利用してインター予測またはイントラ予測を実行することもでき、他のレイヤ(レイヤ0)の情報を利用してインターレイヤ予測を実行することもできる。
例えば、レイヤ1の予測部235は、レイヤ1の動き情報、レイヤ1のテクスチャ情報、レイヤ1のユニット情報、レイヤ1のパラメータ情報のうち一つを利用して現在ブロックに対する予測を実行することができる。また、レイヤ1の予測部235は、レイヤ1の動き情報、レイヤ1のテクスチャ情報、レイヤ1のユニット情報、レイヤ1のパラメータ情報のうち複数の情報を利用して現在ブロックに対する予測を実行することもできる。
レイヤ1の予測部235は、レイヤ0の予測部275からレイヤ1の動き情報の伝達を受けて動き予測を実行することができる。インターレイヤ動き予測をインターレイヤインター予測とも呼ばれる。インターレイヤ動き予測により、参照レイヤ(ベースレイヤ)の動き情報を利用して現在レイヤ(エンハンスメントレイヤ)の現在ブロックに対する予測を実行することができる。予測部235は、必要な場合、参照レイヤの動き情報をスケーリングして利用することもできる。
レイヤ1の予測部235は、レイヤ0の予測部275からレイヤ1のテクスチャ情報の伝達を受けてテクスチャ予測を実行することができる。テクスチャ予測は、インターレイヤイントラ予測またはイントラBL(Base Layer)予測とも呼ばれる。テクスチャ予測は、参照レイヤの参照ブロックがイントラ予測により復元された場合に適用されることができる。インターレイヤイントラ予測では、参照レイヤ内の参照ブロックのテクスチャをエンハンスメントレイヤの現在ブロックに対する予測値として使用することができる。このとき、参照ブロックのテクスチャは、アップサンプリングによりスケーリングすることができる。
レイヤ1の予測部235は、レイヤ0の予測部275からレイヤ1のユニットパラメータ情報の伝達を受けてユニットパラメータ予測を実行することができる。ユニットパラメータ予測により、ベースレイヤのユニット(CU、PU及び/またはTU)情報がエンハンスメントレイヤのユニット情報として使われ、またはベースレイヤのユニット情報に基づいてエンハンスメントレイヤのユニット情報を決定することができる。
レイヤ1の予測部235は、レイヤ0の予測部275からレイヤ1のフィルタリングに対するパラメータ情報の伝達を受けてパラメータ予測を実行することができる。パラメータ予測により、ベースレイヤで使用したパラメータを誘導してエンハンスメントレイヤで再使用し、またはベースレイヤで使用したパラメータに基づいてエンハンスメントレイヤに対するパラメータを予測することができる。
前述したインターレイヤを利用した多様な予測方法は、特定のブロックに対する予測時、複数個を利用することもできる。例えば、現在ブロックを予測するために、レイヤ0の予測情報を利用しながら、対応されるレイヤ0または対応ブロックのユニット情報またはフィルタリングパラメータ情報などを追加的に利用することができる。このようなインターレイヤ予測方法の結合は、本明細書の以下で説明される予測にも適用することができる。
加算器290、295は、予測部235、275で生成された予測ブロックと逆変換部230、270で生成されたレジデュアルブロックとを利用して復元ブロックを生成することができる。この場合、加算器290、295は、復元ブロックを生成する別途のユニット(復元ブロック生成部)と見ることができる。
加算器290、295で復元されたブロック及び/またはピクチャは、フィルタリング部240、280に提供することができる。
フィルタリング部240、280は、復元されたブロック及び/またはピクチャにデブロッキングフィルタリング、SAO(Sample Adaptive Offset)及び/またはALFなどを適用することができる。
フィルタリング部240、280は、デブロッキングフィルタ、ALF、SAOを全て適用せずに、デブロッキングフィルタのみを適用し、またはデブロッキングフィルタとALFのみを適用し、またはデブロッキングフィルタとSAOのみを適用することもできる。
図2の例を参照すると、レイヤ1のフィルタリング部240は、レイヤ1の予測部235及び/またはレイヤ1のフィルタリング部280から伝達されるパラメータ情報を利用して復元されたピクチャに対するフィルタリングを実行することもできる。例えば、レイヤ1のフィルタリング部240は、レイヤ0で適用されたフィルタリングのパラメータから予測されたパラメータを利用してレイヤ1に対するまたはレイヤ間のフィルタリングを適用することができる。
メモリ245、285は、復元されたピクチャまたはブロックを格納して参照ピクチャまたは参照ブロックとして使用可能にする。メモリ245、285は、格納された復元ピクチャを所定の出力部(図示せず)またはディスプレイ(図示せず)を介して出力することもできる。
図2の例では、再整列部、逆量子化部、逆変換部などに分けて説明したが、図1のエンコーディング装置のように、逆量子化/逆変換部の一モジュールで再整列、逆量子化、逆変換を順序通りに実行するようにデコーディング装置を構成することもできる。
また、図2の例では、スケーラビリティをサポートするビデオデコーディング装置200がレイヤ別にデコーディングを実行するために、レイヤ1のデコーディング部210とレイヤ0のデコーディング部250を含むと示したが、本発明がこれに限定されるものではない。スケーラビリティをサポートするビデオデコーディング装置は、各レイヤに対するデコーディング部を含まずに、レイヤ1のデコーディング部210(または、レイヤ0のデコーディング部250)に含まれているモジュールのみで構成されてスケーラビリティをサポートするための複数のレイヤに対するデコーディングを実行することもできる。
図1及び図2の例では、予測部として説明したが、発明の理解を容易にするために、レイヤ1の予測部は、他のレイヤ(レイヤ0)の情報を利用して予測を実行するインターレイヤ予測部と、他のレイヤ(レイヤ0)の情報を利用せずに予測を実行するインター/イントラ予測部と、を含むと見ることもできる。
図3は、本発明が適用されることができる複数レイヤを利用したスケーラブルビデオコーディング構造の一例を概略的に示す概念図である。図3において、GOP(Group of Picture)は、ピクチャ群、即ち、ピクチャのグループを示す。
映像データを送信するためには送信媒体が必要であり、その性能は、多様なネットワーク環境によって送信媒体別に異なる。このような多様な送信媒体またはネットワーク環境への適用のために、スケーラブルビデオコーディング方法を提供することができる。
スケーラビリティをサポートするビデオコーディング方法(以下、「スケーラブルコーディング」または「スケーラブルビデオコーディング」という)は、レイヤ(または、階層、layer)間のテクスチャ情報、動き情報、残余信号などを活用してレイヤ間重複性を除去することで、エンコーディング及びデコーディング性能を高めるコーディング方法である。スケーラブルビデオコーディング方法は、送信ビット率、送信エラー率、システムリソースなどの周辺条件によって、空間的(spatial)、時間的(temporal)、画質的(または、品質的、quality)観点で多様なスケーラビリティを提供することができる。
スケーラブルビデオコーディングは、多様なネットワーク状況に適用可能なビットストリームを提供することができるように、複数階層(multiple layers)構造を使用して実行することができる。例えば、スケーラブルビデオコーディング構造は、一般的な映像デコーディング方法を利用して映像データを圧縮して処理するベースレイヤ(または、基本階層、base layer)を含むことができ、ベースレイヤのデコーディング情報及び一般的な映像デコーディング方法を共に使用して映像データを圧縮処理するエンハンスメントレイヤ(または、向上階層、enhancement layer)を含むことができる。
ここで、レイヤ(layer)は、空間(spatial、例えば、映像の大きさ)、時間(temporal、例えば、デコーディング順序、映像出力順序、フレームレート)、画質、複雑度などを基準にして区分される映像及びビットストリーム(bitstream)の集合を意味する。
本明細書において、ベースレイヤ(base layer)は、基本階層または下位階層(lower layer)とも呼ばれる。また、エンハンスメントレイヤ(enhancement layer)は、向上階層または上位階層(higher layer)とも呼ばれる。下位階層は、特定階層より低いスケーラビリティをサポートする階層を意味し、上位階層は、特定階層より高いスケーラビリティをサポートする階層を意味する。特定階層が符号化または復号化時に参照する階層は、参照階層とも呼ばれる。
図3を参照すると、例えば、ベースレイヤは、SD(standard definition)、15Hzのフレーム率、1Mbpsビット率により定義することができ、第1のエンハンスメントレイヤは、HD(high definition)、30Hzのフレーム率、3.9Mbpsビット率により定義することができ、第2のエンハンスメントレイヤは、4K−UHD(ultra high definition)、60Hzのフレーム率、27.2Mbpsビット率により定義することができる。
前記フォーマット(format)、フレーム率、ビット率等は、一つの実施例に過ぎず、必要によって決めることができる。また、使われる階層の数も本実施例に限定されるものではなく、状況によって決めることができる。例えば、送信帯域幅が4Mbpsの場合、前記第1のエンハンスメントレイヤHDのフレームレートを減らして15Hz以下に送信することができる。
スケーラブルビデオコーディング方法は、前記図3の実施例で詳述した方法により時間的、空間的、画質的スケーラビリティを提供することができる。
本明細書において、スケーラブルビデオコーディングは、エンコーディング観点ではスケーラブルビデオエンコーディング、デコーディング観点ではスケーラブルビデオデコーディングと同じ意味を有する。
一方、前述したように、エンコーディング装置は、クワッドツリー構造(quad tree structure)を有する変換ブロック単位に変換を実行する。変換対象ブロックに適用された予測モードと変換ブロックの大きさに基づいてどのような変換が適用されるかを決定することができる。例えば、現在ブロック(変換ブロック)に適用された予測モードがイントラ予測モードかまたはインター予測モードか、そして現在ブロック(変換ブロック)の大きさによって適用する変換方式が異なる。
エンコーディング装置は、2次元の量子化された情報(例えば、2次元の量子化された変換係数配列)をスキャニングして1次元の量子化された変換係数配列に再整列することができる。エンコーディング装置は、1次元の量子化された変換係数配列をエントロピーエンコーディングしてデコーディング装置に送信することができる。
デコーディング装置は、エンコーディング装置から受信した情報をエントロピーデコーディングして1次元の量子化された変換係数配列を生成することができる。デコーディング装置は、1次元の量子化された変換係数配列をスキャニングして2次元の量子化された変換係数配列に再整列することができる。デコーディング装置は、2次元の量子化された変換係数配列を逆量子化して変換係数ブロックを生成することができる。
即ち、エンコーディング装置で実行する再整列は、スキャニング処理対象ブロック(例えば、変換ブロック)のサンプル(ピクセル)位置に対応して配列された2次元の量子化された変換係数をスキャン順序(scan order)によってスキャニングして1次元配列の量子化された変換係数で構成することができる。
デコーディング装置で実行する再整列は、1次元配列の量子化された変換係数をスキャン順序によってスキャニングしてスキャニング処理対象ブロック(例えば、変換ブロック)のサンプル(ピクセル)位置に対応する2次元配列の量子化された変換係数で構成することができる。
スキャニングは、変換ブロックの大きさ、スキャン順序、及びスキャン開始位置のうち少なくとも一つにより決定することができる。
例えば、同じ変換を実行するサンプルのブロックである変換ブロックに対して、
(1)変換ブロックに適用された予測モードがイントラ予測モードであり、変換ブロックの大きさが4×4の場合、または(2)変換ブロックに適用された予測モードがイントラ予測モードであり、変換ブロックの大きさが8×8であり、変換ブロックがルマサンプルに対する変換ブロックの場合、
イントラ予測モードが6以上14以下の場合、スキャン順序は垂直スキャン順序(vertical scan order)であり、イントラ予測モードが22以上30以下の場合、スキャン順序は水平スキャン順序(horizonatal scan order)である。イントラ予測モードが0以上5以下、または15以上21以下、または31以上34以下の場合、スキャン順序は右上向対角スキャン順序(up−right diagonal scan order)である。
また、前記の場合ではなく、変換ブロックに適用された予測モードがインター予測モードの場合、スキャン順序は右上向対角スキャン順序である。また、変換ブロックに適用された予測モードがイントラ予測モードであり、変換ブロックの大きさが8×8より大きい場合(例えば、変換ブロックの大きさが16×16、32×32の場合)、スキャン順序は右上向対角スキャン順序である。
図4は、イントラ予測モードの一例を示す。各イントラ予測モードには互いに異なるモード番号を割り当てることができる。
図4に示すように、6以上14以下のイントラ予測モードは、水平方向の予測モードであり、22以上30以下のイントラ予測モードは、垂直方向の予測モードである。6以上14以下または22以上30以下のイントラ予測モードでない場合は、非方向性の予測モード、または水平方向でない予測モード、または垂直方向でない予測モードである。
したがって、前記例では、(1)変換ブロックに適用された予測モードがイントラ予測モードの場合、(i)変換ブロックの大きさが4×4であり、または(ii)変換ブロックの大きさが8×8であり、変換ブロックがルマサンプルに対するものの時、イントラ予測モードが水平方向の予測モードであると、垂直スキャン順序が適用され、イントラ予測モードが垂直方向の予測モードであると、水平方向のスキャン順序が適用される。(2)その他の場合、即ち、イントラ予測モードが非方向性、または水平方向でない予測モード、または垂直方向でない予測モードの場合、右上向対角スキャン順序が適用される。
垂直スキャン順序が適用されると、エンコーディング装置では、変換ブロック内の量子化された変換係数を垂直方向にスキャンする。
即ち、垂直スキャン順序の場合、エンコーディング装置は、スキャン対象ブロック(例えば、変換ブロック)の最上側行に位置する量子化された変換係数から同じ列に沿って下方に量子化された変換係数をスキャンすることができる。このとき、スキャンは、スキャン対象ブロックの最も左側列から順序通りに右側列に対して進行することができる。または、スキャンは、スキャン対象ブロックの最も右側列から順序通りに左側列に対して進行することもできる。
2次元配列のスキャン対象ブロック(例えば、変換ブロック)でスキャンされた量子化された変換係数は、スキャンされた順序によって1次元の量子化された変換係数配列に再整列することができる。
垂直スキャン順序が適用されると、デコーディング装置では、量子化された変換係数をスキャンして変換ブロック内で垂直方向に再整列することができる。
即ち、デコーディング装置は、1次元の変換係数を順序通りにスキャンし、垂直スキャン順序によって2次元配列に再配置することができる。それによって、量子化された変換係数で構成された変換ブロックが生成されることができる。
垂直スキャン順序によって、2次元配列(変換ブロック)の最上側行から同じ列に沿って下方に量子化された変換係数を配置することができる。再配置は、エンコーディング装置で実行した順序によって、2次元配列の最も左側列から順序通りに右側列に対して進行することもでき、最も右側列から順序通りに左側列に対して進行することもできる。
水平スキャン順序が適用されると、エンコーディング装置では、変換ブロック内の量子化された変換係数を水平方向にスキャンする。
即ち、水平スキャン順序の場合、エンコーディング装置は、スキャン対象ブロック(例えば、変換ブロック)の最も左側列に位置する量子化された変換係数から同じ行に沿って右方に量子化された変換係数をスキャンすることができる。このとき、スキャンは、スキャン対象ブロックの最上側行から順序通りに下側行に対して進行することができる。または、スキャンは、スキャン対象ブロックの最下側行から順序通りに上側行に対して進行することもできる。
2次元配列のスキャン対象ブロック(例えば、変換ブロック)でスキャンされた量子化された変換係数は、スキャンされた順序によって1次元の量子化された変換係数配列に再整列することができる。
水平スキャン順序が適用されると、デコーディング装置では、量子化された変換係数をスキャンして変換ブロック内で水平方向に再整列することができる。
即ち、デコーディング装置は、1次元の変換係数を順序通りにスキャンし、水平スキャン順序によって2次元配列に再配置することができる。それによって、量子化された変換係数で構成された変換ブロックを生成することができる。
水平スキャン順序によって、2次元配列(変換ブロック)の最も左側列から同じ行に沿って右方に量子化された変換係数を配置することができる。再配置は、エンコーディング装置で実行された順序によって、2次元配列の最上側行から順序通りに下側行に対して進行することもでき、最下側行から順序通りに上側行に対して進行することもできる。
右上向対角スキャン順序が適用されると、エンコーディング装置では、変換ブロック内の量子化された変換係数を右上向対角方向にスキャンすることができる。
即ち、右上向対角スキャン順序の場合、エンコーディング装置は、スキャン対象ブロック(例えば、変換ブロック)内の量子化された変換係数の対角配列に対して最も左下側の量子化された変換係数から最も右上側の量子化された変換係数までスキャンすることができる。対角配列のスキャンは、スキャン対象ブロック内の左上側対角配列から順序通りに右下側に対して進行することもでき、スキャン対象ブロック内の右下側対角配列から順序通りに左上側に対して進行することもできる。
2次元配列のスキャン対象ブロック(例えば、変換ブロック)でスキャンされた量子化された変換係数は、スキャンされた順序によって1次元の量子化された変換係数配列に再整列することができる。
右上向対角スキャン順序が適用されると、デコーディング装置では、量子化された変換係数をスキャンして変換ブロック内で右上向対角方向に再整列することができる。
即ち、デコーディング装置は、1次元の変換係数を順序通りにスキャンし、右上向対角スキャン順序によって2次元配列に再配置することができる。それによって、量子化された変換係数で構成された変換ブロックを生成することができる。
右上向対角スキャン順序によって、2次元配列(変換ブロック)の対角配列で左下側から同じ対角配列に沿って右上側に量子化された変換係数を再配置することができる。再配置は、エンコーディング装置で実行した順序によって、2次元配列の左上側対角配列から順序通りに右下側対角配列に対して進行することもでき、右下側対角配列から順序通りに左上側対角配列に対して進行することもできる。
図5は、スキャン順序によるスキャン方法を概略的に説明するための図面である。
図5の(a)は、n×m(n及びmは、整数)大きさの変換ブロック内に配置された量子化された変換係数の2次元配列を概略的に示す。
図5の(a)を参照すると、各サンプル(ピクセル)位置に対応して量子化された変換係数Cが配列されている。例えば、変換ブロック内のa番目の行及びb番目の列の位置に変換係数Ca,bが配列されている。
図5の(b)は、水平スキャン順序が適用された場合、図5の(a)に示す2次元の量子化された変換係数配列に対応する1次元配列の例を示す。
図5の(a)及び図5の(b)を参照すると、水平スキャン順序が適用される場合、エンコーディング装置は、n×m大きさの変換ブロック内の1番目の行でC0,0→C0,1→...→C0,n-1の順序に量子化された変換係数をスキャンし、次の行でC1,0→C1,1→...→C1,n-1の順序に量子化された変換係数をスキャンすることができる。行毎に平行にスキャンを進行し、一つの行で水平スキャンが終了すると、次の行で水平スキャンを進行することができる。
水平スキャン順序が適用される場合、デコーディング装置は、n×m長さの量子化された変換係数配列から順序通りに読み込んだ量子化された変換係数を水平スキャン順序によってn×m大きさの変換ブロック内の2次元配列に配置することができる。
例えば、図5の(b)において、量子化された変換係数列の端から前方に(即ち、Cm-1,n-1→C0,0方向に)スキャンする場合、デコーディング装置は、水平スキャン順序によって、図5の(a)の2次元配列のようにCm-1,n-1→Cm-1,n-2→...→Cm-1,1→Cm-1,0の位置に順序通りに配列し、Cm-1,0の次にスキャンされるn個の量子化された変換係数は、行を変えて(上側行に変えて)右側から順序通りに配列することができる。続く量子化された変換係数のスキャン及び再整列によりC0,n-1→...→C0,2→C0,1→C0,0までスキャン及び再整列されてn×m大きさの量子化された変換係数の2次元配列(例えば、変換ブロック)が生成されることができる。
図5の(b)において、量子化された変換係数列の前から後方に(即ち、C0,0→Cm-1,n-1方向に)スキャンする場合、デコーディング装置は、水平スキャン順序によって、図5の(a)の2次元配列のようにC0,0→C0,1→...→C0,n-1の位置に順序通りに配列し、C0,n-1の次にスキャンされるn個の量子化された変換係数は、行を変えて(下側行に変えて)左側から順序通りに配列することができる。続く量子化された変換係数のスキャン及び再整列によりCm-1,0→Cm-1,1→Cm-1,2→...→Cm-1,n-1までスキャン及び再整列されてn×m大きさの量子化された変換係数の2次元配列(例えば、変換ブロック)を生成することができる。
図5の(c)は、垂直スキャン順序が適用された場合、図5の(a)に示す2次元の量子化された変換係数配列に対応する1次元配列の例を示す。
図5の(a)及び図5の(c)を参照すると、垂直スキャン順序が適用される場合、エンコーディング装置は、n×m大きさの変換ブロック内の1番目の列でC0,0→C1,0→...→Cm-1,0の順序に量子化された変換係数をスキャンし、次の列でC0,1→C1,1→...→Cm-1,1の順序に量子化された変換係数をスキャンすることができる。列毎に垂直にスキャンを進行し、一つの列で垂直スキャンが終了すると、次の列で垂直スキャンを進行することができる。
垂直スキャン順序が適用される場合、デコーディング装置は、n×m長さの量子化された変換係数配列から順序通りに読み込んだ量子化された変換係数を垂直スキャン順序によってn×m大きさの変換ブロック内の2次元配列に配列する。
例えば、図5の(c)において、量子化された変換係数列の端から前方に(即ち、Cm-1,n-1→C0,0方向に)スキャンする場合、デコーディング装置は、垂直スキャン順序によって、図5の(a)の2次元配列のようにCm-1,n-1→Cm-2,n-1→...→C1,n-1→C0,n-1の位置に順序通りに配列し、C0,n-1の次にスキャンされるm個の量子化された変換係数は、列を変えて(左側列に変えて)下側から順序通りに配列することができる。続く量子化された変換係数のスキャン及び再整列によりCm-1,0→...→C2,0→C1,0→C0,0までスキャン及び再整列されてn×m大きさの量子化された変換係数の2次元配列(例えば、変換ブロック)を生成することができる。
図5の(c)において、量子化された変換係数列の前から後方に(即ち、C0,0→Cm-1,n-1方向に)スキャンする場合、デコーディング装置は、垂直スキャン順序によって、図5の(a)の2次元配列のようにC0,0→C1,0→C2,0→...→Cm-1,0の位置に順序通りに配列し、Cm-1,0の次にスキャンされるm個の量子化された変換係数は、列を変えて(右側列に変えて)上側から順序通りに配列することができる。続く量子化された変換係数のスキャン及び再整列によりC0,n-1→C1,n-1→C2,n-1→...→Cm-1,n-1までスキャン及び再整列されてn×m大きさの量子化された変換係数の2次元配列(例えば、変換ブロック)を生成することができる。
図5の(d)は、右上向対角スキャン順序が適用された場合、図5の(a)に示す2次元の量子化された変換係数配列に対応する1次元配列の例を示す。
図5の(a)及び図5の(d)を参照すると、右上向対角スキャン順序が適用される場合、エンコーディング装置は、n×m大きさの変換ブロック内の対角列順序によって1番目の対角列の量子化された変換係数を右上向にスキャンし、順序通りに次の対角列の量子化された変換係数を右上向にスキャンする。例えば、図5の(a)を参照すると、変換ブロック内の1番目の対角列には量子化された変換係数がC0,0しかないため、C0,0をスキャンし、次の対角列でC1,0→C0,1の順序に量子化された変換係数をスキャンし、その次の対角列でC2,0→C1,1→C0,2の順序に量子化された変換係数をスキャンすることができる。順序通りに対角列の量子化された変換係数がスキャンされて最後の量子化された変換係数Cm-1,n-1がスキャンされる。
エンコーディング装置は、右上向対角スキャン順序によって量子化された変換係数のスキャンを実行することで、図5の(d)のような1次元の量子化された変換係数列を生成する。1次元の量子化された変換係数列は、前述した右上向対角スキャン順序によって、先にスキャンされた係数を前方に位置させると、図示されているように(Cm-1,n-1...C0,21,12,00,11,00,0)の順序を有する。
右上向対角スキャン順序が適用される場合、デコーディング装置は、n×m長さの量子化された変換係数配列から順序通りに読み込んだ量子化された変換係数を右上向対角スキャン順序によってn×m大きさの変換ブロック内の2次元配列に配列する。
例えば、図5の(d)のような量子化された変換係数の1次元配列を量子化された変換係数列の前から後方に(即ち、C0,0→Cm-1,n-1方向に)スキャンする場合、デコーディング装置は、スキャンした量子化された変換係数を右上向対角スキャン順序によって2次元配列の対角列に沿って配置することができる。スキャンされた変換係数は、2次元配列の最も左上側に位置する対角列に先に配置することができ、右下側方向の対角列に順序通りに配置することができる。各対角列では、左下側から右上側に量子化された変換係数が配置することができる。
即ち、図5の(a)の2次元配列を参照すると、C0,0→C1,0→C0,1→C2,0→C1,1→C0,2→...→Cm-1,n-2→Cm-2,n-1→Cm-1,n-1の順序通りに配列することができる。
図5の(d)において、量子化された変換係数列の端から前方に(即ち、Cm-1,n-1→C0,0方向に)スキャンする場合、デコーディング装置は、スキャンした量子化された変換係数を右上向対角スキャン順序によって2次元配列の対角列に沿って配置することができる。スキャンされた変換係数は、2次元配列の最も右下側に位置する対角列に先に配置することができ、左上側方向の対角列に順序に配置することができる。各対角列では、左下側から右上側に量子化された変換係数が配置することができる。
即ち、図5の(a)の2次元配列を参照すると、Cm-1,n-1→Cm-1,n-2→Cm-2,n-1→...→C2,0→C1,1→C0,2→C1,0→C0,1→C0,0の順序通りに配列することができる。
図5の例において、m=nである場合は、正方形のブロック(例えば、変換ブロック)単位に変換を実行する場合を意味し、n≠mである場合は、非正方形のブロック(例えば、変換ブロック)単位に変換を実行する場合を意味する。
前述したような変換係数のスキャンは、2次元の量子化された変換係数配列(例えば、変換ブロック)内のサブブロック単位に実行することもできる。
例えば、エンコーディング装置は、変換係数配列内のサブブロックに対して一サブブロック内の量子化された変換係数を順序通りにスキャンして再整列した後、次のサブブロック内の量子化された変換係数を順序通りにスキャンして再整列することによって、1次元の量子化された変換係数配列を生成することができる。サブブロック内では前述した水平スキャン順序、垂直スキャン順序、右上向対角スキャン順序によって量子化された変換係数をスキャンすることができる。
デコーディング装置は、1次元の変換係数配列をサブブロック単位にスキャン及び再整列することができる。例えば、デコーディング装置は、一サブブロック(例えば、第1のサブブロック)に対して量子化された変換係数をスキャンし、全体変換係数の2次元配列で前記第1のサブブロックの位置に量子化された変換係数を再整列して2次元配列を生成した後、次のサブブロック(例えば、第2のサブブロック)に対して量子化された変換係数をスキャンし、全体変換係数の2次元配列で前記第2のサブブロックの位置に量子化された変換係数を再整列する方式に変換係数の2次元配列(例えば、変換ブロック)を生成することができる。このとき、サブブロック内では詳述した水平スキャン順序、垂直スキャン順序、右上向対角スキャン順序によって量子化された変換係数を再整列することができる。
サブブロックのスキャン順序とサブブロック内の量子化された変換係数のスキャン順序は、同じであってもよく、異なってもよい。例えば、サブブロックが右上向対角スキャン順序にスキャンまたは再整列する場合、サブブロック内の量子化された変換係数も右上向対角スキャン順序にスキャンまたは再整列することができる。また、サブブロックが右上向対角スキャン順序にスキャンまたは再整列する場合、サブブロック内の量子化された変換係数は、水平スキャン順序または垂直スキャン順序によってスキャンされ、または再整列することもできる。
一方、前述したようにスケーラブルビデオコーディングでは現在レイヤに対する予測を実行する時、現在レイヤの情報のみを利用してインター予測またはイントラ予測を実行することもでき、他のレイヤの情報を利用してインターレイヤ予測を実行することもできる。
図6は、本発明が適用されることができるインターレイヤ予測を説明するための図面である。
図6を参照すると、複数個のレイヤをサポートするスケーラブルビデオコーディング構造において、エンハンスメントレイヤ(現在レイヤ)の現在ブロック610に対する予測を実行する場合、現在ブロック610と同じレイヤの情報を利用して予測(イントラまたはインター予測)を実行することもできるが、予測効率を上げるために、現在レイヤより下位レイヤで既に復元されたピクチャを利用して予測(インターレイヤ予測)を実行することもできる。
現在ブロック610のデコーディング時、インターレイヤ予測を使用するかどうかは、エンコーディング装置からシグナリングすることができる。例えば、現在ピクチャ600のデコーディング時、インターレイヤ予測が使用可能かどうかを指示するinter_layer_pred_enabled_flag情報を介して知ることができる。inter_layer_pred_enabled_flag値が1の場合、現在ピクチャ600のデコーディング時、インターレイヤ予測を使うことができるということを指示し、inter_layer_pred_enabled_flag値が0の場合、現在ピクチャ600のデコーディング時、インターレイヤ予測を使わないということを指示できる。
現在ブロック610のデコーディング時、インターレイヤ予測を使う場合、インターレイヤ予測のために使われる他のレイヤのピクチャに対する情報が必要である。即ち、インターレイヤ予測時、参照される参照レイヤに対する情報、参照レイヤ内の参照される参照ピクチャに対する情報などが必要である。インターレイヤ予測時、参照される参照ピクチャは、インターレイヤ参照ピクチャとも呼ばれる。このとき、インターレイヤ参照ピクチャは、現在レイヤ(エンハンスメントレイヤ)のスケーラビリティに合わせてリサンプルされた(resampled)参照ピクチャである。
インターレイヤ参照ピクチャは、インター予測またはインターレイヤ予測のために使われる参照ピクチャで構成された参照ピクチャリストから誘導することができる。
参照ピクチャリストは、PスライスまたはBスライスのインター予測またはインターレイヤ予測のために使われる参照ピクチャリスト0(以下、L0という)と、Bスライスのインター予測またはインターレイヤ予測のために使われる参照ピクチャリスト1(以下、L1という)と、を含むことができる。即ち、単方向予測を実行するPスライスまたはBスライスのブロックに対するインター予測またはインターレイヤ予測にはL0が利用され、双方向予測を実行するBスライスのブロックに対するインター予測またはインターレイヤ予測にはL0及びL1が利用されることができる。
PスライスまたはBスライスに対するデコーディング時、インターレイヤ予測を実行する場合、参照ピクチャリストを構成する。参照ピクチャリストは、インター予測に使われる参照ピクチャとインターレイヤ予測に使われる参照ピクチャを含むことができ、参照ピクチャインデックスによりインターレイヤ参照ピクチャを特定することができる。
参照ピクチャリストL0、L1は、現在ピクチャのPOC(Picture Order Count)よりPOCが小さい短期参照ピクチャで構成された短期参照ピクチャセット(RefPicSetStCurrBefore)、現在ピクチャのPOCよりPOCが大きい短期参照ピクチャで構成された短期参照ピクチャセット(RefPicSetStCurrAfter)、長期参照ピクチャセット(RefPicSetLtCurr)及びインターレイヤ参照ピクチャセット(RefPicSetInterLayer0、RefPicSetInterLayer1)に基づいて構成することができる。
POCは、ピクチャの表示順序を示し、短期参照ピクチャは、現在ピクチャとPOCとの差が大きくないピクチャであり、長期参照ピクチャは、現在ピクチャとPOCとの差が大きいピクチャである。
例えば、L0は、RefPicSetStCurrBefore、RefPicSetInterLayer0、RefPicSetStCurrAfter、RefPicSetLtCurr、RefPicSetInterLayer1の順に構成することができる。L1は、RefPicSetStCurrAfter、RefPicSetInterLayer1、RefPicSetStCurrBefore、RefPicSetLtCurr、RefPicSetInterLayer0の順に構成することができる。
このとき、参照ピクチャリストの参照ピクチャの個数を制限する場合、L0またはL1でRefPicSetInterLayer1は、空(empty)状態である。
図6に示すように、エンハンスメントレイヤの現在ピクチャ600がインターレイヤ予測を実行する場合、前述したように、参照ピクチャリストを構成することができる。このとき、エンコーディング装置からシグナリングされるインターレイヤ参照ピクチャを指示する参照ピクチャインデックスを介して参照ピクチャリストからインターレイヤ参照ピクチャ620を誘導することができる。インターレイヤ参照ピクチャ620は、エンハンスメントレイヤのスケーラビリティによって再構成された(resampled)参照ピクチャである。
このとき、インターレイヤ参照ピクチャ620からサンプル情報を利用して予測するインターレイヤサンプル予測と、インターレイヤ参照ピクチャ620から動き情報を利用して予測するインターレイヤ動き予測がある。
現在ピクチャ600の現在ブロック610に対して、インターレイヤサンプル予測を実行するか、またはインターレイヤ動き予測を実行するかは、エンハンスメントレイヤと参照レイヤとの間の従属性タイプ(dependency type)によって決定することができる。このような従属性タイプは、エンコーディング装置からシグナリングすることができる。
例えば、従属性タイプは、direct_dependency_type値によって特定することができる。direct_dependency_type値が0の場合、参照レイヤがエンハンスメントレイヤのインターレイヤサンプル予測のために使うことができるが、インターレイヤ動き予測のために使うことはできない。direct_dependency_type値が1の場合、参照レイヤがエンハンスメントレイヤのインターレイヤ動き予測のために使うことができるが、インターレイヤサンプル予測のために使うことはできない。direct_dependency_type値が2の場合、参照レイヤがエンハンスメントレイヤのインターレイヤサンプル予測とインターレイヤ動き予測のために使うことができる。
前述したように、スケーラブルビデオコーディングにおいて、エンハンスメントレイヤがインターレイヤ予測を使用してコーディングされる場合、一般的なイントラ予測の予測方向(イントラ予測モード)に基づいて予測された場合とは違って、他のピクチャの情報を利用して予測を実行する。したがって、既存のイントラ予測のモード情報を利用して変換係数のスキャン順序を決定する方法を適用する場合、コーディング効率に影響を与えることができる。本発明ではインターレイヤ予測モードが使われるスケーラブルビデオコーディングでの係数スキャニング方法を提案する。例えば、現在ブロックに適用されたイントラ予測モードがインターレイヤ予測モードの場合、現在ブロックの変換係数に対するスキャン順序は、特定な一つのスキャン順序に固定することができる。右上向対角スキャン順序に固定することもでき、垂直スキャン順序または水平スキャン順序に固定することもできる。
図7は、本発明による複数のレイヤをサポートする映像符号化方法を概略的に示す流れ図である。図7の方法は、前述した図1のエンコーディング装置で実行されることができる。
図7を参照すると、エンコーディング装置は、現在レイヤ(エンハンスメントレイヤ)の符号化対象ブロックを予測して予測サンプルを生成することができる(S700)。このとき、符号化対象ブロックの予測モードに基づいて予測を実行することができる。例えば、符号化対象ブロックにインターレイヤ予測が使われる場合、前述した図6のように、参照ピクチャリストから誘導されたインターレイヤ参照ピクチャに基づいてインターレイヤ予測を実行することができる。
エンコーディング装置は、符号化対象ブロックの予測サンプルに基づいて取得されたレジデュアルサンプルに変換を実行することができる(S710)。変換を実行した結果、符号化対象ブロックに対する変換係数の2次元配列を生成することができる。レジデュアルサンプルは、予測により生成された予測サンプルと符号化対象ブロックの原サンプルとの間の差分値である。
エンコーディング装置は、変換係数の2次元配列をスキャン順序によってスキャンして変換係数を1次元配列に再整列することができる(S720)。このとき、スキャン順序は、符号化対象ブロックに適用された予測モードに基づいて決定することができる。
例えば、符号化対象ブロックに適用された予測モードがインターレイヤ予測の場合、右上向対角スキャン順序によって変換係数の2次元配列をスキャンして1次元配列に再整列することができる。または、符号化対象ブロックに適用された予測モードがインターレイヤ予測の場合、垂直スキャン順序や水平スキャン順序に特定して再整列を実行することもできる。
符号化対象ブロックに適用された予測モードがインター予測モードの場合、右上向対角スキャン順序によって変換係数の2次元配列をスキャンして1次元配列に再整列することができる。
符号化対象ブロックに適用された予測モードがイントラ予測モードの場合、符号化対象ブロックの大きさ及び符号化対象ブロックがルマサンプルに対するブロックであるかどうかによってスキャン順序を決定することができる。
即ち、符号化対象ブロックに適用された予測モードがイントラ予測モードであり、符号化対象ブロックの大きさが4×4の場合、または符号化対象ブロックに適用された予測モードがイントラ予測モードであり、符号化対象ブロックの大きさが8×8であり、符号化対象ブロックがルマサンプルに対するブロックの場合、符号化対象ブロックのイントラ予測モード値によってスキャン順序を決定することができる。
符号化対象ブロックのイントラ予測モード値が6以上14以下の場合、スキャン順序は垂直スキャン順序に決定され、符号化対象ブロックのイントラ予測モード値が22以上30以下の場合、スキャン順序は水平スキャン順序に決定され、符号化対象ブロックのイントラ予測モード値が0以上5以下、または15以上21以下、または31以上34以下の場合、スキャン順序は右上向対角スキャン順序に決定することができる。
また、符号化対象ブロックに適用された予測モードがイントラ予測モードであり、符号化対象ブロックの大きさが8×8より大きい場合、スキャン順序は右上向対角スキャン順序に決定することができる。
前記右上向対角スキャン順序、垂直スキャン順序、水平スキャン順序は、具体的に詳述したことがあるため、ここでは説明を省略する。
エンコーディング装置は、変換係数の1次元配列をエントロピーエンコーディングすることができる(S730)。エンコーディング装置は、1次元の変換係数と共にデコーディングに必要な情報をエントロピーエンコーディングしてビットストリームを生成することができる。ビットストリームは、デコーディング装置に送信することができる。
図8は、本発明による複数のレイヤをサポートする映像復号化方法を概略的に示す流れ図である。図8の方法は、前述した図2のデコーディング装置で実行することができる。
図8を参照すると、デコーディング装置は、ビットストリームを受信してエントロピーデコーディングすることができる(S800)。このとき、ビットストリームは、現在レイヤの復号化対象ブロックに対する情報を含むことができる。デコーディング装置は、エントロピーデコーディングを介して復号化対象ブロックに対する変換係数の1次元配列を取得することができる。
デコーディング装置は、変換係数の1次元配列をスキャン順序によってスキャンして変換係数の2次元配列に再整列することができる(S810)。このとき、スキャン順序は、復号化対象ブロックに適用された予測モードに基づいて誘導することができる。
例えば、復号化対象ブロックに適用された予測モードがインターレイヤ予測の場合、スキャン順序を右上向対角スキャン順序に誘導することができる。したがって、変換係数の1次元配列を右上向対角スキャン順序によってスキャンして変換係数の2次元配列に再整列することができる。または、復号化対象ブロックに適用された予測モードがインターレイヤ予測の場合、スキャン順序を垂直スキャン順序や水平スキャン順序に誘導することもできる。
復号化対象ブロックに適用された予測モードがインター予測モードの場合、スキャン順序を右上向対角スキャン順序に誘導することができる。
復号化対象ブロックに適用された予測モードがイントラ予測モードの場合、復号化対象ブロックの大きさ及び復号化対象ブロックがルマサンプルに対するブロックであるかどうかによってスキャン順序を誘導することができる。
即ち、復号化対象ブロックに適用された予測モードがイントラ予測モードであり、復号化対象ブロックの大きさが4×4の場合、または復号化対象ブロックに適用された予測モードがイントラ予測モードであり、復号化対象ブロックの大きさが8×8であり、復号化対象ブロックがルマサンプルに対するブロックの場合、復号化対象ブロックのイントラ予測モード値によってスキャン順序を誘導することができる。
復号化対象ブロックのイントラ予測モード値が6以上14以下の場合、スキャン順序は垂直スキャン順序に誘導され、復号化対象ブロックのイントラ予測モード値が22以上30以下の場合、スキャン順序は水平スキャン順序に誘導され、復号化対象ブロックのイントラ予測モード値が0以上5以下、または15以上21以下、または31以上34以下の場合、スキャン順序は右上向対角スキャン順序に誘導することができる。
また、復号化対象ブロックに適用された予測モードがイントラ予測モードであり、復号化対象ブロックの大きさが8×8より大きい場合、スキャン順序は右上向対角スキャン順序に誘導することができる。
前記右上向対角スキャン順序、垂直スキャン順序、水平スキャン順序は、具体的に詳述したことがあるため、ここでは説明を省略する。
デコーディング装置は、変換係数の2次元配列を逆量子化することができる(S820)。デコーディング装置は、逆量子化を介して復号化対象ブロックに対する逆量子化された変換係数の2次元配列を取得することができる。
デコーディング装置は、復号化対象ブロックの予測モードに基づいて復号化対象ブロックに対する予測を実行する(S830)。デコーディング装置は、予測により復号化対象ブロックの予測サンプルを生成することができ、予測サンプルと、逆量子化された変換係数の変換を介して取得されたレジデュアルサンプルと、を利用して復号化対象ブロックに対する復元サンプルを取得することができる。
前述した例示的なシステムにおいて、方法は、一連のステップまたはブロックで流れ図に基づいて説明されているが、本発明は、ステップの順序に限定されるものではなく、あるステップは、前述と異なるステップと、異なる順序にまたは同時に発生できる。また、前述した実施例は、多様な態様の例示を含む。したがって、本発明は、特許請求の範囲内に属する全ての交替、修正及び変更を含む。

Claims (20)

  1. 複数のレイヤをサポートする映像復号化方法において、
    現在レイヤの復号化対象ブロックに対する情報を含むビットストリームを受信するステップと、
    前記ビットストリームをエントロピーデコーディングして前記復号化対象ブロックに対する変換係数の1次元配列を取得するステップと、
    前記変換係数の1次元配列をスキャン順序(scan order)によってスキャンして前記変換係数の2次元配列に再整列するステップと、
    前記変換係数の2次元配列を逆量子化して前記復号化対象ブロックに対する逆量子化された変換係数の2次元配列を取得するステップと、
    前記復号化対象ブロックに対する予測モードに基づいて前記復号化対象ブロックを予測するステップと、を含み、
    前記変換係数の2次元配列に再整列するステップでは、
    前記復号化対象ブロックに適用された予測モードに基づいて前記スキャン順序を誘導する、映像復号化方法。
  2. 前記変換係数の2次元配列に再整列するステップでは、前記復号化対象ブロックに適用された予測モードがインターレイヤ予測モードの場合、前記スキャン順序を右上向対角スキャン順序に設定する、請求項1に記載の映像復号化方法。
  3. 前記変換係数の2次元配列に再整列するステップでは、前記復号化対象ブロックに適用された予測モードがインターレイヤ予測モードの場合、前記スキャン順序を垂直スキャン順序に設定する、請求項1に記載の映像復号化方法。
  4. 前記変換係数の2次元配列に再整列するステップでは、前記復号化対象ブロックに適用された予測モードがインターレイヤ予測モードの場合、前記スキャン順序を水平スキャン順序に設定する、請求項1に記載の映像復号化方法。
  5. 前記変換係数の2次元配列に再整列するステップでは、前記復号化対象ブロックに適用された予測モードがインター予測モードの場合、前記スキャン順序を右上向対角スキャン順序に設定する、請求項1に記載の映像復号化方法。
  6. 前記変換係数の2次元配列に再整列するステップでは、前記復号化対象ブロックに適用された予測モードがイントラ予測モードの場合、前記スキャン順序を前記復号化対象ブロックの大きさ及び前記復号化対象ブロックがルマサンプルに対するブロックであるかどうかによって誘導する、請求項1に記載の映像復号化方法。
  7. 前記変換係数の2次元配列に再整列するステップでは、前記復号化対象ブロックに適用された予測モードがイントラ予測モードであり、前記復号化対象ブロックの大きさが4×4の場合、または前記復号化対象ブロックに適用された予測モードがイントラ予測モードであり、前記復号化対象ブロックの大きさが8×8であり、前記符号化対象ブロックがルマサンプルに対するブロックの場合、前記スキャン順序は、前記復号化対象ブロックのイントラ予測モード値によって誘導される、請求項6に記載の映像復号化方法。
  8. 前記変換係数の2次元配列に再整列するステップでは、前記復号化対象ブロックに適用された予測モードがイントラ予測モードであり、前記復号化対象ブロックの大きさが8×8より大きい場合、前記スキャン順序は、右上向対角スキャン順序に誘導される、請求項6に記載の映像復号化方法。
  9. 前記変換係数の2次元配列に再整列するステップでは、前記復号化対象ブロックのイントラ予測モード値が6以上14以下の場合、前記スキャン順序は垂直スキャン順序に誘導され、前記復号化対象ブロックのイントラ予測モード値が22以上30以下の場合、前記スキャン順序は水平スキャン順序に誘導され、前記復号化対象ブロックのイントラ予測モード値が0以上5以下、または15以上21以下、または31以上34以下の場合、前記スキャン順序は右上向対角スキャン順序に誘導される、請求項7に記載の映像復号化方法。
  10. 前記インターレイヤ予測モードは、前記復号化対象ブロックを含む現在ピクチャの復号化時にインターレイヤ予測を使用するかどうかを指示する情報から特定される、請求項2から請求項4のいずれか一項に記載の映像復号化方法。
  11. 複数のレイヤをサポートする映像符号化方法において、
    現在レイヤの符号化対象ブロックに対する予測モードに基づいて予測を実行することで予測サンプルを取得するステップと、
    前記予測サンプルに基づいて取得されたレジデュアルサンプルに変換を実行することで前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップと、
    前記変換係数の2次元配列をスキャン順序(scan order)によってスキャンして前記変換係数の1次元配列に再整列するステップと、
    前記変換係数の1次元配列をエントロピーエンコーディングするステップと、を含み、
    前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、
    前記符号化対象ブロックに適用された予測モードに基づいて前記スキャン順序を決定する、映像符号化方法。
  12. 前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、前記符号化対象ブロックに適用された予測モードがインターレイヤ予測モードの場合、前記スキャン順序を右上向対角スキャン順序に決定する、請求項11に記載の映像符号化方法。
  13. 前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、前記符号化対象ブロックに適用された予測モードがインターレイヤ予測モードの場合、前記スキャン順序を垂直スキャン順序に決定する、請求項11に記載の映像符号化方法。
  14. 前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、前記符号化対象ブロックに適用された予測モードがインターレイヤ予測モードの場合、前記スキャン順序を水平スキャン順序に決定する、請求項11に記載の映像符号化方法。
  15. 前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、前記符号化対象ブロックに適用された予測モードがインター予測モードの場合、前記スキャン順序を右上向対角スキャン順序に決定する、請求項11に記載の映像符号化方法。
  16. 前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、前記符号化対象ブロックに適用された予測モードがイントラ予測モードの場合、前記スキャン順序を前記符号化対象ブロックの大きさ及び前記符号化対象ブロックがルマサンプルに対するブロックであるかどうかによって決定する、請求項11に記載の映像符号化方法。
  17. 前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、前記符号化対象ブロックに適用された予測モードがイントラ予測モードであり、前記符号化対象ブロックの大きさが4×4の場合、または前記符号化対象ブロックに適用された予測モードがイントラ予測モードであり、前記符号化対象ブロックの大きさが8×8であり、前記符号化対象ブロックがルマサンプルに対するブロックの場合、前記スキャン順序は、前記符号化対象ブロックのイントラ予測モード値によって決定される、請求項16に記載の映像符号化方法。
  18. 前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、前記符号化対象ブロックに適用された予測モードがイントラ予測モードであり、前記符号化対象ブロックの大きさが8×8より大きい場合、前記スキャン順序は、右上向対角スキャン順序に決定される、請求項16に記載の映像符号化方法。
  19. 前記符号化対象ブロックに対する変換係数の2次元配列を生成するステップでは、前記符号化対象ブロックのイントラ予測モード値が6以上14以下の場合、前記スキャン順序は垂直スキャン順序に決定され、前記符号化対象ブロックのイントラ予測モード値が22以上30以下の場合、前記スキャン順序は水平スキャン順序に決定され、前記符号化対象ブロックのイントラ予測モード値が0以上5以下、または15以上21以下、または31以上34以下の場合、前記スキャン順序は右上向対角スキャン順序に決定される、請求項17に記載の映像符号化方法。
  20. 前記インターレイヤ予測モードは、前記符号化対象ブロックを含む現在ピクチャの符号化時にインターレイヤ予測を使用するかどうかを指示する情報を利用して特定される、請求項12から請求項14のいずれか一項に記載の映像符号化方法。
JP2015545367A 2012-11-29 2013-11-29 複数のレイヤをサポートする映像符号化/復号化方法 Active JP6082123B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261731471P 2012-11-29 2012-11-29
US61/731,471 2012-11-29
PCT/KR2013/010992 WO2014084656A1 (ko) 2012-11-29 2013-11-29 복수의 레이어를 지원하는 영상 부호화/복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2016502817A true JP2016502817A (ja) 2016-01-28
JP6082123B2 JP6082123B2 (ja) 2017-02-15

Family

ID=50828200

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015545367A Active JP6082123B2 (ja) 2012-11-29 2013-11-29 複数のレイヤをサポートする映像符号化/復号化方法

Country Status (6)

Country Link
US (1) US20150312571A1 (ja)
EP (1) EP2928184A4 (ja)
JP (1) JP6082123B2 (ja)
KR (1) KR20150091043A (ja)
CN (1) CN104885453B (ja)
WO (1) WO2014084656A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100882949B1 (ko) 2006-08-17 2009-02-10 한국전자통신연구원 화소 유사성에 따라 적응적인 이산 코사인 변환 계수스캐닝을 이용한 부호화/복호화 장치 및 그 방법
PL2941872T3 (pl) 2013-01-02 2019-03-29 Dolby Laboratories Licensing Corporation Kompatybilne wstecznie kodowanie dla sygnałów wideo o ultra wysokiej rozdzielczości z rozszerzonym zakresem dynamicznym
US9510001B2 (en) 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
US20180027236A1 (en) * 2015-02-17 2018-01-25 Lg Electronics Inc. Method and device for encoding/decoding video signal by using adaptive scan order
MX2018006141A (es) * 2015-11-24 2018-08-01 Samsung Electronics Co Ltd Metodo y dispositivo de decodificacion de video, y metodo y dispositivo de codificacion del mismo.
WO2017111648A1 (en) * 2015-12-23 2017-06-29 Huawei Technologies Co., Ltd. Method and apparatus for transform coding with block-level transform selection and implicit signaling within hierarchical partitioning
CN115767106B (zh) 2016-10-04 2023-10-10 有限公司B1影像技术研究所 图像编码/解码方法和计算机可读记录介质
MX2019011211A (es) * 2017-03-21 2019-12-05 Lg Electronics Inc Metodo de transformacion en el sistema de codificacion de imagenes y aparato para el mismo.
KR20230008911A (ko) * 2017-12-15 2023-01-16 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
WO2019199077A1 (ko) * 2018-04-11 2019-10-17 엘지전자 주식회사 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2020139016A2 (ko) * 2018-12-27 2020-07-02 엘지전자 주식회사 영상 코딩 시스템에서 레지듀얼 재배열을 사용하는 영상 디코딩 방법 및 그 장치
KR20210079379A (ko) * 2019-01-12 2021-06-29 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
CN113453008B (zh) * 2020-03-26 2022-08-02 腾讯科技(深圳)有限公司 视频解码方法、视频编码方法、相关设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006211304A (ja) * 2005-01-28 2006-08-10 Matsushita Electric Ind Co Ltd 映像符号化装置、映像復号化装置、映像符号化方法、映像復号化方法、映像符号化プログラムおよび映像復号化プログラム
JP2009513056A (ja) * 2005-10-21 2009-03-26 韓國電子通信研究院 適応型走査を用いる動画の符号化/復号化装置及びその方法
WO2014036174A2 (en) * 2012-08-31 2014-03-06 Qualcomm Incorporated Intra prediction improvements for scalable video coding

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3468043A1 (en) * 2002-09-20 2019-04-10 Ntt Docomo, Inc. Method and apparatus for arithmetic coding
CN1225126C (zh) * 2002-10-09 2005-10-26 中国科学院计算技术研究所 用于视频编码的新型空间预测方法及其装置
GB0323284D0 (en) * 2003-10-04 2003-11-05 Koninkl Philips Electronics Nv Method and apparatus for processing image data
US7876833B2 (en) * 2005-04-11 2011-01-25 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive up-scaling for spatially scalable coding
US8938009B2 (en) * 2007-10-12 2015-01-20 Qualcomm Incorporated Layered encoded bitstream structure
EP2213099A1 (en) * 2007-10-15 2010-08-04 QUALCOMM Incorporated Improved enhancement layer coding for scalable video coding
US8848787B2 (en) * 2007-10-15 2014-09-30 Qualcomm Incorporated Enhancement layer coding for scalable video coding
WO2010033565A1 (en) * 2008-09-16 2010-03-25 Dolby Laboratories Licensing Corporation Adaptive video encoder control
EP2182732A1 (en) * 2008-10-28 2010-05-05 Panasonic Corporation Switching between scans in image coding
JP5416271B2 (ja) * 2009-04-20 2014-02-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 多層映像配信のための適応補間フィルタ
KR101694399B1 (ko) * 2009-10-07 2017-01-09 에스케이 텔레콤주식회사 적응적 부호화 패턴 정보를 생성/이용하는 동영상 부호화/복호화 방법, 장치 및 기록 매체
JP5703781B2 (ja) * 2010-09-03 2015-04-22 ソニー株式会社 画像処理装置および方法
US9049444B2 (en) * 2010-12-22 2015-06-02 Qualcomm Incorporated Mode dependent scanning of coefficients of a block of video data
WO2012093969A1 (en) * 2011-01-07 2012-07-12 Agency For Science, Technology And Research Method and an apparatus for coding an image
JP2012209673A (ja) * 2011-03-29 2012-10-25 Sony Corp 情報処理装置及び方法、画像提供システム及び画像提供方法、並びにプログラム
US9756360B2 (en) * 2011-07-19 2017-09-05 Qualcomm Incorporated Coefficient scanning in video coding
AU2011236109B2 (en) * 2011-10-18 2015-02-19 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006211304A (ja) * 2005-01-28 2006-08-10 Matsushita Electric Ind Co Ltd 映像符号化装置、映像復号化装置、映像符号化方法、映像復号化方法、映像符号化プログラムおよび映像復号化プログラム
JP2009513056A (ja) * 2005-10-21 2009-03-26 韓國電子通信研究院 適応型走査を用いる動画の符号化/復号化装置及びその方法
WO2014036174A2 (en) * 2012-08-31 2014-03-06 Qualcomm Incorporated Intra prediction improvements for scalable video coding

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JPN6016014702; Jianle Chen et al.: 'Description of scalable video coding technology proposal by Qualcomm (configuration 1)' Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC-K0035, 201210, pp.1-19, 11th Meeting: Shanghai, CN *
JPN6016014703; Chulkeun Kim et al.: 'Description of scalable video coding technology proposal by LG Electronics and MediaTek (differentia' Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC-K0033_r2, 201210, pp.1-38, 11th Meeting: &#xFF33 *
JPN6016014704; Jianle Chen et al.: 'Description of scalable video coding technology proposal by Qualcomm (configuration 2)' Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC-K0036, 201210, pp.1-21, 11th Meeting: Shanghai, CN *
JPN6016014705; Benjamin Bross et al.: 'High efficiency video coding (HEVC) text specification draft 6' Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC-H1003_dK, 201204, pp.i-vi, 18-21, 51-53, 88-90,98-102, 8th Meeting: San Jose, &#x *
JPN6016014707; Do-Kyoung Kwon et al.: 'Description of scalable video coding technology proposal by Texas Instruments Inc.' Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC-K0038_r2, 201210, pp.1-10, 11th Meeting: Shanghai, CN *

Also Published As

Publication number Publication date
EP2928184A1 (en) 2015-10-07
KR20150091043A (ko) 2015-08-07
CN104885453B (zh) 2018-11-02
WO2014084656A1 (ko) 2014-06-05
CN104885453A (zh) 2015-09-02
EP2928184A4 (en) 2016-09-21
US20150312571A1 (en) 2015-10-29
JP6082123B2 (ja) 2017-02-15

Similar Documents

Publication Publication Date Title
JP6082123B2 (ja) 複数のレイヤをサポートする映像符号化/復号化方法
US10873750B2 (en) Method for encoding video, method for decoding video, and apparatus using same
KR20220113326A (ko) 스케일러블 비디오 코딩 및 디코딩 방법과 이를 이용한 장치
KR101542585B1 (ko) 영상 부호화/복호화 방법 및 그 장치
US20170099504A1 (en) Method and apparatus for encoding/decoding image
US10616607B2 (en) Method for encoding video of multi-layer structure supporting scalability and method for decoding same and apparatus therefor
JP5993092B2 (ja) 映像復号化方法及びそれを利用する装置
WO2013147557A1 (ko) 인터 레이어 예측 방법 및 이를 이용하는 인코딩 장치와 디코딩 장치
JP6055098B2 (ja) 映像復号方法及びそれを利用する装置
US20180109803A1 (en) Video decoding method and apparatus using the same
EP2961166B1 (en) Method for encoding video of multi-layer structure supporting scalability and method for decoding same and apparatus therefor
WO2013147497A1 (ko) 스케일러블 비디오 코딩에서 샘플 적응적 오프셋 적용 방법 및 이를 이용한 장치
KR20140073430A (ko) 영상 부호화/복호화 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170119

R150 Certificate of patent or registration of utility model

Ref document number: 6082123

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250