JP2013502133A - 適応的なループフィルタリングを利用したビデオ符号化方法及び装置、ビデオ復号化方法及び装置 - Google Patents

適応的なループフィルタリングを利用したビデオ符号化方法及び装置、ビデオ復号化方法及び装置 Download PDF

Info

Publication number
JP2013502133A
JP2013502133A JP2012524643A JP2012524643A JP2013502133A JP 2013502133 A JP2013502133 A JP 2013502133A JP 2012524643 A JP2012524643 A JP 2012524643A JP 2012524643 A JP2012524643 A JP 2012524643A JP 2013502133 A JP2013502133 A JP 2013502133A
Authority
JP
Japan
Prior art keywords
unit
coding
depth
coding unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012524643A
Other languages
English (en)
Other versions
JP5731506B2 (ja
Inventor
リー,タミー
ハン,ウ−ジン
キム,イル−グ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2013502133A publication Critical patent/JP2013502133A/ja
Application granted granted Critical
Publication of JP5731506B2 publication Critical patent/JP5731506B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • H04N19/865Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness with detection of the former encoding block subdivision in decompressed video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、符号化されたビデオについてのビットストリームを受信してパージングし、ビットストリームから、最大サイズの符号化単位である最大符号化単位に割り当てられる現在のピクチャーの映像データ、最大符号化単位別の符号化深度及び符号化モードについての情報、及び現在のピクチャーのループフィルタリングのためのフィルタ係数情報を抽出して、最大符号化単位別の符号化深度及び符号化モードについての情報に基づいて、最大符号化単位別の符号化された映像データを復号化し、現在のピクチャーの復号化された映像データに対してデブロッキングを行って、デブロッキングされたデータに対して、連続的な一次元フィルタリングによるループフィルタリングを行うことで、現在のピクチャーを復元するビデオ復号化方法を提供する。

Description

本発明は、ビデオ符号化及び復号化に関する。
高解像度または高画質のビデオコンテンツを再生及び保存できるハードウェアの開発及び普及によって、高解像度または高画質のビデオコンテンツを効果的に符号化または復号化するビデオコーデックの必要性が高くなっている。既存のビデオコーデックによれば、ビデオは、所定のサイズのマクロブロックに基づいて、制限された符号化方式によって符号化されている。また、既存のビデオコーデックは、復元された映像データの画質改善のためにループフィルタリングを利用することもある。
本発明の目的は、連続的な一次元フィルタリングによる適応的なループフィルタリングを利用するビデオ符号化及び復号化を提供することである。
本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ復号化方法は、符号化されたビデオについてのビットストリームを受信してパージングするステップと、前記ビットストリームから、最大サイズの符号化単位である最大符号化単位に割り当てられる現在のピクチャーの映像データ、前記最大符号化単位別の符号化深度及び符号化モードについての情報、及び前記現在のピクチャーのループフィルタリングのためのフィルタ係数情報を抽出するステップと、前記最大符号化単位別の符号化深度及び符号化モードについての情報に基づいて、前記最大符号化単位別の符号化された映像データを復号化するステップと、前記現在のピクチャーの復号化された映像データに対してデブロッキングを行い、デブロッキングされたデータに対して、連続的な一次元フィルタリングによるループフィルタリングを行うステップと、を含む。
本発明の一実施形態によるビデオ符号化装置を示すブロック図である。 本発明の一実施形態によるビデオ復号化装置を示すブロック図である。 本発明の一実施形態による符号化単位の概念を示す図である。 本発明の一実施形態による符号化単位に基づいた映像符号化部を示すブロック図である。 本発明の一実施形態による符号化単位に基づいた映像復号化部を示すブロック図である。 本発明の一実施形態による深度別の符号化単位及びパーティションを示す図面である。 本発明の一実施形態による符号化単位及び変換単位の関係を示す図である。 本発明の一実施形態による深度別の符号化情報を示す図である。 本発明の一実施形態による深度別の符号化単位を示す図である。 本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す図である。 本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す図である。 本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す図である。 表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す図である。 本発明の一実施形態によるビデオ符号化方法を示すフローチャートである。 本発明の一実施形態によるビデオ復号化方法を示すフローチャートである。 本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ符号化装置を示す図である。 本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ復号化装置を示す図である。 本発明の一実施形態による連続的な一次元フィルタリングを示すフローチャートである。 本発明の他の実施形態によるループフィルタリングを示すフローチャートである。 本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ符号化方法を示す図である。 本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ復号化方法を示す図である。
本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ復号化方法は、符号化されたビデオについてのビットストリームを受信してパージングするステップと、前記ビットストリームから、最大サイズの符号化単位である最大符号化単位に割り当てられる現在のピクチャーの映像データ、前記最大符号化単位別の符号化深度及び符号化モードについての情報、及び前記現在のピクチャーのループフィルタリングのためのフィルタ係数情報を抽出するステップと、前記最大符号化単位別の符号化深度及び符号化モードについての情報に基づいて、前記最大符号化単位別の符号化された映像データを復号化するステップと、前記現在のピクチャーの復号化された映像データに対してデブロッキングを行い、デブロッキングされたデータに対して、連続的な一次元フィルタリングによるループフィルタリングを行うステップと、を含む。
一実施形態による符号化単位は、最大サイズ及び深度により特徴づけられてもよい。
深度とは、符号化単位が階層的に分割される段階を表し、深度が深くなるほど、深度別の符号化単位は、最大符号化単位から最小符号化単位まで分割される。本明細書では、高い深度または上位深度から低い深度または下位深度の方向に‘深度が深くなる’と定義する。深度が深くなるにつれて、最大符号化単位の分割回数が増加し、最大符号化単位の分割可能な総回数が‘最大深度’に対応する。符号化単位の最大サイズ及び最大深度が既定であってもよい。
一実施形態による前記フィルタ係数情報抽出ステップは、複数の一次元フィルタのうちそれぞれの一次元フィルタに対して、連続的なフィルタ係数間の差値についての残差情報を抽出するステップを含む。
一実施形態による前記ループフィルタリング実行ステップは、水平方向の一次元フィルタリング及び垂直方向の一次元フィルタリングを連続的に行って、前記現在のピクチャーを復元する。
一実施形態による前記ループフィルタリング実行ステップは、前記抽出されたフィルタ係数の残差情報を利用して、前記それぞれの一次元フィルタのフィルタ係数を誘導するステップと、前記誘導されたそれぞれの一次元フィルタのフィルタ係数を利用して、前記連続的な一次元フィルタリングを行うステップと、を含む。
一実施形態による前記フィルタ係数誘導ステップは、前記それぞれの一次元フィルタごとに、現在のフィルタ係数と以前のフィルタ係数との差値を前記以前のフィルタ係数に加えて現在のフィルタ係数が計算されることで、前記連続的なフィルタ係数を誘導する。
一実施形態による前記ループフィルタリング実行ステップは、前記デブロッキングされた映像データのうち、水平方向の9個の連続的なデータに対して、5個の水平方向の一次元フィルタ係数でフィルタリングするステップと、前記デブロッキングされた映像データのうち、垂直方向の9個の連続的なデータに対して、5個の垂直方向の一次元フィルタ係数でフィルタリングするステップと、を含む。
本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ符号化方法は、現在のピクチャーを最大サイズの符号化単位である少なくとも一つの最大符号化単位に分割するステップと、前記最大符号化単位の領域を分割する回数が増加するにつれて深くなる深度に基づいて、前記深度ごとに、前記最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、前記少なくとも一つの分割領域別に最終符号化結果が出力される深度を決定するステップと、前記最大符号化単位ごとに、前記少なくとも一つの分割領域別の最終符号化結果である映像データ、深度及び予測モードについての符号化情報、及び前記現在のピクチャーの符号化のうち、デブロッキング以後に連続的な一次元フィルタリングにより行われるループフィルタリングのフィルタ係数情報を符号化して出力するステップと、を含む。
一実施形態による前記ループフィルタリングのフィルタ係数情報出力ステップは、前記それぞれの一次元フィルタごとに、前記残差情報として、現在のフィルタ係数と以前のフィルタ係数との差値を符号化するステップを含む。
一実施形態によって、前記最大符号化単位は、少なくとも一つの深度による階層的に分化された前記深度別の符号化単位を含み、それぞれの下位深度の符号化単位は、複数の上位深度の符号化単位を含み、前記符号化深度は、前記最大符号化単位から階層的に分化された少なくとも一つの深度別の符号化単位のうち、符号化誤差が最も小さい深度を表す。
本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ復号化装置は、符号化されたビデオについてのビットストリームを受信してパージングする受信部と、前記ビットストリームから、最大サイズの符号化単位である最大符号化単位に割り当てられる現在のピクチャーの映像データ、前記最大符号化単位別の符号化深度及び符号化モードについての情報、及び前記現在のピクチャーのループフィルタリングのためのフィルタ係数情報を抽出する抽出部と、前記最大符号化単位別の符号化深度及び符号化モードについての情報に基づいて、前記最大符号化単位別の符号化された映像データを復号化する映像データ復号化部と、前記現在のピクチャーの復号化された映像データに対してデブロッキングを行い、デブロッキングされたデータに対して、連続的な一次元フィルタリングによるループフィルタリングを行うループフィルタリング実行部と、を備える。
本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ符号化装置は、現在のピクチャーを最大サイズの符号化単位である少なくとも一つの最大符号化単位に分割する最大符号化単位分割部と、前記最大符号化単位の領域を分割する回数が増加するにつれて深くなる深度に基づいて、前記深度ごとに、前記最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、前記少なくとも一つの分割領域別に最終符号化結果が出力される深度を決定する符号化深度決定部と、前記最大符号化単位ごとに、前記少なくとも一つの分割領域別の最終符号化結果である映像データ、深度及び予測モードについての符号化情報、及び前記現在のピクチャーの符号化のうち、デブロッキング以後に連続的な一次元フィルタリングにより行われるループフィルタリングのフィルタ係数情報を符号化して出力する出力部と、を備える。
本発明は、一実施形態によるビデオ復号化方法を具現するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体を含む。また、本発明は、一実施形態によるビデオ符号化方法を具現するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体を含む。
以下、図1ないし図21を参照して、本発明の一実施形態によるビデオ符号化装置及びビデオ復号化装置、ビデオ符号化方法及びビデオ復号化方法について述べる。図1ないし図15を参照して、本発明の一実施形態によって、空間的に階層的なデータ単位に基づいたビデオ符号化及びビデオ復号化について述べ、図16ないし図21を参照して、本発明の一実施形態による空間的に階層的なデータ単位に基づいて、適応的なループフィルタリングを利用するビデオ符号化及びビデオ復号化について述べる。
以下、本明細書に記載された本発明の多様な実施形態において、‘映像’は、静止映像だけでなく、ビデオのような動画を含んで包括的に指してもよい。
以下、図1ないし図15を参照して、本発明の一実施形態によるビデオ符号化装置及びビデオ復号化装置、ビデオ符号化方法及びビデオ復号化方法について述べる。
図1は、本発明の一実施形態によるビデオ符号化装置を示すブロック図である。
一実施形態によるビデオ符号化装置100は、最大符号化単位分割部110、符号化単位決定部120及び出力部130を備える。
最大符号化単位分割部110は、映像の現在のピクチャーのための最大サイズの符号化単位である最大符号化単位に基づいて、現在のピクチャーを区画する。現在のピクチャーが最大符号化単位より大きければ、現在のピクチャーの映像データは、少なくとも一つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32×32、64×64、128×128、256×256などのデータ単位であって、横及び縦サイズが2の二乗である正方形のデータ単位である。映像データは、少なくとも一つの最大符号化単位別に符号化単位決定部120に出力される。
一実施形態による符号化単位は、最大サイズ及び深度により特徴づけられてもよい。深度とは、最大符号化単位から、符号化単位が空間的に分割した回数を表し、深度が深くなるほど、深度別の符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位として定義される。最大符号化単位は、深度が深くなるにつれて、深度別の符号化単位のサイズは縮小するので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含む。
前述したように、符号化単位の最大サイズによって、現在のピクチャーの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含む。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが深度によって階層的に分類される。
最大符号化単位の高さ及び幅を階層的に分割できる総回数を制限する最大深度及び符号化単位の最大サイズが既定であってもよい。
符号化単位決定部120は、深度ごとに最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、少なくとも一つの分割領域別に最終符号化結果が出力される深度を決定する。すなわち、符号化単位決定部120は、現在のピクチャーの最大符号化単位ごとに、深度別の符号化単位で映像データを符号化して、最も小さい符号化誤差が発生する深度を選択して、符号化深度として決定する。決定された符号化深度及び最大符号化単位別の映像データは、出力部130に出力される。
最大符号化単位内の映像データは、最大深度以下の少なくとも一つの深度によって、深度別の符号化単位に基づいて符号化され、それぞれの深度別の符号化単位に基づいた符号化結果が比較される。深度別の符号化単位の符号化誤差の比較結果、符号化誤差の最も小さい深度が選択される。それぞれの最大符号化単位ごとに、少なくとも一つの符号化深度が決定される。
最大符号化単位のサイズは、深度が深くなるにつれて、符号化単位が階層的に分割され、符号化単位の個数は増加する。また、一つの最大符号化単位に含まれる同じ深度の符号化単位であるとしても、それぞれのデータについての符号化誤差を測定し、下位深度への分割如何が決定される。したがって、一つの最大符号化単位に含まれるデータであるとしても、位置によって深度別の符号化誤差が異なるので、位置によって符号化深度が異なって決定されてもよい。したがって、一つの最大符号化単位に対して符号化深度が一つ以上設定され、最大符号化単位のデータは、一つ以上の符号化深度の符号化単位によって区画される。
したがって、一実施形態による符号化単位決定部120は、現在の最大符号化単位に含まれるツリー構造による符号化単位が決定される。一実施形態による‘ツリー構造による符号化単位’は、現在の最大符号化単位に含まれるあらゆる深度別の符号化単位のうち、符号化深度として決定された深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で、同じ領域では深度によって階層的に決定され、他の領域に対しては独立的に決定される。同様に、現在の領域についての符号化深度は、他の領域についての符号化深度と独立的に決定される。
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数と関連した指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を表す。例えば、最大符号化単位の深度が0であるとするとき、最大符号化単位が1回分割された符号化単位の深度は1に設定され、2回分割された符号化単位の深度が2に設定される。この場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であれば、深度0,1,2,3及び4の深度レベルが存在するので、第1最大深度は4、第2最大深度は5に設定される。
最大符号化単位の予測符号化及び周波数変換が行われる。予測符号化及び周波数変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに深度別の符号化単位に基づいて行われる。
最大符号化単位が深度別に分割される度に、深度別の符号化単位の個数が増加するので、深度が深くなるにつれて生成されるあらゆる深度別の符号化単位に対して、予測符号化及び周波数変換を含む符号化が行わねばならない。以下、説明の便宜上、少なくとも一つの最大符号化単位のうち、現在の深度の符号化単位に基づいて、予測符号化及び周波数変換を説明する。
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位のサイズまたは形態を多様に選択する。映像データの符号化のためには、予測符号化、周波数変換、エントロピー符号化などの段階を経るが、あらゆる段階にわたって、同じデータ単位が使われ、段階別にデータ単位が変更されてもよい。
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択する。
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、それ以上分割されない符号化単位に基づいて、予測符号化が行われる。以下、予測符号化の基盤となるそれ以上分割されない符号化単位を‘予測単位’と称する。予測単位が分割されたパーティションは、予測単位、または予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位を含む。
例えば、サイズ2N×2N(ただし、Nは、正の整数)の符号化単位がそれ以上分割されない場合、サイズ2N×2Nの予測単位となり、パーティションのサイズは、2N×2N、2N×N、N×2N、N×Nなどである。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的割合で分割された対称的パーティションだけでなく、1:nまたはn:1のように非対称的割合で分割されたパーティション、幾何学的な形態に分割されたパーティション、任意的形態のパーティションなどを選択的に含んでもよい。
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つである。例えば、イントラモード及びインターモードは、2N×2N、2N×N、N×2N、N×Nサイズのパーティションに対して行われる。また、スキップモードは、2N×2Nサイズのパーティションのみに対して行われる。符号化単位以内の一つの予測単位ごとに独立的に符号化が行われて、符号化誤差の最も小さい予測モードが選択される。
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位と異なるデータ単位に基づいて、符号化単位の映像データの周波数変換を行える。
符号化単位の周波数変換のためには、符号化単位より小さいか、またはそれと同じサイズのデータ単位に基づいて、周波数変換が行われる。例えば、周波数変換のためのデータ単位は、イントラモードのためのデータ単位及びインターモードのためのデータ単位を含む。
以下、周波数変換の基盤となるデータ単位は、‘変換単位’と称する。符号化単位と類似した方式で、符号化単位内の変換単位も、再帰的にさらに小さいサイズの変換単位に分割されつつ、符号化単位の残差データが、変換深度によってツリー構造による変換単位によって区画される。
一実施形態による変換単位に対しても、符号化単位の高さ及び幅が分割され、変換単位に達するまでの分割回数を表す変換深度が設定される。例えば、サイズ2N×2Nの現在の符号化単位の変換単位のサイズが2N×2Nであれば、変換深度0、変換単位のサイズがN×Nであれば、変換深度1、変換単位のサイズがN/2×N/2であれば、変換深度2に設定される。すなわち、変換単位に対しても、変換深度によってツリー構造による変換単位が設定される。
符号化深度別の符号化情報は、符号化深度だけでなく、予測関連情報及び周波数変換関連情報が必要である。したがって、符号化単位決定部120は、最小符号化誤差を発生させた符号化深度だけでなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別の予測モード、周波数変換のための変換単位のサイズなどを決定する。
一実施形態による最大符号化単位のツリー構造による符号化単位及びパーティションの決定方式については、図3ないし図12を参照して後述する。
符号化単位決定部120は、深度別の符号化単位の符号化誤差を、ラグランジュの乗数(Lagrangian Multiplier)基盤の率−歪曲最適化技法(Rate-Distortion Optimization)を利用して測定する。
出力部130は、符号化単位決定部120で決定された少なくとも一つの符号化深度に基づいて符号化された最大符号化単位の映像データ、及び深度別の符号化モードについての情報をビットストリーム形態で出力する。
符号化された映像データは、映像の残差データの符号化結果である。
深度別の符号化モードについての情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含む。
符号化深度情報は、現在深度で符号化せず、下位深度の符号化単位で符号化するか否かを表す深度別の分割情報を利用して定義される。現在の符号化単位の現在深度が符号化深度であれば、現在の符号化単位は、現在深度の符号化単位で符号化されるので、現在深度の分割情報は、それ以上下位深度に分割されないように定義される。逆に、現在の符号化単位の現在深度が符号化深度でなければ、下位深度の符号化単位を利用した符号化を試みねばならないので、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
現在深度が符号化深度でなければ、下位深度の符号化単位に分割された符号化単位に対して符号化が行われる。現在深度の符号化単位内に下位深度の符号化単位が一つ以上存在するので、それぞれの下位深度の符号化単位ごとに反復的に符号化が行われて、同じ深度の符号化単位ごとに再帰的な(recursive)符号化が行われる。
一つの最大符号化単位内にツリー構造の符号化単位が決定され、符号化深度の符号化単位ごとに、少なくとも一つの符号化モードについての情報が決定されねばならないので、一つの最大符号化単位については、少なくとも一つの符号化モードについての情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画されて、位置別に符号化深度が異なるので、データに対して符号化深度及び符号化モードについての情報が設定される。
したがって、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つに対して、該符号化深度及び符号化モードについての符号化情報が割り当てられる。
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位である。一実施形態による最小単位は、最大符号化単位に含まれるあらゆる符号化単位、予測単位、パーティション単位及び変換単位内に含まれる最大サイズの正方形のデータ単位である。
例えば、出力部130を通じて出力される符号化情報は、深度別の符号化単位別の符号化情報と、予測単位別の符号化情報とに分類される。深度別の符号化単位別の符号化情報は、予測モード情報及びパーティションサイズ情報を含む。予測単位別に伝送される符号化情報は、インターモードの推定方向についての情報、インターモードの参照映像インデックスについての情報、動きベクトルについての情報、イントラモードのクロマ成分についての情報、イントラモードの補間方式についての情報などを含む。また、ピクチャー、スライスまたはGOP別に定義される符号化単位の最大サイズについての情報及び最大深度についての情報は、ビットストリームのヘッダに挿入される。
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別の符号化単位は、一つの階層の上位深度の符号化単位の高さ及び幅を半分にしたサイズの符号化単位である。すなわち、現在深度の符号化単位のサイズが2N×2Nであれば、下位深度の符号化単位のサイズは、N×Nである。また、2N×2Nサイズの現在の符号化単位は、N×Nサイズの下位深度の符号化単位を最大四つ含む。
したがって、一実施形態によるビデオ復号化装置100は、現在のピクチャーの特性を考慮して決定された最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の形態及びサイズの符号化単位を決定して、ツリー構造による符号化単位を構成する。また、それぞれの最大符号化単位ごとに多様な予測モード、周波数変換方式などで符号化するので、多様な映像サイズの符号化単位の映像特性を考慮して、最適の符号化モードが決定される。
したがって、映像の解像度が非常に高いか、またはデータ量が非常に大きい映像を既存のマクロブロック単位で符号化すれば、ピクチャー当たりマクロブロックの数が過度に多くなる。これによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。したがって、一実施形態によるビデオ符号化装置は、映像のサイズを考慮して符号化単位の最大サイズを増大させつつ、映像特性を考慮して符号化単位を調節するので、映像圧縮効率が向上する。
図2は、本発明の一実施形態によるビデオ復号化装置を示すブロック図である。一実施形態によるビデオ復号化装置200は、受信部210、映像データ及び符号化情報抽出部220、及び映像データ復号化部230を備える。一実施形態によるビデオ復号化装置200の各種のプロセシングのための符号化単位、深度、予測単位、変換単位、各種の符号化モードについての情報など各種の用語の定義は、図1及びビデオ符号化装置100を参照して前述した通りである。
受信部205は、符号化されたビデオについてのビットストリームを受信してパージングする。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位によって、符号化単位ごとに符号化された映像データを抽出して、映像データ復号化部230に出力する。映像データ及び符号化情報抽出部220は、現在のピクチャーについてのヘッダから、現在のピクチャーの符号化単位の最大サイズについての情報を抽出する。
また、映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位についての符号化深度及び符号化モードについての情報を抽出する。抽出された符号化深度及び符号化モードについての情報は、映像データ復号化部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割して、映像データ復号化部230が最大符号化単位ごとに映像データを復号化するようにする。
最大符号化単位別の符号化深度及び符号化モードについての情報は、一つ以上の符号化深度情報に対して設定され、符号化深度別の符号化モードについての情報は、該符号化単位のパーティションタイプ情報、予測モード情報、及び変換単位のサイズ情報などを含む。また、符号化深度情報として、深度別の分割情報が抽出されもする。
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別の符号化深度及び符号化モードについての情報は、一実施形態によるビデオ符号化装置100のように、符号化端で最大符号化単位別の深度別の符号化単位ごとに反復的に符号化を行って、最小符号化誤差を発生させるものとして決定された符号化深度及び符号化モードについての情報である。したがって、ビデオ復号化装置200は、最小符号化誤差を発生させる符号化方式によって、データを復号化して映像を復元する。
一実施形態による符号化深度及び符号化モードについての符号化情報は、該符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して割り当てられているので、映像データ及び符号化情報抽出部220は、所定のデータ単位別に符号化深度及び符号化モードについての情報を抽出する。所定のデータ単位別に、該最大符号化単位の符号化深度及び符号化モードについての情報が記録されていれば、同じ符号化深度及び符号化モードについての情報を有している所定のデータ単位は、同じ最大符号化単位に含まれるデータ単位として類推される。
映像データ復号化部230は、最大符号化単位別の符号化深度及び符号化モードについての情報に基づいて、それぞれの最大符号化単位の映像データを復号化して、現在のピクチャーを復元する。すなわち、映像データ復号化部230は、最大符号化単位に含まれるツリー構造による符号化単位のうち、それぞれの符号化単位ごとに、読み取られたパーティションタイプ、予測モード、変換単位に基づいて、符号化された映像データを復号化する。復号化過程は、イントラ予測及び動き補償を含む予測過程、及び周波数逆変換過程を含む。
映像データ復号化部230は、符号化深度別の符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとにそれぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行う。
また、映像データ復号化部230は、最大符号化単位別の周波数逆変換のために、符号化深度別の符号化単位の変換単位のサイズ情報に基づいて、符号化単位ごとにそれぞれの変換単位によって周波数逆変換を行う。
映像データ復号化部230は、深度別分割情報を利用して、現在の最大符号化単位の符号化深度を決定する。もし、分割情報が現在深度でそれ以上分割されないことを表せば、現在深度が符号化深度である。したがって、映像データ復号化部230は、現在の最大符号化単位の映像データに対して、現在深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を利用して復号化する。
すなわち、符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して設定されている符号化情報を観察して、同じ分割情報を含む符号化情報を保有しているデータ単位が集まって、映像データ復号化部230により同じ符号化モードに復号化する一つのデータ単位として見なされる。
一実施形態によるビデオ復号化装置200は、符号化過程で最大符号化単位ごとに再帰的に符号化を行って、最小符号化誤差を発生させた符号化単位についての情報を獲得して、現在のピクチャーに対する復号化に利用する。すなわち、最大符号化単位ごとに最適符号化単位として決定されたツリー構造による符号化単位の符号化された映像データの復号化が可能になる。
したがって、高い解像度の映像またはデータ量が多すぎる映像であっても、符号化端から伝送された最適符号化モードについての情報を利用して、映像の特性に適応的に決定された符号化単位のサイズ及び符号化モードによって、効率的に映像データを復号化して復元する。
以下、図3ないし図15を参照して、本発明の一実施形態によるツリー構造による符号化単位、予測単位及び変換単位の決定方式について述べる。
図3は、階層的符号化単位の概念を示す。
符号化単位の例は、符号化単位のサイズが幅×高さで表現され、サイズ64×64の符号化単位から、32×32、16×16、8×8を含む。サイズ64×64の符号化単位は、サイズ64×64、64×32、32×64、32×32のパーティションに、サイズ32×32の符号化単位は、サイズ32×32、32×16、16×32、16×16のパーティションに、サイズ16×16の符号化単位は、サイズ16×16、16×8、8×16、8×8のパーティションに、サイズ8×8の符号化単位は、サイズ8×8、8×4、4×8、4×4のパーティションに分割される。
ビデオデータ310に対しては、解像度が1920×1080、符号化単位の最大サイズが64、最大深度が2に設定されている。ビデオデータ320に対しては、解像度が1920×1080、符号化単位の最大サイズが64、最大深度が3に設定されている。ビデオデータ330に対しては、解像度が352×288、符号化単位の最大サイズが16、最大深度が1に設定されている。図3に示す最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。
解像度が高いか、またはデータ量が多い場合、符号化効率の向上だけでなく、映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。したがって、ビデオデータ330に比べて、解像度の高いビデオデータ310,320は、符号化サイズの最大サイズが64として選択される。
ビデオデータ310の最大深度が2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64である最大符号化単位から2回分割し、深度が二階層深くなって、長軸サイズが32,16である符号化単位まで含む。一方、ビデオデータ330の最大深度が1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16である符号化単位から1回分割し、深度が一階層深くなって、長軸サイズが8である符号化単位まで含む。
ビデオデータ320の最大深度が3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から3回分割し、深度が三階層深くなって、長軸サイズが32,16,8である符号化単位まで含む。深度が深くなるほど、細部情報の表現能力が向上する。
図4は、本発明の一実施形態による符号化単位に基づいた映像符号化部を示すブロック図である。一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化単位決定部120で映像データを符号化するのに経る作業を含む。すなわち、イントラ予測部410は、現在のフレーム405のうち、イントラモードの符号化単位に対してイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在のフレーム405及び参照フレーム495を利用して、インター推定及び動き補償を行う。
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、周波数変換部430及び量子化部440を経て量子化された変換係数として出力される。量子化された変換係数は、逆量子化部460及び周波数逆変換部470を通じて空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て後処理されて、参照フレーム495として出力される。量子化された変換係数は、エントロピー符号化部450を経てビットストリーム455として出力される。
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループフィルタリング部490が、いずれも最大符号化単位ごとに最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位に基づいた作業を行わねばならない。
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在の最大符号化単位の最大サイズ及び最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位のパーティション及び予測モードを決定し、周波数変換部430は、ツリー構造による符号化単位のうち、それぞれの符号化単位内の変換単位のサイズを決定せねばならない。
図5は、本発明の一実施形態による符号化単位に基づいた映像復号化部を示すブロック図である。ビットストリーム505がパージング部510を経て、復号化対象である符号化された映像データ及び復号化のために必要な符号化についての情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て、逆量子化されたデータとして出力され、周波数逆変換部540を経て、空間領域の映像データが復元される。
空間領域の映像データに対して、イントラ予測部550は、イントラモードの符号化単位に対してイントラ予測を行い、動き補償部560は、参照フレーム585を共に利用して、インターモードの符号化単位に対して動き補償を行う。
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びループフィルタリング部580を経て後処理されて、復元フレーム595として出力される。また、デブロッキング部570及びループフィルタリング部580を経て後処理されたデータは、参照フレーム585として出力される。
ビデオ復号化装置200の映像データ復号化部230で映像データを復号化するために、一実施形態による映像復号化部500のパージング部510以後の段階別の作業が行われる。
一実施形態によるビデオ復号化装置200に適用されるためには、映像復号化部500の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580が、いずれも最大符号化単位ごとに、ツリー構造による符号化単位に基づいて作業を行わねばならない。
特に、イントラ予測部550及び動き補償部560は、ツリー構造による符号化単位ごとにパーティション及び予測モードを決定し、周波数逆変換部540は、符号化単位ごとに変換単位のサイズを決定せねばならない。
図6は、本発明の一実施形態による深度別の符号化単位及びパーティションを示す。一実施形態によるビデオ符号化装置100及び一実施形態によるビデオ復号化装置200は、映像特性を考慮するために階層的な符号化単位を使用する。符号化単位の最大高及び幅、最大深度は、映像の特性によって適応的に決定されてもよく、ユーザーの要求によって多様に設定されてもよい。既定された符号化単位の最大サイズによって、深度別の符号化単位のサイズが決定されてもよい。
一実施形態による符号化単位の階層構造600は、符号化単位の最大高及び幅が64であり、最大深度が4である場合を示している。一実施形態による符号化単位の階層構造600の縦軸に沿って深度が深くなるので、深度別の符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別の符号化単位の予測符号化の基盤となる予測単位及びパーティションが示されている。
すなわち、符号化単位610は、符号化単位の階層構造600のうち、最大符号化単位として深度が0であり、符号化単位のサイズ、すなわち、高さ及び幅が64×64である。縦軸に沿って深度が深くなり、サイズ32×32である深度1の符号化単位620、サイズ16×16である深度2の符号化単位630、サイズ8×8である深度3の符号化単位640、サイズ4×4である深度4の符号化単位650が存在する。サイズ4×4である深度4の符号化単位650は、最小符号化単位である。
それぞれの深度別に横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64×64の符号化単位610が予測単位であれば、予測単位は、サイズ64×64の符号化単位610に含まれるサイズ64×64のパーティション610、サイズ64×32のパーティション612、サイズ32×64のパーティション614、サイズ32×32のパーティション616に分割される。
同様に、深度1のサイズ32×32の符号化単位620の予測単位は、サイズ32×32の符号化単位620に含まれるサイズ32×32のパーティション620、サイズ32×16のパーティション622、サイズ16×32のパーティション624、サイズ16×16のパーティション626に分割される。
同様に、深度2のサイズ16×16の符号化単位630の予測単位は、サイズ16×16の符号化単位630に含まれるサイズ16×16のパーティション630、サイズ16×8のパーティション632、サイズ8×16のパーティション634、サイズ8×8のパーティション636に分割される。
同様に、深度3のサイズ8×8の符号化単位640の予測単位は、サイズ8×8の符号化単位640に含まれるサイズ8×8のパーティション640、サイズ8×4のパーティション642、サイズ4×8のパーティション644、サイズ4×4のパーティション646に分割される。
最後に、深度4のサイズ4×4の符号化単位650は、最小符号化単位であり、かつ最下位深度の符号化単位であり、該予測単位も、サイズ4×4のパーティション650のみに設定される。
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を決定するために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに符号化を行わねばならない。
同じ範囲及び大きさのデータを含むための深度別の符号化単位の個数は、深度が深くなるほど、深度別の符号化単位の個数も増加する。例えば、深度1の一つの符号化単位が含むデータに対して、深度2の符号化単位は、四つ必要である。したがって、同じデータの符号化結果を深度別に比較するために、一つの深度1の符号化単位及び四つの深度2の符号化単位を利用してそれぞれ符号化されねばならない。
それぞれの深度別の符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別の符号化単位の予測単位ごとに符号化を行って、該深度から最も小さい符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って深度が深くなり、それぞれの深度ごとに符号化を行って、深度別の代表符号化誤差を比較して、最小符号化誤差が検索される。最大符号化単位610のうち、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプとして選択される。
図7は、本発明の一実施形態による符号化単位及び変換単位の関係を示す。一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200は、最大符号化単位ごとに、最大符号化単位より小さいか、またはそれと同じサイズの符号化単位で映像を符号化または復号化する。符号化過程中で、周波数変換のための変換単位のサイズは、それぞれの符号化単位より大きくないデータ単位に基づいて選択される。
例えば、一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200において、現在の符号化単位710が64×64サイズであるとき、32×32サイズの変換単位720を利用して周波数変換が行われる。
また、64×64サイズの符号化単位710のデータを、64×64サイズ以下の32×32、16×16、8×8、4×4サイズの変換単位にそれぞれ周波数変換を行って符号化した後、原本との誤差が最も少ない変換単位が選択される。
図8は、本発明の一実施形態による深度別の符号化情報を示す。一実施形態によるビデオ符号化装置100の出力部130は、符号化モードについての情報として、それぞれの符号化深度の符号化単位ごとに、パーティションタイプについての情報800、予測モードについての情報810、変換単位サイズについての情報820を符号化して伝送する。
パーティションタイプについての情報800は、現在の符号化単位の予測符号化のためのデータ単位であって、現在の符号化単位の予測単位が分割されたパーティションの形態についての情報を表す。例えば、サイズ2N×2Nの現在の符号化単位CU_0は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、サイズN×Nのパーティション808のうちいずれか一つのタイプに分割されて利用される。この場合、現在の符号化単位のパーティションタイプについての情報800は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、及びサイズN×Nのパーティション808のうち一つを表すように設定される。
予測モードについての情報810は、それぞれのパーティションの予測モードを表す。例えば、予測モードについての情報810を通じて、パーティションタイプについての情報800が指すパーティションが、イントラモード812、インターモード814、及びスキップモード816のうち一つで予測符号化が行われるかが設定される。
また、変換単位サイズについての情報820は、現在の符号化単位をいかなる変換単位に基づいて周波数変換を行うかを表す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インター変換単位サイズ826、及び第2イントラ変換単位サイズ828のうち一つである。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部210は、それぞれの深度別の符号化単位ごとに、パーティションタイプについての情報800、予測モードについての情報810、変換単位サイズについての情報820を抽出して復号化に利用する。
図9は、本発明の一実施形態による深度別の符号化単位を示す。
深度の変化を表すために、分割情報が利用される。分割情報は、現在深度の符号化単位が下位深度の符号化単位に分割されるか否かを表す。
深度0及び2N_0×2N_0サイズの符号化単位900の予測符号化のための予測単位910は、2N_0×2N_0サイズのパーティションタイプ912、2N_0×N_0サイズのパーティションタイプ914、N_0×2N_0サイズのパーティションタイプ916、N_0×N_0サイズのパーティションタイプ918を含む。予測単位が対称的割合で分割されたパーティション912,914,916,918のみが例示されているが、前述したように、パーティションタイプは、これらに限定されず、非対称的なパーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含んでもよい。
パーティションタイプごとに、一つの2N_0×2N_0サイズのパーティション、二つの2N_0×N_0サイズのパーティション、二つのN_0×2N_0サイズのパーティション、四つのN_0×N_0サイズのパーティションごとに反復的に予測符号化が行われねばならない。サイズ2N_0×2N_0、サイズN_0×2N_0、サイズ2N_0×N_0、及びサイズN_0×N_0のパーティションに対しては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ2N_0×2N_0のパーティションのみに対して予測符号化が行われる。
サイズ2N_0×2N_0、2N_0×N_0及びN_0×2N_0のパーティションタイプ912,914,916のうち一つによる符号化誤差が最も小さければ、それ以上下位深度に分割する必要がない。
サイズN_0×N_0のパーティションタイプ918による符号化誤差が最も小さければ、深度0を1に変更して分割し(920)、深度2及びサイズN_0×N_0のパーティションタイプの符号化単位930に対して反復的に符号化を行って、最小符号化誤差を検索する。
深度1及びサイズ2N_1×2N_1(=N_0×N_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1×2N_1のパーティションタイプ942、サイズ2N_1×N_1のパーティションタイプ944、サイズN_1×2N_1のパーティションタイプ946、サイズN_1×N_1のパーティションタイプ948を含む。
また、サイズN_1×N_1のパーティションタイプ948による符号化誤差が最も小さければ、深度1を深度2に変更して分割し(950)、深度2及びサイズN_2×N_2の符号化単位960に対して反復的に符号化を行って、最小符号化誤差を検索する。
最大深度がdである場合、深度別の分割情報は、深度d−1であるまで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2から分割されて(970)、深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)×2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)×2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)×N_(d−1)のパーティションタイプ994、サイズN_(d−1)×2N_(d−1)のパーティションタイプ996、サイズN_(d−1)×N_(d−1)のパーティションタイプ998を含む。
パーティションタイプのうち、一つのサイズ2N_(d−1)×2N_(d−1)のパーティション、二つのサイズ2N_(d−1)×N_(d−1)のパーティション、二つのサイズN_(d−1)×2N_(d−1)のパーティション、四つのサイズN_(d−1)×N_(d−1)のパーティションごとに反復的に予測符号化を通じた符号化が行われて、最小符号化誤差が発生するパーティションタイプが検索される。
サイズN_(d−1)×N_(d−1)のパーティションタイプ998による符号化誤差が最も小さいとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、それ以上下位深度への分割過程を経ず、現在の最大符号化単位900についての符号化深度が深度d−1として決定され、パーティションタイプは、N_(d−1)×N_(d−1)として決定される。また、最大深度がdであるので、深度d−1の符号化単位952に対して分割情報は設定されない。
データ単位999は、現在の最大符号化単位についての‘最小単位’と称する。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位である。かかる反復的な符号化過程を通じて、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別の符号化誤差を比較して、最も小さい符号化誤差が発生する深度を選択して、符号化深度を決定し、該パーティションタイプ及び予測モードが符号化深度の符号化モードに設定される。
かかる方法で、深度0,1,…,d−1,dのあらゆる深度別の最小符号化誤差を比較して、誤差の最も小さい深度が選択されて、符号化深度として決定される。符号化深度、予測単位のパーティションタイプ、及び予測モードは、符号化モードについての情報として符号化されて伝送される。また、深度0から符号化深度に達するまで符号化単位が分割されねばならないので、符号化深度の分割情報のみが‘0’に設定され、符号化深度を除いた深度別の分割情報は、‘1’に設定されねばならない。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部220は、符号化単位900についての符号化深度、及び予測単位についての情報を抽出して、符号化単位912を復号化するのに利用する。一実施形態によるビデオ復号化装置200は、深度別の分割情報を利用して、分割情報が‘0’である深度を符号化深度として把握し、該深度についての符号化モードに関する情報を利用して復号化に利用する。
図10、図11及び図12は、本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す。
符号化単位1010は、最大符号化単位に対して、一実施形態によるビデオ符号化装置100が決定した符号化深度別の符号化単位である。予測単位1060は、符号化単位1010のうち、それぞれの符号化深度別の符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別の符号化単位の変換単位である。
深度別の符号化単位1010は、最大符号化単位の深度が0とすれば、符号化単位1012,1054は、深度が1、符号化単位1014,1016,1018,1028,1050,1052は、深度が2、符号化単位1020,1022,1024,1026,1030,1032,1048は、深度が3、符号化単位1040,1042,1044,1046は、深度が4である。
予測単位1060のうち、一部のパーティション1014,1016,1022,1032,1048,1050,1052,1054は、符号化単位が分割された形態である。すなわち、パーティション1014,1022,1050,1054は、2N×Nのパーティションタイプであり、パーティション1016,1048,1052は、N×2Nのパーティションタイプ、パーティション1032は、N×Nのパーティションタイプである。深度別の符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位より小さいか、またはそれと同じである。
変換単位1070のうち、符号化単位1052の映像データに対しては、符号化単位に比べて小さいデータ単位で周波数変換または周波数逆変換が行われる。また、変換単位1014,1016,1022,1032,1048,1050,1052,1054は、予測単位1060のうち、該予測単位及びパーティションと比較すれば、相異なるサイズまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200は、同じ符号化単位に対するイントラ予測/動き推定/動き補償作業、及び周波数変換/逆変換作業であるとしても、それぞれのデータ単位に基づいて行う。
これによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに再帰的に符号化が行われて、最適符号化単位が決定されることで、再帰的なツリー構造による符号化単位が構成される。符号化情報は、符号化単位についての分割情報、パーティションタイプ情報、予測モード情報、及び変換単位サイズ情報を含む。以下、表1は、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200で設定できる一例を示す。
Figure 2013502133
一実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位についての符号化情報を出力し、一実施形態によるビデオ復号化装置200の符号化情報抽出部220は、受信されたビットストリームから、ツリー構造による符号化単位についての符号化情報を抽出する。
分割情報は、現在の符号化単位が下位深度の符号化単位に分割されるか否かを表す。現在深度dの分割情報が0であれば、現在の符号化単位が下位符号化単位にそれ以上分割されない深度が符号化深度であるので、符号化深度に対して、パーティションタイプ情報、予測モード、変換単位サイズ情報が定義される。分割情報によって、一段階さらに分割されねばならない場合には、分割された四つの下位深度の符号化単位ごとに独立的に符号化が行われねばならない。
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで表す。イントラモード及びインターモードは、あらゆるパーティションタイプで定義され、スキップモードは、パーティションタイプ2N×2Nのみで定義される。
パーティションタイプ情報は、予測単位の高さまたは幅が対称的な割合で分割された対称的なパーティションタイプ2N×2N、2N×N、N×2N、N×N、及び非対称的な割合で分割された非対称的なパーティションタイプ2N×nU、2N×nD、nL×2N、nR×2Nを表す。非対称的なパーティションタイプ2N×nU及び2N×nDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的なパーティションタイプnL×2N及びnR×2Nは、それぞれ幅が1:3及び3:1に分割された形態を表す。
変換単位のサイズは、イントラモードで二つのサイズ、インターモードで二つのサイズに設定される。すなわち、変換単位の分割情報が0であれば、変換単位のサイズが現在の符号化単位のサイズ2N×2Nに設定される。変換単位の分割情報が1であれば、現在の符号化単位が分割されたサイズの変換単位に設定される。また、サイズ2N×2Nである現在の符号化単位についてのパーティションタイプが対称形のパーティションタイプであれば、変換単位のサイズはN×N、非対称型のパーティションタイプであれば、N/2×N/2に設定される。
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位、及び最小単位のうち少なくとも一つに対して割り当てられる。符号化深度の符号化単位は、同じ符号化情報を保有している予測単位及び最小単位を一つ以上含む。
したがって、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同じ符号化深度の符号化単位に含まれるか否かが確認される。また、データ単位が保有している符号化情報を利用すれば、該符号化深度の符号化単位を確認できるので、最大符号化単位内の符号化深度の分布が類推される。
したがって、この場合、現在の符号化単位が周辺のデータ単位を参照して予測する場合、現在の符号化単位に隣接する深度別の符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
他の実施形態として、現在の符号化単位が周辺の符号化単位を参照して予測符号化が行われる場合、隣接する深度別の符号化単位の符号化情報を利用して、深度別の符号化単位内で現在の符号化単位に隣接するデータが検索されることで、周辺の符号化単位が参照されてもよい。
図13は、表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す。最大符号化単位1300は、符号化深度の符号化単位1302,1304,1306,1312,1314,1316,1318を含む。そのうち一つの符号化単位1318は、符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2N×2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2N×2N 1322,2N×N 1324,N×2N 1326,N×N 1328,2N×nU 1332,2N×nD 1334,nL×2N 1336及びnR×2N 1338のうち一つに設定される。
パーティションタイプ情報が対称形のパーティションタイプ2N×2N 1322,2N×N 1324,N×2N 1326及びN×N
1328のうち一つに設定されている場合、変換単位の分割情報(TU size flag)が0であれば、サイズ2N×2Nの変換単位1342が設定され、変換単位の分割情報が1であれば、サイズN×Nの変換単位1344が設定される。
パーティションタイプ情報が非対称型のパーティションタイプ2N×nU 1332,2N×nD 1334,nL×2N
1336及びnR×2N 1338のうち一つに設定された場合、変換単位の分割情報が0であれば、サイズ2N×2Nの変換単位1352が設定され、変換単位の分割情報が1であれば、サイズN/2×N/2の変換単位1354が設定される。
図15を参照して前述した変換単位の分割情報は、0または1の値を有するフラグであるが、一実施形態による変換単位の分割情報が1ビットのフラグに限定されるものではなく、設定によって0,1,2,3…などに増加して、変換単位が階層的に分割されてもよい。
この場合、一実施形態による変換単位の分割情報を変換単位の最大サイズ、変換単位の最小サイズと共に利用すれば、実際に利用された変換単位のサイズが表現される。一実施形態によるビデオ符号化装置100は、最大変換単位サイズ情報、最小変換単位サイズ情報、及び最大変換単位分割情報を符号化する。符号化された最大変換単位サイズ情報、最小変換単位サイズ情報、及び最大変換単位分割情報は、SPSに挿入される。一実施形態によるビデオ復号化装置200は、最大変換単位サイズ情報、最小変換単位サイズ情報、及び最大変換単位分割情報を利用して、ビデオ復号化に利用する。
例えば、(a)現在の符号化単位のサイズが64×64であり、最大変換単位のサイズが32×32であれば、(a−1)変換単位の分割情報が0であるとき、変換単位のサイズが32×32、(a−2)変換単位の分割情報が1であるとき、変換単位のサイズが16×16、(a−3)変換単位の分割情報が2であるとき、変換単位のサイズが8×8に設定される。
他の例として、(b)現在の符号化単位のサイズが32×32であり、最小変換単位のサイズが32×32であれば、(b−1)変換単位の分割情報が0であるとき、変換単位のサイズが32×32に設定され、変換単位のサイズが32×32より小さくないので、それ以上の変換単位の分割情報が設定されない。
さらに他の例として、(c)現在の符号化単位のサイズが64×64であり、最大変換単位の分割情報が1であれば、変換単位の分割情報は0または1であり、他の変換単位の分割情報が設定されない。
したがって、最大変換単位の分割情報を‘MaxTransformSizeIndex’、最小変換単位サイズを‘MinTransformSize’、変換単位の分割情報が0である場合の変換単位サイズを‘RootTuSize’と定義するとき、現在の符号化単位で可能な最小変換単位サイズ‘CurrMinTuSize’は、下記(関係式1)のように定義される。
CurrMinTuSize
=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) (関係式1)
現在の符号化単位で可能な最小変換単位サイズ‘CurrMinTuSize’と比較して、変換単位の分割情報が0である場合の変換単位サイズ‘RootTuSize’は、システム上、採択可能な最大変換単位サイズを表す。すなわち、(関係式1)によれば、‘RootTuSize/(2^MaxTransformSizeIndex)’は、変換単位の分割情報が0である場合の変換単位サイズ‘RootTuSize’を最大変換単位の分割情報に相応する回数ほど分割した変換単位サイズであり、‘MinTransformSize’は、最小変換単位サイズであるので、それらのうち小さい値が、現在の符号化単位で可能な最小変換単位サイズ‘CurrMinTuSize’である。
一実施形態による最大変換単位サイズRootTuSizeは、予測モードによって変わってもよい。
例えば、現在の予測モードがインターモードであれば、RootTuSizeは、下記(関係式2)によって決定される。(関係式2)で、‘MaxTransformSize’は、最大変換単位サイズ、‘PUSize’は、現在の予測単位サイズを表す。
RootTuSize=min(MaxTransformSize,PUSize) (関係式2)
すなわち、現在の予測モードがインターモードであれば、変換単位の分割情報が0である場合の変換単位サイズ‘RootTuSize’は、最大変換単位サイズ及び現在の予測単位サイズのうち小さい値に設定される。
現在のパーティション単位の予測モードがイントラモードであれば、‘RootTuSize’は、下記(関係式3)によって決定される。‘PartitionSize’は、現在のパーティション単位のサイズを表す。
RootTuSize=min(MaxTransformSize,PartitionSize) (関係式3)
すなわち、現在の予測モードがイントラモードであれば、変換単位の分割情報が0である場合の変換単位サイズ‘RootTuSize’は、最大変換単位サイズ及び現在のパーティション単位サイズのうち小さい値に設定される。
ただし、パーティション単位の予測モードによって変動する一実施形態による現在の最大変換単位サイズ‘RootTuSize’は、一実施形態であるのみ、現在の最大変換単位サイズを決定する要因がこれに限定されるものではないことに留意せねばならない。
図14は、本発明の一実施形態によるビデオ符号化方法のフローチャートを示す。
ステップ1210で、現在のピクチャーは、少なくとも一つの最大符号化単位に分割される。また、可能な総分割回数を表す最大深度が既定であってもよい。
ステップ1220で、深度ごとに最大符号化単位の領域が分割された少なくとも一つの分割領域が符号化されて、少なくとも一つの分割領域別に最終符号化結果が出力される深度が決定され、ツリー構造による符号化単位が決定される。
最大符号化単位は、深度が深くなる度に空間的に分割されて、下位深度の符号化単位に分割される。それぞれの符号化単位は、隣接する他の符号化単位と独立的に、空間的に分割されつつ、再び下位深度の符号化単位に分割される。深度別に符号化単位ごとに反復的に符号化が行われねばならない。
また、深度別の符号化単位ごとに、符号化誤差の最も小さいパーティションタイプ別の変換単位が決定されねばならない。符号化単位の最小符号化誤差を発生させる符号化深度が決定されるために、あらゆる深度別の符号化単位ごとに符号化誤差が測定されて比較される。
ステップ1230で、最大符号化単位ごとに少なくとも一つの分割領域別の最終符号化結果である映像データと、符号化深度及び符号化モードについての情報とが出力される。符号化モードについての情報は、符号化深度についての情報または分割情報、予測単位のパーティションタイプ情報、予測モード情報、及び変換単位サイズ情報などを含む。符号化された符号化モードについての情報は、符号化された映像データと共に復号化端へ伝送される。
図15は、本発明の一実施形態によるビデオ復号化方法のフローチャートを示す。
ステップ1310で、符号化されたビデオについてのビットストリームが受信されてパージングされる。
ステップ1320で、パージングされたビットストリームから、最大サイズの最大符号化単位に割り当てられる現在のピクチャーの映像データと、最大符号化単位別の符号化深度及び符号化モードについての情報とが抽出される。最大符号化単位別の符号化深度は、現在のピクチャーの符号化過程で、最大符号化単位別に符号化誤差が最も小さい深度として選択された深度である。最大符号化単位別の符号化は、最大符号化単位を深度別に階層的に分割した少なくとも一つのデータ単位に基づいて、映像データが符号化されたのである。
一実施形態による符号化深度及び符号化モードについての情報によれば、最大符号化単位がツリー構造による符号化単位に分割される。ツリー構造による符号化単位による符号化単位は、それぞれ符号化深度の符号化単位である。したがって、符号化単位別の符号化深度を把握した後、それぞれの映像データを復号化することで、映像の符復号化の効率性が向上する。
ステップ1330で、最大符号化単位別の符号化深度及び符号化モードについての情報に基づいて、それぞれの最大符号化単位の映像データが復号化される。復号化された映像データは、再生装置により再生されるか、または記録媒体に保存されるか、またはネットワークを通じて伝送される。
以下、図16ないし図21を参照して、本発明の一実施形態によって、空間的に階層的なデータ単位に基づいて、適応的なループフィルタリングを利用するビデオ符号化及びビデオ復号化について述べる。
図16は、本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ符号化装置を示す。
一実施形態によるビデオ符号化装置1400は、最大符号化単位分割部1410、符号化単位決定部1420、及び出力部1460を備える。出力部1460は、符号化された映像データ出力部1430、符号化情報出力部1440、及びループフィルタ係数情報出力部1450を備える。
最大符号化単位分割部1410及び符号化単位決定部1420は、図1を参照して前述したビデオ符号化装置100の最大符号化単位分割部110及び符号化単位決定部120と同じ機能の構成要素である。また、符号化された映像データ出力部1430及び符号化情報出力部1440は、図1を参照して前述したビデオ符号化装置100の出力部130の一部の機能を行う。
ただし、ビデオ符号化装置1400のビデオ符号化は、一実施形態によって、連続的な一次元フィルタリングにより行われるループフィルタリングを含む。一実施形態によるビデオ符号化装置1400のループフィルタリングによる特徴を後述する。
一実施形態によって、最大符号化単位分割部1410は、映像の現在のピクチャーのための最大サイズの符号化単位である最大符号化単位に基づいて、現在のピクチャーを区画し、符号化単位決定部1420は、最大符号化単位ごとに深度別の符号化単位で映像データを符号化して、少なくとも一つの分割領域別に最終符号化結果が出力される深度を決定する。
一実施形態によって符号化された映像データ出力部1430は、符号化深度に基づいて符号化された最大符号化単位の映像データのビットストリームを出力する。符号化情報出力部1440は、最大符号化単位ごとに深度別の符号化モードについての情報を符号化して出力する。
一実施形態によるループフィルタ係数情報出力部1450は、現在のピクチャーの符号化中、デブロッキング以後に連続的な一次元フィルタリングにより行われるループフィルタリングのフィルタ係数情報を符号化して出力する。一実施形態によるループフィルタリングは、複数の一次元フィルタの連続的なフィルタリングによる。ループフィルタリングは、ルマ成分及びクロマ成分に対して別個に行われる。
一実施形態によるビデオ符号化装置1400が映像符号化部400に対応する場合、量子化された変換係数が、逆量子化部460及び周波数逆変換部470を通じて時間領域のデータに復元され、復元された時間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て、参照フレーム495が生成される。一実施形態によるループフィルタ係数情報出力部1450は、ループフィルタリング部490で利用されるフィルタ係数を符号化して出力する。
符号化されるフィルタ係数情報は、それぞれの一次元フィルタに対するフィルタ係数についての情報を含み、各一次元フィルタのフィルタ係数の情報は、連続的なフィルタ係数間の差値についての情報を含む。すなわち、それぞれの一次元フィルタのフィルタ係数の残差成分が符号化される。具体的に、ループフィルタ係数情報出力部1450は、それぞれの一次元フィルタごとに、残差情報として、現在のフィルタ係数と以前のフィルタ係数との差値を符号化する。
連続的な一次元フィルタリングは、水平方向の一次元フィルタ、及び垂直方向の一次元フィルタの連続的なフィルタリングである。詳しくは、水平方向の9個の連続的なデブロッキングされたデータに対して、水平方向の一次元フィルタリングを行い、連続的に垂直方向の9個の連続的なデブロッキングされたデータに対して、垂直方向の一次元フィルタリングを行う。この場合、水平方向の一次元フィルタ及び垂直方向の一次元フィルタは、対称形のフィルタであり、フィルタ係数の個数は、それぞれ5個ずつである。
一次元フィルタのフィルタ係数は、ウィナーフィルタ方式(Wiener filter approach)により決定される。
一実施形態によるビデオ符号化装置1400は、それぞれの一次元フィルタの種類、個数、サイズ、量子化ビット、係数、フィルタリング方向、フィルタリング実行如何、及びランニングフィルタリング実行如何などを設定して、フィルタ係数情報以外に、ループフィルタリングの一次元フィルタセットについての情報を符号化して伝送してもよい。
一次元フィルタセットについての情報は、ピクチャー、スライス、シーケンスなどのデータ単位で設定されている。
例えば、それぞれの一次元フィルタの種類は、ウィナーフィルタであるか、対称または非対称なフィルタなどを含む所定のフィルタとして決定される。一次元フィルタがウィナーフィルタである場合、フィルタ係数がフィルタ間の相互相関マトリックスにより決定されるので、フィルタ係数情報は、個別的な係数の代わりに、相互相関マトリックスについての情報を含む。
それぞれの一次元フィルタのフィルタリング方向は、所定の角度の一直線上に位置したピクセルについてのフィルタリング方向として決定される。例えば、垂直(±90゜)、水平(0゜,180゜)、対角線(±45゜,±135゜)など±0ないし180゜の所定の角度のフィルタリング方向による一次元フィルタリングが行われる。
または、それぞれの一次元フィルタのフィルタリング方向が、映像データのうちローカル映像の特性に適応的に決定される。例えば、映像データのうち、ローカル映像のエッジを検出して、検出されたエッジの方向によるフィルタリング方向に沿って、一次元フィルタリングが行われるようにフィルタが決定される。
複数の一次元フィルタセットを、一つ以上の連続的な一次元フィルタを含むサブフィルタセットに分類して、それぞれのサブフィルタセット別に一次元フィルタリングを行うか否かが決定される。すなわち、同じサブフィルタセットのフィルタは、いずれもフィルタリングが行われるか、いずれも行われないかが決定されもする。
以前のピクセルの一次元フィルタリングの結果が、現在のピクセルの一次元フィルタリングに影響を与えるランニングフィルタリング方式であるか否かが決定される。ランニングフィルタリング方式による一次元フィルタリングによれば、以前のピクセルのフィルタリング結果が更新されることで、連続的に以前のピクセルのフィルタリングされたデータを入力されて、現在のピクセルのフィルタリングが行われる。
図17は、本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ復号化装置を示す。
一実施形態によるビデオ復号化装置1500は、受信部1501、抽出部1505、及び映像データ復号化部1540を備える。抽出部1505は、映像データ獲得部1510、符号化情報抽出部1520、及びループフィルタ係数情報抽出部1530を備える。映像データ復号化部1540は、図2を参照して前述したビデオ復号化装置200の映像データ復号化部230にそれぞれ対応し、映像データ獲得部1510及び符号化情報抽出部1520は、ビデオ復号化装置200の抽出部220の一部の機能を行う。
ただし、映像データ復号化部1540は、連続的な一次元フィルタリングによるループフィルタリングを行うループフィルタリング実行部1550を備える。一実施形態によるビデオ復号化装置1500の連続的な一次元フィルタリングにより、適応的なループフィルタリングを行って復号化する特徴を後述する。
受信部1501は、符号化されたビデオについてのビットストリームを受信してパージングし、抽出部1505は、パージングされた受信したビットストリームから、各種の符号化された情報を抽出する。映像データ獲得部1510は、パージングされた受信したビットストリームから、最大符号化単位別に符号化された映像データを獲得する。符号化情報抽出部1520は、受信したビットストリームをパージングして、現在のピクチャーについてのヘッダから、最大符号化単位別の符号化深度及び符号化モードについての情報を抽出する。
ループフィルタ係数情報抽出部1530は、現在のピクチャーのループフィルタリングのためのフィルタ係数情報を抽出する。符号化単位パターン情報抽出部1530は、ループフィルタリングが連続的な一次元フィルタリングによる場合、複数の一次元フィルタのフィルタ係数を抽出する。
ループフィルタ係数情報抽出部1530は、連続的な一次元フィルタリングの複数の一次元フィルタのうち、それぞれの一次元フィルタに対して、連続的なフィルタ係数間の差値についての残差情報を抽出する。
映像データ復号化部1540は、最大符号化単位別の符号化深度及び符号化モードについての情報に基づいて、それぞれの最大符号化単位の符号化された映像データを復号化して、現在のピクチャーを復元する。映像データ復号化部1540は、時間領域の映像データに復号化された現在のピクチャーのデータに対してデブロッキングを行い、デブロッキングされたデータに対して、ループフィルタ係数情報抽出部1530で抽出されたフィルタ係数を利用して、ループフィルタリングを行う。ループフィルタリングは、ルマ成分及びクロマ成分に対して別個に行われる。
一実施形態による映像データ復号化部1540が映像復号化部500に対応する場合、映像データ復号化部1540のループフィルタリング部1550は、ループフィルタリング部580に対応し、デブロッキング部570によりデブロッキングされたデータに対して、連続的な一次元フィルタリングを行う。デブロッキングされてループフィルタリングが行われたデータは、バッファに保存され、次のピクチャーの動き補償のための参照映像として利用される。
ループフィルタリング実行部1550は、水平方向の一次元フィルタリング及び垂直方向の一次元フィルタリングを連続的に行って、現在のピクチャーを復元する。ループフィルタリング実行部1550は、ループフィルタ係数情報抽出部1530から抽出されたフィルタ係数の残差情報を利用して、それぞれの一次元フィルタのフィルタ係数を誘導する。
例えば、それぞれの一次元フィルタごとに、現在のフィルタ係数と以前のフィルタ係数との差値を以前のフィルタ係数に加えることで、現在のフィルタ係数が誘導される。誘導されたそれぞれの一次元フィルタのフィルタ係数を利用して、デブロッキングされたデータに対して、連続的な一次元フィルタリングが行われる。デブロッキングは、復号化されたデータのブロック効果を低下させ、ループフィルタリングは、復元された映像と原本映像との誤差を最小化させる。
発明の具体的な理解のために、水平方向及び垂直方向の連続的な一次元フィルタリングによるループフィルタリングを、以下数式を参照して述べる。
現在のフィルタ係数は、式(1)によって誘導される。
c[i][j]=adaptive_loop_filter_prev[i][j]+adaptive_loop_filter[i][j] (1)
ここで、iは、一次元フィルタのインデックスを表し、jは、各一次元フィルタのフィルタ係数のインデックスを表す。c[i][j]は、現在のフィルタ係数、adaptive_loop_filter_prev[i][j]は、以前のフィルタ係数、adaptive_loop_filter[i][j]は、フィルタ係数情報として伝送されたフィルタ係数の残差成分を表す。
すなわち、現在のフィルタ係数は、以前のフィルタ係数と残差成分との和として誘導される。現在のフィルタ係数を誘導した後、次のフィルタ係数を誘導するために、現在のフィルタ係数c[i][j]がadaptive_loop_filter_prev[i][j]に更新される。
連続的な一次元フィルタリングによるループフィルタリングは、式(2)及び(3)によって行われる。式(2)及び(3)で、iは、現在のピクチャーの幅方向のインデックス、jは、現在のピクチャーの高さ方向のインデックスを表す。
qi,j=(pi,j-4*c[0][4]+pi,j-3*c[0][3]+pi,j-2*c[0][2]+pi,j-1*c[0][1]+pi,j*c[0][0]+pi,j+1*c[0][1]+pi,j+2*c[0][2]+pi,j+3*c[0][3]+pi,j+4*c[0][4]) (2)
i,jは、現在のピクチャーのデブロッキングされたデータを表し、qi,jは、デブロッキングされたデータに対して、水平方向の一次元フィルタリングされたデータを表す。対称形のフィルタのフィルタ係数cを利用して、9個のデブロッキングされたデータに対して、5個のフィルタ係数を利用して対称的にフィルタリングされる。
fi,j=(qi,j-4*c[1][4]+qi,j-3*c[1][3]+qi,j-2*c[1][2]+qi,j-1*c[1][1]+qi,j*c[1][0]+qi,j+1*c[1][1]+qi,j+2*c[1][2]+qi,j+3*c[1][3]+qi,j+4*c[1][4]) (3)
i,jは、qi,jに対して垂直方向の一次元フィルタリングしたデータを表す。フィルタ係数cは、ランニングフィルタリング方式によるので、水平方向の一次元フィルタリングされたデータに対して、連続的に垂直方向の一次元フィルタリングが行われる。
対称形のフィルタの場合、二次元フィルタに比べて、一次元フィルタが少量の係数のみでも、あらゆるフィルタの係数が設定されるという長所がある。したがって、二次元フィルタに比べて、複数の一次元フィルタセットが、伝送ビットストリームに挿入されるフィルタ特性と関連したビットが相対的に少なく必要である。
また、フィルタリングの間に臨時データを保存するためのメモリの容量も、二次元フィルタに比べて一次元フィルタが少ない。二次元フィルタによるフィルタリングの演算量は、一次元フィルタリングに比べて顕著に大きい。ランニングフィルタリングの場合、二次元では複数のフィルタリングによる併行処理が不可能であるが、一次元フィルタによっては併行処理が可能である。
しかし、一実施形態によるループフィルタリングは、水平方向及び垂直方向の連続的な一次元フィルタリングに限定されるものではない。一実施形態によるループフィルタリングは、任意の個数の一次元フィルタの連続的なフィルタリングで具現され、それぞれの一次元フィルタリングは、任意の方向に行われる。
一実施形態によるビデオ復号化装置1500は、フィルタ係数情報以外に、ループフィルタリングの一次元フィルタセットについての情報を受信されて、それぞれの一次元フィルタの種類、個数、サイズ、量子化ビット、係数、フィルタリング方向、フィルタリング実行如何、及びランニングフィルタリング実行如何などを確認できる。これによって、ループフィルタリング実行部1550は、多様な一次元フィルタの組み合わせによるループフィルタリングを行う。
ループフィルタリングによる後処理は、複雑な損失圧縮により発生する原本映像と復元映像との歪曲を減少させる。また、ループフィルタリングされた映像を参照映像として利用することで、予測または動き補償の結果映像の画質が向上する。
多様な特徴の一次元フィルタの組み合わせを通じて、映像の特徴、システム環境またはユーザー要求などを考慮した適応的なループフィルタリングが可能である。また、二次元フィルタの代わりに、連続的な一次元フィルタが利用されるので、二次元フィルタに比べて、メモリー、演算量、伝送ビットなどの多様な方面で有利である。さらに、フィルタ係数の残差成分が符号化されて伝送されるので、フィルタ係数を伝送するのに発生する負担が低減する。
図18は、本発明の一実施形態による連続的な一次元フィルタリングのフローチャートを示す。
複数の一次元フィルタが連続的にフィルタリングされることで、ループフィルタリングが行われる。ステップ1610で、デブロッキングされた復元映像が入力され、ステップ1620で、第1フィルタ、第2フィルタないし第Nフィルタのあらゆるフィルタの使用如何が決定され、いずれも使用しないと決定されれば、保存または再生(ステップ1660)に直ちに進む。ステップ1620で、あらゆるフィルタによるフィルタリングを行うと決定されれば、フィルタリング順序によって、ステップ1630で、第1フィルタを利用した第1フィルタリング方向の一次元フィルタリング、ステップ1640で、第2フィルタを利用した第2フィルタリング方向の一次元フィルタリング、ステップ1650で、第Nフィルタを利用した第Nフィルタリング方向の一次元フィルタリングまで順次に行われる。
ステップ1660では、デブロッキングされた復元映像データ、または連続的に一次元フィルタリングされたデータがバッファに保存されるか、または再生装置で再生される。
図19は、本発明の他の実施形態によるループフィルタリングのフローチャートを示す。
一実施形態の一次元フィルタのフィルタリング方向は、映像特性の分析を通じてローカル映像の特性に適応的に決定される。例えば、映像のエッジを保存するために、ローカル映像のエッジ方向に適応的にフィルタリング方向が決定される。
ステップ1710で、復元された映像データが入力されれば、ステップ1720では、復元された映像データのそれぞれのピクセルごとにエッジが検出される。ステップ1730では、検出されたエッジ方向によって、一次元フィルタリングが行われ、ステップ1740で、フィルタリングされたデータは、保存されるか、または再生装置で再生される。
ビデオ符号化過程で、エッジ方向によって決定されたフィルタリング方向を含む1次フィルタセットについての情報は、符号化されて復号化端に提供される。ビデオ復号化過程では、受信されたデータからループフィルタについての情報を読み取って、所定の一次元フィルタのエッジ方向などのフィルタリング方向による一次元フィルタリングが行われる。
図20は、本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ符号化方法を示す。
ステップ1810で、現在のピクチャーは、最大サイズの符号化単位である少なくとも一つの最大符号化単位に分割され、ステップ1820で、深度ごとに最大符号化単位の領域が分割された少なくとも一つの分割領域が符号化されて、少なくとも一つの分割領域別に最終符号化結果が出力される深度が決定される。
ステップ1830では、それぞれの最大符号化単位ごとに、一つの符号化深度で符号化された映像データと、符号化深度及び符号化モードについての情報とが符号化されて出力される。また、現在のピクチャーの符号化中、デブロッキング以後に連続的な一次元フィルタリングにより行われるループフィルタリングのフィルタ係数情報が符号化されて出力される。フィルタ係数情報は、連続的なフィルタ係数間の残差成分についての情報を含む。水平方向の一次元フィルタ及び垂直方向の一次元フィルタの連続的なフィルタリングにより、ループフィルタリングが行われる。一次元フィルタは、対称形のフィルタであり、一次元フィルタのフィルタ係数は、ウィナーフィルタ方式による。
図21は、本発明の一実施形態によって、連続的な一次元フィルタリングによるループフィルタリングを利用するビデオ復号化方法を示す。
ステップ1910で、符号化されたビデオについてのビットストリームが受信されてパージングされる。
ステップ1920で、パージングされたビットストリームから、最大サイズの最大符号化単位に割り当てられる現在のピクチャーの映像データと、最大符号化単位別の符号化深度及び符号化モードについての情報とが抽出される。また、現在のピクチャーのループフィルタリングのためのフィルタ係数情報が抽出される。フィルタ係数情報は、それぞれの一次元フィルタのフィルタ係数間の残差成分についての情報を含む。抽出されたフィルタ係数情報は、水平方向の一次元フィルタ及び垂直方向の一次元フィルタの係数である。
ステップ1930で、最大符号化単位別の符号化深度及び符号化モードについての情報と、符号化単位パターン情報とに基づいて、最大符号化単位の符号化された映像データが復号化される。
ステップ1940で、現在のピクチャーの復号化された映像データに対してデブロッキングが行われ、デブロッキングされたデータに対して、連続的な一次元フィルタリングによるループフィルタリングが行われる。フィルタ係数情報として、フィルタ係数の残差成分が抽出された場合、フィルタ係数の残差成分と以前のフィルタ係数とを加えることで、現在のフィルタ係数が誘導される。それぞれの一次元フィルタごとに誘導されたフィルタ係数を利用して、連続的な一次元フィルタリングが行われる。ループフィルタリングは、ルマ成分及びクロマ成分に対して別個に行われる。
大容量の映像または高解像度の映像の大きいデータ量のため、相対的に小さいマクロブロックで映像を符復号化する場合、演算量が非常に負担となる。本発明は、映像サイズに適して選択されたサイズの符号化単位を利用し、最大サイズの符号化単位内でも、映像の細部情報によって、符号化単位のサイズを階層的に分化する。階層的構造の符号化単位に基づいて、最大符号化単位ごとに、最小限の符号化誤差を有する符号化単位が決定される。すなわち、階層的構造の符号化単位に基づいて、効率的な符復号化が図られる。
また、大容量の映像または高解像度の映像に対して、ポストプロセシングの演算量の負担を減らすために、デブロッキングした後で行うループフィルタリングとして、二次元フィルタリングの代わりに、連続的な一次元フィルタリングを導入する。これによって、演算量だけでなく、フィルタ係数の伝送ビットも減少する。また、フィルタ係数の代わりに、フィルタ係数の残差成分を伝送することで、伝送効率がさらに向上する。
一方、前述した本発明の実施形態は、コンピュータで実行されるプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。前記コンピュータで読み取り可能な記録媒体は、磁気記録媒体(例えば、ROM、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的読み取り媒体(例えば、CD−ROM、DVDなど)のような記録媒体を含む。
以上、本発明について、その望ましい実施形態を中心に述べた。当業者は、本発明が本質的な特性から逸脱しない範囲で、変形された形態に具現可能であるということを理解できるであろう。したがって、開示された実施形態は、限定的な観点ではなく、説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明ではなく、特許請求の範囲に表れており、それと同等な範囲内にあるあらゆる相違点は、本発明に含まれていると解釈されねばならない。

Claims (15)

  1. 符号化されたビデオについてのビットストリームを受信してパージングするステップと、
    前記ビットストリームから、最大サイズの符号化単位である最大符号化単位に割り当てられる現在のピクチャーの映像データ、前記最大符号化単位別の符号化深度及び符号化モードについての情報、及び前記現在のピクチャーのループフィルタリングのためのフィルタ係数情報を抽出するステップと、
    前記最大符号化単位別の符号化深度及び符号化モードについての情報に基づいて、前記最大符号化単位別の符号化された映像データを復号化するステップと、
    前記現在のピクチャーの復号化された映像データに対してデブロッキングを行い、デブロッキングされたデータに対して、連続的な一次元フィルタリングによるループフィルタリングを行うステップと、を含むことを特徴とするビデオ復号化方法。
  2. 前記抽出ステップは、
    複数の一次元フィルタのうちそれぞれの一次元フィルタに対して、連続的なフィルタ係数間の差値についての残差情報を抽出するステップを含むことを特徴とする請求項1に記載のビデオ復号化方法。
  3. 前記ループフィルタリング実行ステップは、
    水平方向の一次元フィルタリング及び垂直方向の一次元フィルタリングを連続的に行って、前記現在のピクチャーを復元することを特徴とする請求項1に記載のビデオ復号化方法。
  4. 前記ループフィルタリング実行ステップは、
    前記抽出されたフィルタ係数の残差情報を利用して、前記それぞれの一次元フィルタのフィルタ係数を誘導するステップと、
    前記誘導されたそれぞれの一次元フィルタのフィルタ係数を利用して、前記連続的な一次元フィルタリングを行うステップと、を含むことを特徴とする請求項2に記載のビデオ復号化方法。
  5. 前記フィルタ係数誘導ステップは、
    前記それぞれの一次元フィルタごとに、現在のフィルタ係数と以前のフィルタ係数との差値を前記以前のフィルタ係数に加えて現在のフィルタ係数が計算されることで、前記連続的なフィルタ係数を誘導することを特徴とする請求項4に記載のビデオ復号化方法。
  6. 前記深度は、前記最大符号化単位の領域を分割する回数が増加するにつれて深くなり、前記最大符号化単位別の符号化深度は、前記現在のピクチャーの符号化過程で、前記最大符号化単位別に、前記深度ごとに前記最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、前記少なくとも一つの分割領域別に最終符号化結果が出力された深度として決定されたことを特徴とする請求項1に記載のビデオ復号化方法。
  7. 現在のピクチャーを最大サイズの符号化単位である少なくとも一つの最大符号化単位に分割するステップと、
    前記最大符号化単位の領域を分割する回数が増加するにつれて深くなる深度に基づいて、前記深度ごとに前記最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、前記少なくとも一つの分割領域別に最終符号化結果が出力される深度を決定するステップと、
    前記最大符号化単位ごとに前記少なくとも一つの分割領域特別の最終符号化結果である映像データ、深度及び予測モードについての符号化情報、及び前記現在のピクチャーの符号化のうち、デブロッキング以後に連続的な一次元フィルタリングにより行われるループフィルタリングのフィルタ係数情報を符号化して出力するステップと、を含むことを特徴とするビデオ符号化方法。
  8. 複数の一次元フィルタのうちそれぞれの一次元フィルタのフィルタ係数情報は、連続的なフィルタ係数間の差値についての残差情報を含むことを特徴とする請求項7に記載のビデオ符号化方法。
  9. 前記ループフィルタリングのフィルタ係数情報出力ステップは、
    前記それぞれの一次元フィルタごとに、前記残差情報として、現在のフィルタ係数と以前のフィルタ係数との差値を符号化するステップを含むことを特徴とする請求項8に記載のビデオ符号化方法。
  10. 前記ループフィルタリングは、水平方向の一次元フィルタ及び垂直方向の一次元フィルタの連続的なフィルタリングであることを特徴とする請求項7に記載のビデオ符号化方法。
  11. 前記最大符号化単位は、少なくとも一つの深度による階層的に分化された前記深度別の符号化単位を含み、それぞれの上位深度の符号化単位は、複数の下位深度の符号化単位を含み、
    前記符号化深度は、前記最大符号化単位から階層的に分化された少なくとも一つの深度別の符号化単位のうち、符号化誤差が最も小さい深度を表すことを特徴とする請求項7に記載のビデオ符号化方法。
  12. 符号化されたビデオについてのビットストリームを受信してパージングする受信部と、
    前記ビットストリームから、最大サイズの符号化単位である最大符号化単位に割り当てられる現在のピクチャーの映像データ、前記最大符号化単位別の符号化深度及び符号化モードについての情報、及び前記現在のピクチャーのループフィルタリングのためのフィルタ係数情報を抽出する抽出部と、
    前記最大符号化単位別の符号化深度及び符号化モードについての情報に基づいて、前記最大符号化単位別の符号化された映像データを復号化する映像データ復号化部と、
    前記現在のピクチャーの復号化された映像データに対してデブロッキングを行い、デブロッキングされたデータに対して、連続的な一次元フィルタリングによるループフィルタリングを行うループフィルタリング実行部と、を備えることを特徴とするビデオ復号化装置。
  13. 現在のピクチャーを最大サイズの符号化単位である少なくとも一つの最大符号化単位に分割する最大符号化単位分割部と、
    前記最大符号化単位の領域を分割する回数が増加するにつれて深くなる深度に基づいて、前記深度ごとに前記最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、前記少なくとも一つの分割領域別に最終符号化結果が出力される深度を決定する符号化深度決定部と、
    前記最大符号化単位ごとに、前記少なくとも一つの分割領域別の最終符号化結果である映像データ、深度及び予測モードについての符号化情報、及び前記現在のピクチャーの符号化のうち、デブロッキング以後に連続的な一次元フィルタリングにより行われるループフィルタリングのフィルタ係数情報を符号化して出力する出力部と、を備えることを特徴とするビデオ符号化装置。
  14. 請求項1に記載のビデオ復号化方法を具現するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体。
  15. 請求項7に記載のビデオ符号化方法を具現するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体。
JP2012524643A 2009-08-14 2010-08-12 適応的なループフィルタリングを利用したビデオ符号化方法及び装置、ビデオ復号化方法及び装置 Active JP5731506B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020090075336A KR101701342B1 (ko) 2009-08-14 2009-08-14 적응적인 루프 필터링을 이용한 비디오의 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR10-2009-0075336 2009-08-14
PCT/KR2010/005284 WO2011019213A2 (ko) 2009-08-14 2010-08-12 적응적인 루프 필터링을 이용한 비디오의 부호화 방법 및 장치, 비디오 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2013502133A true JP2013502133A (ja) 2013-01-17
JP5731506B2 JP5731506B2 (ja) 2015-06-10

Family

ID=43586652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012524643A Active JP5731506B2 (ja) 2009-08-14 2010-08-12 適応的なループフィルタリングを利用したビデオ符号化方法及び装置、ビデオ復号化方法及び装置

Country Status (6)

Country Link
US (5) US9351000B2 (ja)
EP (1) EP2466890A4 (ja)
JP (1) JP5731506B2 (ja)
KR (1) KR101701342B1 (ja)
CN (1) CN102474615B (ja)
WO (1) WO2011019213A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018107608A (ja) * 2016-12-26 2018-07-05 沖電気工業株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム及び復号プログラム

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY191783A (en) 2010-04-13 2022-07-15 Samsung Electronics Co Ltd Video encoding method and video encoding apparatus and video decoding method and video decoding apparatus, which perform deblocking filtering based on tree-structure encoding units
US9445126B2 (en) 2011-01-05 2016-09-13 Qualcomm Incorporated Video filtering using a combination of one-dimensional switched filter and one-dimensional adaptive filter
EP2533537A1 (en) * 2011-06-10 2012-12-12 Panasonic Corporation Transmission of picture size for image or video coding
KR101337990B1 (ko) * 2012-06-01 2013-12-09 한양대학교 산학협력단 부호화 장치 및 부호화 유닛 레벨의 적응적 루프 필터 적용 여부 결정 방법
KR101307431B1 (ko) * 2012-06-01 2013-09-12 한양대학교 산학협력단 부호화 장치 및 프레임 기반 적응적 루프 필터의 사용 여부 결정 방법
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
US20140029670A1 (en) * 2012-07-27 2014-01-30 Motorola Mobility Llc Devices and methods for processing of partition mode in high efficiency video coding
CN104735450B (zh) * 2015-02-26 2019-06-07 北京大学 一种在视频编解码中进行自适应环路滤波的方法及装置
CN107439012B (zh) * 2015-04-06 2018-09-25 杜比实验室特许公司 用于环内转换的方法、装置和计算机可读存储介质
CN105791877B (zh) * 2016-03-15 2019-06-07 北京大学 视频编解码中自适应环路滤波的方法
US10419755B2 (en) * 2016-05-16 2019-09-17 Qualcomm Incorporated Confusion of multiple filters in adaptive loop filtering in video coding
CN115988211A (zh) 2018-10-12 2023-04-18 华为技术有限公司 用于视频译码中去块效应滤波器的装置和方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009047917A1 (ja) * 2007-10-11 2009-04-16 Panasonic Corporation 映像符号化方法及び映像復号方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100308114B1 (ko) 1998-01-26 2001-10-19 김영환 화질개선을 위한 압축 및 복원방법
KR100450836B1 (ko) 2001-12-11 2004-10-01 삼성전자주식회사 이차원 영상의 입체화 장치 및 방법
CN100553321C (zh) 2002-01-14 2009-10-21 诺基亚有限公司 编码动态滤波器
KR100584549B1 (ko) 2002-01-31 2006-05-30 삼성전자주식회사 블록킹 효과를 제거하기 위한 필터링 방법 및 그 장치
KR100846774B1 (ko) 2002-05-03 2008-07-16 삼성전자주식회사 블록킹 효과를 제거하기 위한 필터링 방법 및 그 장치
JP3999634B2 (ja) 2002-11-11 2007-10-31 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラム,画像復号プログラムおよびそのプログラムを記録した記録媒体
KR101000926B1 (ko) 2004-03-11 2010-12-13 삼성전자주식회사 영상의 불연속성을 제거하기 위한 필터 및 필터링 방법
KR100678958B1 (ko) 2005-07-29 2007-02-06 삼성전자주식회사 인트라 bl 모드를 고려한 디블록 필터링 방법, 및 상기방법을 이용하는 다 계층 비디오 인코더/디코더
CN101223552A (zh) 2005-08-17 2008-07-16 Nxp股份有限公司 用于深度提取的视频处理方法和装置
US20080075165A1 (en) 2006-09-26 2008-03-27 Nokia Corporation Adaptive interpolation filters for video coding
US20080107176A1 (en) 2006-11-02 2008-05-08 General Instrument Corporation Method and Apparatus for Detecting All Zero Coefficients

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009047917A1 (ja) * 2007-10-11 2009-04-16 Panasonic Corporation 映像符号化方法及び映像復号方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNC201210054028; Sung-Chang Lim,et al: 'Intra coding using extended block size[online]' VCEG-AL28 , 20090701, <URL:http://wftp3.itu.int/av-arch/video-site/0906 *
CSNC201210055020; Takeshi Chujoh, et al: 'Specification and experimental results of Quadtree-based Adaptive Loop Filter[online]' VCEG-AK22 , 20090415, <URL:http://wftp3.itu.int/av-arch/video-site/0904 *
JPN6014019789; Takeshi Chujoh, et al: 'Specification and experimental results of Quadtree-based Adaptive Loop Filter[online]' VCEG-AK22 , 20090415, <URL:http://wftp3.itu.int/av-arch/video-site/0904 *
JPN6014019792; Sung-Chang Lim,et al: 'Intra coding using extended block size[online]' VCEG-AL28 , 20090701, <URL:http://wftp3.itu.int/av-arch/video-site/0906 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018107608A (ja) * 2016-12-26 2018-07-05 沖電気工業株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム及び復号プログラム

Also Published As

Publication number Publication date
US20180160121A1 (en) 2018-06-07
CN102474615B (zh) 2015-03-25
CN102474615A (zh) 2012-05-23
US20170034537A1 (en) 2017-02-02
EP2466890A4 (en) 2016-02-24
WO2011019213A2 (ko) 2011-02-17
US10218982B2 (en) 2019-02-26
WO2011019213A3 (ko) 2011-04-21
US20170223360A1 (en) 2017-08-03
US20120140831A1 (en) 2012-06-07
US20160234508A1 (en) 2016-08-11
US9912954B2 (en) 2018-03-06
KR101701342B1 (ko) 2017-02-01
US9491474B2 (en) 2016-11-08
JP5731506B2 (ja) 2015-06-10
US9351000B2 (en) 2016-05-24
KR20110017720A (ko) 2011-02-22
US9668000B2 (en) 2017-05-30
EP2466890A2 (en) 2012-06-20

Similar Documents

Publication Publication Date Title
JP6342549B2 (ja) ビデオ復号化方法とその装置
JP5731506B2 (ja) 適応的なループフィルタリングを利用したビデオ符号化方法及び装置、ビデオ復号化方法及び装置
JP6073977B2 (ja) ビデオ復号化方法及び装置
JP6823028B2 (ja) ビデオ復号化方法及びビデオ復号化装置
JP5937720B2 (ja) ピクセルグループ別ピクセル値補償のためのビデオ符号化方法とその装置、及びピクセルグループ別ピクセル値補償のためのビデオ復号化方法とその装置
JP2015156702A (ja) ビデオ復号化方法及びビデオ復号化装置
KR101780026B1 (ko) 적응적인 루프 필터링을 이용한 비디오의 부호화 방법 및 장치, 비디오 복호화 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150409

R150 Certificate of patent or registration of utility model

Ref document number: 5731506

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250