TWI615017B - 熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置 - Google Patents

熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置 Download PDF

Info

Publication number
TWI615017B
TWI615017B TW105128696A TW105128696A TWI615017B TW I615017 B TWI615017 B TW I615017B TW 105128696 A TW105128696 A TW 105128696A TW 105128696 A TW105128696 A TW 105128696A TW I615017 B TWI615017 B TW I615017B
Authority
TW
Taiwan
Prior art keywords
unit
depth
transformation
coding
transform
Prior art date
Application number
TW105128696A
Other languages
English (en)
Other versions
TW201642654A (zh
Inventor
金壹求
Il-Koo Kim
Original Assignee
三星電子股份有限公司
Samsung Electronics Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三星電子股份有限公司, Samsung Electronics Co., Ltd. filed Critical 三星電子股份有限公司
Publication of TW201642654A publication Critical patent/TW201642654A/zh
Application granted granted Critical
Publication of TWI615017B publication Critical patent/TWI615017B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本發明所提供為熵解碼以及熵編碼視訊的方法。熵解碼方法包含從位元流獲得指示非零變換係數是否存在於變換單元中的變換單元有效係數旗標,基於變換單元的變換深度判定用於算術解碼變換單元有效係數旗標的上下文模型,以及基於判定的上下文模型算術解碼變換單元有效係數旗標。

Description

熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置
本發明的一或多個實施例是關於視訊編碼以及解碼,且更明確而言,是關於一種用於熵編碼以及熵解碼與變換單元有關的資訊的方法與裝置。
根據諸如MPEG-1、MPEG-2或MPEG-4 H.264/MPEG-4進階式視訊編碼(advanced video coding;AVC)的影像壓縮方法,將影像分裂成具有預定大小的區塊,然而,藉由框間預測或框內預測獲得區塊的殘餘資料。藉由變換、量化、掃描、延行長度編碼以及熵編碼來壓縮殘餘資料。在熵編碼中,諸如變換係數或預測模式的語法元素經熵編碼以輸出位元流。解碼器剖析且擷取來自位元流的語法元素,並基於擷取的語法元素重建構影像。
本發明的一或多個實施例包含一種熵編碼方法與裝置,以及一種用於基於指示編碼單元與變換單元之間的階層分裂關係的變換深度選擇上下文模型的熵解碼方法與裝置,所述上下文模型用以熵編碼以及熵解碼與為用以變換編碼單元的資料單元的變換單元有關的語法元素。
基於變換深度而判定用於算術解碼變換單元有效係數旗標的上下文模型,所述變換深度指示分裂編碼單元以判定包含於編碼單元中的變換單元的次數,並基於判定的上下文模型算術解碼變換單元有效係數旗標。
根據本發明的實施例,藉由基於變換深度選擇上下文模型,可簡化用於選擇上下文模型的條件,且亦可簡化用於熵編碼以及熵解碼的操作。
100‧‧‧視訊編碼裝置
110‧‧‧階層編碼器
120‧‧‧熵編碼器
200‧‧‧視訊解碼裝置
210‧‧‧剖析器
220‧‧‧熵解碼器
230‧‧‧階層解碼器
310‧‧‧視訊資料
315‧‧‧編碼單元
320‧‧‧視訊資料
325‧‧‧編碼單元
330‧‧‧視訊資料
335‧‧‧編碼單元
400‧‧‧視訊編碼器
405‧‧‧當前圖框
410‧‧‧框內預測器
420‧‧‧運動估計器
425‧‧‧運動補償器
430‧‧‧變換器
440‧‧‧量化器
450‧‧‧熵編碼器
455‧‧‧位元流
460‧‧‧反量化器
470‧‧‧反變換器
480‧‧‧解區塊單元
490‧‧‧迴路濾波單元
495‧‧‧參考圖框
500‧‧‧視訊解碼器
505‧‧‧位元流
510‧‧‧剖析器
520‧‧‧解碼器
530‧‧‧反量化器
540‧‧‧反變換器
550‧‧‧框內預測器
560‧‧‧運動補償器
570‧‧‧解區塊單元
580‧‧‧迴路濾波單元
585‧‧‧參考圖框
595‧‧‧經重建構的圖框
600‧‧‧階層結構
610‧‧‧編碼單元/分割區
612‧‧‧分割區
614‧‧‧分割區
616‧‧‧分割區
620‧‧‧編碼單元/分割區
622‧‧‧分割區
624‧‧‧分割區
626‧‧‧分割區
630‧‧‧編碼單元
632‧‧‧分割區
634‧‧‧分割區
636‧‧‧分割區
640‧‧‧編碼單元
642‧‧‧分割區
644‧‧‧分割區
646‧‧‧分割區
650‧‧‧編碼單元
710‧‧‧編碼單元
720‧‧‧變換單元
800‧‧‧資訊
802‧‧‧分割區
804‧‧‧分割區
806‧‧‧分割區
808‧‧‧分割區
810‧‧‧資訊
812‧‧‧框內模式
814‧‧‧框間模式
816‧‧‧跳過模式
820‧‧‧資訊
822‧‧‧第一框內變換單元
824‧‧‧第二框內變換單元
826‧‧‧第一框間變換單元
828‧‧‧第二框間變換單元
900‧‧‧編碼單元
910‧‧‧預測單元
912‧‧‧分割區類型
914‧‧‧分割區類型
916‧‧‧分割區類型
918‧‧‧分割區類型
920‧‧‧操作
930‧‧‧編碼單元
940‧‧‧預測單元
942‧‧‧分割區類型
944‧‧‧分割區類型
946‧‧‧分割區類型
948‧‧‧分割區類型
950‧‧‧操作
960‧‧‧編碼單元
970‧‧‧操作
980‧‧‧編碼單元
990‧‧‧預測單元
992‧‧‧分割區類型
994‧‧‧分割區類型
996‧‧‧分割區類型
998‧‧‧分割區類型
999‧‧‧資料單元
1010‧‧‧編碼單元
1012‧‧‧編碼單元
1014‧‧‧編碼單元
1016‧‧‧編碼單元
1018‧‧‧編碼單元
1020‧‧‧編碼單元
1022‧‧‧編碼單元
1024‧‧‧編碼單元
1026‧‧‧編碼單元
1028‧‧‧編碼單元
1030‧‧‧編碼單元
1032‧‧‧編碼單元
1040‧‧‧編碼單元
1042‧‧‧編碼單元
1044‧‧‧編碼單元
1046‧‧‧編碼單元
1048‧‧‧編碼單元
1050‧‧‧編碼單元
1052‧‧‧編碼單元
1054‧‧‧編碼單元
1060‧‧‧預測單元
1070‧‧‧變換單元
1300‧‧‧最大編碼單元
1302‧‧‧編碼單元
1304‧‧‧編碼單元
1306‧‧‧編碼單元
1312‧‧‧編碼單元
1314‧‧‧編碼單元
1316‧‧‧編碼單元
1318‧‧‧編碼單元
1322‧‧‧分割區類型
1324‧‧‧分割區類型
1326‧‧‧分割區類型
1328‧‧‧分割區類型
1332‧‧‧分割區類型
1334‧‧‧分割區類型
1336‧‧‧分割區類型
1338‧‧‧分割區類型
1342‧‧‧變換單元
1344‧‧‧變換單元
1352‧‧‧變換單元
1354‧‧‧變換單元
1400‧‧‧熵編碼裝置
1410‧‧‧二進位化器
1420‧‧‧上下文模型化器
1430‧‧‧二進位算術編碼器
1432‧‧‧常規編碼引擎
1434‧‧‧旁路編碼引擎
1510‧‧‧操作
1520‧‧‧操作
1530‧‧‧操作
1611‧‧‧變換單元
1612‧‧‧變換單元
1613‧‧‧變換單元
1614‧‧‧變換單元
1615‧‧‧變換單元
1616‧‧‧變換單元
1617‧‧‧變換單元
1711‧‧‧葉節點
1712‧‧‧葉節點
1713‧‧‧葉節點
1714‧‧‧葉節點
1715‧‧‧葉節點
1716‧‧‧葉節點
1717‧‧‧葉節點
1811‧‧‧編碼單元
1812‧‧‧變換單元
1910‧‧‧分裂變換旗標
1911‧‧‧分裂變換旗標
1912‧‧‧分裂變換旗標
1913‧‧‧分裂變換旗標
1914‧‧‧分裂變換旗標
1915‧‧‧分裂變換旗標
1916‧‧‧分裂變換旗標
1917‧‧‧分裂變換旗標
1918‧‧‧分裂變換旗標
2000‧‧‧變換單元
2010‧‧‧變換單元
2100‧‧‧有效值映射
2200‧‧‧coeff_abs_level_greater1_flag
2210‧‧‧coeff_abs_level_greater1_flag
2300‧‧‧coeff_abs_level_greater2_flag
2310‧‧‧coeff_abs_level_greater2_flag
2400‧‧‧coeff_abs_level_remaining
2510‧‧‧操作
2520‧‧‧操作
2530‧‧‧操作
2600‧‧‧熵解碼裝置
2610‧‧‧上下文模型化器
2620‧‧‧常規解碼引擎
2630‧‧‧旁路解碼引擎
2640‧‧‧去二進位化器
2710‧‧‧操作
2720‧‧‧操作
2730‧‧‧操作
2740‧‧‧操作
圖1為根據本發明的實施例的視訊編碼裝置的方塊圖。
圖2為根據本發明的實施例的視訊解碼裝置的方塊圖。
圖3為根據本發明的實施例的用於描述編碼單元的概念的示意圖。
圖4為根據本發明的實施例的基於具有階層結構的編碼單元的視訊編碼器的方塊圖。
圖5為根據本發明的實施例的基於具有階層結構的編碼單元的視訊解碼器的方塊圖。
圖6為說明根據本發明的實施例的根據深度的較深編碼單元以及分割區的示意圖。
圖7為根據本發明的實施例的用於描述編碼單元與變換單元之間的關係的示意圖。
圖8為根據本發明的實施例的用於描述對應於經編碼的深度的編碼單元的編碼資訊的示意圖。
圖9為根據本發明的實施例的根據深度的較深編碼單元的示意圖。
圖10至圖12為根據本發明的實施例的用於描述編碼單元、預測單元與頻率變換單元之間的關係的示意圖。
圖13為根據表1的編碼模式資訊的用於描述編碼單元、預測單元與變換單元之間的關係的示意圖。
圖14為根據本發明的實施例的熵編碼裝置的方塊圖。
圖15為根據本發明的實施例的熵編碼以及熵解碼與變換單元有關的語法元素的操作的流程圖。
圖16為根據本發明的實施例的說明編碼單元以及包含於編碼單元中的變換單元的示意圖。
圖17為說明用以基於變換深度判定圖16的變換單元中的每 一者的變換單元有效係數旗標的上下文模型的上下文增加參數的示意圖。
圖18為根據本發明的另一實施例的說明編碼單元以及包含於編碼單元中的變換單元的示意圖。
圖19為根據本發明的實施例的說明用以判定包含於圖16的編碼單元中的變換單元的結構的分裂變換旗標的示意圖。
圖20說明根據本發明的實施例的經熵編碼的變換單元。
圖21說明對應於圖20的變換單元的有效值映射。
圖22說明對應於圖20的4×4變換單元的coeff_abs_level_greater1_flag。
圖23說明對應於圖20的4×4變換單元的coeff_abs_level_greater2_flag。
圖24說明對應於圖20的4×4變換單元的coeff_abs_level_remaining。
圖25為根據本發明的實施例的熵編碼視訊的方法的流程圖。
圖26為根據本發明的實施例的熵解碼裝置的方塊圖。
圖27為根據本發明的實施例的熵解碼視訊的方法的流程圖。
用於進行本發明的最佳模式
根據本發明的一或多個實施例,一種熵解碼視訊的方法,方法包 含:判定包含於編碼單元中並用以反變換編碼單元的變換單元;從位元流獲得指示非零變換係數是否存在於變換單元中的變換單元有效係數旗標;若編碼單元經分裂以判定變換單元的次數被稱作變換單元的變換深度,則基於變換單元的變換深度判定用於算術解碼變換單元有效係數旗標的上下文模型;以及基於判定的上下文模型來算術解碼變換單元有效係數旗標。
根據本發明的一或多個實施例,一種熵解碼視訊的裝置,裝置包含:剖析器,其用於從位元流獲得指示非零變換係數是否存在於包含於編碼單元中並用以反變換編碼單元的變換單元中的變換單元有效係數旗標;上下文模型化器,其用於在編碼單元經分裂以判定變換單元的次數被稱作變換單元的變換深度的情況下,基於變換單元的變換深度判定用於算術解碼變換單元有效係數旗標的上下文模型;以及算術解碼器,其用於基於判定的上下文模型來算術解碼變換單元有效係數旗標。
根據本發明的一或多個實施例,一種熵編碼視訊的方法,方法包含:獲得基於變換單元而變換的編碼單元的資料;若編碼單元經分裂以判定變換單元的次數被稱作變換單元的變換深度,則基於變換單元的變換深度判定用於算術編碼指示非零變換係數是否存在於變換單元中的變換單元有效係數旗標的上下文模型;以及基於判定的上下文模型來算術編碼變換單元有效係數旗標。
根據本發明的一或多個實施例,一種熵編碼視訊的裝置,裝置包含:上下文模型化器,其用於獲得基於變換單元而變換的編碼單元的資料,且若編碼單元經分裂以判定變換單元的次 數被稱作變換單元的變換深度,則基於變換單元的變換深度判定用於算術編碼指示非零變換係數是否存在於變換單元中的變換單元有效係數旗標的上下文模型;以及算術編碼器,其用於基於判定的上下文模型來算術編碼變換單元有效係數旗標。
本發明的模式
下文中,將參照圖1至圖13描述根據本發明的實施例的用於更新用於熵編碼以及熵解碼變換單元的大小資訊的參數的方法與裝置。此外,將參照圖14至圖27詳細描述熵編碼以及熵解碼藉由使用參照圖1至圖13描述的視訊的熵編碼以及熵解碼的方法獲得的語法元素的方法。諸如“……中的至少一者”的陳述當接在一元件清單前時修飾整個元件清單,而不修飾清單中的個別元件。
圖1為根據本發明的實施例的視訊編碼裝置100的方塊圖。
視訊編碼裝置100包含階層編碼器110以及熵編碼器120。
階層編碼器110可以預定資料單元為單位分裂待編碼的當前圖像,以對資料單元中的每一者執行編碼。詳細地,階層編碼器110可基於最大編碼單元(其為最大大小的編碼單元)分裂當前圖像。根據本發明的實施例的最大編碼單元可為具有32×32、64×64、128×128、256×256等大小的資料單元,其中資料單元的形狀為寬度與長度為2的數次方且大於8的正方形。
根據本發明的實施例的編碼單元的特性可在於最大大小以及深度。深度表示從最大編碼單元起將編碼單元在空間上分裂 的次數,並隨著深度變深,可從最大編碼單元起將根據深度的較深編碼單元分裂至最小編碼單元。最大編碼單元的深度為最上部深度,而最小編碼單元的深度為最下部深度。由於隨著最大編碼單元的深度變深,對應於每一深度的編碼單元的大小減小,因此對應於上部深度的編碼單元可包含對應於下部深度的多個編碼單元。
如上所述,將當前圖像的影像資料分裂成根據編碼單元的最大大小的最大編碼單元,而最大編碼單元中的每一者可包含根據深度分裂的較深編碼單元。由於根據深度分裂根據本發明的實施例的最大編碼單元,因此可根據深度在階層上分類包含於最大編碼單元中的空間域的影像資料。
可預定編碼單元的最大深度以及最大大小,其限制階層上分裂最大編碼單元的高度以及寬度的總次數。
階層編碼器110編碼藉由根據深度分裂最大編碼單元的區域而獲得的至少一分裂區域,並根據至少一分裂區域判定用以輸出最後編碼的影像資料的深度。換句話說,階層編碼器110藉由根據當前圖像的最大編碼單元編碼根據深度的較深編碼單元中的影像資料並選擇具有最少編碼錯誤的深度來判定經編碼的深度。將判定的經編碼的深度以及根據最大編碼單元的經編碼的影像資料輸出至熵編碼器120。
基於對應於等於或小於最大深度的至少一深度的較深編碼單元編碼最大編碼單元中的影像資料,並基於較深編碼單元中的每一者比較編碼影像資料的結果。可在比較了較深編碼單元的編碼錯誤後選擇具有最少編碼錯誤的深度。可針對每一最大編碼 單元選擇至少一經編碼的深度。
隨著根據深度在階層上分裂編碼單元且隨著編碼單元的數目增加,分裂最大編碼單元的大小。此外,即使編碼單元對應於一最大編碼單元中的同一深度,仍藉由分開地量測每一編碼單元的影像資料的編碼錯誤來判定是否將對應於同一深度的編碼單元中的每一者分裂至較低深度。因此,甚至當影像資料包含於一最大編碼單元中時,仍根據深度將影像資料分裂成多個區域,而編碼錯誤可根據一最大編碼單元中的區域而不同,也因此經編碼的深度可根據影像資料中的區域而不同。因此,可判定一最大編碼單元中的一或多個經編碼的深度,且可根據至少一經編碼的深度的編碼單元劃分最大編碼單元的影像資料。
因此,階層編碼器110可判定包含於最大編碼單元中的具有樹型結構的編碼單元。根據本發明的實施例的「具有樹型結構的編碼單元」包含來從包含於最大編碼單元中的所有較深編碼單元中的對應於經判定為經編碼的深度的深度的編碼單元。可在最大編碼單元的同一區域中根據深度在階層上判定具有經編碼的深度的編碼單元,並可在不同區域中獨立判定具有經編碼的深度的編碼單元。類似地,可獨立於另一區域中的經編碼的深度而判定當前區域中的經編碼的深度。
根據本發明的實施例的最大深度為與將最大編碼單元分裂成最小編碼單元的次數有關的指數。根據本發明的實施例的第一最大深度可表示將最大編碼單元分裂成最小編碼單元的總次數。根據本發明的實施例的第二最大深度可表示從最大編碼單元至最小編碼單元的深度層級的總數目。舉例而言,當最大編碼單 元的深度為0時,可將最大編碼單元被分裂一次的編碼單元的深度設定至1,且可將最大編碼單元被分裂兩次的編碼單元的深度設定至2。因此,若最小編碼單元為最大編碼單元被分裂四次的編碼單元,則存在深度0、1、2、3以及4的五個深度層級,也因此,可將第一最大深度設定至4,且可將第二最大深度設定至5。
可根據最大編碼單元執行預測編碼以及變換。亦根據最大編碼單元,基於根據等於或小於最大深度的深度的較深編碼單元執行預測編碼以及變換。
由於無論何時當根據深度分裂最大編碼單元時較深編碼單元的數目皆增加,因此對隨著深度變深而產生的所有較深編碼單元執行包含預測編碼以及變換的編碼。為了便於描述,現將基於最大編碼單元中的當前深度的編碼單元描述預測編碼以及變換。
視訊編碼裝置100可不同地選擇用於編碼影像資料的資料單元的大小或形狀。為了編碼影像資料,執行諸如預測編碼、變換以及熵編碼的操作,且此時,可將同一資料單元用於所有操作或可將不同資料單元用於每一操作。
舉例而言,視訊編碼裝置100可不僅選擇用於編碼影像資料的編碼單元,且亦可選擇與所述編碼單元不同的資料單元,以便對編碼單元中的影像資料執行預測編碼。
為了在最大編碼單元中執行預測編碼,可基於對應於經編碼的深度的編碼單元(亦即,基於不再分裂成對應於較低深度的編碼單元的編碼單元)執行預測編碼。下文中,不再被分裂且變為用於預測編碼的基礎單元的編碼單元將被稱作「預測單元」。藉由 分裂預測單元而獲得的分割區可包含藉由分裂預測單元的高度與寬度中的至少一者而獲得的預測單元或資料單元。
舉例而言,當2N×2N(其中N為正整數)的編碼單元不再被分裂且變為2N×2N的預測單元時,分割區的大小可為2N×2N、2N×N、N×2N或N×N。分割區類型的實例包含藉由對稱地分裂預測單元的高度或寬度而獲得的對稱分割區、藉由不對稱地分裂預測單元的高度或寬度(諸如,1:n或n:1)而獲得的分割區、藉由幾何分裂預測單元而獲得的分割區,以及具有任意形狀的分割區。
預測單元的預測模式可為框內模式、框間模式或跳過模式中的至少一者。舉例而言,可對2N×2N、2N×N、N×2N或N×N的分割區執行框內模式或框間模式。此外,可僅對2N×2N的分割區執行跳過模式。獨立地對編碼單元中的一預測單元執行編碼,藉此選擇具有最少編碼錯誤的預測模式。
視訊編碼裝置100亦可不僅基於用於編碼影像資料的編碼單元且亦基於與編碼單元不同的資料單元而對編碼單元中的影像資料執行變換。
為了在編碼單元中執行變換,可基於具有等於或小於編碼單元的大小的大小的資料單元執行變換。舉例而言,用於變換的資料單元可包含用於框內模式的資料單元以及用於框間模式的資料單元。
用作變換的基礎的資料單元被稱作「變換單元」。類似於編碼單元,可將編碼單元中的變換單元遞回地(recursively)分裂成較小大小的區域,使得可以區域為單位獨立地判定變換單元。因此,可根據變換深度根據具有樹型結構的變換單元劃分編碼單元 中的殘餘資料。
亦可在變換單元中設定變換深度,其指示分裂編碼單元的高度與寬度以達到變換單元的次數。舉例而言,在2N×2N的當前編碼單元中,當變換單元的大小為2N×2N時,變換深度可為0,當變換單元的大小為N×N時,變換深度可為1,且當變換單元的大小為N/2×N/2時,變換深度可為2。亦即,亦可根據變換深度設定具有樹型結構的變換單元。
根據對應於經編碼的深度的編碼單元的編碼資訊不僅需要關於經編碼的深度的資訊,且亦需要關於與預測編碼以及變換有關的資訊。因此,階層編碼器110不僅判定具有最少編碼錯誤的經編碼的深度,且亦判定預測單元中的分割區類型、根據預測單元的預測模式以及用於變換的變換單元的大小。
以下將參照圖3至圖12詳細描述根據本發明的實施例的最大編碼單元中的根據樹型結構的編碼單元以及判定分割區的方法。
階層編碼器110可藉由使用基於拉格朗日乘子(Lagrangian multiplier)的速率-失真最佳化(Rate-Distortion Optimization)來量測根據深度的較深編碼單元的編碼錯誤。
熵編碼器120在位元流中輸出最大編碼單元的影像資料(其是基於由階層編碼器110判定的至少一經編碼的深度來編碼)以及關於根據經編碼的深度的編碼模式的資訊。經編碼的影像資料可為影像的殘餘資料的編碼結果。關於根據經編碼的深度的編碼模式的資訊可包含關於經編碼的深度的資訊、關於預測單元中的分割區類型的資訊、預測模式資訊以及變換單元的大小資訊。 詳細而言,如下文將描述,熵編碼器120可藉由使用基於變換單元的變換深度而判定的上下文模型來熵編碼指示非0變換係數是否包含於變換單元中的變換單元有效係數旗標(coded_block_flag)cbf。以下將描述在熵編碼單元120中的熵編碼與變換單元有關的語法元素的操作。
可藉由使用根據深度的分裂資訊定義關於經編碼的深度的資訊,其指示是否對較低深度而非當前深度的編碼單元執行編碼。若當前編碼單元的當前深度為經編碼的深度,則編碼且輸出當前編碼單元中的影像資料,也因此分裂資訊可被定義為不將當前編碼單元分裂至較低深度。或者,若當前編碼單元的當前深度並非經編碼的深度,則對較低深度的編碼單元執行編碼,也因此分裂資訊可被定義為分裂當前編碼單元以獲得較低深度的編碼單元。
若當前深度並非經編碼的深度,則對經分裂成較低深度的編碼單元的編碼單元執行編碼。由於較低深度的至少一編碼單元存在於當前深度的一編碼單元中,因此對較低深度的每一編碼單元重複地執行編碼,也因此可對於具有相同深度的編碼單元遞回地執行編碼。
由於針對一最大編碼單元判定具有樹型結構的編碼單元,且針對經編碼的深度的編碼單元判定關於至少一編碼模式的資訊,因此可針對一最大編碼單元判定關於至少一編碼模式的資訊。此外,因為影像資料是根據深度在階層上分裂的,最大編碼單元的影像資料的經編碼的深度可根據位置而不同,也因此可針對影像資料設定關於經編碼的深度以及編碼模式的資訊。
因此,熵編碼器120可將關於對應的經編碼的深度以及編碼模式的編碼資訊指派至包含於最大編碼單元中的編碼單元、預測單元以及最小單元中的至少一者。
根據本發明的實施例的最小單元為藉由4次分裂構成最低深度的最小編碼單元而獲得的正方形資料單元。或者,最小單元可為可包含於包含在最大編碼單元中的編碼單元、預測單元、分割區單元以及變換單元中的所有者中的最大正方形資料單元。
舉例而言,經由熵編碼器120輸出的編碼資訊可分類成根據編碼單元的編碼資訊以及根據預測單元的編碼資訊。根據編碼單元的編碼資訊可包含關於預測模式以及關於分割區的大小的資訊。根據預測單元的編碼資訊可包含關於框間模式的估計的方向、關於框間模式的參考影像索引、關於運動向量、關於框內模式的色度分量以及關於框內模式的內插方法的資訊。此外,可將關於根據圖像、片段或GOP定義的編碼單元的最大大小的資訊以及關於最大深度的資訊插入至位元流的標頭內。
在視訊編碼裝置100中,較深編碼單元可為藉由將上部深度的編碼單元(其高出一層)的高度或寬度除以二而獲得的編碼單元。換句話說,在當前深度的編碼單元的大小為2N×2N時,較低深度的編碼單元的大小為N×N。此外,具有2N×2N的大小的當前深度的編碼單元可包含最大數目四個的較低深度的編碼單元。
因此,視訊編碼裝置100可藉由基於最大編碼單元的大小以及考慮到當前圖像的特性而判定的最大深度來判定具有對於每一最大編碼單元而言的最佳形狀以及最佳大小的編碼單元,而形成具有樹型結構的編碼單元。此外,由於可藉由使用各種預測 模式以及變換中的任一者對每一最大編碼單元執行編碼,因此可考慮到各種影像大小的編碼單元的特性來判定最佳編碼模式。
因此,若在習知巨集區塊中編碼具有高解析度或大資料量的影像,則每圖像巨集區塊的數目過度增加。因此,針對每一巨集區塊產生的壓縮的資訊的條數增加,也因此難以傳輸壓縮的資訊,且資料壓縮效率降低。然而,藉由使用視訊編碼裝置100,可增加影像壓縮效率,這是因為在考慮影像的特性的同時調整編碼單元,而在考慮影像的大小的可同時增大編碼單元的最大大小。
圖2為根據本發明的實施例的視訊解碼裝置200的方塊圖。
視訊解碼裝置200包含剖析器210、熵解碼器220以及階層解碼器230。對於視訊解碼裝置200的各種操作,諸如編碼單元、深度、預測單元、變換單元的各種術語的定義以及關於各種編碼模式的資訊與參照圖1以及視訊編碼裝置100描述的彼等者相同。
剖析器210接收經編碼的視訊的位元流以剖析語法元素。熵解碼器220藉由執行經剖析的語法元素的熵解碼而基於具有結構的編碼單元算術解碼指示經編碼的影像資料的語法元素,並將算術解碼的語法元素輸出至階層解碼器230。亦即,熵解碼器220執行按0與1的位元串的形式接收的語法元素的熵解碼,藉此重建構語法元素。
此外,熵解碼器220從經剖析的位元流根據每一最大編碼單元擷取具有樹型結構的編碼單元的關於經編碼的深度、編碼模式、色彩分量資訊、預測模式資訊等的資訊。將關於經編碼的 深度以及編碼模式所擷取的資訊輸出至階層解碼器230。將位元流中的影像資料分裂成最大編碼單元,使得階層解碼器230可解碼每一最大編碼單元的影像資料。
根據最大編碼單元的關於經編碼的深度以及編碼模式的資訊可設定為關於對應於經編碼的深度的至少一編碼單元的資訊,且關於編碼模式的資訊可包含關於對應於經編碼的深度的對應的編碼單元的分割區類型、關於預測模式以及變換單元的大小的資訊。此外,可將根據深度的分裂資訊擷取為關於經編碼的深度的資訊。
由熵解碼器220擷取的根據每一最大編碼單元的關於經編碼的深度以及編碼模式的資訊為關於經判定以當諸如視訊編碼裝置100的編碼器根據每一最大編碼單元重複執行對於根據深度的每一較深編碼單元的編碼時產生最小編碼錯誤的經編碼的深度以及編碼模式的資訊。因此,視訊解碼裝置200可藉由根據產生最小編碼錯誤的經編碼的深度以及編碼模式解碼影像資料而重建構影像。
由於關於經編碼的深度以及編碼模式的編碼資訊可指派至從對應的編碼單元、預測單元以及最小單元中的預定資料單元,因此熵解碼器220可根據預定資料單元擷取關於經編碼的深度以及編碼模式的資訊。當將關於對應的最大編碼單元的經編碼的深度以及編碼模式的資訊指派至預定資料單元中的每一者時,則可將關於經編碼的深度以及編碼模式的相同資訊所指派至的預定資料單元推斷為包含於同一最大編碼單元中的資料單元。
此外,如以下將描述,熵解碼器220可藉由使用基於變 換單元的變換深度判定的上下文模型來熵解碼變換單元有效係數旗標cbf。以下將描述在熵解碼器220中的熵解碼與變換單元有關的語法元素的操作。
階層解碼器230藉由基於根據最大編碼單元的關於經編碼的深度以及編碼模式的資訊解碼每一最大編碼單元中的影像資料來重建構當前圖像。換句話說,階層解碼器230可基於關於來從包含於每一最大編碼單元中的具有樹型結構的編碼單元中的每一編碼單元的分割區類型、預測模式以及變換單元的所擷取資訊而解碼經編碼的影像資料。解碼操作可包含包含框內預測以及運動補償的預測以及反變換。
階層解碼器230可基於關於根據經編碼的深度的編碼單元的分割區類型以及預測單元的預測模式的資訊而根據每一編碼單元的分割區以及預測模式執行框內預測或運動補償。
此外,階層解碼器230可基於關於根據經編碼的深度的編碼單元的變換單元的大小的資訊執行根據編碼單元中的每一變換單元的反變換,以便執行根據最大編碼單元的反變換。
階層解碼器230可藉由使用根據深度的分裂資訊判定當前最大編碼單元的至少一經編碼的深度。若分裂資訊指示不再在當前深度中分裂影像資料,則當前深度為經編碼的深度。因此,階層解碼器230可藉由使用關於預測單元的分割區類型、預測模式以及變換單元的大小的資訊而相關於當前最大編碼單元的影像資料來解碼當前深度的編碼單元。
換句話說,可藉由觀測針對來從編碼單元、預測單元以及最小單元中的預定資料單元所指派的編碼資訊集合來收集含有 包含相同分裂資訊的編碼資訊的資料單元,並可將收集的資料單元當作待由階層解碼器230按相同編碼模式解碼的一資料單元。
視訊解碼裝置200可獲得關於當針對每一最大編碼單元遞回地執行編碼時則產生最小編碼錯誤的至少一編碼單元的資訊,並可使用所述資訊解碼當前圖像。換句話說,可解碼經判定為每一最大編碼單元中的最佳編碼單元的具有樹型結構的編碼單元的經編碼的影像資料。
因此,即使影像資料具有高解析度以及大資料量,亦可藉由使用編碼單元的大小以及編碼模式有效率地解碼以及重建構影像資料,編碼單元的大小以及編碼模式是藉由使用從編碼器接收的關於最佳編碼模式的資訊根據影像資料的特性而適應地判定的。
現將參照圖3至圖13描述根據本發明的實施例的判定具有樹型結構的編碼單元、預測單元以及變換單元的方法。
圖3為根據本發明的實施例的用於描述編碼單元的概念的示意圖。
編碼單元的大小可按寬度×高度來表達,且可為64×64、32×32、16×16以及8×8。64×64的編碼單元可分裂成64×64、64×32、32×64或32×32的分割區;且32×32的編碼單元可分裂成32×32、32×16、16×32或16×16的分割區;且16×16的編碼單元可分裂成16×16、16×8、8×16或8×8的分割區;且8×8的編碼單元可分裂成8×8、8×4、4×8或4×4的分割區。
關於視訊資料310,設定解析度1920×1080、編碼單元的最大大小64以及最大深度2。關於視訊資料320,設定解析度 1920×1080、編碼單元的最大大小64以及最大深度3。關於視訊資料330,設定解析度352×288、編碼單元的最大大小16以及最大深度1。圖3中繪示的最大深度表示從最大編碼單元至最小編碼單元的分裂的總數。
若解析度高或資料量大,則編碼單元的最大大小可大,以便不僅增加編碼效率,且準確地反映影像的特性。因此,具有比視訊資料330高的解析度的視訊資料310以及320的編碼單元的最大大小可為64。
由於視訊資料310的最大深度為2,因此視訊資料310的編碼單元315可包含具有長軸線大小64的最大編碼單元以及具有長軸線大小32與16的編碼單元,這是因為藉由將最大編碼單元分裂兩次而使深度加深至兩層。同時,由於視訊資料330的最大深度為1,因此視訊資料330的編碼單元335可包含具有長軸線大小16的最大編碼單元以及具有長軸線大小8的編碼單元,這是因為藉由將最大編碼單元分裂一次而使深度加深至一層。
由於視訊資料320的最大深度為3,因此視訊資料320的編碼單元325可包含具有長軸線大小64的最大編碼單元以及具有長軸線大小32、16與8的編碼單元,這是因為藉由將最大編碼單元分裂三次而使深度加深至3層。隨著深度變深,可精確地表達詳細資訊。
圖4為根據本發明的實施例的基於具有階層結構的編碼單元的視訊編碼器400的方塊圖。
框內預測器410關於當前圖框405在框內模式中對編碼單元執行框內預測,且運動估計器420以及運動補償器425分別 藉由使用當前圖框405以及參考圖框495在框間模式中對編碼單元執行框間估計以及運動補償。
經由變換器430以及量化器440輸出自框內預測器410、運動估計器420以及運動補償器425輸出的資料,作為經量化的變換係數。經由反量化器460以及反變換器470將經量化的變換係數重建構為空間域中的資料,並將空間域中的經重建構的資料在經由解區塊單元480以及迴路濾波單元490後處理後作為參考圖框495輸出。可經由熵編碼器450輸出經量化的變換係數,作為位元流455。
熵編碼單元450算術編碼與變換單元有關的語法元素,諸如,指示非0變換係數是否包含於變換單元中的變換單元有效係數旗標(cbf)、指示非0變換係數的位置的有效值映射(significance map;SigMap)、指示變換係數是否具有大於1的值的第一臨界值旗標(coeff_abs_level_greater1_flag)、指示變換係數是否具有大於2的值的第二臨界值旗標(coeff_abs_level_greather2_flag)以及對應於基於第一臨界值旗標與第二臨界值旗標判定的基層級(baseLevel)與真實變換係數(abscoeff)之間的差的變換係數(coeff_abs_level_remaining)的大小資訊。
為了將視訊編碼器400應用於視訊編碼裝置100中,視訊編碼器400的所有元件(亦即,框內預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反量化器460、反變換器470、解區塊單元480以及迴路濾波單元490)必須基於來從具有樹型結構的編碼單元中的每一編碼單元同 時考慮到每一最大編碼單元的最大深度而執行操作。
具體而言,框內預測器410、運動估計器420以及運動補償器425判定來從具有樹型結構的編碼單元中的每一編碼單元的分割區以及預測模式,同時考慮到當前最大編碼單元的最大大小以及最大深度,且變換器430判定來自具有樹型結構的編碼單元中的每一編碼單元中的變換單元的大小。
圖5為根據本發明的實施例的基於編碼單元的視訊解碼器500的方塊圖。
剖析器510剖析來自位元流505的待解碼的經編碼影像資料以及對於解碼所需的關於編碼的資訊。經編碼的影像資料穿過解碼器520以及反量化器530以作為反量化的資料而輸出。熵解碼器520從位元流獲得與變換單元有關的元素,亦即,指示非0變換係數是否包含於變換單元中的變換單元有效係數旗標(cbf)、指示非0變換係數的位置的有效值映射、指示變換係數是否具有大於1的值的第一臨界值旗標(coeff_abs_level_greater1_flag)、指示變換係數是否具有大於2的值的第二臨界值旗標(coeff_abs_level_greather2_flag)以及對應於基於第一臨界值旗標與第二臨界值旗標判定的基層級(baseLevel)與真實變換係數(abscoeff)之間的差的變換係數(coeff_abs_level_remaining)的大小資訊,且算術解碼獲得的語法元素以便重建構語法元素。
反變換器540將反量化的資料重建構為空間域中的影像資料。框內預測器550相關於空間域中的影像資料在框內模式中對編碼單元執行框內預測,且運動補償器560藉由使用參考圖框585在框間模式中對編碼單元執行運動補償。
已穿過框內預測器550以及運動補償器560的在空間域中的影像資料可在經由解區塊單元570以及迴路濾波單元580後處理後作為經重建構的圖框595輸出。此外,可將經由解區塊單元570以及迴路濾波單元580後處理的影像資料作為參考圖框585輸出。
為了將視訊解碼器500應用於視訊解碼裝置200中,視訊解碼器500的所有元件(亦即,剖析器510、熵解碼器520、反量化器530、反變換器540、框內預測器550、運動補償器560、解區塊單元570以及迴路濾波單元580)針對每一最大編碼單元執行基於具有樹型結構的編碼單元的操作。
框內預測器550以及運動補償器560針對具有樹型結構的每一編碼單元判定分割區以及預測模式,且反變換器540必須針對每一編碼單元判定變換單元的大小。
圖6為說明根據本發明的實施例的根據深度的較深編碼單元以及分割區的示意圖。
視訊編碼裝置100以及視訊解碼裝置200使用階層編碼單元以便考慮到影像的特性。編碼單元的最大高度、最大寬度以及最大深度可根據影像的特性適應地加以判定,或可由使用者不同地設定。可根據編碼單元的預定最大大小判定根據深度的較深編碼單元的大小。
在根據本發明的實施例的編碼單元的階層結構600中,編碼單元的最大高度與最大寬度各為64,且最大深度為4。由於深度沿著階層結構600的垂直軸線變深,因此較深編碼單元的高度與寬度各從經分裂。此外,沿著階層結構600的水平軸線繪示 了為用於每一較深編碼單元的預測編碼的基礎的預測單元以及分割區。
換句話說,編碼單元610為階層結構600中的最大編碼單元,其中深度為0且大小(亦即,高度乘寬度)為64×64。深度沿著垂直軸線變深,且存在具有大小32×32以及深度1的編碼單元620、具有大小16×16以及深度2的編碼單元630、具有大小8×8以及深度3的編碼單元640以及具有大小4×4以及深度4的編碼單元650。具有大小4×4以及深度4的編碼單元650為最小編碼單元。
根據每一深度沿著水平軸線配置編碼單元的預測單元以及分割區。換句話說,若具有大小64×64以及深度0的編碼單元610為預測單元,則可將預測單元分裂成包含於編碼單元610中的分割區,亦即,具有大小64×64的分割區610、具有大小64×32的分割區612、具有大小32×64的分割區614或具有大小32×32的分割區616。
類似地,具有大小32×32以及深度1的編碼單元620的預測單元可分裂成包含於編碼單元620中的分割區,亦即,具有大小32×32的分割區620、具有大小32×16的分割區622、具有大小16×32的分割區624以及具有大小16×16的分割區626。
類似地,具有大小16×16以及深度2的編碼單元630的預測單元可分裂成包含於編碼單元630中的分割區,亦即,包含於編碼單元630中的具有大小16×16的分割區、具有大小16×8的分割區632、具有大小8×16的分割區634以及具有大小8×8的分割區636。
類似地,具有大小8×8以及深度3的編碼單元640的預測單元可分裂成包含於編碼單元640中的分割區,亦即,包含於編碼單元640中的具有大小8×8的分割區、具有大小8×4的分割區642、具有大小4×8的分割區644以及具有大小4×4的分割區646。
具有大小4×4以及深度4的編碼單元650為最小編碼單元以及最低深度的編碼單元。編碼單元650的預測單元僅指派至具有大小4×4的分割區。
為了判定構成最大編碼單元610的編碼單元的至少一經編碼的深度,視訊編碼裝置100的階層編碼器110對於包含於最大編碼單元610中的對應於每一深度的編碼單元執行編碼。
包含相同範圍以及相同大小中的資料的根據深度的較深編碼單元的數目隨著深度變深而增加。舉例而言,需要對應於深度2的四個編碼單元來涵蓋包含於對應於深度1的一編碼單元中的資料。因此,為了比較相同資料的根據深度的編碼結果,各編碼對應於深度1的編碼單元以及對應於深度2的四個編碼單元。
為了針對諸深度中的當前深度執行編碼,可藉由沿著階層結構600的水平軸線對於對應於當前深度的編碼單元中的每一預測單元執行編碼而針對當前深度選擇最少編碼錯誤。或者,可藉由比較根據深度的最少編碼錯誤且隨著深度沿著階層結構600的水平軸線變深而執行對於每一深度的編碼來搜尋最小編碼錯誤。可將在最大編碼單元610中具有最小編碼錯誤的深度與分割區選擇為最大編碼單元610的經編碼的深度與分割區類型。
圖7為根據本發明的實施例的用於描述編碼單元710與 變換單元720之間的關係的示意圖。
視訊編碼裝置100或視訊解碼裝置200根據具有等於或小於最大編碼單元的大小的大小的編碼單元編碼或解碼每一最大編碼單元的影像。可基於不大於對應的編碼單元的資料單元選擇用於在編碼期間的變換的變換單元的大小。
舉例而言,在視訊編碼裝置100或視訊解碼裝置200中,若編碼單元710的大小為64×64,則可藉由使用具有大小32×32的變換單元720來執行變換。
此外,可藉由對具有大小32×32、16×16、8×8以及4×4(其小於64×64)的變換單元中的每一者執行變換來編碼具有大小64×64的編碼單元710的資料,且接著可選擇具有最少編碼錯誤的變換單元。
圖8為根據本發明的實施例的用於描述對應於經編碼的深度的編碼單元的編碼資訊的示意圖。
視訊編碼裝置100的輸出單元130可編碼且傳輸關於分割區類型的資訊800、關於預測模式的資訊810以及關於對應於經編碼的深度的每一編碼單元的變換單元的大小的資訊820,作為關於編碼模式的資訊。
資訊800指示關於藉由分裂當前編碼單元的預測單元獲得的分割區的形狀的資訊,其中分割區為用於預測編碼當前編碼單元的資料單元。舉例而言,具有大小2N×2N的當前編碼單元CU_0可分裂成具有大小2N×2N的分割區802、具有大小2N×N的分割區804、具有大小N×2N的分割區806以及具有大小N×N的分割區808中的任一者。此處,設定關於分割區類型的資訊800 以指示具有大小2N×2N的分割區802、具有大小2N×N的分割區804、具有大小N×2N的分割區806以及具有大小N×N的分割區808中的一者。
資訊810指示每一分割區的預測模式。舉例而言,資訊810可指示對由資訊800指示的分割區執行的預測編碼的模式,亦即,框內模式812、框間模式814或跳過模式816。
資訊820指示當對當前編碼單元執行變換時所基於的變換單元。舉例而言,變換單元可為第一框內變換單元822、第二框內變換單元824、第一框間變換單元826或第二框間變換單元828。
視訊解碼裝置200的影像資料以及編碼資料擷取單元210可根據每一較深編碼單元擷取並使用關於編碼單元的資訊800、關於預測模式的資訊810以及關於變換單元的大小的資訊820以用於解碼。
圖9為根據本發明的實施例的根據深度的較深編碼單元的示意圖。
分裂資訊可用以指示深度的改變。分裂資訊指示是否將當前深度的編碼單元分裂成較低深度的編碼單元。
用於具有深度0以及大小2N_0×2N_0的編碼單元900的預測編碼的預測單元910可包含具有大小2N_0×2N_0的分割區類型912、具有大小2N_0×N_0的分割區類型914、具有大小N_0×2N_0的分割區類型916以及具有大小N_0×N_0的分割區類型918的分割區。圖9僅說明藉由對稱地分裂預測單元910而獲得的分割區類型912至918,但分割區類型不限於此,且預測單元910的分割區可包含不對稱分割區、具有預定形狀的分割區以及具 有幾何形狀的分割區。
根據每一分割區類型,對具有大小2N_0×2N_0的一分割區、具有大小2N_0×N_0的兩個分割區、具有大小N_0×2N_0的兩個分割區以及具有大小N_0×N_0的四個分割區重複執行預測編碼。可對具有大小2N_0×2N_0、N_0×2N_0、2N_0×N_0以及N_0×N_0的分割區執行框內模式以及框間模式的預測編碼。跳過模式的預測編碼僅對具有大小2N_0×2N_0的分割區執行。
若在具有大小2N_0×2N_0、2N_0×N_0以及N_0×2N_0的分割區類型912至916中的一者中編碼錯誤最小,則預測單元910可不分裂成較低深度。
若在具有大小N_0×N_0的分割區類型918中編碼錯誤最小,則深度從0改變至1以在操作920中分裂分割區類型918,且對具有深度2以及大小N_0×N_0的分割區類型編碼單元重複執行編碼以搜尋最小編碼錯誤。
用於預測編碼具有深度1以及大小2N_1×2N_1(=N_0×N_0)的(分割區類型)編碼單元930的預測單元940可包含具有大小2N_1×2N_1的分割區類型942、具有大小2N_1×N_1的分割區類型944、具有大小N_1×2N_1的分割區類型946以及具有大小N_1×N_1的分割區類型948的分割區。
若在具有大小N_1×N_1的分割區類型948中編碼錯誤最小,則深度從1改變至2以在操作950中分裂分割區類型948,且對具有深度2以及大小N_2×N_2的編碼單元960重複執行編碼以搜尋最小編碼錯誤。
當最大深度為d時,可執行根據每一深度的分裂操作直 至深度變為d-1時,且可編碼分裂資訊,直至當深度為0至d-2中的一者時。換句話說,當在於操作970中分裂對應於d-2的深度的編碼單元後執行編碼直至深度為d-1時,用於預測編碼具有深度d-1以及大小2N_(d-1)×2N_(d-1)的編碼單元980的預測單元990可包含具有大小2N_(d-1)×2N_(d-1)的分割區類型992、具有大小2N_(d-1)×N_(d-1)的分割區類型994、具有大小N_(d-1)×2N_(d-1)的分割區類型996以及具有大小N_(d-1)×N_(d-1)的分割區類型998的分割區。
可對來從分割區類型992至998中的具有大小2N_(d-1)×2N_(d-1)的一分割區、具有大小2N_(d-1)×N_(d-1)的兩個分割區、具有大小N_(d-1)×2N_(d-1)的兩個分割區、具有大小N_(d-1)×N_(d-1)的四個分割區重複地執行預測編碼以搜尋具有最小編碼錯誤的分割區類型。
甚至當具有大小N_(d-1)×N_(d-1)的分割區類型998具有最小編碼錯誤時,由於最大深度為d,因此具有深度d-1的編碼單元CU_(d-1)亦不再分裂至較低深度,並將構成當前最大編碼單元900的編碼單元的經編碼的深度判定為d-1,且可將當前最大編碼單元900的分割區類型判定為N_(d-1)×N_(d-1)。此外,由於最大深度為d,因此未設定用於最小編碼單元952的分裂資訊。
資料單元999可為用於當前最大編碼單元的「最小單元」。根據本發明的實施例的最小單元可為藉由將最小編碼單元980分裂4次而獲得的矩形資料單元。藉由重複執行編碼,視訊編碼裝置100可藉由比較根據編碼單元900的深度的編碼錯誤來選擇具有最少編碼錯誤的深度以判定經編碼的深度,並將對應的分 割區類型以及預測模式設定為經編碼的深度的編碼模式。
因而,在1至d的所有深度中比較根據深度的最小編碼錯誤,並將具有最少編碼錯誤的深度判定為經編碼的深度。經編碼的深度、預測單元的分割區類型以及預測模式可被編碼以及傳輸作為關於編碼模式的資訊。此外,由於從深度0至經編碼的深度地分裂編碼單元,因此僅將經編碼的深度的分裂資訊設定至0,並將不包含經編碼的深度的深度的分裂資訊設定至1。
視訊解碼裝置200的熵解碼器220可擷取且使用關於經編碼的深度以及編碼單元900的預測單元的資訊以解碼編碼單元912。視訊解碼裝置200可藉由使用根據深度的分裂資訊將分裂資訊為0的深度判定為經編碼的深度,並將關於對應的深度的編碼模式的資訊用於解碼。
圖10至圖12為根據本發明的實施例的用於描述編碼單元1010、預測單元1060與變換單元1070之間的關係的示意圖。
編碼單元1010為最大編碼單元中的具有樹型結構的編碼單元,其對應於由視訊編碼裝置100判定的經編碼的深度。預測單元1060為編碼單元1010中的每一者的預測單元的分割區,且變換單元1070為編碼單元1010中的每一者的變換單元。
當在編碼單元1010中最大編碼單元的深度為0時,編碼單元1012以及1054的深度為1,且編碼單元1014、1016、1018、1028、1050以及1052的深度為2,編碼單元1020、1022、1024、1026、1030、1032以及1048的深度為3,且編碼單元1040、1042、1044以及1046的深度為4。
在預測單元1060中,一些編碼單元1014、1016、1022、 1032、1048、1050、1052以及1054是藉由分裂編碼單元而獲得。換句話說,編碼單元1014、1022、1050以及1054中的分割區類型具有2N×N的大小,編碼單元1016、1048以及1052中的分割區類型具有N×2N的大小,且編碼單元1032的分割區類型具有N×N的大小。編碼單元1010的預測單元以及分割區等於或小於每一編碼單元。
在小於編碼單元1052的資料單元中的變換單元1070中對編碼單元1052的影像資料執行變換或反變換。此外,就大小以及形狀而言,變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050、1052以及1054不同於預測單元1060中的編碼單元。換句話說,視訊編碼裝置100以及視訊解碼裝置200可個別地對同一編碼單元中的資料單元執行框內預測、運動估計、運動補償、變換以及反變換。
因此,在最大編碼單元的每一區域中對具有階層結構的編碼單元中的每一者遞回地執行編碼,以判定最佳編碼單元,也因此,可獲得具有遞回樹型結構的編碼單元。編碼資訊可包含關於編碼單元的分裂資訊、關於分割區類型的資訊、關於預測模式的資訊以及關於變換單元的大小的資訊。
表1繪示可由視訊編碼裝置100以及視訊解碼裝置200設定的編碼資訊。
Figure TWI615017BD00001
Figure TWI615017BD00002
視訊編碼裝置100的熵編碼器120可輸出關於具有樹型結構的編碼單元的編碼資訊,且視訊解碼裝置200的熵解碼器220可從接收的位元流擷取關於具有樹型結構的編碼單元的編碼資訊。
分裂資訊指示是否將當前編碼單元分裂成較低深度的編碼單元。若當前深度d的分裂資訊為0,則不再將當前編碼單元分裂成較低深度的深度為經編碼的深度,也因此可針對經編碼的深度定義關於分割區類型、預測模式以及變換單元的大小的資訊。若根據分裂資訊進一步分裂當前編碼單元,則獨立地對較低深度的四個經分裂編碼單元執行編碼。
預測模式可為框內模式、框間模式以及跳過模式中的一者。可在所有分割區類型中定義框內模式以及框間模式,且跳過模式僅被定義於具有大小2N×2N的分割區類型中。
關於分割區類型的資訊可指示具有大小2N×2N、2N×N、N×2N以及N×N的對稱分割區類型(其藉由對稱地分裂預測單元的高度或寬度而獲得),以及具有大小2N×nU、2N×nD、nL×2N以及nR×2N的不對稱分割區類型(其藉由不對稱地分裂預測單元的高度或寬度而獲得)。可分別藉由按1:n以及n:1(其中n為大於1的整數)分裂預測單元的高度而獲得具有大小2N×nU以及2N×nD的 不對稱分割區類型,且可分別藉由按1:n以及n:1分裂預測單元的寬度而獲得具有大小nL×2N以及nR×2N的不對稱分割區類型。
可將變換單元的大小設定至框內模式中的兩個類型以及框間模式中的兩個類型。換句話說,若變換單元的分裂資訊為0,則變換單元的大小可為2N×2N(其為當前編碼單元的大小)。若變換單元的分裂資訊為1,則可藉由分裂當前編碼單元獲得變換單元。此外,若具有大小2N×2N的當前編碼單元的分割區類型為對稱分割區類型,則變換單元的大小可為N×N,且若當前編碼單元的分割區類型為不對稱分割區類型,則變換單元的大小可為N/2×N/2。
關於具有樹型結構的編碼單元的編碼資訊可包含對應於經編碼的深度的編碼單元、預測單元以及最小單元中的至少一者。對應於經編碼的深度的編碼單元可包含含有相同編碼資訊的預測單元以及最小單元中的至少一者。
因此,藉由比較鄰近資料單元的編碼資訊,判定鄰近資料單元是否包含於對應於經編碼的深度的同一編碼單元中。此外,藉由使用資料單元的編碼資訊判定對應於經編碼的深度的對應的編碼單元,也因此可判定經編碼的深度在最大編碼單元中的分佈。
因此,若基於鄰近資料單元的編碼資訊預測當前編碼單元,則可直接參考且使用鄰近當前編碼單元的較深編碼單元中的資料單元的編碼資訊。
或者,若基於鄰近資料單元的編碼資訊預測當前編碼單元,則使用資料單元的經編碼的資訊搜尋鄰近當前編碼單元的資 料單元,且可參考搜尋的鄰近編碼單元來預測當前編碼單元。
圖13為根據表1的編碼模式資訊的描述編碼單元、預測單元與變換單元之間的關係的示意圖。
最大編碼單元1300包含經編碼的深度的編碼單元1302、1304、1306、1312、1314、1316以及1318。此處,由於編碼單元1318為經編碼的深度的編碼單元,因此可將分裂資訊設定至0。可將關於具有大小2N×2N的編碼單元1318的分割區類型的資訊設定至具有大小2N×2N的分割區類型1322、具有大小2N×N的分割區類型1324、具有大小N×2N的分割區類型1326、具有大小N×N的分割區類型1328、具有大小2N×nU的分割區類型1332、具有大小2N×nD的分割區類型1334、具有大小nL×2N的分割區類型1336以及具有大小nR×2N的分割區類型1338中的一者。
當將分割區類型設定為對稱(亦即,分割區類型1322、1324、1326或1328)時,若變換單元的分裂資訊(TU大小旗標)為0,則設定具有大小2N×2N的變換單元1342,且若TU大小旗標為1,則設定具有大小N×N的變換單元1344。
當將分割區類型設定為不對稱(亦即,分割區類型1332、1334、1336或1338)時,若TU大小旗標為0,則設定具有大小2N×2N的變換單元1352,且若TU大小旗標為1,則設定具有大小N/2×N/2的變換單元1354。
TU大小旗標為一類型的變換索引;可根據編碼單元的預測單元類型或分割區類型修改對應於變換索引的變換單元的大小。
當將分割區類型設定為對稱(亦即,分割區類型1322、 1324、1326或1328)時,若變換單元的TU大小旗標為0,則設定具有大小2N×2N的變換單元1342,且若TU大小旗標為1,則設定具有大小N×N的變換單元1344。
當將分割區類型設定為不對稱(亦即,分割區類型1332(2N×nU)、1334(2N×nD)、1336(nL×2N)或1338(nR×2N))時,若TU大小旗標為0,則設定具有大小2N×2N的變換單元1352,且若TU大小旗標為1,則設定具有大小N/2×N/2的變換單元1354。
參照圖9,以上描述的TU大小旗標為具有值0或1的旗標,但TU大小旗標不限於1位元,且可在TU大小旗標從0增大時按階層分裂變換單元。可將變換單元分裂資訊(TU大小旗標)用作變換索引的實例。
在此情況下,當將根據實施例的TU大小旗標與變換單元的最大大小與最小大小一起使用時,可表達實際使用的變換單元的大小。視訊編碼裝置100可編碼最大變換單元大小資訊、最小變換單元大小資訊以及最大變換單元分裂資訊。可將經編碼的最大變換單元大小資訊、最小變換單元大小資訊以及最大變換單元分裂資訊插入至序列參數集(sequence parameter set;SPS)內。視訊解碼裝置200可將最大變換單元大小資訊、最小變換單元大小資訊以及最大變換單元分裂資訊用於視訊解碼。
舉例而言,(a)若當前編碼單元的大小為64×64且最大變換單元為32×32,則(a-1)若TU大小旗標為0,則變換單元的大小為32×32;(a-2)若TU大小旗標為1,則變換單元的大小為16×16;且(a-3)若TU大小旗標為2,則變換單元的大小為8×8。
或者,(b)若當前編碼單元的大小為32×32且最小變換單 元為32×32,則(b-1)若TU大小旗標為0,則變換單元的大小為32×32,且由於變換單元的大小不能小於32×32,因此不能設定更多TU大小旗標。
或者,(c)若當前編碼單元的大小為64×64且最大TU大小旗標為1,則TU大小旗標可為0或1,且不能設定其他TU大小旗標。
因此,當將最大TU大小旗標定義為‘MaxTransformSizeIndex’、將最小TU大小旗標定義為‘MinTransformSize’並將在TU大小旗標為0的情況下的變換單元(亦即,根變換單元RootTu)定義為‘RootTuSize’時,在當前編碼單元中可用的最小變換單元‘CurrMinTuSize’的大小可由以下等式(1)定義。
CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))...(1)
與在當前編碼單元中可用的最小變換單元‘CurrMinTuSize’的大小相比,為TU大小旗標為0時的變換單元的大小的根變換單元大小‘RootTuSize’可指示可關於系統選擇的最大變換單元。亦即,根據等式(1),‘RootTuSize/(2^MaxTransformSizeIndex)’為藉由按對應於最大變換單元分裂資訊的分裂次數分裂‘RootTuSize’(其為當變換單元分裂資訊為0時變換單元的大小)獲得的變換單元的大小,且‘MinTransformSize’為最小變換單元的大小,也因此此等的最小值可為‘CurrMinTuSize’,其為在當前編碼單元中可用的最小變 換單元的大小。
根據本發明的實施例的根變換單元‘RootTuSize’的大小可根據預測模式而變化。
舉例而言,若當前預測模式為框間模式,則可根據以下等式(2)判定RootTuSize。在等式(2)中,‘MaxTransformSize’指最大變換單元大小,且‘PUSize’指當前預測單元大小。
RootTuSize=min(MaxTransformSize,PUSize)...(2)
換句話說,若當前預測模式為框間模式,則根變換單元大小‘RootTuSize’(其為TU大小旗標為0的情況下的變換單元)的大小可被設定至最大變換單元大小以及當前預測單元大小中的較小值。
若當前分割區單元的預測模式為框內模式,則可根據以下等式(3)判定‘RootTuSize’。‘PartitionSize’指當前分割區單元的大小。
RootTuSize=min(MaxTransformSize,PartitionSize)...(3)
換句話說,若當前預測模式為框內模式,則根變換單元大小‘RootTuSize’可被設定至最大變換單元大小以及當前分割區單元大小中的較小值。
然而,應注意,根變換單元大小‘RootTuSize’(其為根據本發明的實施例的當前最大變換單元大小並根據分割區單元的預測模式而變化)的大小為實例,而用於判定當前最大變換單元大小的因素不限於此。
現將詳細描述由圖1的視訊編碼裝置100的熵編碼器120執行的語法元素的熵編碼操作,以及由圖2的視訊解碼裝置200 的熵解碼器220執行的語法元素的熵解碼操作。
如上所述,視訊編碼裝置100以及視訊解碼裝置200藉由將最大編碼單元分裂成等於或小於最大編碼單元的編碼單元來執行編碼以及解碼。可與其他資料單元獨立地基於成本判定在預測以及變換中使用的預測單元以及變換單元。由於可藉由遞回地編碼包含於最大編碼單元中的具有階層結構的每一編碼單元來判定最佳編碼單元,因此可組態具有樹型結構的資料單元。換句話說,對於每一最大編碼單元,可組態具有樹型結構的編碼單元以及各從具有樹型結構的預測單元與變換單元。為了解碼,需要傳輸為指示具有階層結構的資料單元的結構資訊的資訊的階層資訊以及除了階層資訊的外的用於解碼的非階層資訊。
與階層結構有關的資訊為判定具有樹型結構的編碼單元、具有樹型結構的預測單元以及具有樹型結構的變換單元所需的資訊(如上參照圖10至圖12描述),且包含最大編碼單元的大小資訊、經編碼的深度、預測單元的分割區資訊、指示編碼單元是否經分裂的分裂旗標、變換單元的大小資訊以及指示變換單元是否經分裂成較小變換單元以用於變換操作的分裂變換旗標(split_transform_flag)。編碼不同於階層結構資訊的資訊的範例包含應用至每一預測單元的框內/框間預測的預測模式資訊、運動向量資訊、預測方向資訊、在使用多個色彩分量的情況下應用至每一資料單元的色彩分量資訊以及變換係數層級資訊。下文中,階層資訊以及附加階層資訊可被稱作待熵編碼或熵解碼的語法元素。
詳細而言,根據本發明的實施例,提供一種當語法元素 中的與變換單元有關的語法元素為熵編碼及熵解碼時選擇上下文模型的方法。現將詳細描述熵編碼以及熵解碼與變換單元有關的語法元素的操作。
圖14為根據本發明的實施例的熵編碼裝置1400的方塊圖。熵編碼裝置1400對應於圖1的視訊編碼裝置100的熵編碼器120。
參照圖14,熵編碼裝置1400包含二進位化器1410、上下文模型化器1420以及二進位算術編碼器1430。此外,二進位算術編碼器1430包含常規編碼引擎1432以及旁路編碼引擎1434。
當輸入至熵編碼裝置1400的語法元素並非二進位值時,二進位化器1410二進位化語法元素,以便輸出由0與1的二進位值組成的二進位串。二進位(bin)表示由0與1組成的串流的每一位元,且藉由上下文從適應二進位算術編碼(context adaptive binary arithmetic coding;CABAC)來編碼。若語法元素為具有0與1之間的相同機率的資料,則將語法元素輸出至旁路編碼引擎1434以被編碼,旁路編碼引擎1434不使用機率。
二進位化器1410可根據語法元素的類型使用各種二進位化方法。二進位化方法的實例可包含一元方法(unary method)、截斷一元方法(truncated unary method)、截斷萊斯碼(rice code)方法、哥倫布碼(Golomb code)方法以及固定長度碼方法。
藉由使用固定碼方法來二進位化變換單元有效係數旗標cbf,變換單元有效係數旗標cbf指示非零變換係數(下文亦被稱作“有效係數”)是否存在於變換單元中。亦即,若非零變換係數存在於變換單元中,則變換單元有效係數旗標cbf經設定以具有值 1。否則,若非零變換係數不存在於變換單元中,則變換單元有效係數旗標cbf經設定以具有值0。若影像包含多個色彩分量,則可關於每一色彩分量的變換單元設定變換單元有效係數旗標cbf。舉例而言,若影像包含亮度(Y)以及色度(Cb、Cr)分量,則可設定亮度分量的變換單元的變換單元有效係數旗標cbf_luma以及色度分量的變換單元的變換單元有效係數旗標cbf_cb或cbf_cr。
上下文模型化器1420將用於編碼對應於語法元素的位元串的上下文模型提供至常規編碼引擎1432。更詳細而言,上下文模型化器1420將用於編碼當前語法元素的位元串的每一二進位值的二進位值的機率輸出至二進位算術編碼器1430。
上下文模型為二進位的機率模型,且包含關於0與1中的哪一者對應於最可能符號(most probable symbol;MPS)以及最不可能符號(least probable symbol;LPS)的資訊,以及MPS與LPS中的至少一者的機率資訊。
上下文模型化器1420可基於變換單元的變換深度選擇用於熵編碼變換單元有效係數旗標cbf的上下文模型。若變換單元的大小等於編碼單元的大小,亦即,若變換單元的變換深度為0,則上下文模型化器1420可將預設定的第一上下文模型判定為用於熵編碼變換單元有效係數旗標cbf的上下文模型。否則,若變換單元的大小小於編碼單元的大小,亦即,若變換單元的變換深度並非0,則上下文模型化器1420可將預設定的第二上下文模型判定為用於熵編碼變換單元有效係數旗標cbf的上下文模型。此處,第一以及第二上下文模型是基於不同機率分佈模型。亦即,第一與第二上下文模型為不同的上下文模型。
如上所述,當熵編碼變換單元有效係數旗標cbf時,上下文模型化器1420在變換單元的大小等於編碼單元的大小的情況下與變換單元的大小不等於編碼單元的大小的情況下使用不同的上下文模型。若指示用於熵編碼變換單元有效係數旗標cbf的多個預設定的上下文模型中的一者的索引被稱作上下文索引ctxIdx,則上下文索引ctxIdx可具有藉由將用於判定上下文模型的上下文增加參數ctxInc與預設定的上下文索引偏移ctxIdxOffset求和而獲得的值。亦即,ctxIdx=ctxInc+ctxIdxOffset。上下文模型化器1420可將變換單元的變換深度為0的情況與變換單元的變換深度並非0的情況區分開,可基於變換單元的變換深度改變用於判定上下文模型的上下文增加參數ctxInc,也因此可改變用於判定用於熵編碼變換單元有效係數旗標cbf的上下文模型的上下文索引ctxIdx。
更詳細地,若變換深度被稱作trafodepth,則上下文模型化器1420可基於以下演算法判定上下文增加參數ctxInc。ctxInc=(trafodepth==0)?1:0 This algorithm may be implemented by the following pseudo code. { If(trafodepth==0)ctxInc=1; else ctxInc=0; }
可根據亮度以及色度分量單獨設定變換單元有效係數旗標cbf。如上所述,可藉由使用根據變換單元的變換深度是否為0而改變的上下文增加參數ctxInc來判定用於熵編碼亮度分量的變換單元的變換單元有效係數旗標cbf_luma的上下文模型。可藉由 將變換深度trafodepth的值用作上下文增加參數ctxInc來判定用於熵編碼色度分量的變換單元的變換單元有效係數旗標cbf_cb或cbf_cr的上下文模型。
常規編碼引擎1432基於關於MPS與LPS的資訊以及MPS與LPS中的至少一者的機率資訊(其包含於從上下文模型化器1420提供的上下文模型中)對對應於語法元素的位元流執行二進位算術編碼。
圖15為根據本發明的實施例的熵編碼以及熵解碼與變換單元有關的語法元素的操作的流程圖。
參照圖15,在操作1510中,最初熵編碼以及熵解碼變換單元有效係數旗標cbf,其指示包含於當前變換單元中的變換係數中是否存在非零變換係數。如上所述,可基於變換單元的變換深度判定用於熵編碼變換單元有效係數旗標cbf的上下文模型,且可基於判定的上下文模型執行對變換單元有效係數旗標cbf的二進位算術編碼。
若變換單元有效係數旗標cbf為0,則由於在當前變換單元中僅存在變換係數0,因此將值0熵編碼或解碼為變換單元有效係數旗標cbf,且不熵編碼或解碼變換係數層級資訊。
在操作1520中,若有效係數存在於當前變換單元中,則熵編碼或解碼指示有效係數的位置的有效值映射(SigMap)。
有效值映射(SigMap)可由有效位元以及指示最後有效值係數的位置的預定資訊形成。有效位元指示根據每一掃描索引的變換係數為有效係數抑或0,且可由significant_coeff_flag[i]表達。如以下將描述,按具有藉由分裂變換單元獲得的預定大小的 子集為單位設定有效值映射。因此,significant_coeff_flag[i]指示包含於包含於變換單元中的子集中的變換係數中的第i個掃描索引的變換係數是否為0。
根據習知H.264,單獨地熵編碼或解碼指示每一有效係數是否為最後有效係數的旗標(End-Of-Block)。然而,根據本發明的實施例,熵編碼或解碼最後有效係數自身的位置資訊。舉例而言,若最後有效係數的位置為(x,y),其中x與y為整數,則可熵編碼或解碼為指示座標值(x,y)的語法元素的last_significant_coeff_x以及last_significant_coeff_y。
在操作1530中,熵編碼或解碼指示變換係數的大小的變換係數層級資訊。根據習知H.264/AVC,藉由為語法元素的coeff_abs_level_minus1表達變換係數層級資訊。根據本發明的實施例,將為關於變換係數的絕對值是否大於1的語法元素的coeff_abs_level_greater1_flag、為關於變換係數的絕對值是否大於2的語法元素的coeff_abs_level_greater2_flag以及指示剩餘變換係數的大小資訊的coeff_abs_level_remaining編碼為變換係數層級資訊。
指示剩餘變換係數的大小資訊的語法元素coeff_abs_level_remaining具有在變換係數(absCoeff)的大小與藉由使用coeff_abs_level_greater1_flag以及coeff_abs_level_greater2_flag判定的基層級值baseLevel之間的範圍中的差。根據以下等式判定基層級值baseLevel:baseLevel=1+coeff_abs_level_greather1_flag+coeff_abs_level_greather2_flag,且根據以下等式判定 coeff_abs_level_remaining:coeff_abs_level_remaining=absCoeff-baseLevel。雖然coeff_abs_level_greater1_flag以及coeff_abs_level_greater2_flag具有0或1的值,但基層級值baseLevel可具有從1至3的值。因此,coeff_abs_level_remaining可從(absCoeff-1)變化至(absCoeff-3)。如上所述,將為原始變換係數absCoeff的大小與基層級值baseLevel之間的差的(absCoeff-baseLevel)作為變換係數的大小資訊加以傳輸以便減小所傳輸的資料的大小。
現將描述根據本發明的實施例的判定用於熵編碼變換單元有效係數旗標的上下文模型的操作。
圖16為根據本發明的實施例的說明編碼單元以及包含於編碼單元中的變換單元1611至1617的示意圖。在圖16中,由虛線指示的資料單元表示編碼單元,且由實線指示的資料單元表示變換單元1611至1617。
如上所述,視訊編碼裝置100以及視訊解碼裝置200藉由將最大編碼單元分裂成具有等於或小於最大編碼單元的大小的大小的編碼單元來執行編碼以及解碼。可與其他資料單元獨立地基於成本判定在預測操作以及變換操作中使用的預測單元以及變換單元。若編碼單元的大小大於可由視訊編碼裝置100以及視訊解碼裝置200使用的最大變換單元的大小,則可將編碼單元分裂成具有等於或小於最大變換單元的大小的變換單元,且可基於經分裂變換單元執行變換操作。舉例而言,若編碼單元的大小為64×64且可使用的最大變換單元的大小為32×32,為了變換(或反變換)編碼單元,將編碼單元分裂成具有等於或小於32×32的大小 的變換單元。
可判定變換深度(trafodepth),其指示在水平與垂直方向將編碼單元分裂成變換單元的次數。舉例而言,若當前編碼單元的大小為2N×2N且變換單元的大小為2N×2N,則可將變換深度判定為0。若變換單元的大小為N×N,則可將變換深度判定為1。否則,若變換單元的大小為N/2×N/2,則可將變換深度判定為2。
參照圖16,變換單元1611、1616以及1617為藉由將根編碼單元分裂一次而獲得的層級1變換單元,且具有變換深度1。變換單元1612、16143、1614以及1615為藉由將層級1變換單元分裂成四片而獲得的層級2變換單元,且具有變換深度2。
圖17為說明用以基於變換深度判定圖16的變換單元1611至1617中的每一者的變換單元有效係數旗標cbf的上下文模型的上下文增加參數ctxInc的示意圖。在圖17的樹型結構中,葉節點1711至1717分別對應於圖16的變換單元1611至1617,且在葉節點1711至1717上標出的值0及1指示變換單元1611至1617的變換單元有效係數旗標cbf。此外,在圖17中,按位於左上側、右上側、左下側以及右下側的變換單元的次序來說明具有相同變換深度的葉節點。舉例而言,圖17的葉節點1712、1713、1714以及1715分別對應於圖16的變換單元1612、1613、1614以及1615。此外,參照圖16以及圖17,假定僅變換單元1612以及1614的變換單元有效係數旗標cbf為1,且其他變換單元的變換單元有效係數旗標cbf為0。
參照圖17,由於圖16的所有變換單元1611至1617皆是藉由分裂根編碼單元而獲得也因此具有非零變換深度,因此用以 判定變換單元1611至1617中的每一者的變換單元有效係數旗標cbf的上下文模型的上下文增加參數ctxInc經設定以具有值0。
圖18為根據本發明的另一實施例的說明編碼單元1811以及包含於編碼單元1811中的變換單元1812的示意圖。在圖18中,由虛線指示的資料單元表示編碼單元1811,且由實線指示的資料單元表示變換單元1812。
參照圖18,若編碼單元1811的大小等於用以變換編碼單元1811的變換單元1812的大小,則變換單元1812的變換深度(trafodepth)具有值0。若變換單元1812具有變換深度0,則用以判定變換單元1812的變換單元有效係數旗標cbf的上下文模型的上下文增加參數ctxInc經設定以具有值1。
圖14的上下文模型化器1420可基於變換單元的變換深度將編碼單元的大小與變換單元的大小比較,可區分當變換單元的變換深度為0的情況與當變換單元的變換深度不為0的情況,也因此可改變用以判定用於熵編碼變換單元有效係數旗標cbf的上下文模型的上下文增加參數ctxInc。藉由改變用以判定上下文模型的上下文增加參數ctxInc,在變換單元的變換深度為0的情況下以及在變換單元的變換深度不為0的情況下,可改變用於熵編碼變換單元有效係數旗標cbf的上下文模型。
圖19為根據本發明的實施例的說明用以判定包含於圖16的編碼單元中的變換單元的結構的分裂變換旗標(split_transform_flag)的示意圖。
視訊編碼裝置100可對視訊解碼裝置200傳訊關於用以變換每一編碼單元的變換單元的結構的資訊。可藉由使用指示是 否在水平與垂直方向上將每一編碼單元分裂成四個變換單元的分裂變換旗標(split_transform_flag)來傳訊關於變換單元的結構的資訊。
參照圖16以及圖19,由於將根編碼單元分裂成四片,因此將根編碼單元的分裂變換旗標(split_transform_flag)1910設定為1。若根編碼單元的大小大於可使用的最大變換單元的大小,則根編碼單元的分裂變換旗標(split_transform_flag)1910可始終設定為1,且可不被傳訊。這是因為若編碼單元的大小大於可使用的最大變換單元的大小,則編碼單元不需要被分裂成具有等於或小於至少最大變換單元的大小的大小的較深編碼單元。
關於具有變換深度1的自根編碼單元分裂的四個變換單元中的每一者,設定指示是否將四個變換單元中的每一者分裂成具有變換深度2的四個變換單元的分裂變換旗標。在圖19中,按位於左上側、右上側、左下側以及右下側的變換單元的次序來說明具有相同變換深度的變換單元的分裂變換旗標。參考數字1911表示圖16的變換單元1611的分裂變換旗標。由於變換單元1611未分裂成具有較低深度的變換單元,因此變換單元1611的分裂變換旗標1911具有值0。同樣地,由於圖16的變換單元1616以及1617未分裂成具有較低深度的變換單元,因此變換單元1616以及1617的分裂變換旗標1913以及1914具有值0。由於圖16中具有變換深度1的右上側變換單元經分裂成具有變換深度2的變換單元1612、1613、1614以及1615,因此右上側變換單元的分裂變換旗標1912具有變換深度1。由於具有變換深度2的變換單元1612、1613、1614以及1615未分裂成具有較低深度的變換單元,因此具 有變換深度2的變換單元1612、1613、1614以及1615的分裂變換旗標1915、1916、1917以及1918具有值0。
如上所述,可基於變換單元的變換深度判定用於熵編碼變換單元有效係數旗標cbf的上下文模型,且可基於選定上下文模型對變換單元有效係數旗標cbf執行二進位算術編碼。若變換單元有效係數旗標cbf為0,則由於僅0變換係數存在於當前變換單元中,因此將值0熵編碼或解碼為變換單元有效係數旗標cbf,且不熵編碼或解碼變換係數層級資訊。
現將描述熵編碼與包含於變換單元有效係數旗標cbf具有值1的變換單元(亦即,具有非零變換係數的變換單元)中的變換係數有關的語法元素的操作。
圖20說明根據本發明的實施例的經熵編碼的變換單元2000。雖然圖20中說明具有16×16大小的變換單元2000,但變換單元2000的大小不限於16×16的所說明的大小,而是亦可具有在4×4至32×32的範圍內的各種大小。
參照圖20,為了熵編碼以及熵解碼包含於變換單元2000中的變換係數,可將變換單元2000分成較小的變換單元。現將描述熵編碼與包含於變換單元2000中的4×4變換單元2010有關的語法元素的操作。此熵編碼操作亦可應用於不同大小的變換單元。
包含於4×4變換單元2010中的變換係數各具有變換係數(absCoeff),如在圖20中所說明。包含於4×4變換單元2010中的變換係數可根據如在圖20中所說明的預定掃描次序而序列化且依序受到處理。然而,掃描次序不限於所說明的次序,而是亦可作修改。
與包含於4×4變換單元2010中的變換係數有關的語法元素的實例為:significant_coeff_flag,其為指示包含於變換單元中的每一變換係數是否為具有非0值的有效係數的語法元素;coeff_abs_level_greater1_flag,其為指示變換係數的絕對值是否大於1的語法元素;coeff_abs_level_greater2_flag,其為指示絕對值是否大於2的語法元素;以及coeff_abs_level_remaining,其為指示剩餘變換係數的大小資訊的語法元素。
圖21說明對應於圖20的變換單元2010的有效值映射2100。
參照圖20以及圖21,設定對於包含於圖20的4×4變換單元2010中的變換係數中的具有非0值的有效係數中的每一者具有值1的有效值映射2100。藉由使用先前設定的上下文模型來熵編碼或解碼有效值映射2100。
圖22說明對應於圖20的4×4變換單元2010的coeff_abs_level_greater1_flag 2200。
參照圖20至圖22,關於有效值映射2100具有值1的有效係數,設定為指示對應的有效值變換係數是否具有大於1的值的旗標的coeff_abs_level_greater1_flag 2200。當coeff_abs_level_greater1_flag 2200為1時,其指示對應的變換係數為具有大於1的值的變換係數,且當coeff_abs_level_greater1_flag 2200為0時,其指示對應的變換係數為具有值1的變換係數。在圖22中,當coeff_abs_level_greater1_flag 2210處於具有值1的變換係數的位置處時,coeff_abs_level_greater1_flag 2210具有值0。
圖23說明對應於圖20的4×4變換單元2010的coeff_abs_level_greater2_flag 2300。
參照圖20至圖23,關於將coeff_abs_level_greater1_flag 2200設定至1的變換係數,設定指示對應的變換係數是否具有大於2的值的coeff_abs_level_greater2_flag 2300。當coeff_abs_level_greater2_flag 2300為1時,其指示對應的變換係數為具有大於2的值的變換係數,且當coeff_abs_level_greater2_flag 2300為0時,其指示對應的變換係數為具有值2的變換係數。在圖23中,當coeff_abs_level_greater2_flag 2310處於具有值2的變換係數的位置處時,coeff_abs_level_greater2_flag 2310具有0的值。
圖24說明對應於圖20的4×4變換單元2010的coeff_abs_level_remaining 2400。
參照圖20至圖24,可藉由計算每一變換係數的(absCoeff-baseLevel)而獲得為指示剩餘變換係數的大小資訊的語法元素的coeff_abs_level_remaining 2400。
為指示剩餘變換係數的大小資訊的語法元素的coeff_abs_level_reimaining 2400具有在變換係數(absCoeff)的大小與藉由使用coeff_abs_level_greater1_flag以及coeff_abs_level_greater2_flag判定的基層級值baseLevel之間的範圍中的差。根據以下等式判定基層級值baseLevel:baseLevel=1+coeff_abs_level_greather1_flag+coeff_abs_level_greather2_flag,並根據以下等式判定coeff_abs_level_remaining: coeff_abs_level_remaining=absCoeff-baseLevel。
可根據所說明的掃描次序讀取並熵編碼coeff_abs_level_remaining 2400。
圖25為根據本發明的實施例的熵編碼視訊的方法的流程圖。
參照圖14以及圖25,在操作2510中,上下文模型化器1420獲得基於變換單元變換的編碼單元的資料。在操作2520中,上下文模型化器1420基於變換單元的變換深度而判定用於算術編碼指示非零變換係數是否存在於變換單元中的變換單元有效係數旗標的上下文模型。
上下文模型化器1420可判定在變換單元的大小等於編碼單元的大小(亦即,當變換單元的變換深度為0時)的情況與在變換單元的大小小於編碼單元的大小(亦即,當變換單元的變換深度不為0時)的情況中的不同上下文模型。更詳細而言,上下文模型化器1420可基於變換單元的變換深度改變用於判定上下文模型的上下文增加參數ctxInc,可將變換單元的變換深度為0的情況與變換單元的變換深度並非0的情況區分開,也因此可改變用於判定用於熵編碼變換單元有效係數旗標的上下文模型的上下文索引ctxIdx。
可根據亮度以及色度分量單獨地設定變換單元有效係數旗標。可藉由使用根據變換單元的變換深度是否為0而改變的上下文增加參數ctxInc來判定用於熵編碼亮度分量的變換單元的變換單元有效係數旗標cbf_luma的上下文模型。可藉由將變換深度(trafodepth)的值用作上下文增加參數ctxInc來判定用於熵編碼色 度分量的變換單元的變換單元有效係數旗標cbf_cb或cbf_cr的上下文模型。
在操作2530中,常規編碼引擎1432基於判定的上下文模型來算術編碼變換單元有效係數旗標。
圖26為根據本發明的實施例的熵解碼裝置2600的方塊圖。熵解碼裝置2600對應於圖2的視訊解碼裝置200的熵解碼器220。熵解碼裝置2600執行以上描述的由熵編碼裝置1400執行的熵編碼操作的逆操作。
參照圖26,熵解碼裝置2600包含上下文模型化器2610、常規解碼引擎2620、旁路解碼引擎2630以及去二進位化器2640。
將藉由使用旁路編碼而編碼的語法元素輸出至旁路解碼引擎2630以便被算術解碼,且藉由使用常規編碼而編碼的語法元素由常規解碼引擎2620算術解碼。常規解碼引擎2620基於藉由使用上下文模型化器2610而提供的上下文模型來算術解碼當前語法元素的二進位值以藉此輸出位元串。
如同圖14的上述上下文模型化器1420,上下文模型化器2610可基於變換單元的變換深度選擇用於熵解碼變換單元有效係數旗標cbf的上下文模型。亦即,上下文模型化器2610可判定在變換單元的大小等於編碼單元的大小(亦即,當變換單元的變換深度為0時)的情況與在變換單元的大小小於編碼單元的大小(亦即,當變換單元的變換深度不為0時)的情況中的不同上下文模型。更詳細地,上下文模型化器2610可基於變換單元的變換深度而改變用於判定上下文模型的上下文增加參數ctxInc,可將變換單元的變換深度為0的情況與變換單元的變換深度並非0的情況區 分開,也因此可改變用於判定用於熵解碼變換單元有效係數旗標cbf的上下文模型的上下文索引ctxIdx。
若基於指示從位元流獲得的編碼單元是否經分裂成變換單元的分裂變換旗標(split_transform_flag)而判定包含於編碼單元中的變換單元的結構,則可基於編碼單元經分裂以達到變換單元的次數來判定變換單元的變換深度。
可根據亮度以及色度分量單獨地設定變換單元有效係數旗標cbf。可藉由使用根據變換單元的變換深度是否為0而改變的上下文增加參數ctxInc來判定用於熵解碼亮度分量的變換單元的變換單元有效係數旗標cbf_luma的上下文模型。可藉由將變換深度(trafodepth)的值用作上下文增加參數ctxInc來判定用於熵解碼色度分量的變換單元的變換單元有效係數旗標cbf_cb或cbf_cr的上下文模型。
去二進位化器2640再次將由常規解碼引擎2620或旁路解碼引擎2630算術解碼的位元串重建構為語法元素。
除了變換單元有效係數旗標cbf之外,熵解碼裝置2600亦算術解碼與變換單元有關的語法元素(諸如,coeff_abs_level_remaing、SigMap、coeff_abs_level_greater1_flag以及coeff_abs_level_greater2_flag),並將其輸出。當重建構與變換單元有關的語法元素時,可基於重建構的語法元素藉由使用反量化、反變換以及預測解碼來解碼包含於變換單元中的資料。
圖27為根據本發明的實施例的熵解碼視訊的方法的流程圖。
參照圖27,在操作2710中,判定包含於編碼單元中且用 以反變換編碼單元的變換單元。如上所述,可基於指示從位元流獲得的編碼單元是否經分裂成變換單元的分裂變換旗標split_transform_flag而判定包含於編碼單元中的變換單元的結構。此外,可基於編碼單元經分裂以達到變換單元的次數來判定變換單元的變換深度。
在操作2720中,上下文模型化器2610從位元流獲得指示非零變換係數是否存在於變換單元中的變換單元有效係數旗標。
在操作2730中,上下文模型化器2610基於變換單元的變換深度判定用於算術解碼變換單元有效係數旗標的上下文模型。如上所述,上下文模型化器2610可判定在變換單元的大小等於編碼單元的大小(亦即,當變換單元的變換深度為0時)的情況與在變換單元的大小小於編碼單元的大小(亦即,當變換單元的變換深度不為0時)的情況中的不同上下文模型。更詳細而言,上下文模型化器2610可基於變換單元的變換深度而改變用於判定上下文模型的上下文增加參數ctxInc,可將變換單元的變換深度為0的情況與變換單元的變換深度並非0的情況區分開,也因此可改變用於判定用於熵解碼變換單元有效係數旗標的上下文模型的上下文索引ctxIdx。
在操作2740中,常規解碼引擎2620基於從上下文模型化器2610提供的上下文模型而算術解碼變換單元有效係數旗標。
本發明的以上實施例亦可體現為在電腦可讀記錄媒體上的電腦可讀程式碼。電腦可讀記錄媒體為可儲存可其後由電腦系統讀取的資料的任一資料儲存元件。電腦可讀記錄媒體的實例包 含唯讀記憶體(read-only memory;ROM)、隨機存取記憶體(random-access memory;RAM)、CD-ROM、磁帶、軟性磁碟以及光學資料儲存器件。電腦可讀記錄媒體亦可分佈於網路耦接的電腦系統上,使得按分散式方式儲存以及執行電腦可讀程式碼。
雖然本發明已參照其例示性實施例加以特定地繪示與描述,但一般熟習此項技術者應理解,在不脫離如由以下申請專利範圍定義的本發明的精神以及範疇的情況下,可在其中進行形式以及細節的各種改變。
2710‧‧‧操作
2720‧‧‧操作
2730‧‧‧操作
2740‧‧‧操作

Claims (1)

  1. 一種解碼視訊的裝置,所述裝置包括:剖析器,從位元流獲得當前變換深度k的分裂變換旗標,k為整數,且當所述當前變換深度k的所述分裂變換旗標指出不分裂,則判定變換深度等於所述當前變換深度;上下文模型化器,基於所述變換深度是否等於預設值而不使用變換單元的大小,以判定上下文增加參數作為上下文索引的判定,並藉由外加所述上下文增加參數與上下文偏移取得上下文模型以算數解碼使用所述上下文索引的變換單元有效係數旗標;以及算術解碼器,基於所述上下文模型對所述變換單元有效係數旗標進行算數解碼,並基於所述變換單元有效係數旗標判定至少一非零變換有效係數是否存在於所述變換深度的所述變換單元中,其中所述變換深度指出編碼單元的高度與寬度的分裂次數以取得所述變換單元,其中所述預設值為0,且其中,當所述分裂變換旗標指出分裂成所述當前深度,所述當前深度的變換單元分裂成下一深度的一或多個變換單元,且所述下一深度的分裂變換旗標從所述位元流取得。
TW105128696A 2012-07-02 2013-07-02 熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置 TWI615017B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261667117P 2012-07-02 2012-07-02
US61/667,117 2012-07-02

Publications (2)

Publication Number Publication Date
TW201642654A TW201642654A (zh) 2016-12-01
TWI615017B true TWI615017B (zh) 2018-02-11

Family

ID=49882230

Family Applications (3)

Application Number Title Priority Date Filing Date
TW106143919A TWI655859B (zh) 2012-07-02 2013-07-02 熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置
TW105128696A TWI615017B (zh) 2012-07-02 2013-07-02 熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置
TW102123712A TWI555377B (zh) 2012-07-02 2013-07-02 熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW106143919A TWI655859B (zh) 2012-07-02 2013-07-02 熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW102123712A TWI555377B (zh) 2012-07-02 2013-07-02 熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置

Country Status (28)

Country Link
US (5) US9407936B2 (zh)
EP (5) EP3361732B1 (zh)
JP (3) JP6014823B2 (zh)
KR (12) KR101484283B1 (zh)
CN (7) CN105007489A (zh)
AU (4) AU2013285752B2 (zh)
BR (3) BR122020009714B1 (zh)
CA (2) CA2988167C (zh)
CY (1) CY1120791T1 (zh)
DK (5) DK3361733T3 (zh)
ES (5) ES2768086T3 (zh)
HR (1) HRP20180927T1 (zh)
HU (3) HUE039986T2 (zh)
IN (1) IN2015MN00021A (zh)
LT (1) LT2869563T (zh)
MX (1) MX347473B (zh)
MY (6) MY200990A (zh)
PH (5) PH12018500781A1 (zh)
PL (5) PL3361733T3 (zh)
PT (1) PT2869563T (zh)
RS (1) RS57336B1 (zh)
RU (3) RU2612624C2 (zh)
SG (4) SG11201408336RA (zh)
SI (1) SI2869563T1 (zh)
TR (1) TR201808497T4 (zh)
TW (3) TWI655859B (zh)
WO (1) WO2014007524A1 (zh)
ZA (1) ZA201500272B (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101703327B1 (ko) * 2010-01-14 2017-02-06 삼성전자 주식회사 계층적 데이터 단위의 패턴 정보를 이용하는 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
US10091529B2 (en) * 2010-07-09 2018-10-02 Samsung Electronics Co., Ltd. Method and apparatus for entropy encoding/decoding a transform coefficient
SI2869563T1 (en) * 2012-07-02 2018-08-31 Samsung Electronics Co., Ltd. The process of entropic video decoding
US20160165246A1 (en) * 2013-07-17 2016-06-09 Sony Corporation Image processing device and method
JP6066945B2 (ja) * 2014-02-21 2017-01-25 キヤノン株式会社 画像復号装置、画像復号方法及びプログラム
KR102051200B1 (ko) * 2015-05-19 2019-12-02 미디어텍 인크. 다중 테이블 기반의 컨텍스트 적응 이진 산술 코딩을 위한 방법 및 장치
WO2016183814A1 (en) * 2015-05-20 2016-11-24 Mediatek Singapore Pte. Ltd. Coded block flag coding using cross-component correlation
CN105141957B (zh) * 2015-07-31 2019-03-15 广东中星电子有限公司 图像和视频数据编解码的方法和设备
JP2018530211A (ja) * 2015-09-08 2018-10-11 サムスン エレクトロニクス カンパニー リミテッド エントロピー符号化及び復号化のための装置及び方法
US10531102B2 (en) * 2015-09-10 2020-01-07 Samsung Electronics Co., Ltd. Encoding device, decoding device, and encoding and decoding method thereof
KR102469145B1 (ko) 2015-10-13 2022-11-21 삼성전자주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
US10362310B2 (en) * 2015-10-21 2019-07-23 Qualcomm Incorporated Entropy coding techniques for display stream compression (DSC) of non-4:4:4 chroma sub-sampling
CN113810709A (zh) 2016-04-29 2021-12-17 世宗大学校产学协力团 用于对图像信号进行编码和解码的方法和装置
WO2017188739A1 (ko) * 2016-04-29 2017-11-02 세종대학교 산학협력단 영상 신호 부호화 및 복호화 방법과 장치
BR112019013834A2 (pt) * 2017-01-03 2020-01-28 Lg Electronics Inc método e aparelho para codificar / decodificar sinal de vídeo usando transformada secundária
KR102601268B1 (ko) * 2017-02-24 2023-11-10 주식회사 케이티 비디오 신호 처리 방법 및 장치
AU2018254570B2 (en) * 2017-04-21 2021-08-05 Zenimax Media Inc. Systems and methods for deferred post-processes in video encoding
US10560723B2 (en) * 2017-05-08 2020-02-11 Qualcomm Incorporated Context modeling for transform coefficient coding
WO2019045538A1 (ko) * 2017-09-04 2019-03-07 삼성전자 주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
CN117834919A (zh) 2018-01-17 2024-04-05 英迪股份有限公司 对视频进行解码或编码的方法和用于发送比特流的方法
US11366738B2 (en) * 2018-03-12 2022-06-21 Headspin, Inc. System to determine performance based on entropy values
EP3562156A1 (en) * 2018-04-27 2019-10-30 InterDigital VC Holdings, Inc. Method and apparatus for adaptive context modeling in video encoding and decoding
WO2020101313A1 (ko) * 2018-11-12 2020-05-22 삼성전자 주식회사 계수 레벨의 엔트로피 부호화 방법 및 장치, 엔트로피 복호화 방법 및 장치
CN111435993B (zh) * 2019-01-14 2022-08-26 华为技术有限公司 视频编码器、视频解码器及相应方法
CN114143548B (zh) 2019-03-11 2023-02-14 北京达佳互联信息技术有限公司 视频编解码中变换系数的编解码
KR102204438B1 (ko) * 2019-03-15 2021-01-18 삼성전자주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
WO2020189971A1 (ko) * 2019-03-15 2020-09-24 엘지전자 주식회사 영상 코딩 시스템에서 변환 스킵 플래그를 이용한 영상 디코딩 방법 및 그 장치
WO2020218580A1 (ja) * 2019-04-24 2020-10-29 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
KR102211000B1 (ko) * 2019-06-21 2021-02-02 삼성전자주식회사 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치
CN112449188B (zh) * 2019-08-28 2021-08-20 腾讯科技(深圳)有限公司 视频解码方法、编码方法、装置、介质及电子设备
WO2021194199A1 (ko) * 2020-03-24 2021-09-30 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
US20230108690A1 (en) * 2020-03-26 2023-04-06 Lg Electronics Inc. Transform-based image coding method and device therefor
US11386663B1 (en) 2020-08-28 2022-07-12 Headspin, Inc. Reference-free system for determining quality of video data
US20220321909A1 (en) * 2021-03-31 2022-10-06 Tencent America LLC Harmonized design between multiple reference line intra prediction and transform partitioning
CN114531595B (zh) * 2022-04-24 2022-08-09 浙江芯昇电子技术有限公司 cabac二进制化和上下文模型产生的编码方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050078750A1 (en) * 2003-10-14 2005-04-14 Matsushita Electric Industrial Co., Ltd. De-blocking filter processing apparatus and de-blocking filter processing method
CN101313588A (zh) * 2005-09-27 2008-11-26 高通股份有限公司 基于内容信息的可缩放性技术
TW201031217A (en) * 2008-10-03 2010-08-16 Qualcomm Inc Video coding with large macroblocks
US20110170610A1 (en) * 2010-01-14 2011-07-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using deblocking filtering, and method and apparatus for decoding video by using deblocking filtering
US20110249721A1 (en) * 2010-04-12 2011-10-13 Qualcomm Incorporated Variable length coding of coded block pattern (cbp) in video compression

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002290243A (ja) * 2001-03-28 2002-10-04 Mitsubishi Electric Corp 符号化方法、符号化装置、復号方法、及び復号装置
JP2003319391A (ja) * 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7599438B2 (en) * 2003-09-07 2009-10-06 Microsoft Corporation Motion vector block pattern coding and decoding
US7664176B2 (en) * 2004-07-09 2010-02-16 Nokia Corporation Method and system for entropy decoding for scalable video bit stream
US20060008009A1 (en) * 2004-07-09 2006-01-12 Nokia Corporation Method and system for entropy coding for scalable video codec
JP2007043651A (ja) * 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
EP2039168A2 (en) * 2006-07-05 2009-03-25 Thomson Licensing Methods and apparatus for multi-view video encoding and decoding
US8335261B2 (en) * 2007-01-08 2012-12-18 Qualcomm Incorporated Variable length coding techniques for coded block patterns
US8515194B2 (en) * 2007-02-21 2013-08-20 Microsoft Corporation Signaling and uses of windowing information for images
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
US8335266B2 (en) * 2007-06-29 2012-12-18 Cisco Technology, Inc. Expedited splicing of video streams
US8483282B2 (en) * 2007-10-12 2013-07-09 Qualcomm, Incorporated Entropy coding of interleaved sub-blocks of a video block
JP4895396B2 (ja) * 2008-01-22 2012-03-14 キヤノン株式会社 画像復号化装置及び画像復号化方法
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) * 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US8259801B2 (en) * 2008-10-12 2012-09-04 Mediatek Inc. Methods for coding digital media data with prediction information and prediction error information being respectively carried by different bit stream sections
US20100098156A1 (en) * 2008-10-16 2010-04-22 Qualcomm Incorporated Weighted prediction based on vectorized entropy coding
KR101672456B1 (ko) * 2009-02-09 2016-11-17 삼성전자 주식회사 저복잡도 주파수 변환을 이용한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
JP5133950B2 (ja) 2009-07-16 2013-01-30 日本電信電話株式会社 コンテクスト適応エントロピ符号化方法および装置,コンテクスト適応エントロピ復号方法および装置,並びにそれらのプログラム
KR101474756B1 (ko) * 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101624649B1 (ko) * 2009-08-14 2016-05-26 삼성전자주식회사 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR20110017719A (ko) * 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
PL2491553T3 (pl) * 2009-10-20 2017-05-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób kodowania informacji audio, sposób dekodowania informacji audio i program komputerowy wykorzystujący iteracyjne zmniejszania rozmiaru przedziału
KR101457418B1 (ko) * 2009-10-23 2014-11-04 삼성전자주식회사 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR101457894B1 (ko) * 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
KR101703327B1 (ko) 2010-01-14 2017-02-06 삼성전자 주식회사 계층적 데이터 단위의 패턴 정보를 이용하는 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
US9973768B2 (en) 2010-03-16 2018-05-15 Texas Instruments Incorporated CABAC decoder with decoupled arithmetic decoding and inverse binarization
US9100661B2 (en) * 2010-04-05 2015-08-04 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using dynamic-range transformation, and method and apparatus for decoding video by using dynamic-range transformation
CN101848393B (zh) * 2010-06-08 2011-08-31 上海交通大学 可伸缩视频稀疏信息处理系统
PL3104616T3 (pl) 2010-07-09 2017-10-31 Samsung Electronics Co Ltd Urządzenie do entropijnego dekodowania współczynników przekształcenia
WO2012005520A2 (en) * 2010-07-09 2012-01-12 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using block merging, and method and apparatus for decoding video by using block merging
US9215470B2 (en) * 2010-07-09 2015-12-15 Qualcomm Incorporated Signaling selected directional transform for video coding
KR20120008314A (ko) * 2010-07-16 2012-01-30 광운대학교 산학협력단 영상 특성과 문맥에 기반한 적응적인 매크로 블록 크기 조절과 하위 블록의 깊이 조절을 이용한 동영상 부호화/복호화 장치 및 그 방법
CN103238321B (zh) * 2010-09-30 2016-11-02 三星电子株式会社 用于对分层结构的符号进行编解码的视频编解码方法及其装置
US9025661B2 (en) * 2010-10-01 2015-05-05 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding
US9641846B2 (en) * 2010-10-22 2017-05-02 Qualcomm Incorporated Adaptive scanning of transform coefficients for video coding
US9172963B2 (en) 2010-11-01 2015-10-27 Qualcomm Incorporated Joint coding of syntax elements for video coding
US8976861B2 (en) * 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
CN104811705B (zh) * 2011-01-06 2018-05-08 三星电子株式会社 视频的编码方法和装置及视频的解码方法和装置
US9414056B2 (en) * 2011-01-13 2016-08-09 Samsung Electronics Co., Ltd. Video-encoding method and apparatus for same and video-decoding method and apparatus for same using a selective scan mode
WO2012114711A1 (ja) * 2011-02-23 2012-08-30 パナソニック株式会社 画像符号化方法および画像復号方法
WO2012134246A2 (ko) * 2011-04-01 2012-10-04 엘지전자 주식회사 엔트로피 디코딩 방법 및 이를 이용하는 디코딩 장치
CN102215404B (zh) * 2011-05-20 2013-07-10 昌信科技有限公司 嵌入式系统中视频的解码方法和系统
CN105791875B (zh) 2011-06-10 2018-12-11 联发科技股份有限公司 可伸缩视频编码方法及其装置
US20130003858A1 (en) * 2011-06-30 2013-01-03 Vivienne Sze Simplified Context Selection For Entropy Coding of Transform Coefficient Syntax Elements
AU2012278484B2 (en) 2011-07-01 2016-05-05 Samsung Electronics Co., Ltd. Method and apparatus for entropy encoding using hierarchical data unit, and method and apparatus for decoding
IN2014CN03598A (zh) * 2011-11-04 2015-07-31 Sharp Kk
US9237358B2 (en) * 2011-11-08 2016-01-12 Qualcomm Incorporated Context reduction for context adaptive binary arithmetic coding
EP2800368B1 (en) * 2011-12-28 2021-07-28 Sharp Kabushiki Kaisha Arithmetic decoding device, arithmetic decoding method, and arithmetic coding device
US9185405B2 (en) * 2012-03-23 2015-11-10 Qualcomm Incorporated Coded block flag inference in video coding
SI2869563T1 (en) * 2012-07-02 2018-08-31 Samsung Electronics Co., Ltd. The process of entropic video decoding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050078750A1 (en) * 2003-10-14 2005-04-14 Matsushita Electric Industrial Co., Ltd. De-blocking filter processing apparatus and de-blocking filter processing method
CN101313588A (zh) * 2005-09-27 2008-11-26 高通股份有限公司 基于内容信息的可缩放性技术
TW201031217A (en) * 2008-10-03 2010-08-16 Qualcomm Inc Video coding with large macroblocks
US20110170610A1 (en) * 2010-01-14 2011-07-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using deblocking filtering, and method and apparatus for decoding video by using deblocking filtering
US20110249721A1 (en) * 2010-04-12 2011-10-13 Qualcomm Incorporated Variable length coding of coded block pattern (cbp) in video compression

Also Published As

Publication number Publication date
EP3361733B1 (en) 2019-12-25
JP2018046573A (ja) 2018-03-22
AU2017200680B2 (en) 2017-10-26
LT2869563T (lt) 2018-07-10
CA2988167C (en) 2019-05-28
DK3361734T3 (da) 2020-01-02
JP6014823B2 (ja) 2016-10-26
RU2673392C1 (ru) 2018-11-26
KR20140093201A (ko) 2014-07-25
JP2015526014A (ja) 2015-09-07
CN104811704B (zh) 2018-07-20
CN104471934A (zh) 2015-03-25
SG10201701381RA (en) 2017-04-27
KR20150056078A (ko) 2015-05-22
AU2013285752B2 (en) 2016-02-11
BR112014033040B1 (pt) 2020-09-29
KR101678574B1 (ko) 2016-12-06
KR101769429B1 (ko) 2017-08-18
DK2869563T3 (en) 2018-06-25
JP2016213895A (ja) 2016-12-15
EP3361732B1 (en) 2019-12-11
US20150117546A1 (en) 2015-04-30
PL3361732T3 (pl) 2020-03-31
HUE039986T2 (hu) 2019-02-28
MY166893A (en) 2018-07-24
KR20180021371A (ko) 2018-03-02
CN104811707B (zh) 2018-02-13
RU2612624C2 (ru) 2017-03-09
TWI655859B (zh) 2019-04-01
RU2015102988A (ru) 2016-08-20
PT2869563T (pt) 2018-06-25
US9516350B2 (en) 2016-12-06
DK3361732T3 (da) 2020-01-02
EP2869563A4 (en) 2016-01-13
KR20150099482A (ko) 2015-08-31
PH12018500783A1 (en) 2018-10-15
PH12018500781A1 (en) 2018-10-15
KR20170106252A (ko) 2017-09-20
KR101484283B1 (ko) 2015-01-20
CN104811707A (zh) 2015-07-29
KR20140122698A (ko) 2014-10-20
ES2770609T3 (es) 2020-07-02
CN104811708A (zh) 2015-07-29
US20150139297A1 (en) 2015-05-21
TWI555377B (zh) 2016-10-21
PH12014502873B1 (en) 2015-02-23
CY1120791T1 (el) 2019-12-11
KR101678576B1 (ko) 2016-12-06
WO2014007524A1 (ko) 2014-01-09
CA2876288C (en) 2018-01-16
PL3361735T3 (pl) 2020-04-30
EP3361734B1 (en) 2019-12-11
DK3361735T3 (da) 2020-01-27
PH12018500784A1 (en) 2018-10-15
EP3361735B1 (en) 2020-01-08
US9426496B2 (en) 2016-08-23
CA2988167A1 (en) 2014-01-09
CN107911699B (zh) 2021-08-10
EP2869563B1 (en) 2018-06-13
CN107911699A (zh) 2018-04-13
CN104811708B (zh) 2018-02-02
AU2018200355A1 (en) 2018-02-08
DK3361733T3 (da) 2020-01-20
TW201414314A (zh) 2014-04-01
AU2017200680A1 (en) 2017-02-23
ES2768086T3 (es) 2020-06-19
EP2869563A1 (en) 2015-05-06
KR101927969B1 (ko) 2018-12-11
AU2016201791B2 (en) 2016-11-17
SG10201709163WA (en) 2017-12-28
TR201808497T4 (tr) 2018-07-23
US9591333B2 (en) 2017-03-07
ZA201500272B (en) 2022-05-25
US20150189291A1 (en) 2015-07-02
RU2642387C1 (ru) 2018-01-24
CN104796712A (zh) 2015-07-22
JP6247354B2 (ja) 2017-12-13
MX347473B (es) 2017-04-27
CN104796712B (zh) 2018-09-11
PL3361734T3 (pl) 2020-03-31
MY200990A (en) 2024-01-29
MY182016A (en) 2021-01-18
IN2015MN00021A (zh) 2015-10-16
KR101678572B1 (ko) 2016-11-22
KR101678575B1 (ko) 2016-11-22
AU2013285752A1 (en) 2015-01-22
PL3361733T3 (pl) 2020-04-30
KR101678577B1 (ko) 2016-11-22
SG10201704574YA (en) 2017-07-28
HRP20180927T1 (hr) 2018-07-27
SI2869563T1 (en) 2018-08-31
KR101824057B1 (ko) 2018-01-31
CN104471934B (zh) 2018-01-23
KR20150009615A (ko) 2015-01-26
TW201811038A (zh) 2018-03-16
MY181358A (en) 2020-12-21
CN104811704A (zh) 2015-07-29
ES2764989T3 (es) 2020-06-05
US20150195584A1 (en) 2015-07-09
EP3361732A1 (en) 2018-08-15
ES2673893T3 (es) 2018-06-26
US9407936B2 (en) 2016-08-02
US20150195583A1 (en) 2015-07-09
AU2013285752A2 (en) 2015-02-12
EP3361734A1 (en) 2018-08-15
HUE049140T2 (hu) 2020-09-28
RS57336B1 (sr) 2018-08-31
EP3361733A1 (en) 2018-08-15
MX2015000134A (es) 2015-05-07
CA2876288A1 (en) 2014-01-09
KR20150099481A (ko) 2015-08-31
PL2869563T3 (pl) 2018-08-31
KR20140005101A (ko) 2014-01-14
KR20150099483A (ko) 2015-08-31
KR101678573B1 (ko) 2016-11-22
MY182019A (en) 2021-01-18
BR122020009714B1 (pt) 2021-06-22
CN105007489A (zh) 2015-10-28
US9525891B2 (en) 2016-12-20
HUE048718T2 (hu) 2020-08-28
SG11201408336RA (en) 2015-02-27
KR20160148485A (ko) 2016-12-26
ES2764988T3 (es) 2020-06-05
EP3361735A1 (en) 2018-08-15
TW201642654A (zh) 2016-12-01
KR20150056079A (ko) 2015-05-22
MY181285A (en) 2020-12-21
BR122018069200B1 (pt) 2021-02-09
BR112014033040A2 (pt) 2017-06-27
PH12014502873A1 (en) 2015-02-23
AU2016201791A1 (en) 2016-04-14
AU2018200355B2 (en) 2018-11-22
PH12018500782A1 (en) 2018-10-15
JP6510618B2 (ja) 2019-05-08

Similar Documents

Publication Publication Date Title
TWI615017B (zh) 熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置
US10257517B2 (en) Method and apparatus for entropy encoding using hierarchical data unit, and method and apparatus for decoding
TWI640191B (zh) 對視訊進行解碼的裝置
TWI629895B (zh) 視訊解碼的裝置