TWI590649B - 視訊之算術解碼裝置 - Google Patents
視訊之算術解碼裝置 Download PDFInfo
- Publication number
- TWI590649B TWI590649B TW105129896A TW105129896A TWI590649B TW I590649 B TWI590649 B TW I590649B TW 105129896 A TW105129896 A TW 105129896A TW 105129896 A TW105129896 A TW 105129896A TW I590649 B TWI590649 B TW I590649B
- Authority
- TW
- Taiwan
- Prior art keywords
- code
- unit
- coordinate
- bit string
- size
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1887—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a variable length codeword
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明是關於視訊之編碼及解碼,且更特定言之,是關於用於熵編碼及解碼變換係數資訊之方法及裝置。
在諸如動畫專家群(moving picture experts group;MPEG)-1、MPEG-2及MPEG-4 H.264/MPEG-4 AVC(進階視訊寫碼)之影像壓縮方法中,影像劃分為多個區塊,每一區塊具有預定大小,且每一區塊之殘餘資料藉由使用畫面間預測或畫面內預測處理程序而獲取。殘餘資料是經由諸如變換、量化、掃描、行程寫碼(run length coding)及熵寫碼之處理程序而壓縮。在熵寫碼操作期間,例如關於(例如)變換係數或預測模式之資訊的語法元素經熵編碼,且位元串流被輸出。解碼器剖析位元串流以提取語法元素,且基於所提取語法元素還原影像。
本發明藉由組合全文自適應性二元算術寫碼(context adaptive binary arithmetic coding;CABAC)方法與旁通算術寫碼方法而提供用於以算術方式編碼及解碼變換係數之符號的方法及裝置,此全文自適應性二元算術寫碼(CABAC)方法具有高的計算複雜性同時具有高的壓縮效能,此旁通算術寫碼方法具有低於CABAC方法之計算複雜性的計算複雜性同時展示較小的壓縮輸送量。
根據本發明之態樣,提供一種用於解碼視訊之算術解碼方法,所述方法包括:自所接收位元串流獲取分別對應於第一座標首碼位元串及第一座標尾碼位元串之第一座標首碼語法元素及第一座標尾碼語法元素,所述第一座標首碼位元串及所述第一座標尾碼位元串是藉由基於臨界值分類當前區塊之最後有效係數的第一座標位置而獲得,所述臨界值是基於所述當前區塊之大小而判定,且自所述所接收位元串流獲取分別對應於第二座標首碼位元串及第二座標尾碼位元串之第二座標首碼語法元素及第二座標尾碼語法元素,所述第二座標首碼位元串及所述第二座標尾碼位元串是藉由基於所述臨界值分類所述最後有效係數的第二座標位置而獲得;藉由在第一算術解碼方法中關於所述第一座標首碼語法元素及所述第二座標首碼語法元素順序地執行算術解碼操作而獲取所述第一座標首碼位元串及所述第二座標首碼位元串;藉由在第二算術解碼方法中關於所述第一座標尾碼語法元素及所述第二座標尾碼語法元素順序地執行算術解碼操作而獲取所述第一座標尾碼位元串及所述第二座標尾碼位元串;以及藉由對所述第一座標首碼位元串及所述第一座標尾碼位元串執行逆二元化而還原第一座標分量,且藉由對所述第二座標首碼位元串及所述第二座標尾碼位元串執行逆二元化而還原第二座標分量。
根據本發明之另一態樣,提供一種視訊解碼裝置,其包括:剖析器,其自所接收位元串流獲取分別對應於第一座標首碼位元串及第一座標尾碼位元串之第一座標首碼語法元素及第一座標尾碼語法元素,所述第一座標首碼位元串及所述第一座標尾碼位元串是藉由基於臨界值分類當前區塊之最後有效係數的第一座標位置而獲得,所述臨界值是基於所述當前區塊之大小而判定,且自所述所接收位元串流獲取分別對應於第二座標首碼位元串及第二座標尾碼位元串之第二座標首碼語法元素及第二座標尾碼語法元素,所述第二座標首碼位元串及所述第二座標尾碼位元串是藉由基於所述臨界值分類所述最後有效係數的第二座標位置而獲得;以及算術解碼器,其藉由在第一算術解碼方法中關於所述第一座標首碼語法元素及所述第二座標首碼語法元素順序地執行算術解碼操作而獲取所述第一座標首碼位元串及所述第二座標首碼位元串,藉由在第二算術解碼方法中關於所述第一座標尾碼語法元素及所述第二座標尾碼語法元素順序地執行算術解碼操作而獲取所述第一座標尾碼位元串及所述第二座標尾碼位元串,且藉由對所述第一座標首碼位元串及所述第一座標尾碼位元串執行逆二元化而還原第一座標分量,且藉由對所述第二座標首碼位元串及所述第二座標尾碼位元串執行逆二元化而還原第二座標分量。
根據本發明之另一態樣,提供一種用於編碼視訊之算術編碼方法,所述方法包括:基於臨界值將當前區塊中之最後有效係數之位置的第一座標分量分類為第一座標首碼位元串及第一座標尾碼位元串,所述臨界值是基於所述當前區塊之大小而判定;基於所述臨界值將所述最後有效係數之所述位置的第二座標分量分類為第二座標首碼位元串及第二座標尾碼位元串;在第一算術編碼方法中對所述第一座標首碼位元串及所述第二座標首碼位元串順序地執行算術編碼;以及在第二算術編碼方法中對所述第一座標尾碼位元串及所述第二座標尾碼位元串執行算術編碼。
根據本發明之另一態樣,提供一種視訊編碼裝置,其包括:影像編碼器,其對藉由分割視訊所獲得之區塊執行預測、變換及量化,以用於產生所述區塊的語法元素;以及熵編碼器,其基於臨界值將當前區塊中之最後有效係數之位置的第一座標分量分類為第一座標首碼位元串及第一座標尾碼位元串,所述臨界值是基於所述當前區塊之大小而判定;基於所述臨界值將所述最後有效係數之所述位置的第二座標分量分類為第二座標首碼位元串及第二座標尾碼位元串;在第一算術編碼方法中對所述第一座標首碼位元串及所述第二座標首碼位元串順序地執行算術編碼;及在第二算術編碼方法中對所述第一座標尾碼位元串及所述第二座標尾碼位元串執行算術編碼。
根據本發明之實施例,藉由應用具有高的計算複雜性同時具有高的壓縮效能之CABAC方法,及具有低於CABAC方法之計算複雜性的計算複雜性同時展示較小的壓縮輸送量的旁通算術寫碼方法,算術編碼及解碼之處理速度及壓縮效能可經由在計算複雜性與處理速度之間的折衷而得以改良。
下文中,將參看隨附圖式詳細描述本發明之實施例。在以下描述中,術語‘影像’可指代靜止影像或移動圖像(亦即,視訊)。
首先,將參看圖1至圖10描述根據本發明之實施例的算術編碼方法及視訊編碼裝置,及根據本發明之實施例的算術解碼方法及視訊解碼裝置。
圖1為根據本發明之實施例之視訊編碼裝置10的方塊圖。
視訊編碼裝置10將來自多個圖像當中之組態視訊的圖像分割為階層結構之多個資料單元,且藉由使用階層結構之資料單元而執行預測、變換及量化。如稍後將參看圖11至圖23描述,階層結構之資料單元可為最大寫碼單元、寫碼單元、預測單元,或變換單元。在預測處理程序及變換處理程序中所使用之預測單元及變換單元可基於成本而獨立於其他資料單元來判定。
由於編碼對在最大寫碼單元之每一區域中具有階層結構之寫碼單元中的每一者以遞回方式執行以判定最佳寫碼單元,因此具有樹結構之資料單元可得以獲得。亦即,具有樹結構之寫碼單元,及具有樹結構之預測單元及變換單元可在每一最大寫碼單元中得以判定。用於解碼之表示具有階層結構之資料單元之組態的階層資訊及非階層資訊必須被傳輸,以執行解碼操作。
與階層結構相關之資訊對於判定具有樹結構之寫碼單元、具有樹結構之預測單元及具有樹結構之變換單元為必要的(其將在下文描述),且可包含最大寫碼單元之大小、經寫碼深度、預測單元之分區資訊、表示寫碼單元是否經分割之狹縫平面(slit flat)、變換單元之大小資訊,及表示變換單元是否經分割之變換單元(transformation unit;TU)大小旗標。除階層結構資訊以外之編碼資訊可包含應用於預測單元中之每一者的畫面內/畫面間預測之預測模式資訊、運動向量資訊、預測方向資訊、在多個色彩分量被使用時應用於相應資料單元的色彩分量資訊,及變換係數資訊。下文中,待熵編碼及解碼之階層資訊及非階層資訊可被稱為語法元素或符號。另外,為便於描述,資料單元被稱為區塊。區塊在預測處理程序期間對應於預測單元或分區,且在變換處理程序期間對應於變換單元。
參看圖1,視訊編碼裝置10包含影像編碼器11及語法元素編碼器12。
影像編碼器11執行諸如影像區塊之預測、變換及量化之操作,以產生語法元素。更詳細而言,影像編碼器11在區塊中之每一者中經由畫面內預測及畫面間預測而產生預測值,且藉由變換及量化殘餘值而產生變換係數,此殘餘值為原始區塊與預測值之間的差。
語法元素編碼器12執行關於在區塊中之每一者中所產生之變換係數的語法元素及在其他編碼處理程序中所產生之其他各種語法元素的算術編碼,以產生位元串流。詳言之,本實施例之語法元素編碼器12基於臨界值將區塊中之除0以外之有效係數當中的根據預定掃描次序最後掃描之最後有效係數的列位置及行位置分類為首碼及尾碼,此臨界值是根據當前區塊之寬度或高度而判定;及以算術方式編碼位元串,此等位元串是藉由根據全文自適應性二元算術寫碼(CABAC)應用全文模型來對首碼順序地執行二元化而獲得;及以算術方式編碼位元串,此等位元串是藉由在CABAC經執行之後在旁通模式中對尾碼執行二元化而獲得。
圖2為更詳細展示圖1之語法元素編碼器12的方塊圖。
參看圖2,語法元素編碼器20包含二元化器21、全文模型化器22及二元算術寫碼器23。又,二元算術寫碼器23包含規則寫碼引擎24及旁通寫碼引擎25。
若語法元素不具有二元值,則二元化器21二元化語法元素以輸出由二元值0或1組成之位元串,亦即,分格串(bin string)。分格表示由0或1組成之位元串中的每一位元。根據語法元素之類型,可使用一元二元化、截斷一元二元化、指數葛洛姆二元化及固定長度二元化中之一者。
詳言之,本發明之實施例的二元化器21基於根據當前區塊之大小所判定的臨界值將當前編碼之語法元素分類為首碼或尾碼,且可藉由使用彼此獨立之二元化方法二元化首碼及尾碼以輸出首碼位元串及尾碼位元串。舉例而言,二元化器21基於依據當前區塊之寬度所判定之臨界值將最後有效係數之行位置分類為首碼及尾碼,且接著,藉由將預定第一二元化方法應用於行位置之首碼而輸出行位置的首碼位元串,且藉由將預定第二二元化方法應用於行位置之尾碼而輸出行位置的尾碼位元串。第一二元化方法及第二二元化方法為彼此獨立的,亦即,此等方法可彼此相同或不同。
類似地,二元化器21可基於依據當前區塊之高度所判定之臨界值將最後有效係數之列位置分類為首碼及尾碼,且接著,藉由將預定第一二元化方法應用於列位置之首碼而輸出列位置的首碼位元串,且藉由將預定第二二元化方法應用於列位置之尾碼而輸出列位置的尾碼位元串。下文將參看圖5描述將當前編碼之語法元素分類為首碼及尾碼的處理程序。
根據語法元素之類型,位元串中之分格中的每一者可藉由使用全文模型(context model)而在規則寫碼引擎24中以算術方式寫碼,或可在旁通寫碼引擎25中以算術方式寫碼。詳言之,當最後有效係數之位置分類為首碼位元串及尾碼位元串時,本實施例之規則寫碼引擎24藉由根據CABAC應用全文模型而順序地以算術方式編碼分類為首碼的位元串,且旁通寫碼引擎25可在旁通模式中以算術方式編碼分類為尾碼的位元串。
全文模型化器22向規則寫碼引擎24提供全文模型,以用於以算術方式編碼當前語法元素。詳言之,當規則寫碼引擎24以算術方式編碼最後有效係數位置之首碼位元串時,全文模型化器22將如下機率輸出至規則寫碼引擎24:產生用於編碼首碼位元串中之分格中之每一者的二元值。全文模型為每一分格之機率模型,且包含關於0及1中之哪一者對應於最可能符號(most probable symbol;MPS)及最不可能符號(least probable symbol;LPS)的資訊,及MPS或LPS之機率資訊。全文模型化器22根據在規則寫碼引擎24中編碼之位元的值為0抑或1而更新全文模型。
規則寫碼引擎24基於自全文模型化器22所提供之全文模型對組態最後有效係數位置之首碼位元串的分格中之每一者執行算術寫碼,此全文模型亦即關於MPS及LPS之資訊及MPS或LPS的機率資訊。
旁通寫碼引擎25根據旁通模式執行最後有效係數位置之尾碼位元串的算術寫碼。在旁通模式中,產生二元信號0及1之機率具有固定值。因此,旁通寫碼引擎25可直接對輸入位元串執行算術寫碼,此不同於使用全文模型之算術寫碼方法,在此方法中,全文模型是在以算術方式編碼分格中之每一者的同時更新且經更新全文模型用於下一分格的算術寫碼中。
圖7為說明使用在圖2之規則寫碼引擎24中所執行之全文模型的算術寫碼處理程序的圖式。在圖7中,當前編碼之符號的二元值為“010”,且假設,為便於描述,產生1之機率具有固定值0.2且產生0之機率具有固定值0.8。在現實中,規則寫碼引擎24根據二元值“010”中之分格中之每一者的算術寫碼來更新產生二元值之機率。
參看圖7,當二元值“010”中之第一分格值“0”經編碼時,初始區段[0.0~1.0]中之下部80%部分(亦即,[0.0~0.8])更新為新的區段。另外,當下一分格值“1”經編碼時,區段[0.0~0.8]中之上部20%部分(亦即,[0.64~0.8])更新為新的區段。另外,當下一分格值“0”經編碼時,區段[0.64~0.8]中之下部80%部分(亦即,[0.64~0.768])更新為新的區段。在對應於包含於最終區段[0.64~0.768]中之實數0.75的二元數0.11中,除初始數0以外之在小數點後的數“11”輸出為對應於經編碼符號之二元值“010”的位元串。
下文中,下文將詳細描述與變換係數相關之資訊(亦即,與變換係數相關之語法元素)的算術編碼及解碼處理程序。
圖3為說明根據本發明之實施例的以算術方式編碼及解碼每一區塊中之變換係數資訊之處理程序的流程圖。
參看圖3,在操作31中,首先以算術方式編碼或解碼旗標coded_block_flag,此旗標coded_block_flag表示在包含於當前區塊中之變換係數當中是否存在除0以外的有效係數。
若當前區塊僅具有為0之變換係數且不具有除0以外之有效係數,則值0以算術方式編碼為coded_block_flag,且與其他變換係數相關之語法元素的算術編碼處理程序被省略。
在操作32中,若在當前區塊中存在有效係數,亦即,coded_block_flag之值為1,則以算術方式編碼或解碼指示有效係數之位置的有效地圖(significance map)(SigMap)。
有效地圖SigMap可由指示有效位元及最後有效係數之位置的預定資訊組成。有效位元表示根據每一掃描索引之變換係數為有效係數抑或0,且可藉由使用significant_coeff_flag[i]來表達。有效地圖SigMap可關於具有預定大小之子集中的每一者來設定,此等子集是藉由分割當前區塊而獲得。亦即,significant_coeff_flag[i]可指示在包含於當前區塊之一子集中的變換係數當中具有第i個掃描索引之變換係數是否為0。
在習知H.264標準中,指示有效係數是否為最後有效係數之旗標End-Of-Block在有效係數中之每一者中單獨地算術編碼或解碼。然而,根據本實施例,關於最後有效係數之位置的資訊以算術方式編碼或解碼為自身。舉例而言,若最後有效係數位於當前區塊之第x行(其中x為整數)及第y列(其中y為整數)處,亦即,若最後有效係數之位置為(x,y),則x及y之值以算術方式編碼或解碼。
詳言之,根據本實施例之語法元素編碼器12基於依據當前區塊之寬度所判定的臨界值將最後有效係數之列位置(x)分類為x軸首碼位元串(或第一座標首碼位元串)及x軸尾碼位元串(或第一座標尾碼位元串),且基於依據當前區塊之高度所判定的臨界值將最後有效係數之行位置(y)分類為y軸首碼位元串(或第二座標首碼位元串)及y軸尾碼位元串(或第二座標尾碼位元串)。另外,語法元素編碼器12藉由根據CABAC應用全文模型而執行x軸首碼位元串及y軸首碼位元串之算術編碼,且在旁通模式中對x軸尾碼位元串及y軸尾碼位元串執行算術編碼。又,語法元素編碼器12可藉由形成使用不同算術編碼類型分別編碼之首碼位元串及尾碼位元串的群組而順序地執行算術編碼。亦即,語法元素編碼器12藉由應用全文模型而對x軸首碼位元串及y軸首碼位元串執行算術編碼,且在對首碼位元串所執行之算術編碼之後或獨立於對首碼位元串所執行的算術編碼處理程序,可在旁通模式中對x軸尾碼位元串及y軸尾碼位元串執行算術編碼。
圖4為展示藉由分割區塊以便以算術方式編碼與變換係數相關之語法元素所獲得的子集之圖式。在圖4中,參考數字41表示區塊40中之最後有效係數。
參看圖4,為了執行與包含於區塊40中之變換係數相關的語法元素之算術寫碼,區塊40可分割為具有預定大小之多個子集。變換係數資訊可包含有效地圖(SigMap)、指示包含於子集中之有效係數是否大於1之旗標(Greaterthan1旗標)、指示包含於子集中之有效係數是否大於2之旗標(Greaterthan2旗標)、表示大於2之有效係數之位準的資訊(level-3),及關於最後有效係數41之位置的資訊。諸如SigMap、Greatherthan1旗標、Greatherthan2旗標及(level-3)之語法元素可以算術方式編碼於子集單元中。可以各種方式設定子集之處理次序。舉例而言,如藉由箭頭所表示,包含於子集中之每一者中的變換係數資訊可按自subset15至subset0之次序以算術方式編碼。本發明不限於此,且若區塊40之大小為小的,則區塊可能不分割為多個子集,但包含於區塊40中之諸如SigMap、Greaterthan1旗標、Greaterthan2旗標及level-3的語法元素可以算術方式編碼。
如上文所述,在包含於區塊40中之有效係數當中,根據預定掃描次序之最後有效係數41的列位置(x)及行位置(y)基於當前區塊40之大小分別分類為首碼位元串及尾碼位元串。接著,首碼位元串藉由根據CABAC應用全文模型而以算術方式編碼,且尾碼位元串在旁通模式中以算術方式編碼。
下文中,下文將更詳細描述將最後有效係數之位置分類為首碼位元串及尾碼位元串的處理程序。
圖5為說明將最後有效係數之位置分類為首碼位元串及尾碼位元串及以算術方式編碼位元串之處理程序的參考圖。
當假設區塊之寬度為w(其中w為整數)且區塊之高度為h(其中h為整數)時,區塊中之變換係數的位置具有二維座標值(x, y)。當定義變換係數之位置處於區塊之左側最上角(0,0)且變換係數之位置處於區塊的右側最下角((w-1), (h-1))時,區塊中之變換係數的列位置x具有自0至(w-1)之值中的一者,且變換係數之行位置y具有自0至(h-1)之值中的一者。
首先,下文將描述將列位置x分類為首碼位元串及尾碼位元串及以算術方式編碼位元串的處理程序。
參看圖5,區塊中之最後有效係數的列位置x可具有來自0至(w-1)當中之值。基於依據區塊之寬度w所判定的臨界值th,列位置x分類為等於或小於臨界值th之首碼及超過臨界值th的尾碼(x-th)。
詳言之,若最後有效係數之列位置x的值等於或小於臨界值th,則列位置僅分類為首碼,而不分類為尾碼。若列位置x之值超過臨界值th,則列位置x分類為對應於臨界值th之首碼及超過臨界值th的尾碼(x-th)。亦即,若列位置x具有等於或小於臨界值th之值,則列位置僅分類為首碼且不存在尾碼。另外,僅當列位置x超過臨界值th時,列位置x分類為首碼及尾碼。
換言之,若最後有效係數之列位置x等於或小於臨界值th,則列位置x根據預定第一二元化方法而二元化,且僅分類為x軸首碼位元串。若最後有效係數x之列位置x超過臨界值th,則列位置x分類為x軸首碼位元串及x軸尾碼位元串,此x軸首碼位元串是藉由在第一二元化方法中對臨界值th執行二元化而獲得,此x軸尾碼位元串是藉由在預定第二二元化方法中對值(x-th)執行二元化而獲得。
列位置x分類為首碼及尾碼所基於之臨界值th可基於區塊之寬度w而判定,如上文所述。舉例而言,臨界值th可為(w/2)-1,(w/2)-1為在0至(w-1)之間的中間值,(w-1)為列位置x之容許範圍。作為另一實例,若區塊之寬度w為2的冪,則臨界值th可藉由以下方程式th = (log2
w<<1)-1來判定。臨界值th不限於此,且可以各種方式設定。
詳言之,若區塊之寬度w具有值8,則臨界值th為(8/2)-1=3,且由此,列位置x可基於值3分類為首碼及尾碼。若列位置x超過3,例如,列位置x具有值5,則由於x = th+2 = 3+2,因此列位置x分類為具有值3之首碼及具有值2的尾碼。若列位置x具有值3或更小,則列位置x直接二元化且分類為首碼,且不存在尾碼。
在先前描述之實例中,首碼3及尾碼2使用不同之二元化方法而分別二元化。舉例而言,首碼可經由截斷一元二元化處理程序而二元化,且尾碼可經由固定長度二元化處理程序而二元化。為便於描述,在圖5中,在列位置x為5且臨界值th為3之狀況下,分類為首碼之值3經由一元二元化而二元化為0001(52),且分類為尾碼之值2經由一般二元化處理程序而二元化為010(54)。
如上文所述,首碼位元串0001(52)藉由應用全文模型而以算術方式編碼。全文索引是關於‘0001’中之分格中的每一者判定,且用於以算術方式編碼每一分格之全文模型可基於所判定之全文索引而判定。在不執行判定全文模型化之處理程序的情況下,尾碼位元串010(54)在旁通模式中以算術方式編碼。在旁通模式中,由於分格中之每一者具有相同機率,亦即,值0及值1具有相同固定機率值1/2,因此輸入位元串101(54)可在不使用全文模型的情況下直接以算術方式編碼。
如上文所述,若列位置x具有等於或小於臨界值th之值,則列位置x僅分類為首碼,且不存在尾碼。在上文所述之實例中,假設列位置x具有小於臨界值th 3之值1。在此狀況下,列位置x之值(亦即,1)經由預定二元化方法僅分類為首碼位元串,且不存在尾碼位元串。如上文所述,首碼位元串藉由應用全文模型而以算術方式編碼,且因為不存在尾碼位元串,所以在旁通模式中之算術編碼處理程序被省略。
類似於在將列位置x分類為首碼位元串及尾碼位元串之後所執行的算術編碼,行位置y可分類為首碼位元串及尾碼位元串且可以算術方式編碼。亦即,基於依據區塊之高度h所判定的臨界值th,行位置y分類為等於或小於臨界值th之首碼及具有超過臨界值th之值(y-th)的尾碼。若行位置y具有等於或小於臨界值th之值,則行位置僅分類為首碼,且不存在尾碼。若行位置y分類為首碼及尾碼,則首碼及尾碼中之每一者使用獨立的二元化方法而二元化,藉此獲得首碼位元串及尾碼位元串。
亦即,最後有效係數之行位置y等於或小於臨界值th,行位置y使用第一二元化方法而二元化且分類為y軸首碼位元串。若最後有效係數之行位置y超過臨界值th,則行位置y分類為y軸首碼位元串及y軸尾碼位元串,此y軸首碼位元串是藉由在第一二元化方法中對臨界值th執行二元化而獲得,此y軸尾碼位元串是藉由在第二二元化方法中對值(y-th)執行二元化而獲得。
另外,首碼位元串藉由應用全文模型而以算術方式編碼,且尾碼位元串在旁通模式中以算術方式編碼。
圖6為說明根據本發明之實施例的以算術方式編碼最後有效係數之位置資訊的處理程序之圖式。
如上文所述,當最後有效係數之列位置x及行位置y基於依據當前區塊之大小所判定的臨界值th而分別分類為首碼位元串及尾碼位元串時,根據本實施例之語法元素編碼器12藉由根據CABAC應用全文模型而執行首碼位元串之算術寫碼,且在旁通模式中執行分類為尾碼之位元串的算術寫碼。
參看圖6,當最後有效係數之列位置x 61分類為x軸分量首碼62及x軸分量尾碼63且行位置y分類為y軸分量首碼66及y軸分量尾碼67時,語法元素編碼器12產生x軸分量首碼62及y軸分量首碼66之群組,且藉由應用全文模型化68而對此群組執行算術編碼。另外,在執行全文模型化68之後或獨立於全文模型化68,語法元素編碼器12產生x軸分量尾碼63及y軸分量尾碼67之群組,且在旁通模式69中對此群組執行算術編碼。如上文所述,本實施例之語法元素編碼器12可關於同一算術編碼方法所應用於之位元串的群組執行處理程序,且由此,計算速度可得以改良。詳言之,x軸分量尾碼63及y軸分量尾碼67經群聚,且此群組之算術編碼是在旁通模式中執行,且由此,尾碼位元串可即刻以算術方式編碼。由於旁通模式如上文所述使用固定機率值,因此對應於整個輸入位元串之編碼結果可直接輸出。另外,如上文所述,當最後有效係數之列位置x或行位置y具有等於或小於預定臨界值之值時,列位置及行位置之尾碼位元串不存在,且由此,尾碼位元串的算術編碼處理程序可省略。
圖8為說明根據本發明之實施例的用於編碼視訊之算術編碼方法的流程圖。
參看圖8,在操作82中,語法元素編碼器12基於依據當前區塊之大小所判定的臨界值將當前區塊中之最後有效係數位置的第一座標分量分類為第一座標首碼位元串及第一座標尾碼位元串。如上文所述,語法元素編碼器12根據第一預定二元化方法二元化列位置x,且在最後有效係數之列位置x等於或小於臨界值th時將二元化之結果分類為x軸首碼位元串。又,當最後有效係數之列位置x超過臨界值th時,語法元素編碼器12將列位置x分類為x軸首碼位元串及x軸尾碼位元串,此x軸首碼位元串是藉由根據第一二元化方法對臨界值th執行二元化而獲得,此x軸尾碼位元串是藉由根據第二預定二元化方法對值(x-th)執行二元化而獲得。
在操作82中,語法元素編碼器12基於臨界值將最後有效係數之第二座標分量分類為第二座標首碼位元串及第二座標尾碼位元串。如上文所述,語法元素編碼器12根據第一預定二元化方法二元化行位置y,且在最後有效係數之行位置y等於或小於臨界值th時將二元化之結果分類為y軸首碼位元串。又,當最後有效係數之行位置y超過臨界值th時,語法元素編碼器12將行位置y分類為y軸首碼位元串及y軸尾碼位元串,此y軸首碼位元串是藉由根據第一二元化方法對臨界值th執行二元化而獲得,此y軸尾碼位元串是藉由根據第二預定二元化方法對值(y-th)執行二元化而獲得。此處,當區塊之寬度w及高度h彼此相等時,為用於將列位置x及行位置y分類為首碼及尾碼之準則的臨界值彼此相等。若區塊具有矩形形狀,則用於將列位置x及行位置y分類為首碼及尾碼之臨界值可分別基於區塊之寬度及高度來判定。
在操作83中,語法元素編碼器12根據第一算術編碼方法對第一座標首碼位元串及第二座標首碼位元串順序地執行算術編碼。如上文所述,語法元素編碼器12可藉由使用全文模型產生首碼位元串之群組以執行算術編碼。
在操作84中,語法元素編碼器12根據第二算術編碼方法對第一座標尾碼位元串及第二座標尾碼位元串執行算術編碼。如上文所述,語法元素編碼器12可產生在旁通模型中以算術方式編碼之尾碼位元串的群組。
圖9A為根據本發明之實施例之視訊解碼裝置90的方塊圖。
參看圖9A,視訊解碼裝置包含語法元素解碼器91及影像還原單元92。
語法元素解碼器91接收包含表示視訊之經編碼資料的各種語法元素之位元串流,且剖析位元串流以獲取語法元素。以上操作可執行於語法元素解碼器91之剖析單元中。由於語法元素是藉由上文所述之視訊編碼裝置10而二元化及以算術方式編碼,因此語法元素解碼器91經由以算術方式解碼及逆二元化處理程序而還原語法元素。
詳言之,本實施例之語法元素解碼器91自所接收位元串流獲取分別對應於x軸分量首碼位元串及x軸分量尾碼位元串之x軸分量首碼語法元素及x軸分量尾碼語法元素,此x軸分量首碼位元串及此x軸分量尾碼位元串是藉由基於臨界值分類當前區塊之最後有效係數的x軸位置而獲得,此臨界值是基於當前區塊之大小而判定,且自所接收位元串流獲取分別對應於y軸分量首碼位元串及y軸分量尾碼位元串之y軸分量首碼語法元素及y軸分量尾碼語法元素,此y軸分量首碼位元串及此y軸分量尾碼位元串是藉由基於臨界值分類最後有效係數的y軸位置而獲得。
另外,語法元素解碼器91在第一算術解碼方法(亦即,使用全文模型之算術解碼)中關於x軸分量首碼語法元素及y軸分量首碼語法元素順序地執行算術解碼操作,以便獲取x軸分量首碼位元串及y軸分量首碼位元串。
又,語法元素解碼器91在第二算術解碼方法(亦即,旁通模式之算術解碼)中關於x軸分量尾碼語法元素及y軸分量尾碼語法元素順序地執行算術解碼操作,以便獲取x軸分量尾碼位元串及y軸分量尾碼位元串。如上文所述,由於在列位置x及行位置y之值小於預定臨界值th的狀況下不存在尾碼,因此尾碼語法元素之算術解碼操作在此狀況下省略。
當x軸分量首碼位元串、y軸分量首碼位元串、x軸分量尾碼位元串及y軸分量尾碼位元串被獲取時,語法元素解碼器對x軸分量首碼位元串及x軸分量尾碼位元串執行逆二元化,且將逆二元化之x軸分量首碼及逆二元化之x軸分量尾碼相加來復原x軸分量。又,語法元素解碼器91對y軸分量首碼位元串及y軸分量尾碼位元串執行逆二元化,且將逆二元化之y軸分量首碼及逆二元化之y軸分量尾碼相加來復原y軸分量。
影像還原單元92藉由使用藉由語法元素解碼器91所還原之各種語法元素對當前區塊執行逆變換及預測。影像還原單元92可藉由使用影像區塊中之每一者中的經還原語法元素執行諸如逆量化、逆變換及畫面內預測/運動補償的操作來還原影像區塊。
圖9B為包含於圖9A之語法元素解碼器91中之算術解碼裝置的方塊圖。圖9B中所示之算術解碼裝置93對應於圖2中所示的語法元素編碼裝置20。算術解碼裝置93執行為在語法元素編碼裝置20中所執行之算術編碼處理程序之逆處理程序的處理程序。
參看圖9B,算術解碼裝置93包含全文模型化器94、規則解碼器95、旁通解碼器96,及逆二元化單元97。
在旁通模式中編碼之符號輸出至旁通解碼器96來解碼,且在規則寫碼方法中編碼之符號藉由規則解碼器95解碼。規則解碼器95基於自全文模型化器94所提供之全文模型以算術方式解碼當前編碼之符號的二元化值。如上文所述,規則解碼器95使用全文模型關於自所接收位元串流所獲取之x軸分量首碼語法元素及y軸分量首碼語法元素順序地執行算術解碼,且由此,獲取x軸分量首碼位元串及y軸分量首碼位元串。
旁通解碼器96在旁通模式中關於自所接收位元串流所獲取之x軸分量尾碼語法元素及y軸分量尾碼語法元素執行算術解碼,且由此,獲取x軸分量尾碼位元串及y軸分量尾碼位元串。
逆二元化單元97對藉由規則解碼器95或旁通解碼器96所復原之x軸分量首碼位元串、y軸分量首碼位元串、x軸分量尾碼位元串及y軸分量尾碼位元串執行逆二元化,以便還原x軸分量首碼、y軸分量首碼、x軸分量尾碼及y軸分量尾碼。x軸分量首碼及x軸分量尾碼相加以獲得最後有效係數之x軸位置,且y軸分量首碼及y軸分量尾碼相加以獲得最後有效係數的y軸位置。
圖10為說明根據本發明之實施例的用於解碼視訊之算術解碼方法的流程圖。
參看圖10,在操作101中,語法元素解碼器91自所接收位元串流獲取分別對應於第一座標分量首碼位元串及第一座標分量尾碼位元串之第一座標分量首碼語法元素及第一座標分量尾碼語法元素,第一座標分量首碼位元串及第一座標分量尾碼位元串是藉由基於臨界值分類當前區塊之最後有效係數的第一座標位置而獲得,此臨界值是基於當前區塊之大小而判定,且自所接收位元串流獲取分別對應於第二座標分量首碼位元串及第二座標分量尾碼位元串之第二座標分量首碼語法元素及第二座標分量尾碼語法元素,第二座標分量首碼位元串及第二座標分量尾碼位元串是藉由基於臨界值分類最後有效係數的第二座標位置而獲得。
在操作102中,語法元素解碼器91在第一算術解碼方法(亦即,使用全文模型之算術解碼)中關於第一座標分量首碼語法元素及第二座標分量首碼語法元素順序地執行算術解碼操作,以便獲取第一座標分量首碼位元串及第二座標分量首碼位元串。
在操作103中,語法元素解碼器91在第二算術解碼方法(亦即,旁通模式之算術解碼)中關於第一座標分量尾碼語法元素及第二座標分量尾碼語法元素順序地執行算術解碼操作,以便獲取第一座標分量尾碼位元串及第二座標分量尾碼位元串。
在操作104中,語法元素解碼器91對第一座標首碼位元串及第一座標尾碼位元串執行逆二元化以還原第一座標分量,且對第二座標首碼位元串及第二座標尾碼位元串執行逆二元化以還原第二座標分量。
根據本發明之以上實施例,最後有效係數之位置分類為首碼位元串及尾碼位元串,且同一算術編碼方法所應用於之位元串組態為待順序地處理的群組。首碼位元串藉由使用全文模型化以算術方式編碼及解碼,且尾碼位元串在不使用全文模型化的情況下在旁通模式中以算術方式編碼及解碼。因此,當與最後有效係數之位置藉由僅使用全文模型化而以算術方式編碼及解碼的狀況相比時,計算量減小,且由此,算術編碼及解碼操作之處理速度可得以改良。
如上文所述,在根據本實施例之視訊編碼裝置10及視訊解碼裝置90中,藉由分割視訊資料所獲得之區塊分割為具有樹結構的寫碼單元,且預測單元用以預測寫碼單元且變換單元用以變換寫碼單元。下文中,下文將參看圖11至圖23描述基於具有樹結構之寫碼單元、預測單元及變換單元的視訊編碼方法及裝置以及視訊解碼方法及裝置。
圖11為根據本發明之實施例之視訊編碼裝置100的方塊圖。
視訊編碼裝置100包含階層式編碼器110及熵編碼器120。
階層式編碼器110分割編碼為具有預定大小之資料單元的當前圖像,以在資料單元中之每一者中執行編碼操作。詳言之,階層式編碼器110可基於為具有最大大小之寫碼單元的最大寫碼單元而分割當前圖像。根據本發明之實施例的最大寫碼單元可為具有大小32×32、64×64、128×128、256×256等之資料單元,其中資料單元之形狀為具有為2的平方之寬度及長度之正方形。
根據本發明之實施例的寫碼單元可藉由最大大小及深度來表徵。深度表示寫碼單元自最大寫碼單元在空間上分割之次數,且隨著深度加深,根據深度之較深編碼單元可自最大寫碼單元分割為最小寫碼單元。最大寫碼單元之深度為最上層深度,且最小寫碼單元之深度為最下層深度。由於對應於每一深度之寫碼單元的大小隨著最大寫碼單元之深度加深而減小,因此對應於較上層深度之寫碼單元可包含對應於較下層深度的多個寫碼單元。
如上文所述,當前圖像之影像資料根據寫碼單元之最大大小分割為最大寫碼單元,且最大寫碼單元中的每一者可包含根據深度所分割的較深寫碼單元。由於根據本發明之實施例的最大寫碼單元是根據深度分割,因此包含於最大寫碼單元中之空間域的影像資料可根據深度在階層上分類。
限制最大寫碼單元之高度及寬度在階層上分割之總次數的寫碼單元之最大深度及最大大小可為預定的。
階層式編碼器110編碼藉由根據深度分割最大寫碼單元之區域所獲得的至少一分割區域,且判定深度以根據此至少一分割區域輸出最終經編碼影像資料。換言之,階層式編碼器110藉由以下操作來判定經寫碼深度:根據當前圖像之最大寫碼單元編碼根據深度之較深寫碼單元中的影像資料,及選擇具有最小編碼誤差的深度。所判定之經寫碼深度及根據所判定之經寫碼深度的經編碼影像資料輸出至熵編碼器120。
最大寫碼單元中之影像資料基於對應於等於或小於最大深度之至少一深度的較深寫碼單元而編碼,且編碼影像資料之結果基於較深寫碼單元中的每一者而比較。可在比較較深寫碼單元之編碼誤差之後選擇具有最小編碼誤差的深度。可針對每一最大寫碼單元選擇至少一經寫碼深度。
隨著寫碼單元根據深度在階層上分割,且隨著寫碼單元之數目增加,最大寫碼單元的大小經分割。又,即使寫碼單元對應於一最大寫碼單元中之同一深度,仍藉由單獨量測每一寫碼單元之影像資料的編碼誤差而判定是否將對應於同一深度之寫碼單元中的每一者分割為較下層深度。因此,即使當影像資料包含於一最大寫碼單元中時,影像資料仍根據深度而分割為多個區域且編碼誤差可根據此一最大寫碼單元中之區域而不同,且由此經寫碼深度可根據影像資料中的區域而不同。因此,一或多個經寫碼深度可在一最大寫碼單元中判定,且最大寫碼單元之影像資料可根據至少一經寫碼深度的寫碼單元而劃分。
因此,階層式編碼器110可判定包含於最大寫碼單元中之具有樹結構的寫碼單元。根據本發明之實施例的‘具有樹結構之寫碼單元’包含來自包含於最大寫碼單元中之所有較深寫碼單元當中的對應於判定為經寫碼深度之深度的寫碼單元。經寫碼深度之寫碼單元可根據最大寫碼單元之同一區域中的深度而在階層上判定,且可在不同的區域中獨立地判定。類似地,當前區域中之經寫碼深度可獨立於另一區域中之經寫碼深度而判定。
根據本發明之實施例的最大深度為與自最大寫碼單元至最小寫碼單元執行分割之次數相關的索引。根據本發明之實施例的第一最大深度可表示自最大寫碼單元至最小寫碼單元執行分割的總次數。根據本發明之實施例的第二最大深度可表示自最大寫碼單元至最小寫碼單元之總深度層級數。舉例而言,當最大寫碼單元之深度為0時,最大寫碼單元經分割一次之寫碼單元的深度可設定為1,且最大寫碼單元經分割兩次之寫碼單元的深度可設定為2。此處,若最小寫碼單元為最大寫碼單元經分割四次之寫碼單元,則深度之5個深度層級0、1、2、3及4存在,且由此,第一最大深度可設定為4,且第二最大深度可設定為5。
預測編碼及變換可根據最大寫碼單元而執行。根據最大寫碼單元,亦基於根據等於最大深度之深度或小於最大深度之深度的較深寫碼單元執行預測編碼及變換。
由於在無論何時最大寫碼單元根據深度分割時較深寫碼單元之數目增大,因此包含預測編碼及變換的編碼對隨著深度加深所產生的所有較深寫碼單元執行。為了便於描述,在最大寫碼單元中,現將基於當前深度之寫碼單元描述預測編碼及變換。
視訊編碼裝置100可以各種方式選擇用於編碼影像資料之資料單元的大小或形狀。為了編碼影像資料,諸如預測編碼、變換及熵編碼之操作經執行,且此時,同一資料單元可用於所有操作或不同的資料單元可用於每一操作。
舉例而言,視訊編碼裝置100可不僅選擇用於編碼影像資料之寫碼單元,而且選擇不同於寫碼單元之資料單元,以便對寫碼單元中之影像資料執行預測編碼。
為了在最大寫碼單元中執行預測編碼,預測編碼可基於對應於經寫碼深度之寫碼單元(亦即,基於不再分割為對應於較下層深度之寫碼單元的寫碼單元)執行。下文中,不再分割且變為用於預測編碼之基礎單元的寫碼單元現將被稱為‘預測單元’。藉由分割預測單元所獲得之分區可包含藉由分割預測單元之高度及寬度中的至少一者所獲得的預測單元或資料單元。
舉例而言,當2N×2N(其中N為正整數)之寫碼單元不再分割且變為2N×2N之預測單元時,分區之大小可為2N×2N、2N×N、N×2N或N×N。分區類型之實例包含藉由對稱地分割預測單元之高度或寬度所獲得的對稱分區、藉由非對稱地分割預測單元之高度或寬度(諸如,1:n或n:1)所獲得的分區、藉由以幾何方式分割預測單元所獲得之分區,及具有任意形狀的分區。
預測單元之預測模式可為畫面內模式、畫面間模式及跳過模式中之至少一者。舉例而言,可對2N×2N、2N×N、N×2N或N×N之分區執行畫面內模式或畫面間模式。又,可僅對2N×2N之分區執行跳過模式。在寫碼單元中對一預測單元獨立地執行編碼,藉此選擇具有最小編碼誤差的預測模式。
視訊編碼裝置100亦可不僅基於用於編碼影像資料之寫碼單元而且基於不同於寫碼單元之資料單元而對寫碼單元中的影像資料執行變換。
為了在寫碼單元中執行變換,可基於具有小於或等於寫碼單元之大小的資料單元執行變換。舉例而言,用於變換之資料單元可包含用於畫面內模式之資料單元及用於畫面間模式之資料單元。
用作變換之基礎的資料單元現將被稱為‘變換單元’。類似於寫碼單元,寫碼單元中之變換單元可以遞回方式分割為較小大小的區域,使得變換單元可以區域為單位獨立地判定。因此,寫碼單元中之殘餘資料可根據具有根據變換深度之樹結構的變換單元而劃分。
亦可在變換單元中設定變換深度,此變換深度指示藉由分割寫碼單元之高度及寬度達到變換單元而執行分割的次數。舉例而言,在2N×2N之當前寫碼單元中,當變換單元之大小為2N×2N時,變換深度可為0,當變換單元之大小為N×N時,變換深度可為11,且當變換單元之大小為N/2×N/2時,變換深度可為12。亦即,亦可根據變換深度來設定具有樹結構之變換單元。
根據對應於經寫碼深度之寫碼單元的編碼資訊不僅需要關於經寫碼深度之資訊,而且需要關於與預測編碼及變換相關之資訊的資訊。因此,階層式編碼器110不僅判定具有最小編碼誤差之經寫碼深度,而且判定預測單元中之分區類型、根據預測單元之預測模式,及用於變換之變換單元的大小。
稍後將詳細描述根據本發明之實施例的在最大寫碼單元中之根據樹結構的寫碼單元及判定分區的方法。
階層式編碼器110可藉由基於拉格朗日乘數(Lagrangian multiplier)使用位元率-失真最佳化(Rate-Distortion Optimization)而量測根據深度之較深寫碼單元的編碼誤差。
熵編碼器120在位元串流中輸出基於藉由階層式編碼器110所判定之至少一經寫碼深度所編碼的最大寫碼單元之影像資料,及關於根據經寫碼深度之編碼模式的資訊。可藉由編碼影像之殘餘資料來獲得經編碼影像資料。關於根據經寫碼深度之編碼模式的資訊可包含關於經寫碼深度、關於預測單元中之分區類型、預測模式及變換單元之大小的資訊。
可藉由使用根據深度之分割資訊來定義關於經寫碼深度的資訊,關於經寫碼深度的資訊指示是否對較下層深度而非當前深度之寫碼單元執行編碼。若當前寫碼單元之當前深度為經寫碼深度,則當前寫碼單元中之影像資料經編碼且輸出,且由此,分割資訊可定義為不將當前寫碼單元分割為較下層深度。或者,若當前寫碼單元之當前深度並非經寫碼深度,則編碼對較下層深度之寫碼單元執行,且由此,分割資訊可定義為分割當前寫碼單元以獲得較下層深度的寫碼單元。
若當前深度並非經寫碼深度,則編碼對分割為較下層深度之寫碼單元的寫碼單元執行。由於較下層深度之至少一寫碼單元存在於當前深度之一寫碼單元中,因此編碼對較下層深度之每一寫碼單元重複地執行,且由此,編碼可針對具有同一深度之寫碼單元以遞回方式執行。
由於具有樹結構之寫碼單元是針對一最大寫碼單元而判定,且關於至少一編碼模式的資訊是針對經寫碼深度之寫碼單元而判定,因此關於至少一編碼模式的資訊可針對一最大寫碼單元而判定。又,最大寫碼單元之影像資料的經寫碼深度可根據位置而不同,此是因為影像資料根據深度在階層上分割,且由此,關於經寫碼深度及編碼模式的資訊可針對影像資料設定。
因此,熵編碼器120可將關於相應經寫碼深度及編碼模式之編碼資訊指派給寫碼單元、預測單元及包含於最大寫碼單元中之最小單元中的至少一者。
根據本發明之實施例的最小單元為藉由將構成最下層深度之最小寫碼單元分割為4個所獲得的正方形資料單元。或者,最小單元可為可包含在所有寫碼單元、預測單元、分區單元及包含在最大寫碼單元中之變換單元中的最大正方形資料單元。
舉例而言,經由熵編碼器120所輸出之編碼資訊可分類為根據寫碼單元之編碼資訊,及根據預測單元的編碼資訊。根據寫碼單元之編碼資訊可包含關於預測模式及關於分區之大小的資訊。根據預測單元之編碼資訊可包含關於畫面間模式之估計方向、關於畫面間模式之參考影像索引、關於運動向量、關於畫面內模式之色度分量及關於畫面內模式之內插方法的資訊。又,關於根據圖像、片段或GOP所定義之寫碼單元之最大大小的資訊及關於最大深度之資訊可插入至位元串流的標頭中。
在視訊編碼裝置100中,較深寫碼單元可為藉由將較上層深度之寫碼單元(其為在上方的一層)的高度或寬度除以2所獲得的寫碼單元。換言之,當當前深度之寫碼單元的大小為2N×2N時,較下層深度之寫碼單元的大小為N×N。又,具有大小2N×2N之當前深度的寫碼單元可包含具有大小N×N的較下層深度之最大數目4個寫碼單元。
因此,視訊編碼裝置100可藉由基於最大寫碼單元之大小及考慮當前圖像之特性所判定的最大深度針對每一最大寫碼單元判定具有最佳形狀及最佳大小的寫碼單元而形成具有樹結構之寫碼單元。又,由於藉由使用各種預測模式及變換中之任一者對每一最大寫碼單元執行編碼,因此可考慮各種影像大小之寫碼單元的特性判定最佳編碼模式。
因此,若具有高解析度或大資料量之影像在習知巨集區塊中編碼,則每圖像之巨集區塊的數目過度地增大。因此,針對每一巨集區塊所產生之壓縮資訊之片的數目增大,且由此難以傳輸壓縮資訊且資料壓縮效率降低。然而,藉由使用視訊編碼裝置100,由於在考慮影像之特性的同時調整寫碼單元,同時在考慮影像之大小的同時增大寫碼單元的最大大小,因此影像壓縮效率可增大。
圖12為根據本發明之實施例之視訊解碼裝置200的方塊圖。
視訊解碼裝置200包含語法元素提取器210、熵解碼器220及階層式解碼器230。諸如寫碼單元、深度、預測單元、變換單元之各種術語的定義,及關於各種編碼模式、用於視訊解碼裝置200之各種操作的資訊與參看圖11及參考視訊編碼裝置100所述的彼等相同。
語法元素提取器210接收且剖析經編碼視訊之位元串流。熵解碼器220自經剖析位元串流提取針對每一寫碼單元之經編碼影像資料,其中寫碼單元具有根據每一最大寫碼單元之樹結構,且將經提取影像資料輸出至階層式解碼器230。
又,熵解碼器220自經剖析位元串流提取關於經寫碼深度、編碼模式之額外資訊,色彩分量資訊,及針對具有根據每一最大寫碼單元之樹結構之寫碼單元的預測模式資訊。關於經寫碼深度及編碼模式之所提取資訊輸出至階層式解碼器230。換言之,位元串流中之影像資料分割為最大寫碼單元,使得階層式解碼器230針對每一最大寫碼單元解碼影像資料。
藉由熵解碼器220所提取的根據最大寫碼單元關於經寫碼深度及編碼模式的資訊可針對關於如下經寫碼深度及編碼模式之資訊而設定:經判定以藉由在編碼終端機(如同實施例之視訊編碼裝置100)處根據最大寫碼單元及經寫碼深度在寫碼單元中的每一者中重複地執行編碼而產生最小編碼誤差。因此,視訊解碼裝置200可藉由根據產生最小編碼誤差之編碼方法解碼資料來還原影像。
由於關於經寫碼深度及編碼模式之編碼資訊可指派給來自相應寫碼單元、預測單元及最小單元當中的預定資料單元,因此熵解碼器220可根據預定資料單元提取關於經寫碼深度及編碼模式的資訊。若關於相應最大寫碼單元之經寫碼深度及編碼模式的資訊記錄於預定資料單元中之每一者中,則關於經寫碼深度及編碼模式之相同資訊所指派給的預定資料單元可被推斷為包含於同一最大寫碼單元中的資料單元。
階層式解碼器230藉由基於根據最大寫碼單元關於經寫碼深度及編碼模式的資訊解碼每一最大寫碼單元中之影像資料來還原當前圖像。換言之,階層式解碼器230可基於關於分區類型、預測模式,及來自包含於每一最大寫碼單元中之具有樹結構的寫碼單元當中之每一寫碼單元之變換單元的所提取資訊而解碼經編碼影像資料。解碼處理程序可包含包括畫面內預測及運動補償之預測,及逆變換。可根據逆正交變換或逆整數變換之方法而執行逆變換。
階層式解碼器230可基於關於根據經寫碼深度之寫碼單元之預測單元的分區類型及預測模式的資訊根據每一寫碼單元之分區及預測模式執行畫面內預測或運動補償。
又,階層式解碼器230可基於關於根據經寫碼深度之寫碼單元的變換單元之大小的資訊根據寫碼單元中之每一變換單元執行逆變換,以便根據最大寫碼單元執行逆變換。
階層式解碼器230可藉由根據深度使用分割資訊而判定當前最大寫碼單元之至少一經寫碼深度。若分割資訊指示影像資料在當前深度上不再分割,則當前深度為經寫碼深度。因此,階層式解碼器230可藉由使用關於預測單元之分區類型、預測模式,及用於對應於經寫碼深度之每一寫碼單元之變換單元的大小之資訊來解碼對應於當前最大寫碼單元中之每一經寫碼深度的至少一寫碼單元之經編碼資料,且輸出當前最大寫碼單元之影像資料。
換言之,含有包含相同分割資訊之編碼資訊的資料單元可藉由觀測針對來自寫碼單元、預測單元及最小單元當中之預定資料單元所指派的編碼資訊集合來聚集,且所聚集資料單元可視為待藉由階層式解碼器230在同一編碼模式中解碼的一資料單元。
視訊解碼裝置200可獲得關於在編碼針對每一最大寫碼單元以遞回方式執行時產生最小編碼誤差之至少一寫碼單元的資訊,且可使用此資訊來解碼當前圖像。換言之,判定為每一最大寫碼單元中之最佳寫碼單元的具有樹結構之寫碼單元可經解碼。
因此,即使影像資料具有高解析度及大量資料,仍可藉由使用自編碼器所接收之關於最佳編碼模式的資訊藉由使用寫碼單元之大小及編碼模式(其是根據影像資料之特性適應性地判定)有效地解碼及還原影像資料。
現將參看圖13至圖23描述根據本發明之實施例的判定具有樹結構之寫碼單元、預測單元及變換單元的方法。
圖13為用於描述根據本發明之實施例的寫碼單元之概念的圖式。
寫碼單元之大小可用寬度×高度來表達,且可為64×64、32×32、16×16及8×8。64×64之寫碼單元可分割為64×64、64×32、32×64或32×32之分區,且32×32之寫碼單元可分割為32×32、32×16、16×32或16×16的分區,16×16之寫碼單元可分割為16×16、16×8、8×16或8×8之分區,且8×8之寫碼單元可分割為8×8、8×4、4×8或4×4的分區。
在視訊資料310中,解析度為1920×1080,寫碼單元之最大大小為64,且最大深度為2。在視訊資料320中,解析度為1920×1080,寫碼單元之最大大小為64,且最大深度為3。在視訊資料330中,解析度為352×288,寫碼單元之最大大小為16,且最大深度為1。圖13中所示之最大深度表示自最大寫碼單元至最小解碼單元之總分割次數。
若解析度為高的或資料量為大的,則寫碼單元之最大大小可為大的,以便不僅增大編碼效率而且準確地反映影像之特性。因此,具有高於視訊資料330之解析度的視訊資料310及320之寫碼單元的最大大小可為64。
由於視訊資料310之最大深度為2,因此視訊資料310之寫碼單元315可包含具有長軸大小64的最大寫碼單元,及具有長軸大小32及16的寫碼單元,此是因為深度藉由分割最大寫碼單元兩次而加深為兩層。同時,由於視訊資料330之最大深度為1,因此視訊資料330之寫碼單元335可包含具有長軸大小16的最大寫碼單元,及具有長軸大小8之寫碼單元,此是因為深度藉由分割最大寫碼單元一次而加深為一層。
由於視訊資料320之最大深度為3,因此視訊資料320之寫碼單元325可包含具有長軸大小64的最大寫碼單元,及具有長軸大小32、16及8的寫碼單元,此是因為深度藉由分割最大寫碼單元三次而加深為三層。隨著深度加深,可精確地表達詳細資訊。
圖14為根據本發明之實施例的基於階層結構之寫碼單元的影像編碼裝置之方塊圖。
畫面內預測器410對來自當前圖框405當中的處於畫面內模式中之寫碼單元執行畫面內預測,且運動估計器420及運動補償器425藉由使用當前圖框405及參考圖框495對來自當前圖框405當中之處於畫面間模式中的寫碼單元執行畫面間估計及運動補償。
自畫面內預測器410、運動估計器420及運動補償器425所輸出之資料經由變換器430及量化器440作為經量化變換係數而輸出。經量化變換係數經由逆量化器460及逆變換器470還原為空間域中之資料,且空間域中之經還原資料在經由解區塊單元480及迴路濾波單元490後處理之後作為參考圖框495輸出。經量化變換係數可經由熵編碼器450作為位元串流455輸出。
為了使影像編碼器400應用於視訊編碼裝置100中,影像編碼器400之所有元件(亦即,畫面內預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、逆量化器460、逆變換器470、解區塊單元480及迴路濾波單元490)在考慮每一最大寫碼單元之最大深度的同時基於來自具有樹結構之寫碼單元當中的每一寫碼單元執行操作。
特定言之,畫面內預測器410、運動估計器420及運動補償器425在考慮當前最大寫碼單元之最大大小及最大深度的同時判定來自具有樹結構之寫碼單元當中的每一寫碼單元之分區及預測模式,且變換器430判定來自具有樹結構之寫碼單元當中的每一寫碼單元中之變換單元的大小。
圖15為根據本發明之實施例的基於階層結構之寫碼單元的影像解碼裝置之方塊圖。
剖析器510剖析待解碼之經編碼影像資料及來自位元串流505的針對解碼所需之關於編碼的資訊。經編碼影像資料經由熵解碼器520及逆量化器530作為經逆量化資料輸出,且經逆量化資料經由逆變換器540還原為空間域中的影像資料。
畫面內預測器550關於空間域中之影像資料對處於畫面內模式中之寫碼單元執行畫面內預測,且運動補償器560藉由使用參考圖框585對處於畫面間模式中的寫碼單元執行運動補償。
傳遞通過畫面內預測器550及運動補償器560之空間域中的影像資料可在經由解區塊單元570及迴路濾波單元580後處理之後作為經還原圖框595輸出。又,經由解區塊單元570及迴路濾波單元580後處理之影像資料可作為參考圖框585輸出。
為了使影像解碼器500應用於視訊解碼裝置200中,影像解碼器500之所有元件(亦即,剖析器510、熵解碼器520、逆量化器530、逆變換器540、畫面內預測器550、運動補償器560、解區塊單元570及迴路濾波單元580)針對每一最大寫碼單元基於具有樹結構之寫碼單元執行操作。
特定言之,畫面內預測550及運動補償器560針對具有樹結構之寫碼單元中之每一者基於分區及預測模式執行操作,且逆變換器540針對每一寫碼單元基於變換單元的大小執行操作。
圖16為說明根據本發明之實施例的根據深度之寫碼單元及分區的圖式。
視訊編碼裝置100及視訊解碼裝置200使用階層式寫碼單元以便考慮影像之特性。寫碼單元之最大高度、最大寬度及最大深度可根據影像之特性適應性地判定,或可藉由使用者不同地設定。可根據寫碼單元之預定最大大小判定根據深度之較深寫碼單元的大小。
在寫碼單元之階層結構600中,根據本發明之實施例,寫碼單元之最大高度及最大寬度各為64,且最大深度為4。由於深度沿著階層結構600之垂直軸加深,因此較深寫碼單元之高度及寬度各自經分割。又,為用於每一較深寫碼單元之預測編碼之基礎的預測單元及分區沿著階層結構600之水平軸而展示。
換言之,寫碼單元610為階層結構600中之最大寫碼單元,其中深度為0且大小(亦即,高度乘寬度)為64×64。深度沿著垂直軸而加深,且具有大小32×32及深度1之寫碼單元620、具有大小16×16及深度2之寫碼單元630、具有大小8×8及深度3之寫碼單元640,及具有大小4×4及深度4的寫碼單元650存在。具有大小4×4及深度4之寫碼單元650為最小寫碼單元。
寫碼單元之預測單元及分區根據每一深度沿著水平軸而配置。換言之,若具有大小64×64及深度0之寫碼單元610為預測單元,則預測單元可分割為包含於編碼單元610中的分區,亦即,具有大小64×64之分區610、具有大小64×32之分區612、具有大小32×64之分區614,或具有大小32×32的分區616。
類似地,具有大小32×32及深度11之寫碼單元620的預測單元可分割為包含於寫碼單元620中的分區,亦即,具有大小32×32之分區620、具有大小32×16之分區622、具有大小16×32之分區624,及具有大小16×16的分區626。
類似地,具有大小16×16及深度12之寫碼單元630的預測單元可分割為包含於寫碼單元630中的分區,亦即,包含於寫碼單元630中的具有大小16×16之分區、具有大小16×8之分區632、具有大小8×16之分區634,及具有大小8×8的分區636。
類似地,具有大小8×8及深度23之寫碼單元640的預測單元可分割為包含於寫碼單元640中的分區,亦即,包含於寫碼單元640中的具有大小8×8之分區、具有大小8×4之分區642、具有大小4×8之分區644,及具有大小4×4的分區646。
具有大小4×4及深度14之寫碼單元650為最小寫碼單元及最下層深度之寫碼單元。寫碼單元650之預測單元僅指派給具有大小4×4之分區。
為了判定構成最大寫碼單元610之寫碼單元的至少一經寫碼深度,視訊編碼裝置100之寫碼單元判定器120針對對應於包含於最大寫碼單元610中之每一深度的寫碼單元執行編碼。
隨著深度加深,包含相同範圍中之資料及相同大小的根據深度之較深寫碼單元的數目增大。舉例而言,需要對應於深度12之四個寫碼單元來涵蓋包含於對應於深度11之一寫碼單元中的資料。因此,為了比較根據深度之相同資料的編碼結果,對應於深度11之寫碼單元及對應於深度12之四個寫碼單元各自經編碼。
為了針對來自深度當中之當前深度執行編碼,沿著階層結構600之水平軸,可藉由針對對應於當前深度之寫碼單元中的每一預測單元執行編碼而針對當前深度選擇最小編碼誤差。或者,可藉由比較根據深度之最小編碼誤差及隨著深度沿著階層結構600之垂直軸加深而針對每一深度執行編碼來搜尋最小編碼誤差。寫碼單元610中具有最小編碼誤差之深度及分區可選擇為寫碼單元610之經寫碼深度及分區類型。
圖17為用於描述根據本發明之實施例的在寫碼單元710與變換單元720之間的關係的圖式。
視訊編碼裝置100或200針對每一最大寫碼單元根據具有小於或等於最大寫碼單元之大小的寫碼單元編碼或解碼影像。在編碼期間用於變換之變換單元的大小可基於不大於相應寫碼單元之資料單元而選擇。
舉例而言,在視訊編碼裝置100或200中,若寫碼單元710之大小為64×64,則可藉由使用具有大小32×32之變換單元720來執行變換。
又,可藉由對具有大小32×32、16×16、8×8及4×4(其小於64×64)之變換單元中的每一者執行變換而編碼具有大小64×64之寫碼單元710的資料,且接著具有最小寫碼誤差的變換單元可經選擇。
圖18為用於描述根據本發明之實施例的對應於經寫碼深度之寫碼單元之編碼資訊的圖式。
視訊編碼裝置100之輸出單元130可編碼且傳輸關於分區類型之資訊800、關於預測模式之資訊810,及關於對應於經寫碼深度之每一寫碼單元的變換單元之大小的資訊820,作為關於編碼模式之資訊。
資訊800指示關於藉由分割當前寫碼單元之預測單元所獲得的分區之形狀的資訊,其中分區為用於預測編碼當前寫碼單元的資料單元。舉例而言,具有大小2N×2N之當前寫碼單元CU_0可分割為具有大小2N×2N之分區802、具有大小2N×N之分區804、具有大小N×2N之分區806及具有大小N×N的分區808中之任一者。此處,關於分區類型之資訊800設定為指示具有大小2N×N之分區804、具有大小N×2N之分區806及具有大小N×N之分區808中的一者。
資訊810指示每一分區之預測模式。舉例而言,資訊810可指示對藉由資訊800所指示之分區所執行的預測編碼之模式,亦即,畫面內模式812、畫面間模式814或跳過模式816。
資訊820指示待基於何時對當前寫碼單元執行變換之變換單元。舉例而言,變換單元可為第一畫面內變換單元822、第二畫面內變換單元824、第一畫面間變換單元826或第二畫面間變換單元828。
根據每一較深寫碼單元,視訊解碼裝置200之影像資料及編碼資訊提取器220可提取且使用資訊800、810及820以用於解碼。
圖19為根據本發明之實施例的根據深度之較深寫碼單元的圖式。
分割資訊可用以指示深度之改變。分割資訊指示當前深度之寫碼單元是否分割為較下層深度之寫碼單元。
用於預測編碼具有深度0及大小2N_0×2N_0之寫碼單元900的預測單元910可包含具有大小2N_0×2N_0之分區類型912、具有大小2N_0×N_0之分區類型914、具有大小N_0×2N_0之分區類型916及具有大小N_0×N_0的分區類型918之分區。圖19僅說明藉由對稱地分割預測單元910所獲得之分區類型912至918,但分區類型不限於此,且預測單元910之分區可包含非對稱分區、具有預定形狀之分區及具有幾何形狀的分區。
根據每一分區類型,預測編碼對具有大小2N_0×2N_0之一個分區、具有大小2N_0×N_0之兩個分區、具有大小N_0×2N_0之兩個分區及具有大小N_0×N_0的四個分區重複地執行。在畫面內模式及畫面間模式中之預測編碼可對具有大小2N_0×2N_0、N_0×2N_0、2N_0×N_0及N_0×N_0之分區執行。在跳過模式中之預測編碼僅對具有大小2N_0×2N_0之分區執行。
若編碼誤差在具有大小2N_0×2N_0、2N_0×N_0及N_0×2N_0之分區類型912至916中的一者中最小,則預測單元910可能不分割為較下層深度。
若編碼誤差在具有大小N_0×N_0之分區類型918中最小,則深度自0改變為1以在操作920中分割分區類型918,且編碼對具有深度12及大小N_0×N_0之寫碼單元930重複地執行以搜尋最小編碼誤差。
用於預測編碼具有深度11及大小2N_1×2N_1(=N_0×N_0)之寫碼單元930的預測單元940可包含具有大小2N_1×2N_1之分區類型942、具有大小2N_1×N_1之分區類型944、具有大小N_1×2N_1之分區類型946及具有大小N_1×N_1的分區類型948之分區。
若編碼誤差在具有大小N_1×N_1之分區類型948中最小,則深度自11改變為12以在操作950中分割分區類型948,且編碼對具有深度2及大小N_2×N_2之寫碼單元960重複地執行以搜尋最小編碼誤差。
當最大深度為d時,根據每一深度之分割操作可經執行直至深度變為d-1時,且分割資訊可編碼為直至深度為0至d-2中之一者時。換言之,當在對應於深度d-2之寫碼單元在操作970中分割之後執行編碼直至深度為d-1時,用於預測編碼具有深度d-1及大小2N_(d-1)×2N_(d-1)之寫碼單元980的預測單元990可包含具有大小2N_(d-1)×2N_(d-1)之分區類型992、具有大小2N_(d-1)×N_(d-1)之分區類型994、具有大小N_(d-1)×2N_(d-1)之分區類型996及具有大小N_(d-1)×N_(d-1)的分區類型998之分區。
預測編碼可對來自分區類型992至998當中的具有大小2N_(d-1)×2N_(d-1)之一個分區、具有大小2N_(d-1)×N_(d-1)之兩個分區、具有大小N_(d-1)×2N_(d-1)之兩個分區,具有大小N_(d-1)×N_(d-1)的四個分區重複地執行,以搜尋具有最小編碼誤差的分區類型。
即使當具有大小N_(d-1)×N_(d-1)之分區類型998具有最小編碼誤差時,由於最大深度為d,具有深度d-1之寫碼單元CU_(d-1)不再分割為較下層深度,且構成當前最大寫碼單元900之寫碼單元的經寫碼深度判定為d-1,且當前最大寫碼單元900的分區類型可判定為N_(d-1)×N_(d-1)。又,由於最大深度為d且具有最下層深度d-1之最小寫碼單元980不再分割為較下層深度,因此不設定用於最小寫碼單元980之分割資訊。
資料單元999可為當前最大寫碼單元之‘最小單元’。根據本發明之實施例的最小單元可為藉由將最小寫碼單元980分割為4個所獲得的矩形資料單元。藉由重複地執行編碼,視訊編碼裝置100可藉由根據寫碼單元900之深度比較編碼誤差而選擇具有最小編碼誤差的深度以判定經寫碼深度,且將相應分區類型及預測模式設定為經寫碼深度的編碼模式。
因而,根據深度之最小編碼誤差在所有深度1至d中比較,且具有最小編碼誤差之深度可判定為經寫碼深度。經寫碼深度、預測單元之分區類型,及預測模式可編碼為關於編碼模式之資訊且作為此資訊傳輸。又,由於寫碼單元自深度0分割為經寫碼深度,因此僅經寫碼深度之分割資訊設定為0,且排除經寫碼深度之深度的分割資訊設定為1。
視訊解碼裝置200之影像資料及編碼資訊提取器220可提取且使用關於經寫碼深度及寫碼單元900之預測單元的資訊,以解碼分區912。視訊解碼裝置200可藉由使用根據深度之分割資訊判定深度(其中分割資訊為0)作為經寫碼深度,且使用關於相應深度之編碼模式的資訊以用於解碼。
圖20至圖22為用於描述根據本發明之實施例的在寫碼單元1010、預測單元1060與變換單元1070之間的關係的圖式。
寫碼單元1010為在最大寫碼單元中對應於藉由視訊編碼裝置100所判定之經寫碼深度的具有樹結構之寫碼單元。預測單元1060為寫碼單元1010中之每一者之預測單元的分區,且變換單元1070為寫碼單元1010中之每一者的變換單元。
當最大寫碼單元之深度在寫碼單元1010中為0時,寫碼單元1012及1054之深度為1,寫碼單元1014、1016、1018、1028、1050及1052之深度為2,寫碼單元1020、1022、1024、1026、1030、1032及1048之深度為3,且寫碼單元1040、1042、1044及1046的深度為4。
在預測單元1060中,藉由分割寫碼單元而獲得一些編碼單元1014、1016、1022、1032、1048、1050、1052及1054。換言之,寫碼單元1014、1022、1050及1054中之分區類型具有大小2N×N,寫碼單元1016、1048及1052中之分區類型具有大小N×2N,且寫碼單元1032之分區類型具有大小N×N。預測單元及寫碼單元1010之分區小於或等於每一寫碼單元。
變換或逆變換在小於寫碼單元1052之資料單元中對變換單元1070中的寫碼單元1052之影像資料執行。又,變換單元1070中之寫碼單元1014、1016、1022、1032、1048、1050及1052在大小及形狀方面不同於預測單元1060中的寫碼單元。換言之,視訊編碼裝置100及視訊解碼裝置200可對同一寫碼單元中之資料單元個別地執行畫面內預測、運動估計、運動補償、變換及逆變換。
因此,編碼對在最大寫碼單元之每一區域中具有階層結構之寫碼單元中的每一者以遞回方式執行以判定最佳寫碼單元,且由此,具有遞回樹結構之寫碼單元可獲得。編碼資訊可包含關於寫碼單元之分割資訊、關於分區類型之資訊、關於預測模式之資訊,及關於變換單元之大小的資訊。表1展示可藉由視訊編碼裝置100及視訊解碼裝置200設定之編碼資訊。
[表1]
視訊編碼裝置100之熵編碼器120可輸出關於具有樹結構之寫碼單元的編碼資訊,且視訊解碼裝置200之熵解碼器220可自所接收位元串流提取關於具有樹結構之寫碼單元的編碼資訊。
分割資訊指示當前寫碼單元是否分割為較下層深度之寫碼單元。若當前深度d之分割資訊為0,則當前寫碼單元不再分割為較下層深度之深度為經寫碼深度,且由此關於分區類型、預測模式及變換單元之大小的資訊可針對經寫碼深度而定義。若當前寫碼單元根據分割資訊進一步分割,則編碼對較下層深度之四個分割寫碼單元獨立地執行。
預測模式可為畫面內模式、畫面間模式及跳過模式中之一者。畫面內模式及畫面間模式可在所有分區類型中定義,且跳過模式僅在具有大小2N×2N之分區類型中定義。
關於分區類型之資訊可指示:具有大小2N×2N、2N×N、N×2N及N×N之對稱分區類型,其是藉由對稱地分割預測單元之高度或寬度而獲得;及具有大小2N×nU、2N×nD、nL×2N及nR×2N之非對稱分區類型,其是藉由非對稱地分割預測單元之高度或寬度而獲得。具有大小2N×nU及2N×nD之非對稱分區類型可藉由以1:n(其中n為大於1之整數)及n:1分割預測單元之高度來分別獲得,且具有大小nL×2N及nR×2N之非對稱分區類型可藉由以1:n及n:1分割預測單元的寬度而分別獲得。
變換單元之大小可設定為畫面內模式中之兩種類型及畫面間模式中的兩種類型。換言之,若變換單元之分割資訊為0,則變換單元之大小可為2N×2N,2N×2N為當前寫碼單元的大小。若變換單元之分割資訊為1,則變換單元可藉由分割當前寫碼單元而獲得。又,若具有大小2N×2N之當前寫碼單元的分區類型為對稱分區類型,則變換單元之大小可為N×N,且若當前寫碼單元之分區類型為非對稱分區類型,則變換單元的大小可為N/2×N/2。
關於具有樹結構之寫碼單元的編碼資訊可包含對應於經寫碼深度之寫碼單元、預測單元及最小單元中的至少一者。對應於經寫碼深度之寫碼單元可包含含有相同編碼資訊之預測單元及最小單元中的至少一者。
因此,藉由比較鄰近資料單元之編碼資訊而判定鄰近資料單元是否包含於對應於經寫碼深度的同一寫碼單元中。又,對應於經寫碼深度之相應寫碼單元是藉由使用資料單元之編碼資訊而判定,且由此最大寫碼單元中之經寫碼深度的分佈可得以判定。
因此,若當前寫碼單元是基於鄰近資料單元之編碼資訊而預測,則鄰近於當前寫碼單元的較深寫碼單元中之資料單元的編碼資訊可直接被參考且使用。
或者,若當前寫碼單元是基於鄰近資料單元之編碼資訊而預測,則鄰近於當前寫碼單元之資料單元是使用資料單元的經編碼資訊而搜尋,且所搜尋之鄰近寫碼單元可被參考以用於預測當前寫碼單元。
圖23為用於描述根據表1之編碼模式資訊的在寫碼單元、預測單元與變換單元之間的關係的圖式。
最大寫碼單元1300包含經寫碼深度之寫碼單元1302、1304、1306、1312、1314、1316及1318。此處,由於寫碼單元1318為經寫碼深度之寫碼單元,因此分割資訊可設定為0。關於具有大小2N×2N之寫碼單元1318之分區類型的資訊可設定為具有大小2N×2N之分區類型1322、具有大小2N×N之分區類型1324、具有大小N×2N之分區類型1326、具有大小N×N之分區類型1328、具有大小2N×nU之分區類型1332、具有大小2N×nD之分區類型1334、具有大小nL×2N之分區類型1336,及具有大小nR×2N的分區類型1338中的一者。
當分區類型設定為對稱(亦即,分區類型1322、1324、1326或1328)時,若變換單元之分割資訊(TU大小旗標)為0,則具有大小2N×2N之變換單元1342經設定,且若TU大小旗標為1,則具有大小N×N的變換單元1344經設定。
當分區類型設定為非對稱(亦即,分區類型1332、1334、1336或1338)時,若TU大小旗標為0,則具有大小2N×2N之變換單元1352經設定,且若TU大小旗標為1,則具有大小N/2×N/2的變換單元1354經設定。
變換單元之分割資訊(TU(變換單元)大小旗標)為一類型之變換索引。對應於變換索引之變換單元的大小可根據寫碼單元之預測單元類型或分區類型而改變。
舉例而言,當分區類型設定為對稱(亦即,分區類型2N×2N(1322)、2N×N(1324)、N×2N(1326)或N×N(1328))時,若變換單元之分割資訊(TU大小旗標)為0,則具有大小2N×2N之變換單元1342經設定,且若TU大小旗標為1,則具有大小N×N的變換單元1344經設定。
當分區類型設定為非對稱(亦即,分區類型2N×nU(1332)、2N×nD(1334)、nL×2N(1336)或nR×2N(1338))時,若TU大小旗標為0,則具有大小2N×2N之變換單元1352經設定,且若TU大小旗標為1,則具有大小N/2×N/2的變換單元1354經設定。
參看圖19,TU大小旗標為具有值0或1之旗標,但TU大小旗標不限於1個位元,且具有樹結構之變換單元可在TU大小旗標自0增大之同時在階層上分割。變換單元之分割資訊(TU大小旗標)可為變換索引之實例。
在此狀況下,已實際使用之變換單元的大小可藉由使用根據本發明之實施例的變換單元之TU大小旗標連同變換單元之最大大小及最小大小來表達。根據本發明之實施例,視訊編碼裝置100能夠編碼最大變換單元大小資訊、最小變換單元大小資訊及最大TU大小旗標。編碼最大變換單元大小資訊、最小變換單元大小資訊及最大TU大小旗標之結果可插入至SPS中。根據本發明之實施例,視訊解碼裝置200可藉由使用最大變換單元大小資訊、最小變換單元大小資訊及最大TU大小旗標而解碼視訊。
舉例而言,(a)若當前寫碼單元之大小為64×64且最大變換單元大小為32×32,(a-1)則在TU大小旗標為0時,變換單元之大小可為32×32,(a-2)在TU大小旗標為1時,變換單元之大小可為16×16,且(a-3)在TU大小旗標為2時,變換單元之大小可為8×8。
作為另一實例,(b)若當前寫碼單元之大小為32×32且最小變換單元大小為32×32,(b-1)則在TU大小旗標為0時,變換單元之大小可為32×32。此處,TU大小旗標不可設定為除0以外之值,此是因為變換單元之大小不可小於32×32。
作為另一實例,(c)若當前寫碼單元之大小為64×64且最大TU大小旗標為1,則TU大小旗標可為0或1。此處,TU大小旗標不可設定為除0或1以外之值。
因此,若定義最大TU大小旗標為‘MaxTransformSizeIndex’,最小變換單元大小為‘MinTransformSize’,且在TU大小旗標為0時變換單元大小為‘RootTuSize’,則可在當前寫碼單元中判定之當前最小變換單元大小‘CurrMinTuSize’可藉由方程式(1)定義: CurrMinTuSize= max (MinTransformSize, RootTuSize/ (2^MaxTransformSizeIndex)) ...... (1)
與可在當前寫碼單元中判定之當前最小變換單元大小‘CurrMinTuSize’相比,在TU大小旗標為0時之變換單元大小‘RootTuSize’可表示可在系統中選擇的最大變換單元大小。在方程式(1)中,‘RootTuSize/(2^MaxTransformSizeIndex)’表示在變換單元大小‘RootTuSize’在TU大小旗標為0時分割對應於最大TU大小旗標之次數時的變換單元大小,且‘MinTransformSize’表示最小變換大小。因此,來自‘RootTuSize/(2^MaxTransformSizeIndex)’及‘MinTransformSize’當中之較小值可為可在當前寫碼單元中判定的當前最小變換單元大小‘CurrMinTuSize’。
根據本發明之實施例,最大變換單元大小RootTuSize可根據預測模式之類型而變化。
舉例而言,若當前預測模式為畫面間模式,則‘RootTuSize’可藉由使用下文之方程式(2)判定。在方程式(2)中,‘MaxTransformSize’表示最大變換單元大小,且‘PUSize’表示當前預測單元大小。 RootTuSize = min(MaxTransformSize, PUSize) ...... (2)
亦即,若當前預測模式為畫面間模式,則在TU大小旗標為0時之變換單元大小‘RootTuSize’可為來自最大變換單元大小及當前預測單元大小當中的較小值。
若當前分區單元之預測模式為畫面內模式,則‘RootTuSize’可藉由使用下文之方程式(3)判定。在方程式(3)中,‘PartitionSize’表示當前分區單元之大小。 RootTuSize = min(MaxTransformSize, PartitionSize) ......(3)
亦即,若當前預測模式為畫面內模式,則在TU大小旗標為0時之變換單元大小‘RootTuSize’可為來自最大變換單元大小及當前分區單元之大小當中的較小值。
然而,根據分區單元中之預測模式之類型而變化的當前最大變換單元大小‘RootTuSize’僅為實例,且本發明不限於此。
本發明之實施例可寫為電腦程式,且可在使用電腦可讀記錄媒體執行程式的通用數位電腦中實施。電腦可讀記錄媒體之實例包含磁性儲存媒體(例如,ROM、軟性磁碟、硬碟等)及光學記錄媒體(例如,CD-ROM或DVD)。電腦可讀記錄媒體亦可散佈於網路耦接之電腦系統之上,使得電腦可讀碼經儲存且以散佈型式執行。
儘管已參考本發明之例示性實施例特定地展示且描述了本發明,但一般熟習此項技術者將理解,在不脫離如由以下申請專利範圍所界定的本發明之精神及範疇的情況下,可在本發明中進行形式及細節上的各種改變。
10‧‧‧視訊編碼裝置
11‧‧‧影像編碼器
12‧‧‧語法元素編碼器
20‧‧‧語法元素編碼器
21‧‧‧二元化器
22‧‧‧全文模型化器
23‧‧‧二元算術寫碼器
24‧‧‧規則寫碼引擎
25‧‧‧旁通寫碼引擎
40‧‧‧區塊
41‧‧‧最後有效係數
52‧‧‧首碼位元串0001
54‧‧‧尾碼位元串010
61‧‧‧列位置x
62‧‧‧x軸分量首碼
63‧‧‧x軸分量尾碼
66‧‧‧y軸分量首碼
67‧‧‧y軸分量尾碼
68‧‧‧全文模型化
69‧‧‧旁通模式
90‧‧‧視訊解碼裝置
91‧‧‧語法元素解碼器
92‧‧‧影像還原單元
93‧‧‧算術解碼裝置
94‧‧‧全文模型化器
95‧‧‧規則解碼器
96‧‧‧旁通解碼器
97‧‧‧逆二元化單元
100‧‧‧視訊編碼裝置
110‧‧‧階層式編碼器
120‧‧‧熵編碼器
200‧‧‧視訊解碼裝置
210‧‧‧語法元素提取器
220‧‧‧熵解碼器
230‧‧‧階層式解碼器
310‧‧‧視訊資料
315‧‧‧寫碼單元
320‧‧‧視訊資料
325‧‧‧寫碼單元
330‧‧‧視訊資料
335‧‧‧寫碼單元
400‧‧‧影像編碼器
405‧‧‧當前圖框
410‧‧‧畫面內預測器
420‧‧‧運動估計器
425‧‧‧運動補償器
430‧‧‧變換器
440‧‧‧量化器
450‧‧‧熵編碼器
455‧‧‧位元串流
460‧‧‧逆量化器
470‧‧‧逆變換器
480‧‧‧解區塊單元
490‧‧‧迴路濾波單元
495‧‧‧參考圖框
500‧‧‧影像解碼器
505‧‧‧位元串流
510‧‧‧剖析器
520‧‧‧熵解碼器
530‧‧‧逆量化器
540‧‧‧逆變換器
550‧‧‧畫面內預測器
560‧‧‧運動補償器
570‧‧‧解區塊單元
580‧‧‧迴路濾波單元
585‧‧‧參考圖框
595‧‧‧經還原圖框
600‧‧‧階層結構
610‧‧‧寫碼單元/編碼單元/分區/最大寫碼單元
612‧‧‧分區
614‧‧‧分區
616‧‧‧分區
620‧‧‧寫碼單元/分區
622‧‧‧分區
624‧‧‧分區
626‧‧‧分區
630‧‧‧寫碼單元
632‧‧‧分區
634‧‧‧分區
636‧‧‧分區
640‧‧‧寫碼單元
642‧‧‧分區
644‧‧‧分區
646‧‧‧分區
650‧‧‧寫碼單元
710‧‧‧寫碼單元
720‧‧‧變換單元
800‧‧‧資訊
802‧‧‧分區
804‧‧‧分區
806‧‧‧分區
808‧‧‧分區
810‧‧‧資訊
812‧‧‧畫面內模式
814‧‧‧畫面間模式
816‧‧‧跳過模式
820‧‧‧資訊
822‧‧‧第一畫面內變換單元
824‧‧‧第二畫面內變換單元
826‧‧‧第一畫面間變換單元
828‧‧‧第二畫面內變換單元
900‧‧‧寫碼單元/最大寫碼單元
910‧‧‧預測單元
912‧‧‧分區類型/分區
914‧‧‧分區類型
916‧‧‧分區類型
918‧‧‧分區類型
920‧‧‧操作
930‧‧‧寫碼單元
940‧‧‧預測單元
942‧‧‧分區類型
944‧‧‧分區類型
946‧‧‧分區類型
948‧‧‧分區類型
950‧‧‧操作
960‧‧‧寫碼單元
970‧‧‧操作
980‧‧‧寫碼單元/最小寫碼單元
990‧‧‧預測單元
992‧‧‧分區類型
994‧‧‧分區類型
996‧‧‧分區類型
998‧‧‧分區類型
999‧‧‧資料單元
1010‧‧‧寫碼單元
1012‧‧‧寫碼單元
1014‧‧‧寫碼單元/編碼單元
1016‧‧‧寫碼單元/編碼單元
1018‧‧‧寫碼單元
1020‧‧‧寫碼單元
1022‧‧‧寫碼單元/編碼單元
1024‧‧‧寫碼單元
1026‧‧‧寫碼單元
1028‧‧‧寫碼單元
1030‧‧‧寫碼單元
1032‧‧‧寫碼單元/編碼單元
1040‧‧‧寫碼單元
1042‧‧‧寫碼單元
1044‧‧‧寫碼單元
1046‧‧‧寫碼單元
1048‧‧‧寫碼單元/編碼單元
1050‧‧‧寫碼單元/編碼單元
1052‧‧‧寫碼單元/編碼單元
1054‧‧‧寫碼單元/編碼單元
1060‧‧‧預測單元
1070‧‧‧變換單元
1300‧‧‧最大寫碼單元
1302‧‧‧寫碼單元
1304‧‧‧寫碼單元
1306‧‧‧寫碼單元
1312‧‧‧寫碼單元
1314‧‧‧寫碼單元
1316‧‧‧寫碼單元
1318‧‧‧寫碼單元
1322‧‧‧分區類型
1324‧‧‧分區類型
1326‧‧‧分區類型
1328‧‧‧分區類型
1332‧‧‧分區類型
1334‧‧‧分區類型
1336‧‧‧分區類型
1338‧‧‧分區類型
1342‧‧‧變換單元
1344‧‧‧變換單元
1352‧‧‧變換單元
1354‧‧‧變換單元
CU_0‧‧‧當前寫碼單元
CU_1‧‧‧寫碼單元
CU_(d-1)‧‧‧寫碼單元
11‧‧‧影像編碼器
12‧‧‧語法元素編碼器
20‧‧‧語法元素編碼器
21‧‧‧二元化器
22‧‧‧全文模型化器
23‧‧‧二元算術寫碼器
24‧‧‧規則寫碼引擎
25‧‧‧旁通寫碼引擎
40‧‧‧區塊
41‧‧‧最後有效係數
52‧‧‧首碼位元串0001
54‧‧‧尾碼位元串010
61‧‧‧列位置x
62‧‧‧x軸分量首碼
63‧‧‧x軸分量尾碼
66‧‧‧y軸分量首碼
67‧‧‧y軸分量尾碼
68‧‧‧全文模型化
69‧‧‧旁通模式
90‧‧‧視訊解碼裝置
91‧‧‧語法元素解碼器
92‧‧‧影像還原單元
93‧‧‧算術解碼裝置
94‧‧‧全文模型化器
95‧‧‧規則解碼器
96‧‧‧旁通解碼器
97‧‧‧逆二元化單元
100‧‧‧視訊編碼裝置
110‧‧‧階層式編碼器
120‧‧‧熵編碼器
200‧‧‧視訊解碼裝置
210‧‧‧語法元素提取器
220‧‧‧熵解碼器
230‧‧‧階層式解碼器
310‧‧‧視訊資料
315‧‧‧寫碼單元
320‧‧‧視訊資料
325‧‧‧寫碼單元
330‧‧‧視訊資料
335‧‧‧寫碼單元
400‧‧‧影像編碼器
405‧‧‧當前圖框
410‧‧‧畫面內預測器
420‧‧‧運動估計器
425‧‧‧運動補償器
430‧‧‧變換器
440‧‧‧量化器
450‧‧‧熵編碼器
455‧‧‧位元串流
460‧‧‧逆量化器
470‧‧‧逆變換器
480‧‧‧解區塊單元
490‧‧‧迴路濾波單元
495‧‧‧參考圖框
500‧‧‧影像解碼器
505‧‧‧位元串流
510‧‧‧剖析器
520‧‧‧熵解碼器
530‧‧‧逆量化器
540‧‧‧逆變換器
550‧‧‧畫面內預測器
560‧‧‧運動補償器
570‧‧‧解區塊單元
580‧‧‧迴路濾波單元
585‧‧‧參考圖框
595‧‧‧經還原圖框
600‧‧‧階層結構
610‧‧‧寫碼單元/編碼單元/分區/最大寫碼單元
612‧‧‧分區
614‧‧‧分區
616‧‧‧分區
620‧‧‧寫碼單元/分區
622‧‧‧分區
624‧‧‧分區
626‧‧‧分區
630‧‧‧寫碼單元
632‧‧‧分區
634‧‧‧分區
636‧‧‧分區
640‧‧‧寫碼單元
642‧‧‧分區
644‧‧‧分區
646‧‧‧分區
650‧‧‧寫碼單元
710‧‧‧寫碼單元
720‧‧‧變換單元
800‧‧‧資訊
802‧‧‧分區
804‧‧‧分區
806‧‧‧分區
808‧‧‧分區
810‧‧‧資訊
812‧‧‧畫面內模式
814‧‧‧畫面間模式
816‧‧‧跳過模式
820‧‧‧資訊
822‧‧‧第一畫面內變換單元
824‧‧‧第二畫面內變換單元
826‧‧‧第一畫面間變換單元
828‧‧‧第二畫面內變換單元
900‧‧‧寫碼單元/最大寫碼單元
910‧‧‧預測單元
912‧‧‧分區類型/分區
914‧‧‧分區類型
916‧‧‧分區類型
918‧‧‧分區類型
920‧‧‧操作
930‧‧‧寫碼單元
940‧‧‧預測單元
942‧‧‧分區類型
944‧‧‧分區類型
946‧‧‧分區類型
948‧‧‧分區類型
950‧‧‧操作
960‧‧‧寫碼單元
970‧‧‧操作
980‧‧‧寫碼單元/最小寫碼單元
990‧‧‧預測單元
992‧‧‧分區類型
994‧‧‧分區類型
996‧‧‧分區類型
998‧‧‧分區類型
999‧‧‧資料單元
1010‧‧‧寫碼單元
1012‧‧‧寫碼單元
1014‧‧‧寫碼單元/編碼單元
1016‧‧‧寫碼單元/編碼單元
1018‧‧‧寫碼單元
1020‧‧‧寫碼單元
1022‧‧‧寫碼單元/編碼單元
1024‧‧‧寫碼單元
1026‧‧‧寫碼單元
1028‧‧‧寫碼單元
1030‧‧‧寫碼單元
1032‧‧‧寫碼單元/編碼單元
1040‧‧‧寫碼單元
1042‧‧‧寫碼單元
1044‧‧‧寫碼單元
1046‧‧‧寫碼單元
1048‧‧‧寫碼單元/編碼單元
1050‧‧‧寫碼單元/編碼單元
1052‧‧‧寫碼單元/編碼單元
1054‧‧‧寫碼單元/編碼單元
1060‧‧‧預測單元
1070‧‧‧變換單元
1300‧‧‧最大寫碼單元
1302‧‧‧寫碼單元
1304‧‧‧寫碼單元
1306‧‧‧寫碼單元
1312‧‧‧寫碼單元
1314‧‧‧寫碼單元
1316‧‧‧寫碼單元
1318‧‧‧寫碼單元
1322‧‧‧分區類型
1324‧‧‧分區類型
1326‧‧‧分區類型
1328‧‧‧分區類型
1332‧‧‧分區類型
1334‧‧‧分區類型
1336‧‧‧分區類型
1338‧‧‧分區類型
1342‧‧‧變換單元
1344‧‧‧變換單元
1352‧‧‧變換單元
1354‧‧‧變換單元
CU_0‧‧‧當前寫碼單元
CU_1‧‧‧寫碼單元
CU_(d-1)‧‧‧寫碼單元
藉由參看附圖詳細描述本發明之例示性實施例,本發明之以上及其他特徵與優點將變得更加顯而易見,其中: 圖1為根據本發明之實施例之視訊編碼裝置的方塊圖。 圖2為圖1中所示之語法元素寫碼單元的方塊圖。 圖3為說明根據本發明之實施例的算術編碼及解碼每一區塊中之變換係數資訊之處理程序的流程圖。 圖4為展示根據本發明之實施例的藉由劃分區塊以便對與變換係數相關之語法元素執行算術編碼所獲得之子集的圖式。 圖5為說明根據本發明之實施例的藉由將最後有效係數之位置分類為首碼位元串及尾碼位元串而算術編碼此位置的處理程序之參考圖。 圖6為說明根據本發明之實施例的以算術方式編碼最後有效係數之位置資訊的處理程序之圖式。 圖7為說明使用對圖2中所示之規則寫碼單元所執行之全文模型的算術編碼處理程序之圖式。 圖8為說明根據本發明之實施例的用於編碼視訊之算術編碼方法的流程圖。 圖9A為展示根據本發明之實施例之視訊編碼裝置的方塊圖。 圖9B為展示包含於圖9A之語法元素解碼單元中之算術解碼裝置的方塊圖。 圖10為說明根據本發明之實施例的用於解碼視訊之算術解碼方法的流程圖。 圖11為根據本發明之實施例之視訊編碼裝置的方塊圖。 圖12為根據本發明之實施例之視訊解碼裝置的方塊圖。 圖13為展示根據本發明之實施例的寫碼單元之概念的圖式。 圖14為根據本發明之實施例的基於階層式寫碼單元之視訊編碼裝置的方塊圖。 圖15為根據本發明之實施例的基於階層式寫碼單元之視訊解碼裝置的方塊圖。 圖16為說明根據本發明之實施例的根據深度之寫碼單元及分區的圖式。 圖17為用於描述根據本發明之實施例的在寫碼單元與變換單元之間的關係的圖式。 圖18為用於描述根據本發明之實施例的對應於經寫碼深度之寫碼單元之編碼資訊的圖式。 圖19為根據本發明之實施例的根據深度之寫碼單元的圖式。 圖20至圖22為用於描述根據本發明之實施例的在寫碼單元、預測單元與頻率變換單元之間的關係的圖式。 圖23為用於描述根據表1之編碼模式資訊的在寫碼單元、預測單元與變換單元之間的關係的圖式。
81~84‧‧‧步驟
Claims (1)
- 一種用於解碼視訊的裝置,所述裝置包括語法元素解碼器,所述語法元素解碼器經組態以: 執行全文式算術解碼位元串流以獲得在變換區塊中的最後有效係數的x座標首碼位元串; 執行所述全文式算術解碼所述位元串流以獲得所述最後有效係數的y座標首碼位元串; 執行旁通模式解碼所述位元串流以獲得所述最後有效係數的x座標尾碼位元串; 執行所述旁通模式解碼所述位元串流以獲得所述最後有效係數的y座標尾碼位元串; 根據截斷一元二元化方法對所述x座標首碼位元串以及所述y座標首碼位元串執行逆二元化以獲得經逆二元化的x座標首碼及經逆二元化的y座標首碼; 根據固定長度二元化方法對所述x座標尾碼位元串以及所述y座標尾碼位元串執行逆二元化以獲得經逆二元化的x座標尾碼及經逆二元化的y座標尾碼; 基於所述經逆二元化的x座標首碼以及所述經逆二元化的x座標尾碼重新建構所述最後有效係數的x座標; 基於所述經逆二元化的y座標首碼以及所述經逆二元化的y座標尾碼重新建構所述最後有效係數的y座標; 基於所述最後有效係數的所述x座標以及所述y座標獲得具有預定大小之子集的有效地圖,所述有效地圖依所述子集的逆轉索引次序分割所述變換區塊而得; 基於所述有效地圖重新建構在所述變換區塊中的變換係數, 其中,在通過所述全文式算術解碼獲得所述x座標首碼位元串以及所述y座標首碼位元串之後,通過所述旁通模式解碼獲得所述x座標尾碼位元串以及所述y座標尾碼位元串。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161557103P | 2011-11-08 | 2011-11-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201644276A TW201644276A (zh) | 2016-12-16 |
TWI590649B true TWI590649B (zh) | 2017-07-01 |
Family
ID=48290289
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106116416A TWI613907B (zh) | 2011-11-08 | 2012-11-08 | 用於解碼視訊的方法 |
TW106144673A TWI653876B (zh) | 2011-11-08 | 2012-11-08 | 用於解碼視訊的裝置、用於編碼視訊的方法及裝置、以及非暫態電腦可讀記錄媒體 |
TW105129896A TWI590649B (zh) | 2011-11-08 | 2012-11-08 | 視訊之算術解碼裝置 |
TW101141661A TWI556632B (zh) | 2011-11-08 | 2012-11-08 | 視訊之算術編碼方法及其裝置、以及視訊之算術解碼方法及其裝置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106116416A TWI613907B (zh) | 2011-11-08 | 2012-11-08 | 用於解碼視訊的方法 |
TW106144673A TWI653876B (zh) | 2011-11-08 | 2012-11-08 | 用於解碼視訊的裝置、用於編碼視訊的方法及裝置、以及非暫態電腦可讀記錄媒體 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101141661A TWI556632B (zh) | 2011-11-08 | 2012-11-08 | 視訊之算術編碼方法及其裝置、以及視訊之算術解碼方法及其裝置 |
Country Status (7)
Country | Link |
---|---|
US (6) | US9888261B2 (zh) |
EP (1) | EP2779643A4 (zh) |
JP (1) | JP2014533058A (zh) |
KR (6) | KR20130050904A (zh) |
CN (6) | CN104041053A (zh) |
TW (4) | TWI613907B (zh) |
WO (1) | WO2013069991A1 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9357185B2 (en) | 2011-11-08 | 2016-05-31 | Qualcomm Incorporated | Context optimization for last significant coefficient position coding |
US9154792B2 (en) * | 2011-11-08 | 2015-10-06 | Qualcomm Incorporated | Progressive coding of position of last significant coefficient |
WO2013106987A1 (en) * | 2012-01-16 | 2013-07-25 | Mediatek Singapore Pte. Ltd. | Methods and apparatuses of bypass coding and reducing contexts for some syntax elements |
DK3416292T3 (da) | 2012-04-15 | 2020-03-09 | Samsung Electronics Co Ltd | Videoafkodningsapparat ved anvendelse af parameteropdatering til de-binærisering af en entropikodet transformationskoefficient og indkodnings-fremgangsmåde anvendende det samme til binærisering |
FR3018148B1 (fr) * | 2014-02-28 | 2017-08-25 | Allegro Dvt | Generateur de flux video |
KR101910376B1 (ko) | 2014-06-29 | 2019-01-04 | 엘지전자 주식회사 | 연결된 rom-ram 테이블에 기초하여 산술 코딩을 수행하는 방법 및 장치 |
KR102333000B1 (ko) * | 2015-01-15 | 2021-12-01 | 한국전자통신연구원 | 고속 변환 계수 부호화 방법 및 장치 |
WO2016119726A1 (en) | 2015-01-30 | 2016-08-04 | Mediatek Inc. | Method and apparatus for entropy coding of source samples with large alphabet |
US10142635B2 (en) * | 2015-12-18 | 2018-11-27 | Blackberry Limited | Adaptive binarizer selection for image and video coding |
EP3270594A1 (en) * | 2016-07-15 | 2018-01-17 | Thomson Licensing | Method and apparatus for advanced cabac context adaptation for last coefficient coding |
US10630974B2 (en) * | 2017-05-30 | 2020-04-21 | Google Llc | Coding of intra-prediction modes |
KR102424514B1 (ko) * | 2017-12-04 | 2022-07-25 | 삼성전자주식회사 | 언어 처리 방법 및 장치 |
KR20230154085A (ko) * | 2018-12-17 | 2023-11-07 | 엘지전자 주식회사 | 고주파 제로잉을 기반으로 변환 계수 스캔 순서를 결정하는 방법 및 장치 |
WO2020141856A1 (ko) * | 2019-01-02 | 2020-07-09 | 엘지전자 주식회사 | 영상 코딩 시스템에서 레지듀얼 정보를 사용하는 영상 디코딩 방법 및 그 장치 |
US11477486B2 (en) * | 2019-01-02 | 2022-10-18 | Qualcomm Incorporated | Escape coding for coefficient levels |
CN117915090A (zh) | 2019-01-12 | 2024-04-19 | Oppo广东移动通信有限公司 | 在图像编译系统中使用残差信息的图像解码方法及其装置 |
KR20240018691A (ko) | 2019-01-14 | 2024-02-13 | 로즈데일 다이나믹스 엘엘씨 | 영상 코딩 시스템에서 레지듀얼 정보를 사용하는 영상 디코딩 방법 및 그 장치 |
WO2020149594A1 (ko) * | 2019-01-15 | 2020-07-23 | 엘지전자 주식회사 | 영상 코딩 시스템에서 고주파 제로잉을 기반으로 레지듀얼 정보를 코딩하는 영상 디코딩 방법 및 그 장치 |
JP7285857B2 (ja) * | 2019-01-16 | 2023-06-02 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | リマインダをもつ均一なタイルスプリットを含むビデオコーディング |
AU2020234409B2 (en) * | 2019-03-12 | 2023-11-02 | Lg Electronics Inc. | Transform-based image coding method and device therefor |
US10541711B1 (en) * | 2019-03-29 | 2020-01-21 | Mitsubishi Electric Research Laboratories, Inc. | Short block length distribution matching algorithm |
US10939114B2 (en) * | 2019-05-15 | 2021-03-02 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
CN112565760B (zh) * | 2020-12-06 | 2022-07-15 | 浙江大华技术股份有限公司 | 串编码技术的编码方法、设备及存储介质 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3807342B2 (ja) | 2002-04-25 | 2006-08-09 | 三菱電機株式会社 | デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法 |
PT1467491E (pt) * | 2002-05-02 | 2007-03-30 | Fraunhofer Ges Forschung | Codificação aritmética de coeficientes de transformação |
US6927710B2 (en) * | 2002-10-30 | 2005-08-09 | Lsi Logic Corporation | Context based adaptive binary arithmetic CODEC architecture for high quality video compression and decompression |
US7472151B2 (en) * | 2003-06-20 | 2008-12-30 | Broadcom Corporation | System and method for accelerating arithmetic decoding of video data |
US6917310B2 (en) | 2003-06-25 | 2005-07-12 | Lsi Logic Corporation | Video decoder and encoder transcoder to and from re-orderable format |
US6900748B2 (en) * | 2003-07-17 | 2005-05-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for binarization and arithmetic coding of a data value |
US7379608B2 (en) * | 2003-12-04 | 2008-05-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Arithmetic coding for transforming video and picture data units |
US7599435B2 (en) * | 2004-01-30 | 2009-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Video frame encoding and decoding |
EP1599049A3 (en) | 2004-05-21 | 2008-04-02 | Broadcom Advanced Compression Group, LLC | Multistandard video decoder |
KR100624432B1 (ko) * | 2004-08-05 | 2006-09-19 | 삼성전자주식회사 | 내용 기반 적응적 이진 산술 복호화 방법 및 장치 |
KR20060038189A (ko) * | 2004-10-29 | 2006-05-03 | 삼성전자주식회사 | 컨텍스트 기반 적응형 이진 산술 복부호화 방법 및 장치 |
US20060126744A1 (en) * | 2004-12-10 | 2006-06-15 | Liang Peng | Two pass architecture for H.264 CABAC decoding process |
CN100466739C (zh) * | 2005-10-12 | 2009-03-04 | 华为技术有限公司 | Cabac解码系统及方法 |
FR2900004A1 (fr) * | 2006-04-18 | 2007-10-19 | Thomson Licensing Sas | Procede et dispositif de decodage arithmetique |
CN101087411A (zh) | 2006-06-08 | 2007-12-12 | 威盛电子股份有限公司 | 译码方法 |
JP5649105B2 (ja) * | 2007-01-11 | 2015-01-07 | トムソン ライセンシングThomson Licensing | 符号化のための装置及び方法並びに復号化のための装置及び方法 |
KR101341111B1 (ko) * | 2007-01-18 | 2013-12-13 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 화질 스케일러블 비디오 데이터 스트림 |
KR101356733B1 (ko) * | 2007-03-07 | 2014-02-05 | 삼성전자주식회사 | 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치 |
KR101539240B1 (ko) | 2007-06-14 | 2015-07-30 | 삼성전자주식회사 | 영상 데이터의 엔트로피 부호화, 복호화 방법 및 장치 |
US7839311B2 (en) * | 2007-08-31 | 2010-11-23 | Qualcomm Incorporated | Architecture for multi-stage decoding of a CABAC bitstream |
US7777654B2 (en) * | 2007-10-16 | 2010-08-17 | Industrial Technology Research Institute | System and method for context-based adaptive binary arithematic encoding and decoding |
US8582652B2 (en) * | 2007-10-30 | 2013-11-12 | General Instrument Corporation | Method and apparatus for selecting a coding mode |
US20100040136A1 (en) * | 2008-08-13 | 2010-02-18 | Horizon Semiconductors Ltd. | Method for performing binarization using a lookup table |
JP2010278668A (ja) * | 2009-05-27 | 2010-12-09 | Sony Corp | 符号化装置及び符号化方法、並びに復号装置及び復号方法 |
KR101063426B1 (ko) * | 2009-08-26 | 2011-09-07 | 주식회사 코아로직 | 이진 산술 복호화 방법 및 장치 |
US7961122B1 (en) * | 2010-02-03 | 2011-06-14 | Himax Media Solutions, Inc. | Multi-bin CABAC bypass bin decoder |
WO2011127403A1 (en) | 2010-04-09 | 2011-10-13 | Ntt Docomo, Inc. | Adaptive binarization for arithmetic coding |
US20110310976A1 (en) * | 2010-06-17 | 2011-12-22 | Qualcomm Incorporated | Joint Coding of Partition Information in Video Coding |
JP5707412B2 (ja) * | 2010-09-29 | 2015-04-30 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、プログラムおよび集積回路 |
US20120114034A1 (en) * | 2010-11-08 | 2012-05-10 | Mediatek Inc. | Method and Apparatus of Delta Quantization Parameter Processing for High Efficiency Video Coding |
CN102231830B (zh) * | 2010-11-23 | 2013-04-17 | 浙江大学 | 用于上下文算术编解码的运算单元 |
US9042440B2 (en) * | 2010-12-03 | 2015-05-26 | Qualcomm Incorporated | Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding |
US9532066B2 (en) * | 2011-01-21 | 2016-12-27 | Qualcomm Incorporated | Motion vector prediction |
US9848197B2 (en) * | 2011-03-10 | 2017-12-19 | Qualcomm Incorporated | Transforms in video coding |
US10123053B2 (en) * | 2011-05-23 | 2018-11-06 | Texas Instruments Incorporated | Acceleration of bypass binary symbol processing in video coding |
US9379736B2 (en) * | 2011-06-03 | 2016-06-28 | Qualcomm Incorporated | Context-adaptive coding video data |
US8804816B2 (en) * | 2011-08-30 | 2014-08-12 | Microsoft Corporation | Video encoding enhancements |
EP2779648A4 (en) * | 2011-11-07 | 2016-06-01 | Panasonic Ip Corp America | PICTURE CODING METHOD, PICTURE DECODING METHOD, PICTURE CODING DEVICE, PICTURE DECODING DEVICE, AND PICTURE CODING / DECODING DEVICE |
US9154792B2 (en) * | 2011-11-08 | 2015-10-06 | Qualcomm Incorporated | Progressive coding of position of last significant coefficient |
US9357185B2 (en) * | 2011-11-08 | 2016-05-31 | Qualcomm Incorporated | Context optimization for last significant coefficient position coding |
US9288508B2 (en) * | 2011-11-08 | 2016-03-15 | Qualcomm Incorporated | Context reduction for context adaptive binary arithmetic coding |
WO2013070974A2 (en) * | 2011-11-08 | 2013-05-16 | General Instrument Corporation | Method of determining binary codewords for transform coefficients |
US9237344B2 (en) * | 2012-03-22 | 2016-01-12 | Qualcomm Incorporated | Deriving context for last position coding for video coding |
US9621921B2 (en) * | 2012-04-16 | 2017-04-11 | Qualcomm Incorporated | Coefficient groups and coefficient coding for coefficient scans |
-
2012
- 2012-11-08 KR KR1020120126171A patent/KR20130050904A/ko active Search and Examination
- 2012-11-08 EP EP12848182.7A patent/EP2779643A4/en not_active Ceased
- 2012-11-08 TW TW106116416A patent/TWI613907B/zh active
- 2012-11-08 TW TW106144673A patent/TWI653876B/zh active
- 2012-11-08 CN CN201280066398.8A patent/CN104041053A/zh active Pending
- 2012-11-08 JP JP2014540947A patent/JP2014533058A/ja active Pending
- 2012-11-08 CN CN201810297173.2A patent/CN108377392A/zh not_active Withdrawn
- 2012-11-08 CN CN201810296846.2A patent/CN108391128A/zh not_active Withdrawn
- 2012-11-08 TW TW105129896A patent/TWI590649B/zh active
- 2012-11-08 WO PCT/KR2012/009412 patent/WO2013069991A1/ko active Application Filing
- 2012-11-08 CN CN201810311117.XA patent/CN108235015A/zh not_active Withdrawn
- 2012-11-08 US US14/357,048 patent/US9888261B2/en active Active
- 2012-11-08 CN CN201810296835.4A patent/CN108513129A/zh not_active Withdrawn
- 2012-11-08 CN CN201810297727.9A patent/CN108471535A/zh not_active Withdrawn
- 2012-11-08 TW TW101141661A patent/TWI556632B/zh active
-
2015
- 2015-03-02 US US14/635,545 patent/US9438933B2/en active Active
- 2015-03-03 US US14/636,571 patent/US9888263B2/en active Active
- 2015-03-03 US US14/636,653 patent/US9888264B2/en active Active
- 2015-03-03 US US14/636,481 patent/US9888262B2/en active Active
- 2015-03-23 KR KR20150040051A patent/KR20150039722A/ko active Search and Examination
- 2015-03-23 KR KR20150040053A patent/KR20150039724A/ko active Search and Examination
- 2015-03-23 KR KR20150040054A patent/KR20150046771A/ko not_active Application Discontinuation
- 2015-03-23 KR KR20150040050A patent/KR20150039721A/ko active Search and Examination
- 2015-03-23 KR KR20150040052A patent/KR20150039723A/ko active Search and Examination
-
2017
- 2017-12-26 US US15/854,062 patent/US20180124433A1/en not_active Abandoned
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI590649B (zh) | 視訊之算術解碼裝置 | |
TWI597975B (zh) | 視訊解碼裝置 | |
TWI555377B (zh) | 熵編碼視訊的方法與裝置、以及熵解碼視訊的方法與裝置 | |
US9521430B2 (en) | Method and apparatus for determining a context model for transform coefficient level entropy encoding and decoding | |
TWI601412B (zh) | 對視訊進行解碼的裝置 |