TW201404161A - 在視訊寫碼中分組經旁路寫碼語法元素 - Google Patents

在視訊寫碼中分組經旁路寫碼語法元素 Download PDF

Info

Publication number
TW201404161A
TW201404161A TW102112894A TW102112894A TW201404161A TW 201404161 A TW201404161 A TW 201404161A TW 102112894 A TW102112894 A TW 102112894A TW 102112894 A TW102112894 A TW 102112894A TW 201404161 A TW201404161 A TW 201404161A
Authority
TW
Taiwan
Prior art keywords
group
syntax elements
syntax
intra
list
Prior art date
Application number
TW102112894A
Other languages
English (en)
Other versions
TWI481237B (zh
Inventor
Wei-Jung Chien
jian-le Chen
Muhammed Zeyd Coban
Marta Karczewicz
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201404161A publication Critical patent/TW201404161A/zh
Application granted granted Critical
Publication of TWI481237B publication Critical patent/TWI481237B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一視訊編碼器件經組態以產生語法元素之一第一群組。該第一群組中之每一語法元素指示一各別預測單元(PU)之一預測模式是否基於至最可能模式之一清單的一索引。產生語法元素之一第二群組,該等語法元素對應於該第一群組中之各別語法元素。該第二群組中之該等語法元素識別至最可能模式之該清單的一索引抑或一框內預測模式。語法元素之該第一群組經內容脈絡自適應性二進位算術寫碼(CABAC)編碼,且語法元素之該第二群組經旁路編碼。一視訊解碼器經組態以接收語法元素之該經熵編碼之第一群組及該經熵編碼之第二群組。該視訊解碼器CABAC解碼旗標之第一群組且旁路解碼旗標之第二群組。

Description

在視訊寫碼中分組經旁路寫碼語法元素 相關申請案
本申請案主張以下各者之權利:2012年4月11日申請之美國臨時申請案第61/623,004號;及2012年4月27日申請之美國臨時申請案第61/639,836號,該兩個申請案中之每一者的全部內容特此以全文引用之方式併入。
本發明係關於視訊寫碼,且更特定而言,係關於視訊寫碼中用於寫碼語法元素之技術。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型」電話、平板電腦、視訊電傳會議器件,及其類似者。視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264(亦稱為ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴充。另外,高效率視訊寫碼(HEVC)為由ITU-T視訊寫碼專家群(VCEG)及ISO/IEC動畫專家群(MPEG)之視 訊寫碼聯合合作小組(JCT-VC)開發的視訊寫碼標準。
視訊壓縮技術執行空間預測及/或時間預測以減少或移除視訊序列中所固有之冗餘。對於基於區塊之預測性視訊寫碼而言,可將視訊圖框或視訊圖框之切片分割為視訊區塊,該等視訊區塊可被稱作巨集區塊或寫碼單元。可進一步分割每一視訊區塊。經框內寫碼(I)圖框或切片中之視訊區塊係相對於相鄰視訊區塊使用空間預測來編碼。經框間寫碼(P或B)圖框或切片中之視訊區塊可相對於同一圖框或切片中之相鄰視訊區塊使用空間預測,或相對於其他參考圖框使用時間預測。
經框間寫碼區塊可使用運動向量來寫碼,該運動向量指示用以形成預測性區塊之參考樣本之群組。經框內寫碼區塊可使用框內模式來寫碼,該框內模式指向用以形成預測性區塊之參考樣本之區塊。視訊區塊與預測性區塊之間的差可被稱作殘餘資料。為進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而產生殘餘變換係數,可接著量化該等殘餘變換係數。另外,經量化變換係數及預測性資訊可經熵寫碼以供進一步壓縮。
一般而言,本發明描述用於配置語法元素以用於預測性視訊寫碼之各種技術。此等技術可減少可影響熵寫碼輸送量之管線額外耗用。在一個實例中,可最佳化語法元素經CABAC(內容脈絡自適應性二進位算術寫碼)寫碼抑或經旁路寫碼之次序。旁路寫碼可指代在不使用自適應性內容脈絡之情況下對二進位之算術寫碼。在一個實例中,可基於指示寫碼單元(CU)內之預測性單元(PU)之框內預測模式的語法元素待經旁路寫碼抑或經CABAC寫碼而將該等語法元素分組在一起。此分組可減少熵寫碼語法元素所需之循環的總數。
在一個實例中,本發明描述一種用於解碼視訊資料之方法,該方法包含:接收一經熵編碼位元串流,該經熵編碼位元串流包括一寫 碼單元(CU)之預測單元(PU)的語法元素之一第一群組及語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素,且其中語法元素之該第一群組的一語法元素指示該CU中之一各別PU的一框內預測模式是否基於至最可能模式之一清單的一索引;內容脈絡自適應性二進位算術寫碼(CABAC)解碼語法元素之該第一群組;在CABAC解碼語法元素之該第一群組之後,旁路解碼語法元素之該第二群組;及基於語法元素之該經解碼之第一群組及語法元素之該經解碼之第二群組重建構該視訊資料。
在另一實例中,本發明描述一種用於解碼視訊資料之裝置,該裝置包含經組態以執行以下操作之一視訊解碼器:接收一經熵編碼位元串流,該經熵編碼位元串流包括一寫碼單元(CU)之預測單元(PU)的語法元素之一第一群組及語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素,且其中語法元素之該第一群組的一語法元素指示該CU中之一各別PU的一框內預測模式是否基於至最可能模式之一清單的一索引;內容脈絡自適應性二進位算術寫碼(CABAC)解碼語法元素之該第一群組;在CABAC解碼語法元素之該第一群組之後,旁路解碼語法元素之該第二群組;及基於語法元素之該經解碼之第一群組及語法元素之該經解碼之第二群組重建構該視訊資料。
在另一實例中,本發明描述一種電腦可讀儲存媒體,該電腦可讀儲存媒體具有儲存於其上之指令,該等指令在執行時使用於解碼視訊資料之一器件的一或多個處理器執行以下操作:接收一經熵編碼位元串流,該經熵編碼位元串流包括一寫碼單元(CU)之預測單元(PU)的語法元素之一第一群組及語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素,且其中語法元素之該第一群組的一語法元素指示該CU中之一各別PU 的一框內預測模式是否基於至最可能模式之一清單的一索引;內容脈絡自適應性二進位算術寫碼(CABAC)解碼語法元素之該第一群組;在CABAC解碼語法元素之該第一群組之後,旁路解碼語法元素之該第二群組;及基於語法元素之該經解碼之第一群組及語法元素之該經解碼之第二群組重建構該視訊資料。
在另一實例中,本發明描述一種用於解碼視訊資料之裝置,該裝置包含:用於接收一經熵編碼位元串流的構件,該經熵編碼位元串流包括一寫碼單元(CU)之預測單元(PU)的語法元素之一第一群組及語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素,且其中語法元素之該第一群組的一語法元素指示該CU中之一各別PU的一框內預測模式是否基於至最可能模式之一清單的一索引;用於內容脈絡自適應性二進位算術寫碼(CABAC)解碼語法元素之該第一群組的構件;用於在CABAC解碼語法元素之該第一群組之後旁路解碼語法元素之該第二群組的構件;及用於基於語法元素之該經解碼之第一群組及語法元素之該經解碼之第二群組重建構該視訊資料的構件。
在另一實例中,本發明描述一種用於編碼視訊資料之方法,該方法包含:產生語法元素之一第一群組,其中語法元素之該第一群組的一語法元素指示一寫碼單元(CU)中之一各別預測單元(PU)的一框內預測模式是否基於至最可能模式之一清單的一索引;產生語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素;內容脈絡自適應性二進位算術寫碼(CABAC)編碼語法元素之該第一群組;在CABAC編碼語法元素之該第一群組之後,旁路編碼語法元素之該第二群組;及輸出包括語法元素之該經編碼之第一群組及語法元素之該經編碼之第二群組的該視訊資料。
在另一實例中,本發明描述一種用於編碼視訊資料之裝置,該裝置包含經組態以執行以下操作之一視訊編碼器:產生語法元素之一第一群組,其中語法元素之該第一群組的一語法元素指示一寫碼單元(CU)中之一各別預測單元(PU)的一框內預測模式是否基於至最可能模式之一清單的一索引;產生語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素;內容脈絡自適應性二進位算術寫碼(CABAC)編碼語法元素之該第一群組;在CABAC編碼語法元素之該第一群組之後,旁路編碼語法元素之該第二群組;及輸出包括語法元素之該經編碼之第一群組及語法元素之該經編碼之第二群組的該視訊資料。
在另一實例中,本發明描述一種電腦可讀儲存媒體,該電腦可讀儲存媒體具有儲存於其上之指令,該等指令在執行時使用於編碼視訊資料之一器件的一或多個處理器執行以下操作:產生語法元素之一第一群組,其中語法元素之該第一群組的一語法元素指示一寫碼單元(CU)中之一各別預測單元(PU)的一框內預測模式是否基於至最可能模式之一清單的一索引;產生語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素;內容脈絡自適應性二進位算術寫碼(CABAC)編碼語法元素之該第一群組;在CABAC編碼語法元素之該第一群組之後,旁路編碼語法元素之該第二群組;及輸出包括語法元素之該經編碼之第一群組及語法元素之該經編碼之第二群組的該視訊資料。
在另一實例中,本發明描述一種用於編碼視訊資料之裝置,該裝置包含:用於產生語法元素之一第一群組的構件,其中語法元素之該第一群組的一語法元素指示一寫碼單元(CU)中之一各別預測單元(PU)的一框內預測模式是否基於至最可能模式之一清單的一索引;用於產生語法元素之一第二群組的構件,其中語法元素之該第二群組的 語法元素對應於語法元素之該第一群組的各別語法元素;用於內容脈絡自適應性二進位算術寫碼(CABAC)編碼語法元素之該第一群組的構件;用於在CABAC編碼語法元素之該第一群組之後旁路編碼語法元素之該第二群組的構件;及用於輸出包括語法元素之該經編碼之第一群組及語法元素之該經編碼之第二群組之該視訊資料的構件。
一或多個實例之細節陳述於隨附圖式及以下描述中。其他特徵、目標及優點將自該描述及圖式以及自申請專利範圍顯而易見。
10‧‧‧視訊編碼及解碼系統
12‧‧‧源器件/視訊器件
14‧‧‧目的地器件/視訊器件
16‧‧‧通信頻道
18‧‧‧外部視訊源
20‧‧‧視訊編碼器
22‧‧‧調變器/解調變器(數據機)
24‧‧‧傳輸器
26‧‧‧接收器
28‧‧‧數據機
30‧‧‧視訊解碼器
32‧‧‧顯示器件
40‧‧‧模式選擇單元
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測單元
48‧‧‧分割單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化處理單元
56‧‧‧熵編碼單元
58‧‧‧反量化處理單元
60‧‧‧反變換處理單元
62‧‧‧求和器
64‧‧‧參考圖框記憶體
70‧‧‧熵解碼單元
72‧‧‧運動補償單元
74‧‧‧框內預測單元
76‧‧‧反量化處理單元
78‧‧‧反變換處理單元
80‧‧‧求和器
82‧‧‧參考圖框記憶體
502‧‧‧二進位化單元
504‧‧‧旁路編碼引擎
506‧‧‧內容脈絡模型化單元
508‧‧‧規則編碼引擎
510‧‧‧算術編碼單元
702‧‧‧算術解碼單元
704‧‧‧旁路解碼引擎
706‧‧‧規則寫碼引擎/規則CABAC解碼引擎
708‧‧‧內容脈絡模型化單元
710‧‧‧反二進位化單元
圖1為說明預測單元結構及相關聯之框內預測寫碼模式之實例的概念圖。
圖2為說明可經組態以利用根據本發明之技術之實例視訊編碼及解碼系統的方塊圖。
圖3為說明根據本發明之可實施用於寫碼預測性語法元素之技術的視訊編碼器之實例的方塊圖。
圖4為說明根據本發明之可實施用於熵編碼預測性語法元素之技術的熵編碼器之實例的方塊圖。
圖5為說明根據本發明之技術編碼預測性語法元素的流程圖。
圖6為說明根據本發明之可實施用於解碼包括預測性語法元素的經編碼視訊序列之技術的視訊解碼器之實例的方塊圖。
圖7為說明根據本發明之可實施用於熵解碼預測性語法元素之技術的熵解碼器之實例的方塊圖。
圖8為說明根據本發明之技術解碼預測性語法元素的流程圖。
語法元素之群組內的預測性語法元素(諸如,可指示一或多個預測單元之框內預測模式的語法元素)可經規則內容脈絡自適應性二進位算術寫碼(CABAC)寫碼抑或經旁路寫碼。此等預測性語法元素由 CABAC寫碼器接收之次序可影響熵寫碼語法元素之群組所需之處理循環的總數。此情形可能歸因於在寫碼旁路寫碼與CABAC寫碼之間的轉變時重新啟動CABAC寫碼引擎所需之設置額外耗用。在本發明中所描述之技術中,此等語法元素可以使得熵寫碼語法元素之群組所需之處理循環的總數得以減少的方式來配置。
舉例而言,在一些其他技術中,對於框內預測而言,視訊編碼器用信號發送指定明度樣本之框內預測模式的語法元素且用信號發送色度樣本之語法元素。明度樣本之語法元素中的一些及色度樣本之語法元素中的一些經CABAC寫碼,且明度樣本及色度樣本之其他語法元素經旁路寫碼。在一些狀況下,經CABAC寫碼及經旁路寫碼之語法元素交錯,從而因為管線額外耗用而導致次最佳熵寫碼輸送量。
舉例而言,旁路模式通常具有遠高於CABAC模式之輸送量。作為一個實例,旁路模式可在一個循環中處理6個二進位,相比每循環處理1個二進位之旁路模式不會添加顯著複雜性,而CABAC模式每循環可僅處理2個二進位,其設計比每循環處理1個二進位之CABAC模式複雜得多。此係歸因於CABAC模式中內容脈絡切換之性質。
為了增加熵寫碼輸送量,將經CABAC寫碼之語法元素分組在一起且將經旁路寫碼之語法元素分組在一起可為有益的。作為一個實例,經CABAC寫碼之語法元素及經旁路寫碼之語法元素不交錯在一起。如更詳細描述,本發明中所描述之技術提供將經CABAC寫碼之語法元素分組在一起且將經旁路寫碼之語法元素分組在一起之各種實例技術,此分組具有增加熵寫碼輸送量之可能性。
作為一個實例,視訊編碼器在經寫碼位元串流中將明度框內模式及色度框內模式之所有經CABAC寫碼之二進位一起以及將明度框內模式及色度框內模式之所有經旁路寫碼之二進位一起編碼及用信號發送,且視訊解碼器自該經寫碼位元串流將明度框內模式及色度框內 模式之所有經CABAC寫碼之二進位一起以及將明度框內模式及色度框內模式之所有經旁路寫碼之二進位一起接收及解碼。作為另一實例,視訊編碼器在經寫碼位元串流中將寫碼單元中之所有區塊之框內模式的所有經CABAC寫碼之二進位以及框內模式之所有經旁路寫碼之二進位一起編碼及用信號發送,且視訊解碼器自該經寫碼位元串流將寫碼單元中之所有區塊之框內模式的所有經CABAC寫碼之二進位以及框內模式之所有經旁路寫碼之二進位一起接收及解碼。作為另一實例,視訊編碼器在經寫碼位元串流中將寫碼單元中之所有區塊的明度框內模式及色度框內模式兩者之所有經CABAC寫碼之二進位以及明度框內模式及色度框內模式之所有經旁路寫碼之二進位一起編碼及用信號發送,且視訊解碼器自該經寫碼位元串流將寫碼單元中之所有區塊的明度框內模式及色度框內模式兩者之所有經CABAC寫碼之二進位以及明度框內模式及色度框內模式之所有經旁路寫碼之二進位一起接收及解碼。在一些狀況下,將需要一些額外記憶體來為視訊解碼器儲存部分經解碼語法。
數位視訊器件實施視訊壓縮技術以更有效率地編碼及解碼數位視訊資訊。可根據視訊寫碼標準來定義視訊壓縮技術。HEVC標準化努力係基於被稱作HEVC測試模型(HM)之視訊寫碼器件之模型。HM假設當前視訊寫碼器件相對於在其他先前視訊寫碼標準(例如,ITU-T H.264/AVC)之開發期間可用的視訊寫碼器件具有能力改良。舉例而言,H.264提供九個框內預測編碼模式,而HEVC提供多達三十五個框內預測編碼模式。HEVC之被稱作「HEVC工作草案6」或「WD6」的新近工作草案(WD)描述於文件Bross等人之JCTVC-H1003(「WD6:Working Draft 6 of High-Efficiency Video Coding(HEVC)」,ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合合作小組(JCT-VC),第八次會議:San Jose(California,USA),2011年2月)中。
另外,HEVC之另一新近工作草案(工作草案8)描述於文件Bross等人之HCTVC-J1003_d7(「High Efficiency Video Coding(HEVC)Text Specification Draft 8」,ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合合作小組(JCT-VC),第10次會議:Stockholm,SE,2012年7月)中。HEVC之更新近工作草案(工作草案9)自2013年3月6日起可自http://phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K1003-v10.zip.獲得。該HEVC標準亦可被稱作ISO/IEC 23008-HEVC,其意欲為HEVC之交付版本之標準編號。儘管本發明之技術係關於ITU-T H.264標準及HEVC標準進行描述,但本發明之技術大體上適用於任何視訊寫碼標準。
視訊序列通常包括一系列視訊圖框(亦稱作圖像)。圖像群組(GOP)大體上包含一系列一或多個視訊圖框。GOP可在GOP之標頭、GOP之一或多個圖框之標頭中或在別處包括語法資料,該語法資料描述包括於GOP中之數個圖框。每一圖框可包括描述各別圖框之編碼模式的圖框語法資料。每一視訊圖框可包括複數個切片。每一切片可包括複數個視訊區塊。視訊編碼器通常對個別視訊圖框內之視訊區塊操作,以便編碼視訊資料。視訊區塊可具有固定或變化之大小,且可根據指定寫碼標準而在大小方面不同。
作為一實例,ITU-T H.264標準支援各種區塊大小(諸如,針對明度分量之16×16、8×8或4×4,及針對色度分量之8×8)之框內預測,以及各種區塊大小(諸如,針對明度分量之16×16、16×8、8×16、8×8、8×4、4×8及4×4,及針對色度分量之對應按比例調整大小)之框間預測。在本發明中,「N×N」與「N乘N」可互換地用以指代在垂直尺寸及水平尺寸上區塊之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16區塊將在垂直方向上具有16個像素(y=16)且在水平方 向上具有16個像素(x=16)。像素亦可被稱作樣本。同樣地,N×N區塊大體上在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數值。可按列及行來配置區塊中之像素。此外,區塊未必需要在水平方向上與垂直方向上具有相同數目個像素。舉例而言,區塊可包含N×M個像素,其中M未必等於N。
視訊區塊可包含在像素域中之像素資料的區塊,或在變換域中之變換係數的區塊。變換係數可在將變換應用於表示經寫碼視訊區塊與預測性視訊區塊之間的像素差的殘餘視訊區塊資料之後產生,該變換諸如離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換。在一些狀況下,視訊區塊可包含在變換域中之經量化變換係數之區塊。
較小視訊區塊可提供較好解析度,且可用於包括高精細等級之視訊圖框的位置。一般而言,可將區塊及各種分割區(有時稱作子區塊)視為視訊區塊。另外,可將切片視為複數個視訊區塊,諸如區塊及/或子區塊。每一切片可為視訊圖框之可獨立解碼單元。或者,圖框自身可為可解碼單元,或圖框之其他部分可定義為可解碼單元。術語「經寫碼單元」可指代視訊圖框之任何獨立可解碼單元,諸如整個圖框、圖框之切片、亦稱作序列之圖像群組(GOP),或根據適用寫碼技術而定義之另一獨立可解碼單元。
在進行框內預測性或框間預測性寫碼以產生預測性資料及殘餘資料之後,且在進行任何變換(諸如,在H.264/AVC中使用之4×4或8×8整數變換,或離散餘弦變換DCT)以產生變換係數之後,可執行變換係數之量化。量化大體上指代將變換係數量化以可能地減少用以表示該等係數之資料之量的程序。該量化程序可減小與該等係數中之一些或全部相關聯的位元深度。舉例而言,可在量化期間將n位元值降值捨位至m位元值,其中n大於m
在量化之後,可(例如)根據內容自適應性可變長度寫碼(CAVLC)、內容脈絡自適應性二進位算術寫碼(CABAC)、機率區間分割熵寫碼(PIPE)或另一熵寫碼方法來執行經量化資料之熵寫碼。亦可執行語法元素(諸如,定義預測模式之語法元素)之熵寫碼。經組態以用於熵寫碼之處理單元或另一處理單元可執行其他處理功能,諸如經量化係數之零延行長度寫碼,及/或語法資訊(諸如,經寫碼區塊型樣(CBP)值、巨集區塊類型、寫碼模式、經寫碼單元(諸如,圖框、切片、巨集區塊或序列)之最大巨集區塊大小,或其類似者)之產生。
HEVC將視訊資料之區塊稱作寫碼單元(CU)。一般而言,本發明之技術與變換、量化、掃描及熵編碼CU之資料有關。CU可包括一或多個預測單元(PU)及/或一或多個變換單元(TU)。PU亦可被稱作「預測分割區」。位元串流內之語法資料可定義最大寫碼單元(LCU),其為根據像素之數目而言的最大寫碼單元。一般而言,LCU具有類似於H.264之巨集區塊之目的。然而,LCU未必限於特定大小且可包括一或多個CU。LCU通常包括64×64個像素。LCU內之CU通常包括32×32、16×16或8×8個像素。因此,LCU可分裂為子CU,且每一子CU可進一步分裂為子CU。CU中之每一像素可包括明度(Y)分量、色度U(U)分量及色度V(V)分量。在一些實例中,色度分量可被稱作Cr及Cb分量。一般而言,本發明中對CU之參考可指代圖像之最大寫碼單元(LCU)或LCU之子CU。用於位元串流之語法資料可定義可分裂LCU之最大次數,該最大次數被稱作CU深度。因此,語法資料亦可定義最小寫碼單元(SCU)。本發明亦使用術語「區塊」來指代CU、PU或TU中之任一者。
LCU可與四分樹資料結構相關聯。一般而言,四分樹資料結構針對每一CU包括一個節點,其中根節點對應於LCU。若將CU分裂成四個子CU,則對應於該CU之節點包括四個葉節點,該四個葉節點中之 每一者對應於該等子CU中之一者。該四分樹資料結構之每一節點可提供用於對應CU之語法資料。舉例而言,四分樹中之節點可包括分裂旗標,從而指示是否將對應於該節點之CU分裂成子CU。可遞回地定義CU之語法元素,且CU之語法元素可取決於CU是否分裂成子CU。若CU未進一步分裂,則其被稱作葉CU。在本發明中,儘管不存在原始葉CU之顯式分裂,但葉CU之四個子CU亦將被稱作葉CU。舉例而言,若16×16大小之CU不進一步分裂,則儘管該16×16 CU從未分裂,但四個8×8子CU亦將被稱作葉CU。
此外,葉CU之TU亦可與各別四分樹資料結構相關聯。亦即,葉CU可包括指示如何將葉CU分割成TU之四分樹。本發明將指示LCU如何分割之四分樹稱作CU四分樹,且將指示葉CU如何分割成TU之四分樹稱作TU四分樹。TU四分樹之根節點大體上對應於葉CU,而CU四分樹之根節點大體上對應於LCU。未分裂之TU四分樹之TU被稱作葉TU。
葉CU可包括一或多個預測單元(PU)。一般而言,PU表示對應CU之全部或一部分,且可包括用於擷取PU之參考樣本的資料。舉例而言,當PU經框間模式編碼時,PU可包括定義PU之運動向量的資料。定義運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、針對運動向量識別參考圖像清單(例如,清單0或清單1)之預測方向,及/或指示運動向量所指向之參考圖像清單內之參考圖框的參考圖像索引值。以類似方式,當CU係以框內預測模式寫碼時,PU可包括定義框內預測模式(例如,角預測、DC預測或平面預測……等)之資料。
用於定義PU之葉CU的資料亦可描述(例如)CU至一或多個PU之分割。CU至一或多個PU之分割可被稱作分割模式。可用於CU之分割模 式可取決於CU未寫碼、經框內預測模式編碼抑或經框間預測模式編碼而不同。對於框內寫碼,可與下文所描述之葉變換單元相同地對待PU。
葉CU可包括一或多個變換單元(TU)。一般而言,除非另外指出,否則本發明分別使用術語CU及TU來指代葉CU及葉TU。如以上所論述,可使用TU四分樹結構來指定變換單元。亦即,分裂旗標可指示葉CU是否分裂為四個變換單元。接著,可將每一變換單元進一步分裂成四個子TU。當TU不進一步分裂時,其可被稱作葉TU。一般而言,分裂旗標可指示葉TU分裂成正方形TU。為了指示TU分裂成非正方形TU,可包括其他語法資料,例如,指示TU待根據NSQT進行分割之語法資料。
一般而言,對於框內寫碼,屬於葉CU之所有葉TU可共用相同框內預測模式。亦即,可應用相同框內預測模式以計算葉CU之所有TU的預測值。對於框內寫碼,視訊編碼器可使用框內預測模式將每一葉TU之殘餘值計算為對應於TU之預測值之部分與原始區塊之間的差。如以上所描述,可變換、量化及掃描該殘餘值。對於框間寫碼,視訊編碼器可在PU層級執行預測,且可計算每一PU之殘餘。可變換、量化及掃描對應於葉CU之殘餘值。對於框間寫碼,葉TU可大於或小於PU。對於框內寫碼,PU可與對應葉TU共置。在一些實例中,葉TU之最大大小可為對應葉CU之大小。
在HEVC中,藉由PU結構判定用以產生CU之預測性區塊之框內預測模式的數目。INTRA_2N×2N之PU結構指示CU僅包括一個PU。INTRA_N×N之PU結構指示CU包括四個PU。另外,CU內之每一PU可具有一個明度框內預測模式,且CU內之PU可共用一個色度預測模式。舉例而言,具有INTRA_2N×2N PU結構之CU可具有一個明度框內預測模式及一個色度框內預測模式。另外,具有INTRA_N×N PU結 構之CU可具有四個明度框內預測模式(亦即,每一PU一個明度框內預測模式)及針對整個CU之一個色度框內預測模式(亦即,四個PU共用一色度預測模式)。可產生語法元素來用信號發送框內預測模式。
圖1為說明預測單元結構及相關聯之框內預測寫碼模式之實例的概念圖。如圖1中所說明,INTRA_2N×2N預測單元(PU)結構僅包括一個PU,且INTRA_N×N PU結構包括四個PU。如圖1中所說明,INTRA_N×N PU結構為對稱的且包括具有相等大小之四個正方形PU。如以上所描述,圖1中所說明之四個PU中之每一者可具有明度框內預測且共用色度框內預測。應注意,HEVC定義供框間模式預測使用之其他PU結構。此等PU中之一些為不對稱的及/或包括矩形PU。儘管關於INTRA_2N×2N PU及INTRA_N×N PU結構來描述本發明之技術,但該等技術大體上適用於可供框內預測模式使用之額外PU結構。舉例而言,本發明之技術可適用於具有四個矩形PU之PU結構與框內預測寫碼模式相關聯的狀況。
如以上所描述,當使用框內預測模式來寫碼CU時,可使用語法元素來用信號發送框內預測模式。在一些實例中,使用三個語法元素來用信號發送PU之明度框內預測模式,且使用一個語法元素來用信號發送色度框內預測模式。該等語法元素以粗體展示於表1中。
語法元素prev_intra_luma_pred_flag[x0][y0]、mpm_idx[x0][y0]及rem_intra_luma_pred_mode[x0][y0]指定明度樣本之框內預測模式。陣 列索引x0、y0指定預測區塊之左上方明度樣本相對於圖像之左上方明度樣本的位置。語法元素prev_intra_luma_pred_flag[x0][y0]指示真或假條件且可具有值1或0。在一個實例中,當prev_intra_luma_pred_flag[x0][y0]等於1時,自相鄰經框內預測PU推斷當前PU之框內預測模式。
舉例而言,如表1中所指示,若prev_intra_luma_pred_flag[x0][y0]等於1,則視訊編碼器在經編碼位元串流中用信號發送mpm_idx[x0][y0]語法元素,且視訊解碼器自該經編碼位元串流接收mpm_idx[x0][y0]語法元素。mpm_idx[x0][y0]為至最可能模式(mpm)之清單的索引。舉例而言,視訊編碼器及視訊解碼器可各自經組態以建構最可能模式之清單。最可能模式之清單識別框內預測模式。
視訊解碼器可隱含地建構最可能模式之清單(亦即,不自視訊編碼器接收指示哪些框內預測模式將包括於最可能模式之清單中的發信號),或可基於來自視訊編碼器之所接收發信號來建構最可能模式之清單。在任一實例中,在視訊編碼器側之最可能模式之清單及在視訊解碼器側之最可能模式之清單可識別相同框內預測模式,且呈相同次序。在一些實例中,視訊編碼器及視訊解碼器可針對CU之每一經框內預測PU建構最可能模式之清單,且CU之兩個或兩個以上PU的最可能模式之清單可不同(亦即,可存在CU之PU的最可能模式之各別清單)。然而,本發明中所描述之技術並不限於此。
可存在視訊編碼器及視訊解碼器可建構最可能模式之清單的各種方式。作為一個實例,視訊編碼器及視訊解碼器經組態以識別最可能模式之清單中的固定數目個框內預測模式(亦即,識別三個框內預測模式)。視訊編碼器及視訊解碼器評估與當前PU(例如,正經框內預測之PU)相鄰之第一相鄰PU及與該當前PU相鄰之第二相鄰PU的框內 預測模式。第一相鄰PU及第二相鄰PU之實例包括左方、左上方、右方、下部及大體上任何相鄰之PU。
視訊編碼器及視訊解碼器將第一相鄰PU及第二相鄰PU之框內預測模式包括於最可能模式之清單中。若第一相鄰PU及第二相鄰PU中之一者或兩者未經框內預測,則作為一個實例,視訊編碼器及視訊解碼器可識別最可能模式之清單中的處於最可能模式之清單內第一相鄰PU及第二相鄰PU之對應位置中的DC框內預測模式。
為了判定框內預測模式之清單中的第三框內預測模式,視訊編碼器及視訊解碼器可判定第一相鄰PU及第二相鄰PU之框內預測模式是否相同(包括在未經框內預測時是否選擇DC框內預測模式)。若第一相鄰PU及第二相鄰PU之框內預測模式相同,則視訊編碼器及視訊解碼器可實施第一技術以識別框內預測模式之清單中的第三框內預測模式。在一些實例中,若第一相鄰PU及第二相鄰PU之框內預測模式相同,則視訊編碼器及視訊解碼器可識別最可能模式之清單中的框內預測模式中之一者,且使用第一技術(或替代第一技術使用另一技術)來識別最可能模式之清單中的第二框內預測模式及第三框內預測模式。若第一相鄰PU及第二相鄰PU之框內預測模式不同,則視訊編碼器及視訊解碼器可實施第二技術以識別第三框內預測模式。
可存在用於識別第三框內預測模式之第一技術及第二技術的各種實例,且本發明中所描述之技術並不限於任何一種特定技術。在一些實例中,基於第一技術抑或第二技術之第三框內預測模式未必需要為相鄰PU之框內預測模式。在一些實例中,基於第一技術抑或第二技術之第三框內預測模式可基於相鄰PU之框內預測模式。
mpm_idx[x0][y0]為至視訊編碼器用信號發送且視訊解碼器接收之最可能模式之清單的索引。在此實例中,自mpm_idx[x0][y0]值,視訊解碼器可經組態以判定當前PU之框內預測模式。在一些實例 中,因為最可能模式之清單係基於相鄰PU(例如,第一相鄰PU及第二相鄰PU)之框內預測模式,所以在一些狀況下,mpm_idx[x0][y0]語法元素可用以識別待用於推斷當前PU之框內預測模式的特定相鄰PU。舉例而言,作為一個實例,若mpm_idx[x0][y0]為識別與第一相鄰PU相關聯之框內預測模式的至最可能模式之清單的索引,則視訊解碼器可被視為將第一相鄰PU識別為供推斷當前PU之框內預測模式的PU。
舉例而言,參看圖1,對於INTRA_N×N實例,PU1之框內預測模式可等於PU0之框內預測模式。語法元素mpm_idx[x0][y0]可指示相鄰經框內預測PU之集合內的哪一相鄰PU可供當前PU推斷框內預測模式。在此實例中,若prev_intra_luma_pred_flag[x0][y0]等於0,則框內預測模式不自相鄰PU推斷,而由語法元素rem_intra_luma_pred_mode[x0][y0]指示。
rem_intra_luma_pred_mode[x0][y0]語法元素可指定當前PU之特定框內預測模式。在一些實例中,rem_intra_luma_pred_mode[x0][y0]語法元素可指定當前PU之框內預測模式不包括在由最可能模式之清單所識別的框內預測模式中。舉例而言,當在最可能模式之清單中所識別之框內預測模式被排除時,rem_intra_luma_pred_mode[x0][y0]語法元素自所有可能的框內預測模式識別剩餘框內預測模式。然而,本發明中之技術並不限於此。
語法元素intra_chroma_pred_mode[x0][y0]指定CU之色度樣本的框內預測模式。色度框內預測可基於明度框內預測模式。語法元素chroma_pred_from_luma_enabled_flag可指示色度之框內預測模式是否基於明度之框內預測模式。
在HEVC WD6中,可能的框內預測模式包括平面預測模式(predMode=0)、DC預測(predMode=1)、33個角預測模式(predMode=2,…,34),及自明度預測模式推斷框內預測模式的色度分量之預測 模式(predMode=35)。因此,對於明度分量,取決於prev_intra_luma_pred_flag之值,mpm_idx語法元素可指示至最可能模式之清單的索引,其中最可能模式之清單中的每一條目識別35個可能的框內預測模式中之一者,或rem_intra_luma_pred_mode可指示35個可能的框內預測模式中之一者(在一些實例中,排除在最可能模式之清單中所識別之彼等框內預測模式)。在一個實例中,語法元素rem_intra_luma_pred_mode可具有整數值0至31並可使用固定長度二進位寫碼方法來寫碼,且語法元素mpm_idx可具有整數值0至2(例如,用以識別最可能模式之清單中的三個條目中之一者)並可使用截斷一元寫碼方法來寫碼。另外,對於色度分量,intra_chroma_pred_mode及一或多個其他語法元素可指示36個可能的框內預測模式中之一者。在一個實例中,語法元素intra_chroma_pred_mode可具有為整數值0至5。在HEVC WD6中提供語法元素mpm_idx、rem_intra_luma_pred_mode及intra_chroma_pred_mode中之每一者如何識別特定框內預測模式的更詳細描述,且為簡明起見在本文中重複。然而,應注意,本文中所描述之技術可大體上應用於語法元素mpm_idx、rem_intra_luma_pred_mode及intra_chroma_pred_mode之預期變化。
如以上所描述,視訊寫碼標準可根據CABAC技術來熵寫碼語法元素。為了將CABAC寫碼應用於語法元素,視訊寫碼器可對語法元素執行二進位化。二進位化指代將語法值轉換為一系列一或多個位元之程序。此等位元可被稱作「二進位」。二進位化為無損程序且可包括以下寫碼技術中之一者或組合:固定長度寫碼、一元寫碼、截斷一元寫碼、截斷萊斯(Rice)寫碼、哥倫布(Golomb)寫碼、指數哥倫布寫碼及哥倫布-萊斯寫碼。舉例而言,二進位化可包括使用8位元固定長度技術將整數值5表示為00000101或使用一元寫碼技術表示為 11110。
在二進位化之後,視訊寫碼器可識別寫碼內容脈絡。寫碼內容脈絡可識別寫碼具有特定值之二進位的機率。舉例而言,寫碼內容脈絡可指示寫碼0值二進位之機率為0.7及寫碼值1二進位之機率為0.3。在識別寫碼內容脈絡之後,視訊寫碼器可基於該內容脈絡以算術方式寫碼彼二進位。使用規則CABAC寫碼來寫碼之二進位可被稱作「CABAC二進位」。
另外,替代於對所有語法元素二進位執行規則CABAC編碼,視訊寫碼器可使用旁路CABAC寫碼來寫碼一些語法元素。旁路寫碼指代在不使用自適應性內容脈絡之情況下以算術方式編碼二進位的程序。亦即,旁路寫碼引擎不選擇內容脈絡且可假設兩個符號(0及1)之機率為0.5。儘管旁路寫碼可不如CABAC寫碼般頻寬有效,但相比對二進位執行規則CABAC寫碼,對二進位執行旁路寫碼在計算上可為成本較低的。另外,執行旁路寫碼可實現較高程度之平行化及輸送量。使用旁路寫碼來寫碼之二進位可被稱作「旁路二進位」。
當實施CABAC寫碼器時,該寫碼器可包括用以執行規則CABAC寫碼之規則寫碼引擎及以用以執行旁路寫碼之旁路寫碼引擎。若二進位經CABAC寫碼,則使用規則CABAC編碼引擎來寫碼此二進位。規則CABAC編碼引擎可需要兩個以上處理循環來寫碼單一二進位。然而,藉由適當管線設計,規則CABAC編碼引擎可僅需要n+M個循環來編碼n個二進位,其中M為用以啟動管線之額外耗用。M通常大於0。
在CABAC寫碼程序開始時(亦即,自旁路模式至規則模式之每一切換),引入管線額外耗用。若二進位經旁路寫碼,則使用規則旁路編碼引擎來寫碼此二進位。可預期旁路寫碼引擎僅需要一個循環來寫碼n位元語法元素,其中n可大於一。因此,若一起寫碼旁路二進位及 CABAC二進位之集合內的所有旁路二進位且一起寫碼該集合內之所有CABAC二進位,則可減少用以寫碼該集合之循環之總數。特定而言,在轉變至CABAC寫碼之前或之後一起寫碼旁路二進位可節省重新啟動CABAC寫碼引擎所需之額外耗用。
如以上所描述,具有INTRA_N×N PU結構之CU可具有四個明度框內預測模式且因此具有語法元素prev_intra_luma_pred_flag、mpm_idx及rem_intra_luma_pred_mode之四個集合。在一個實例中,在此等三個語法元素當中,僅prev_intra_luma_pred_flag經CABAC寫碼且mpm_idx及rem_intra_luma_pred_mode兩者經旁路寫碼。此外,旁路寫碼可指代藉由非CABAC程序(亦即,在CABAC引擎外)對二進位之寫碼。可用於旁路寫碼中之非CABAC寫碼之實例包括哥倫布寫碼、指數哥倫布寫碼及哥倫布-萊斯寫碼。
如以上所描述,具有INTRA_N×N PU結構之CU可具有用於所有四個PU之一個色度框內預測模式。色度框內預測模式可基於明度框內預測模式。作為一個實例,表2展示語法元素intra_chroma_pred_mode之二進位化。二進位化導致一或多個二進位表示intra_chroma_pred_mode之對應值。在此實例中,加底線之二進位經CABAC寫碼且剩餘二進位經旁路寫碼。如表2中所說明,intra_chroma_pred_mode之二進位化及特定二進位經CABAC寫碼抑或經旁路寫碼係基於chroma_pred_from_luma_enable_flag之值。因此,語法元素之二進位化及特定二進位經CABAC寫碼抑或經旁路寫碼可基於另一語法元素(例如,chroma_pred_from_luma_enable_flag)之值。
以下表3及表4表示在一些實例中用於識別CU之明度預測模式及色度預測模式的語法元素之寫碼結構。表3說明INTRA_2N×2N PU結構之語法元素之寫碼且表4說明INTRA_N×N PU結構之寫碼。在表3及表4中,將語法元素intra_chroma_pred_mode表示為語法元素chroma_mode_cabac_bins及chroma_mode_bypass_bins,其中如表2中所提供,chroma_mode_cabac_bins表示經CABAC寫碼之二進位且chroma_mode_bypass_bins表示經旁路寫碼之二進位。表3及表4識別正使用CABAC模式抑或旁路模式來寫碼語法元素。語法元素被輸出至CABAC寫碼引擎,且通常以其在表3及表4中所呈現之次序來熵寫碼。另外,如表4中所說明,存在prev_intra_luma_pred_flag、mpm_idx及rem_intra_luma_pred_mode之四個集合(每一者對應於四個PU中之一者)及由所有四個PU共用之一個色度模式指示。
如表3及表4中所說明,經CABAC寫碼之語法元素與經旁路寫碼之語法元素交錯(如以上所描述)可(例如)歸因於重新啟動CABAC寫碼引擎之設置額外耗用而增加熵編碼表3及表4中之所有語法元素所需之循環的總數。如表4中所說明,若CU含有多個PU,則該問題為複合的。為了減少總管線額外耗用及編碼識別框內預測模式之語法元素所需的循環之總數,可根據本發明進行對寫碼次序之某些調整。
圖2為說明可利用根據本發明之技術之實例視訊編碼及解碼系統10的方塊圖。如圖2中所展示,系統10包括用信號發送經編碼視訊資料之源器件12。在一些實例中,源器件12可經由通信頻道16將經編碼視訊資料用信號發送至目的地器件14。源器件12及目的地器件14可包含廣泛範圍之器件中的任一者。在一些狀況下,源器件12及目的地器件14可包含無線通信器件,諸如無線手機、所謂的蜂巢式或衛星無線 電電話,或可經由通信頻道16傳達視訊資訊之任何無線器件,在此狀況下,通信頻道16為無線的。然而,本發明之技術未必限於無線應用或設定。舉例而言,此等技術可應用於空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路視訊傳輸、經編碼至儲存媒體上之經編碼數位視訊,或其他情境。因此,通信頻道16可包含適合於傳輸或儲存經編碼視訊資料以供目的地器件14稍後擷取的無線、有線或儲存媒體之任何組合。
在圖2之實例中,源器件12包括視訊源18、視訊編碼器20、調變器/解調變器(數據機)22及傳輸器24。目的地器件14包括接收器26、數據機28、視訊解碼器30及顯示器件32。根據本發明,源器件12之視訊編碼器20可經組態以應用用於以減少管線額外耗用之方式來熵編碼的技術。在其他實例中,源器件及目的地器件可包括其他組件或配置。舉例而言,源器件12可自外部視訊源18(諸如,外部攝影機)接收視訊資料。同樣地,目的地器件14可與外部顯示器件介接,而非包括整合式顯示器件。
圖2之所說明系統10僅為一個實例。可藉由任何數位視訊編碼及/或解碼器件執行用於以減少管線額外耗用之方式熵編碼旗標之集合及每一旗標之各別語法元素的技術。雖然大體上藉由視訊寫碼器件來執行本發明之技術,但亦可藉由視訊編碼器/解碼器(通常稱作「CODEC」)執行該等技術。此外,亦可藉由視訊預處理器來執行本發明之技術。源器件12及目的地器件14僅為此等寫碼器件之實例,在該等寫碼器件中,源器件12產生用於傳輸至目的地器件14之經寫碼視訊資料。在一些實例中,器件12、14可以實質上對稱之方式進行操作,使得器件12、14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、14之間的單向或雙向視訊傳輸,例如,用於視訊串流傳輸、視訊播放、視訊廣播或視訊電話。
源器件12之視訊源18可包括視訊俘獲器件(諸如,視訊攝影機)、含有先前所俘獲之視訊的視訊封存檔,及/或來自視訊內容提供者之視訊饋入。作為另一替代例,視訊源18可產生基於電腦圖形之資料以作為源視訊,或直播視訊、經封存視訊及電腦產生之視訊的組合。在一些狀況下,若視訊源18為視訊攝影機,則源器件12及目的器件14可形成所謂的攝影機電話或視訊電話。然而,如以上所提及,本發明中所描述之技術可大體上適用於視訊寫碼,且可應用於無線及/或有線應用。在每一狀況下,可藉由視訊編碼器20來編碼所俘獲、預俘獲或電腦產生之視訊。可接著藉由數據機22根據通信標準來調變經編碼視訊資訊,且經由傳輸器24將經編碼視訊資訊傳輸至目的地器件14。數據機22可包括各種混頻器、濾波器、放大器或經設計以用於信號調變之其他組件。傳輸器24可包括經設計以用於傳輸資料之電路,包括放大器、濾波器及一或多個天線。
目的地器件14之接收器26經由頻道16接收資訊,且數據機28解調變該資訊。再次,視訊編碼程序可實施本文中所描述之技術中之一或多者以熵編碼語法元素,從而減少管線額外耗用。經由頻道16傳達之資訊可包括由視訊編碼器20定義之語法資訊(亦由視訊解碼器30使用),該語法資訊包括描述巨集區塊及其他經寫碼單元(例如,圖像群組(GOP))之特性及/或處理的語法元素。顯示器件32向使用者顯示經解碼視訊資料,且可包含多種顯示器件中之任一者,諸如陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
在圖2之實例中,通信頻道16可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線、或無線及有線媒體之任何組合。通信頻道16可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全球網路)的部分。通信頻道16大體上表示用於 將視訊資料自源器件12傳輸至目的地器件14之任何合適通信媒體或不同通信媒體之集合,包括有線或無線媒體之任何合適組合。通信頻道16可包括路由器、交換器、基地台,或可有用於促進自源器件12至目的地器件14之通信的任何其他設備。在其他實例中,源器件12可將經編碼資料儲存至儲存媒體上,而非傳輸該資料。同樣地,目的地器件14可經組態以自儲存媒體擷取經編碼資料。以此方式,源器件12可經組態以產生電腦程式產品,其中該電腦程式產品包括根據本文中所描述之技術編碼的視訊檔案。
視訊編碼器20及視訊解碼器30可根據諸如本文中所描述之彼等視訊壓縮標準的視訊壓縮標準進行操作。然而,本發明之技術不限於任何特定寫碼標準。雖然未展示於圖2中,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體,以處置共同資料串流或單獨資料串流中之音訊及視訊兩者的編碼。在適用時,MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
視訊編碼器20及視訊解碼器30各自可實施為多種合適編碼器或解碼器電路中之任一者,該等電路諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、包括視訊寫碼器件(諸如,編碼器或解碼器)之無線通信器件、離散邏輯、軟體、硬體、韌體,或其任何組合。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,該一或多個編碼器或解碼器中之任一者可整合以作為各別攝影機、電腦、行動器件、用戶器件、廣播器件、機上盒、伺服器或其類似者中之組合式編碼器/解碼器(CODEC)的部分。包括視訊編碼器20及/或視訊解碼器30之裝置可包含積體電路、微處理器及/或無線通信器件(諸如, 蜂巢式電話)。
視訊編碼器20及視訊解碼器30可經組態以實施根據本發明之技術。此等技術可減少管線額外耗用,藉此潛在地增加輸送量。舉例而言,管線額外耗用之一個原因為與開始內容脈絡自適應性二進位算術寫碼(CABAC)所需之循環相關聯的額外耗用。在本發明中所描述之技術中,視訊編碼器20使用CABAC編碼(例如,藉由規則CABAC引擎)熵編碼語法元素之第一群組,且使用旁路編碼(例如,藉由旁路引擎)熵編碼語法元素之第二群組。類似地,視訊解碼器30使用CABAC解碼(例如,藉由規則CABAC引擎)熵解碼語法元素之第一群組,且使用旁路解碼(例如,藉由旁路解碼引擎)熵解碼語法元素之第二群組。
以此方式,在位元串流中,經CABAC編碼之第一群組之語法元素不與經旁路編碼之第二群組之語法元素交錯。若經CABAC編碼之語法元素與經旁路編碼之語法元素交錯,則視訊編碼器20及視訊解碼器30將必須重複地重新啟動CABAC引擎。
舉例而言,假設第一語法元素待經CABAC編碼且在待經旁路編碼之第二語法元素之前,且待經CABAC編碼之第三語法元素在待經旁路編碼之第二語法元素之後。在待經CABAC編碼之語法元素與待經旁路編碼之語法元素交錯的此實例中,視訊編碼器20將需要針對第一語法元素來啟動CABAC引擎,且接著在藉由旁路引擎編碼第二語法元素之後針對第三語法元素重新啟動CABAC引擎,此情形浪費了循環。
在本發明中所描述之技術中,藉由CABAC編碼語法元素之第一群組及旁路編碼語法元素之第二群組,視訊編碼器20可減少待啟動CABAC引擎之次數,藉此減少浪費之循環的數目。類似地,藉由CABAC解碼語法元素之第一群組及旁路解碼語法元素之第二群組,視訊解碼器30可減少待啟動CABAC引擎之次數,藉此減少浪費之循 環的數目。
如更詳細地描述,語法元素之第一群組的每一語法元素與CU之一個PU相關聯,且語法元素之第二群組的每一語法元素對應於語法元素之第一群組的語法元素。語法元素之第一群組及語法元素之第二群組中的每一者包括複數個語法元素。語法元素之第一群組中的每一者指示各別PU(例如,對應於語法元素之第一群組之語法元素的PU)之框內預測模式是否係自相鄰PU推斷。換言之,語法元素之第一群組中的每一者指示各別PU之框內預測模式是否基於至最可能模式之清單的索引。
舉例而言,視訊編碼器20及視訊解碼器30可經組態以按以上所描述之實例方式建構最可能模式之清單。語法元素之第一群組中的每一語法元素可對應於CU中之PU中的一者。在此實例中,語法元素之第一群組中的語法元素(亦即,第一群組之複數個語法元素中之語法元素中的一者)指示該語法元素所對應之PU的框內預測模式是否基於至最可能模式之清單的索引。
若語法元素之第一群組的語法元素指示其所相關聯之PU的框內預測模式係基於至最可能模式之清單的索引,則與語法元素之第一群組之該語法元素相關聯的語法元素之第二群組之語法元素識別至最可能模式之清單的該索引。若語法元素之第一群組的語法元素指示其所相關聯之PU的框內預測模式不基於至最可能模式之清單的索引,則與語法元素之第一群組之該語法元素相關聯的語法元素之第二群組之語法元素識別該框內預測模式。
圖3為說明可實施本發明中所描述之用於編碼視訊資料之技術的視訊編碼器20之實例的方塊圖。在一個實例中,視訊編碼器20可經組態以產生語法元素之第一群組及語法元素之第二群組,其中語法元素之第二群組的語法元素對應於語法元素之第一群組的各別語法元素, 且其中語法元素之第一群組之語法元素中的每一者指示CU中之各別PU的框內預測模式是否基於至最可能模式之清單的索引。視訊編碼器20可內容脈絡自適應性二進位算術寫碼(CABAC)編碼語法元素之第一群組(例如,使用規則CABAC引擎),在熵編碼語法元素之第一群組之後旁路編碼語法元素之第二群組(例如,使用旁路編碼引擎),且輸出包括語法元素之經編碼之第一群組及語法元素之經編碼之第二群組的視訊資料。語法元素之第一群組及第二群組中的每一者包括複數個語法元素。
視訊編碼器20可執行視訊切片內之視訊區塊的框內寫碼(亦即,框內預測編碼)及框間寫碼(亦即,框間預測編碼)。如圖3中所展示,視訊編碼器20接收可為待編碼之視訊圖框內之當前視訊區塊的視訊資料,且輸出經編碼之視訊位元串流。視訊編碼器20可(例如)在圖框標頭、區塊標頭、切片標頭或GOP標頭中進一步發送語法資料,諸如基於區塊之語法資料、基於圖框之語法資料,及基於GOP之語法資料。GOP語法資料可描述各別GOP中之數個圖框,且圖框語法資料可指示用以編碼對應圖框之編碼/預測模式。
在圖3之實例中,視訊編碼器20包括模式選擇單元40、參考圖框記憶體64、求和器50、變換處理單元52、量化處理單元54及熵編碼單元56。模式選擇單元40又包括運動估計單元42、運動補償單元44、框內預測單元46及分割單元48。為了視訊區塊重建構,視訊編碼器20亦包括反量化處理單元58、反變換處理單元60及求和器62。
在該編碼程序期間,視訊編碼器20接收待寫碼之視訊圖框或切片。可將該圖框或切片劃分成多個視訊區塊。運動估計單元42及運動補償單元44相對於一或多個參考圖框中之一或多個區塊來執行所接收視訊區塊之框間預測性寫碼(框間預測編碼),以提供時間預測。框內預測單元46可替代地相對於與待寫碼之區塊相同之圖框或切片中的一 或多個相鄰區塊來執行所接收視訊區塊之框內預測性寫碼(框內預測編碼),以提供空間預測。視訊編碼器20可執行多個寫碼遍次(例如)以針對視訊資料之每一區塊選擇適當寫碼模式。
此外,分割單元48可基於先前寫碼遍次中之先前分割方案的評估將視訊資料之區塊分割成多個子區塊。舉例而言,分割單元48可最初將一圖框或切片分割成多個LCU,且基於速率-失真分析(例如,速率-失真最佳化)將該等LCU中之每一者分割成多個子CU。模式選擇單元40可進一步產生指示LCU至子CU之分割的四分樹資料結構。四分樹之葉節點CU可包括一或多個PU及一或多個TU。
模式選擇單元40可(例如)基於誤差結果來選擇寫碼模式中之一者(框內或框間),且將所得經框內寫碼或框間寫碼區塊提供至求和器50以產生殘餘區塊資料,且提供至求和器62以重建構經編碼區塊以供用作參考圖框。模式選擇單元40亦將諸如運動向量、框內模式指示符、分割資訊及其他此語法資訊的語法元素提供至熵編碼單元56。舉例而言,模式選擇單元40可將如以上所描述之語法元素prev_intra_luma_pred_flag、mpm_idx、rem_intra_luma_pred_mode、intra_chroma_pred_mode及chroma_pred_from_luma_enable_flag提供至熵編碼單元56。另外,模式選擇單元40可經組態以將語法元素配置成prev_intra_luma_pred_flag、mpm_idx、rem_intra_luma_pred_mode及intra_chroma_pred_mode,使得以熵編碼該等語法元素所需之循環之數目得以減少的方式將該等語法元素提供至熵編碼單元56。
舉例而言,視訊編碼器20經由熵編碼單元56使用CABAC編碼來針對CU內之每一PU熵編碼prev_intra_luma_pred_flag。在此實例中,語法元素之第一群組包括複數個prev_intra_luma_pred_flag(亦即,CU中之每一PU一個prev_intra_luma_pred_flag)。視訊編碼器20經由熵編碼單元56在對應prev_intra_luma_pred_flag指示PU之框內預測模式係 基於至最可能模式之清單的索引之情況下使用旁路編碼來熵編碼mpm_idx語法元素,或在對應prev_intra_luma_pred_flag指示PU之框內預測模式不基於至最可能模式之清單的索引之情況下編碼rem_intra_luma_pred_mode語法元素。在此實例中,語法元素之第二群組包括一或多個mpm_idx語法元素及一或多個rem_intra_luma_pred_mode語法元素中之至少一者。
換言之,語法元素之第一群組中之語法元素的一個實例為prev_intra_luma_pred_flag,語法元素之第二群組中之語法元素的一個實例為mpm_idx語法元素,且語法元素之第二群組中之語法元素的另一實例為rem_intra_luma_pred_mode語法元素。
再次,prev_intra_luma_pred_flag指示CU之PU之明度樣本的框內預測模式是否基於至最可能模式之清單的索引。若prev_intra_luma_pred_flag指示CU之PU之明度樣本的框內預測模式係基於至最可能模式之清單的索引,則mpm_idx語法元素指示至最可能模式之清單的索引。若prev_intra_luma_pred_flag指示CU之PU之框內預測模式不基於至最可能模式之清單的索引,則rem_intra_luma_pred_mode語法元素指示該PU之明度樣本的框內預測模式。rem_intra_luma_pred_mode語法元素可指示未在最可能模式之清單中識別之框內預測模式。
運動估計單元42及運動補償單元44可高度整合,但出於概念性目的而單獨進行說明。由運動估計單元42執行之運動估計為產生運動向量之程序,運動向量估計視訊區塊之運動。舉例而言,運動向量可指示當前視訊圖框或圖像內之視訊區塊的PU相對於參考圖框(或其他經寫碼單元)內之預測性區塊(其關於該當前圖框(或其他經寫碼單元)內正經寫碼之當前區塊)之位移。預測性區塊為被發現在像素差方面緊密地匹配於待寫碼區塊之區塊,該像素差可藉由絕對差和(SAD)、 平方差和(SSD)或其他差量度予以判定。在一些實例中,視訊編碼器20可計算儲存於參考圖框記憶體64中之參考圖像的子整數像素位置之值。舉例而言,視訊編碼器20可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分數像素位置之值。因此,運動估計單元42可執行相對於全像素位置及分數像素位置之運動搜尋,且以分數像素精度輸出運動向量。
運動估計單元42藉由比較經框間寫碼切片中之視訊區塊的PU之位置與參考圖像之預測性區塊之位置而計算該PU之運動向量。該參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),清單0或清單1中之每一者識別儲存於參考圖框記憶體64中之一或多個參考圖像。運動估計單元42將計算出之運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及基於由運動估計單元42所判定之運動向量來獲取或產生預測性區塊。再次,在一些實例中,運動估計單元42及運動補償單元44可在功能上進行整合。在接收到當前視訊區塊之PU之運動向量之後,運動補償單元44可將運動向量所指向之預測性區塊定位於參考圖像清單中之一者中。如以下所論述,求和器50藉由自正經寫碼之當前視訊區塊的像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值。一般而言,運動估計單元42相對於明度分量而執行運動估計,且運動補償單元44將基於該等明度分量所計算之運動向量用於色度分量與明度分量兩者。模式選擇單元40亦可產生與視訊區塊及視訊切片相關聯之語法元素以供視訊解碼器30用於解碼視訊切片之視訊區塊。
作為對由運動估計單元42及運動補償單元44執行之框間預測(如上文所描述)之替代,框內預測單元46可框內預測當前區塊。詳言之,框內預測單元46可判定將用以編碼當前區塊之框內預測模式。在 一些實例中,框內預測單元46可(例如)在單獨編碼遍次期間使用各種框內預測模式來編碼當前區塊,且框內預測單元46(或在一些實例中,模式選擇單元40)可(例如)基於速率-失真分析自經測試模式選擇將使用之適當框內預測模式。如以上所描述,可能的框內預測模式可包括平面預測模式、DC預測、角預測模式及自明度預測模式推斷框內預測模式之色度分量之預測模式。
另外,在一個實例中,框內預測單元46可使用對各種經測試框內預測模式之速率-失真分析而計算速率-失真值,且在經測試模式當中選擇具有最好速率-失真特性之框內預測模式。速率-失真分析大體上判定經編碼區塊與原始未經編碼區塊之間的失真(或誤差)之量以及用以產生經編碼區塊之位元率(亦即,位元數目),該原始未經編碼區塊經編碼以產生該經編碼區塊。框內預測單元46可自失真及速率計算各種經編碼區塊之比率以判定哪一框內預測模式展現區塊之最好速率-失真值。
在選擇區塊之框內預測模式之後,框內預測單元46可將指示區塊之選定框內預測模式的資訊(諸如,語法元素)提供至熵編碼單元56。熵編碼單元56可編碼指示選定框內預測模式之資訊。視訊編碼器20可在所傳輸之位元串流組態資料中包括各種區塊之編碼內容脈絡之定義及將用於該等內容脈絡中之每一者之最可能框內預測模式、框內預測模式索引表及經修改之框內預測模式索引表的指示,該位元串流組態資料可包括複數個框內預測模式索引表及複數個經修改之框內預測模式索引表(亦稱作碼字映射表)。
如以上所描述,框內預測語法元素prev_intra_luma_pred_flag、mpm_idx、rem_intra_luma_pred_mode、intra_chroma_pred_mode及chroma_pred_from_luma_enable_flag可指示PU結構之一或多個明度框內預測模式及PU結構之一色度框內預測模式。另外,如以上關於表3 及表4所描述,框內預測語法元素prev_intra_luma_pred_flag、mpm_idx、rem_intra_luma_pred_mode、intra_chroma_pred_mode及chroma_pred_from_luma_enable_flag在寫碼結構內之配置可判定熵編碼PU結構之所有語法元素所需的循環之總數。因此,除如以上關於表3及表4所描述將框內預測語法元素輸出至熵編碼單元56以外,框內預測單元46可經組態以配置框內預測語法,以使得以熵編碼語法元素所需之循環之總數得以減少的方式將該等語法元素輸出至熵編碼單元56。同樣地,藉由此配置,在解碼器處熵解碼語法元素所需之循環之總數得以減少。
在一個實例中,框內預測單元46可經組態以配置色度框內模式語法元素之經CABAC寫碼之二進位與明度框內模式語法元素之經CABAC寫碼之二進位,使得該等二進位一起經寫碼。另外,框內預測單元46可配置明度框內模式語法元素之經旁路寫碼之二進位與色度框內模式語法元素之經旁路寫碼之二進位,使得該等二進位可一起經寫碼。表5提供INTRA_2N×2N PU結構之此配置之實例寫碼結構。表6提供INTRA_N×N PU結構之此配置之實例寫碼結構。在表5及表6中,可如以上關於表3及表4所描述來定義語法元素。然而,應注意,表5及表6中之語法元素未必需要具有與以上所描述之值範圍相同的值範圍。舉例而言,若視訊編碼器20包括33個以下或以上框內預測模式,則可相應地調整語法元素之值。如表5及表6中所說明,語法元素chroma_mode_cabac_bins經配置以使得其在mpm_idx及rem_intra_luma_pred_mode之前寫碼。
在另一實例中,框內預測單元46可經組態以針對CU內之所有PU配置框內模式明度語法元素之經CABAC寫碼之二進位,使得其可一起經寫碼。另外,框內預測單元46可配置明度框內模式語法元素之經旁路寫碼之二進位,以使得其可一起經寫碼。表7提供INTRA_2N×2N PU結構之此配置之實例寫碼結構。表8提供INTRA_N×N PU結構之此配置之實例寫碼結構。在表7及表8中,可如以上關於表5及表6所描述來定義語法元素。
如表8中所說明,對於INTRA_N×N PU結構,針對四個PU中之每一者寫碼prev_intra_luma_pred_flag語法元素,接著針對PU中之每一 者寫碼各別mpm_idx及rem_intra_luma_pred_mode語法元素。四個prev_intra_luma_pred_flag語法元素可被稱作PU之語法元素之第一群組。因此,框內預測單元46可經組態以在熵編碼單元56之前,在與旗標中之每一者相關聯的各別語法元素mpm_idx及rem_intra_luma_pred_mode之前輸出語法元素之第一群組。
在又一實例中,框內預測單元46可經組態以針對寫碼單元中之所有PU配置明度框內模式語法元素及色度框內模式語法元素兩者的所有經CABAC寫碼之二進位,使得其可一起經寫碼。另外,框內預測單元46可經組態以配置明度框內模式及色度框內模式兩者的所有經旁路寫碼之二進位,以使得其可一起經寫碼。表9提供INTRA_2N×2N PU結構之此配置之實例寫碼結構。表10提供INTRA_N×N PU結構之此配置之實例寫碼結構。在表9及表10中,可如以上關於表5及表6所描述來定義語法元素。
應注意,在表6至表10中,在表中呈現語法元素之列可對應於語法元素由熵編碼器進行熵編碼的次序。在一些狀況下,無中間熵編碼可能發生在表6至表10中之相鄰列之間。本文中之術語「群組」及「分組」可大體上指代將元素緊密地置放在一起,例如,在諸如圖像、切片、CU或其類似者之視訊寫碼單元內的語法表內。在對包括於群組中之語法元素執行操作的狀況下,可在一些狀況下將該等元素緊密地置放在一起以使得不對該群組之外的元素執行操作,直至對群組內之所有元素完成該操作為止(亦即,在不同群組之間無交錯)。在一些狀況下,一群組中之二進位可連續地呈現且以一次序或序列(亦即,相繼地)進行寫碼。
再次參看圖3,視訊編碼器20藉由自正經寫碼之原始視訊區塊減去來自模式選擇單元40之預測資料而形成殘餘視訊區塊。求和器50表示執行此減法運算之一或多個組件。變換處理單元52將諸如離散餘弦變換(DCT)或概念上類似之變換的變換應用於殘餘區塊,從而產生包含殘餘變換係數值之視訊區塊。變換處理單元52可執行概念上類似於DCT之其他變換。亦可使用小波變換、整數變換、次頻帶變換或其他類型之變換。在任何狀況下,變換處理單元52將變換應用於殘餘區塊,從而產生殘餘變換係數之區塊。該變換可將殘餘資訊自像素值域轉換至變換域(諸如,頻域)。變換處理單元52可將所得變換係數發送至量化單元54。量化處理單元54量化該等變換係數以進一步減小位元率。該量化程序可減小與該等係數中之一些或全部相關聯的位元深度。可藉由調整量化參數而修改量化程度。在一些實例中,量化處理單元54可接著執行對包括經量化變換係數之矩陣的掃描。或者,熵編 碼單元56可執行該掃描。
視訊編碼器20可經組態以執行反量化及反變換以儲存經解碼區塊,以用作用於預測(例如)同一圖框或待在時間上預測之多個圖框中之後續區塊的參考。反量化處理單元58及反變換處理單元60分別應用反量化及反變換,以在像素域中重建構殘餘區塊(例如)以供稍後用作參考區塊。運動補償單元44可藉由將該殘餘區塊加至參考圖框記憶體64之圖框中之一者的預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於該經重建構殘餘區塊以計算用於在運動估計中使用之子整數像素值。求和器62將經重建構殘餘區塊加至由運動補償單元44產生之經運動補償之預測區塊以產生經重建構視訊區塊,以供儲存於參考圖框記憶體64中。
在量化之後,熵編碼單元56熵編碼經量化變換係數。另外,熵編碼單元56熵編碼語法元素,諸如以上所描述之預測性語法元素。舉例而言,熵編碼單元56可執行內容脈絡自適應性可變長度寫碼(CAVLC)、內容脈絡自適應性二進位算術寫碼(CABAC)、基於語法之內容脈絡自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵寫碼技術。在基於內容脈絡之熵編碼的狀況下,內容脈絡可基於相鄰區塊。在藉由熵編碼單元56進行熵編碼之後,可將經編碼位元串流傳輸至另一器件(例如,視訊解碼器30)或經封存以供稍後傳輸或擷取。
圖4為說明可實施本發明中所描述之技術之實例熵編碼單元56的方塊圖。在一個實例中,圖4中所說明之熵編碼單元56可為CABAC編碼器。實例熵編碼單元56可包括二進位化單元502、包括旁路編碼引擎504及規則編碼引擎508之算術編碼單元510,及內容脈絡模型化單元506。
熵編碼單元56可接收一或多個語法元素,諸如以上所描述之框 內預測語法元素prev_intra_luma_pred_flag、mpm_idx、rem_intra_luma_pred_mode、intra_chroma_pred_mode及chroma_pred_from_luma_enable_flag。語法元素由熵編碼單元56接收之次序可根據寫碼結構(諸如,以上關於表3至表10所描述之實例寫碼結構)來定義。
二進位化單元502接收語法元素且產生二進位(bin)串(亦即,二進位(binary)串)。舉例而言,二進位化單元502可使用以下技術中之任一者或組合來產生二進位串:固定長度寫碼、一元寫碼、截斷一元寫碼、截斷萊斯寫碼、哥倫布寫碼、指數哥倫布寫碼,及哥倫布-萊斯寫碼。另外,在一些狀況下,二進位化單元502可接收語法元素作為二進位串且簡單地傳遞二進位值。在一個實例中,二進位化單元502接收語法元素intra_chroma_pred_mode且根據以上關於表2所描述之實例基於chroma_pred_from_luma_enable_flag之值產生二進位串。
算術編碼單元510經組態以自二進位化單元502接收二進位串,且對二進位串執行算術編碼。如圖4中所展示,算術編碼單元510可自旁路路徑或規則寫碼路徑接收二進位值。遵循旁路路徑之二進位值可為識別為經旁路寫碼之二進位值,且遵循規則編碼路徑之二進位值可識別為經CABAC寫碼。與以上所描述之CABAC程序一致,在算術編碼單元510自旁路路徑接收二進位值的狀況下,旁路編碼引擎504可在不利用指派給二進位值之自適應性內容脈絡的情況下對二進位值執行算術編碼。在一個實例中,旁路編碼引擎504可假設二進位具有可能值之機率相等。
在算術編碼單元510經由規則路徑接收二進位值之狀況下,內容脈絡模型化單元506可提供內容脈絡變數(例如,內容脈絡狀態),以使得規則編碼引擎508可基於由內容脈絡模型化單元506提供之內容脈絡指派來執行算術編碼。可根據諸如HEVC之視訊寫碼標準來定義內 容脈絡指派。內容脈絡模型可儲存於記憶體中。內容脈絡模型化單元506可包括一系列經編索引之表及/或利用映射函數來判定特定二進位之內容脈絡及內容脈絡變數。在編碼二進位值之後,規則編碼引擎508可基於實際二進位值來更新內容脈絡。
另外,在一個實例中,熵編碼單元56可經組態以基於其自模式選擇單元40接收語法元素之次序來編碼二進位。如以上所描述,該次序可根據寫碼結構(諸如,以上關於表3至表10所描述之實例寫碼結構)來定義。熵編碼單元56接收語法元素之集合內之語法元素的次序可判定熵編碼單元56編碼語法元素之該集合所需的循環之總數。
在一個實例中,規則編碼引擎508可需要兩個以上循環來寫碼單一二進位。另外,在一個實例中,規則編碼引擎508可需要n+M個循環來編碼n個二進位,其中M為用以啟動管線之額外耗用。M通常大於0。在CABAC編碼程序開始時(例如,自旁路模式至規則模式之切換),引入管線額外耗用M。在一個實例中,旁路編碼引擎504可需要一個循環來寫碼n位元語法元素,其中n大於零。
因此,算術編碼單元510編碼旁路二進位及CABAC二進位之集合所需的循環之總數可基於引入管線額外耗用M之次數。舉例而言,若算術編碼單元510如表4中所配置而編碼預測性語法元素,則管線額外耗用可引入五次且算術編碼單元510可需要最少5*M個循環來編碼語法元素之二進位。然而,若算術編碼單元510如表8中所配置而編碼預測性語法元素,則管線額外耗用可僅引入兩次且算術編碼單元510管線額外耗用可減少至2*M個循環。
應注意,根據HEVC寫碼之視訊圖框可包括大約數萬個PU。因此,框內預測語法元素在寫碼結構中之配置次序可顯著影響視訊寫碼器寫碼視訊資料所需之循環之數目。另外,應注意,儘管將圖4中所說明之實例熵編碼單元56描述為自旁路編碼操作切換至規則編碼操 作,但在一些狀況下,此等操作可並列地執行。然而,在此狀況下,熵編碼單元56接收經旁路寫碼及經CABAC寫碼之語法元素的次序仍可判定熵編碼語法元素所需之循環之總數。額外耗用來自內容脈絡切換。因為以旁路模式寫碼之二進位可針對下一經CABAC寫碼之二進位產生若干不同語法元素,所以難以預先獲取必要內容脈絡(載入內容脈絡緩衝器)來減少管線額外耗用。
圖5為說明根據本發明之技術編碼視訊資料之實例的流程圖。儘管以下將圖5中之程序描述為大體上由視訊編碼器20執行,但該程序可由視訊編碼器20、模式選擇單元40及/或熵編碼單元56之任何組合執行。
如圖5中所說明,視訊編碼器20產生語法元素之第一群組(602)。在一個實例中,第一群組內之語法元素指示各別預測單元(PU)之預測模式是否基於至最可能模式之清單的索引。在一個實例中,語法元素之第一群組包括對應於INTRA_N×N PU結構中之PU的四個語法元素prev_intra_luma_pred_flag。視訊編碼器20產生語法元素之第二群組(604)。在一個實例中,如以上所描述,各別語法元素可為語法元素mpm_idx或rem_intra_luma_pred_mode中之任一者。第二群組之語法元素對應於第一群組之各別語法元素。
視訊編碼器20 CABAC編碼語法元素之第一群組(例如,使用規則CABAC引擎)(606)。在CABAC編碼語法元素之第一群組之後,視訊編碼器20旁路編碼語法元素之第二群組(例如,使用旁路編碼引擎)(608)。視訊編碼器20可基於語法元素之第一群組及第二群組來框內編碼CU之PU(610)。視訊編碼器20可在位元串流中輸出視訊資料,該視訊資料包括語法元素之經編碼之第一群組及語法元素之經編碼之第二群組(612)。視訊編碼器20亦在位元串流中輸出經框內編碼PU之殘餘資訊。
如以上所描述,語法元素之第一群組的實例包括複數個旗標(例如,prev_intra_luma_pred_flag語法元素)。該複數個旗標中之旗標可為語法元素之第一群組的指示以下情形之語法元素:各別PU之明度樣本的框內預測模式是否基於至最可能模式之清單的索引。
在一些實例中,語法元素之第二群組包括第一語法元素,該第一語法元素在語法元素之第一群組中的對應語法元素指示各別PU之明度樣本的框內預測模式係基於至最可能模式之清單的索引之情況下指示至最可能模式之清單的索引。舉例而言,若各別PU之prev_intra_luma_pred_flag語法元素指示該各別PU之框內預測模式係基於至最可能模式之清單的索引,則各別PU之對應mpm_idx語法元素指示至最可能模式之清單的索引。在此實例中,將mpm_idx語法元素視為語法元素之第二群組中的第一語法元素。
在一些實例中,語法元素之第二群組包括第二語法元素,該第二語法元素在語法元素之第一群組中的對應語法元素指示各別PU之明度樣本的框內預測模式不基於至最可能模式之清單的索引之情況下指示該各別PU之框內預測模式。舉例而言,若各別PU之prev_intra_luma_pred_flag語法元素指示該各別PU之框內預測模式不基於至最可能模式之清單的索引,則各別PU之對應rem_intra_luma_pred_mode語法元素指示該框內預測模式。在此實例中,將rem_intra_luma_pred_mode語法元素視為語法元素之第二群組中的第二語法元素。
如以上所描述,視訊編碼器20建構之最可能模式之清單識別一或多個相鄰PU之一或多個框內預測模式。在一些實例中,視訊編碼器20可在輸出CU之PU的語法元素之第二群組的任何語法元素之前輸出CU之PU的語法元素之第一群組的所有語法元素。在一些實例中,視訊編碼器20可在旁路編碼語法元素之第二群組的任何語法元素之前 CABAC編碼語法元素之第一群組的所有語法元素。
應注意,在一些實例中,熵編碼器可為包括於視訊編碼器20內之熵編碼器,諸如熵編碼單元56。在此狀況下,術語「輸出」可指代視訊編碼器20內之一個組件將資料輸出至視訊編碼器20內之另一組件。另外,在其他實例中,熵編碼器可在視訊編碼器20外部。在一個實例中,視訊編碼器20輸出旗標之集合及各別語法元素,以使得語法元素之群組在序列中配置於各別語法元素之前。在一個實例中,視訊編碼器20可根據表8中所說明之寫碼結構來配置語法元素。視訊解碼器可接收經熵編碼位元串流且使用該經熵編碼位元串流來重建構視訊資料。
圖6為說明解碼經編碼視訊序列之視訊解碼器30之實例的方塊圖。在一個實例中,視訊解碼器30可經組態以執行以下操作:接收經熵編碼位元串流,該經熵編碼位元串流包括旗標之集合及對應於每一旗標之各別語法元素,其中每一旗標指示各別預測單元(PU)之預測模式是否基於至最可能模式之清單的索引;CABAC解碼旗標之集合;旁路解碼該等各別語法元素;及基於每一旗標及該等各別語法元素之值來重建構視訊資料。
在圖6之實例中,視訊解碼器30包括熵解碼單元70、運動補償單元72、框內預測單元74、反量化處理單元76、反變換處理單元78、參考圖框記憶體82,及求和器80。在一些實例中,視訊解碼器30可執行與關於視訊編碼器20(圖4)所描述之編碼遍次大體上互逆的解碼遍次。
熵解碼單元70接收經熵編碼位元串流,且根據與用以編碼語法元素之熵編碼程序互逆的程序來解碼來自該位元串流之語法元素。在一個實例中,用以編碼語法元素之熵編碼程序可為以上所描述之熵編碼程序中的任一者。
圖7為說明可實施本發明中所描述之技術之實例熵解碼單元70的方塊圖。熵解碼單元70接收經熵編碼位元串流且解碼來自該位元串流之語法元素。語法元素可包括以上所描述之框內預測語法元素prev_intra_luma_pred_flag、mpm_idx、rem_intra_luma_pred_mode、intra_chroma_pred_mode及chroma_pred_from_luma_enable_flag。語法元素由熵解碼單元70解碼之次序可根據寫碼結構(諸如,以上關於表3至表10所描述之實例寫碼結構)來定義。圖7中之實例熵解碼單元70包括算術解碼單元702,算術解碼單元702可包括旁路解碼引擎704及規則解碼引擎706。實例熵解碼單元70亦包括內容脈絡模型化單元708及反二進位化單元710。實例熵解碼單元70可執行關於圖4所描述之實例熵編碼單元56的互逆功能。以此方式,熵解碼單元70可基於本文中所描述之技術來執行熵解碼。
算術解碼單元702接收經編碼位元串流。如圖7中所展示,算術解碼單元702可根據旁路路徑或規則寫碼路徑來處理經編碼二進位值。可用較高層級語法在位元串流中用信號發送經編碼二進位值應根據旁路路徑抑或規則路徑進行處理的指示。與以上所描述之CABAC程序一致,在算術解碼單元702自旁路路徑接收二進位值之狀況下,旁路解碼引擎704可在不利用指派給二進位值之內容脈絡的情況下對二進位值執行算術編碼。在一個實例中,旁路解碼引擎704可假設二進位具有可能值之機率相等。
在算術解碼單元702經由規則路徑接收二進位值之狀況下,內容脈絡模型化單元708可提供內容脈絡變數,以使得規則解碼引擎706可基於由內容脈絡模型化單元708提供之內容脈絡指派來執行算術編碼。可根據諸如HEVC之視訊寫碼標準來定義內容脈絡指派。內容脈絡模型可儲存於記憶體中。內容脈絡模型化單元708可包括一系列經編索引之表及/或利用映射函數來判定經編碼位元串流之內容脈絡及 內容脈絡變數部分。在解碼二進位值之後,規則寫碼引擎706可基於經解碼二進位值來更新內容脈絡。另外,反二進位化單元710可對二進位值執行反二進位化且使用二進位匹配函數來判定二進位值是否有效。反二進位化單元710亦可基於匹配判定來更新內容脈絡模型化單元。因此,反二進位化單元710根據內容脈絡自適應性解碼技術來輸出語法元素。
熵解碼單元70接收語法元素之集合內之語法元素的次序可判定熵解碼單元70解碼語法元素之集合所需的循環之總數。在一個實例中,規則解碼引擎706可需要兩個以上循環來解碼單一二進位。另外,在一個實例中,規則CABAC解碼引擎706可需要n+M個循環來解碼n個二進位,其中M為用以啟動管線之額外耗用。M通常大於0。在CABAC解碼程序開始時(例如,自旁路模式至規則模式之切換),引入管線額外耗用M。在一個實例中,旁路解碼引擎704可需要一個循環來寫碼n位元語法元素。因此,算術解碼單元510解碼旁路二進位及CABAC二進位之集合所需的循環之總數可基於引入管線額外耗用M之次數。因而,框內預測語法元素在寫碼結構中之配置次序可判定視訊解碼器30解碼視訊資料所需之循環之數目。另外,應注意,儘管將圖7中所說明之實例熵解碼單元70描述為自旁路解碼操作切換至規則解碼操作,但在一些狀況下,此等操作可並列地執行。然而,在此狀況下,熵解碼單元70接收經旁路寫碼及經CABAC寫碼之語法元素的次序仍可判定熵解碼語法元素所需之循環之總數。
再次參看圖6,運動補償單元72可基於自熵解碼單元70所接收之運動向量來產生預測資料。運動補償單元72可使用在位元串流中接收之運動向量識別參考圖框記憶體82中之參考圖框中的預測區塊。運動補償單元72產生經運動補償區塊,從而有可能基於內插濾波器來執行內插。待用於具有子像素精度之運動估計的內插濾波器之識別符可包 括於語法元素中。運動補償單元72可使用如在視訊區塊之編碼期間由視訊編碼器20使用之內插濾波器來計算參考區塊之子整數像素的內插值。運動補償單元72可根據所接收語法資訊來判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器產生預測性區塊。
運動補償單元72使用語法資訊中之一些來判定用以編碼經編碼視訊序列之圖框的巨集區塊之大小、描述如何分割經編碼視訊序列之圖框之每一巨集區塊的分割資訊、指示如何編碼每一分割區之模式、用於每一經框間編碼巨集區塊或分割區之一或多個參考圖框(及參考圖框清單),及用以解碼經編碼視訊序列之其他資訊。
框內預測單元74可使用在位元串流中接收之框內預測模式自空間上鄰近之區塊形成預測區塊。框內預測模式可包括以上所描述之框內預測模式。框內預測單元74可根據如以上所描述之語法元素prev_intra_luma_pred_flag、mpm_idx、rem_intra_luma_pred_mode、intra_chroma_pred_mode及chroma_pred_from_luma_enable_flag來判定待使用之框內預測模式。
反量化單元76反量化(亦即,解量化)提供於位元串流中且藉由熵解碼單元70解碼之經量化區塊係數。反量化程序可包括(例如)如由H.264解碼標準所定義之習知程序。反量化程序亦可包括針對每一巨集區塊使用藉由視訊編碼器計算之量化參數QPY,以判定量化程度且同樣地判定應應用之反量化程度。
反變換單元78將反變換(例如,反DCT、反整數變換或概念上類似之反變換程序)應用於變換係數,以便在像素域中產生殘餘區塊。求和器80對殘餘區塊與藉由運動補償單元72或框內預測單元74產生之對應預測區塊進行求和,以形成經解碼區塊。以此方式,視訊解碼器30自經編碼位元串流重建構視訊區塊。
圖8為說明根據本發明之技術解碼視訊資料之實例的流程圖。儘 管以下將圖8中之程序描述為大體上由視訊解碼器30執行,但該程序可由視訊解碼器30、框內預測單元74及/或熵解碼單元70之任何組合執行。
如圖8中所說明,視訊解碼器30接收語法元素之第一群組(802)。 視訊解碼器30接收語法元素之第二群組(804),其中語法元素之第二群組的語法元素對應於語法元素之第一群組的各別語法元素。換言之,視訊解碼器30接收經熵編碼位元串流,該經熵編碼位元串流包括寫碼單元(CU)之預測單元(PU)的語法元素之第一群組及語法元素之第二群組。
在一個實例中,第一群組內之語法元素指示各別預測單元(PU)之預測模式是否基於至最可能模式之清單的索引。在一個實例中,第一群組包括對應於INTRA_N×N PU結構中之四個各別PU的四個語法元素prev_intra_luma_pred_flag。在一個實例中,語法元素之第二群組中的語法元素可為語法元素mpm_idx或rem_intra_luma_pred_mode中之任一者,如以上所描述。在一個實例中,語法元素之第一群組及語法元素之第二群組可根據關於表8所描述之寫碼結構來配置。以此方式,可根據寫碼結構來定義視訊解碼器30接收旗標之集合及各別語法元素且對旗標之集合及各別語法元素執行操作的次序。
視訊解碼器30 CABAC解碼語法元素之第一群組(806)。在一個實例中,視訊解碼器30使用規則內容脈絡自適應性二進位算術寫碼(CABAC)引擎(諸如,關於圖7所描述之規則解碼引擎706)解碼語法元素之第一群組。視訊解碼器30旁路解碼語法元素之第二群組(808)。 在一個實例中,視訊解碼器30可在熵解碼語法元素之第一群組之後熵解碼語法元素之第二群組。另外,在一個實例中,視訊解碼器30可使用旁路解碼引擎(諸如,關於圖7所描述之旁路解碼引擎704)熵解碼語法元素之第二群組。視訊解碼器30基於語法元素之經解碼之第一群組 及語法元素之經解碼之第二群組來解碼及重建構視訊資料(810)。在一個實例中,視訊解碼器30藉由對視訊資料之殘餘區塊與相關聯於各別語法元素之視訊資料的對應預測區塊進行求和來重建構視訊資料。 舉例而言,視訊解碼器30基於語法元素之第一群組及語法元素之經解碼之第二群組來框內預測解碼CU之PU。
重申,類似於以上關於視訊編碼器20及圖5進行之描述,語法元素之第一群組的實例包括複數個旗標(例如,prev_intra_luma_pred_flag語法元素)。該複數個旗標中之旗標可為語法元素之第一群組的指示以下情形之語法元素:各別PU之明度樣本的框內預測模式是否基於至最可能模式之清單的索引。
在一些實例中,語法元素之第二群組包括第一語法元素,該第一語法元素在語法元素之第一群組中的對應語法元素指示各別PU之明度樣本的框內預測模式係基於至最可能模式之清單的索引之情況下指示至最可能模式之清單的索引。舉例而言,若各別PU之prev_intra_luma_pred_flag語法元素指示該各別PU之框內預測模式係基於至最可能模式之清單的索引,則各別PU之對應mpm_idx語法元素指示至最可能模式之清單的索引。在此實例中,將mpm_idx語法元素視為語法元素之第二群組中的第一語法元素。
在一些實例中,語法元素之第二群組包括第二語法元素,該第二語法元素在語法元素之第一群組中的對應語法元素指示各別PU之明度樣本的框內預測模式不基於至最可能模式之清單的索引之情況下指示該各別PU之框內預測模式。舉例而言,若各別PU之prev_intra_luma_pred_flag語法元素指示該各別PU之框內預測模式不基於至最可能模式之清單的索引,則各別PU之對應rem_intra_luma_pred_mode語法元素指示框內預測模式。在此實例中,將rem_intra_luma_pred_mode語法元素視為語法元素之第二群組 中的第二語法元素。
如以上所描述,視訊解碼器30建構之最可能模式之清單識別一或多個相鄰PU之一或多個框內預測模式。在一些實例中,視訊解碼器30可在接收CU之PU的語法元素之第二群組的任何語法元素之前接收CU之PU的語法元素之第一群組的所有語法元素。在一些實例中,視訊解碼器30可在旁路解碼語法元素之第二群組的任何語法元素之前CABAC解碼語法元素之第一群組的所有語法元素。
在以上實例中,當CU之預測模式為INTRA_N×N時,CU包括四個PU,且每一PU具有一個明度框內預測模式,且整個CU僅具有一個色度框內預測模式,然而,此設計可存在一些潛在缺陷。作為一個實例,可存在低效預測效能,此係因為具有不同紋理型樣之四個PU被迫使用一個相同的色度預測模式。作為另一實例,明度分量與色度分量之間可存在不一致模式發信號。
以下描述用以解決與針對整個CU僅存在一個色度框內預測模式之要求相關聯之缺陷的一些實例。可在針對整個CU僅存在一個色度框內預測模式時結合以上所描述之技術,或在僅存在整個CU之一個色度框內預測模式時與以上所描述之技術分離地應用以下技術。
為了解決以上所引入之低效預測效能的潛在問題,本發明之技術包括針對每一PU用信號發送一個色度框內預測模式(如針對明度框內預測模式所進行),亦即,在當前HEVC標準之內容脈絡中,針對具有如INTRA_N×N之預測模式的CU用信號發送四個chroma_intra_prediction_mode。藉由此設計,因此用信號發送一個「luma_intra_prediction_mode」語法元素及一個「chroma_intra_prediction_mode」語法元素以表示PU之框內預測模式。
在一些實例中,除非當前CU大小等於8×8且最小變換單元大小為 4×4,否則可應用此框內模式發信號方案。更一般而言,在當前CU大小在每一維度上為最小變換單元大小之兩倍時,此例外狀況存在,此情形意謂當前CU之色度分量等於最小變換單元大小且無法進一步分裂成四個PU(假設原始格式為YUV420)。在此狀況下,僅針對當前CU用信號發送一個chroma_intra_prediction_mode。
根據此等實例,可如表11及表12之實例中所展示來實施框內模式之寫碼結構。
以下描述定義CU之每一PU之明度樣本及每一PU之色度樣本的框內預測模式而非針對整個CU之色度樣本僅定義一個框內預測模式的實例。表13及表14分別定義用於針對intra_2N×2N及intra_N×N之框內模式寫碼結構配置框內預測語法的方式,其中將明度框內預測模式及色度框內預測模式之所有經CABAC寫碼之二進位一起寫碼,且接著將明度框內預測模式及色度框內預測模式之所有經旁路寫碼之二進位一起寫碼。表15及表16分別定義用於針對intra_2N×2N及intra_N×N之框內模式寫碼結構配置框內預測語法的方式,其中將CU中之所有PU之框內預測模式的所有經CABAC寫碼之二進位一起寫碼,且接著將框內預測模式之所有經旁路寫碼之二進位一起寫碼。表17及表18分別定義用於針對intra_2N×2N及intra_N×N之框內模式寫碼結構配置框內預測語法的方式,其中將CU中之所有PU之明度框內預測模式及色度框內預測模式兩者的所有經CABAC寫碼之二進位寫碼,且接著將明度框內預測模式及色度框內預測模式之所有經旁路寫碼之二進位一起寫碼。
在一或多個實例中,所描述之功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則該等功能可作為一或多個指令或 程式碼儲存於電腦可讀媒體上或經由電腦可讀媒體傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體大體上可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例且非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,將任何連接適當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纜、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是有關非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路之一或多個處理器來執行指令。因此,如本文中所使 用,術語「處理器」可指代前述結構或適合於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,可將本文中所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可以廣泛多種器件或裝置實施,該等器件或裝置包括無線手機、積體電路(IC)或IC之集合(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示之技術的器件之功能態樣,但未必需要藉由不同硬體單元來實現。更確切而言,如以上所描述,可將各種單元組合於編解碼器硬體單元中,或藉由交互操作之硬體單元(包括如以上所描述之一或多個處理器)之集合結合合適軟體及/或韌體來提供。已描述各種實例。此等及其他實例在以下申請專利範圍之範疇內。

Claims (47)

  1. 一種用於解碼視訊資料之方法,該方法包含:接收一經熵編碼位元串流,該經熵編碼位元串流包括一寫碼單元(CU)之預測單元(PU)的語法元素之一第一群組及語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素,且其中語法元素之該第一群組的一語法元素指示該CU中之一各別PU的一框內預測模式是否基於至最可能模式之一清單的一索引;內容脈絡自適應性二進位算術寫碼(CABAC)解碼語法元素之該第一群組;在CABAC解碼語法元素之該第一群組之後,旁路解碼語法元素之該第二群組;及基於語法元素之該經解碼之第一群組及語法元素之該經解碼之第二群組重建構該視訊資料。
  2. 如請求項1之方法,其中語法元素之該第一群組包含複數個旗標,其中該複數個旗標中之一旗標包含語法元素之該第一群組的指示以下情形之該語法元素:該各別PU之明度樣本的該框內預測模式是否基於至最可能模式之該清單的該索引,且其中語法元素之該第二群組包含以下各者中之一者:一第一語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式係基於至最可能模式之該清單的該索引之情況下指示至最可能模式之該清單的該索引;及一第二語法元素,其在語法元素之該第一群組中的該旗標 指示該各別PU之該等明度樣本的該框內預測模式不基於至最可能模式之該清單的該索引之情況下指示該各別PU之該等明度樣本的該框內預測模式。
  3. 如請求項1之方法,其中最可能模式之該清單識別一或多個相鄰PU之一或多個框內預測模式。
  4. 如請求項1之方法,其中接收包含在接收該CU之該等PU的語法元素之該第二群組的任何語法元素之前接收該CU之該等PU的語法元素之該第一群組的所有語法元素。
  5. 如請求項1之方法,其中CABAC解碼包含在旁路解碼語法元素之該第二群組的任何語法元素之前CABAC解碼語法元素之該第一群組的所有語法元素。
  6. 如請求項1之方法,其中語法元素之該第一群組包括四個旗標,且其中該四個旗標中之每一者與該CU之一INTRA_N×N PU結構的一各別PU相關聯。
  7. 如請求項1之方法,其中重建構包含:基於語法元素之該第一群組及語法元素之該第二群組來框內預測解碼該CU之該等PU。
  8. 一種用於解碼視訊資料之裝置,該裝置包含組態以執行以下操作之一視訊解碼器:接收一經熵編碼位元串流,該經熵編碼位元串流包括一寫碼單元(CU)之預測單元(PU)的語法元素之一第一群組及語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素,且其中語法元素之該第一群組的一語法元素指示該CU中之一各別PU的一框內預測模式是否基於至最可能模式之一清單的一索引;內容脈絡自適應性二進位算術寫碼(CABAC)解碼語法元素之 該第一群組;在CABAC解碼語法元素之該第一群組之後,旁路解碼語法元素之該第二群組;及基於語法元素之該經解碼之第一群組及語法元素之該經解碼之第二群組重建構該視訊資料。
  9. 如請求項8之裝置,其中語法元素之該第一群組包含複數個旗標,其中該複數個旗標中之一旗標包含語法元素之該第一群組的指示以下情形之該語法元素:該各別PU之明度樣本的該框內預測模式是否基於至最可能模式之該清單的該索引,且其中語法元素之該第二群組包含以下各者中之一者:一第一語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式係基於至最可能模式之該清單的該索引之情況下指示至最可能模式之該清單的該索引;及一第二語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式不基於至最可能模式之該清單的該索引之情況下指示該各別PU之該等明度樣本的該框內預測模式。
  10. 如請求項8之裝置,其中最可能模式之該清單識別一或多個相鄰PU之一或多個框內預測模式。
  11. 如請求項8之裝置,其中為了接收,該視訊解碼器經組態以在接收該CU之該等PU的語法元素之該第二群組的任何語法元素之前接收該CU之該等PU的語法元素之該第一群組的所有語法元素。
  12. 如請求項8之裝置,其中為了CABAC解碼,該視訊解碼器經組態以在旁路解碼語法元素之該第二群組的任何語法元素之前 CABAC解碼語法元素之該第一群組的所有語法元素。
  13. 如請求項8之裝置,其中語法元素之該第一群組包括四個旗標,且其中該四個旗標中之每一者與該CU之一INTRA_N×N PU結構的一各別PU相關聯。
  14. 如請求項8之裝置,其中為了重建構,該視訊解碼器經組態以執行以下操作:基於語法元素之該第一群組及語法元素之該第二群組來框內預測解碼該CU之該等PU。
  15. 如請求項8之裝置,其中該裝置包含以下各者中之至少一者:一積體電路;一微處理器;及一無線通信器件,其包括該視訊解碼器。
  16. 一種電腦可讀儲存媒體,其具有儲存於其上之指令,該等指令在執行時使用於解碼視訊資料之一器件的一或多個處理器執行以下操作:接收一經熵編碼位元串流,該經熵編碼位元串流包括一寫碼單元(CU)之預測單元(PU)的語法元素之一第一群組及語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素,且其中語法元素之該第一群組的一語法元素指示該CU中之一各別PU的一框內預測模式是否基於至最可能模式之一清單的一索引;內容脈絡自適應性二進位算術寫碼(CABAC)解碼語法元素之該第一群組;在CABAC解碼語法元素之該第一群組之後,旁路解碼語法元素之該第二群組;及基於語法元素之該經解碼之第一群組及語法元素之該經解碼 之第二群組重建構該視訊資料。
  17. 如請求項16之電腦可讀儲存媒體,其中語法元素之該第一群組包含複數個旗標,其中該複數個旗標中之一旗標包含語法元素之該第一群組的指示以下情形之該語法元素:該各別PU之明度樣本的該框內預測模式是否基於至最可能模式之該清單的該索引,且其中語法元素之該第二群組包含以下各者中之一者:一第一語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式係基於至最可能模式之該清單的該索引之情況下指示至最可能模式之該清單的該索引;及一第二語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式不基於至最可能模式之該清單的該索引之情況下指示該各別PU之該等明度樣本的該框內預測模式。
  18. 如請求項16之電腦可讀儲存媒體,其中最可能模式之該清單識別一或多個相鄰PU之一或多個框內預測模式。
  19. 如請求項16之電腦可讀儲存媒體,其中使該一或多個處理器接收之該等指令包含使該一或多個處理器執行以下操作之指令:在接收該CU之該等PU的語法元素之該第二群組的任何語法元素之前接收該CU之該等PU的語法元素之該第一群組的所有語法元素。
  20. 如請求項16之電腦可讀儲存媒體,其中使該一或多個處理器CABAC解碼之該等指令包含使該一或多個處理器執行以下操作之指令:在旁路解碼語法元素之該第二群組的任何語法元素之前CABAC解碼語法元素之該第一群組的所有語法元素。
  21. 如請求項16之電腦可讀儲存媒體,其中語法元素之該第一群組包括四個旗標,且其中該四個旗標中之每一者與該CU之一INTRA_N×N PU結構的一各別PU相關聯。
  22. 如請求項16之電腦可讀儲存媒體,其中使該一或多個處理器重建構之該等指令包含使該一或多個處理器執行以下操作之指令:基於語法元素之該第一群組及語法元素之該第二群組來框內預測解碼該CU之該等PU。
  23. 一種用於解碼視訊資料之裝置,該裝置包含:用於接收一經熵編碼位元串流之構件,該經熵編碼位元串流包括一寫碼單元(CU)之預測單元(PU)的語法元素之一第一群組及語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素,且其中語法元素之該第一群組的一語法元素指示該CU中之一各別PU的一框內預測模式是否基於至最可能模式之一清單的一索引;用於內容脈絡自適應性二進位算術寫碼(CABAC)解碼語法元素之該第一群組的構件;用於在CABAC解碼語法元素之該第一群組之後旁路解碼語法元素之該第二群組的構件;及用於基於語法元素之該經解碼之第一群組及語法元素之該經解碼之第二群組重建構該視訊資料的構件。
  24. 如請求項23之裝置,其中語法元素之該第一群組包含複數個旗標,其中該複數個旗標中之一旗標包含語法元素之該第一群組的指示以下情形之該語法元素:該各別PU之明度樣本的該框內預測模式是否基於至最可能模式之該清單的該索引,且 其中語法元素之該第二群組包含以下各者中之一者:一第一語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式係基於至最可能模式之該清單的該索引之情況下指示至最可能模式之該清單的該索引;及一第二語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式不基於至最可能模式之該清單的該索引之情況下指示該各別PU之該等明度樣本的該框內預測模式。
  25. 一種用於編碼視訊資料之方法,該方法包含:產生語法元素之一第一群組,其中語法元素之該第一群組的一語法元素指示一寫碼單元(CU)中之一各別預測單元(PU)的一框內預測模式是否基於至最可能模式之一清單的一索引;產生語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素;內容脈絡自適應性二進位算術寫碼(CABAC)編碼語法元素之該第一群組;在CABAC編碼語法元素之該第一群組之後,旁路編碼語法元素之該第二群組;及輸出包括語法元素之該經編碼之第一群組及語法元素之該經編碼之第二群組的該視訊資料。
  26. 如請求項25之方法,其中語法元素之該第一群組包含複數個旗標,其中該複數個旗標中之一旗標包含語法元素之該第一群組的指示以下情形之該語法元素:該各別PU之明度樣本的該框內預測模式是否基於至最可能模式之該清單的該索引,且 其中語法元素之該第二群組包含以下各者中之一者:一第一語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式係基於至最可能模式之該清單的該索引之情況下指示至最可能模式之該清單的該索引;及一第二語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式不基於至最可能模式之該清單的該索引之情況下指示該各別PU之該等明度樣本的該框內預測模式。
  27. 如請求項25之方法,其中最可能模式之該清單識別一或多個相鄰PU之一或多個框內預測模式。
  28. 如請求項25之方法,其中輸出包含在輸出語法元素之該第二群組的任何語法元素之前輸出包括語法元素的該經編碼之第一群組之所有語法元素的該視訊資料。
  29. 如請求項25之方法,其中CABAC編碼包含在旁路編碼語法元素之該第二群組的任何語法元素之前CABAC編碼語法元素之該第一群組的所有語法元素。
  30. 如請求項25之方法,其中語法元素之該第一群組包括四個旗標,且其中該四個旗標中之每一者與該CU之一INTRA_N×N PU結構的一各別PU相關聯。
  31. 如請求項25之方法,其進一步包含:基於語法元素之該第一群組及語法元素之該第二群組來框內預測編碼該CU之該等PU。
  32. 一種用於編碼視訊資料之裝置,該裝置包含經組態以執行以下操作之一視訊編碼器:產生語法元素之一第一群組,其中語法元素之該第一群組的 一語法元素指示一寫碼單元(CU)中之一各別預測單元(PU)的一框內預測模式是否基於至最可能模式之一清單的一索引;產生語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素;內容脈絡自適應性二進位算術寫碼(CABAC)編碼語法元素之該第一群組;在CABAC編碼語法元素之該第一群組之後,旁路編碼語法元素之該第二群組;及輸出包括語法元素之該經編碼之第一群組及語法元素之該經編碼之第二群組的該視訊資料。
  33. 如請求項32之裝置,其中語法元素之該第一群組包含複數個旗標,其中該複數個旗標中之一旗標包含語法元素之該第一群組的指示以下情形之該語法元素:該各別PU之明度樣本的該框內預測模式是否基於至最可能模式之該清單的該索引,且其中語法元素之該第二群組包含以下各者中之一者:一第一語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式係基於至最可能模式之該清單的該索引之情況下指示至最可能模式之該清單的該索引;及一第二語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式不基於至最可能模式之該清單的該索引之情況下指示該各別PU之該等明度樣本的該框內預測模式。
  34. 如請求項32之裝置,其中最可能模式之該清單識別一或多個相鄰PU之一或多個框內預測模式。
  35. 如請求項32之裝置,其中為了輸出,該視訊編碼器經組態以在輸出語法元素之該第二群組的任何語法元素之前輸出包括語法元素的該經編碼之第一群組之所有語法元素的該視訊資料。
  36. 如請求項32之裝置,其中為了CABAC編碼,該視訊編碼器經組態以在旁路編碼語法元素之該第二群組的任何語法元素之前CABAC編碼語法元素之該第一群組的所有語法元素。
  37. 如請求項32之裝置,其中語法元素之該第一群組包括四個旗標,且其中該四個旗標中之每一者與該CU之一INTRA_N×N PU結構的一各別PU相關聯。
  38. 如請求項32之裝置,其中該視訊編碼器經組態以執行以下操作:基於語法元素之該第一群組及語法元素之該第二群組來框內預測編碼該CU之該等PU。
  39. 一種電腦可讀儲存媒體,其具有儲存於其上之指令,該等指令在執行時使用於編碼視訊資料之一器件的一或多個處理器執行以下操作:產生語法元素之一第一群組,其中語法元素之該第一群組的一語法元素指示一寫碼單元(CU)中之一各別預測單元(PU)的一框內預測模式是否基於至最可能模式之一清單的一索引;產生語法元素之一第二群組,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素;內容脈絡自適應性二進位算術寫碼(CABAC)編碼語法元素之該第一群組;在CABAC編碼語法元素之該第一群組之後,旁路編碼語法元素之該第二群組;及輸出包括語法元素之該經編碼之第一群組及語法元素之該經 編碼之第二群組的該視訊資料。
  40. 如請求項39之電腦可讀儲存媒體,其中語法元素之該第一群組包含複數個旗標,其中該複數個旗標中之一旗標包含語法元素之該第一群組的指示以下情形之該語法元素:該各別PU之明度樣本的該框內預測模式是否基於至最可能模式之該清單的該索引,且其中語法元素之該第二群組包含以下各者中之一者:一第一語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式係基於至最可能模式之該清單的該索引之情況下指示至最可能模式之該清單的該索引;及一第二語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式不基於至最可能模式之該清單的該索引之情況下指示該各別PU之該等明度樣本的該框內預測模式。
  41. 如請求項39之電腦可讀儲存媒體,其中最可能模式之該清單識別一或多個相鄰PU之一或多個框內預測模式。
  42. 如請求項39之電腦可讀儲存媒體,其中使該一或多個處理器輸出之該等指令包含使該一或多個處理器執行以下操作之指令:在輸出語法元素之該第二群組的任何語法元素之前輸出包括語法元素的該經編碼之第一群組之所有語法元素之該視訊資料。
  43. 如請求項39之電腦可讀儲存媒體,其中使該一或多個處理器CABAC編碼之該等指令包含使該一或多個處理器執行以下操作之指令:在旁路編碼語法元素之該第二群組的任何語法元素之前CABAC編碼語法元素之該第一群組的所有語法元素。
  44. 如請求項39之電腦可讀儲存媒體,其中語法元素之該第一群組 包括四個旗標,且其中該四個旗標中之每一者與該CU之一INTRA_N×N PU結構的一各別PU相關聯。
  45. 如請求項39之電腦可讀儲存媒體,其進一步包含使該一或多個處理器執行以下操作之指令:基於語法元素之該第一群組及語法元素之該第二群組來框內預測編碼該CU之該等PU。
  46. 一種用於編碼視訊資料之裝置,該裝置包含:用於產生語法元素之一第一群組的構件,其中語法元素之該第一群組的一語法元素指示一寫碼單元(CU)中之一各別預測單元(PU)的一框內預測模式是否基於至最可能模式之一清單的一索引;用於產生語法元素之一第二群組的構件,其中語法元素之該第二群組的語法元素對應於語法元素之該第一群組的各別語法元素;用於內容脈絡自適應性二進位算術寫碼(CABAC)編碼語法元素之該第一群組的構件;用於在CABAC編碼語法元素之該第一群組之後旁路編碼語法元素之該第二群組的構件;及用於輸出包括語法元素之該經編碼之第一群組及語法元素之該經編碼之第二群組之該視訊資料的構件。
  47. 如請求項46之裝置,其中語法元素之該第一群組包含複數個旗標,其中該複數個旗標中之一旗標包含語法元素之該第一群組的指示以下情形之該語法元素:該各別PU之明度樣本的該框內預測模式是否基於至最可能模式之該清單的該索引,且其中語法元素之該第二群組包含以下各者中之一者: 一第一語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式係基於至最可能模式之該清單的該索引之情況下指示至最可能模式之該清單的該索引;及一第二語法元素,其在語法元素之該第一群組中的該旗標指示該各別PU之該等明度樣本的該框內預測模式不基於至最可能模式之該清單的該索引之情況下指示該各別PU之該等明度樣本的該框內預測模式。
TW102112894A 2012-04-11 2013-04-11 在視訊寫碼中分組經旁路寫碼語法元素 TWI481237B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261623004P 2012-04-11 2012-04-11
US201261639836P 2012-04-27 2012-04-27
US13/839,855 US9538172B2 (en) 2012-04-11 2013-03-15 Grouping bypass coded syntax elements in video coding

Publications (2)

Publication Number Publication Date
TW201404161A true TW201404161A (zh) 2014-01-16
TWI481237B TWI481237B (zh) 2015-04-11

Family

ID=49325051

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102112894A TWI481237B (zh) 2012-04-11 2013-04-11 在視訊寫碼中分組經旁路寫碼語法元素

Country Status (22)

Country Link
US (1) US9538172B2 (zh)
EP (1) EP2847997B1 (zh)
JP (1) JP5940726B2 (zh)
KR (1) KR101642629B1 (zh)
CN (1) CN104221374B (zh)
AU (1) AU2013246251B2 (zh)
BR (1) BR112014025406B1 (zh)
CA (1) CA2867764C (zh)
DK (1) DK2847997T3 (zh)
ES (1) ES2561609T3 (zh)
HK (1) HK1201003A1 (zh)
HU (1) HUE026345T2 (zh)
IL (1) IL234650A (zh)
MY (1) MY166911A (zh)
PH (1) PH12014502290B1 (zh)
PL (1) PL2847997T3 (zh)
PT (1) PT2847997E (zh)
RU (1) RU2623884C2 (zh)
SG (1) SG11201405752SA (zh)
TW (1) TWI481237B (zh)
WO (1) WO2013154939A1 (zh)
ZA (1) ZA201407858B (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120016991A (ko) * 2010-08-17 2012-02-27 오수미 인터 프리딕션 방법
US9729884B2 (en) * 2012-01-18 2017-08-08 Lg Electronics Inc. Method and device for entropy coding/decoding
US9264706B2 (en) * 2012-04-11 2016-02-16 Qualcomm Incorporated Bypass bins for reference index coding in video coding
US9942551B2 (en) * 2015-01-30 2018-04-10 Qualcomm Incorporated Palette index grouping for video coding
US10148961B2 (en) * 2015-05-29 2018-12-04 Qualcomm Incorporated Arithmetic coder with multiple window sizes
US11146788B2 (en) 2015-06-12 2021-10-12 Qualcomm Incorporated Grouping palette bypass bins for video coding
US10142627B2 (en) * 2015-06-18 2018-11-27 Qualcomm Incorporated Intra prediction and intra mode coding
US10841593B2 (en) 2015-06-18 2020-11-17 Qualcomm Incorporated Intra prediction and intra mode coding
US11463689B2 (en) 2015-06-18 2022-10-04 Qualcomm Incorporated Intra prediction and intra mode coding
ES2677193B1 (es) 2015-08-28 2019-06-19 Kt Corp Procedimiento y dispositivo para procesar señales de vídeo
US10708164B2 (en) 2016-05-03 2020-07-07 Qualcomm Incorporated Binarizing secondary transform index
US10750169B2 (en) * 2016-10-07 2020-08-18 Mediatek Inc. Method and apparatus for intra chroma coding in image and video coding
US11496747B2 (en) 2017-03-22 2022-11-08 Qualcomm Incorporated Intra-prediction mode propagation
WO2019027074A1 (ko) * 2017-08-04 2019-02-07 엘지전자(주) 멀티 심볼 엔트로피 코딩을 위한 멀티 심볼 매핑을 수행하는 방법 및 장치
TWI706670B (zh) 2018-06-19 2020-10-01 大陸商北京字節跳動網絡技術有限公司 廣義運動向量差解析度
US11277644B2 (en) 2018-07-02 2022-03-15 Qualcomm Incorporated Combining mode dependent intra smoothing (MDIS) with intra interpolation filter switching
EP4325859A3 (en) 2018-09-19 2024-05-15 Beijing Bytedance Network Technology Co., Ltd. Syntax reuse for affine mode with adaptive motion vector resolution
CA3113755A1 (en) 2018-09-25 2020-04-02 Telefonaktiebolaget Lm Ericsson (Publ) Media bistream having backwards compatibility
US11303885B2 (en) 2018-10-25 2022-04-12 Qualcomm Incorporated Wide-angle intra prediction smoothing and interpolation
AU2020236358A1 (en) * 2019-03-11 2021-11-11 Interdigital Vc Holdings, Inc. Reducing the number of regular coded bins
CN113661712A (zh) * 2019-03-12 2021-11-16 夏普株式会社 在视频编码中用于执行帧内预测编码的系统和方法
US10587286B1 (en) * 2019-03-18 2020-03-10 Blackberry Limited Methods and devices for handling equiprobable symbols in entropy coding
US11057619B2 (en) 2019-03-23 2021-07-06 Lg Electronics Inc. Image coding method and apparatus based on intra prediction using MPM list
CN113661709A (zh) * 2019-03-27 2021-11-16 北京字节跳动网络技术有限公司 仿射高级运动矢量预测中的运动信息精度对齐
US11303898B2 (en) * 2019-04-03 2022-04-12 Mediatek Inc. Coding transform coefficients with throughput constraints
WO2020242260A1 (ko) * 2019-05-31 2020-12-03 한국전자통신연구원 전역적 문맥을 이용하는 기계 학습 기반의 이미지 압축을 위한 방법 및 장치
KR20210137222A (ko) 2019-06-03 2021-11-17 엘지전자 주식회사 매트릭스 기반 인트라 예측 장치 및 방법
US11412262B2 (en) * 2019-06-24 2022-08-09 Qualcomm Incorporated Nonlinear extensions of adaptive loop filtering for video coding
EP3987803A1 (en) * 2019-06-24 2022-04-27 InterDigital VC Holdings, Inc. Method and apparatus for signaling decoding data using high level syntax elements
WO2021071297A1 (ko) * 2019-10-08 2021-04-15 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
US11876970B2 (en) * 2021-07-22 2024-01-16 Tencent America LLC Non-interleaved separate tree

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI235579B (en) 2002-03-29 2005-07-01 Nti Inc Communication apparatus, communication system, encrypting apparatus information processing apparatus, information processing system, information processing method, and service providing method
JP4591657B2 (ja) * 2003-12-22 2010-12-01 キヤノン株式会社 動画像符号化装置及びその制御方法、プログラム
KR100612015B1 (ko) 2004-07-22 2006-08-11 삼성전자주식회사 컨텍스트 적응형 이진 산술 부호화 방법 및 그 장치
WO2007148906A1 (en) 2006-06-19 2007-12-27 Lg Electronics, Inc. Method and apparatus for processing a vedeo signal
US8199796B2 (en) 2006-12-22 2012-06-12 Newport Media, Inc. Physical layer aware video encoding for mobile TV applications
US7839311B2 (en) 2007-08-31 2010-11-23 Qualcomm Incorporated Architecture for multi-stage decoding of a CABAC bitstream
US8938009B2 (en) * 2007-10-12 2015-01-20 Qualcomm Incorporated Layered encoded bitstream structure
TWI353792B (en) 2008-08-07 2011-12-01 Acer Inc Method, program for computer readable media, and p
CN101790096B (zh) 2009-01-24 2013-03-13 华为技术有限公司 基于二重预测的编解码方法及装置
US8294603B2 (en) 2009-06-30 2012-10-23 Massachusetts Institute Of Technology System and method for providing high throughput entropy coding using syntax element partitioning
KR101712098B1 (ko) 2009-09-04 2017-03-03 삼성전자 주식회사 구문 요소에 기초한 비트스트림 생성 방법 및 장치
US9973768B2 (en) * 2010-03-16 2018-05-15 Texas Instruments Incorporated CABAC decoder with decoupled arithmetic decoding and inverse binarization
US9591320B2 (en) 2010-07-15 2017-03-07 Texas Instruments Incorporated Context and bypass encoding video
BR112013002029B1 (pt) 2010-07-28 2022-06-28 Nokia Technologies Oy Método, aparelho e meio de armazenamento
KR101583199B1 (ko) * 2010-09-27 2016-01-07 엘지전자 주식회사 블록 분할 방법 및 복호화 장치
JP5855570B2 (ja) 2010-09-30 2016-02-09 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、プログラムおよび集積回路

Also Published As

Publication number Publication date
MY166911A (en) 2018-07-24
SG11201405752SA (en) 2014-10-30
JP2015516765A (ja) 2015-06-11
AU2013246251B2 (en) 2017-01-19
EP2847997B1 (en) 2015-11-04
US9538172B2 (en) 2017-01-03
CN104221374A (zh) 2014-12-17
IL234650A (en) 2016-03-31
CA2867764A1 (en) 2013-10-17
PT2847997E (pt) 2016-02-09
KR101642629B1 (ko) 2016-07-25
TWI481237B (zh) 2015-04-11
US20130272380A1 (en) 2013-10-17
EP2847997A1 (en) 2015-03-18
JP5940726B2 (ja) 2016-06-29
RU2014145203A (ru) 2016-06-10
BR112014025406A2 (zh) 2017-06-20
KR20150003277A (ko) 2015-01-08
BR112014025406B1 (pt) 2022-12-06
HUE026345T2 (en) 2016-05-30
DK2847997T3 (en) 2015-12-07
CA2867764C (en) 2017-09-05
CN104221374B (zh) 2018-09-14
RU2623884C2 (ru) 2017-06-29
AU2013246251A1 (en) 2014-10-23
PL2847997T3 (pl) 2016-04-29
ZA201407858B (en) 2017-09-27
PH12014502290A1 (en) 2014-12-15
ES2561609T3 (es) 2016-02-29
PH12014502290B1 (en) 2014-12-15
HK1201003A1 (zh) 2015-08-14
WO2013154939A1 (en) 2013-10-17

Similar Documents

Publication Publication Date Title
TWI481237B (zh) 在視訊寫碼中分組經旁路寫碼語法元素
US11431968B2 (en) Variable number of intra modes for video coding
WO2019120305A1 (zh) 图像块的运动信息的预测方法、装置及编解码器
US9699472B2 (en) Restriction of prediction units in B slices to uni-directional inter prediction
WO2020068599A1 (en) Adaptive multiple transform coding
CN113940069A (zh) 用于视频译码中的低频不可分离变换的变换和最后有效系数位置信令
TW201342920A (zh) 在視訊寫碼中用於色度分量之變換單位分割
CN114128286A (zh) 视频编解码中的环绕运动补偿
CN114830648A (zh) 用于视频译码的图像报头信令
TW202127887A (zh) 視訊解碼中用於聯合色度殘差模式的量化參數訊號傳遞
KR20220009946A (ko) 적응적 루프 필터들에 대한 클리핑 값 계산의 단순화
CN112335251B (zh) 以分组的旁路位元的系数编码
US11722692B2 (en) History-based motion vector predictor constraint for merge estimation region
CN113170141A (zh) 帧间预测方法和相关装置
CN114503590A (zh) 用信号发送针对变换跳过中的残差值的译码方案以进行视频译码
WO2020257557A1 (en) Maximum allowed block size for bdpcm mode