TWI523530B - 導出最末位置寫碼之上下文以供視訊寫碼 - Google Patents
導出最末位置寫碼之上下文以供視訊寫碼 Download PDFInfo
- Publication number
- TWI523530B TWI523530B TW102110387A TW102110387A TWI523530B TW I523530 B TWI523530 B TW I523530B TW 102110387 A TW102110387 A TW 102110387A TW 102110387 A TW102110387 A TW 102110387A TW I523530 B TWI523530 B TW I523530B
- Authority
- TW
- Taiwan
- Prior art keywords
- video
- value
- binary
- block
- context
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本申請案主張2012年3月22日提交之美國臨時申請案第61/614,178號、2012年4月4日提交的美國臨時申請案第61/620,273號,以及2012年6月29日提交的美國臨時申請案第61/666,316號的權益,該等申請案之每一者的全部內容特此以引用之方式併入本文中。
本發明係關於視訊寫碼。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板型電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲機、蜂巢式或衛星無線電電話、所謂的「智慧型手機」、視訊電傳會議器件、視訊串流器件,及其類似者。數位視訊器件實施視訊寫碼技術,諸如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4部分10進階視訊寫碼(AVC)所定義之標準、目前正在開發中之高效率視訊寫碼(HEVC)標準及此等標準之擴展中所描述的視訊寫碼技術。視訊器件可藉由實施此等視訊寫碼技術來更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊寫碼技術包括空間(圖片內)預測及/或時間(圖片間)預測以減
少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼,可將視訊圖塊(例如,視訊圖框或視訊圖框之一部分)分割成視訊區塊(其亦可被稱作樹型區塊)、寫碼單元(CU)及/或寫碼節點。可使用相對於同一圖片中之相鄰區塊中之參考樣本的空間預測來編碼圖片之框內寫碼(I)圖塊中的視訊區塊。圖片之框間寫碼(P或B)圖塊中之視訊區塊可使用相對於同一圖片中之相鄰區塊中之參考樣本的空間預測,或相對於其他參考圖片中之參考樣本之時間預測。圖片可被稱作圖框,且參考圖片可被稱作參考圖框。
空間預測或時間預測導致針對待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本之區塊的運動向量,及指示經寫碼區塊與預測性區塊之間的差異之殘餘資料來編碼框間寫碼區塊。根據框內寫碼模式及殘餘資料來編碼框內寫碼區塊。為了進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而引起殘餘變換係數,可接著量化殘餘變換係數。可掃描最初配置成二維陣列之經量化之變換係數以便產生變換係數之一維向量,且可應用熵寫碼以達成甚至更多壓縮。
一般而言,本發明描述用於使用一或多個函數寫碼與視訊資料相關聯之語法元素的技術。舉例而言,一器件可實施該等技術中之一或多者以寫碼一值,其中該值指示視訊資料之區塊(諸如變換單元或「TU」)之一最末有效係數的位置。為了寫碼該值,該器件可使用對應於最末有效係數之二進位化值中的每一位元(或「二進位」)之索引的函數,其中該索引指示該二進位在表示該二進位化值之二進位陣列中的位置。
在一實例中,一種方法包括使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位的上
下文,並使用所判定的上下文寫碼該二進位。
在另一實例中,用於寫碼視訊資料之器件包括一視訊寫碼器,該視訊寫碼器經組態以使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位的上下文,並使用所判定的上下文寫碼該二進位。
在另一實例中,一種器件包括使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位之上下文的構件,以及使用所判定的上下文寫碼該二進位的構件。
在另一實例中,一種電腦可讀儲存媒體編碼有指令。當執行時,該等指令使得一計算器件之一可程式化處理器使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位的上下文,並使用所判定的上下文寫碼該二進位。
一或多個實例之細節陳述於隨附圖式及以下描述中。其他特徵、目標及優勢將自該描述及該等圖式以及自申請專利範圍顯而易見。
10‧‧‧視訊編碼及解碼系統/系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
40‧‧‧模式選擇單元
42‧‧‧運動補償單元
44‧‧‧運動估計單元
46‧‧‧框內預測單元
48‧‧‧分割單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧逆量化單元
60‧‧‧逆變換單元
62‧‧‧求和器
64‧‧‧參考圖框記憶體
70‧‧‧熵解碼單元
72‧‧‧運動補償單元
74‧‧‧框內預測單元
76‧‧‧逆量化單元
78‧‧‧逆變換單元
80‧‧‧求和器
82‧‧‧參考圖框記憶體
CU‧‧‧寫碼單元
k‧‧‧值
n‧‧‧值
PU‧‧‧預測單元
QPY‧‧‧量化參數
TU‧‧‧變換單元
圖1為說明可利用用於判定上下文之技術之一實例視訊編碼及解碼系統的方塊圖,其中該上下文用以寫碼表示視訊資料之一區塊之最末有效係數的值。
圖2為說明可實施用於判定上下文之技術之視訊編碼器的一實例的方塊圖,其中該上下文用以寫碼表示視訊資料之一區塊之最末有效係數的值。
圖3為說明可實施用於判定上下文之技術之視訊解碼器的一實例的方塊圖,其中該上下文用以寫碼表示視訊資料之一區塊之最末有效係數的值。
圖4為說明用於編碼視訊資料之當前區塊之實例方法的流程圖。
圖5為說明用於解碼視訊資料之當前區塊之實例方法的流程圖。
一般而言,本發明之技術係關於視訊寫碼。在視訊寫碼中,圖片之序列係使用空間預測(框內預測)或時間預測(框間預測)個別地進行寫碼。詳言之,視訊寫碼器使用框內預測或框間預測來寫碼圖片之個別區塊。視訊寫碼器亦寫碼區塊之殘餘資料,其中該殘餘資料大體上對應於殘餘區塊,該等殘餘區塊表示經預測之資料與原始未經寫碼資料之間的逐像素差異。視訊寫碼器可變換且量化殘餘資料,以產生殘餘區塊之經量化之變換係數。視訊寫碼器進一步寫碼語法資料,諸如係數是否有效(例如,絕對值是否大於零)、有效係數之位置、在掃描次序中的最末有效係數之位置,以及有效係數的位準值。
本發明描述用於寫碼指示視訊資料之一區塊(諸如變換單元(TU))中之最末有效係數的值的技術。詳言之,為了寫碼諸如指示區塊中之最末有效係數之值的語法元素,視訊寫碼器可經組態以應用上下文自適應性二進位算術寫碼(CABAC)。CABAC寫碼涉及使用由上下文索引指示之各種上下文,該等上下文大體上指示二進位化字串之個別位元(或「二進位」)將具有特定值(例如,0或1)之似然性。特定而言,用於寫碼指示區塊中之最末有效係數之值的二進位的上下文係個別地針對該值之每一二進位,亦即,基於二進位在該值中的位置(例如,二進位的索引,假定該值表示為二進位之陣列)來進行判定。
並非使用映射表(其提供用於寫碼特定二進位之上下文的上下文索引之指示),本發明之技術包括使用函數來判定用以寫碼二進位之上下文的上下文索引。詳言之,該函數可為二進位之索引的函數。舉例而言,假定二進位為經寫碼之值的第i個二進位,函數可定義為f(i),其中f(i)傳回對應於將用以寫碼二進位化值之二進位i之上下文的上下文索引值。如上文所描述之上下文可指示二進位i將具有特定值
(例如,0或1)之似然性。
以此方式,本發明描述最末有效係數位置(最末位置)之CABAC寫碼技術。對於待編碼之最末位置二進位,其CABAC上下文之索引可使用一函數而導出,使得可節省最末位置二進位與CABAC上下文之間的映射表(例如,未經儲存)。CABAC寫碼大體上包括兩部分:二進位化及CABAC寫碼。執行二進位化程序以將區塊之最末有效係數的位置轉換為二進位字串,例如,二進位之陣列。用於高效率視訊寫碼測試模型(HM)中之二進位化方法為截斷一元+固定長度編碼。對於截斷一元碼部分,二進位係使用CABAC上下文進行編碼。對於固定長度部分,二進位係使用旁路模式(在未使用上下文的情況下)進行編碼。以下表1中展示32×32 TU(變換單元/變換區塊)之一實例。
以下表2說明用於習知HM中之一實例上下文映射表。表2展示位於不同位置之最末位置可共用相同的上下文。對於一些二進位,例如,8×8區塊之二進位6至7,未指派上下文,原因為,如上文表1中所展示,該等二進位在未使用上下文的情況下進行編碼(旁路模式)。
儘管習知HM使用諸如表2的表來判定用於寫碼最末位置值(亦即,指示視訊資料之區塊中之最末有效係數位置的值)之二進位的上下文,但是本發明之技術包括使用函數來判定用於寫碼最末位置值之二進位的上下文。因而,根據本發明之技術而組態之視訊寫碼器中不需要類似表2的表。以此方式,可將函數用於導出針對最末位置寫碼中的二進位之CABAC上下文索引,使得可移除映射表(表2)。下文更詳細地描述寫碼器件的各種實例,其經組態以執行函數,從而判定用於寫碼語法元素之二進位之上下文。
圖1為說明可利用用於判定上下文之技術之一實例視訊編碼及解碼系統10的方塊圖,其中該上下文用以寫碼表示視訊資料之一區塊之最末有效係數的值。如圖1所示,系統10包括源器件12,該源器件提供稍後由目的地器件14解碼之經編碼的視訊資料。詳言之,源器件12經由電腦可讀媒體16向目的地器件14提供視訊資料。源器件12與目的地器件14可包含廣泛範圍之器件中之任一者,該等器件包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板型電腦、機上盒、諸如所謂「智慧型」手機之電話手機、所謂「智慧型」板、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲機、視訊串流器件,或類似者,在一些狀況下,源器件12及目的地器件14可經配備以進行無線通信。
目的地器件14可經由電腦可讀媒體16接收待解碼之經編碼視訊資料。電腦可讀媒體16可包括能夠將經編碼之視訊資料自源器件12移動至目的地器件14之任一類型之媒體或器件。在一實例中,電腦可讀媒體16可包括一通信媒體,從而使得源器件12能夠即時地將經編碼之視訊資料直接傳輸至目的地器件14。可根據通信標準(諸如,無線通信協定)調變經編碼之視訊資料,且將經編碼之視訊資料傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路
(諸如,區域網路、廣域網路或諸如網際網路之全球網路)的部分。通信媒體可包括路由器、交換器、基地台,或可用以促進自源器件12至目的地器件14之通信的任何其他設備。
在一些實例中,可將經編碼之資料自輸出介面22輸出至儲存器件。類似地,可藉由輸入介面自儲存器件存取經編碼之資料。儲存器件可包括多種分散式或本端存取式資料儲存媒體中之任一者,諸如,硬碟機、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼之視訊資料之任何其他合適的數位儲存媒體。在又一實例中,儲存器件可對應於一檔案伺服器或對應於可儲存源器件12所產生之經編碼視訊的另一中間儲存器件。目的地器件14可經由串流或下載自儲存器件存取所儲存之視訊資料。檔案伺服器可為能夠儲存經編碼之視訊資料且將彼經編碼之視訊資料傳輸至目的地器件14的任何類型的伺服器。實例檔案伺服器包括網路伺服器(例如,用於網站)、FTP伺服器、網路附加儲存(NAS)器件或本端磁碟機。目的地器件14可經由任何標準資料連接(包括網際網路連接)而存取經編碼之視訊資料。此資料連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機,等等),或兩者之組合。經編碼之視訊資料自儲存器件之傳輸可為串流傳輸、下載傳輸,或其組合。
本發明之技術未必限於無線應用或設定。該等技術可應用於支援多種多媒體應用中之任一者的視訊寫碼,該等應用諸如:空中電視廣播、有線電視傳輸、衛星電視傳輸、諸如HTTP動態自適應性串流(DASH)之網際網路串流視訊傳輸、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上之數位視訊之解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。根據本發明,源器件12之視訊編碼器20可經組態以應用用於判定上下文之技術,其中該上下文用以寫碼表示視訊資料之一區塊之最末有效係數的值。在其他實例中,源器件及目的地器件可包括其他組件或配置。舉例而言,源器件12可自外部視訊源18(諸如,外部攝影機)接收視訊資料。同樣地,目的地器件14可與外部顯示器件介接,而非包括整合式顯示器件。
圖1之所說明的系統10僅為一實例。用於判定用以寫碼表示視訊資料之一區塊之最末有效係數之值的上下文的技術可由任一數位視訊編碼及/或解碼器件執行。雖然大體上藉由視訊編碼器件執行本發明之技術,但亦可藉由視訊編碼器/解碼器(通常被稱為「CODEC(編碼解碼器)」)執行該等技術。此外,亦可藉由視訊預處理器來執行本發明之技術。源器件12及目的地器件14僅僅為此等寫碼器件之實例,在該等寫碼器件中,源器件12產生用於傳輸至目的地器件14之經寫碼之視訊資料。在一些實例中,器件12、14可按照實質上對稱之方式進行操作,使得器件12、14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、14之間的單向或雙向視訊傳輸,例如,用於視訊串流、視訊播放、視訊廣播或視訊電話。
源器件12之視訊源18可包括諸如視訊攝影機之視訊俘獲器件、含有先前俘獲之視訊的視訊存檔,及/或用以自視訊內容提供者接收視訊之視訊饋入介面。作為另一替代,視訊源18可產生基於電腦圖形之資料作為源視訊、或產生實況視訊、存檔視訊及電腦產生之視訊的組合。在一些狀況下,若視訊源18為視訊攝影機,則源器件12及目的地器件14可形成所謂的攝影機電話或視訊電話。然而,如上文所提及,本發明中所描述之技術大體上可適用於視訊寫碼,且可應用於無
線及/或有線應用。在每一狀況下,所俘獲的、預先俘獲的或電腦產生之視訊可由視訊編碼器20編碼。然後經編碼之視訊資訊可由輸出介面22輸出至電腦可讀媒體16上。
電腦可讀媒體16可包括暫時性媒體,諸如,無線廣播或有線網路傳輸;或儲存媒體(亦即,非暫時性儲存媒體),諸如,硬碟、隨身碟、光碟、數位影音光碟、藍光光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(圖中未展示)可自源器件12接收經編碼之視訊資料,且(例如)經由網路傳輸將經編碼之視訊資料提供至目的地器件14。類似地,媒體生產設施(諸如,光碟壓印設施)之計算器件可自源器件12接收經編碼之視訊資料且產生含有經編碼之視訊資料之光碟。因此,在各種實例中,可將電腦可讀媒體16理解成包括各種形式之一或多個電腦可讀媒體。
目的地器件14之輸入介面28自電腦可讀媒體16接收資訊。電腦可讀媒體16之該資訊可包括由視訊編碼器20定義,亦由視訊解碼器30使用之語法資訊,該語法資訊包括描述區塊及其他經寫碼單元(例如GOP)之特性及/或處理的語法元素。顯示器件32向使用者顯示經解碼之視訊資料,且可包含各種顯示器件中之任一者,諸如,陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型的顯示器件。
視訊編碼器20及視訊解碼器30可根據諸如目前在開發中的高效率視訊寫碼(HEVC)標準之視訊寫碼標準而操作,且可符合HEVC測試模型(HM)。或者,視訊編碼器20及視訊解碼器30可根據諸如ITU-T H.264標準或者被稱作MPEG-4第10部分進階視訊寫碼(AVC)之其他專屬或工業標準或此等標準之擴展而操作。然而,本發明之技術不限於任何特定寫碼標準。視訊寫碼標準之其他實例包括MPEG-2及ITU-T H.263。雖然未展示於圖1中,但在一些態樣中,視訊編碼器20及視訊
解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體以處置共同資料串流或獨立資料串流中之音訊及視訊兩者的編碼。若適用,則MUX-DEMUX單元可符合ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
ITU-T H.264/MPEG-4(AVC)標準由ITU-T視訊寫碼專家群(VCEG)連同ISO/IEC動畫專家群(MPEG)一起作為被稱為聯合視訊小組(JVT)之集體合作之產物而制定。在一些態樣中,本發明中所描述之技術可應用於大體上符合H.264標準之器件。H.264標準由ITU-T研究小組在2005年3月描述於ITU-T推薦H.264(用於一般視聽服務之進階視訊寫碼)中,其在本文中可被稱作H.264標準或H.264規範,或H.264/AVC標準或規範。聯合視訊小組(JVT)繼續致力於對H.264/MPEG-4 AVC之擴展。
視訊編碼器20及視訊解碼器30可各自實施為多種適宜編碼器電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地在軟體中實施時,一器件可將用於軟體之指令儲存於合適的非暫時性電腦可讀媒體中,且在硬體中使用一或多個處理器來執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中任一者可整合為各別器件中之組合的編碼器/解碼器(編碼解碼器(CODEC))的部分。
JCT-VC正致力於HEVC標準之開發。HEVC標準化努力係基於視訊寫碼器件之演進模型,其被稱作HEVC測試模型(HM)。HM假設視訊寫碼器件相對於根據(例如)ITU-T H.264/AVC之現有器件的若干額外能力。舉例而言,H.264提供九個框內預測編碼模式,而HM可提供多達三十三個框內預測編碼模式。
一般而言,HM之工作模型描述視訊圖框或圖片可被劃分成包括明度樣本及色度樣本兩者之樹型區塊或最大寫碼單元(LCU)之序列。位元串流內之語法資料可定義LCU之大小,LCU就像素之數目而言為最大寫碼單元。圖塊包括按寫碼次序之若干連續樹型區塊。可將視訊圖框或圖片分割成一或多個圖塊。每一樹型區塊可根據四分樹而分裂成若干寫碼單元(CU)。一般而言,四分樹資料結構中對於每一CU包括一個節點,其中根節點對應於樹型區塊。若將CU分裂成四個子CU,則對應於該CU之節點包括四個葉節點,該等葉節點中之每一者對應於該等子CU中之一者。
該四元樹資料結構中之每一節點可提供針對對應CU之語法資料。舉例而言,在四元樹中之節點可包括分裂旗標,其指示是否將對應於該節點之CU分裂成子CU。可遞歸地定義用於CU之語法元素,且用於CU之語法元素可視CU是否分裂成子CU而定。若CU未經進一步分裂,則其被稱作葉CU。在本發明中,即使不存在原始葉CU之明顯分裂,一葉CU之四個子CU亦會被稱作葉CU。舉例而言,若16×16大小之CU未經進一步分裂,則四個8×8子CU亦會被稱作葉CU,儘管該16×16 CU從未經分裂。
除了CU不具有大小區別之外,CU具有與H.264標準之巨集區塊類似的用途。舉例而言,樹型區塊可分裂成四個子節點(亦被稱作子CU),且每一子節點可又為父節點並分裂成另外四個子節點。被稱作四分樹之葉節點之最終的未分裂子節點包含一寫碼節點,該寫碼節點亦被稱作葉CU。與經寫碼之位元串流相關聯的語法資料可定義可分裂樹區塊之最大次數(其被稱作最大CU深度),且亦可定義該等寫碼節點之最小大小。因此,位元串流亦可定義一最小寫碼單元(SCU)。本發明使用術語「區塊」指代在HEVC之內容脈絡中之CU、PU或TU中的任一者,或在其他標準之內容脈絡中之類似資料結構(例如,在
H.264/AVC中之巨集區塊及其子區塊)。
CU包括一寫碼節點及與該寫碼節點相關聯之若干預測單元(PU)及變換單元(TU)。CU之大小對應於寫碼節點之大小,且形狀必須為正方形。CU之大小的範圍可自8×8像素直至具有最大64×64像素或大於64×64像素之樹型區塊之大小。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述(例如)CU至一或多個PU之分割。分割模式可視CU係被跳過或直接模式編碼、框內預測模式編碼抑或框間預測模式編碼而不同。PU可分割成非正方形形狀。與CU相關聯之語法資料亦可描述(例如)根據四分樹將CU分割成一或多個TU。TU之形狀可為正方形或非正方形(例如,矩形)。
HEVC標準允許根據TU之變換,該等變換對於不同CU可不同。通常基於針對經分割LCU所定義之給定CU內之PU的大小而設定TU大小,但可能並非總是如此狀況。TU通常具有與PU相同的大小,或小於PU。在一些實例中,可使用已知為「殘餘四分樹」(RQT)之四分樹結構而將對應於CU之殘餘樣本再分為更小之單元。RQT之葉節點可被稱作變換單元(TU)。可變換與TU相關聯之像素差值以產生變換係數,變換係數可被量化。
葉CU可包括一或多個預測單元(PU)。一般而言,PU表示對應於對應CU之全部或一部分之空間區域,且可包括用於擷取PU之參考樣本之資料。此外,PU包括與預測有關之資料。舉例而言,當PU經框內模式編碼時,用於PU之資料可包括於殘餘四分樹(RQT)中,殘餘四分樹可包括描述對應於PU之TU之框內預測模式的資料。作為另一實例,當PU經框間模式編碼時,PU可包括定義該PU之一或多個運動向量之資料。定義PU之運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖片,及/或用於
運動向量之參考圖片清單(例如,清單0、清單1或清單C)。
具有一或多個PU之葉CU亦可包括一或多個變換單元(TU)。可使用RQT(亦被稱作TU四分樹結構)指定變換單元,如上文所論述。舉例而言,分裂旗標可指示葉CU是否分裂成四個變換單元。接著,每一變換單元可進一步分裂成其他子TU。當TU不進一步分裂時,其可被稱作葉TU。一般而言,對於框內寫碼,屬於葉CU之所有葉TU共用相同框內預測模式。亦即,大體上應用相同框內預測模式來計算一葉CU的所有TU之預測值。對於框內寫碼,視訊編碼器可將使用框內預測模式的每一葉TU之殘餘值計算為在CU之對應於該TU的部分與原始區塊之間的差。TU未必限於PU之大小。因此,TU可能大於或小於PU。對於框內寫碼,一PU可與用於同一CU之一對應葉TU位於相同位置。在一些實例中,葉TU之最大大小可對應於對應葉CU之大小。
此外,葉CU之TU亦可與被稱作殘餘四分樹(RQT)之各別四分樹資料結構相關聯。亦即,葉CU可包括指示如何將葉CU分割成TU之四分樹。TU四分樹之根節點大體上對應於葉CU,而CU四分樹之根節點大體上對應於樹型區塊(或LCU)。RQT之不分裂的TU被稱作葉TU。一般而言,除非另有指示,否則本發明分別使用術語CU及TU來指代葉CU及葉TU。
視訊序列通常包括一系列視訊圖框或圖片。圖片群組(GOP)通常包含一系列的一或多個視訊圖片。GOP可在GOP之標頭、圖片中之一或多者之標頭中或在別處包括描述包括於GOP中之圖片數目的語法資料。圖片之每一圖塊可包括描述該各別圖塊之編碼模式的圖塊語法資料。視訊編碼器20通常對個別視訊圖塊內之視訊區塊進行操作,以便編碼視訊資料。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小,且可根據指定寫碼標準而在大小方面不同。
作為一實例,HM支援以各種PU大小進行預測。假定特定CU之
大小為2N×2N,則HM支援以2N×2N或N×N之PU大小進行框內預測,及以2N×2N、2N×N、N×2N或N×N之對稱PU大小進行框間預測。HM亦支援以2N×nU、2N×nD、nL×2N及nR×2N之PU大小針對框間預測進行不對稱分割。在不對稱分割中,CU之一方向未分割,而另一方向被分割成25%及75%。CU之對應於25%分割區之部分由「n」繼之以「上」、「下」、「左」或「右」之指示來指示。因此,例如,「2N×nU」指代被水平分割而具有頂部2N×0.5N PU及底部2N×1.5N PU之2N×2N CU。
在本發明中,「N×N」與「N乘N」可互換地使用以指代視訊區塊在垂直尺寸與水平尺寸方面之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16區塊在垂直方向中將具有16個像素(y=16)且在水平方向中將具有16個像素(x=16)。同樣地,N×N區塊通常在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數值。可按列及行來配置區塊中之像素。此外,區塊未必需要在水平方向中與在垂直方向中具有相同數目個像素。舉例而言,區塊可包含N×M個像素,其中M未必等於N。
在使用CU之PU進行框內預測性寫碼或框間預測性寫碼之後,視訊編碼器20可計算CU之TU的殘餘資料。PU可包含描述於空間域(亦稱為像素域)中產生預測性像素資料之方法或模式的語法資料,且TU可在將變換(例如離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換)應用於殘餘視訊資料之後包含變換域中之係數。殘餘資料可對應於未經編碼之圖片之像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括CU之殘餘資料的TU,且接著變換該等TU以產生CU之變換係數。
在應用任何變換以產生變換係數之後,視訊編碼器20可執行變換係數之量化。量化大體上指代如下程序:將變換係數量化以可能地
減少用以表示該等係數之資料量,從而提供進一步壓縮。該量化程序可減少與該等係數中之一些或所有係數相關聯的位元深度。舉例而言,可在量化期間將n位元值降值捨位至m位元值,其中n大於m。
在量化之後,視訊編碼器可掃描變換係數,從而自包括經量化之變換係數之二維矩陣產生一維向量。掃描可經設計成將較高能量(且因此較低頻率)係數置於陣列前部,且將較低能量(且因此較高頻率)係數置於陣列後部。在一些實例中,視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數,以產生可經熵編碼的串列化向量。在其他實例中,視訊編碼器20可執行自適應性掃描。在掃描經量化之變換係數以形成一維向量之後,視訊編碼器20可(例如)根據上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法而熵編碼該一維向量。視訊編碼器20亦可熵編碼與經編碼之視訊資料相關聯的語法元素以供視訊解碼器30用於解碼視訊資料。
為了執行CABAC,視訊編碼器20可將上下文模型內之上下文指派給待傳輸之符號。該上下文可能係關於(例如)符號之相鄰值是否為非零。為了執行CAVLC,視訊編碼器20可針對待傳輸之符號選擇一可變長度碼。可建構VLC中之碼字使得相對較短碼對應於更有可能的符號,而較長碼對應於較不可能的符號。以此方式,使用VLC可達成位元節省(與(例如)針對待傳輸之每一符號使用等長度碼字相比較)。機率判定可基於指派給符號之上下文而進行。
根據本發明之技術,視訊編碼器20可使用上下文編碼表示視訊資料之一區塊之最末有效係數的位置的值,該等上下文係使用該值之二進位的一或多個函數而判定。同樣地,視訊解碼器30可使用上下文解碼表示視訊資料之一區塊之最末有效係數的值,該等上下文係使用
該值之二進位的一或多個函數而判定。視訊編碼器20及/或視訊解碼器30可經組態以執行下文中更詳細描述之函數(1)-(12),或概念上類似之函數中之任一者,從而執行本發明之技術。以此方式,視訊編碼器20及視訊解碼器30表示視訊寫碼器之實例,該等視訊寫碼器經組態以使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位的上下文,並使用所判定的上下文寫碼該二進位。
作為一實例,「Ctx_i」可表示由視訊編碼器20用以編碼「最末位置」二進位字串中的第i個二進位之上下文的索引。視訊編碼器20可使用以下方程式導出Ctx_i:Ctx_i=f(i)。
f(i)所表示之函數可為線性或非線性的。另外,f(i)可為視訊編碼器20與視訊解碼器30二者均可使用之預定義函數。或者,f(i)可由使用者或由視訊編碼器20選擇,且可使用一或多種類型之高階語法發信而傳輸至視訊解碼器30,諸如序列參數集(SPS)、圖片參數集(PPS)、調適參數集(APS)、圖框標頭、圖塊標頭、序列標頭,或其他此類語法發信。視訊編碼器20可執行之一此類函數的實例為:f(i)=(i>>1), (1)
其中「>>」表示二進位右移位運算子。接下來,f(i)之結果可對應於Ctx_i。亦即,視訊編碼器20可執行f(i)來產生與Ctx_i之值相等的輸出。更特定而言,視訊編碼器20可執行f(i)來產生用以熵寫碼第i個二進位之上下文的上下文索引。
以下表3說明上下文索引之實例,視訊編碼器20可使用上文所描述之實例函數(1),使用該等上下文索引寫碼在各種區塊(例如TU)大小下在各種二進位索引處的二進位。儘管為了解釋實例函數(1)之結果的目的提供表3,但將瞭解,諸如表3的表不需要儲存於諸如源器件
12及/或目的地器件14之視訊寫碼器件中。實情為,視訊編碼器20與視訊解碼器30中之一者或兩者可基於各種二進位索引而執行上文的函數(1),以產生表3中所指示之結果。
作為另一實例,視訊編碼器20可執行依賴於二進位索引(i)與對應區塊(例如TU)之大小兩者的函數。該對應區塊可為包括最末有效係數值所描述之係數的區塊。作為一實例,上下文索引可由一函數產生,諸如:Ctx_i=f(i,TUBlkSize),其中「TUBlkSize」為指示區塊大小之值。出於本發明之目的,術語「TUBlkSize」及「block_size」可互換地用以指示區塊大小。
作為一實例,函數可為:f(i,TUBlkSize)=i>>(log2(TUBlkSize)-2)。 (2)
以下表4說明上下文索引之實例,視訊編碼器20將使用實例函數(2),使用該等上下文索引寫碼在各種區塊(例如TU)大小下在各種二進位索引處的二進位。儘管為了解釋實例函數(2)之結果的目的提供表4,但將瞭解,諸如表4的表不需要儲存於諸如源器件12及/或目的地器件14之視訊寫碼器件中。實情為,視訊編碼器20與視訊解碼器30中之一者或兩者可執行上文所描述之實例函數(2),以產生表4中所指示之結果。
作為另一實例,視訊編碼器20可執行以下函數以導出Ctx_i:f(i,TUBlkSize)=i>>1+TUSIZEoffset,其中TUSIZEoffset=(log2(TUBlkSize)-2)*(log2(TUBlkSize)+1)/2。 (3)
以下表5說明上下文索引之實例,視訊編碼器20可使用實例函數(3),使用該等上下文索引寫碼在各種區塊(例如TU)大小下在各種二進位索引處的二進位。儘管為了解釋實例函數(3)之結果的目的而提供表5,但將瞭解,諸如表5的表不需要儲存於源器件12及/或目的地器件14中。實情為,視訊編碼器20與視訊解碼器30中之一者或兩者可執行上文所描述之實例函數(3),以產生表5中所指示之結果。
作為再一實例,視訊編碼器20可執行以下函數以導出Ctx_i:Ctx_idx=(i+1)>>1+TUSIZEoffset,其中TUSIZEoffset=(log2(TUBlkSize)-2)*(log2(TUBlkSize)+1)/2。 (4)
以下表6說明上下文索引之實例,視訊編碼器20可使用實例函數(4),使用該等上下文索引寫碼在各種區塊(例如TU)大小下在各種二進位索引處的二進位。儘管為了解釋該函數之結果的目的而提供表6,但將瞭解,諸如表6的表不需要儲存於諸如源器件12及/或目的地器件14之視訊寫碼器件中。實情為,視訊編碼器20與視訊解碼器30中之一者或兩者可執行上文所描述之實例函數(4),以產生表6中所指示之結果。
作為另一實例,函數可為:Ctx_idx=偏移+(i>>k), (5)
其中:偏移=3*n+((n+1)>>2), (6)
k=(n+3)>>2,且 (7)
n=(log2(TUBlkSize)-2)。 (8)
或者,出於本發明之目的,實例函數(8)可表示為:n=(log2(block_size)-2)。
以下表7說明上下文索引之實例,視訊編碼器20可使用實例函數(5)-(8),使用該等上下文索引寫碼在各種區塊(例如TU)大小下在各種二進位索引處的二進位。儘管為了解釋該等函數之結果的目的而提供表7,但將瞭解,諸如表7的表不需要儲存於諸如源器件12及/或目的地器件14之視訊寫碼器件中。實情為,視訊編碼器20與視訊解碼器30中之一者或兩者可執行上文之實例函數(5)-(8),以產生表7中所指示之結果。
以下表8與表9說明另一實例,其中視訊編碼器20及/或視訊解碼器30可將本發明的針對「最末位置」寫碼中之二進位的一或多個基於公式之上下文導出技術以統一方式應用於亮度分量與色度分量。詳言
之,表8說明各種大小之亮度TU的二進位索引,而表9提供各種大小之色度TU的二進位索引。
視訊編碼器20及/或視訊解碼器30可使用以在亮度TU(根據表8)及色度TU(根據表9)之最末位置寫碼中導出二進位的上下文的函數的一實例為:Ctx_idx=偏移+(i>>k), (9)
其中亮度與色度共用同一值k,k=(n+3)>>2,其中n=(log2(TUBlkSize)-2)
視訊編碼器20及/或視訊解碼器30可基於TU為亮度TU抑或色度TU,使用各種函數來判定函數(9)之變數「偏移」的值。此類函數之實例包括以下函數:亮度:偏移=3*n+((n+1)>>2)(10)
色度:偏移=0(11)
以此方式,函數(9)表示函數之實例,視訊編碼器20及/或視訊解碼器30可執行該函數以產生上下文索引。上下文索引又可指示作為二進位(i)之索引與指示區塊大小的值(k,其基於n而計算,n為log2(TUBlkSize)-2)的函數的用於寫碼指示視訊資料之一區塊之最末有效係數之值的二進位的上下文。在此實例中,視訊編碼器20及/或視訊解碼器30亦可基於偏移值來執行實例函數(9)以產生上下文索引,
該偏移值係基於區塊為色度區塊抑或亮度區塊而判定,例如,如函數(10)及(11)中所示。
作為另一實例,視訊編碼器20可實施一步階函數,以導出待用於熵寫碼第i個二進位之上下文的上下文索引。更特定言之,該步階函數可表示取決於(例如)二進位索引i之值而具有兩個或兩個以上部分之函數。因而,視訊編碼器20及/或視訊解碼器30可將最末位置值中的二進位劃分為不同子集,例如子集0、子集1等。另外,視訊編碼器20及/或視訊解碼器30可針對不同子集應用不同函數,例如,針對子集0應用F0( )、針對子集1應用F1( )等等。舉例而言,此類函數可為以下函數:,其中TUSIZEoffset=(log2(TUBlkSize)-2)*(log2(TUBlkSize)-1)/2。 (12)
在一些實施中,可預定義子集,且視訊編碼器20與視訊解碼器30可存取該等子集的定義。或者,視訊編碼器20(或源器件12之使用者)可選擇子集,且輸出介面22可使用一或多個高階語法發信技術(諸如SPS、PPS、APS、圖框標頭、圖塊標頭、序列標頭或其他此類語法發信)將所選擇之子集傳輸至目的地器件14之視訊解碼器30。該等子集之定義亦可取決於各種其他類型之資訊,諸如區塊大小(例如,TU大小)、對應於該區塊的殘餘四分樹(RQT)深度、該區塊對應於亮度分量抑或色度分量、包括該區塊之圖框的圖框大小(例如,按像素解析度計)、對應於該區塊之運動補償區塊(例如,預測單元(PU))的運動補償區塊大小、包括該區塊之圖框的圖框類型(I/P/B)、對應運動補償區塊之框間預測方向、對應運動補償區塊之運動向量幅度,及/或對應運動補償區塊之運動向量的運動向量差幅度。
以下表10說明上下文索引之實例,視訊編碼器20可使用實例函數(12),使用該等上下文索引寫碼在各種區塊(例如TU)大小下在各種二進位索引處的二進位。儘管為了解釋該函數之結果的目的而提供表10,但將瞭解,諸如表10的表不需要儲存於諸如源器件12及/或目的地器件14之視訊寫碼器件中。實情為,視訊編碼器20與視訊解碼器30中之一者或兩者可執行上文所描述之實例函數(12),以產生表10中所指示之結果。
上文所描述之實例函數(1)-(12)可至少部分地取決於旁側資訊之一或多個元素。作為一實例,該等函數可將該旁側資訊接受作為引數。在其他實例中,視訊編碼器20及/或視訊解碼器30可基於對應的旁側資訊而選擇不同的函數。該旁側資訊可包括以下項中之任一者或全部:區塊大小(例如,TU大小)、對應於該區塊的殘餘四分樹深度(RQT)深度、該區塊對應於亮度分量抑或色度分量、包括該區塊之圖框的圖框大小(例如,按像素解析度計)、對應於該區塊之運動補償區塊(例如,預測單元(PU))的運動補償區塊大小、包括該區塊之圖框的圖框類型(I/P/B)、對應運動補償區塊之框間預測方向、對應運動補償區塊之運動向量幅度,及/或對應運動補償區塊之運動向量的運動向量差幅度。作為一實例,視訊編碼器20及/或視訊解碼器30可(相對於色度區塊)選擇不同函數來導出在寫碼指示亮度區塊之最末有效係數位置之值的二進位時所應用的上下文。
視訊編碼器20可進一步將語法資料(諸如,基於區塊之語法資料、基於圖框之語法資料,及基於GOP之語法資料)發送至視訊解碼
器30(例如,在圖框標頭、區塊標頭、圖塊標頭或GOP標頭中)。GOP語法資料可描述各別GOP中的圖框之數目,且圖框語法資料可指示用以編碼對應圖框之編碼/預測模式。
視訊編碼器20及視訊解碼器30可各自實施為多種合適編碼器或解碼器電路中之任一者(在適用時),諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯電路、軟體、硬體、韌體或其任何組合。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中之任一者可整合為組合式視訊編碼器/解碼器(CODEC)之部分。包括視訊編碼器20及/或視訊解碼器30之器件可包含一積體電路、一微處理器及/或一無線通信器件(諸如,蜂巢式電話)。
以此方式,視訊編碼器20及視訊解碼器30表示視訊寫碼器之實例,該視訊寫碼器經組態以使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位的上下文,並使用所判定的上下文寫碼該二進位。
圖2為說明可實施用於判定上下文之技術之視訊編碼器20的一實例的方塊圖,其中該上下文用以寫碼表示視訊資料之一區塊之最末有效係數的值。視訊編碼器20可執行視訊圖塊內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減小或移除給定視訊圖框或圖片內之視訊的空間冗餘。框間寫碼依賴於時間預測以減小或移除視訊序列之鄰接圖框或圖片內之視訊的時間冗餘。框內模式(I模式)可指代若干基於空間之寫碼模式中的任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可指代若干基於時間之寫碼模式中的任一者。
如圖2中所示,視訊編碼器20接收待編碼之視訊圖框內之當前視訊區塊。在圖2之實例中,視訊編碼器20包括模式選擇單元40、參考
圖框記憶體64、求和器50、變換處理單元52、量化單元54,及熵編碼單元56。模式選擇單元40又包括運動補償單元44、運動估計單元42、框內預測單元46及分割單元48。為了進行視訊區塊重建構,視訊編碼器20亦包括逆量化單元58、逆變換單元60及求和器62。亦可包含解區塊濾波器(圖2中未展示)以對區塊邊界進行濾波,從而自重建構之視訊中移除方塊效應假影。若需要,解區塊濾波器通常對求和器62之輸出進行濾波。除解區塊濾波器之外,亦可使用額外濾波器(迴路內或迴路後)。為簡潔起見未展示此類濾波器,但此類濾波器必要時可對求和器50之輸出進行濾波(作為迴路內濾波器)。
在編碼程序期間,視訊編碼器20接收待寫碼之視訊圖框或圖塊。可將該圖框或圖塊劃分成多個視訊區塊。運動估計單元42及運動補償單元44執行所接收之視訊區塊相對於一或多個參考圖框中之一或多個區塊的框間預測性寫碼,以提供時間預測。框內預測單元46可替代地執行所接收之視訊區塊相對於在與待寫碼之區塊相同之圖框或圖塊中的一或多個相鄰區塊的框內預測性寫碼,以提供空間預測。視訊編碼器20可執行多個寫碼遍次(例如)以選擇用於視訊資料之每一區塊之適當寫碼模式。
此外,分割單元48可基於對先前寫碼遍次中之先前分割方案之評估而將視訊資料之區塊分割成子區塊。舉例而言,分割單元48可初始地將一圖框或圖塊分割成LCU,且基於位元率-失真分析(例如,位元率-失真最佳化)來將該等LCU中之每一者分割成子CU。模式選擇單元40可進一步產生指示LCU至子CU之分割的四分樹資料結構。四分樹之葉節點CU可包括一或多個PU及一或多個TU。
模式選擇單元40可選擇寫碼模式(框內或框間)中之一者(例如,基於誤差結果),且將所得的經框內或框間寫碼之區塊提供至求和器50以產生殘餘區塊資料,且提供至求和器62以重建構經編碼之區塊以
便用作參考圖框。模式選擇單元40亦將語法元素(諸如運動向量、框內模式指示符、分割資訊及其他此類語法資訊)提供至熵編碼單元56。
運動估計單元42及運動補償單元44可高度整合,但出於概念目的而分別說明。由運動估計單元42執行之運動估計為產生運動向量之程序,運動向量估計視訊區塊之運動。舉例而言,運動向量可指示在一當前視訊圖框或圖片內的一視訊區塊的一PU相對於在一參考圖框(或其他經寫碼單元)內的一預測性區塊(其關於在該當前圖框(或其他經寫碼單元)內正被寫碼的當前區塊)之位移。預測性區塊為被發現在像素差方面緊密地匹配於待寫碼區塊之區塊,該像素差可藉由絕對差和(SAD)、平方差和(SSD)或其他差量度予以判定。在一些實例中,視訊編碼器20可計算儲存於參考圖框記憶體64中之參考圖片的次整數像素位置之值。舉例而言,視訊編碼器20可內插該參考圖片之四分之一像素位置、八分之一像素位置或其他分率像素位置之值。因此,運動估計單元42可執行相對於全像素位置及分率像素位置之運動搜尋,且以分率像素精度輸出運動向量。
運動估計單元42藉由比較經框間寫碼之圖塊中的視訊區塊的PU之位置與參考圖片之預測性區塊的位置,來計算該PU之運動向量。該參考圖片可選自一第一參考圖片清單(清單0)或一第二參考圖片清單(清單1),清單0或清單1中之每一者識別儲存於參考圖框記憶體64中之一或多個參考圖片。運動估計單元42將所計算之運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及基於由運動估計單元42判定之運動向量來提取或產生預測性區塊。再次,在一些實例中,運動估計單元42及運動補償單元44可在功能上整合。在接收到當前視訊區塊之PU之運動向量時,運動補償單元44可在參考圖片清單中之
一者中探尋運動向量所指向的預測性區塊。求和器50藉由自正被寫碼之當前視訊區塊的像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值,如下文所論述。一般而言,運動估計單元42相對於亮度分量而執行運動估計,且運動補償單元44將基於該等亮度分量所計算之運動向量用於色度分量與亮度分量兩者。模式選擇單元40亦可產生與視訊區塊及視訊圖塊相關聯的語法元素,以供視訊解碼器30用於解碼視訊圖塊之視訊區塊。
作為由運動估計單元42及運動補償單元44執行之框間預測(如上文所描述)之替代,框內預測單元46可框內預測當前區塊。詳言之,框內預測單元46可判定待用以編碼當前區塊之框內預測模式。在一些實例中,框內預測單元46可(例如)在單獨之編碼遍次期間使用各種框內預測模式來編碼當前區塊,且框內預測單元46(或在一些實例中,模式選擇單元40)可自所測試之模式選擇欲使用之適當框內預測模式。
舉例而言,框內預測單元46可使用對各種經測試之框內預測模式之位元率-失真分析而計算位元率-失真值,且在經測試模式當中選擇具有最佳位元率-失真特性之框內預測模式。位元率-失真分析大體上判定經編碼區塊與經編碼以產生該經編碼區塊的原始未經編碼區塊之間的失真(或誤差)之量以及用以產生經編碼區塊之位元率(亦即,位元數目)。框內預測單元46可自失真及位元率計算各種經編碼區塊之比率以判定哪一框內預測模式展現區塊之最佳位元率-失真值。
在選擇區塊之框內預測模式之後,框內預測單元46可向熵編碼單元56提供指示該區塊之所選擇之框內預測模式的資訊。熵編碼單元56可編碼指示所選擇之框內預測模式的資訊。視訊編碼器20可在經傳輸之位元串流組態資料中包括各種區塊之編碼上下文之定義,及將用於該等上下文中之每一者之最有可能的框內預測模式、框內預測模式
索引表及經修改之框內預測模式索引表的指示,該位元串流組態資料可包括複數個框內預測模式索引表及複數個經修改之框內預測模式索引表(亦被稱作碼字映射表)。
視訊編碼器20藉由自正被寫碼之原始視訊區塊減去來自模式選擇單元40之預測資料而形成一殘餘視訊區塊。求和器50表示執行此減法運算之一或多個組件。變換處理單元52將諸如離散餘弦變換(DCT)或概念上類似之變換的變換應用於殘餘區塊,從而產生包含殘餘變換係數值之視訊區塊。變換處理單元52可執行概念上類似於DCT之其他變換。亦可使用小波變換、整數變換、子頻帶變換或其他類型之變換。在任何狀況下,變換處理單元52將變換應用於殘餘區塊,從而產生殘餘變換係數之區塊。該變換可將殘餘資訊自像素值域轉換至變換域(諸如頻域)。變換處理單元52可將所得的變換係數發送至量化單元54。量化單元54量化該等變換係數以進一步減少位元率。該量化程序可減少與該等係數中之一些或所有相關聯的位元深度。可藉由調整量化參數而修改量化程度。在一些實例中,量化單元54可接著執行對包括經量化之變換係數之矩陣的掃描。或者,熵編碼單元56可執行該掃描。
在量化之後,熵編碼單元56熵寫碼該經量化之變換係數。舉例而言,熵編碼單元56可執行上下文適應性可變長度寫碼(CAVLC)、上下文適應性二進位算術寫碼(CABAC)、基於語法之上下文適應性二進位算術寫碼(SBAC)、概率區間分割熵(PIPE)寫碼或另一熵寫碼技術。在基於上下文之熵寫碼之狀況下,上下文可基於相鄰區塊。在藉由熵編碼單元56進行之熵寫碼之後,可將經編碼之位元串流傳輸至另一器件(例如,視訊解碼器30)或經封存以供稍後傳輸或擷取。
詳言之,熵編碼單元56可自量化單元54接收與TU相關聯之經量化之變換係數之一集合。反過來,熵編碼單元56可掃描該經量化之變
換係數集合,且判定每一經掃描之係數是否包括一有效係數,亦即,該係數的值為零抑或非零。非零值可指示一特定經量化之變換係數為「有效」係數。在熵編碼單元56偵測到一有效係數之實例中,熵編碼單元56可寫碼表示與該係數相關聯之特定值(例如,1、2,等等)的資料。此類資料可包括,例如該係數之正負號的指示、該係數之絕對值是否大於一,以及當該係數之絕對值大於一時該係數之絕對值是否大於二。另外,在一有效係數的絕對值大於二的實例中,熵編碼單元56可自該係數之絕對值減去二,由此獲得一值(其中該係數比二多出該值),且寫碼此值。
藉由掃描自量化單元54接收之整個經量化之變換係數之集合,熵編碼單元56亦可偵測且識別與一特定TU相關聯之最末有效係數(亦即,以掃描次序)。另外,熵編碼單元56可判定該最末有效係數於對應TU內之位置。舉例而言,熵編碼單元56可識別該最末有效係數於該TU內之水平及垂直(x-或y-)座標。
此外,熵編碼單元56可經組態以將並非已具有二進位值之語法元素二進位化。亦即,在語法元素尚未由二進位字串表示時,熵編碼單元56可判定表示語法元素之值之二進位字串。二進位字串或經二進位化的值大體上對應於位元之一陣列,位元中的每一者的值可為「0」或「1」。該陣列可為由零進行索引的,使得該陣列之序數第一位元出現於位置0處,該陣列之序數第二位元出現於位置1處,等等。因而,熵編碼單元56可形成長度為N位元之經二進位化的值B[N],其中每一位元出現於各別位置B[i],其中0iN-1。
反過來,熵編碼單元56可熵編碼表示最末有效係數之x-及y-座標的資料。舉例而言,熵編碼單元56可經組態以熵編碼語法元素last_significant_coeff_x_prefix、last_significant_coeff_y_prefix、last_significant_coeff_x_suffix,及/或last_significant_coeff_y_suffix,
在HEVC中,該等語法元素一起表示按照掃描次序的最末有效係數之x-及y-座標。熵編碼單元56可實施本發明之一或多個技術,以使用由f(i)表示之一函數來熵編碼表示最末有效係數之座標的資料。舉例而言,熵編碼單元56可使用上下文來熵編碼各種語法元素,諸如自量化單元54接收的經量化之變換係數及/或表示TU的最末有效係數之值的語法元素(例如上文所描述之語法元素),其中該上下文係使用表示對應語法元素之值之二進位的一或多個函數而判定。
舉例而言,如上文參考表1至表2及表8至表9所描述,「Ctx_i」可表示由熵編碼單元56用以編碼表示最末有效係數之位置的經二進位化值中的第i個二進位之上下文的索引。由ctx_i索引之上下文大體上指示一最有可能的符號(例如,「1」或「0」)以及該最有可能的符號之可能性。熵編碼單元56可使用方程式Ctx_i=f(i)導出Ctx_i之值,其中f(i)可為熵編碼單元56可用之一預定義函數,或為使用者所選擇之一函數。另外,熵編碼單元56可編碼表示f(i)之資料,使得視訊解碼器30可解碼用於函數f(i)之資料並使用f(i)獲得Ctx_i之值。以此方式,熵編碼單元56可使用二進位索引之一函數,亦即該二進位在表示語法元素之經二進位化值(亦即,二進位字串)中的位置,來判定用於經二進位化的語法元素之一特定二進位的上下文。
在一些實例中,熵編碼單元56經組態以使用上文描述之公式(5)-(8),判定用於寫碼表示最末有效係數位置之資料的二進位的上下文。亦即,熵編碼單元56可如下計算f(i):Ctx_idx=偏移+(i>>k)。此外,熵編碼單元56可使用以下方程式來導出用於f(i)中之偏移值及k之值:偏移=3*n+((n+1)>>2),k=(n+3)>>2,且n=(log2(block_size)-2)。
在其他實施方案中,當判定用於熵編碼表示TU之最末有效係數之位置的資料之二進位的上下文時,除公式(5)-(8)之外或作為其替代,熵編碼單元56可使用實例函數(1)-(4)及(9)-(12)中之一或多者。以此方式,視訊編碼器20及其組件(諸如熵編碼單元56)可實施本發明之技術,以使用一或多個函數來編碼表示最末有效係數之資料。與儲存於表中相比,此類函數可更高效地儲存於視訊編碼器20及視訊解碼器30之記憶體中。因此,本發明之技術可提供(例如)藉由向其他資料分配原本專用於表之記憶體或藉由減少視訊編碼器或視訊解碼器所需之記憶體量而更有效地利用記憶體之視訊編碼器及視訊解碼器。
逆量化單元58及逆變換單元60分別應用逆量化及逆變換以在像素域中重建構殘餘區塊(例如)以供稍後用作參考區塊。運動補償單元44可藉由將該殘餘區塊添加至參考圖框記憶體64之圖框中之一者的一預測性區塊來計算一參考區塊。運動補償單元44亦可對該經重建構的殘餘區塊應用一或多個內插濾波器以計算用於在運動估計中使用之次整數像素值。求和器62將該經重建構的殘餘區塊添加至由運動補償單元44產生之經運動補償的預測區塊以產生一經重建構的視訊區塊以用於儲存於參考圖框記憶體64中。該經重建構的視訊區塊可由運動估計單元42及運動補償單元44用作一參考區塊以框間寫碼在後續視訊圖框中之區塊。
以此方式,圖2之視訊編碼器20表示視訊編碼器之一實例,該視訊編碼器經組態以使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位的上下文,並使用所判定的上下文寫碼該二進位。此外,視訊編碼器20亦表示視訊編碼器之一實例,其中函數藉由將二進位之索引右移位一值k且將經右移位之值添加至偏移值,來產生上下文之上下文索引,其中該偏移值係根據公式偏移==3*n+((n+1)>>2)而判定,其中值k係根據公式k=
(n+3)>>2而判定,且其中值n係根據公式n=(log2(block_size)-2)而判定。
圖3為說明可實施用於判定上下文之技術之視訊解碼器30的一實例的方塊圖,其中該上下文用以寫碼表示視訊資料之一區塊之最末有效係數的值。在圖3之實例中,視訊解碼器30包括熵解碼單元70、運動補償單元72、框內預測單元74、逆量化單元76、逆變換單元78、參考圖框記憶體82及求和器80。在一些實例中,視訊解碼器30可執行與關於視訊編碼器20(圖2)所描述之編碼遍次大體上互逆之解碼遍次。運動補償單元72可基於自熵解碼單元70接收之運動向量而產生預測資料,而框內預測單元74可基於自熵解碼單元70接收之框內預測模式指示符而產生預測資料。
在解碼程序期間,視訊解碼器30自視訊編碼器20接收表示經編碼之視訊圖塊的視訊區塊以及相關聯的語法元素的經編碼之視訊位元串流。視訊解碼器30之熵解碼單元70熵解碼該位元串流,以產生經量化之係數、運動向量或框內預測模式指示符,以及其他語法元素。熵解碼單元70向運動補償單元72轉發運動向量及其他語法元素。視訊解碼器30可接收視訊圖塊層級及/或視訊區塊層級的語法元素。
熵解碼單元70可藉由熵解碼經編碼之視訊位元串流,且在區塊中以掃描次序填入經熵解碼的經量化係數,來產生經量化之係數的一區塊(例如,TU)。舉例而言,熵解碼單元70可熵解碼經編碼之視訊位元串流的語法元素,以判定有效係數在待產生之區塊中的位置。若該區塊之一位置對應於並非有效係數之一係數,則熵解碼單元70可將該區塊中之彼位置處的係數的值設定為零。另一方面,若熵解碼單元70判定一特定經量化之係數為有效係數,則熵解碼單元70可基於由視訊編碼器20提供於經編碼之視訊位元串流中的資料而設定該有效係數的值。
此外,如下文所解釋的,熵解碼單元70可基於指示最末有效係數之x-及y-座標的語法元素,判定該最末有效係數於區塊中之位置。根據本發明之技術,如下文更詳細解釋,熵解碼單元70可使用一函數來判定用於熵解碼表示最末有效係數之x-及y-座標之值的二進位的上下文。視訊解碼器30可使用最末有效係數之位置的指示,以判定位元串流之資料何時表示後續語法元素(亦即,不表示正被再生之區塊之資料的語法元素)。
熵解碼單元70可基於經編碼之視訊位元串流中所提供的資料,判定每一有效係數的正負號,以及表示每一有效係數之位準值的資料。舉例而言,熵解碼單元70可經由對表示一有效係數之正負號之一語法元素(例如coeff_sign_flag)進行熵解碼來判定該正負號。另外,熵解碼單元70可解碼表示每一有效係數之位準值的一或多個語法元素,例如coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag,及coeff_abs_level_remaining。一般而言,coeff_abs_level_greater1_flag指示一有效係數之絕對值是否大於1,coeff_abs_level_greater2_flag指示一有效係數之絕對值是否大於2,且coeff_abs_level_remaining指示一有效係數之絕對值減去2。
熵解碼單元70亦可判定正被再生之區塊(例如,TU)之最末有效係數的位置。更特定而言,熵解碼單元70可(例如,基於表示x-及y-座標之經寫碼語法元素)識別與經編碼之視訊位元串流相關聯之TU內的最末有效係數的位置。基於識別該最末有效係數之位置,熵解碼單元70可按照掃描次序將TU中之剩餘係數的值設定為零。亦即,視訊解碼器30不需要接收最末有效係數以外之係數的任何語法元素,且另外,可推斷此等係數之值為0。
另外,熵解碼單元70可實施本發明之一或多個技術以使用大體上由f(i)表示之函數,解碼表示最末有效係數之位置的x-及y-座標之經
二進位化值的二進位,其中i對應於該二進位於該經二進位化值中的位置。在一些實例中,熵解碼單元70可使用所判定之上下文來解碼經編碼之資料,從而再生二進位之值(例如,「0」或「1」)。儘管被描述為對應於最末有效係數位置,但本發明之技術同樣可應用於熵解碼其他語法元素。舉例而言,熵解碼單元70可使用上下文來熵解碼各種語法元素,諸如發送至運動補償單元72及框內預測單元74中之一者或兩者的經量化之係數的語法元素、表示經量化之變換係數及/或表示與經編碼之視訊位元串流相關聯之TU的最末有效係數的值的語法元素,其中該上下文係使用表示對應語法元素之值的二進位索引的一或多個函數而判定。
舉例而言,如上文參考表1至表2及表8至表9所描述,「Ctx_i」可表示由熵解碼單元70用以解碼表示最末有效係數之位置之經二進位化值中的第i個二進位之上下文的索引。在此實例中,熵解碼單元70可使用方程式Ctx_i=f(i)導出Ctx_i之值,其中f(i)可為熵解碼單元70可用之一預定義函數(例如,由源器件12傳達),或為由使用者選擇之一函數。另外,熵解碼單元70可解碼表示f(i)之資料,以便使用該表示f(i)之資料來獲得Ctx_i之值。
在一些實例中,熵解碼單元70經組態以使用上文描述之公式(5)-(8),判定用於解碼表示最末有效係數位置之資料的二進位的上下文。亦即,熵解碼單元70可如下計算f(i):Ctx_idx=offset+(i>>k)。此外,熵解碼單元70可使用以下方程式來導出用於f(i)中之偏移值及k之值:偏移=3*n+((n+1)>>2),k=(n+3)>>2,且n=(log2(block_size)-2)。
在其他實施方案中,熵解碼單元70可在解碼由經編碼之視訊位
元串流表示之TU的最末有效係數時將f(i)設定為實例方程式(1)-(4)及(9)-(12)中的一或多者。以此方式,視訊解碼器30及其組件(諸如熵解碼單元70)可實施本發明之技術以使用一或多個函數來解碼最末有效係數。與儲存於表中相比,此類函數可更加高效地儲存於視訊編碼器20及視訊解碼器30之記憶體中。因此,本發明之技術可提供(例如)藉由向其他資料分配原本專用於表之記憶體或藉由減少視訊編碼器或視訊解碼器所需之記憶體量而更有效地利用記憶體之視訊編碼器及視訊解碼器。
當視訊圖塊經寫碼為框內寫碼(I)圖塊時,框內預測單元74可基於所發信之框內預測模式及來自當前圖框或圖片之先前經解碼區塊的資料而產生當前視訊圖塊之視訊區塊的預測資料。當視訊圖框經寫碼為框間寫碼(亦即B、P或GPB)圖塊時,運動補償單元72基於自熵解碼單元70接收之運動向量及其他語法元素,產生當前視訊圖塊之視訊區塊的預測性區塊。可自參考圖片清單中之一者內的參考圖片中之一者產生該等預測性區塊。視訊解碼器30可基於儲存於參考圖框記憶體82中之參考圖片,使用預設建構技術來建構該等參考圖框清單,清單0及清單1。
運動補償單元72藉由剖析運動向量及其他語法元素而判定當前視訊圖塊之視訊區塊之預測資訊,且使用該預測資訊以產生正被解碼之當前視訊區塊之預測性區塊。舉例而言,運動補償單元72使用所接收之語法元素中的一些以判定用以寫碼視訊圖塊之視訊區塊的預測模式(例如,框內預測或框間預測)、框間預測圖塊類型(例如,B圖塊、P圖塊或GPB圖塊)、圖塊之參考圖片清單中之一或多者的建構資訊、圖塊之每一經框間編碼之視訊區塊的運動向量、圖塊之每一經框間寫碼之視訊區塊的框間預測狀態,及用以解碼當前視訊圖塊中之視訊區塊的其他資訊。
運動補償單元72亦可基於內插濾波器執行內插。運動補償單元72可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器,以計算參考區塊之次整數像素的內插值。在此狀況下,運動補償單元72可根據接收之語法元素判定由視訊編碼器20使用之內插濾波器且使用該等內插濾波器來產生預測性區塊。
逆量化單元76逆量化(亦即,解量化)提供於位元串流中且由熵解碼單元70解碼之經量化之變換係數。逆量化程序可包括針對視訊圖塊中之每一視訊區塊使用由視訊解碼器30計算的量化參數QPY,以判定量化程度且同樣判定應應用之逆量化的程度。
逆變換單元78將逆變換(例如,逆DCT、逆整數變換或概念上類似之逆變換程序)應用於變換係數,以便在像素域中產生殘餘區塊。
在運動補償單元72基於運動向量及其他語法元素產生當前視訊區塊的預測性區塊之後,視訊解碼器30藉由對來自逆變換單元78之殘餘區塊與由運動補償單元72產生之對應預測性區塊求和而形成經解碼之視訊區塊。求和器80表示執行此加法運算之一或多個組件。若需要,亦可應用解區塊濾波器來對經解碼區塊濾波以便移除方塊效應假影。其他迴路濾波器(寫碼迴路中或寫碼迴路後)亦可用以使像素轉變平滑,或以其他方式改良視訊品質。接著將給定圖框或圖片中之經解碼之視訊區塊儲存於參考圖框記憶體82中,該參考圖框記憶體儲存用於後續運動補償之參考圖片。參考圖框記憶體82亦儲存經解碼之視訊,用於稍後呈現於顯示器件上(諸如圖1之顯示器件32)。
以此方式,圖3的視訊解碼器30表示視訊解碼器的實例,該視訊解碼器經組態以使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位的上下文,並使用所判定的上下文寫碼該二進位。此外,視訊解碼器30亦表示視訊解碼器之一實例,其中函數藉由將二進位之索引右移位一值k且將經右移位之
值添加至偏移值,來產生上下文之上下文索引,其中該偏移值係根據公式偏移=3*n+((n+1)>>2)而判定,其中值k係根據公式k=(n+3)>>2而判定,且其中值n係根據公式n=(log2(block_size)-2)而判定。
圖4為說明用於編碼當前區塊之實例方法的流程圖。當前區塊可包含一當前CU或該當前CU之一部分。儘管參考了視訊編碼器20(圖1及圖2)進行描述,但應理解,其他器件可經組態以執行類似於圖4之方法的方法。此外,儘管圖4之實例方法特定地描述使用此等技術來寫碼與視訊區塊之最末有效係數的位置有關之語法元素,但應理解,此等技術同樣可應用於寫碼其他語法元素。
在此實例中,視訊編碼器20最初預測當前區塊(150)。舉例而言,視訊編碼器20可計算當前區塊之一或多個預測單元(PU)。視訊編碼器20可接著計算當前區塊之殘餘區塊,(例如)以產生一變換單元(TU)(152)。為了計算該殘餘區塊,視訊編碼器20可計算當前區塊的原始未經寫碼之區塊與所預測之區塊之間的差。視訊編碼器20可接著變換及量化殘餘區塊之係數(154)。接下來,視訊編碼器20可掃描殘餘區塊之經量化之變換係數(156)。在掃描期間,或在掃描之後,視訊編碼器20可熵編碼該等係數(158)。舉例而言,視訊編碼器20可使用CAVLC或CABAC來編碼該等係數。
視訊編碼器20亦可判定TU中之最末有效係數的一位置的值(160)。該值可包含(例如)表示該最末有效係數之位置的一經二進位化的值,例如,如上文參考表1所描述。該值的最大數目之二進位可使用CABAC進行寫碼,而超過該最大數目的其他二進位可進行旁路寫碼,再次如參考表1所描述。詳言之,根據本發明之技術,視訊編碼器20可使用一函數來判定用於該值之二進位的上下文(162)。如上文所解釋的,該等上下文可描述該等二進位具有特定值(例如,「0」或「1」)之可能性。該函數可對應於上文所描述之函數(1)-(12)中之一
者,或一概念上類似之函數。
參考函數(5)-(8)之實例,視訊編碼器20可使用公式偏移+(i>>k)(其中偏移=3*n+((n+1)>>2)、k=(n+3)>>2,且n=(log2(block_size)-2)),來判定用於一經二進位化值中的位於位置i處之二進位的上下文ctx_idx,其中該經二進位化值表示最末有效係數之位置。亦即,視訊編碼器20可對於待熵編碼之每一二進位反覆執行,且執行上文所展示之函數以判定用於寫碼當前反覆之二進位的上下文。接著視訊編碼器20可使用所判定之上下文來編碼該值之二進位(例如,未超過最大數目之二進位的二進位)(164)。同樣地,視訊編碼器20可旁路寫碼該值之任何剩餘二進位(166)。
以此方式,圖4的方法表示一方法的實例,該方法包括使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位的上下文,並使用所判定的上下文寫碼該二進位。此外,該函數可藉由將二進位之索引右移位一值k且將經右移位之值添加至偏移值,來產生上下文之上下文索引,其中該偏移值係根據公式偏移=3*n+((n+1)>>2)而判定,其中值k係根據公式k=(n+3)>>2而判定,且其中值n係根據公式n=(log2(block_size)-2)而判定。
圖5為說明用於解碼視訊資料之當前區塊之實例方法的流程圖。當前區塊可包含一當前CU或該當前CU之一部分。儘管參考了視訊解碼器30(圖1及圖3)進行描述,但應理解,其他器件可經組態以執行類似於圖5之方法的方法。此外,儘管圖4之實例方法特定地描述使用此等技術來寫碼與視訊區塊之最末有效係數的位置有關之語法元素,但應理解,此等技術同樣可應用於寫碼其他語法元素。
視訊解碼器30可預測當前區塊(200),例如,使用框內或框間預測模式以計算當前區塊之所預測區塊。視訊解碼器30亦可接收當前區
塊之經熵寫碼資料,諸如對應於當前區塊之一殘餘區塊之係數的經熵寫碼資料(202)。視訊解碼器30可熵解碼該經熵寫碼資料,以再生殘餘區塊之係數(204)。
根據本發明之技術,視訊解碼器30可接收指示TU中之最末有效係數之位置的經編碼值(206)。該值的最大數目之二進位可使用CABAC進行解碼,而超過該最大數目的其他二進位可進行旁路解碼,如參考表1所描述。詳言之,根據本發明之技術,視訊解碼器30可使用一函數來判定該值之二進位的上下文(208)。如上文所解釋的,該等上下文可描述該等二進位具有特定值(例如,「0」或「1」)之可能性。該函數可對應於上文所描述之函數(1)-(12)中之一者,或一概念上類似之函數。
參考函數(5)-(8)之實例,視訊解碼器30可使用公式偏移+(i>>k)(其中偏移=3*n+((n+1)>>2)、k=(n+3)>>2,且n=(log2(block_size)-2)),來判定正被解碼的經二進位化值中的位於位置i處之二進位的上下文ctx_idx,其中該經二進位化值表示最末有效係數之一位置。亦即,視訊解碼器30可反覆地解碼有待熵解碼之每一二進位,且執行上文所展示之函數以判定用於寫碼當前反覆之二進位的上下文。接著視訊解碼器30可使用所判定之上下文來解碼該值之二進位(例如,未超過最大數目之二進位的二進位)(210)。舉例而言,視訊解碼器30可使用所判定之上下文來解碼自視訊編碼器20接收之經編碼資料,以再生或以其他方式獲得該值的二進位。同樣地,視訊解碼器30可旁路解碼該值之任何剩餘二進位(212)。
接著視訊解碼器30可基於最末有效係數之位置而逆掃描所再生之係數(214),以建立經量化之變換係數的區塊。亦即,視訊解碼器30可於最末有效係數之位置處開始,且按照大體上對應於編碼器所使用之掃描次序之一掃描次序將經解碼之係數置於TU中。接著視訊解
碼器30可逆量化且逆變換該等係數以產生殘餘區塊(216)。視訊解碼器30可最終藉由組合所預測區塊與殘餘區塊來解碼當前區塊(218)。
以此方式,圖5的方法表示一方法的實例,該方法包括使用指示視訊資料之一區塊之最末有效係數之值的二進位之索引的函數來判定用於熵寫碼該二進位的上下文,並使用所判定的上下文寫碼該二進位。此外,該函數可藉由將二進位之索引右移位一值k且將經右移位之值添加至偏移值,來產生上下文之上下文索引,其中該偏移值係根據公式偏移=3*n+((n+1)>>2)而判定,其中值k係根據公式k=(n+3)>>2而判定,且其中值n係根據公式n=(log2(block_size)-2)而判定。
應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可按照一不同序列執行、可被添加、合併或完全省略(例如,對於實踐該等技術而言並非所有所描述之動作或事件皆係必要的)。此外,在某些實例中,可(例如)經由多執行緒處理、中斷處理或多個處理器同時而非順序地執行動作或事件。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合予以實施。若以軟體予以實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括促進(例如)根據通信協定將電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體大體上可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括一電腦可讀媒體。
藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接可適當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纜、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為,係有關非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路之一或多個處理器來執行指令。因此,本文中所使用之術語「處理器」可指代上述結構或適於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,可將本文中所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可以多種器件或裝置予以實施,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片集)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術的器件之功能態樣,但未必要求藉由不同硬體單元來實現。實情為,如上文所
描述,可將各種單元組合於編碼解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合且結合適宜軟體及/或韌體來提供該等單元。
已描述各種實例。此等及其他實例屬於以下申請專利範圍之範疇內。
Claims (18)
- 一種寫碼視訊資料之方法,該方法包含:使用指示視訊資料之一區塊之一最末有效係數之一值的一二進位之一索引的一函數來判定用於熵寫碼該二進位的一上下文,其中該函數藉由將該二進位之該索引右移位一值k,且將該經右移位之值添加至一偏移值,來產生該上下文之一上下文索引,其中該偏移值係根據以下公式而判定:偏移=3*n+((n+1)>>2),其中該值k係根據以下公式而判定:k=(n+3)>>2,其中該值n係根據以下公式而判定:n=(log2(block_size)-2),且其中block_size之值包含指示該區塊之大小的一值;及使用所判定之該上下文寫碼該二進位。
- 如請求項1之方法,其中判定該上下文包含執行該函數。
- 如請求項1之方法,其中該函數包含一線性函數。
- 如請求項1之方法,其中該函數包含一非線性函數。
- 如請求項1之方法,其中該函數藉由將該二進位之該索引右移位一而產生該上下文之一上下文索引。
- 如請求項1之方法,其更包含自一使用者接收該函數。
- 如請求項1之方法,其更包含接收定義該函數之語法資料。
- 如請求項1之方法,其中寫碼該二進位包含使用所判定之該上下文來熵解碼經編碼之資料,以再生該二進位之一值。
- 如請求項1之方法,其中寫碼該二進位包含使用所判定之該上下文來熵編碼該二進位。
- 一種用於寫碼視訊資料之器件,該器件包含:一記憶體,該記憶體經組態以儲存該視訊資料;及一或多個處理器,該一或多個處理器經組態以:使用指示視訊資料之一區塊之一最末有效係數之一值的一二進位之一索引的一函數來判定用於熵寫碼該二進位的一上下文,其中該函數藉由將該二進位之該索引右移位一值k,且將該經右移位之值添加至一偏移值,來產生該上下文之一上下文索引,其中該偏移值係根據以下公式而判定:偏移=3*n+((n+1)>>2),其中該值k係根據以下公式而判定:k=(n+3)>>2,其中該值n係根據以下公式而判定:n=(log2(block_size)-2),且其中block_size之值包含指示該區塊之大小的一值;及使用該所判定之上下文寫碼該二進位。
- 如請求項10之器件,其中該視訊寫碼器經組態以至少部分藉由執行該函數來判定該上下文。
- 如請求項10之器件,其中該視訊寫碼器進一步經組態以接收定義該函數之語法資料。
- 如請求項10之器件,其中該視訊寫碼器經組態以至少部分藉由使用該所判定之上下文熵解碼經編碼之資料來寫碼該二進位,以再生該二進位之一值。
- 如請求項10之器件,其中該視訊寫碼器經組態以至少部分藉由使用該所判定之上下文熵編碼該二進位來寫碼該二進位。
- 如請求項10之器件,其中該器件包含以下項中之至少一者:一積體電路;一微處理器;及包含該視訊寫碼器之一無線通信器件。
- 一種用於寫碼視訊資料之器件,該器件包含:用於使用指示視訊資料之一區塊之一最末有效係數之一值的一二進位之一索引的一函數來判定用於熵寫碼該二進位之一上下文的構件,其中該函數藉由將該二進位之該索引右移位一值k,且將該經右移位之值添加至一偏移值,來產生該上下文之一上下文索引,其中該偏移值係根據以下公式而判定:偏移=3*n+((n+1)>>2),其中該值k係根據以下公式而判定:k=(n+3)>>2,其中該值n係根據以下公式而判定:n=(log2(block_size)-2),且其中block_size之值包含指示該區塊之大小的一值;及用於使用該所判定之上下文寫碼該二進位的構件。
- 如請求項16之器件,其中用於判定該上下文之該構件包含用於執行該函數之構件。
- 如請求項16之器件,其更包含用於接收定義該函數之語法資料的構件。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261614178P | 2012-03-22 | 2012-03-22 | |
US201261620273P | 2012-04-04 | 2012-04-04 | |
US201261666316P | 2012-06-29 | 2012-06-29 | |
US13/796,572 US9237344B2 (en) | 2012-03-22 | 2013-03-12 | Deriving context for last position coding for video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201352010A TW201352010A (zh) | 2013-12-16 |
TWI523530B true TWI523530B (zh) | 2016-02-21 |
Family
ID=49211799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102110387A TWI523530B (zh) | 2012-03-22 | 2013-03-22 | 導出最末位置寫碼之上下文以供視訊寫碼 |
Country Status (23)
Country | Link |
---|---|
US (1) | US9237344B2 (zh) |
EP (1) | EP2829061B1 (zh) |
JP (1) | JP6042526B2 (zh) |
KR (1) | KR101699600B1 (zh) |
CN (1) | CN104205835B (zh) |
AU (1) | AU2013235516B2 (zh) |
BR (1) | BR112014023466B1 (zh) |
CA (1) | CA2865616C (zh) |
DK (1) | DK2829061T3 (zh) |
ES (1) | ES2616486T3 (zh) |
HK (1) | HK1202741A1 (zh) |
HU (1) | HUE031741T2 (zh) |
IL (1) | IL234269A (zh) |
MY (1) | MY165949A (zh) |
PH (1) | PH12014502044B1 (zh) |
PL (1) | PL2829061T3 (zh) |
PT (1) | PT2829061T (zh) |
RU (1) | RU2629437C2 (zh) |
SG (1) | SG11201405150XA (zh) |
SI (1) | SI2829061T1 (zh) |
TW (1) | TWI523530B (zh) |
WO (1) | WO2013142195A1 (zh) |
ZA (1) | ZA201407494B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2711671T3 (es) * | 2011-06-28 | 2019-05-06 | Samsung Electronics Co Ltd | Procedimiento de decodificación de vídeo usando decodificación |
US9888261B2 (en) * | 2011-11-08 | 2018-02-06 | Samsung Electronics Co., Ltd. | Method and device for arithmetic coding of video, and method and device for arithmetic decoding of video |
AU2014202682A1 (en) * | 2014-05-16 | 2015-12-03 | Canon Kabushiki Kaisha | Method, apparatus and system for copying a block of video samples |
US10425659B2 (en) * | 2015-01-30 | 2019-09-24 | Qualcomm Incorporated | Coding escape pixels for palette coding |
US10574993B2 (en) | 2015-05-29 | 2020-02-25 | Qualcomm Incorporated | Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design |
EP3306924A1 (en) | 2016-10-05 | 2018-04-11 | Thomson Licensing | Method and device for context-adaptive binary arithmetic coding a sequence of binary symbols representing a syntax element related to picture data |
GB2567861A (en) | 2017-10-27 | 2019-05-01 | Sony Corp | Image data encoding and decoding |
EP3490253A1 (en) | 2017-11-23 | 2019-05-29 | Thomson Licensing | Encoding and decoding methods and corresponding devices |
WO2020141856A1 (ko) * | 2019-01-02 | 2020-07-09 | 엘지전자 주식회사 | 영상 코딩 시스템에서 레지듀얼 정보를 사용하는 영상 디코딩 방법 및 그 장치 |
US11218735B2 (en) * | 2019-04-02 | 2022-01-04 | Qualcomm Incorporated | Context derivation for last position coding for video coding |
US11336893B2 (en) * | 2020-01-07 | 2022-05-17 | Qualcomm Incorporated | Context derivation and entropy coding initialization parameters for coordinates of last position coding in video coding |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434623A (en) * | 1991-12-20 | 1995-07-18 | Ampex Corporation | Method and apparatus for image data compression using combined luminance/chrominance coding |
US5734755A (en) * | 1994-03-11 | 1998-03-31 | The Trustees Of Columbia University In The City Of New York | JPEG/MPEG decoder-compatible optimized thresholding for image and video signal compression |
EP1933568A3 (en) | 2001-09-14 | 2008-06-25 | Nokia Corporation | Method and system for context-based adaptive binary arithmetic coding |
CN100483402C (zh) * | 2002-08-28 | 2009-04-29 | 思科系统公司 | 用于执行高速上下文检索和数据模式特征描述的可编程规则处理设备 |
US7724818B2 (en) | 2003-04-30 | 2010-05-25 | Nokia Corporation | Method for coding sequences of pictures |
US7379608B2 (en) * | 2003-12-04 | 2008-05-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Arithmetic coding for transforming video and picture data units |
US7570827B2 (en) * | 2004-07-14 | 2009-08-04 | Slipstream Data Inc. | Method, system and computer program product for optimization of data compression with cost function |
NO322043B1 (no) * | 2004-12-30 | 2006-08-07 | Tandberg Telecom As | Fremgangsmate for forenklet entropikoding |
RU2336661C2 (ru) * | 2005-04-19 | 2008-10-20 | Самсунг Электроникс Ко., Лтд. | Способ и устройство адаптивного выбора контекстной модели для кодирования по энтропии |
WO2008065814A1 (en) | 2006-11-30 | 2008-06-05 | Panasonic Corporation | Coder |
WO2008084443A1 (en) | 2007-01-09 | 2008-07-17 | Nokia Corporation | System and method for implementing improved decoded picture buffer management for scalable video coding and multiview video coding |
US7535387B1 (en) * | 2007-09-10 | 2009-05-19 | Xilinx, Inc. | Methods and systems for implementing context adaptive binary arithmetic coding |
US8891615B2 (en) * | 2008-01-08 | 2014-11-18 | Qualcomm Incorporated | Quantization based on rate-distortion modeling for CABAC coders |
KR100936208B1 (ko) * | 2008-12-09 | 2010-01-12 | 주식회사세오 | 무손실 문맥적응적이진산술부호화를 위한 h.264/avc 부호화기, 상기 부호화기의 문맥적응적이진산술부호화방법 |
US20110110416A1 (en) * | 2009-11-12 | 2011-05-12 | Bally Gaming, Inc. | Video Codec System and Method |
CN103119849B (zh) | 2010-04-13 | 2017-06-16 | 弗劳恩霍夫应用研究促进协会 | 概率区间分割编码器和译码器 |
KR102574591B1 (ko) | 2010-05-12 | 2023-09-06 | 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 | 통합된 유효성 맵 코딩을 위한 방법 및 장치 |
US9591320B2 (en) | 2010-07-15 | 2017-03-07 | Texas Instruments Incorporated | Context and bypass encoding video |
US9042440B2 (en) * | 2010-12-03 | 2015-05-26 | Qualcomm Incorporated | Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding |
US20120163456A1 (en) * | 2010-12-22 | 2012-06-28 | Qualcomm Incorporated | Using a most probable scanning order to efficiently code scanning order information for a video block in video coding |
US20120163472A1 (en) * | 2010-12-22 | 2012-06-28 | Qualcomm Incorporated | Efficiently coding scanning order information for a video block in video coding |
US8768080B2 (en) | 2011-01-04 | 2014-07-01 | Blackberry Limited | Coding of residual data in predictive compression |
US8687904B2 (en) | 2011-01-14 | 2014-04-01 | Panasonic Corporation | Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and image coding and decoding apparatus which include arithmetic coding or arithmetic decoding |
CN107529708B (zh) * | 2011-06-16 | 2019-05-07 | Ge视频压缩有限责任公司 | 解码器、编码器、解码和编码视频的方法及存储介质 |
US10536701B2 (en) * | 2011-07-01 | 2020-01-14 | Qualcomm Incorporated | Video coding using adaptive motion vector resolution |
US10390046B2 (en) * | 2011-11-07 | 2019-08-20 | Qualcomm Incorporated | Coding significant coefficient information in transform skip mode |
US9357185B2 (en) * | 2011-11-08 | 2016-05-31 | Qualcomm Incorporated | Context optimization for last significant coefficient position coding |
US9565435B2 (en) * | 2012-02-04 | 2017-02-07 | Google Technology Holdings LLC | Devices and methods for context reduction in last significant coefficient position coding |
US9386307B2 (en) * | 2012-06-14 | 2016-07-05 | Qualcomm Incorporated | Grouping of bypass-coded bins for SAO syntax elements |
-
2013
- 2013-03-12 US US13/796,572 patent/US9237344B2/en active Active
- 2013-03-13 SG SG11201405150XA patent/SG11201405150XA/en unknown
- 2013-03-13 EP EP13712992.0A patent/EP2829061B1/en active Active
- 2013-03-13 AU AU2013235516A patent/AU2013235516B2/en active Active
- 2013-03-13 SI SI201330493A patent/SI2829061T1/sl unknown
- 2013-03-13 CN CN201380015445.0A patent/CN104205835B/zh active Active
- 2013-03-13 PL PL13712992T patent/PL2829061T3/pl unknown
- 2013-03-13 HU HUE13712992A patent/HUE031741T2/en unknown
- 2013-03-13 WO PCT/US2013/030886 patent/WO2013142195A1/en active Application Filing
- 2013-03-13 MY MYPI2014702357A patent/MY165949A/en unknown
- 2013-03-13 BR BR112014023466-3A patent/BR112014023466B1/pt active IP Right Grant
- 2013-03-13 JP JP2015501752A patent/JP6042526B2/ja active Active
- 2013-03-13 DK DK13712992.0T patent/DK2829061T3/en active
- 2013-03-13 KR KR1020147029386A patent/KR101699600B1/ko active IP Right Grant
- 2013-03-13 CA CA2865616A patent/CA2865616C/en active Active
- 2013-03-13 RU RU2014142546A patent/RU2629437C2/ru active
- 2013-03-13 ES ES13712992.0T patent/ES2616486T3/es active Active
- 2013-03-13 PT PT137129920T patent/PT2829061T/pt unknown
- 2013-03-22 TW TW102110387A patent/TWI523530B/zh active
-
2014
- 2014-08-24 IL IL234269A patent/IL234269A/en active IP Right Grant
- 2014-09-15 PH PH12014502044A patent/PH12014502044B1/en unknown
- 2014-10-15 ZA ZA2014/07494A patent/ZA201407494B/en unknown
-
2015
- 2015-03-26 HK HK15103086.2A patent/HK1202741A1/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11496385B2 (en) | Binarizing secondary transform index | |
CA3000373C (en) | Video intra-prediction using position dependent prediction combination for video coding | |
TWI523530B (zh) | 導出最末位置寫碼之上下文以供視訊寫碼 | |
US8995523B2 (en) | Memory efficient context modeling | |
KR102334126B1 (ko) | 인트라 블록 복사를 위한 레지듀얼 예측 | |
US9848197B2 (en) | Transforms in video coding | |
JP6695692B2 (ja) | ビデオコーディングにおける4:2:2サンプルフォーマットのためのイントラコーディング | |
AU2012332242B2 (en) | Intra-mode video coding | |
US9877035B2 (en) | Quantization processes for residue differential pulse code modulation | |
JP6162212B2 (ja) | マージシグナリングおよびループフィルタオン/オフシグナリング | |
TWI520584B (zh) | 用信號發送用於一葉層級編碼單元之子集的轉換係數的語法元素 | |
TWI527440B (zh) | 在視訊寫碼中針對高效率視訊寫碼(hevc)延伸之多層之低複雜度支援 | |
US20130272423A1 (en) | Transform coefficient coding | |
TWI558179B (zh) | 對視訊寫碼發信長期參考圖像 | |
TW201342920A (zh) | 在視訊寫碼中用於色度分量之變換單位分割 | |
TWI558174B (zh) | 用於寫碼視訊資訊之裝置、方法及非暫時性電腦可讀媒體 | |
US20130188698A1 (en) | Coefficient level coding | |
TW201444350A (zh) | 方形區塊預測 | |
US20130128971A1 (en) | Transforms in video coding | |
KR20140139571A (ko) | 비디오 코딩을 위한 계층간 텍스처 예측 |