TW201926995A - 用於在視訊寫碼中自適應之迴路濾波之線路緩衝減少 - Google Patents
用於在視訊寫碼中自適應之迴路濾波之線路緩衝減少 Download PDFInfo
- Publication number
- TW201926995A TW201926995A TW107142291A TW107142291A TW201926995A TW 201926995 A TW201926995 A TW 201926995A TW 107142291 A TW107142291 A TW 107142291A TW 107142291 A TW107142291 A TW 107142291A TW 201926995 A TW201926995 A TW 201926995A
- Authority
- TW
- Taiwan
- Prior art keywords
- block
- video
- video data
- samples
- filter
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/563—Motion estimation with padding, i.e. with filling of non-object values in an arbitrarily shaped picture block or region for estimation purposes
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本發明揭示一種寫碼視訊資料之方法,該方法包含:寫碼視訊資料之一區塊以獲得視訊資料之一經寫碼區塊;將由一濾波器支援限定之一自適應迴路濾波器應用於視訊資料之該經寫碼區塊的樣本,包括對該濾波器支援之在該區塊外部之部分使用填補樣本;在將自適應迴路濾波應用於視訊資料之該經寫碼區塊之後輸出視訊資料之該經寫碼區塊。
Description
本發明係關於視訊編碼及解碼。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放機、視訊遊戲器件、視訊遊戲主控台、蜂巢式或衛星無線電電話(所謂的「智慧型電話」)、視訊電傳會議器件、視訊串流器件及其類似者。數位視訊器件實施視訊壓縮技術,諸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分、進階視訊寫碼(AVC)、ITU-T H.265、高效率視訊寫碼(HEVC)標準所定義的標準及此等標準之擴展中所描述的彼等視訊壓縮技術。視訊器件可藉由實施此等視訊壓縮技術而更高效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊壓縮技術可執行空間(圖像內)預測及/或時間(圖像間)預測來減少或移除視訊序列中固有的冗餘。對於基於區塊之視訊寫碼,視訊圖塊(例如,視訊圖框或視訊圖框的一部分)可分割成視訊區塊,諸如寫碼樹型區塊及寫碼區塊。空間或時間預測產生用於待寫碼區塊的預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。為了進一步壓縮,可將殘餘資料自像素域變換至變換域,從而產生可接著進行量化之殘餘變換係數。
大體而言,本發明描述與供用於視訊寫碼之濾波器有關的技術。在一些實例中,本發明描述用於在視訊寫碼中使用之自適應迴路濾波器(ALF)及雙向濾波器之複雜度降低的技術。本發明之技術可包括基於區塊內之樣本的位置針對區塊之某些樣本啟用或停用濾波器(例如,ALF、雙向濾波器,或其他濾波器)。本發明之其他技術包括使用填補樣本而非最大寫碼單元列外部之樣本來執行濾波。以此方式,對儲存來自相鄰區塊之樣本之線緩衝器的需求可消除及/或減少。本發明之技術可用於進階視訊編解碼器之上下文,諸如HEVC之擴展或視訊寫碼標準之下一代,諸如H.266/VVC (通用視訊寫碼)。
在一個實例中,本發明描述一種寫碼視訊資料之方法,該方法包含寫碼視訊資料區塊以獲得視訊資料之經寫碼區塊,將由濾波器支援限定之自適應迴路濾波器應用於視訊資料之經寫碼區塊的樣本,包括對濾波器支援之在區塊外部之部分使用填補樣本,及在將自適應迴路濾波應用於視訊資料之經寫碼區塊之後輸出視訊資料之經寫碼區塊。
在另一實例中,本發明描述一種經組態以寫碼視訊資料之裝置,該裝置包含記憶體,其經組態以儲存視訊資料之經寫碼區塊;及一或多個處理器,其在與記憶體通信之電路中實施,該一或多個處理器經組態以寫碼視訊資料區塊以獲得視訊資料之經寫碼區塊,將由濾波器支援限定之自適應迴路濾波器應用於視訊資料之經寫碼區塊的樣本,包括對濾波器支援之在區塊外部之部分使用填補樣本,及在將自適應迴路濾波應用於視訊資料之經寫碼區塊之後輸出視訊資料之經寫碼區塊。
在另一實例中,本發明描述一種經組態以寫碼視訊資料之裝置,該裝置包含用於寫碼視訊資料區塊以獲得視訊資料之經寫碼區塊的構件,用於將由濾波器支援限定之自適應迴路濾波器應用於視訊資料之經寫碼區塊的樣本,包括對濾波器支援之在區塊外部之部分使用填補樣本的構件,及用於在將自適應迴路濾波應用於視訊資料之經寫碼區塊之後輸出視訊資料之經寫碼區塊的構件。
在另一實例中,本發明描述一種儲存指令之非暫時性電腦可讀媒體,該等指令在執行時使一或多個處理器:寫碼視訊資料區塊以獲得視訊資料之經寫碼區塊,將由濾波器支援限定之自適應迴路濾波器應用於視訊資料之經寫碼區塊的樣本,包括對濾波器支援之在區塊外部之部分使用填補樣本,及在將自適應迴路濾波應用於視訊資料之經寫碼區塊之後輸出視訊資料之經寫碼區塊。
在隨附圖式及以下描述中闡述本發明之一或多個態樣的細節。本發明中描述之技術的其他特徵、目標及優勢將自描述及圖式且自申請專利範圍顯而易見。
本申請案主張2017年11月28日申請的美國臨時申請案第62/591,504號之益處,該申請案之全部內容以引用的方式併入本文中。
大體而言,本發明描述與自適應迴路濾波器(ALF)及雙向濾波器有關的技術。如下文將更詳細地解釋,本發明描述當執行可使用來自相鄰區塊之樣本的ALF、雙向濾波或其他類型之濾波時可減少用作線緩衝器所需之記憶體的量的技術。
圖1為說明可使用本發明之技術之實例視訊編碼及解碼系統10的方塊圖。如圖1中所展示,系統10包括源器件12,其提供稍後將由目的地器件14解碼的經編碼視訊資料。特定言之,源器件12經由電腦可讀媒體16將經編碼視訊資料提供至目的地器件14。源器件12及目的地器件14可包含廣泛範圍之器件中之任一者,包括桌上型電腦、筆記型電腦(亦即,膝上型電腦)、平板電腦、機上盒、諸如所謂的「智慧型」電話之電話手持機、平板電腦、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件或其類似物。在一些情況下,源器件12及目的地器件14可經裝備以用於無線通信。因此,源器件12及目的地器件14可為無線通信器件。可將本發明中所描述之技術應用於無線及/或有線應用。源器件12為實例視訊編碼器件(亦即,用於編碼視訊資料之器件)。目的地器件14為實例視訊解碼器件(亦即,用於解碼視訊資料之器件)。
圖1中所說明之系統10僅為一個實例。用於處理視訊資料之技術可藉由任何數位視訊編碼及/或解碼器件來執行。在一些實例中,可藉由視訊編碼器/解碼器(通常被稱為「編碼解碼器」)執行該等技術。源器件12及目的地器件14為源器件12產生經寫碼視訊資料以供傳輸至目的地器件14之此類寫碼器件的實例。在一些實例中,源器件12及目的地器件14可以實質上對稱方式操作,使得源器件12及目的地器件14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援源器件12與目的地器件14之間的單向或雙向視訊傳輸,例如用於視訊串流、視訊播放、視訊廣播或視訊電話。
在圖1之實例中,源器件12包括視訊源18、經組態以儲存視訊資料之儲存媒體19、視訊編碼器20及輸出介面22。目的地器件14包括輸入介面26、經組態以儲存經編碼視訊資料之儲存媒體28、視訊解碼器30及顯示器件32。在其他實例中,源器件12及目的地器件14包括其他組件或配置。舉例而言,源器件12可自外部視訊源(諸如,外部攝影機)接收視訊資料。同樣地,目的地器件14可與外部顯示器件介接,而非包括整合顯示器件。
視訊源18為視訊資料之源。視訊資料可包含一系列圖像。視訊源18可包括視訊捕捉器件,諸如視訊攝影機、含有先前捕捉之視訊的視訊存檔及/或用於自視訊內容提供者接收視訊資料的視訊饋入介面。在一些實例中,視訊源18產生基於電腦圖形之視訊資料或實況視訊、存檔視訊及電腦產生之視訊的組合。儲存媒體19可經組態以儲存視訊資料。在每一情況下,可由視訊編碼器20編碼所捕捉、經預先捕捉或電腦產生之視訊。
輸出介面22可將經編碼視訊資訊輸出至電腦可讀媒體16。輸出介面22可包含各種類型之組件或器件。舉例而言,輸出介面22可包含無線傳輸器、數據機、有線網路連接組件(例如,乙太網路卡)或另一實體組件。在輸出介面22包含無線傳輸器之實例中,輸出介面22可經組態以傳輸根據蜂巢式通信標準(諸如4G、4G-LTE、進階LTE、5G及類似者)調變之資料,諸如經編碼視訊資料。在輸出介面22包含無線傳輸器之一些實例中,輸出介面22可經組態以傳輸根據其他無線標準(諸如IEEE 802.11規範、IEEE 802.15規範(例如,ZigBee™)、Bluetooth™標準及類似者)調變之資料,諸如經編碼視訊資料。在一些實例中,輸出介面22之電路整合於源器件12之視訊編碼器20及/或其他組件之電路中。舉例而言,視訊編碼器20及輸出介面22可為系統單晶片(SoC)之部分。SoC亦可包括其他組件,諸如,通用微處理器、圖形處理單元等。
目的地器件14可經由電腦可讀媒體16接收待解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14之任何類型的媒體或器件。在一些實例中,電腦可讀媒體16包含使得源器件12能夠即時將經編碼視訊資料直接地傳輸至目的地器件14的通信媒體。通信媒體可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全球網路)的一部分。通信媒體可包括路由器、交換器、基地台或可用於促進自源器件12至目的地器件14的通信之任何其他設備。目的地器件14可包括經組態以儲存經編碼視訊資料及經解碼視訊資料之一或多個資料儲存媒體。
電腦可讀媒體16可包括暫時性媒體,諸如無線廣播或有線網路傳輸,或儲存媒體(亦即,非暫時性儲存媒體),諸如硬碟、固態驅動器、快閃驅動器、緊密光碟、數位視訊光碟、藍光光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(未展示)可自源器件12接收經編碼視訊資料且將經編碼視訊資料提供至目的地器件14,例如,經由網路傳輸。類似地,諸如光碟衝壓設施之媒體生產設施之計算器件可自源器件12接收經編碼視訊資料且生產含有經編碼視訊資料之光碟。因此,在各種實例中,電腦可讀媒體16可理解為包括各種形式中之任一者的一或多個電腦可讀媒體。
在一些實例中,輸出介面22可將諸如經編碼視訊資料之資料輸出至中間器件,諸如儲存器件。類似地,目的地器件12之輸入介面26可自中間器件接收經編碼資料。中間器件可包括多種分佈式或本端存取式資料儲存媒體中之任一者,諸如,硬碟機、固態驅動器、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼視訊資料之任何其他合適的數位儲存媒體。在一些實例中,中間器件對應於檔案伺服器。實例檔案伺服器包括網頁伺服器、FTP伺服器、網路附接儲存(NAS)器件或本機磁碟機。
目的地器件14可經由任何標準資料連接(包括網際網路連接)存取經編碼視訊資料。此可包括適用於存取儲存於檔案伺服器上之經編碼視訊資料的無線通道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機、光纖等),或兩者的組合。來自儲存器件之經編碼視訊資料之傳輸可為串流傳輸、下載傳輸,或其組合。
目的地器件14之輸入介面26自電腦可讀媒體16接收資料。輸入介面26可包含各種類型之組件或器件。舉例而言,輸入介面26可包含無線接收器、數據機、有線網路連接組件(例如,乙太網路卡)、光學網路連接卡或另一實體組件。在輸入介面26包含無線接收器之實例中,輸入介面26可經組態以接收根據蜂巢式通信標準(諸如,4G、4G-LTE、進階LTE、5G及類似者)調變之資料,諸如位元串流。在輸入介面26包含無線接收器之一些實例中,輸入介面26可經組態以接收根據其他無線標準(諸如IEEE 802.11規範、IEEE 802.15規範(例如,ZigBee™)、Bluetooth™標準及其類似者)調變之資料,諸如位元串流。在一些實例中,輸入介面26之電路可整合至目的地器件14之視訊解碼器30及/或其他組件之電路中。舉例而言,視訊解碼器30及輸入介面26可為SoC之部分。SoC亦可包括其他組件,諸如,通用微處理器、圖形處理單元等。
儲存媒體28可經組態以儲存經編碼視訊資料,諸如藉由輸入介面26接收之經編碼視訊資料(例如,位元串流)。顯示器件32將經解碼視訊資料顯示給使用者。顯示器件32可包含多種顯示器件中之任一者,該等顯示器件諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器單元30各自可實施為各種合適的處理電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分以軟體實施時,器件可將用於軟體之指令儲存於合適的非暫時性電腦可讀媒體中,且可使用一或多個處理器在硬體中執行該等指令,以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中的任一者可整合為各別器件中之組合式編碼器/解碼器(編解碼器)的部分。
在一些實例中,視訊編碼器20及視訊解碼器30根據一或多個視訊寫碼標準或規範來編碼及解碼視訊資料。舉例而言,視訊編碼器20及視訊解碼器30可根據ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264(亦被稱作ISO/IEC MPEG-4 AVC) (包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展)或另一視訊寫碼標準或規範而編碼及解碼視訊資料。在一些實例中,視訊編碼器20及視訊解碼器30根據高效視訊寫碼(HEVC)標準(其被稱為ITU-T H.265)、其範圍及螢幕內容寫碼擴展、其3D視訊寫碼擴展(3D-HEVC)、其多視圖擴展(MV-HEVC)或其可調式擴展(SHVC)而編碼及解碼視訊資料。
ITU-T VCEG (Q6/16)及ISO/IEC MPEG (JTC 1/SC 29/WG 11)現正研究對於將具有超過當前HEVC標準(包括其當前擴展及針對螢幕內容寫碼及高動態範圍寫碼的近期擴展)之壓縮能力的未來視訊寫碼技術標準化的潛在需要。該等群組正共同致力於聯合合作工作(被稱為聯合視訊探索小組(JVET))中之此探索活動,以評估由此領域中之專家建議的壓縮技術設計。JVET首先在2015年10月19日至21日期間滿足。參考軟體之最近版本(亦即,聯合探索模型7 (JEM7))可自https://jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/tags/HM-16.6-JEM-7.0/下載。JEM7之此演算法描述可被稱作J. Chen、E. Alshina、G. J. Sullivan、J.-R. Ohm、J. Boyce (JVET-C1001,托里諾,2017年7月)的「Algorithm description of Joint Exploration Test Model 7 (JEM7)」。
新的視訊寫碼標準之早期草案,被稱作H.266/多功能視訊寫碼(VVC)標準,係在文件JVET-J1001,Benjamin Bross之「Video Coding (Draft 1)」中獲得,且其演算法描述係在文件JVET-J1002,Jianle Chen及Elena Alshina之「Algorithm description for Versatile Video Coding and Test Model 1 (VTM 1)」中獲得。
本發明之技術可用於進階視訊編解碼器之上下文中,諸如HEVC之擴展或下一代視訊寫碼標準(例如,H.266/VVC)中。雖然通常參考HEVC及下一代視訊寫碼標準(例如,VVC/JEM)描述本發明之技術,但應理解,本發明之技術可與使用迴路濾波器(包括ALF及解區塊濾波器)之任何視訊寫碼技術結合使用。
如下文將更詳細地解釋,視訊編碼器20及視訊解碼器30可經組態以減少儲存用於自適應迴路濾波器(ALF)之特定濾波器支援的經解碼/經重建構區塊外部之樣本所需的線緩衝器記憶體的量的方式將ALF應用於視訊資料之經解碼/經重建構區塊。舉例而言,視訊編碼器20及視訊解碼器30可經組態以寫碼(例如,編碼或解碼)視訊資料區塊以獲得視訊資料之經寫碼區塊,將由濾波器支援限定之自適應迴路濾波器應用於視訊資料之經寫碼區塊的樣本,包括對濾波器支援之在區塊外部之部分使用填補樣本,及在將自適應迴路濾波應用於視訊資料之經寫碼區塊之後輸出視訊資料之經寫碼區塊。
在HEVC及其他視訊寫碼規範中,視訊資料包括一系列圖像。圖像亦可被稱為「圖框」。圖像可包括一或多個樣本陣列。圖像之每一各別樣本陣列可包含各別色彩分量之樣本的陣列。圖像可包括三個樣本陣列,標示為SL
、SCb
及SCr
。SL
為明度樣本之二維陣列(亦即,區塊)SCb
為Cb色度樣本之二維陣列。SCr
為Cr色度樣本之二維陣列。在其他情況下,圖像可為單色的且可僅包括明度樣本陣列。
作為編碼視訊資料之部分,視訊編碼器20可編碼視訊資料之圖像。換言之,視訊編碼器20可產生視訊資料之圖像之經編碼表示。圖像之經編碼表示在本文中可被稱作「經寫碼圖像」或「經編碼圖像」。
為產生圖像之經編碼表示,視訊編碼器20可編碼圖像之區塊。視訊編碼器20可將視訊區塊之經編碼表示包括於位元串流中。在一些實例中,為編碼圖像之區塊,視訊編碼器20執行框內預測或框間預測以產生一或多個預測性區塊。此外,視訊編碼器20可產生用於區塊之殘餘資料。殘餘區塊包含殘餘樣本。每一殘餘樣本可指示所產生之預測性區塊中之一者的樣本與區塊之對應樣本之間的差異。視訊編碼器20可將變換應用於殘餘樣本之區塊以產生變換係數。此外,視訊編碼器20可量化變換係數。在一些實例中,視訊編碼器20可產生一或多個語法元素以表示變換係數。視訊編碼器20可熵編碼表示變換係數之語法元素中之一或多者。
更特定言之,當根據HEVC或其他視訊寫碼規格編碼視訊資料時,為產生圖像之經編碼表示,視訊編碼器20可將圖像之每一樣本陣列分割成寫碼樹型區塊(CTB)且編碼CTB。CTB可為圖像之樣本陣列中的樣本之N×N區塊。在HEVC主規範中,CTB之大小可在16×16至64×64之範圍內(儘管技術上可支援8×8 CTB大小)。
圖像之寫碼樹型單元(CTU)可包含一或多個CTB且可包含用於編碼該一或多個CTB之樣本的語法結構。舉例而言,每一CTU可包含明度樣本之CTB、色度樣本之兩個對應CTB,及用於編碼CTB之樣本的語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,CTU可包含單一CTB及用於編碼CTB之樣本的語法結構。CTU亦可被稱作「樹型區塊」或「最大寫碼單元(LCU)」。在本發明中,「語法結構」可定義為以指定次序共同存在於位元串流中之一或多個語法元素。在一些編解碼器中,經編碼圖像為含有圖像之所有CTU的經編碼表示。
為編碼圖像之CTU,視訊編碼器20可將CTU之CTB分割成一或多個寫碼區塊。寫碼區塊為樣本之N×N區塊。在一些編解碼器中,為編碼圖像之CTU,視訊編碼器20可對CTU之寫碼樹型區塊遞歸地執行四分樹分割以將CTB分割成寫碼區塊,因此命名為「寫碼樹型單元」。寫碼單元(CU)可包含一或多個寫碼區塊及用於編碼一或多個寫碼區塊之樣本的語法結構。舉例而言,CU可包含具有明度樣本陣列、Cb樣本陣列及Cr樣本陣列之圖像的明度樣本之寫碼區塊,及色度樣本之兩個對應寫碼區塊,以及用於對寫碼區塊之樣本進行編碼的語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,CTU可包含單一寫碼區塊及用於寫碼該寫碼區塊之樣本的語法結構。
此外,視訊編碼器20可編碼視訊資料之圖像之CU。在一些編解碼器中,作為編碼CU之部分,視訊編碼器20可將CU之寫碼區塊分割成一或多個預測區塊。預測區塊為其上應用相同預測之樣本的矩形(亦即,正方形或非正方形)區塊。CU之預測單元(PU)可包含CU之一或多個預測區塊及用於預測該一或多個預測區塊之語法結構。舉例而言,PU可包含明度樣本之預測區塊、色度樣本之兩個對應預測區塊,及用於對預測區塊進行預測之語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,PU可包含單一預測區塊及用於對該預測區塊進行預測之語法結構。
視訊編碼器20可產生用於CU之PU的預測區塊(例如,明度、Cb及Cr預測區塊)之預測性區塊(例如,明度、Cb及Cr預測性區塊)。視訊編碼器20可使用框內預測或框間預測以產生預測性區塊。若視訊編碼器20使用框內預測以產生預測性區塊,則視訊編碼器20可基於包括CU之圖像的經解碼樣本產生預測性區塊。若視訊編碼器20使用框間預測以產生當前圖像之PU之預測性區塊,則視訊編碼器20可基於參考圖像(亦即,除當前圖像外之圖像)之經解碼樣本產生PU之預測性區塊。在HEVC中,視訊編碼器20在「coding_unit」語法結構內產生用於框間預測之PU之「prediction_unit」語法結構,但不在「coding_unit」語法結構內產生用於框內預測之PU之「prediction_unit」語法結構。實際上,在HEVC中,關於框內預測之PU之語法元素直接包括於「coding_unit」語法結構中。
JEM/VVC亦提供仿射運動補償模式,其可被視為框間預測模式。在仿射運動補償模式中,視訊編碼器20可判定表示非平移運動(諸如放大或縮小、旋轉、透視運動或其他不規則運動類型)之兩個或更多個運動向量。
視訊編碼器20可產生CU之一或多個殘餘區塊。舉例而言,視訊編碼器20可產生CU之明度殘餘區塊。CU之明度殘餘區塊中的各樣本指示CU之預測性明度區塊中之一者中的明度樣本與CU之原始明度寫碼區塊中的對應樣本之間的差異。另外,視訊編碼器20可產生用於CU之Cb殘餘區塊。CU之Cb殘餘區塊中的每一樣本可指示CU之預測性Cb區塊中之中一者中的Cb樣本與CU之原始Cb寫碼區塊中的對應樣本之間的差異。視訊編碼器20亦可產生CU之Cr殘餘區塊。CU之Cr殘餘區塊中的每一樣本可指示CU之預測性Cr區塊之中之一者中的Cr樣本與CU之原始Cr寫碼區塊中的對應樣本之間的差異。
此外,視訊編碼器20可將CU之殘餘區塊分解為一或多個變換區塊。例如,視訊編碼器20可使用四分樹分割以將CU之殘餘區塊分解成一或多個變換區塊。變換區塊為供應用相同變換之樣本的矩形((例如正方形或非正方形)區塊。CU之變換單元(TU)可包含一或多個變換區塊。舉例而言,TU可包含明度樣本之變換區塊、色度樣本之兩個對應變換區塊,及用於對變換區塊樣本進行變換之語法結構。因此,CU之每一TU可具有明度變換區塊、Cb變換區塊及Cr變換區塊。TU之明度變換區塊可為CU之明度殘餘區塊的子區塊。Cb變換區塊可為CU之Cb殘餘區塊的子區塊。Cr變換區塊可為CU之Cr殘餘區塊的子區塊。在單色圖像或具有三個單獨色彩平面之圖像中,TU可包含單一變換區塊及用於對變換區塊之樣本進行變換的語法結構。
在JEM7中,可使用四分樹二進位樹(QTBT)分割結構而非使用上述HEVC之四分樹分割結構。QTBT結構移除多個分區類型之概念。亦即,QTBT結構移除CU、PU及TU概念之分離,且支援CU分區形狀之較多可撓性。在QTBT區塊結構中,CU可具有正方形或矩形形狀。在一個實例中,CU為按四分樹結構之第一分區。四分樹葉節點藉由二元樹結構進一步分割。
在一些實例中,存在兩種分裂類型:對稱水平分裂及對稱豎直分裂。二元樹葉節點被稱作CU,且該分段(亦即,CU)用於預測及變換處理而無需任何進一步分割。此意謂CU、PU及TU在QTBT寫碼區塊結構中具有相同區塊大小。在JEM中,CU有時由具有不同色彩分量之寫碼區塊(CB)組成。舉例而言,在4:2:0色度格式之P及B圖塊的情況下,一個CU含有一個明度CB及兩個色度CB,且有時由具有單一分量之CB組成。舉例而言,在I圖塊的情況下,一個CU含有僅一個明度CB或僅兩個色度CB。
圖2A及圖2B為說明實例四分樹二元樹(QTBT)結構130及對應寫碼樹型單元(CTU) 132之概念圖。實線表示四分樹分裂,且點線指示二元樹分裂。在二元樹之每一分裂(亦即,非葉)節點中,一個旗標經傳信以指示使用哪一分裂類型(亦即,水平或豎直),其中在此實例中,0指示水平分裂且1指示豎直分裂。對於四分樹分裂,不存在對於指示分裂類型之需要,此係由於四分樹節點將區塊水平地及豎直地分裂成具有相等大小之4個子區塊。因此,視訊編碼器20可編碼,且視訊解碼器30可解碼用於QTBT結構130之區域樹層級(亦即實線)的語法元素(諸如分裂資訊)及用於QTBT結構130之預測樹層級(亦即虛線)的語法元素(諸如分裂資訊)。視訊編碼器20可編碼,且視訊解碼器30可解碼用於由QTBT結構130之端葉節點表示之CU的視訊資料(諸如預測及轉換資料)。
一般而言,圖2B之CTU 132可與定義對應於在第一及第二層級處的QTBT結構130之節點的區塊之大小的參數相關聯。此等參數可包括CTU大小(表示樣本中之CTU 132之大小)、最小四分樹大小(MinQTSize,表示最小允許四分樹葉節點大小)、最大二元樹大小(MaxBTSize,表示最大允許二元樹根節點大小)、最大二元樹深度(MaxBTDepth,表示最大允許二元樹深度),及最小二元樹大小(MinBTSize,表示最小允許二元樹葉節點大小)。
QTBT結構之對應於CTU之根節點可具有在QTBT結構之第一層級處的四個子節點,該等節點中之每一者可根據四分樹分割來分割。亦即,第一層級之節點為葉節點(不具有子節點)或具有四個子節點。QTBT結構130之實例表示諸如包括具有用於分枝之實線之父節點及子節點的節點。若第一層級之節點不大於最大允許二元樹根節點大小(MaxBTSize),則其可藉由各別二元樹進一步分割。一個節點之二元樹分裂可重複,直至由分裂產生之節點達至最小允許之二元樹葉節點大小(MinBTSize),或最大允許之二元樹深度(MaxBTDepth)為止。QTBT結構130之實例表示諸如具有用於分枝之虛線的節點。二元樹葉節點被稱作寫碼單元(CU),其用於預測(例如,圖像內或圖像間預測)及變換而無需任何進一步分割。如上文所論述,CU亦可被稱作「視訊區塊」或「區塊」。
在QTBT分割結構之一個實例中,CTU大小經設定為128×128 (明度樣本及兩個對應64×64色度樣本),MinQTSize經設定為16×16,MaxBTSize經設定為64×64,MinBTSize(對於寬度及高度兩者)經設定為4,且MaxBTDepth經設定為4。四分樹分割首先應用於CTU以產生四分樹葉節點。四分樹葉節點可具有自16×16 (亦即,MinQTSize)至128×128 (亦即,CTU大小)之大小。若葉四分樹節點為128×128,則其將不會由二元樹進一步分裂,此係由於大小超過MaxBTSize (亦即,在此實例中64×64)。否則,葉四分樹節點將由二元樹進一步分割。因此,四分樹葉節點亦為二元樹之根節點並具有為0之二元樹深度。當二元樹深度達到MaxBTDepth (在此實例中為4)時,不准許進一步分裂。當二元樹節點具有等於MinBTSize (在此實例中為4)之寬度時,其意指不准許進一步水平分裂。類似地,具有等於MinBTSize之高度的二元樹節點意指不准許對該二元樹節點進行進一步豎直分裂。如上文所提及,二元樹之葉節點被稱作CU,且根據預測及變換來進一步處理而不進一步分割。
視訊編碼器20可將一或多個轉換應用於TU之轉換區塊以產生TU之係數區塊。係數區塊可為變換係數之二維陣列。變換係數可為純量。在一些實例中,一或多個變換將變換區塊自像素域轉換至頻域。因此,在此類實例中,變換係數可為視為在頻域中的純量。變換係數層級為表示在按比例調整變換係數值之運算之前與解碼程序中之特定2維頻率索引相關聯之值的整數量。
在一些實例中,視訊編碼器20將變換之應用跳至變換區塊。在此類實例中,視訊編碼器20可以與變換係數相同之方式處理殘餘樣本值。因此,在視訊編碼器20跳過變換之應用的實例中,變換係數及係數區塊之以下論述可適用於殘餘樣本之變換區塊。
產生係數區塊之後,視訊編碼器20可量化係數區塊以可能地減小用以表示係數區塊之資料的量,潛在地提供進一步壓縮。量化通常係指其中值之範圍壓縮為單個值的過程。舉例而言,可藉由以常數除以值且接著捨入至最接近的整數來進行量化。為量化係數區塊,視訊編碼器20可量化係數區塊之變換係數。在一些實例中,視訊編碼器20跳過量化。
視訊編碼器20可產生指示一些或所有潛在地經量化的變換係數的語法元素。視訊編碼器20可熵編碼指示經量化變換係數之語法元素中的一或多者。舉例而言,視訊編碼器20可對指示經量化變換係數之語法元素執行上下文自適應二進位算術寫碼(CABAC)。因此,經編碼區塊(例如,經編碼CU)可包括指示經量化變換係數之經熵編碼語法元素。
視訊編碼器20可輸出包括經編碼視訊資料之位元串流。換言之,視訊編碼器20可輸出包括視訊資料之經編碼表示的位元串流。視訊資料之經編碼表示可包括視訊資料之圖像的經編碼表示。舉例而言,位元串流可包含形成視訊資料及相關聯資料之經編碼圖像之表示的位元之序列。在一些實例中,經編碼圖像之表示可包括圖像之區塊的經編碼表示。
視訊解碼器30可接收由視訊編碼器20產生之位元串流。如上文所提及,位元串流可包含視訊資料之經編碼表示。視訊解碼器30可解碼位元串流以重建構視訊資料之圖像。作為解碼位元串流之部分,視訊解碼器30可自位元串流獲得語法元素。視訊解碼器30可至少部分地基於獲自位元串流之語法元素來重建構視訊資料之圖像。重建構視訊資料之圖像的處理程序可大體上互逆於由視訊編碼器20執行以編碼圖像之處理程序。
舉例而言,作為解碼視訊資料之圖像的部分,視訊解碼器30可使用框間預測或框內預測以產生預測性區塊。另外,視訊解碼器30可基於自位元串流獲得的語法元素判定變換係數。在一些實例中,視訊解碼器30逆量化經判定變換係數。此外,視訊解碼器30可將逆變換應用於經判定變換係數以判定殘餘樣本之值。視訊解碼器30可基於殘餘樣本及所產生之預測性區塊之對應樣本來重建構圖像的區塊。舉例而言,視訊解碼器30可將殘餘樣本添加至所產生之預測性區塊的對應樣本以判定區塊之經重建構樣本。
更特定言之,在HEVC及其他視訊寫碼規範中,視訊解碼器30可使用框間預測或框內預測以產生當前CU之每一PU的一或多個預測性區塊。另外,視訊解碼器30可逆量化當前CU之TU之係數區塊。視訊解碼器30可對係數區塊執行逆變換以重建構當前CU之TU的變換區塊。視訊解碼器30可基於當前CU之PU之預測性區塊的樣本及當前CU之TU之變換區塊的殘餘樣本重建構當前CU之寫碼區塊。在一些實例中,視訊解碼器30可藉由將當前CU之PU的預測性區塊之樣本添加至當前CU之TU的變換區塊之對應經解碼樣本重建構當前CU之寫碼區塊。藉由重建構圖像之每一CU的寫碼區塊,視訊解碼器30可重建構圖像。
圖像之圖塊可包括圖像之整數數目個區塊。舉例而言,在HEVC及其他視訊寫碼規範中,圖像之圖塊可包括圖像之整數數目個CTU。圖塊之CTU可按掃描次序(諸如光柵掃描次序)連續定序。在HEVC中,圖塊經定義為含於同一存取單元內的一個獨立圖塊分段及先於下一獨立圖塊分段(若存在)之所有後續相依圖塊分段(若存在)中的整數數目個CTU。此外,在HEVC中,圖塊分段經定義為在影像塊掃描中經連續定序且含於單一NAL單元中的整數數目個CTU。影像塊掃描為分割圖像之CTB的特定順序定序,其中CTB在圖像塊中在CTB光柵掃描中經連續定序,而圖像中之影像塊係在圖像之影像塊的光柵掃描中經連續定序。影像塊為圖像中之特定影像塊行及特定影像塊列內的CTB之矩形區。
在視訊寫碼之領域中,通常應用濾波以便增強經解碼視訊信號之品質。濾波亦可應用於視訊編碼器20及視訊解碼器30之重建構迴路中。濾波器可應用為後置濾波器,其中經濾波圖框並非用於未來圖框之預測,或濾波器可應用為迴路內濾波器,其中經濾波圖框可用於預測未來圖框。濾波器可藉由例如最小化原始信號與經解碼經濾波信號之間的誤差進行設計。類似於變換係數,視訊編碼器20可藉由以下量化寫碼濾波器之係數h
(k
,l
),k = -K,…, K, l = -K,… K
:
f (k,l )=round (normFactor ·h (k,l ))
視訊編碼器20可將經寫碼經量化係數發送至視訊解碼器30。normFactor 可等於2 n 。normFactor 之值越大,量化越精密,且經量化濾波器係數f (k,l )提供更佳效能。然而,normFactor produce 係數f (k,l )之較大值要求傳輸更多位元。
f (k,l )=round (normFactor ·h (k,l ))
視訊編碼器20可將經寫碼經量化係數發送至視訊解碼器30。normFactor 可等於2 n 。normFactor 之值越大,量化越精密,且經量化濾波器係數f (k,l )提供更佳效能。然而,normFactor produce 係數f (k,l )之較大值要求傳輸更多位元。
在視訊解碼器30中,經解碼濾波器係數f
(k,l
)如下應用於經重建構影像R
(i,j
):
其中i 及j 為圖框內的像素之座標。
其中i 及j 為圖框內的像素之座標。
迴路內自適應迴路濾波器(ALF)在HEVC開發階段期間經評估,但ALF不包括於HEVC標準之最終版本中。
JEM中採用之一個實例迴路內ALF描述於J.Chen等人在2015年1月的「Coding tools investigation for next generation video coding」,SG16-Geneva-C806中。基本想法與HM-3中之具有基於區塊之適應的ALF相同。(參見T.Wiegand等人在2011年3月16日至23日的第5次會議:日內瓦,CH的ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合合作小組(JCT-VC),JCTVC-E603,「WD3:Working Draft 3 of High-Efficiency Video Coding」。)
對於明度分量,視訊編碼器20及視訊解碼器30可基於1D拉普拉斯(Laplacian)方向(至多3個方向)及2D拉普拉斯活動(至多5個活動值)對圖像中之4×4區塊進行分類。方向Dirb
及未經量化活動Actb
的計算展示於方程式(2)至(5)中,其中指示具有4×4區塊之左上方之相對座標(i,j
)的經重建構像素。Actb
進一步經量化至0至4範圍(包括端值)內,如T.Wiegand等人在2011年3月16日至23日的第5次會議:日內瓦,CH的ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合合作小組(JCT-VC),JCTVC-E603,「WD3:Working Draft 3 of High-Efficiency Video Coding」中所描述。
總計,視訊編碼器20及視訊解碼器30可經組態以將每一區塊分類成15 (5×3)分之一群組,且索引根據區塊之Dirb
及Actb
的值分配給每一4×4區塊。藉由C表示群組索引,且分類經設定等於,其中為Actb
之經量化值。
可如下執行用以獲得活動值Actb
至活動索引的量化程序。基本上,此程序定義關於在Dirb
相同時如何將具有不同活動之區塊合併至一個種類的規則。Actb
之量化程序定義如下:
avg_var = Clip_post((NUM_ENTRY-1), (Actb *ScaleFactor)>>shift);
= ActivityToIndex[avg_var]
其中NUM_ENTRY被設定成16,ScaleFactor被設定成114,shift等於(3+內部經寫碼位元深度),ActivityToIndex[NUM_ENTRY] = {0, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4}},且函數Clip_post (a, b)返回a與b之間的較小值。
avg_var = Clip_post((NUM_ENTRY-1), (Actb *ScaleFactor)>>shift);
= ActivityToIndex[avg_var]
其中NUM_ENTRY被設定成16,ScaleFactor被設定成114,shift等於(3+內部經寫碼位元深度),ActivityToIndex[NUM_ENTRY] = {0, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4}},且函數Clip_post (a, b)返回a與b之間的較小值。
因此,可針對圖像之明度分量傳信達至15個ALF參數集。為節省傳信成本,視訊編碼器20可經組態以沿群組索引值合併群組。對於每一經合併群組,傳信ALF係數集。在JEM2.0之一個實例中,支援至多三個圓形對稱濾波器形狀(例如,如圖3中所示)。圖3展示5×5菱形濾波器支援300、7×7菱形濾波器支援302及截斷9×9菱形濾波器支援304。在一個實例中,對於圖像中之兩個色度分量,應用單一ALF係數集且始終使用5×5菱形形狀濾波器。圖3中之符號Ci(例如,C0、C1、C2等)表示濾波器係數。
在一些實例中,在視訊解碼器30處,每一像素樣本經濾波,產生如方程式(6)中所示之像素值,其中L
表示濾波器長度,fm,n
表示濾波器係數,且o
指示濾波器偏移,
其中且。在JEM2中,由BDF 表示之位元深度被設定成9,此意謂濾波器係數可能在[-256, 256]範圍內。應注意,對於一些實例,僅至多一個濾波器支援兩個色度分量。
其中且。在JEM2中,由BDF 表示之位元深度被設定成9,此意謂濾波器係數可能在[-256, 256]範圍內。應注意,對於一些實例,僅至多一個濾波器支援兩個色度分量。
現將論述濾波器係數之時間預測。視訊編碼器20及/或視訊解碼器30可經組態以儲存先前經寫碼圖像之ALF係數且可經組態以將此類係數重複使用為當前圖像之ALF係數。對於當前圖像,視訊編碼器20及/或視訊解碼器30可經組態以經選擇以使用經儲存用於參考圖像之ALF係數且旁路ALF係數傳信。在此情況下,僅將索引傳信至參考圖像中之一者,且針對當前圖像僅繼承(例如,重複使用)所指示參考圖像之所儲存ALF係數。為指示時間預測之用途,視訊編碼器20可經組態以在發送索引之前首先寫碼一個旗標。
現將論述基於幾何變換之ALF。在M. Karczewicz, L. Zhang, W.-J. Chien, X. Li,2016年2月20日至2月26日第2次會議:美國,聖地亞哥的ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之探勘組(JVET),文獻JVET-B0060,「EE2.5: Improvements on adaptive loop filter」中,及在M. Karczewicz, L. Zhang, W.-J. Chien, X. Li,2016年5月26日至6月1日第3次會議:日內瓦,CH的ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG 11之探勘組(JVET),文獻JVET-C0038,「EE2.5: Improvements on adaptive loop filter」中,提出基於幾何變換之ALF (GALF)。GALF用於JEM3.0。在GALF中,運用所考慮的對角線梯度修改分類且幾何變換可應用於濾波器係數。每一2×2區塊基於其方向性及活動之經量化值而分類成25分之一種類。在其他實例中,視訊編碼器20及/或視訊解碼器30可經組態以對4×4子區塊執行分類。以下子章節中描述細節。
此章節中論述GALF之分類。類似於實例ALF實施之設計,GALF之分類係基於每一N×N明度區塊之1D拉普拉斯方向及2D拉普拉斯活動。然而,方向及活動兩者之定義已經修改成更佳俘獲本端特性。首先,除現有ALF中使用之水平及豎直梯度以外,使用1-D拉普拉斯計算兩個對角線梯度之值。如自下方方程式(7)至(10)可見,覆蓋目標像素之6×6窗口內的所有像素之梯度的總和用作目標像素之經表示梯度。在其他實例中,視訊編碼器20及/或視訊解碼器30可經組態以使用覆蓋目標像素之8×8窗口。根據實驗,視窗大小,亦即6×6,提供複雜度與寫碼性能之間的良好折衷。每一像素與四個梯度值相關聯,其中豎直梯度由gv
表示,水平梯度由gh
表示,135度對角線梯度由gd1表示且45度對角線梯度由gd2
表示。
表1.方向之值及其實體意義
為分配方向性D
,水平及豎直梯度之最大值及最小值之比率(在(10)中由Rh,v
表示)及兩個對角線梯度之最大值及最小值的比率(在(11)中由Rd1,d2
表示)與兩個臨限值t1
及t2
彼此進行比較。
藉由比較水平/豎直及對角線梯度之所偵測到之比率,五個方向模式,亦即在[0, 4]範圍(包括端值)內之D
,定義於(12)及(13)中。D
之值及其實體意義描述於表I中。
活動值計算為:
Act
經進一步量化至0至4之範圍(包括端值),且經量化值表示為:
自活動值
A
至活動指數索引
之量化程序
定義如下量化程序:
avg_var = Clip_post( NUM_ENTRY-1, (Act * ScaleFactor) >> shift);
= ActivityToIndex[avg_var]
其中NUM_ENTRY被設定成16,ScaleFactor被設定成24,shift等於(3+內部經寫碼位元深度),ActivityToIndex[NUM_ENTRY] = {0, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4},且函數Clip_post (a, b)返回a與b之間的較小值。
avg_var = Clip_post( NUM_ENTRY-1, (Act * ScaleFactor) >> shift);
= ActivityToIndex[avg_var]
其中NUM_ENTRY被設定成16,ScaleFactor被設定成24,shift等於(3+內部經寫碼位元深度),ActivityToIndex[NUM_ENTRY] = {0, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4},且函數Clip_post (a, b)返回a與b之間的較小值。
請注意,歸因於計算活動值之不同方式,ScaleFactor及ActivityToIndex兩者皆相較於JEM2.0中之ALF設計經修改。
因此,在所提出之GALF方案中,每一N×N區塊基於其方向性D
及活動之量化值分類成25分之一種類:
圖4中描繪根據D及活動之量化值之種類索引的實例。應注意,針對自變數Act
導出的每一行,之值被設定成0……4。針對之新值的最小Act
沿頂線標記(例如,0、8192、16384、57344、122880)。舉例而言,具有在[16384, 57344-1]內之值的Act
將屬於等於2之。
現將論述幾何變換。對於每一類別,可傳信一個濾波器係數集。為更佳區分以同一類別索引標記之區塊的不同方向,引入四種幾何變換,包括無變換、對角、豎直翻轉及旋轉。圖5為說明5×5菱形濾波器支援500之概念圖。圖6中描繪具有三種幾何變換之5×5濾波器支援的實例。圖6展示對角5×5菱形濾波器支援600、豎直翻轉5×5菱形濾波器支援602,及旋轉5×5菱形濾波器支援604。圖5及圖6中之符號Ci (例如,C0、C1、C2等)表示濾波器係數。比較圖5及圖6,三種額外幾何變換之公式形式為:
其中K
為濾波器之大小,0≤k
,l
≤K
-1為係數座標,使得部位(0,0)在左上角處且部位(K
-1,K
-1)在右下角處。
應注意,當使用菱形濾波器支援時,諸如在ALF之現有實例中,具有在濾波器支援之外之座標的係數將始終設定成0。一種用於指示幾何變換索引之技術為隱式地導出幾何變換索引以避免額外負擔。在GALF中,變換取決於針對區塊計算之梯度值應用於濾波器係數f
(k
,l
)。表2中描述變換與使用(6)至(9)計算之四個梯度之間的關係。總之,變換係基於兩個梯度(水平及豎直,或45度及135度梯度)中之較大者。基於該比較,可提取更精確方向資訊。因此,雖然濾波器係數之負擔並未增加,但可歸因於變換獲得不同濾波結果。
表2.梯度及變換之映射
類似於HM3中之ALF,GALF亦採用5×5及7×7菱形濾波器支援。另外,9×7濾波器支援(圖3的截斷9×9菱形)由9×9菱形濾波器支援替換。圖7說明用於GALF之實例9×9菱形濾波器支援700。在VVC之一些實例中,使用7×7濾波器支援而非9×9菱形濾波器支援。本發明之技術適用於任何大小之濾波器支援。
現將論述自固定濾波器之預測。當時間預測不可用(例如,對於框內圖框)時為改良寫碼效率,可將一組固定濾波器(例如,16個固定濾波器)分配給每一種類。為指示固定濾波器之用途,傳信用於每一種類之旗標。在一些實例中,亦可傳信所選取固定濾波器之索引。即使當固定濾波器經選擇用於給定種類時,自適應濾波器f
(k
,l
)之係數仍可經發送用於此種類,在此情況下將應用於經重構影像之濾波器的係數為係數之兩個集合的總和。多個種類可共用在位元串流中發信之相同係數f
(k
,l
),即使不同固定濾波器經選擇用於其。2017年2月14日申請之美國專利申請案第15/432,839號(2017年8月17日發佈之美國公開案第2017/0238020號)描述固定濾波器亦可能應用於經框間寫碼圖框。
現將論述濾波器係數之傳信,包括來自固定濾波器之預測圖案及預測索引。三種情況經限定:情況1:是否該等種類(例如,25個種類)之濾波器中無一者係自固定濾波器預測;情況2:該等種類之所有濾波器係自固定濾波器預測;及情況3;與一些種類相關聯的濾波器係自固定濾波器預測且與剩餘種類相關聯的濾波器並非自固定濾波器預測。
視訊編碼器20可首先寫碼索引以指示三種情況中之一種。另外,以下適用:
- 若為情況1,則不需要進一步傳信固定濾波器之索引。
- 否則,若為情況2,則傳信用於每一種類之經選擇固定濾波器的索引。
- 另外(若為情況3),首先傳信用於每一種類之一個位元,且若使用固定濾波器,則進一步傳信索引。
- 若為情況1,則不需要進一步傳信固定濾波器之索引。
- 否則,若為情況2,則傳信用於每一種類之經選擇固定濾波器的索引。
- 另外(若為情況3),首先傳信用於每一種類之一個位元,且若使用固定濾波器,則進一步傳信索引。
跳過
DC
濾波器係數
由於所有濾波器係數之總和必須等於2K
(其中K表示濾波器係數之位元深度),應用於當前像素(濾波器支援內之中心像素,諸如圖5中之C6
)的DC濾波器係數可經導出而無需傳信。
濾波器索引
為減少表示濾波器係數所需的位元之數目,可合併不同類別。然而,與在T. Wiegand, B. Bross, W.-J. Han, J.-R. Ohm及G. J. Sullivan,2011年3月16日至23日的第5次會議:日內瓦,CH的ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合合作小組(JCT-VC),JCTVC-E603,「WD3:Working Draft 3 of High-Efficiency Video Coding」中不同,可合併任何種類集合,即使種類具有如(15)中所定義之表示種類索引的C之非連續值。藉由對於25個種類中之每一者對索引iC
進行發送提供指示合併哪些類別之資訊。具有相同索引iC
之種類共用經寫碼之相同濾波器係數。藉由截斷二進位二值化方法寫碼索引iC
。以與JEM2.0中相同之方式寫碼其他資訊,諸如係數。
現有ALF/GALF設計展現若干缺陷。舉例而言,一些現有ALF設計使用線緩衝器記憶體之額外八條線,如圖8中之灰色樣本800所描繪。對於位於圖8中之LCU的頂線處的樣本(如由X標記之左上方樣本),相鄰LCU之樣本的上方四條線用於9×9菱形濾波器支援。類似地,對於位於圖8中之LCU之底線處的濾波樣本(如由X標記之左下方樣本),相鄰LCU之樣本的下方四條線用於9×9菱形濾波器支援。視訊編碼器20及視訊解碼器30可組態有八個線緩衝器以儲存相鄰LCU之樣本的此等八條線。其他類型的濾波器(諸如解區塊濾波器及樣本自適應偏移(SAO))可使用相鄰樣本之較少線,且因此較少及/或較小線緩衝器。一些實例解區塊濾波器使用線緩衝器記憶體之四條線,而一些SAO濾波器僅使用線緩衝器記憶體之一條線。相較於解區塊濾波器及SAO濾波器,ALF使用更多線緩衝器,其增加成本且增大晶片大小。
鑒於此等缺陷,本發明描述用於藉由減少數目個線緩衝器執行ALF之以下技術。視訊編碼器20及視訊解碼器30兩者可經組態以執行下文所描述的技術。可個別地應用以下詳細列舉之技術。替代地,可一起應用本文中所描述之技術的任何組合。
在本發明之一個實例中,對於位於區塊之特定位置(例如,最大寫碼單元,LCU)處的樣本,視訊編碼器20及視訊解碼器30可經組態以停用GALF/ALF (亦即,GALF及/或ALF)而無需任何傳信。舉例而言,視訊解碼器30可經組態以針對區塊之特定樣本基於該等樣本在區塊上之位置而非基於指示ALF/GALF是否停用之任何經傳信語法元素而停用GALF/ALF。以此方式,可能需要較小線緩衝器(或無線緩衝器),此係因為來自相鄰區塊之樣本將由於ALF/GALF停用而不被需要。
在一個實例中,對於位於一個LCU內之前N (非零變數)列處的樣本,視訊編碼器20及視訊解碼器30可經組態以停用ALF/GALF。舉例而言,視訊編碼器20及視訊解碼器30可經組態以將位於前N列內之樣本標記為「不適用」於ALF/GALF。
在另一實例中,對於位於一個LCU內之最後M (非零變數)列處的樣本,視訊編碼器20及視訊解碼器30可經組態以停用ALF/GALF。舉例而言,視訊編碼器20及視訊解碼器30可經組態以將位於最後M列內之樣本標記為「不適用」於ALF/GALF。
在一個實例中,變數N或/及M可經預定義(例如,儲存於視訊編碼器20及視訊解碼器30兩者處)。在另一實例中,視訊編碼器20可經組態以在供由視訊解碼器30使用之經編碼視訊位元串流中傳信指示N及/或M之值的語法元素。
在其他實例中,變數N或/及M對於不同序列/圖像/圖塊可不同。亦即,變數N及M對於所有序列/圖像/圖塊不必相同。
在另一實例中,變數N或/及M可取決於所允許之濾波器支援。舉例而言,若視訊編碼器20及/或視訊解碼器30判定將5×5菱形濾波器支援用於一個圖塊,則視訊編碼器20及/或視訊解碼器30可將變數N及M設定成0。類似地,若視訊編碼器20及/或視訊解碼器30判定將9×9菱形濾波器支援用於一個圖塊,則視訊編碼器20及/或視訊解碼器30可將變數N及M設定成2。
在另一實例中,對於具有標記為「不適用」之所有樣本(或大部分樣本)的區塊,視訊編碼器20及/或視訊解碼器30可經組態以跳過GALF/ALF開/關旗標之傳信。替代地,視訊編碼器20及/或視訊解碼器30可經組態以將GALF/ALF開/關旗標推斷為假(亦即,ALF/GALF斷開)。
在本發明之另一實例中,因此使用一或多個線緩衝器而非存取LCU列外部之樣本,視訊編碼器20及/或視訊解碼器30可經組態以將填補樣本用於濾波程序。與來自儲存於線緩衝器中之相鄰區塊的樣本相反,填補樣本為由視訊編碼器20及/或視訊解碼器30產生之樣本。以此方式,線緩衝器的量可減少,因此降低硬體實施之複雜度及成本。
在一個實例中,視訊編碼器20及/或視訊解碼器30可經組態以自一或多個參考圖像中之區塊產生填補樣本。實例給定於圖9中。對於待濾波之當前樣本900 (位於圖框N-1內之一個LCU 902的頂部列處),相鄰樣本(由A至C、1至9標記)可自不同參考圖像904(圖框N-2)中之運動補償區塊填補。亦即,來自圖像904之樣本A至C及1至9可經複製且用作用於對當前LCU 902之當前樣本900進行濾波的樣本。
在另一實例中,視訊編碼器20及/或視訊解碼器30可經組態以自一或多個參考圖像中之區塊複製填補樣本。當填補樣本係來自多個參考圖像時,視訊編碼器20及/或視訊解碼器30可經組態以將線性函數應用於來自相同位置之多個樣本,以產生一個填補樣本。在某一實例中,區塊可藉由與覆蓋待濾波之樣本的當前區塊相關聯或與覆蓋待填補之樣本的相鄰區塊相關聯的運動向量識別。在一些實例中,運動向量可捨入至整數位置。在其他實例中,運動向量可設定成零運動向量。
在另一實例中,視訊編碼器20及/或視訊解碼器30可經組態以藉由映射函數填補樣本,而非藉由自區塊之第一列或行複製現有樣本來產生填補樣本。在一些實例中,所使用之映射函數可取決於用於GALF/ALF的濾波器支援。在一些實例中,映射函數可包括但不限於交換及/或翻轉及/或旋轉函數。交換函數、翻轉函數及旋轉函數可為任何函數,經加權或以其他方式)其中LCU邊界內之樣本映射至LCU邊界外部之部位。圖10A為說明針對ALF藉由映射來填補之實例使用的概念圖。在圖10A中,由符號Si指示之樣本經填補(例如,重複使用)為用於LCU上部邊界外部之樣本的濾波器支援。在LCU上部邊界外部之具有與LCU邊界內部之樣本相同的Si標識(例如,S0
)之樣本經複製為濾波器支援。圖10A展示對角填補之實例。舉例而言,LCU上部邊界內之樣本可圍繞對角軸線翻轉至LCU上部邊界外部之部位。圖10B為說明針對ALF藉由映射來填補之另一實例使用的概念圖。舉例而言,LCU上部邊界內之樣本可圍繞水平軸翻轉至LCU上部邊界外部之部位。
在另一實例中,可迫使用於GALF/ALF之與LCU列外部之樣本相關聯的濾波器係數為0。在另一實例中,多個濾波器支援可在一個圖塊內應用。在一個實例中,僅傳信部分數目的濾波器支援(例如,係數),且剩餘數目的濾波器支援可自經傳信支援導出。舉例而言,9×9菱形濾波器支援可藉由索引傳信。對於要求額外線緩衝器之樣本,濾波器支援可經修改成例如圖11中所示的濾波器支援1100。
啟用還是停用以上方法可在序列參數集(SPS)、圖片參數集(PPS)、視圖參數集及/或圖塊標頭中傳信。
圖12為說明可實施本發明之技術的視訊編碼器20之實例的方塊圖。出於解釋之目的提供圖12,且不應將該圖視為對如本發明中廣泛例示及描述之技術的限制。本發明之技術可適用於各種寫碼標準或方法。
處理電路包括視訊編碼器20,且視訊編碼器20經組態以執行本發明中所描述之實例技術中之一或多者。舉例而言,視訊編碼器20包括積體電路,且圖12中說明之各種單元可形成為與電路匯流排互連之硬體電路區塊。此等硬體電路區塊可為單獨電路區塊或該等單元中之兩者或更多者可組合為共用硬體電路區塊。硬體電路區塊可形成為電路組件之組合,該等電路組件形成諸如算術邏輯單元(ALU)、基礎功能單元(EFU)之操作區塊,以及諸如AND、OR、NAND、NOR、XOR、XNOR及其他類似邏輯區塊的邏輯區塊。
在一些實例中,圖12中所說明之單元中之一或多者可為在處理電路上執行的軟體單元。在此類實例中,用於此等軟體單元之目的碼儲存於記憶體中。作業系統可使得視訊編碼器20擷取目的碼並執行目的碼,其使得視訊編碼器20執行實施實例技術之操作。在一些實例中,軟體單元可為視訊編碼器20在啟動處執行之韌體。因此,視訊編碼器20為具有執行實例技術之硬體或具有在硬體上執行以特化執行該等實例技術之硬體的軟體及/或韌體的結構性組件。
在圖12的實例中,視訊編碼器20包括預測處理單元100、視訊資料記憶體101、殘餘產生單元102、變換處理單元104、量化單元106、逆量化單元108、逆變換處理單元110、重建構單元112、濾波器單元114、經解碼圖像緩衝器116及熵編碼單元118。預測處理單元100包括框間預測處理單元120及框內預測處理單元126。框間預測處理單元120可包括運動估計單元及運動補償單元(未示出)。
視訊資料記憶體101可經組態以儲存待由視訊編碼器20之組件編碼之視訊資料。可例如自視訊源18獲得儲存於視訊資料記憶體101中之視訊資料。經解碼圖像緩衝器116可為儲存供由視訊編碼器20用於例如以框內或框間寫碼模式編碼視訊資料或供輸出之參考視訊資料的參考圖像記憶體。視訊資料記憶體101及經解碼圖像緩衝器116可由多種記憶體器件中之任一者形成,諸如動態隨機存取記憶體(DRAM),包括同步DRAM (SDRAM)、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體器件。可由同一記憶體器件或單獨記憶體器件提供視訊資料記憶體101及經解碼圖像緩衝器116。在各種實例中,視訊資料記憶體101可與視訊編碼器20之其他組件一起在晶片上,或相對於彼等組件而言在晶片外。視訊資料記憶體101可與圖1之儲存媒體19相同,為該儲存媒體之部分,或與該儲存媒體分離。
視訊編碼器20接收視訊資料。視訊編碼器20可編碼視訊資料之圖像之圖塊中的每一CTU。CTU中之每一者可與相等大小之明度寫碼樹型區塊(CTB)及圖像之對應CTB相關聯。作為編碼CTU之部分,預測處理單元100可執行分割以將CTU之CTB分割成逐漸較小的區塊。較小區塊可為CU之寫碼區塊。舉例而言,預測處理單元100可根據樹狀結構分割與CTU相關聯的CTB。
視訊編碼器20可編碼CTU之CU以產生CU之經編碼表示(亦即,經寫碼CU)。作為編碼CU之部分,預測處理單元100可在CU之一或多個PU當中分割與CU相關聯之寫碼區塊。因此,每一PU可與明度預測區塊及對應的色度預測區塊相關聯。視訊編碼器20及視訊解碼器30可支援具有各種大小之PU。如上文所指示,CU之大小可指CU之明度寫碼區塊的大小,且PU之大小可指PU之明度預測區塊的大小。假定特定CU之大小為2N×2N,則視訊編碼器20及視訊解碼器30可支援用於框內預測之2N×2N或N×N之PU大小,及用於框間預測的2N×2N、2N×N、N×2N、N×N或類似之對稱PU大小。視訊編碼器20及視訊解碼器30亦可支援用於框間預測的2N×nU、2N×nD、nL×2N及nR×2N之PU大小的非對稱分割。
框間預測處理單元120可產生用於PU之預測性資料。作為產生用於PU之預測性資料之部分,框間預測處理單元120對PU執行框間預測。用於PU之預測性資料可包括PU之預測性區塊及用於PU之運動資訊。取決於PU係在I圖塊中、P圖塊中抑或B圖塊中,框間預測處理單元120可針對CU之PU執行不同操作。在I圖塊,所有PU經框內預測。因此,若PU在I圖塊中,則框間預測處理單元120不對PU執行框間預測。因此,對於I模式中編碼的區塊,經預測區塊係使用空間預測自同一圖框內的先前經編碼之相鄰區塊形成。若PU在P圖塊中,則框間預測處理單元120可使用單向框間預測以產生PU之預測性區塊。若PU在B圖塊中,則框間預測處理單元120可使用單向或雙向框間預測以產生PU之預測性區塊。
框內預測處理單元126可藉由對PU執行框內預測而產生用於PU之預測性資料。用於PU之預測性資料可包括PU之預測性區塊及各種語法元素。框內預測處理單元126可對I圖塊、P圖塊及B圖塊中之PU執行框內預測。
為對PU執行框內預測,框內預測處理單元126可使用多個框內預測模式以產生PU之預測性資料的多個集合。框內預測處理單元126可使用來自相鄰PU之樣本區塊的樣本以產生用於PU之預測性區塊。對於PU、CU及CTU,假定自左至右自上而下之編碼次序,則相鄰PU可在PU上方、右上方、左上方或左方。框內預測處理單元126可使用各種數目之框內預測模式,例如,33個方向性框內預測模式。在一些實例中,框內預測模式之數目可取決於與PU相關聯之區域的大小。
預測處理單元100可自藉由框間預測處理單元120針對PU產生之預測性資料或藉由框內預測處理單元126針對PU產生之預測性資料中選擇用於CU之PU的預測性資料。在一些實例中,預測處理單元100基於數組預測性資料之速率/失真量度而選擇用於CU之PU的預測性資料。所選擇預測性資料之預測性樣本區塊在本文中可被稱作所選擇之預測性樣本區塊。
殘餘產生單元102可基於CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)及CU之PU的所選預測性區塊(例如,預測性明度、Cb及Cr區塊)產生CU之殘餘區塊(例如,明度、Cb及Cr殘餘區塊)。舉例而言,殘餘產生單元102可產生CU之殘餘區塊,以使得殘餘區塊中之每一樣本具有等於CU之寫碼區塊中的樣本與CU之PU之對應所選擇預測性區塊中的對應樣本之間的差的值。
變換處理單元104可執行將CU之殘餘區塊分割成CU之TU的變換區塊。舉例而言,變換處理單元104可執行四分樹分割以將CU之殘餘區塊分割成CU之TU的變換區塊。因此,TU可與一明度變換區塊及兩個色度變換區塊相關聯。CU之TU的明度及色度變換區塊的大小及位置可基於或可能不基於CU之PU的預測區塊之大小及位置。被稱為「殘餘四分樹」(RQT)之四分樹結構可包括與區域中之每一者相關聯的節點。CU之TU可對應於RQT之葉節點。
變換處理單元104可藉由將一或多個變換應用於TU之變換區塊而產生CU之每一TU的變換係數區塊。變換處理單元104可將各種變換應用於與TU相關聯的變換區塊。舉例而言,變換處理單元104可將離散餘弦變換(DCT)、定向變換或概念上類似之變換應用於變換區塊。在一些實例中,變換處理單元104並不將變換應用於變換區塊。在此類實例中,變換區塊可視為變換係數區塊。
量化單元106可量化係數區塊中之變換係數。量化處理程序可減少與變換係數中之一些或全部相關聯的位元深度。舉例而言,在量化期間,可將n
位元變換係數捨入至m
位元變換係數,其中n
大於m
。量化單元106可基於與CU相關聯之量化參數(QP)值來量化與CU之TU相關聯的係數區塊。視訊編碼器20可藉由調整與CU相關聯之QP值來調整應用於與CU相關聯之係數區塊的量化程度。量化可引入資訊的損失。因此,經量化變換係數可具有比最初變換係數低的精度。
逆量化單元108及逆變換處理單元110可分別將逆量化及逆變換應用於係數區塊,以自係數區塊重構殘餘區塊。重建構單元112可將經重建構之殘餘區塊添加至來自藉由預測處理單元100產生之一或多個預測性區塊的對應樣本,以產生與TU相關聯之經重建構變換區塊。藉由以此方式重建構用於CU之每一TU的變換區塊,視訊編碼器20可重建構CU之寫碼區塊。
濾波器單元114可對與CU相關聯之寫碼區塊執行一或多個SAO、GALF、ALF及/或解區塊操作。濾波器單元114可包括用以儲存相鄰樣本以便執行ALF及/或GAL濾波操作之一或多個線緩衝器。濾波器單元114可執行上文所描述的本發明之ALF及GALF技術。經解碼圖像緩衝器116可在濾波器單元114對經重建構寫碼區塊執行一或多個濾波操作之後儲存經重建構寫碼區塊。框間預測處理單元120可使用含有經重建構寫碼區塊之參考圖像以對其他圖像之PU執行框間預測。另外,框內預測處理單元126可使用經解碼圖像緩衝器116中之經重建構之寫碼區塊以對處於與CU相同之圖像中的其他PU執行框內預測。在一些實例中,視訊編碼器20可經組態以不藉由濾波器單元114處理由框內預測處理單元126使用之樣本。亦即,在一些實例中,框內預測處理單元126並不使用已使用GALF或ALF濾波的樣本值。
熵編碼單元118可自視訊編碼器20之其他功能組件接收資料。舉例而言,熵編碼單元118可自量化單元106接收係數區塊且可自預測處理單元100接收語法元素。熵編碼單元118可對資料執行一或多個熵編碼操作,以產生經熵編碼資料。舉例而言,熵編碼單元118可對資料執行CABAC操作、上下文自適應可變長度寫碼(CAVLC)操作、可變至可變(V2V)長度寫碼操作、基於語法之上下文自適應二進位算術寫碼(SBAC)操作、概率區間分割熵(PIPE)寫碼操作、指數哥倫布編碼操作或另一類型之熵編碼操作。視訊編碼器20可輸出包括由熵編碼單元118產生之經熵編碼資料的位元串流。舉例而言,位元串流可包括表示用於CU之變換係數之值的資料。
圖13為說明經組態以實施本發明之技術的實例視訊解碼器30之方塊圖。出於解釋之目的而提供圖13,且其並不限制如本發明中所廣泛例示及描述之技術。
處理電路包括視訊解碼器30,且視訊解碼器30經組態以執行本發明中所描述之實例技術中之一或多者。舉例而言,視訊解碼器30包括積體電路,且圖13中說明之各種單元可形成為與電路匯流排互連之硬體電路區塊。此等硬體電路區塊可為單獨電路區塊或該等單元中之兩者或更多者可組合為共用硬體電路區塊。硬體電路區塊可形成為電路組件之組合,該等電路組件形成諸如算術邏輯單元(ALU)、基礎功能單元(EFU)之操作區塊,以及諸如AND、OR、NAND、NOR、XOR、XNOR及其他類似邏輯區塊的邏輯區塊。
在一些實例中,圖13中所說明之單元中之一或多者可為在處理電路上執行之軟體單元。在此類實例中,用於此等軟體單元之目的碼儲存於記憶體中。作業系統可使得視訊解碼器30擷取目的碼並執行目的碼,其使得視訊解碼器30執行實施實例技術之操作。在一些實例中,軟體單元可為視訊解碼器30在啟動處執行之韌體。因此,視訊解碼器30為具有執行實例技術之硬體或具有在硬體上執行以特化執行該等實例技術之硬體的軟體及/或韌體的結構性組件。
在圖13之實例中,視訊解碼器30包括熵解碼單元150、視訊資料記憶體151、預測處理單元152、逆量化單元154、逆變換處理單元156、重建構單元158、濾波器單元160,及經解碼圖像緩衝器162。預測處理單元152包括運動補償單元164及框內預測處理單元166。在其他實例中,視訊解碼器30可包括更多、更少或不同功能組件。
視訊資料記憶體151可儲存待由視訊解碼器30之組件解碼之經編碼視訊資料(諸如,經編碼視訊位元串流)。視訊資料記憶體151中儲存之視訊資料可經由視訊資料之有線或無線網路通信或藉由存取實體資料儲存媒體例如自電腦可讀媒體16,例如,自本端視訊源(諸如攝影機)獲得。視訊資料記憶體151可形成儲存來自經編碼視訊位元串流之經編碼視訊資料的經寫碼圖像緩衝器(CPB)。經解碼圖像緩衝器162可為儲存供由視訊解碼器30用於例如以框內或框間寫碼模式解碼視訊資料或供輸出之參考視訊資料的參考圖像記憶體。視訊資料記憶體151及經解碼圖像緩衝器162可由多種記憶體器件中之任一者形成,諸如動態隨機存取記憶體(DRAM),包括同步DRAM (SDRAM)、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體器件。可藉由同一記憶體器件或單獨記憶體器件提供視訊資料記憶體151及經解碼圖像緩衝器162。在各種實例中,視訊資料記憶體151可與視訊解碼器30之其他組件一起在晶片上,或相對於彼等組件在晶片外。視訊資料記憶體151可與圖1之儲存媒體28相同或係該儲存媒體之部分。
視訊資料記憶體151接收並儲存位元串流之經編碼視訊資料(例如,NAL單元)。熵解碼單元150可自視訊資料記憶體151接收經編碼視訊資料(例如,NAL單元),且可剖析NAL單元以獲得語法元素。熵解碼單元150可熵解碼該等NAL單元中之經熵編碼之語法元素。預測處理單元152、逆量化單元154、逆變換處理單元156、重建構單元158及濾波器單元160可基於自位元串流提取之語法元素產生經解碼視訊資料。熵解碼單元150可執行大體上互逆於熵編碼單元118之彼程序的程序。
除自位元串流獲得語法元素之外,視訊解碼器30可對未經分割之CU執行重建構操作。為對CU執行重建構操作,視訊解碼器30可對CU之每一TU執行重建構操作。藉由對CU之每一TU執行重建構操作,視訊解碼器30可重建構CU之殘餘區塊。
作為對CU之TU執行重建構操作之部分,逆量化單元154可逆量化(亦即,解量化)與TU相關聯之係數區塊。在逆量化單元154對係數區塊進行逆量化之後,逆變換處理單元156可將一或多個逆變換應用於係數區塊以便產生與TU相關聯之殘餘區塊。舉例而言,逆變換處理單元156可將逆DCT、逆整數變換、逆Karhunen-Loeve變換(KLT)、逆旋轉變換、逆定向變換或另一逆變換應用於係數區塊。
逆量化單元154可執行本揭示之特定技術。舉例而言,對於視訊資料之圖像的CTU之CTB內的複數個量化群組之至少一個各別量化群組,逆量化單元154可至少部分地基於在位元串流中傳信之本端量化資訊導出用於各別量化群組之各別量化參數。另外,在此實例中,逆量化單元154可基於用於各別量化群組之各別量化參數而逆量化CTU之CU的TU之變換區塊的至少一個變換係數。在此實例中,各別量化群組經定義為連續(在寫碼次序中) CU或寫碼區塊之群組,以使得各別量化群組之邊界必須為CU或寫碼區塊之邊界且各別量化群組之大小大於或等於臨限值。視訊解碼器30 (例如,逆變換處理單元156、重建構單元158及濾波器單元160)可基於變換區塊之經逆量化變換係數重建構CU之寫碼區塊。
若使用框內預測編碼PU,則框內預測處理單元166可執行框內預測以產生PU之預測性區塊。框內預測處理單元166可使用框內預測模式來基於空間相鄰區塊之樣本產生PU之預測性區塊。框內預測處理單元166可基於自位元串流獲得的一或多個語法元素判定用於PU之框內預測模式。
若使用框間預測編碼PU,則熵解碼單元150可判定PU之運動資訊。運動補償單元164可基於PU之運動資訊判定一或多個參考區塊。運動補償單元164可基於一或多個參考區塊產生PU之預測性區塊(例如,預測性明度、Cb及Cr區塊)。
重建構單元158可使用CU之TU的變換區塊(例如,明度、Cb及Cr變換區塊)及CU之PU的預測性區塊(例如,明度、Cb及Cr區塊) (亦即,可適用之框內預測資料或框間預測資料)來重建構CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)。舉例而言,重建構單元158可將變換區塊(例如,明度、Cb及Cr變換區塊)之樣本添加至預測性區塊(例如,明度、Cb及Cr預測性區塊)之對應樣本,以重建構CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)。
濾波器單元160可對與CU相關聯之寫碼區塊執行一或多個SAO、GALF、ALF及/或解區塊操作。濾波器單元160可包括用以儲存相鄰樣本以便執行ALF及/或GAL濾波操作之一或多個線緩衝器。濾波器單元160可執行上文所描述的本發明之ALF及GALF技術。經解碼圖像緩衝器162可在濾波器單元160對經重建構寫碼區塊執行一或多個濾波操作之後儲存經重建構寫碼區塊。經解碼圖像緩衝器162可提供參考圖像以用於隨後運動補償、框內預測及在顯示器件(諸如,圖1之顯示器件32)上之呈現。舉例而言,視訊解碼器30可基於經解碼圖像緩衝器162中之區塊對其他CU之PU執行框內預測操作或框間預測操作。在一些實例中,視訊解碼器30可經組態以不藉由濾波器單元160處理由框內預測處理單元166使用之樣本。亦即,在一些實例中,框內預測處理單元166並不使用已使用GALF或ALF濾波的樣本值。
圖14為說明本發明之實例寫碼方法的流程圖。包括濾波器單元114及濾波器單元160之視訊編碼器20及視訊解碼器30兩者可經組態以執行圖14之技術。
在本發明之一個實例中,視訊編碼器20及視訊解碼器30可經組態以寫碼視訊資料區塊以獲得視訊資料之經寫碼區塊(1400),將由濾波器支援限定之自適應迴路濾波器應用於視訊資料之經寫碼區塊的樣本,包括對濾波器支援之在區塊外部之部分使用填補樣本(1402),及在將自適應迴路濾波應用於視訊資料之經寫碼區塊之後輸出視訊資料之經寫碼區塊(1404)。
在一個實例中,視訊編碼器20及視訊解碼器30可進一步經組態以自由與視訊資料區塊相關聯之運動向量指向的參考圖像之樣本產生填補樣本。
在另一實例中,視訊編碼器20及視訊解碼器30可進一步經組態以自視訊資料之經寫碼區塊之第一列或最末列產生填補樣本。
在另一實例中,視訊編碼器20及視訊解碼器30可進一步經組態以藉由將線性函數應用於一或多個參考圖像之樣本而產生填補樣本。
在另一實例中,視訊編碼器20及視訊解碼器30可進一步經組態以使用一或多個運動向量識別一或多個參考圖像之樣本。
在另一實例中,視訊編碼器20及視訊解碼器30可進一步經組態以將一或多個運動向量捨入至整數值。
在另一實例中,視訊編碼器20及視訊解碼器30可進一步經組態以將一或多個運動向量設定成零運動向量。
在另一實例中,視訊編碼器20及視訊解碼器30可進一步經組態以使用映射函數及視訊資料之經解碼區塊的樣本產生填補樣本。映射函數可包括交換函數、翻轉函數或旋轉函數中之一或多者。
在另一實例中,視訊編碼器20及視訊解碼器30可進一步經組態以將自適應迴路濾波器之濾波器支援之在視訊資料區塊外部的部分的係數設定成零。
在另一實例中,視訊編碼器20及視訊解碼器30可進一步經組態以產生/接收指示填補樣本針對濾波器支援之在區塊外部之部分的使用的語法元素。
已出於說明之目的關於HEVC、HEVC之擴展、及開發中VVC標準描述本發明之特定態樣。然而,本發明中所描述之技術可適用於其他視訊寫碼程序,包括尚未開發之其他標準或專有視訊寫碼程序。
如本發明中所描述之視訊寫碼器可指視訊編碼器或視訊解碼器。類似地,視訊寫碼單元可指視訊編碼器或視訊解碼器。同樣地,視訊寫碼可指視訊編碼或視訊解碼(在適用時)。在本發明中,片語「基於」可指示僅僅基於、至少部分地基於,或以某一方式基於。本發明可使用術語「視訊單元」或「視訊區塊」或「區塊」來指代一或多個樣本區塊及用以寫碼樣本之一或多個區塊之樣本的語法結構。視訊單元之實例類型可包括CTU、CU、PU、變換單元(TU)、巨集區塊、巨集區塊分區,等等。在一些上下文中,PU之論述可與巨集區塊或巨集區塊分區之論述互換。視訊區塊之實例類型可包括寫碼樹型區塊、寫碼區塊及視訊資料之其他類型的區塊。
本發明之技術可應用於支援多種多媒體應用中之任一者的視訊寫碼,諸如,空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(諸如,經由HTTP之動態自適應串流(DASH))、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上的數位視訊之解碼或其他應用。
應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可以不同序列執行、可添加、合併或完全省略該等動作或事件(例如,並非所有所描述動作或事件對於該等技術之實踐係必要的)。此外,在某些實例中,可例如經由多執行緒處理、中斷處理或多個處理器同時而非依序執行動作或事件。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,該通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體大體可對應於(1)為非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可藉由一或多個電腦或一或多個處理電路存取以擷取指令、程式碼及/或資料結構以用於實施本發明中描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉助於實例而非限制,此電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器件、磁碟儲存器件或其他磁性儲存器件、快閃記憶體或可用來儲存呈指令或資料結構形式之所要程式碼且可由電腦存取的任何其他媒體。又,任何連接被適當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纜、雙絞線、數位用戶線(digital subscriber line;DSL)或無線技術(諸如紅外線、無線電及微波)自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纜、雙絞線、DSL或無線技術(諸如紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為係關於非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各者之組合亦應包括於電腦可讀媒體之範疇內。
本發明中所描述之功能可藉由固定功能及/或可程式化處理電路執行。舉例而言,指令可藉由固定功能及/或可程式化處理電路執行。此等處理電路可包括一或多個處理器,諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指上述結構或適用於實施本文中所描述之技術之任何其他結構中的任一者。此外,在一些實例中,本文所描述之功能性可提供於經組態以供編碼及解碼或併入於經組合編解碼器中之專用硬體及/或軟體模組內。又,技術可完全實施於一或多個電路或邏輯元件中。處理電路可以各種方式耦接至其他組件。舉例而言,處理電路可經由內部器件互連件、有線或無線網路連接或另一通信媒體耦接至其他組件。
本發明之技術可在廣泛多種器件或裝置中實施,包括無線手持機、積體電路(IC)或IC集合(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之器件的功能性態樣,但未必需要藉由不同硬體單元來實現。實際上,如上所述,各種單元可與合適的軟體及/或韌體一起組合在編解碼器硬體單元中或由互操作硬體單元之集合提供,硬體單元包括如上文所描述之一或多個處理器。
各種實例已予以描述。此等及其他實例在以下申請專利範圍之範疇內。
10‧‧‧系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
19‧‧‧儲存媒體
20‧‧‧視訊編碼器
22‧‧‧輸出介面
26‧‧‧輸入介面
28‧‧‧儲存媒體
30‧‧‧視訊解碼器
32‧‧‧顯示器件
100‧‧‧預測處理單元
101‧‧‧視訊資料記憶體
102‧‧‧殘餘產生單元
104‧‧‧變換處理單元
106‧‧‧量化單元
108‧‧‧逆量化單元
110‧‧‧逆變換處理單元
112‧‧‧重建構單元
114‧‧‧濾波器單元
116‧‧‧經解碼圖像緩衝器
118‧‧‧熵編碼單元
120‧‧‧框間預測處理單元
126‧‧‧框內預測處理單元
130‧‧‧四分樹二元樹結構
132‧‧‧寫碼樹型單元
150‧‧‧熵解碼單元
151‧‧‧視訊資料記憶體
152‧‧‧預測處理單元
154‧‧‧逆量化單元
156‧‧‧逆變換處理單元
158‧‧‧重建構單元
160‧‧‧濾波器單元
162‧‧‧經解碼圖像緩衝器
164‧‧‧運動補償單元
166‧‧‧框內預測處理單元
300‧‧‧5×5菱形濾波器支援
302‧‧‧7×7菱形濾波器支援
304‧‧‧截斷9×9菱形濾波器支援
500‧‧‧5×5菱形濾波器支援
600‧‧‧對角5×5菱形濾波器支援
602‧‧‧豎直翻轉5×5菱形濾波器支援
604‧‧‧旋轉5×5菱形濾波器支援
700‧‧‧9×9菱形濾波器支援
800‧‧‧樣本
900‧‧‧樣本
902‧‧‧LCU
904‧‧‧參考圖像
1100‧‧‧濾波器支援
1400‧‧‧區塊
1402‧‧‧區塊
1404‧‧‧區塊
圖1為說明可使用本發明中所描述之一或多種技術之實例視訊編碼及解碼系統的方塊圖。
圖2A及圖2B為說明實例四分樹二元樹(QTBT)結構及對應寫碼樹型單元(CTU)之概念圖。
圖3說明三個不同實例自適應迴路濾波(ALF)濾波器支援。
圖4為基於矩陣結果(活動值Act
及方向性D
)說明由Ci
表示之種類索引的實例之概念圖。
圖5為說明5×5菱形濾波器支援之概念圖。
圖6為說明幾何形狀變換之實例的概念圖。
圖7說明用於GALF之實例9×9菱形濾波器支援。
圖8為說明用於ALF之線緩衝器的概念圖。
圖9為說明具有運動補償之填補樣本的概念圖。
圖10A為說明針對ALF藉由映射來填補之實例使用的概念圖。
圖10B為說明針對ALF藉由映射來填補之另一實例使用的概念圖。
圖11為說明經修改濾波器支援之概念圖。
圖12為說明可實施本發明中所描述之一或多種技術之實例視訊編碼器的方塊圖。
圖13為說明可實施本發明中所描述之一或多種技術之實例視訊解碼器的方塊圖。
圖14為說明本發明之實例寫碼方法的流程圖。
Claims (30)
- 一種寫碼視訊資料之方法,該方法包含: 寫碼視訊資料之一區塊以獲得視訊資料之一經寫碼區塊; 將由一濾波器支援限定之一自適應迴路濾波器應用於視訊資料之該經寫碼區塊的樣本,包括對該濾波器支援之在該區塊外部之部分使用填補樣本;及 在將自適應迴路濾波應用於視訊資料之該經寫碼區塊之後輸出視訊資料之該經寫碼區塊。
- 如請求項1之方法,其進一步包含: 自由與視訊資料之該區塊相關聯之一運動向量指向的一參考圖像之樣本產生該等填補樣本。
- 如請求項1之方法,其進一步包含: 自視訊資料之該經寫碼區塊之一第一列或一最末列產生該等填補樣本。
- 如請求項1之方法,其進一步包含: 藉由將一線性函數應用於一或多個參考圖像之樣本而產生該等填補樣本。
- 如請求項4之方法,其進一步包含: 使用一或多個運動向量識別該一或多個參考圖像之該等樣本。
- 如請求項5之方法,其進一步包含: 將該一或多個運動向量捨入至整數值。
- 如請求項5之方法,其進一步包含: 將該一或多個運動向量設定成零運動向量。
- 如請求項1之方法,其進一步包含: 使用一映射函數及視訊資料之經解碼區塊的樣本產生該等填補樣本。
- 如請求項8之方法,其中該映射函數包括一交換函數、一翻轉函數或一旋轉函數中之一或多者。
- 如請求項1之方法,其進一步包含: 將該自適應迴路濾波器之該濾波器支援的在視訊資料之該區塊外部之該等部分的係數設定成零。
- 如請求項1之方法,其進一步包含: 接收指示該等填補樣本針對該濾波器支援之在該區塊外部之部分的使用的一語法元素。
- 如請求項1之方法,其中寫碼為編碼。
- 如請求項1之方法,其中寫碼為解碼。
- 一種裝置,其經組態以寫碼視訊資訊,該裝置包含: 一記憶體,其經組態以儲存視訊資料之一區塊;及 一或多個處理器,其在與該記憶體通信之電路中實施,該一或多個處理器經組態以: 寫碼視訊資料之該區塊以獲得視訊資料之一經寫碼區塊; 將由一濾波器支援限定之一自適應迴路濾波器應用於視訊資料之該經寫碼區塊的樣本,包括對該濾波器支援之在該區塊外部之部分使用填補樣本;及 在將自適應迴路濾波應用於視訊資料之該經寫碼區塊之後輸出視訊資料之該經寫碼區塊。
- 如請求項14之裝置,其中該一或多個處理器進一步經組態以: 自由與視訊資料之該區塊相關聯之一運動向量指向的一參考圖像之樣本產生該等填補樣本。
- 如請求項14之裝置,其中該一或多個處理器進一步經組態以: 自視訊資料之該經寫碼區塊之一第一列或一最末列產生該等填補樣本。
- 如請求項14之裝置,其中該一或多個處理器進一步經組態以: 藉由將一線性函數應用於一或多個參考圖像之樣本而產生該等填補樣本。
- 如請求項17之裝置,其中該一或多個處理器進一步經組態以: 使用一或多個運動向量識別該一或多個參考圖像之該等樣本。
- 如請求項18之裝置,其中該一或多個處理器進一步經組態以: 將該一或多個運動向量捨入至整數值。
- 如請求項18之裝置,其中該一或多個處理器進一步經組態以: 將該一或多個運動向量設定成零運動向量。
- 如請求項14之裝置,其中該一或多個處理器進一步經組態以: 使用一映射函數及視訊資料之經解碼區塊的樣本產生該等填補樣本。
- 如請求項21之裝置,其中該映射函數包括一交換函數、一翻轉函數或一旋轉函數中之一或多者。
- 如請求項14之裝置,其中該一或多個處理器進一步經組態以: 將該自適應迴路濾波器之該濾波器支援的在視訊資料之該區塊外部之該等部分的係數設定成零。
- 如請求項14之裝置,其中該一或多個處理器進一步經組態以: 接收指示該等填補樣本針對該濾波器支援之在該區塊外部之部分的使用的一語法元素。
- 如請求項14之裝置,其中為了寫碼視訊資料之該區塊以獲得視訊之該經寫碼區塊,該一或多個處理器經組態以編碼視訊資料之該區塊以獲得視訊之一經編碼區塊。
- 如請求項14之裝置,其中為了寫碼視訊資料之該區塊以獲得視訊之該經寫碼區塊,該一或多個處理器經組態以解碼視訊資料之該區塊以獲得視訊之一經解碼區塊。
- 一種裝置,其經組態以寫碼視訊資訊,該裝置包含: 用於寫碼視訊資料之一區塊以獲得視訊資料之一經寫碼區塊的構件; 用於將由一濾波器支援限定之一自適應迴路濾波器應用於視訊資料之該經寫碼區塊的樣本,包括對該濾波器支援之在該區塊外部之部分使用填補樣本的構件;及 用於在將自適應迴路濾波應用於視訊資料之該經寫碼區塊之後輸出視訊資料之該經寫碼區塊的構件。
- 如請求項27之裝置,其進一步包含: 用於自由與視訊資料之該區塊相關聯之一運動向量指向的一參考圖像之樣本產生該等填補樣本的構件。
- 一種非暫時性電腦可讀媒體,其儲存指令,該等指令在執行時使一或多個處理器: 寫碼視訊資料之一區塊以獲得視訊資料之一經寫碼區塊; 將由一濾波器支援限定之一自適應迴路濾波器應用於視訊資料之該經寫碼區塊的樣本,包括對該濾波器支援之在該區塊外部之部分使用填補樣本;及 在將自適應迴路濾波應用於視訊資料之該經寫碼區塊之後輸出視訊資料之該經寫碼區塊。
- 如請求項29之非暫時性電腦可讀媒體,其中該等指令進一步使該一或多個處理器: 自由與視訊資料之該區塊相關聯之一運動向量指向的一參考圖像之樣本產生該等填補樣本。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762591504P | 2017-11-28 | 2017-11-28 | |
US62/591,504 | 2017-11-28 | ||
US16/200,197 | 2018-11-26 | ||
US16/200,197 US10721469B2 (en) | 2017-11-28 | 2018-11-26 | Line buffer reduction for adaptive loop filtering in video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201926995A true TW201926995A (zh) | 2019-07-01 |
TWI722341B TWI722341B (zh) | 2021-03-21 |
Family
ID=66633805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107142291A TWI722341B (zh) | 2017-11-28 | 2018-11-27 | 用於在視訊寫碼中自適應之迴路濾波之線路緩衝減少 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10721469B2 (zh) |
EP (1) | EP3718303A1 (zh) |
CN (1) | CN111373752B (zh) |
SG (1) | SG11202003555TA (zh) |
TW (1) | TWI722341B (zh) |
WO (1) | WO2019108550A1 (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10887622B2 (en) | 2017-07-05 | 2021-01-05 | Qualcomm Incorporated | Division-free bilateral filter |
US11044473B2 (en) * | 2018-12-21 | 2021-06-22 | Qualcomm Incorporated | Adaptive loop filtering classification in video coding |
CN113519164A (zh) | 2019-03-02 | 2021-10-19 | 北京字节跳动网络技术有限公司 | 对分割结构的限制 |
US11910024B2 (en) | 2019-03-11 | 2024-02-20 | Qualcomm Incorporated | Boundary handling for adaptive loop filtering |
JP7233565B2 (ja) | 2019-03-24 | 2023-03-06 | 北京字節跳動網絡技術有限公司 | ビデオ処理におけるマルチパラメータ適応ループフィルタリング |
EP3928524A4 (en) | 2019-04-15 | 2022-06-22 | Beijing Bytedance Network Technology Co., Ltd. | TIME PREDICTION OF PARAMETERS IN A NONLINEAR ADAPTIVE LOOP FILTER |
WO2020211810A1 (en) | 2019-04-16 | 2020-10-22 | Beijing Bytedance Network Technology Co., Ltd. | On adaptive loop filtering for video coding |
WO2020216177A1 (en) | 2019-04-20 | 2020-10-29 | Beijing Bytedance Network Technology Co., Ltd. | Signaling of chroma and luma syntax elements in video coding |
CN113785574B (zh) | 2019-05-30 | 2022-10-11 | 北京字节跳动网络技术有限公司 | 色度分量的自适应环路滤波 |
KR20220016075A (ko) | 2019-06-04 | 2022-02-08 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 모션 후보 리스트 구성 프로세스의 조건부 구현 |
WO2020244571A1 (en) | 2019-06-04 | 2020-12-10 | Beijing Bytedance Network Technology Co., Ltd. | Motion candidate list construction using neighboring block information |
CN118138754A (zh) | 2019-06-14 | 2024-06-04 | 北京字节跳动网络技术有限公司 | 处理视频单元边界和虚拟边界 |
WO2020249124A1 (en) | 2019-06-14 | 2020-12-17 | Beijing Bytedance Network Technology Co., Ltd. | Handling video unit boundaries and virtual boundaries based on color format |
EP3981150A4 (en) | 2019-07-09 | 2022-08-03 | Beijing Bytedance Network Technology Co., Ltd. | SAMPLE DETERMINATION FOR ADAPTIVE LOOP FILTERING |
WO2021004542A1 (en) | 2019-07-11 | 2021-01-14 | Beijing Bytedance Network Technology Co., Ltd. | Sample padding in adaptive loop filtering |
CN114128295B (zh) | 2019-07-14 | 2024-04-12 | 北京字节跳动网络技术有限公司 | 视频编解码中几何分割模式候选列表的构建 |
WO2021008546A1 (en) | 2019-07-15 | 2021-01-21 | Beijing Bytedance Network Technology Co., Ltd. | Accessing samples across video unit boundaries in adaptive loop filtering |
KR102707780B1 (ko) | 2019-09-18 | 2024-09-20 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 코딩에서 적응형 루프 필터의 2-파트 시그널링 |
EP4018652A4 (en) | 2019-09-22 | 2022-11-02 | Beijing Bytedance Network Technology Co., Ltd. | FILLING METHOD IN AN ADAPTIVE LOOP FILTER |
JP7326600B2 (ja) | 2019-09-27 | 2023-08-15 | 北京字節跳動網絡技術有限公司 | 異なるビデオユニット間の適応ループフィルタリング |
CN117596389A (zh) | 2019-09-28 | 2024-02-23 | 北京字节跳动网络技术有限公司 | 视频编解码中的几何分割模式 |
EP4029263A4 (en) | 2019-10-10 | 2022-12-07 | Beijing Bytedance Network Technology Co., Ltd. | FILLING PROCEDURE AT UNAVAILABLE SAMPLING POINTS IN AN ADAPTIVE LOOP FILTERING |
KR102707834B1 (ko) | 2019-10-29 | 2024-09-19 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 루마 차이를 이용한 크로스 컴포넌트 적응적 루프 필터 |
CN115428449A (zh) * | 2019-11-04 | 2022-12-02 | 抖音视界有限公司 | 交叉分量自适应环路滤波器 |
BR112022011466A2 (pt) | 2019-12-11 | 2022-08-23 | Beijing Bytedance Network Tech Co Ltd | Método de processamento de dados de vídeo, aparelho para processamento de dados de vídeo, meio de armazenamento e meio de gravação legíveis por computador não transitório |
US11329722B2 (en) | 2020-03-27 | 2022-05-10 | Relative Dynamics Incorporated | Optical terminals |
CN116325728A (zh) | 2020-06-30 | 2023-06-23 | 抖音视界有限公司 | 自适应环路滤波的边界位置 |
CN114501003B (zh) * | 2021-12-24 | 2024-03-12 | 北京达佳互联信息技术有限公司 | 视频解码方法及装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9137545B2 (en) * | 2009-10-21 | 2015-09-15 | Sk Telecom Co., Ltd. | Image encoding and decoding apparatus and method |
KR101791242B1 (ko) * | 2010-04-16 | 2017-10-30 | 에스케이텔레콤 주식회사 | 영상 부호화/복호화 장치 및 방법 |
US8711933B2 (en) * | 2010-08-09 | 2014-04-29 | Sony Computer Entertainment Inc. | Random access point (RAP) formation using intra refreshing technique in video coding |
KR20130070646A (ko) * | 2010-10-01 | 2013-06-27 | 제너럴 인스트루먼트 코포레이션 | 유연한 분할에서 영상 경계 패딩을 활용하는 코딩 및 디코딩 |
EP2533537A1 (en) * | 2011-06-10 | 2012-12-12 | Panasonic Corporation | Transmission of picture size for image or video coding |
US20120314767A1 (en) * | 2011-06-13 | 2012-12-13 | Qualcomm Incorporated | Border pixel padding for intra prediction in video coding |
PL3379833T3 (pl) * | 2011-10-18 | 2021-12-13 | Lg Electronics Inc. | Sposób intra-predykcji i jego urządzenie |
US20130128986A1 (en) * | 2011-11-23 | 2013-05-23 | Mediatek Inc. | Method and Apparatus of Slice Boundary Padding for Loop Filtering |
JP6309092B2 (ja) * | 2013-10-25 | 2018-04-11 | メディアテック インコーポレイテッド | スライス高さで均等に割り切れないピクチャ高さ及び/又はピクセルグループ幅で均等に割り切れないスライス幅を有するピクチャを処理する方法及び装置 |
US10057574B2 (en) * | 2015-02-11 | 2018-08-21 | Qualcomm Incorporated | Coding tree unit (CTU) level adaptive loop filter (ALF) |
US11405611B2 (en) | 2016-02-15 | 2022-08-02 | Qualcomm Incorporated | Predicting filter coefficients from fixed filters for video coding |
-
2018
- 2018-11-26 US US16/200,197 patent/US10721469B2/en active Active
- 2018-11-27 CN CN201880075825.6A patent/CN111373752B/zh active Active
- 2018-11-27 TW TW107142291A patent/TWI722341B/zh active
- 2018-11-27 SG SG11202003555TA patent/SG11202003555TA/en unknown
- 2018-11-27 EP EP18816457.8A patent/EP3718303A1/en active Pending
- 2018-11-27 WO PCT/US2018/062643 patent/WO2019108550A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
US10721469B2 (en) | 2020-07-21 |
CN111373752B (zh) | 2021-07-16 |
TWI722341B (zh) | 2021-03-21 |
EP3718303A1 (en) | 2020-10-07 |
US20190166363A1 (en) | 2019-05-30 |
CN111373752A (zh) | 2020-07-03 |
SG11202003555TA (en) | 2020-06-29 |
WO2019108550A1 (en) | 2019-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI722341B (zh) | 用於在視訊寫碼中自適應之迴路濾波之線路緩衝減少 | |
US11044473B2 (en) | Adaptive loop filtering classification in video coding | |
CN112449753B (zh) | 利用广角帧内预测的位置相关帧内预测组合 | |
CN110720218B (zh) | 与视频译码中的变换处理一起应用的帧内滤波 | |
TWI812694B (zh) | 以角度模式延伸之位置相關框內預測組合 | |
CN110169064B (zh) | 具有减低复杂性的视频译码中的双边滤波器 | |
TWI782904B (zh) | 合併用於視訊寫碼之用於多類別區塊之濾波器 | |
TWI843809B (zh) | 用於視訊寫碼中具有運動向量差之合併模式之信令傳輸 | |
US20190238845A1 (en) | Adaptive loop filtering on deblocking filter results in video coding | |
TWI669944B (zh) | 基於調色板之視訊寫碼中之寫碼行程 | |
CN113853784B (zh) | 用于视频译码的多个自适应环路滤波器集合的方法和装置 | |
TW201841501A (zh) | 用於視訊寫碼之多種類型樹架構 | |
TW201838415A (zh) | 在視訊寫碼中判定用於雙邊濾波之鄰近樣本 | |
TW201830964A (zh) | 基於在視訊寫碼中之一預測模式導出雙邊濾波器資訊 | |
TW201804794A (zh) | 過濾資訊之發信號 | |
TW201633787A (zh) | 寫碼樹單元級可適性迴路濾波器 | |
TW201517599A (zh) | 內部運動補償延伸 | |
TW201608880A (zh) | 基於調色板之視訊寫碼中之逃脫樣本寫碼 | |
TW202106005A (zh) | 視訊寫碼中之簡化色度內模式寫碼 | |
US10764605B2 (en) | Intra prediction for 360-degree video | |
CN114731415A (zh) | 针对多类型树块结构的合并估计区域 | |
CN114223202A (zh) | 低频不可分离变换(lfnst)信令 | |
TW202127884A (zh) | 用於用於視訊譯碼的跨分量適應性環路濾波的位元位移 | |
CN113994674A (zh) | 增加经帧内译码的块的解码吞吐 | |
TW202431835A (zh) | 自適應迴路濾波器分類器 |