TW202110194A

TW202110194A - 視訊寫碼中漸進式隨機存取發信

Info

Publication number: TW202110194A
Application number: TW109121593A
Authority: TW
Inventors: 穆漢麥德傑德柯本; 阿達許克里許納瑞瑪蘇布雷蒙尼安; 法迪姆塞瑞金; 馬塔卡茲維克茲
Original assignee: 美商高通公司
Priority date: 2019-06-24
Filing date: 2020-06-24
Publication date: 2021-03-01
Also published as: US20200404334A1; US11457242B2; BR112021024987A2; EP3987805A1; WO2020263916A1; CN114009034A

Abstract

一種對視訊資料進行解碼之方法包括：自一經寫碼視訊位元串流且作為以左側位元為第一者的一無正負號整數0階指數哥倫布寫碼語法元素解碼一值，該值指定一當前圖像序列之一當前圖像的一目標恢復點圖像，其中該目標恢復點圖像按顯示次序定位於該當前圖像處或之後；及在該目標恢復點圖像處恢復該當前圖像序列的解碼。

Description

視訊寫碼中漸進式隨機存取發信

本發明係關於視訊編碼及視訊解碼。

數位視訊能力可併入至廣泛範圍之裝置中，該等裝置包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄裝置、數位媒體播放機、視訊遊戲裝置、視訊遊戲主控台、蜂巢式或衛星無線電電話(所謂的「智慧型電話」)、視訊電傳會議裝置、視訊串流傳輸裝置及其類似者。數位視訊裝置實施視訊寫碼技術，諸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分進階視訊寫碼(AVC)、ITU-T H.265/高效視訊寫碼(HEVC)定義之標準，及此等標準的擴展中所描述之技術。視訊裝置可藉由實施此類視訊寫碼技術而更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。

視訊寫碼技術包括空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列所固有之冗餘。對於基於區塊之視訊寫碼，視訊截塊(例如，視訊圖像或視訊圖像的一部分)可分割成視訊區塊，視訊區塊亦可被稱作寫碼樹型單元(CTU)、寫碼單元(CU)及/或寫碼節點。使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼圖像之經框內寫碼(I)截塊中的視訊區塊。圖像之經框間寫碼(P或B)截塊中之視訊區塊可使用關於同一圖像中之相鄰區塊中的參考樣本的空間預測或關於其他參考圖像中之參考樣本的時間預測。圖像可稱為圖框，且參考圖像可稱為參考圖框。

大體而言，本發明描述用於在視訊寫碼中發信漸進式隨機存取(GRA)恢復點的技術。視訊通信中之重要態樣為隨機存取。隨機存取指解碼器之在不同於串流之起點的點處開始解碼串流且恢復經解碼圖像之準確或近似表示的能力。隨機存取點及恢復點特徵化隨機存取操作。隨機存取點為解碼可經起始的任何經寫碼圖像。按輸出次序在恢復點處或之後的所有經解碼圖像在內容上為正確或大致正確的。若隨機存取點與恢復點相同，則隨機存取操作為瞬時的；否則，隨機存取操作為漸進式的。

隨機存取點啟用本端儲存之視訊串流中的搜尋、快進及快退操作。在視訊點播串流傳輸中，伺服器可藉由傳輸自最靠近於搜尋操作之所請求目的地的隨機存取點開始的資料來對搜尋請求做出回應。隨機存取點啟用對廣播的調諧。此外，隨機存取點作為對切割成源序列之場景的回應或作為對快速更新圖像內更新請求的回應可經寫碼。

在一些實例中，漸進式隨機存取(GRA)圖像可定義為運用在恢復圖像定位所在之處的目標恢復點圖像次序計數(POC)值發信漸進式隨機存取之起點的圖像。因此，若解碼器自GRA圖像起啟動解碼程序，則解碼器將解碼但不輸出圖像直至恢復點圖像為止，但解碼器可解碼並輸出自恢復圖像起且稍遲的圖像。視訊編碼器可使用具有帶正負號值之語法元素(例如，recovery_poc_cnt)來發信目標恢復點圖像。此情形意謂，具有小於當前GRA圖像之POC值的圖像可為恢復點。此情形導致自恢復點開始且在解碼上向前的所有圖像可被輸出之情形。此情形可呈現一或多個問題。舉例而言，可存在需要被跳過(例如，未輸出/顯示)的呈輸出次序之數個圖像，此是由於圖像按解碼次序先於恢復點圖像。此情形可導致所顯現圖像中的間隙，其為非所要的。

根據本發明之一或多種技術，視訊寫碼器(例如，視訊解碼器及/或視訊編碼器)可使用具有無正負號值之語法元素(例如，recovery_poc_cnt)對目標恢復點圖像的一指示進行寫碼。舉例而言，視訊寫碼器可將語法元素寫碼為以左側位元為第一者的無正負號整數0階指數哥倫布寫碼語法元素。藉由使用具有無正負號值之語法元素對目標恢復點圖像進行寫碼，本發明之技術消除間隙引入於所顯現圖像之輸出中的非所要條件。另外，使用具有無正負號值之語法元素對目標恢復點圖像進行寫碼可減小用以發信目標恢復點圖像之資料量，此舉可改良寫碼效率。

在一個實例中，一種用於對視訊資料進行解碼之方法包括：自一經寫碼視訊位元串流且作為以左側位元為第一者的一無符號整數0階指數哥倫布寫碼的語法元素解碼一值，該值指定一當前圖像序列之一當前圖像的一目標恢復點圖像，其中該目標恢復點圖像按顯示次序定位於該當前圖像處或之後；及在該目標恢復點圖像處恢復當前圖像序列的解碼。

在另一實例中，一種用於對視訊資料進行編碼的方法包括：針對一當前圖像序列之一當前圖像且按顯示次序在當前圖像處或之後選擇一目標恢復點圖像；及在經寫碼視訊位元串中且作為以左側位元為第一者之無正負號整數0階指數哥倫布寫碼語法元素編碼一值，該值指定當前圖像序列之當前圖像的目標恢復點圖像。

在另一實例中，一種裝置包括經組態以儲存經寫碼視訊位元串流之至少一部分的記憶體；及一或多個處理器，該一或多個處理器以電路實施且經組態以：自經寫碼視訊位元串流且作為以左側位元為第一者之無正負號整數0階指數哥倫布寫碼語法元素解碼一值，該值指定當前圖像序列之當前圖像的目標恢復點圖像，其中目標恢復點圖像按顯示次序定位於當前圖像處或之後；及在目標恢復點圖像處恢復當前圖像序列的解碼。

在另一實例中，一種裝置包括經組態以儲存經寫碼視訊位元串流之至少一部分的記憶體；及一或多個處理器，該一或多個處理器以電路實施且經組態以：針對當前圖像序列之當前圖像且按顯示次序在當前圖像處或之後選擇目標恢復點圖像；及在經寫碼視訊位元串流中且作為以左側位元為第一者之無正負號整數0階指數哥倫布寫碼語法元素編碼一值，該值指定當前圖像序列之當前圖像的目標恢復點圖像。

在以下隨附圖式及描述中闡述一或多個實例之細節。其他特徵、目標及優點將自描述內容、圖式及申請專利範圍而顯而易見。

相關申請案之交叉參考

本申請案主張2019年6月24日申請之美國臨時申請案第62/865,838號及2019年6月26日申請之美國臨時申請案第62/867,083號的權利，該等美國臨時申請案中之每一者的全部內容特此以引用方式併入。

圖1為說明可執行本發明之技術的實例視訊編碼及解碼系統100的方塊圖。本發明之技術大體上係針對寫碼(編碼及/或解碼)視訊資料。大體而言，視訊資料包括用於處理視訊之任何資料。因此，視訊資料可包括原始未經編碼的視訊、經編碼視訊、經解碼(例如，經重建構)視訊及視訊後設資料，諸如發信資料。

如圖1中所示，在此實例中，系統100包括源裝置102，其提供待由目的地裝置116解碼及顯示之經編碼視訊資料。特定言之，源裝置102經由電腦可讀媒體110將視訊資料提供至目的地裝置116。源裝置102及目的地裝置116可包含廣泛範圍裝置中之任一者，包括桌上型電腦、筆記型(亦即，膝上型)電腦、平板電腦、機上盒、電話手持機(諸如，智慧型電話)、電視、攝影機、顯示裝置、數位媒體播放器、視訊遊戲主控台、視訊串流傳輸裝置或類似者。在一些情況下，源裝置102及目的地裝置116可經裝備用於無線通信，且由此可稱為無線通信裝置。

在圖1之實例中，源裝置102包括視訊源104、記憶體106、視訊編碼器200及輸出介面108。目的地裝置116包括輸入介面122、視訊解碼器300、記憶體120及顯示裝置118。根據本發明，源裝置102之視訊編碼器200及目的地裝置116的視訊解碼器300可經組態以應用漸進式隨機存取(GRA)恢復點發信的技術。由此，源裝置102表示視訊編碼裝置之實例，而目的地裝置116表示視訊解碼裝置之實例。在其他實例中，源裝置及目的地裝置可包括其他組件或配置。舉例而言，源裝置102可自外部視訊源(諸如，外部攝影機)接收視訊資料。同樣地，目的地裝置116可與外部顯示裝置介接，而非包括整合式顯示裝置。

如圖1中所展示之系統100僅為一個實例。一般而言，任何數位視訊編碼及/或解碼裝置可執行用於GRA恢復點發信的技術。源裝置102及目的地裝置116僅為其中源裝置102產生經寫碼視訊資料以供傳輸至目的地裝置116的此類寫碼裝置之實例。本發明將「寫碼」裝置稱為對資料執行寫碼(編碼及/或解碼)之裝置。因此，視訊編碼器200及視訊解碼器300表示寫碼裝置之實例，詳言之分別表示視訊編碼器及視訊解碼器之實例。在一些實例中，裝置102、116可以大體上對稱的方式操作，使得裝置102、116中之每一者包括視訊編碼及解碼組件。因此，系統100可支援視訊裝置102、116之間的單向或雙向視訊傳輸，用於(例如)視訊串流傳輸、視訊播放、視訊廣播或視訊電話。

大體而言，視訊源104表示視訊資料源(亦即，原始未經編碼視訊資料)且將視訊資料之依序圖像(亦稱為「圖框」)提供至視訊編碼器200，該視訊編碼器對圖像之資料進行編碼。源裝置102之視訊源104可包括視訊俘獲裝置，諸如視訊攝影機、含有先前俘獲之原始視訊的視訊存檔及/或用以自視訊內容提供者接收視訊的視訊饋入介面。作為另一替代，視訊源104可產生基於電腦圖形之資料作為源視訊，或實況視訊、存檔視訊及電腦產生之視訊的組合。在每一情況下，視訊編碼器200對所俘獲、所預先俘獲或電腦產生之視訊資料進行編碼。視訊編碼器200可將圖像自接收次序(有時被稱作「顯示次序」)重新配置成寫碼次序以供寫碼。視訊編碼器200可產生包括經編碼視訊資料之位元串流。源裝置102接著可經由輸出介面108將經編碼視訊資料輸出至電腦可讀媒體110上，以供藉由例如目的地裝置116之輸入介面122接收及/或擷取。

源裝置102之記憶體106及目的地裝置116之記憶體120表示通用記憶體。在一些實例中，記憶體106、120可儲存原始視訊資料，例如來自視訊源104之原始視訊及來自視訊解碼器300之原始經解碼視訊資料。另外或替代地，記憶體106、120可儲存分別由例如視訊編碼器200及視訊解碼器300可執行之軟體指令。儘管在此實例中展示為與視訊編碼器200及視訊解碼器300分開，但應理解，視訊編碼器200及視訊解碼器300亦可包括功能上類似或用途等效之內部記憶體。此外，記憶體106、120可儲存例如自視訊編碼器200輸出及輸入至視訊解碼器300的經編碼視訊資料。在一些實例中，可分配記憶體106、120之部分作為一或多個視訊緩衝器例如以儲存原始經解碼及/或經編碼視訊資料。

電腦可讀媒體110可表示能夠將經編碼視訊資料自源裝置102運輸至目的地裝置116的任何類型之媒體或裝置。在一個實例中，電腦可讀媒體110表示用以使源裝置102能即時例如經由射頻網路或基於電腦之網路直接傳輸經編碼視訊資料至目的地裝置116的通信媒體。輸出介面108可調變包括經編碼視訊資料之傳輸信號，且輸入介面122可根據通信標準(諸如無線通信協定)將所接收傳輸信號解調變。通信媒體可包含任何無線或有線通信媒體，諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如，區域網路、廣域網路或諸如網際網路之全域網路)的部分。通信媒體可包括路由器、交換器、基地台或可用於促進自源裝置102至目的地裝置116的通信之任何其他裝備。

在一些實例中，源裝置102可自輸出介面108輸出經編碼資料至儲存裝置112。類似地，目的地裝置116可經由輸入介面122自儲存裝置112存取經編碼資料。儲存裝置112可包括多種分佈式或本端存取之資料儲存媒體中之任一者，諸如硬碟機、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體，或用於儲存經編碼視訊資料的任何其他合適之數位儲存媒體。

在一些實例中，源裝置102可將經編碼視訊資料輸出至檔案伺服器114，或可儲存由源裝置102所產生之經編碼視訊的另一中間儲存裝置。目的地裝置116可經由串流傳輸或下載而自檔案伺服器114存取經儲存視訊資料。檔案伺服器114可為能夠儲存經編碼視訊資料且將經編碼視訊資料傳輸至目的地裝置116的任何類型之伺服器裝置。檔案伺服器114可表示網頁伺服器(例如，用於網站)、檔案傳送協定(FTP)伺服器、內容傳遞網路裝置或網路附加儲存(NAS)裝置。目的地裝置116可經由包括網際網路連接之任何標準資料連接自檔案伺服器114存取經編碼視訊資料。此可包括無線通道(例如，Wi-Fi連接)、有線連接(例如，數位用戶線(DSL)、電纜數據機等)，或適合於存取儲存於檔案伺服器114上之經編碼視訊資料的兩者之一組合。檔案伺服器114及輸入介面122可經組態以根據串流傳輸協定、下載傳輸協定或其組合來操作。

輸出介面108及輸入介面122可表示無線傳輸器/接收器、數據機、有線網路連接組件(例如，乙太網路卡)、根據各種IEEE 802.11標準中之任一者操作之無線通信組件，或其他實體組件。在輸出介面108及輸入介面122包含無線組件之實例中，輸出介面108及輸入介面122可經組態以根據蜂巢式通信標準(諸如4G、4G-LTE(長期演進)、進階LTE、5G或其類似者)來傳送資料，諸如經編碼視訊資料。在輸出介面108包含無線傳輸器的一些實例中，輸出介面108及輸入介面122可經組態以根據其他無線標準(諸如IEEE 802.11規範、IEEE 802.15規範(例如，ZigBee™)、Bluetooth™標準或其類似者)來傳送資料，諸如經編碼視訊資料。在一些實例中，源裝置102及/或目的地裝置116可包括各別晶片上系統(SoC)裝置。舉例而言，源裝置102可包括SoC裝置以執行歸於視訊編碼器200及/或輸出介面108之功能性，且目的地裝置116可包括SoC裝置以執行歸於視訊解碼器300及/或輸入介面122之功能性。

本發明之技術可應用於支援多種多媒體應用中之任一者的視訊寫碼，諸如，空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流傳輸視訊傳輸(諸如，經由HTTP之動態自適應串流傳輸(DASH))、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上的數位視訊之解碼或其他應用。

目的地裝置116之輸入介面122自電腦可讀媒體110 (例如，儲存裝置112、檔案伺服器114或其類似者)接收經編碼視訊位元串流。經編碼視訊位元串流可包括由視訊編碼器200定義之發信資訊(其亦由視訊解碼器300使用)，諸如具有描述視訊區塊或其他經寫碼單元(例如，截塊、圖像、圖像群組、序列或其類似者)之特性及/或處理的值的語法元素。顯示裝置118向使用者顯示經解碼視訊資料之經解碼圖像。顯示裝置118可表示各種顯示裝置中之任一者，諸如陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示裝置。

儘管圖1中未示出，但在一些實例中，視訊編碼器200及視訊解碼器300可各自與音訊編碼器及/或音訊解碼器整合，且可包括適當的MUX-DEMUX單元或其他硬體及/或軟體，以處置在共同資料串流中包括音訊及視訊兩者之多工串流。若適用，則MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。

視訊編碼器200及視訊解碼器300各自可經實施為各種適合之編碼器及/或解碼器電路中之任一者，諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分以軟體實施時，裝置可將用於軟體之指令儲存於合適之非暫時性電腦可讀媒體中，且在硬體中使用一或多個處理器執行指令以執行本發明之技術。視訊編碼器200及視訊解碼器300中之每一者可包括於一或多個編碼器或解碼器中，編碼器或解碼器中之任一者可整合為各別裝置中之組合式編碼器/解碼器(編碼解碼器)的部分。包括視訊編碼器200及/或視訊解碼器300之裝置可包含積體電路、微處理器及/或無線通信裝置(諸如蜂巢式電話)。

視訊編碼器200及視訊解碼器300可根據視訊寫碼標準，諸如亦稱作高效視訊寫碼(HEVC)之ITU-T H.265，或其擴展(諸如多視圖及/或可調式視訊寫碼擴展)操作。替代地，視訊編碼器200及視訊解碼器300可根據其他專有或行業標準，諸如聯合勘探測試模型(JEM)或亦經稱作多功能視訊寫碼(VVC)之ITU-T H.266操作。VVC標準之新近草案描述於2019年3月19日至27日於CH日內瓦的ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG 11之聯合視訊專家小組(JVET)第14次會議JVET-N1001-v8上，Bross等人的「Versatile Video Coding(草案5)」(在下文中為「VVC草案5」)中。然而，本發明之技術不限於任何特定寫碼標準。

大體而言，視訊編碼器200及視訊解碼器300可執行圖像之基於區塊的寫碼。術語「區塊」大體上係指包括待處理(例如，編碼、解碼或以其他方式在編碼及/或解碼程序中使用)之資料的結構。舉例而言，區塊可包括明度及/或色度資料之樣本的二維矩陣。大體而言，視訊編碼器200及視訊解碼器300可對以YUV (例如Y、Cb、Cr)格式表示之視訊資料進行寫碼。亦即，視訊編碼器200及視訊解碼器300可對明度及色度分量進行寫碼，而非對圖像之樣本的紅色、綠色及藍色(RGB)資料進行寫碼，其中色度分量可包括紅色調色度分量及藍色調色度分量兩者。在一些實例中，視訊編碼器200在編碼之前將所接收的RGB格式化資料轉換為YUV表示，且視訊解碼器300將YUV表示轉換為RGB格式。替代地，預處理單元及後處理單元(圖中未示)可執行此等轉換。

本發明大體上可指對圖像進行寫碼(例如編碼及解碼)以包括對圖像之資料進行編碼或解碼的程序。類似地，本發明可指對圖像之區塊進行寫碼以包括對區塊之資料進行編碼或解碼的程序，例如預測及/或殘餘寫碼。經編碼視訊位元串流大體上包括表示寫碼決策(例如，寫碼模式)及圖像至區塊之分割的語法元素的一系列值。因此，對圖像或區塊進行寫碼之提及通常應理解為對形成圖像或區塊之語法元素的值進行寫碼。

HEVC定義各種區塊，包括寫碼單元(CU)、預測單元(PU)，以及變換單元(TU)。根據HEVC，視訊寫碼器(諸如視訊編碼器200)根據四分樹結構將寫碼樹型單元(CTU)分割成CU。亦即，視訊寫碼器將CTU及CU分割成四個相同的非重疊正方形，且四分樹之每一節點具有零個或四個子節點。不具有子節點之節點可被稱作「葉節點」，且此類葉節點之CU可包括一或多個PU及/或一或多個TU。視訊寫碼器可進一步分割PU及TU。舉例而言，在HEVC中，殘餘四分樹(RQT)表示TU之分割。在HEVC中，PU表示框間預測資料，而TU表示殘餘資料。經框內預測之CU包括框內預測資訊，諸如框內模式指示。

作為另一實例，視訊編碼器200及視訊解碼器300可經組態以根據JEM或VVC操作。根據JEM或VVC，視訊寫碼器(諸如視訊編碼器200)將圖像分割成複數個寫碼樹型單元(CTU)。視訊編碼器200可根據樹型結構來分割CTU，諸如四元樹-二元樹(QTBT)結構或多類型樹(MTT)結構。QTBT結構移除多個分割類型之概念，諸如HEVC之CU、PU，以及TU之間的間距。QTBT結構包括兩個層級：根據四分樹分割進行分割之第一層級，及根據二元樹分割進行分割之第二層級。QTBT結構之根節點對應於CTU。二元樹之葉節點對應於寫碼單元(CU)。

在MTT分割結構中，區塊可使用四分樹(QT)分割、二元樹(BT)分割及一或多種類型之三重樹(TT)分割來進行分割。三重樹分割為區塊分裂成三個子區塊的分割。在一些實例中，三重樹分割在不通過中心劃分原始區塊情況下將區塊劃分成三個子區塊。MTT中之分割類型(例如，QT、BT及TT)可為對稱或不對稱的。

在一些實例中，視訊編碼器200及視訊解碼器300可使用單個QTBT或MTT結構來表示明度及色度分量中之每一者，而在其他實例中，視訊編碼器200及視訊解碼器300可使用兩個或更多個QTBT或MTT結構，諸如用於明度分量之一個QTBT/MTT結構及用於兩個色度分量之另一QTBT/MTT結構(或用於各別色度分量之兩個QTBT/MTT結構)。

視訊編碼器200及視訊解碼器300可經組態以使用根據HEVC之四分樹分割、QTBT分割、MTT分割或其他分割結構。出於解釋之目的，關於QTBT分割呈現本發明之技術的描述。然而，應理解，本發明之技術亦可應用於經組態以使用四元樹分割或亦其他類型之分割的視訊寫碼器。

區塊(例如，CTU或CU)可在圖像中以各種方式分組。作為一個實例，磚(brick)可指圖像中之特定圖塊內的CTU列之矩形區。圖塊可為圖像中之特定圖塊行及特定圖塊列內的CTU之矩形區。圖塊行係指高度等於圖像之高度且寬度由語法元素(例如，諸如在圖像參數集中)指定的CTU之矩形區。圖塊列係指高度由語法元素(例如，諸如在圖像參數集中)指定且寬度等於圖像之寬度的CTU之矩形區。

在一些實例中，圖塊可分割成多個磚，多個磚中之每一者可包括圖塊內之一或多個CTU列。未分割成多個磚之圖塊亦可稱為磚。然而，為圖塊之真子集的磚可不被稱作圖塊。

圖像中之磚亦可配置於截塊中。截塊可為可獨佔地含於單一網路抽象層(NAL)單元中之圖像之整數數目個磚。在一些實例中，截塊包括多個完整圖塊或僅包括一個圖塊之連續序列的完整磚。

本發明可互換地使用「N×N」及「N乘N」以指區塊(諸如CU或其他視訊區塊)在豎直及水平尺寸方面之樣本尺寸，例如16×16個樣本或16乘16個樣本。大體而言，16×16 CU在豎直方向上將具有16個樣本(y = 16)且在水平方向上將具有16個樣本(x = 16)。同樣，N×N CU大體在豎直方向上具有N個樣本且在水平方向上具有N個樣本，其中N表示非負整數值。可以列及行形式來配置CU中之樣本。此外，CU不一定在水平方向上及豎直方向上具有相同數目個樣本。舉例而言，CU可包含N×M個樣本，其中M未必等於N。

視訊編碼器200對CU之表示預測及/或殘餘資訊及其他資訊的視訊資料進行編碼。預測資訊指示將如何預測CU以便形成CU之預測區塊。殘餘資訊通常表示在編碼之前的CU與預測區塊的樣本之間的逐樣本差。

為了預測CU，視訊編碼器200可大體經由框間預測或框內預測形成CU之預測區塊。框間預測大體係指自先前經寫碼圖像之資料預測CU，而框內預測大體係指自同一圖像之先前經寫碼資料預測CU。為了執行框間預測，視訊編碼器200可使用一或多個運動向量來產生預測區塊。視訊編碼器200大體可執行運動搜尋以識別例如在CU與參考區塊之間的差方面緊密匹配CU之參考區塊。視訊編碼器200可使用絕對差總和(SAD)、平方差總和(SSD)、平均絕對差(MAD)、均方差(MSD)或其他此類差計算來計算差度量，以判定參考區塊是否緊密匹配當前CU。在一些實例中，視訊編碼器200可使用單向預測或雙向預測來預測當前CU。

JEM及VVC之一些實例亦提供仿射運動補償模式，其可被認為是框間預測模式。在仿射運動補償模式中，視訊編碼器200可判定表示非平移運動(諸如放大或縮小、旋轉、透視運動或其他不規則運動類型)之兩個或大於兩個運動向量。

為了執行框內預測，視訊編碼器200可選擇框內預測模式以產生預測區塊。JEM及VVC之一些實例提供六十七種框內預測模式，包括各種定向模式以及平面模式及DC模式。一般而言，視訊編碼器200選擇描述當前區塊(例如，CU之區塊)的相鄰樣本的框內預測模式，其中自該當前區塊預測當前區塊之樣本。假定視訊編碼器200以光柵掃描次序(左至右、上至下)對CTU及CU進行寫碼，此類樣本通常可在與當前區塊相同之圖像中處於當前區塊之上方、左上方或左側。

視訊編碼器200編碼表示當前區塊之預測模式的資料。舉例而言，針對框間預測模式，視訊編碼器200可編碼表示使用多種可用框間預測模式中之哪一者以及對應模式之運動資訊的資料。舉例而言，針對單向或雙向框間預測，視訊編碼器200可使用進階運動向量預測(AMVP)或合併模式來對運動向量進行編碼。視訊編碼器200可使用類似模式來編碼用於仿射運動補償模式之運動向量。

在區塊之預測(諸如框內預測或框間預測)之後，視訊編碼器200可計算該區塊之殘餘資料。殘餘資料(諸如殘餘區塊)表示區塊與該區塊之使用對應預測模式所形成的預測區塊之間的逐樣本差。視訊編碼器200可將一或多個變換應用於殘餘區塊，以在變換域而非樣本域中產生經變換資料。舉例而言，視訊編碼器200可將離散餘弦變換(DCT)、整數變換、小波變換或概念上類似的變換應用於殘餘視訊資料。另外，視訊編碼器200可在第一變換之後應用二級變換，諸如模式相依不可分離二級變換(MDNSST)、信號相依變換、Karhunen-Loeve變換(KLT)或其類似者。視訊編碼器200在應用一或多個變換之後產生變換係數。

如上文所指出，在產生變換係數之任何變換之後，視訊編碼器200可執行變換係數之量化。量化大體上指變換係數經量化以可能減少用於表示係數的資料之量，從而提供進一步壓縮之程序。藉由執行量化程序，視訊編碼器200可減少與係數中之一些或所有相關聯的位元深度。舉例而言，視訊編碼器200可在量化期間將n 位元值舍入為m 位元值，其中n 大於m 。在一些實例中，為了執行量化，視訊編碼器200可執行待量化值之按位元右移。

在量化之後，視訊編碼器200可掃描變換係數，從而自包括經量化變換係數之二維矩陣產生一維向量。掃描可經設計以將較高能量(且因此較低頻率)係數置於向量前部，且將較低能量(且因此較高頻率)變換係數置於向量後部。在一些實例中，視訊編碼器200可利用預定義掃描次序來掃描經量化變換係數以產生串列化向量，且隨後熵編碼向量之經量化變換係數。在其他實例中，視訊編碼器200可執行自適應掃描。在掃描經量化變換係數以形成一維向量之後，視訊編碼器200可例如根據上下文適應性二進位算術寫碼(CABAC)對一維向量進行熵編碼。視訊編碼器200亦可熵編碼描述與經編碼視訊資料相關聯之後設資料之語法元素的值，以供由視訊解碼器300用於解碼視訊資料。

為執行CABAC，視訊編碼器200可將上下文模型內之上下文指派給待傳輸之符號。上下文可係關於(例如)符號之相鄰值是否為零值。機率判定可基於指派給符號之上下文。

視訊編碼器200可進一步例如在圖像標頭、區塊標頭、截塊標頭或其他語法資料(諸如序列參數集(sequence parameter set；SPS)、圖像參數集(picture parameter set；PPS)或視訊參數集(video parameter set；VPS))中向視訊解碼器300產生語法資料(諸如基於區塊之語法資料、基於圖像之語法資料及基於序列之語法資料)。視訊解碼器300可類似地解碼此語法資料以判定如何解碼對應視訊資料。

以此方式，視訊編碼器200可產生包括經編碼視訊資料(例如，描述圖像至區塊(例如，CU)之分割的語法元素及用於區塊之預測及/或殘餘資訊)之位元串流。最終，視訊解碼器300可接收位元串流並對經編碼視訊資料進行解碼。

一般而言，視訊解碼器300執行與視訊編碼器200所執行之程序互逆的程序，以對位元串流之經編碼視訊資料進行解碼。舉例而言，視訊解碼器300可使用CABAC以與視訊編碼器200之CABAC編碼程序大體上類似但互逆的方式對位元串流之語法元素的值進行解碼。語法元素可定義用於將圖像分割成CTU之分割資訊，及每一CTU根據對應分割結構(諸如QTBT結構)之分割，以定義CTU之CU。語法元素可進一步定義視訊資料之區塊(例如，CU)之預測及殘餘資訊。

殘餘資訊可由例如經量化變換係數表示。視訊解碼器300可反量化及反變換區塊之經量化轉換係數，以再生區塊之殘餘區塊。視訊解碼器300使用經發信預測模式(框內或框間預測)及相關預測資訊(例如，框間預測之運動資訊)以形成區塊之預測區塊。視訊解碼器300可接著(在逐樣本基礎上)使預測區塊與殘餘區塊組合以再生初始區塊。視訊解碼器300可執行額外處理，諸如執行解塊程序以減少沿區塊邊界之視覺假影。

在VVC草案5中，漸進式隨機存取(GRA)圖像定義為具有目標恢復點POC值之發信漸進式隨機存取之開始的圖像，恢復圖像定位於該等圖像處。若解碼器自具有設定為1之NoIncorrectPicOutputFlag的GRA圖像開始解碼程序，則解碼器可解碼但不輸出圖像，直至恢復點圖像將被解碼為止。解碼器可自恢復點圖像起解碼圖像，且輸出恢復點圖像及之後的圖像。目標恢復點圖像可藉由recovery_poc_cnt發信，該recovery_poc_cnt具有帶正負號值並運用se(v)發信。此情形意謂，具有小於當前(curr)GRA pic(GRA_NUT)之POC值的圖像可為恢復點。因此，自恢復點開始且在解碼上向前的所有圖像可被輸出。

當前GRA發信可呈現一或多個難題。作為一個實例，按輸出次序可存在需要被跳過(例如，不輸出/顯示)的數個圖像，此是由於圖像按解碼次序先於恢復點圖像。此情形將導致所顯現圖像中的間隙，其為非所要的。

根據本發明之一或多種技術，與允許按顯示次序先於GRA_NUT圖像的恢復點圖像相對，視訊寫碼器可僅允許POC值等於或大於GRA_NUT圖像之圖像用於恢復圖像。舉例而言，與允許具有小於當前GRA圖像之POC值的恢復點圖像相對，視訊寫碼器可僅允許具有等於或大於當前GRA圖像之POC值的圖像為恢復圖像。

VVC草案5中之現有規範及語義提供如下: 7.3.5 截塊標頭語法 7.3.5.1 通用截塊標頭語法

slice_header( ) {	描述符
slice_pic_parameter_set_id	ue(v)
if( rect_slice_flag \| \| NumBricksInPic ＞ 1 )
slice_address	u(v)
if( !rect_slice_flag && !single_brick_per_slice_flag )
num_bricks_in_slice_minus1	ue(v)
slice_type	ue(v)
if( NalUnitType = = GRA_NUT )
recovery_poc_cnt	se(v)
slice_pic_order_cnt_lsb	u(v)
…

recovery_poc_cnt 按輸出次序指定經解碼圖像之恢復點。若存在CVS中按解碼次序在當前GRA圖像之後且具有等於當前GRA圖像之PicOrderCntVal加上recovery_poc_cnt之值的PicOrderCntVal的圖像picA，則圖像picA被稱作恢復點圖像。否則，具有大於當前圖像之PicOrderCntVal加上recovery_poc_cnt之值的PicOrderCntVal的按輸出次序之第一圖像被稱作恢復點圖像恢復點圖像按解碼次序不應先於當前GRA圖像。recovery_poc_cnt之值應在−MaxPicOrderCntLsb/2至MaxPicOrderCntLsb/2 − 1(包含端點)之範圍內。變數RpPicOrderCntVal導出如下： RpPicOrderCntVal = PicOrderCntVal + recovery_poc_cnt (7-40) 8.1 通用解碼程序 8.1.1 通用對於位元串流中之每一IRAP圖像，應用以下內容： - 若圖像為IDR圖像、位元串流中按解碼次序之第一圖像或者按解碼次序在序列NAL單元結束之後的第一圖像，則變數NoIncorrectPicOutputFlag設定為等於1。 - 否則，若在本規範中未指定之一些外部構件不可用以設定變數HandleCraAsCvsStartFlag為圖像的值，則HandleCraAsCvsStartFlag設定為等於藉由外部構件提供的值，且NoIncorrectPicOutputFlag設定為等於HandleCraAsCvsStartFlag。 - 否則，HandleCraAsCvsStartFlag及NoIncorrectPicOutputFlag皆設定為等於0。對於位元串流中之每一GRA圖像，應用以下內容： - 若當前圖像為按解碼次序位元串流中的第一圖像或按解碼次序在序列NAL單元結束之後的第一圖像，則變數NoIncorrectPicOutputFlag設定為等於1。 - 否則，將NoIncorrectPicOutputFlag設定為等於0。註釋-針對IRAP圖像及GRA圖像兩者之以上操作被需要從而識別位元串流中的CVS。 8.1.2 針對經寫碼圖像的解碼程序對於當前圖像CurrPic，解碼程序如下操作： 1. 在條款8.2中指定NAL單元之解碼。 2. 條款8.3中之程序使用截塊標頭層及以上層之語法元素指定以下解碼程序： - 與圖像次序計數相關之變數及函數如條款8.3.1中所指定導出。此情形需要僅針對圖像之第一截塊來調用。 - 在針對非IDR圖像之每一截塊之解碼程序開始時，針對在條款8.3.2中指定之參考圖像清單構造的解碼程序針對參考圖像清單0 (RefPicList[0])及參考圖像清單1 (RefPicList[1])的導出來調用。 - 條款8.3.3中針對參考圖像標記的解碼程序經予以調用，其中參考圖像可經標記為「未用於參考」或「用於長期參考」。此情形需要僅針對圖像之第一截塊來調用。 - 當當前圖像為具有等於1之NoIncorrectPicOutputFlag的CRA圖像或具有等於1之NoIncorrectPicOutputFlag的GRA圖像時，在子條款8.3.4中指定的用於產生不可用參考圖像的解碼程序經調用，此需要僅針對圖像之第一截塊予以調用。 - PictureOutputFlag設定如下： - 若以下條件中之一者為真，則將PictureOutputFlag設定為0： - 當前圖像為RASL圖像，且相關聯IRAP圖像之NoIncorrectPicOutputFlag等於1。 - gra_enabled_flag等於1，且當前圖像為具有等於1之NoIncorrectPicOutputFlag的GRA圖像。 - gra_enabled_flag 等於1，當前圖像係與具有等於1之NoIncorrectPicOutputFlag的GRA圖像相關聯，且當前圖像之PicOrderCntVal小於關聯GRA圖像的RpPicOrderCntVal。 - 否則，PictureOutputFlag設定成等於1。 3. [版本(YK)：本文中添加解碼程序之調用，針對 4. 在當前圖像之所有截塊已被解碼之後，當前經解碼圖像被標記為「用於短期參考」。當gra_enabled_flag等於1且當前圖像之PicOrderCntVal大於或等於按解碼次序先前GRA圖像的RpPicOrderCntVal(對於該先前GRA圖像，在當前圖像與按解碼次序先前GRA圖像之間不存在IRAP圖像)時，位元串流符合性的要求為，當前及後續經解碼圖像應準確匹配至藉由按解碼次序在當前圖像之前的先前IRAP圖像處起始解碼程序產生的圖像。

如上文所展示，在VVC草案5中，按輸出次序指定經解碼圖像之恢復點的語法元素(亦即，recovery _ poc _ cnt )運用se(v)發信，從而意謂以左側位元為第一者的帶正負號整數0階指數哥倫布寫碼語法元素。

根據本發明之一或多種技術，按輸出次序指定經解碼圖像之恢復點的語法元素(亦即，recovery _ poc _ cnt )之發信可運用ue(v)執行，從而意謂左側位元為第一者之無正負號整數0階指數哥倫布寫碼語法元素。舉例而言，VVC草案5可如下文所展示予以修改。添加以斜體字展示，且刪除運用刪除線展示。 7.3.5 截塊標頭語法 7.3.5.1 通用截塊標頭語法

slice_header( ) {	描述符
slice_pic_parameter_set_id	ue(v)
if( rect_slice_flag \| \| NumBricksInPic ＞ 1 )
slice_address	u(v)
if( !rect_slice_flag && !single_brick_per_slice_flag )
num_bricks_in_slice_minus1	ue(v)
slice_type	ue(v)
if( NalUnitType = = GRA_NUT )
recovery_poc_cnt	se(v)ue(v)
slice_pic_order_cnt_lsb	u(v)
…

recovery_poc_cnt 按輸出次序指定經解碼圖像之恢復點。若存在CVS中按解碼次序在當前GRA圖像之後且具有等於當前GRA圖像之PicOrderCntVal加上recovery_poc_cnt之值的PicOrderCntVal的圖像picA，則圖像picA被稱作恢復點圖像。否則，具有大於當前圖像之PicOrderCntVal加上recovery_poc_cnt之值的PicOrderCntVal的按輸出次序之第一圖像被稱作恢復點圖像恢復點圖像按解碼次序不應先於當前GRA圖像。recovery_poc_cnt之值應在−MaxPicOrderCntLsb / 20 至MaxPicOrderCntLsb/2 − 1(包括端點)之範圍內。變數RpPicOrderCntVal導出如下： RpPicOrderCntVal = PicOrderCntVal + recovery_poc_cnt (7-40)

替代地，recovery_poc_cnt之值應在0至MaxPicOrderCntLsb−1 (包括端點)之範圍內。

本發明提議運用多個GRA圖像修改解碼器行為。舉例而言，若GRA圖像按解碼次序在先前GRA圖像之後、在之前GRA圖像的恢復點之前，則後一GRA圖像且因此其恢復圖像更動控制先前GRA圖像恢復點。換言之，第一GRA圖像之恢復點圖像將不再為有效值(或與GRA_NUT(GRA圖像)相關聯)，該有效值經發信作為恢復點圖像。後一GRA圖像之恢復點圖像將被視為恢復點圖像。類似情況針對按解碼次序發生於GRA圖像與其恢復點圖像之間的IRAP圖像保持。舉例而言，輸出程序將不等待恢復點圖像，實情為輸出程序可自IRAP圖像開始。

在一些實例中，解碼器行為可描述如下。編碼器(例如，視訊編碼器200)可判定編碼IRAP圖像，或在IRAP圖像之按解碼次序的關聯恢復點圖像之前在運用等於1的NoIncorrectPicOutputFlag發信GRA圖像之後起始另一GRA程序。在此情況下，本發明提議針對IRAP情況運用IRAP圖像之PicOrderCntVal且運用PicOrderCntVal+recovery_poc_cnt替換解碼程序的RpPicOrderCntVal，其中PicOrderCntVal及recovery_poc_cnt為新GRA圖像的PicOrderCntVal及recovery_poc_cnt，且設定NoIncorrectPicOutputFlag等於1。舉例而言，視訊解碼器(例如，視訊解碼器300)可處置具有等於1之NoIncorrectPicOutputFlag之GRA圖像、RpPicOrderCntVal為有效的，直至IRAP或新GRA_NUT或其關聯恢復點圖像(或更遲POC值)經解碼。

VVC草案5可修改如下(其中添加以斜體字 展示)：8.1 通用解碼程序8.1.1 通用 …. 對於位元串流中之每一GRA圖像，應用以下內容： - 若當前圖像為按解碼次序位元串流中的第一圖像或按解碼次序在序列NAL單元結束之後的第一圖像，則變數NoIncorrectPicOutputFlag設定為等於1。 –若當前圖像按解碼次序是在 NoIncorrectPicOutputFlag 等於 1 之先前 GRA 圖像的 RpPicOrderCntVal 之前， 則變數 NoIncorrectPicOutputFlag 設定為等於 1 。 - 否則，將NoIncorrectPicOutputFlag設定為等於0。註釋-針對IRAP圖像及GRA圖像兩者之以上操作被需要從而識別位元串流中的CVS。

如上文所論述，視訊解碼器可處置具有等於1之NoIncorrectPicOutputFlag之GRA圖像的RpPicOrderCntVal為有效值，直至IRAP或新GRA_NUT或其關聯恢復點圖像(或更遲POC值)經解碼。

如上文所論述，恢復圖像可為作為圖像經發信的圖像，在該圖像處，每一事項將自經發信之恢復點的點(recovery_poc_cnt)起再新(恢復)。藉由發信非負恢復poc cnt，本發明可消除恢復點按輸出次序在當前經解碼圖像(亦即，恢復poc poc經發信的圖像)之前發信的情況，且存在在恢復圖像之後以輸出次序在當前圖像之前解碼的圖像。因為按輸出次序在恢復之後的此等圖像將為不可顯示的(未經正確地解碼)，所以解碼器可必須跨過此等圖像，且顯現將於顯示恢復圖像之後按解碼次序在恢復圖像之後出現的圖像。

以下實例說明本發明之技術的一些優勢：解碼次序：PX:X為輸出次序。 ….P8 P9P10 (發信P7為相對於10的恢復點，其為負3)P7 P11 P12….. 輸出次序：(帶下劃線圖像將不被顯示，P7 與 P11 之間的間隙 ( 非平滑播放 ) 。 ….P7P8 P9 P10 P11 P12…..

藉由發信具有非負值的恢復poc cnt，本發明之技術達成以下結果：解碼次序：PX:X為輸出次序。 ….P8 P9P10 (發信P14作為相對於10的恢復點，其為正4) P11 P12 P13 P14….. 輸出次序：(帶下劃線圖像將不予顯示，在 P14 之後無間隙 ( 平滑播放 ) 。 ….P10 P11 P12 P13 P14 P15 P16….

根據本發明之技術，視訊寫碼器(例如，視訊編碼器200及/或視訊解碼器300)可經由經寫碼視訊位元串流且針對當前圖像對指定目標恢復點圖像的語法元素進行寫碼，其中目標恢復點圖像按顯示次序定位於當前圖像處或之後。如上文所論述，藉由約束目標恢復點圖像為按顯示次序定位於當前圖像處或之後，視訊寫碼器可避免所顯現圖像中的間隙。另外，在語法元素使用無正負號程式碼寫碼的實例中，此修改可導致位元速率減小，此是由於無正負號值相較於帶正負號值通常需要較少位元來寫碼。

本發明通常可指「發信」某些資訊，諸如語法元素。術語「發信」大體上可指用於解碼經編碼視訊資料之語法元素及/或其他資料的值之傳達。亦即，視訊編碼器200可於位元串流中發信語法元素的值。一般而言，發信指在位元串流中產生值。如上文所指出，源裝置102可實質上即時地將位元串流輸送至目的地裝置116，或不即時輸送，諸如可在將語法元素儲存至儲存裝置112以供目的地裝置116稍後擷取時發生。

圖2A及圖2B為說明實例四分樹二元樹(QTBT)結構130及對應寫碼樹型單元(CTU) 132之概念圖。實線表示四分樹分裂，且點線指示二元樹分裂。在二元樹之各分裂(亦即，非葉)節點中，一個旗標經發信以指示使用哪一分裂類型(亦即，水平或豎直)，其中在此實例中，0指示水平分裂且1指示豎直分裂。對於四分樹分裂，不存在對於指示分裂類型之需要，此係由於四分樹節點將區塊水平地及豎直地分裂成具有相等大小之4個子區塊。因此，視訊編碼器200可編碼且視訊解碼器300可解碼用於QTBT結構130之區樹層級(亦即，實線)的語法元素(諸如分裂資訊)及用於QTBT結構130之預測樹層級(亦即，虛線)的語法元素(諸如分裂資訊)。視訊編碼器200可編碼，且視訊解碼器300可解碼用於由QTBT結構130之端葉節點表示之CU的視訊資料(諸如，預測及變換資料)。

一般而言，圖2B之CTU 132可與定義對應於在第一層級及第二層級處的QTBT結構130之節點的區塊之大小的參數相關聯。此等參數可包括CTU大小(表示樣本中之CTU 132之大小)、最小四分樹大小(MinQTSize，表示最小允許四分樹葉節點大小)、最大二元樹大小(MaxBTSize，表示最大允許二元樹根節點大小)、最大二元樹深度(MaxBTDepth，表示最大允許二元樹深度)，及最小二元樹大小(MinBTSize，表示最小允許二元樹葉節點大小)。

QTBT結構中對應於CTU之根節點可具有在QTBT結構之第一層級處的四個子節點，該等節點中之每一者可根據四分樹分割來進行分割。亦即，第一層級之節點為葉節點(不具有子節點)或具有四個子節點。QTBT結構130之實例表示諸如包括具有用於分枝之實線之父節點及子節點的節點。若第一層級之節點不大於最大允許二元樹根節點大小(MaxBTSize)，則該等節點可藉由各別二元樹進一步分割。一個節點之二元樹分裂可反覆，直至由分裂產生之節點達到最小允許二元樹葉節點大小(MinBTSize)或最大允許二元樹深度(MaxBTDepth)為止。QTBT結構130之實例表示諸如具有用於分枝之虛線的節點。二元樹葉節點被稱為寫碼單元(CU)，其用於預測(例如，圖像內或圖像間預測)及變換而無需任何進一步分割。如上文所論述，CU亦可稱為「視訊區塊」或「區塊」。

在QTBT分割結構之一個實例中，CTU大小經設定為128×128 (明度樣本及兩個對應64×64色度樣本)，MinQTSize經設定為16×16，MaxBTSize經設定為64×64，MinBTSize (對於寬度及高度兩者)經設定為4，且MaxBTDepth經設定為4。四分樹分割首先應用於CTU以產生四分樹葉節點。四分樹葉節點可具有16×16 (亦即，MinQTSize)至128×128 (亦即，CTU大小)之大小。若葉四分樹節點為128×128，則其將不會藉由二元樹進一步分裂，此係由於大小超過MaxBTSize (亦即，在此實例中64×64)。否則，葉四元樹節點將由二元樹進一步分割。因此，四分樹葉節點亦為二元樹之根節點且具有為0之二元樹深度。當二元樹深度達到MaxBTDepth (在此實例中為4)時，不准許進一步分裂。當二元樹節點具有等於MinBTSize (在此實例中為4)之寬度時，其意指不准許進一步水平分裂。類似地，具有等於MinBTSize之高度的二元樹節點意指不准許對該二元樹節點進行進一步豎直分裂。如上文所提及，二元樹之葉節點被稱作CU，且根據預測及變換來進一步處理而不進一步分割。

圖3為說明可執行本發明之技術的實例視訊編碼器200之方塊圖。出於解釋之目的而提供圖3，且不應將該圖視為對如本發明中廣泛例示及描述之技術的限制。出於解釋之目的，本發明在諸如HEVC視訊寫碼標準及研發中之H.266視訊寫碼標準的視訊寫碼標準之情形下描述視訊編碼器200。然而，本發明之技術並不限於此等視訊寫碼標準，且通常適用於視訊編碼及解碼。

在圖3之實例中，視訊編碼器200包括視訊資料記憶體230、模式選擇單元202、殘餘產生單元204、變換處理單元206、量化單元208、反量化單元210、反變換處理單元212、重建構單元214、濾波器單元216、經解碼圖像緩衝器(decoded picture buffer；DPB) 218及熵編碼單元220。視訊資料記憶體230、模式選擇單元202、殘餘產生單元204、變換處理單元206、量化單元208、反量化單元210、反變換處理單元212、重建構單元214、濾波器單元216、DPB 218及熵編碼單元220中之任一者或全部可實施於一或多個處理器或處理電路中。此外，視訊編碼器200可包括額外或替代處理器或處理電路以執行此等及其他功能。

視訊資料記憶體230可儲存待由視訊編碼器200之組件編碼之視訊資料。視訊編碼器200可自(例如)視訊源104 (圖1)接收儲存於視訊資料記憶體230中之視訊資料。DPB 218可充當參考圖像記憶體，其儲存參考視訊資料以供視訊編碼器200用於預測後續視訊資料。視訊資料記憶體230及DPB 218可由多種記憶體裝置中之任一者形成，該等記憶體裝置是諸如動態隨機存取記憶體(DRAM)，包括同步DRAM (SDRAM)、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體裝置。視訊資料記憶體230及DPB 218可由同一記憶體裝置或單獨的記憶體裝置提供。在各種實例中，視訊資料記憶體230可與視訊編碼器200之其他組件一起在晶片上，如所說明，或相對於彼等組件在晶片外。

在本發明中，對視訊資料記憶體230之參考不應解譯為將記憶體限於在視訊編碼器200內部(除非特定地如此描述)，或將記憶體限於在視訊編碼器200外部(除非特定地如此描述)。實際上，對視訊資料記憶體230之參考應理解為對儲存視訊編碼器200接收以用於編碼的視訊資料(例如，待被編碼的當前區塊之視訊資料)之記憶體的參考。圖1之記憶體106亦可提供對來自視訊編碼器200之各種單元的輸出的暫時儲存。

圖3的各種單元經說明以輔助理解藉由視訊編碼器200執行的操作。單元可經實施為固定功能電路、可程式化電路或其組合。固定功能電路係指提供特定功能性，且在可執行之操作上預設定的電路。可程式化電路係指可經程式化以執行各種任務並在可執行之操作中提供靈活功能性的電路。舉例而言，可程式化電路可執行使得可程式化電路以由軟體或韌體之指令定義的方式操作的軟體或韌體。固定功能電路可執行軟體指令(例如，以接收參數或輸出參數)，但固定功能電路執行的操作類型通常為不可變的。在一些實例中，單元中之一或多者可為獨特電路區塊(固定功能或可程式化)，且在一些實例中，一或多個單元可為積體電路。

視訊編碼器200可包括由可程式化電路形成之算術邏輯單元(ALU)、基本功能單元(EFU)、數位電路、類比電路及/或可程式化核心。在視訊編碼器200之操作係使用由可程式化電路執行之軟體執行的實例中，記憶體106 (圖1)可儲存視訊編碼器200接收並執行的軟體之目標程式碼，或視訊編碼器200內之另一記憶體(圖中未示)可儲存此類指令。

視訊資料記憶體230經組態以儲存接收到之視訊資料。視訊編碼器200可自視訊資料記憶體230擷取視訊資料之圖像，並將視訊資料提供至殘餘產生單元204及模式選擇單元202。視訊資料記憶體230中之視訊資料可為待編碼之原始視訊資料。

模式選擇單元202包括運動估計單元222、運動補償單元224及框內預測單元226。模式選擇單元202可包括額外功能單元以根據其他預測模式來執行視訊預測。作為實例，模式選擇單元202可包括調色板單元、區塊內複製單元(其可為運動估計單元222及/或運動補償單元224之部分)、仿射單元、線性模型(LM)單元或其類似者。

模式選擇單元202通常協調多個編碼遍次以測試編碼參數之組合，及用於此等組合之所得速率失真值。編碼參數可包括CTU至CU之分割、用於CU之預測模式、用於CU之殘餘資料的變換類型、用於CU之殘餘資料的量化參數等。模式選擇單元202可最終選擇相比其他所測試組合具有更佳速率-失真值的編碼參數之組合。

視訊編碼器200可將自視訊資料記憶體230擷取之圖像分割成一系列CTU，且將一或多個CTU囊封於截塊內。模式選擇單元202可根據樹型結構，諸如上文所描述之QTBT結構或HEVC之四分樹結構來分割圖像之CTU。如上文所描述，視訊編碼器200可用根據樹型結構分割CTU來形成一或多個CU。此CU通常亦可稱為「視訊區塊」或「區塊」。

一般而言，模式選擇單元202亦控制其組件(例如，運動估計單元222、運動補償單元224及框內預測單元226)以產生當前區塊(例如，當前CU，或在HEVC中，PU及TU之重疊部分)之預測區塊。對於當前區塊之框間預測，運動估計單元222可執行運動搜尋以識別一或多個參考圖像(例如，儲存於DPB 218中之一或多個先前經寫碼圖像)中之一或多個緊密匹配參考區塊。特定而言，運動估計單元222可例如根據絕對差總和(SAD)、平方差總和(SSD)、平均值絕對差(MAD)、均方差(MSD)或類似者來計算表示潛在參考區塊與當前區塊之類似程度的值。運動估計單元222可通常使用當前區塊與所考慮之參考區塊之間的逐樣本差執行此等計算。運動估計單元222可識別具有由此等計算產生之最低值的參考區塊，從而指示最緊密匹配當前區塊之參考區塊。

運動估計單元222可形成一或多個運動向量(motion vectors；MV)，其相對於當前圖像中之當前區塊的位置定義參考圖像中之參考區塊的位置。運動估計單元222接著可將運動向量提供至運動補償單元224。舉例而言，對於單向框間預測，運動估計單元222可提供單個運動向量，而對於雙向框間預測，運動估計單元222可提供兩個運動向量。運動補償單元224接著可使用運動向量來產生預測區塊。舉例而言，運動補償單元224可使用運動向量來擷取參考區塊之資料。作為另一實例，若運動向量具有分率樣本精確度，則運動補償單元224可根據一或多個內插濾波器為預測區塊的值進行內插。此外，對於雙向框間預測，運動補償單元224可擷取用於藉由各別運動向量識別之兩個參考區塊的資料，並例如通過逐樣本平均或加權平均來組合所擷取之資料。

作為另一實例，對於框內預測，或框內預測寫碼，框內預測單元226可自鄰近當前區塊之樣本產生預測區塊。舉例而言，對於定向模式，框內預測單元226一般可在數學上組合相鄰樣本的值，且在橫跨當前區塊之所定義方向上填入此等計算值以產生預測區塊。作為另一實例，對於DC模式，框內預測單元226可計算與當前區塊相鄰之樣本的平均值，且產生預測區塊以針對預測區塊之每一樣本包括此所得平均值。

模式選擇單元202將預測區塊提供至殘餘產生單元204。殘餘產生單元204接收來自視訊資料記憶體230之當前區塊的原始未經編碼版本及來自模式選擇單元202之預測區塊。殘餘產生單元204計算當前區塊與預測區塊之間的逐樣本差。所得逐樣本差定義當前區塊之殘餘區塊。在一些實例中，殘餘產生單元204亦可判定殘餘區塊中之樣本值之間的差，以使用殘餘差分脈碼調變(RDPCM)來產生殘餘區塊。在一些實例中，可使用進行二進位減法之一或多個減法器電路來形成殘餘產生單元204。

在模式選擇單元202將CU分割成PU之實例中，每一PU可與明度預測單元及對應色度預測單元相關聯。視訊編碼器200及視訊解碼器300可支援具有各種大小之PU。如上文所指示，CU之大小可係指CU之明度寫碼區塊的大小，且PU之大小可係指PU之明度預測單元的大小。假定特定CU之大小為2N×2N，則視訊編碼器200可支援用於框內預測的2N×2N或N×N之PU大小，及用於框間預測的2N×2N、2N×N、N×2N、N×N或類似大小之對稱PU大小。視訊編碼器200及視訊解碼器300亦可支援用於框間預測的2N×nU、2N×nD、nL×2N以及nR×2N之PU大小的不對稱分割。

在模式選擇單元未將CU進一步分割成PU的實例中，每一CU可與明度寫碼區塊及對應色度寫碼區塊相關聯。如上，CU之大小可指CU之明度寫碼區塊的大小。視訊編碼器200及視訊解碼器300可支援2N × 2N、2N × N或N × 2N之CU大小。

對於其他視訊寫碼技術，諸如作為一些實例的區塊內複製模式寫碼、仿射模式寫碼及線性模型(LM)模式寫碼，模式選擇單元202經由與寫碼技術相關聯之各別單元產生用於正編碼之當前區塊的預測區塊。在諸如調色板模式寫碼的一些實例中，模式選擇單元202可能不會產生預測區塊，而產生指示基於所選擇之調色板來重建構區塊之方式的語法元素。在此等模式中，模式選擇單元202可將此等語法元素提供至熵編碼單元220以待編碼。

如上文所描述，殘餘產生單元204接收用於當前區塊及對應預測區塊之視訊資料。殘餘產生單元204隨後產生用於當前區塊之殘餘區塊。為產生殘餘區塊，殘餘產生單元204計算預測區塊與當前區塊之間的逐樣本差。

變換處理單元206將一或多個變換應用於殘餘區塊以產生變換係數之區塊(在本文中稱為「變換係數區塊」)。變換處理單元206可將各種變換應用於殘餘區塊以形成變換係數區塊。舉例而言，變換處理單元206可將離散餘弦變換(DCT)、定向變換、Karhunen-Loeve變換(KLT)或概念上類似之變換應用於殘餘區塊。在一些實例中，變換處理單元206可向殘餘區塊執行多個變換，(例如)一級變換及二級變換，諸如旋轉變換。在一些實例中，變換處理單元206不將變換應用於殘餘區塊。

量化單元208可量化變換係數區塊中之變換係數，以產生經量化變換係數區塊。量化單元208可根據與當前區塊相關聯之量化參數(QP)值量化變換係數區塊之變換係數。視訊編碼器200 (例如，經由模式選擇單元202)可藉由調整與CU相關聯之QP值來調整應用於與當前區塊相關聯之變換係數區塊的量化程度。量化可引入資訊之損耗，且因此，經量化變換係數可相比由變換處理單元206產生之原始變換係數具有較低精度。

反量化單元210及反變換處理單元212可將反量化及反變換分別應用於經量化變換係數區塊，以自變換係數區塊重建構殘餘區塊。重建構單元214可基於經重建構殘餘區塊及藉由模式選擇單元202產生之預測區塊，產生對應於當前區塊之經重建構區塊(儘管可能具有一些程度的失真)。舉例而言，重建構單元214可將經重建構殘餘區塊之樣本添加至來自模式選擇單元202產生之預測區塊的對應樣本，以產生經重建構區塊。

濾波器單元216可對經重建構區塊執行一或多個濾波操作。舉例而言，濾波器單元216可執行解區塊操作以沿CU之邊緣減少區塊效應假影。在一些實例中，可跳過濾波器單元216之操作。

視訊編碼器200將重建構區塊儲存於DPB 218中。舉例而言，在不需要濾波器單元216之操作的實例中，重建構單元214可將經重建構區塊儲存至DPB 218。在需要濾波器單元216之操作的實例中，濾波器單元216可將經濾波經重建構區塊儲存至DPB 218。運動估計單元222及運動補償單元224可自DPB 218擷取由經重建構(及可能經濾波)區塊形成之參考圖像，以對隨後經編碼圖像之區塊進行框間預測。另外，框內預測單元226可使用當前圖像之DPB 218中的經重建構區塊以對當前圖像中之其他區塊進行框內預測。

一般而言，熵編碼單元220可對自視訊編碼器200之其他功能組件接收到的語法元素進行熵編碼。舉例而言，熵編碼單元220可熵編碼來自量化單元208之經量化變換係數區塊。作為另一實例，熵編碼單元220可熵編碼來自模式選擇單元202的預測語法元素(例如，用於框間預測之運動資訊或用於框內預測之框內模式資訊)。熵編碼單元220可對語法元素(其為視訊資料之另一實例)執行一或多個熵編碼操作以產生經熵編碼資料。舉例而言，熵編碼單元220可對資料執行上下文自適應可變長度寫碼(CAVLC)操作、CABAC操作、可變至可變(V2V)長度寫碼操作、以語法為基礎的上下文自適應二進位算術寫碼(SBAC)操作、機率區間分割熵(PIPE)寫碼操作、指數哥倫布編碼(Exponential-Golomb encoding)操作或另一類型之熵編碼操作。在一些實例中，熵編碼單元220可以略過模式操作，其中語法元素未經熵編碼。

視訊編碼器200可輸出位元串流，該位元串流包括重建構截塊或圖像之區塊所需的經熵編碼語法元素。特定而言，熵編碼單元220可輸出該位元串流。

上文所描述之操作相對於區塊進行描述。此描述應理解為用於明度寫碼區塊及/或色度寫碼區塊的操作。如上文所描述，在一些實例中，明度寫碼區塊及色度寫碼區塊為CU之明度及色度分量。在一些實例中，明度寫碼區塊及色度寫碼區塊為PU之明度及色度分量。

在一些實例中，無需針對色度寫碼區塊重複關於明度寫碼區塊執行之操作。作為一個實例，無需重複識別明度寫碼區塊之運動向量(MV)及參考圖像的操作用於識別色度區塊之MV及參考圖像。實情為，明度寫碼區塊之MV可經縮放以判定色度區塊之MV，且參考圖像可為相同的。作為另一實例，框內預測程序可針對明度寫碼區塊及色度寫碼區塊為相同的。

視訊編碼器200表示經組態以對視訊資料進行編碼之裝置的實例，該裝置包括：經組態以儲存視訊資料之記憶體，及一或多個處理單元，該一或多個處理單元實施於電路中且經組態以在經寫碼視訊位元串流中且針對當前圖像編碼指定目標恢復點圖像的語法元素，其中目標恢復點圖像按顯示順序定位於當前圖像處或之後。

圖4為說明可執行本發明之技術之實例視訊解碼器300的方塊圖。出於解釋之目的提供圖4，且其並不限制如本發明中所廣泛例示及描述之技術。出於解釋之目的，本發明根據JEM、VVC及HEVC之技術來描述視訊解碼器300。然而，本發明之技術可由經組態為其他視訊寫碼標準的視訊寫碼裝置執行。

在圖4之實例中，視訊解碼器300包括經寫碼圖像緩衝器(CPB)記憶體320、熵解碼單元302、預測處理單元304、反量化單元306、反變換處理單元308、重建構單元310、濾波器單元312及經解碼圖像緩衝器(DPB)314。CPB記憶體320、熵解碼單元302、預測處理單元304、反量化單元306、反變換處理單元308、重建構單元310、濾波器單元312及DPB 314中任一者或全部可實施於一或多個處理器或處理電路中。此外，視訊解碼器300可包括額外或替代處理器或處理電路以執行此等及其他功能。

預測處理單元304包括運動補償單元316及框內預測單元318。預測處理單元304可包括根據其他預測模式執行預測的額外單元。作為實例，預測處理單元304可包括調色板單元、塊內複製單元(其可形成運動補償單元316之部分)、仿射單元、線性模型(LM)單元或其類似者。在其他實例中，視訊解碼器300可包括更多、更少或不同功能組件。

CPB 記憶體320可儲存待由視訊解碼器300之組件解碼之視訊資料，諸如經編碼視訊位元串流。可(例如)自電腦可讀媒體110 (圖1)獲得儲存於CPB記憶體320中之視訊資料。CPB記憶體320可包括儲存來自經編碼視訊位元串流之經編碼視訊資料(例如，語法元素)的CPB。同樣，CPB記憶體320可儲存除經寫碼圖像之語法元素之外的視訊資料，諸如表示自視訊解碼器300之各種單元之輸出的臨時資料。DPB 314通常儲存經解碼圖像，當對經編碼視訊位元串流之後續資料或圖像進行解碼時，視訊解碼器300可輸出該等經解碼圖像且/或將其用作參考視訊資料。CPB記憶體320及DPB 314可由各種記憶體裝置中之任一者形成，諸如DRAM (包括SDRAM、MRAM、RRAM)或其他類型之記憶體裝置。CPB記憶體320及DPB 314可藉由同一記憶體裝置或獨立記憶體裝置提供。在各種實例中，CPB 記憶體320可與視訊解碼器300之其他組件一起在晶片上，或相對於彼等組件在晶片外。

另外或替代地，在一些實例中，視訊解碼器300可自記憶體120 (圖1)擷取經寫碼視訊資料。亦即，記憶體120可運用CPB記憶體320如上文所論述儲存資料。同樣地，當視訊解碼器300之一些或所有功能性實施於軟體中以由視訊解碼器300之處理電路執行時，記憶體120可儲存待由視訊解碼器300執行之指令。

圖4中所展示之各種單元經說明以輔助理解由視訊解碼器300執行的操作。單元可經實施為固定功能電路、可程式化電路或其組合。類似於圖3，固定功能電路係指提供特定功能性且對可執行之操作進行預設的電路。可程式化電路係指可經程式化以執行各種任務並在可執行之操作中提供靈活功能性的電路。舉例而言，可程式化電路可執行使得可程式化電路以由軟體或韌體之指令定義的方式操作的軟體或韌體。固定功能電路可執行軟體指令(例如，以接收參數或輸出參數)，但固定功能電路執行的操作類型通常為不可變的。在一些實例中，單元中之一或多者可為獨特電路區塊(固定功能或可程式化)，且在一些實例中，一或多個單元可為積體電路。

視訊解碼器300可包括ALU、EFU、數位電路、類比電路及/或由可程式化電路形成之可程式化核心。在視訊解碼器300之操作係由在可程式化電路上執行之軟體執行的實例中，晶片上或晶片外記憶體可儲存視訊解碼器300接收並執行的軟體之指令(例如，目標程式碼)。

熵解碼單元302可自CPB接收經編碼視訊資料且對視訊資料進行熵解碼以再生語法元素。預測處理單元304、反量化單元306、反變換處理單元308、重建構單元310及濾波器單元312可基於自位元串流提取之語法元素產生經解碼視訊資料。

一般而言，視訊解碼器300在逐區塊基礎上重建構圖像。視訊解碼器300可單獨對每一區塊執行重建構操作(其中當前經重建構(亦即經解碼)之區塊可稱為「當前區塊」)。

熵解碼單元302可對定義經量化變換係數區塊之經量化變換係數的語法元素以及諸如量化參數(QP)及/或變換模式指示之變換資訊進行熵解碼。反量化單元306可使用與經量化轉換係數區塊相關聯之QP判定量化程度，且同樣判定反量化程度供反量化單元306應用。反量化單元306可例如執行按位元左移操作以將經量化變換係數反量化。反量化單元306可從而形成包括變換係數之變換係數區塊。

在反量化單元306形成變換係數區塊後，反變換處理單元308可將一或多個反變換應用於變換係數區塊以產生與當前區塊相關聯的殘餘區塊。舉例而言，反變換處理單元308可將反DCT、反整數變換、反Karhunen-Loeve變換(KLT)、反旋轉變換、反定向變換或另一反變換應用於變換係數區塊。

此外，預測處理單元304根據由熵解碼單元302熵解碼之預測資訊語法元素產生預測區塊。舉例而言，若預測資訊語法元素指示當前區塊經框間預測，則運動補償單元316可產生預測區塊。在此情況下，預測資訊語法元素可指示DPB 314中之參考圖像(自其擷取參考區塊)，以及運動向量，其識別參考圖像中之參考區塊相對於當前圖像中之當前區塊之方位的方位。運動補償單元316可大體上以實質上類似於關於運動補償單元224 (圖3)所描述之方式的方式執行框間預測程序。

作為另一實例，若預測資訊語法元素指示當前區塊經框內預測，則框內預測單元318可根據藉由預測資訊語法元素指示之框內預測模式來產生預測區塊。同樣，框內預測單元318通常可以實質上與相對於框內預測單元226 (圖3)所描述之方式類似的方式執行框內預測程序。框內預測單元318可自DPB 314擷取當前區塊之相鄰樣本之資料。

重建構單元310可使用預測區塊及殘餘區塊重建構當前區塊。舉例而言，重建構單元310可將殘餘區塊之樣本添加至預測區塊之對應樣本以重建構當前區塊。

濾波器單元312可對經重建構區塊執行一或多個濾波操作。舉例而言，濾波器單元312可執行解區塊操作以沿經重建構區塊之邊緣減少區塊效應假影。濾波器單元312之操作不一定在所有實例中進行。

視訊解碼器300可將重建構區塊儲存於DPB 314中。如上文所論述，DPB 314可將諸如用於框內預測之當前圖像及用於後續運動補償之先前經解碼圖像之樣本的參考資訊提供至預測處理單元304。此外，視訊解碼器300可輸出來自DPB 314之經解碼圖像用於後續呈現於顯示裝置上，諸如圖1之顯示裝置118。

以此方式，視訊解碼器300表示視訊解碼裝置之實例，該視訊解碼裝置包括經組態以儲存視訊資料之記憶體，及一或多個處理單元，該一或多個處理單元實施於電路中且經組態以：自經寫碼視訊位元串流及針對當前圖像解碼指定目標恢復點圖像的語法元素，其中目標恢復點圖像按顯示次序定位於當前圖像處或之後。類似地，視訊解碼器300表示視訊解碼裝置之實例，該視訊解碼裝置包括經組態以儲存視訊資料之記憶體及一或多個處理單元，該一或多個處理單元實施於電路中且經組態以自經寫碼視訊位元串流解碼具有恢復點的第一漸進式隨機存取(GRA)圖像；自經寫碼視訊位元串流解碼具有恢復點的第二GRA圖像；及回應於判定第二GRA圖像定位於第一GRA圖像與第一GRA圖像之恢復點之間，用第二GRA圖像的恢復點替換第一GRA圖像的恢復點。

圖5為說明用於編碼當前區塊之實例方法的流程圖。當前區塊可包含當前CU。儘管關於視訊編碼器200 (圖1及圖3)加以描述，但應理解，其他裝置可經組態以執行類似於圖5之方法的方法。

在此實例中，視訊編碼器200首先預測當前區塊(350)。舉例而言，視訊編碼器200可形成當前區塊之預測區塊。視訊編碼器200隨後可計算當前區塊之殘餘區塊(352)。為了計算殘餘區塊，視訊編碼器200可計算當前區塊的原始未經編碼區塊與預測區塊之間的差。視訊編碼器200接著可變換並量化殘餘區塊之變換係數(354)。接著，視訊編碼器200可掃描殘餘區塊之經量化變換係數(356)。在掃描期間或在掃描之後，視訊編碼器200可對係數進行熵編碼(358)。舉例而言，視訊編碼器200可使用CAVLC或CABAC來對係數進行編碼。視訊編碼器200隨後可輸出區塊之經熵寫碼資料(360)。

圖6為說明用於解碼視訊資料之當前區塊的實例方法之流程圖。當前區塊可包含當前CU。儘管關於視訊解碼器300 (圖1及圖4)加以描述，但應理解，其他裝置可經組態以執行類似於圖6之方法的方法。

視訊解碼器300可接收當前區塊之經熵寫碼資料，諸如經熵寫碼預測資訊及對應於當前區塊之殘餘區塊的係數之經熵寫碼資料(370)。視訊解碼器300可對經熵寫碼資料進行熵解碼，以判定當前區塊之預測資訊且再生殘餘區塊之係數(372)。視訊解碼器300可如藉由當前區塊之預測資訊所指示例如使用框內或框間預測模式來預測當前區塊(374)，以計算當前區塊的預測區塊。視訊解碼器300接著可反掃描經再生之係數(376)，以產生經量化變換係數之區塊。視訊解碼器300隨後可反量化及反變換係數以產生殘餘區塊(378)。視訊解碼器300最終可藉由組合預測區塊及殘餘區塊來解碼當前區塊(380)。

圖7為根據本發明之一或多項技術的說明用於視訊寫碼中之編碼漸進式隨機存取(GRA)恢復點之實例技術的流程圖。儘管關於視訊編碼器200 (圖1及圖4)加以描述，但應理解，其他裝置可經組態以執行類似於圖7之方法的方法。

視訊編碼器200可判定以在視訊資料之圖像之當前序列中指明隨機存取點。舉例而言，視訊編碼器200可判定以在視訊資料之序列中以規則間隔(例如，每30秒、1分鐘一次等)指明隨機存取點。此外，視訊編碼器200可判定以指明隨機存取點作為對切割成源序列之場景的回應或者作為對快速更新圖像內更新請求的回應。

除指明隨機存取點外，視訊編碼器200可指明恢復點。若隨機存取點與恢復點相同，則隨機存取操作為瞬時的；否則，隨機存取操作為漸進式的。

為了啟用漸進式隨機存取(GRA)，視訊編碼器200可針對當前圖像序列之當前圖像且按顯示次序在當前圖像處或之後選擇目標恢復點圖像(702)。舉例而言，視訊編碼器200之模式選擇單元202可識別目標恢復點圖像的圖像次序計數(POC)值。此所識別之POC值可被稱為recoveryPointPocVal。

視訊編碼器200可在經寫碼視訊位元串流中發信所選擇之目標恢復點圖像的指示。相對於發信所識別之POC值，視訊編碼器200可發信所識別POC值與當前圖像之POC值(PicOrderCntVal)之間的差。舉例而言，視訊編碼器200可根據以下等式判定所識別POC值與當前圖像之POC值之間的差，其中 recovery_poc_cnt = recoveryPointPocVal - PicOrderCntVal 其中recoveryPointPocVal為目標恢復點圖像的POC值，PicOrderCntVal為當前圖像之POC值，且recovery_poc_cnt為目標恢復點圖像之POC值與當前圖像之POC值之間的差。

視訊編碼器200可選擇目標恢復點圖像，使得recovery_poc_cnt之值滿足某些約束。舉例而言，視訊編碼器200可選擇目標恢復點圖像，使得recovery_poc_cnt之值是在零至MaxPicOrderCntLsb (例如，最大圖像次序計數之表示，諸如最大圖像次序計數的最低有效位元)(包含端點)的範圍內。

如上文所論述，視訊編碼器200可發信所識別POC值與當前圖像之POC值之間的差。又如上文所論述，且根據本發明之一或多種技術，視訊編碼器200可使用具有無正負號值的語法元素來發信目標恢復點圖像。舉例而言，模式選擇單元202可使得熵編碼單元220在經寫碼視訊位元串流中且作為以左側位元為第一者之無正負號整數0階指數哥倫布寫碼語法元素編碼語法元素的值，該語法元素的值指定當前圖像序列之當前圖像的目標恢復點圖像(704)。語法元素可命名為recovery _ poc _ cnt 或類似者。

熵編碼單元220可在經寫碼視訊位元串流中藉由當前圖像參考之標頭語法結構中編碼語法元素。舉例而言，熵編碼單元220可在截塊標頭或圖像標頭語法結構中編碼語法元素。

藉由使用具有無正負號值之語法元素發信目標恢復點，視訊編碼器200可消除間隙引入於所顯現圖像之輸出中的非所要情況。另外，使用具有無正負號值之語法元素發信目標恢復點圖像可減小藉由視訊編碼器200使用以發信目標恢復點圖像之資料的量，此舉可改良寫碼效率。

圖8為根據本發明之一或多項技術的說明用於在視訊寫碼中解碼漸進式隨機存取(GRA)恢復點的實例技術之流程圖。儘管關於視訊解碼器300 (圖1及圖4)加以描述，但應理解，其他裝置可經組態以執行類似於圖8之方法的方法。

根據本發明之一或多種技術且如上文所論述，視訊解碼器300可使用具有無正負號值的語法元素來發信目標恢復點圖像。舉例而言，熵解碼單元302可自經寫碼視訊位元串流且作為以左側位元為第一者之無正負號整數0階指數哥倫布寫碼語法元素解碼語法元素的值，該語法元素的值指定當前圖像序列之當前圖像的目標恢復點圖像(802)。目標恢復點圖像按顯示次序可定位於當前圖像處或當前圖像之後。舉例而言，目標恢復點圖像可具有大於或等於當前圖像之POC值的POC值。

熵解碼單元302可自經寫碼視訊位元串流中藉由當前圖像參考之標頭語法結構解碼語法元素。舉例而言，熵解碼單元302可自截塊標頭或圖像標頭語法結構對語法元素進行解碼。

視訊解碼器300可指定，語法元素之值滿足某些約束。舉例而言，視訊解碼器300可驗證，語法元素之值是在零至MaxPicOrderCntLsb(包含端點)的範圍內。

藉由使用具有無正負號值之語法元素發信目標恢復點圖像，視訊解碼器300可消除間隙引入於所顯現圖像之輸出中的非所要情形。另外，使用具有無正負號值之語法元素發信目標恢復點圖像可減小藉由視訊解碼器300使用以發信目標恢復點圖像的資料量，此可改良寫碼效率。

視訊解碼器300可在目標恢復點圖像處恢復當前圖像序列的解碼(804)。舉例而言，回應於接收到指示搜尋操作之所請求目的地的使用者輸入，視訊解碼器300可識別最靠近於搜尋操作之所請求目的地的隨機存取點，且在目標恢復點圖像處開始或重新開始圖像序列的解碼。

以下編號實例可說明本發明之一或多個態樣：

實例1。一種對視訊資料進行寫碼之方法，該方法包含：經由一經寫碼視訊位元串流且針對一當前圖像對指定一目標恢復點圖像的一語法元素進行寫碼，其中該目標恢復點圖像按顯示次序定位於該當前圖像處或之後；及基於該語法元素對該當前圖像進行寫碼。

實例2。如請求項1之方法，其中對該語法元素進行寫碼包含使用一無正負號程式碼對該語法元素進行寫碼。

實例3。如請求項2之方法，其中使用該無正負號程式碼對該語法元素進行寫碼包含對該語法元素進行寫碼作為以左側位元為第一者的一無正負號0階指數哥倫布寫碼語法元素。

實例4。如請求項1至3中任一項之方法，其中該語法元素為一recovery_poc_cnt語法元素。

實例5。一種對視訊資料進行寫碼之方法，該方法包含：自一經寫碼視訊位元串流獲得針對具有一恢復點圖像之一第一漸進式隨機存取(GRA)圖像的資訊；自該經寫碼視訊位元串流獲得具有一恢復點圖像之一第二GRA圖像的資訊；及回應於判定該第二GRA圖像定位於該第一GRA圖像與該第一GRA圖像之恢復點圖像之間，用第二GRA圖像之恢復點圖像替換第一GRA圖像的恢復點圖像。

實例6。如請求項5之方法，其進一步包含：判定第一GRA圖像之恢復點圖像為有效的，直至解碼第二GRA圖像或第二GRA圖像之恢復點圖像。

實例7。如請求項5或請求項6之方法，其進一步包含：判定第一GRA圖像之恢復點圖像為有效的，直至解碼框內隨機存取點(IRAP)圖像。

實例8。如請求項5至7中任一項之方法，其中第一GRA圖像之恢復點圖像藉由第一RpPicOrderCntVal變數指定，其中第二GRA圖像之恢復點圖像藉由第二RpPicOrderCntVal變數指定。

實例9。如請求項8之方法，其中用第二GRA圖像之恢復點圖像替換第一GRA圖像的恢復點圖像包含用第二RpPicOrderCntVal變數之值替換第一RpPicOrderCntVal變數的值。

實例10。如請求項1至9中任一項之方法，其中寫碼包含解碼。

實例11。如請求項1至10中任一項之方法，其中寫碼包含編碼。

實例12。一種用於對視訊資料進行寫碼之裝置，該裝置包含用於執行請求項1至11中任一項之方法的一或多個構件。

實例13。如請求項12之裝置，其中該一或多個構件包含以電路實施之一或多個處理器。

實例14。如請求項12及13中任一項之裝置，其進一步包含用以儲存視訊資料的記憶體。

實例15。如請求項12至14中任一項之裝置，其進一步包含經組態以顯示經解碼視訊資料的顯示器。

實例16。如請求項12至15中任一項之裝置，其中該裝置包含以下各者中之一或多者：一攝影機、一電腦、一行動裝置、一廣播接收器裝置或一機上盒。

實例17。如請求項12至16中任一項之裝置，其中裝置包含一視訊解碼器。

實例18。如請求項12至17中任一項之裝置，其中裝置包含一視訊編碼器。

實例19。一種上面儲存有指令的電腦可讀儲存媒體，該等指令在經執行時使得一或多個處理器執行請求項1至11中任一項的方法。

應認識到，取決於實例，本文中所描述之技術中之任一者的某些動作或事件可以不同序列被執行、可被添加、合併或完全省去(例如，並非所有所描述動作或事件為實踐該等技術所必要)。此外，在某些實例中，可(例如)經由多執行緒處理、中斷處理或多個處理器同時而非依序執行動作或事件。

在一或多個實例中，所描述之功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施，則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體傳輸，且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體，該通信媒體包括例如根據通信協定來促進電腦程式自一處傳送至另一處的任何媒體。以此方式，電腦可讀媒體一般可對應於(1)非暫時性的有形電腦可讀儲存媒體，或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明所描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。

藉由實例而非限制，此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存裝置、快閃記憶體或可用於儲存呈指令或資料結構形式之所要程式碼且可由電腦存取的任何其他媒體。而且，任何連接被恰當地稱為電腦可讀媒體。舉例而言，若使用同軸纜線、光纜、雙絞線、數位用戶線(digital subscriber line；DSL)或無線技術(諸如紅外線、無線電及微波)自網站、伺服器或其他遠端源傳輸指令，則同軸纜線、光纜、雙絞線、DSL或無線技術(諸如紅外線、無線電及微波)包括於媒體之定義中。然而，應理解，電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體，而是係針對非暫時性有形儲存媒體。如本文中所使用，磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟碟及藍光光碟，其中磁碟通常以磁性方式再生資料，而光碟藉由雷射以光學方式再生資料。以上各者之組合亦應包括於電腦可讀媒體之範疇內。

指令可由一或多個處理器執行，該一或多個處理器是諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)或其他等效的整合或離散邏輯電路。因此，如本文中所使用之術語「處理器」及「處理電路」可指上述結構或適用於實施本文中所描述之技術之任何其他結構中的任一者。另外，在一些態樣中，本文所描述之功能可經提供於經組態以供編碼及解碼或併入於經組合編碼解碼器中之專用硬體及/或軟體模組內。又，可在一或多個電路或邏輯元件中充分實施該等技術。

本發明之技術可實施於廣泛多種裝置或設備中，該等裝置或設備包括無線手機、積體電路(IC)或IC之集合(例如，晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之裝置的功能態樣，但未必要求由不同硬體單元來實現。相反地，如上所述，各種單元可與合適的軟體及/或韌體一起組合在編解碼器硬體單元中或由互操作硬體單元之集合提供，硬體單元包括如上文所描述之一或多個處理器。

各種實例已予以描述。此等及其他實例係在以下申請專利範圍之範疇內。

100:實例視訊編碼及解碼系統 102:源裝置 104:視訊源 106:記憶體 108:輸出介面 110:電腦可讀媒體 112:儲存裝置 114:檔案伺服器 116:目的地裝置 118:顯示裝置 120:記憶體 122:輸入介面 130:實例四分樹二元樹(QTBT)結構 132:寫碼樹型單元(CTU) 200:實例視訊編碼器 202:模式選擇單元 204:殘餘產生單元 206:變換處理單元 208:量化單元 210:反量化單元 212:反變換處理單元 214:重建構單元 216:濾波器單元 218:經解碼圖像緩衝器(DPB) 220:熵編碼單元 222:運動估計單元 224:運動補償單元 226:框內預測單元 230:視訊資料記憶體 300:實例視訊解碼器 302:熵解碼單元 304:預測處理單元 306:反量化單元 308:反變換處理單元 310:重建構單元 312:濾波器單元 314:經解碼圖像緩衝器(DPB) 316:運動補償單元 318:框內預測單元 320:經寫碼圖像緩衝器(CPB)記憶體 350:區塊 352:區塊 354:區塊 356:區塊 358:區塊 360:區塊 370:區塊 372:區塊 374:區塊 376:區塊 378:區塊 380:區塊 702:區塊 704:區塊 802:區塊 804:區塊

圖1為說明可執行本發明之技術的實例視訊編碼及解碼系統之方塊圖。

圖2A及圖2B為說明實例四分樹二元樹(QTBT)結構及對應寫碼樹型單元(CTU)之概念圖。

圖3為說明可執行本發明之技術之實例視訊編碼器的方塊圖。

圖4為說明可執行本發明之技術之實例視訊解碼器的方塊圖。

圖5為說明本發明之實例編碼方法的流程圖。

圖6為說明本發明之實例解碼方法的流程圖。

圖7為根據本發明之一或多項技術的說明用於視訊寫碼中之編碼漸進式隨機存取(GRA)恢復點之實例技術的流程圖。

圖8為根據本發明之一或多項技術的說明用於在視訊寫碼中解碼漸進式隨機存取(GRA)恢復點的實例技術之流程圖。

802:區塊

804:區塊

Claims

一種對視訊資料進行解碼之方法，該方法包含：自一經寫碼視訊位元串流且作為以左側位元為第一者的一無正負號整數0階指數哥倫布寫碼語法元素解碼一值，該值指定一當前圖像序列之一當前圖像的一目標恢復點圖像，其中該目標恢復點圖像按顯示次序定位於該當前圖像處或之後；及在該目標恢復點圖像處恢復該當前圖像序列的解碼。
如請求項1之方法，其中指定該目標恢復點圖像之該值是在零至MaxPicOrderCntLsb(包含端點)的一範圍內。
如請求項2之方法，其中解碼該值包含自該經寫碼視訊位元串流中藉由該當前圖像參考之一標頭語法結構解碼該語法元素。
如請求項3之方法，其進一步包含：基於指定該目標恢復點圖像的該值及該當前圖像之一圖像次序計數(POC)值判定該目標恢復點圖像的一POC值。
如請求項3之方法，其中該語法元素為一recovery_poc_cnt語法元素。
一種對視訊資料進行編碼之方法，該方法包含：針對一當前圖像序列之一當前圖像且按顯示次序在該當前圖像處或之後選擇一目標恢復點圖像；及在一經寫碼視訊位元串流中且作為以左側位元為第一者的一無正負號整數0階指數哥倫布寫碼語法元素編碼一值，該值指定該當前圖像圖列之該當前圖像的該目標恢復點圖像。
如請求項6之方法，其中指定該目標恢復點圖像之該值是在零至MaxPicOrderCntLsb(包含端點)的一範圍內。
如請求項7之方法，其中編碼該值包含在該經寫碼視訊位元串流中藉由該當前圖像參考之一標頭語法結構中編碼該語法元素。
如請求項8之方法，其中該第一語法元素為一recovery_poc_cnt語法元素。
一種用於對視訊資料進行解碼之裝置，該裝置包括：一記憶體，該記憶體經組態以儲存一經寫碼視訊位元串流的至少一部分；及一或多個處理器，其以電路實施且經組態以：自該經寫碼視訊位元串流且作為以左側位元為第一者的一無正負號整數0階指數哥倫布寫碼語法元素解碼一值，該值指定一當前圖像序列之一當前圖像的一目標恢復點圖像，其中該目標恢復點圖像按顯示次序定位於該當前圖像處或之後；及在該目標恢復點圖像處恢復該當前圖像序列的解碼。
如請求項10之方法，其中指定該目標恢復點圖像之該值是在零至MaxPicOrderCntLsb(包含端點)的一範圍內。
如請求項11之裝置，其中解碼該值包含自該經寫碼視訊位元串流中藉由該當前圖像參考之一標頭語法結構解碼該語法元素。
如請求項12之裝置，其進一步包含：基於指定該目標恢復點圖像的該值及該當前圖像之一圖像次序計數(POC)值判定該目標恢復點圖像的一POC值。
如請求項12之裝置，其中該語法元素為一recovery_poc_cnt語法元素。
如請求項10之裝置，其進一步包含一顯示器，該一或多個處理器進一步經組態以自該當前圖像序列輸出經解碼圖像以供顯示於該顯示器處。
一種用於對視訊資料進行編碼之裝置，該裝置包含：一記憶體，該記憶體經組態以儲存一經寫碼視訊位元串流的至少一部分；及一或多個處理器，其以電路實施且經組態以：針對一當前圖像序列之一當前圖像且按顯示次序在該當前圖像處或之後選擇一目標恢復點圖像；及在該經寫碼視訊位元串流中且作為以左側位元為第一者的一無正負號整數0階指數哥倫布寫碼語法元素編碼一值，該值指定該當前圖像序列之該當前圖像的該目標恢復點圖像。
如請求項16之裝置，其中：指定該目標恢復點圖像之該值是在零至MaxPicOrderCntLsb(包含端點)的一範圍內，且為了編碼該值，該一或多個處理器經組態以在該經寫碼視訊位元串流中藉由該當前圖像參考之一標頭語法結構中編碼該語法元素。
一種儲存有指令之電腦可讀儲存媒體，該等指令在由一視訊解碼器之一或多個處理器執行時使得該一或多個處理器進行以下操作：自一經寫碼視訊位元串流且作為以左側位元為第一者的一無正負號整數0階指數哥倫布寫碼語法元素解碼一值，該值指定一當前圖像序列之一當前圖像的一目標恢復點圖像，其中該目標恢復點圖像按顯示次序定位於該當前圖像處或之後；及在該目標恢復點圖像處恢復該當前圖像序列的解碼。
如請求項18之電腦可讀儲存媒體，其中：指定該目標恢復點圖像之該值是在零至MaxPicOrderCntLsb(包含端點)的一範圍內，且使得該一或多個處理器對該值進行解碼的該等指令包含使得該一或多個處理器自該經寫碼視訊位元串流中藉由該當前圖像參考之一標頭語法結構解碼該語法元素之指令。
如請求項19之電腦可讀儲存媒體，其進一步包含使得該一或多個處理器進行以下操作的指令：基於指定該目標恢復點圖像的該值及該當前圖像之一圖像次序計數(POC)值判定該目標恢復點圖像的一POC值。