TW202241134A - 用於視頻譯碼的圖片方位和品質度量補充增強資訊訊息 - Google Patents
用於視頻譯碼的圖片方位和品質度量補充增強資訊訊息 Download PDFInfo
- Publication number
- TW202241134A TW202241134A TW111108836A TW111108836A TW202241134A TW 202241134 A TW202241134 A TW 202241134A TW 111108836 A TW111108836 A TW 111108836A TW 111108836 A TW111108836 A TW 111108836A TW 202241134 A TW202241134 A TW 202241134A
- Authority
- TW
- Taiwan
- Prior art keywords
- quality metric
- picture
- syntax element
- video
- psnr
- Prior art date
Links
- 238000013442 quality metrics Methods 0.000 title claims abstract description 446
- 230000000153 supplemental effect Effects 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 claims description 171
- 230000015654 memory Effects 0.000 claims description 66
- 238000012545 processing Methods 0.000 claims description 57
- 238000003860 storage Methods 0.000 claims description 50
- 230000008569 process Effects 0.000 claims description 27
- 238000004891 communication Methods 0.000 claims description 21
- 238000012805 post-processing Methods 0.000 claims description 18
- 230000009466 transformation Effects 0.000 description 58
- 238000013139 quantization Methods 0.000 description 33
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 31
- 241000023320 Luma <angiosperm> Species 0.000 description 29
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 29
- 238000006243 chemical reaction Methods 0.000 description 23
- 239000013598 vector Substances 0.000 description 22
- 238000005192 partition Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 17
- 238000000638 solvent extraction Methods 0.000 description 16
- 239000000470 constituent Substances 0.000 description 15
- 239000000463 material Substances 0.000 description 15
- 238000000844 transformation Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 12
- 238000007667 floating Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 8
- 238000012856 packing Methods 0.000 description 7
- 239000000872 buffer Substances 0.000 description 6
- 238000013500 data storage Methods 0.000 description 6
- 230000011664 signaling Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 239000011449 brick Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000002688 persistence Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/89—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
視頻編碼器和視頻解碼器被配置為補充增強資訊(SEI)訊息。SEI訊息可以包括指示可以如何旋轉圖片和/或對圖片進行鏡像的圖片方位轉換類型語法元素。SEI訊息還可以包括品質度量。
Description
本申請主張享有於2021年4月2日提交的、編號為63/170,267的美國臨時申請的權益,以及於2021年6月24日提交的、編號為63/214,378的美國暫時申請的權益,上述申請中的每個申請的全部內容透過引用的方式併入本文中。
本公開內容涉及視頻編碼和視頻解碼。
數位視頻能力可以被合併到廣泛範圍的設備中,該廣泛範圍的設備包括數位電視機、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型計算機或桌上型計算機、平板計算機、電子書閱讀器、數位相機、數位記錄設備、數位媒體播放器、視頻遊戲設備、視頻遊戲機、蜂巢式或衛星無線電話、所謂的“智慧型電話”、視頻電話會議設備、視頻串流式傳輸設備等。數位視頻設備實現視頻譯碼(coding)技術(諸如在透過MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第十部分(進階視頻譯碼(AVC))、ITU-T H.265/高效率視頻譯碼(HEVC)、ITU-T H.266/通用視頻譯碼(VVC)定義的標準以及這樣的標準的擴展中描述的那些技術)以及專有視頻編解碼器/格式(諸如由開放媒體聯盟開發的AOMedia視頻1(AV1))。透過實現這樣的視頻譯碼技術,視頻設備可以更高效地發送、接收、編碼、解碼和/或儲存數位視頻資訊。
視頻譯碼技術包括空間(圖片內(intra-picture))預測和/或時間(圖片間(inter-picture))預測以減少或去除在視頻序列中固有的冗餘。對於基於區塊的視頻譯碼,視頻切片(例如,視頻圖片或視頻圖片的一部分)可以被分割為視頻區塊,該視頻區塊還可以被稱為譯碼樹單元(CTU)、譯碼單元(CU)和/或譯碼節點。在圖片的經幀內譯碼(I)的切片中的視頻區塊是使用相對於在相同圖片中的相鄰區塊中的參考樣本的空間預測來編碼的。在圖片的經幀間譯碼(P或B)的切片中的視頻區塊可以使用相對於在相同圖片中的相鄰區塊中的參考樣本的空間預測或者相對於在其它參考圖片中的參考樣本的時間預測。圖片可以被稱為幀,以及參考圖片可以被稱為參考幀。
概括而言,本公開內容描述用於對視頻資料進行譯碼的技術。具體而言,本公開內容描述用於對訊息(例如,補充增強資訊(SEI)訊息和/或其它分封化結構)進行編碼和解碼的技術,該訊息包括輔助處理(例如,解碼、顯示等)視頻資料的元資料。本公開內容的訊息可以包括語法元素,該語法元素指示圖片的方位和/或要應用於經解碼的圖片的轉換,該轉換可以用於將經解碼的圖片旋轉和/或鏡像到期望的方位。語法元素可以指示用於顯示的整個圖片或組成圖片(例如,左視圖和右視圖立體圖片)的轉換。在另一示例中,該訊息可以包括指示圖片品質度量的語法元素。圖片品質度量可以指示圖片的編碼品質,諸如基於品質的視域切換和基於品質的度量測量。
視頻解碼器或其它設備可以對訊息進行解碼,並且根據訊息來處理視頻資料的圖片。圖片方位訊息可以用於向視頻解碼器提供關於要應用於經解碼的圖片的推薦方位轉換的指令。以這種方式,對經解碼的圖片的顯示可以以更合適的方位來示出。視頻解碼器可以在對經解碼的圖片的後處理中使用品質度量,和/或可以使用品質度量來選擇更高品質的圖片以用於幀間預測。
在一個示例中,本公開內容描述一種處理視頻資料的方法,該方法包括:接收圖片;以及對包括轉換類型語法元素的圖片方位訊息進行譯碼,其中,該轉換類型語法元素指示來自在多個轉換當中的要應用於圖片的一轉換。
在另一示例中,本公開內容描述一種被配置為處理視頻資料的裝置,該裝置包括:被配置為儲存圖片的記憶體;以及在電路中實現並且與該記憶體相通信的一個或多個處理器,該一個或多個處理器被配置為:接收圖片;以及對包括轉換類型語法元素的圖片方位訊息進行譯碼,其中,該轉換類型語法元素指示來自在多個轉換當中的要應用於圖片的一轉換。
在另一示例中,本公開內容描述一種被配置為處理視頻資料的裝置,該裝置包括:用於接收圖片的構件;以及用於對包括轉換類型語法元素的圖片方位訊息進行譯碼的構件,其中,該轉換類型語法元素指示來自在多個轉換當中的要應用於圖片的一轉換。
在另一示例中,本公開內容描述一種儲存指令的非暫時性計算機可讀儲存媒體,該指令當被執行時使得被配置為處理視頻資料的設備的一個或多個處理器進行以下操作:接收圖片;以及對包括轉換類型語法元素的圖片方位訊息進行譯碼,其中,該轉換類型語法元素指示來自在多個轉換當中的要應用於圖片的一轉換。
在另一示例中,本公開內容描述一種處理視頻資料的方法,該方法包括:接收圖片;以及對包括品質度量語法元素的品質度量訊息進行譯碼,其中,該品質度量語法元素指示與圖片相關的品質度量的值。
在另一示例中,本公開內容描述一種被配置為處理視頻資料的裝置,該裝置包括:被配置為儲存圖片的記憶體;以及在電路中實現並且與該記憶體相通信的一個或多個處理器,該一個或多個處理器被配置為:接收圖片;以及對包括品質度量語法元素的品質度量訊息進行譯碼,其中,該品質度量語法元素指示與圖片相關的品質度量的值。
在另一示例中,本公開內容描述一種被配置為處理視頻資料的裝置,該裝置包括:用於接收圖片的構件;以及用於對包括品質度量語法元素的品質度量訊息進行譯碼的構件,其中,該品質度量語法元素指示與圖片相關的品質度量的值。
在另一示例中,本公開內容描述一種儲存指令的非暫時性計算機可讀儲存媒體,該指令當被執行時使得被配置為處理視頻資料的設備的一個或多個處理器進行以下操作:接收圖片;以及對包括品質度量語法元素的品質度量訊息進行譯碼,其中,該品質度量語法元素指示與圖片相關的品質度量的值。
在圖式和下文的描述中闡述一個或多個示例的細節。根據說明書、圖式和申請專利範圍,其它特徵、對象和優勢將是顯而易見的。
本公開內容描述用於對訊息(例如,補充增強資訊(SEI)訊息和/或其它分封化結構)進行編碼和解碼的技術,該訊息包括輔助處理(例如,解碼、顯示等)視頻資料的元資料。本公開內容的訊息可以包括語法元素,該語法元素指示圖片的方位和/或要應用於經解碼的圖片的轉換,該轉換可以用於將經解碼的圖片旋轉和/或鏡像到期望的方位。語法元素可以指示用於顯示的整個圖片或組成圖片(例如,左視圖和右視圖立體圖片)的轉換。在另一示例中,該訊息可以包括指示圖片品質度量的語法元素。圖片品質度量可以指示圖片的編碼品質,諸如基於品質的視域切換和基於品質的度量測量。
視頻解碼器或其它設備可以對訊息進行解碼,並且根據訊息來處理視頻資料的圖片。圖片方位訊息可以用於向視頻解碼器提供關於要應用於經解碼的圖片的推薦方位轉換的指令。以這種方式,經解碼的圖片的顯示可以是以更合適的方位示出的。視頻解碼器可以在對經解碼的圖片的後處理中使用品質度量,和/或可以使用品質度量來選擇更高品質的圖片以用於幀間預測。
圖1是示出可以執行本公開內容的技術的示例視頻編碼和解碼系統100的方塊圖。概括而言,本公開內容的技術針對對視頻資料進行譯碼(編碼和/或解碼)。通常,視頻資料包括用於處理視頻的任何資料。因此,視頻資料可以包括原始的未經編碼的視頻、經編碼的視頻、經解碼的(例如,經重建的)視頻、以及視頻元資料(諸如信令資料)。
如圖1所示,在該示例中,系統100包括來源設備102,來源設備102提供要被目的地設備116解碼和顯示的經編碼的視頻資料。具體地,來源設備102經由計算機可讀媒體110來將視頻資料提供給目的地設備116。來源設備102和目的地設備116可以包括多種多樣的設備中的任何設備,其包括桌上型計算機、筆記型計算機(即,膝上型計算機)、行動設備、平板計算機、機上盒、電話手機(諸如智慧型電話)、電視機、相機、顯示設備、數位媒體播放器、視頻遊戲機、視頻串流式傳輸設備、廣播接收機設備等。在一些情況下,來源設備102和目的地設備116可以被配備用於無線通信,並且因此可以被稱為無線通信設備。
在圖1的示例中,來源設備102包括視頻來源104、記憶體106、視頻編碼器200和輸出介面108。目的地設備116包括輸入介面122、視頻解碼器300、記憶體120和顯示設備118。根據本公開內容,來源設備102的視頻編碼器200和目的地設備116的視頻解碼器300可以被配置為應用用於SEI訊息譯碼的技術。因此,來源設備102表示視頻編碼設備的示例,而目的地設備116表示視頻解碼設備的示例。在其它示例中,來源設備和目的地設備可以包括其它組件或排列。例如,來源設備102可以從諸如外部相機的外部視頻來源接收視頻資料。同樣,目的地設備116可以與外部顯示設備對接,而不是包括整合的顯示設備。
如在圖1中所示的系統100僅是一個示例。通常,任何數位視頻編碼和/或解碼設備可以執行用於SEI訊息譯碼的技術。來源設備102和目的地設備116僅是這樣的譯碼設備的示例,其中,來源設備102產生經譯碼的視頻資料以用於傳輸給目的地設備116。本公開內容將“譯碼”設備指為執行對資料的譯碼(例如,編碼和/或解碼)的設備。因此,視頻編碼器200和視頻解碼器300分別表示譯碼設備(具體地,視頻編碼器和視頻解碼器)的示例。在一些示例中,來源設備102和目的地設備116可以以基本上對稱的方式進行操作,使得來源設備102和目的地設備116中的每一者包括視頻編碼和解碼組件。因此,系統100可以支援在來源設備102和目的地設備116之間的單向或雙向視頻傳輸,例如,以用於視頻串流式傳輸、視頻回放、視頻廣播或視頻電話。
通常,視頻來源104表示視頻資料(即,原始的未經編碼的視頻資料)的來源,以及將視頻資料的一系列連續的圖片(還被稱為“幀”)提供給視頻編碼器200,視頻編碼器200對用於圖片的資料進行編碼。來源設備102的視頻來源104可以包括視頻擷取設備,諸如攝影機、包含先前擷取的原始視頻的視頻存檔、和/或用於從視頻內容提供者接收視頻的視頻饋送介面。作為另外的替代方式,視頻來源104可以產生基於計算機圖形的資料作為來源視頻,或者產生即時視頻、被存檔的視頻和計算機產生的視頻的組合。在每種情況下,視頻編碼器200可以對被擷取的、預擷取的或計算機產生的視頻資料進行編碼。視頻編碼器200可以將圖片從所接收的次序(有時被稱為“顯示次序”)重新排列為用於譯碼的譯碼次序。視頻編碼器200可以產生包括經編碼的視頻資料的位元流。然後,來源設備102可以經由輸出介面108將經編碼的視頻資料輸出到計算機可讀媒體110上,以用於由例如目的地設備116的輸入介面122進行的接收和/或取回。
來源設備102的記憶體106和目的地設備116的記憶體120表示通用記憶體。在一些示例中,記憶體106、120可以儲存原始的視頻資料,例如,來自視頻來源104的原始視頻以及來自視頻解碼器300的原始的經解碼的視頻資料。另外或替代地,記憶體106、120可以儲存分別由例如視頻編碼器200和視頻解碼器300可執行的軟體指令。儘管記憶體106和記憶體120在該示例中是與視頻編碼器200和視頻解碼器300分開地示出的,但是應當理解的是,視頻編碼器200和視頻解碼器300還可以包括用於功能上類似或等效目的的內部記憶體。此外,記憶體106、120可以儲存例如從視頻編碼器200輸出並且輸入到視頻解碼器300的經編碼的視頻資料。在一些示例中,記憶體106、120的部分可以被分配為一個或多個視頻緩衝器,例如,以儲存原始的經解碼的和/或經編碼的視頻資料。
計算機可讀媒體110可以表示能夠將經編碼的視頻資料從來源設備102傳送給目的地設備116的任何類型的媒體或設備。在一個示例中,計算機可讀媒體110表示通信媒體,其使得來源設備102能夠例如經由射頻網路或基於計算機的網路,來即時地向目的地設備116直接地發送經編碼的視頻資料。根據諸如無線通信協定的通信標準,輸出介面108可以對包括經編碼的視頻資料的傳輸信號進行調變,以及輸入介面122可以對所接收的傳輸信號進行解調。通信媒體可以包括任何無線或有線通信媒體,諸如射頻(RF)頻譜或一個或多個實體傳輸線。通信媒體可以形成諸如以下各項的基於封包的網路的一部分:區域網路、廣域網路、或諸如網際網路的全球網路。通信媒體可以包括路由器、交換機、基地台、或可以有助於促進從來源設備102到目的地設備116的通信的任何其它設備。
在一些示例中,來源設備102可以將經編碼的資料從輸出介面108輸出到儲存設備112。類似地,目的地設備116可以經由輸入介面122從儲存設備112存取經編碼的資料。儲存設備112可以包括各種各樣的分散式或本地存取的資料儲存媒體中的任何一者,諸如硬碟驅動器、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體、或用於儲存經編碼的視頻資料的任何其它適當的數位儲存媒體。
在一些示例中,來源設備102可以將經編碼的視頻資料輸出到檔案伺服器114或者可以儲存由來源設備102產生的經編碼的視頻資料的另一中間儲存設備。目的地設備116可以經由串流式傳輸或下載來從檔案伺服器114存取被儲存的視頻資料。
檔案伺服器114可以是能夠儲存經編碼的視頻資料並且將該經編碼的視頻資料發送給目的地設備116的任何類型的伺服器設備。檔案伺服器114可以表示網頁伺服器(例如,用於網站)、被配置為提供檔案傳輸協定服務(諸如檔案傳輸協定(FTP)或基於單向傳輸的檔案遞送(FLUTE)協定)的伺服器、內容遞送網路(CDN)設備、超文本傳輸協定(HTTP)伺服器、多媒體廣播多播服務(MBMS)或增強型MBMS(eMBMS)伺服器、和/或網路附加儲存(NAS)設備。檔案伺服器114可以另外或替代地實現一個或多個HTTP串流式傳輸協定,諸如基於HTTP的動態自適應串流式傳輸(DASH)、HTTP即時串流式傳輸(HLS)、即時串流式傳輸協定(RTSP)、HTTP動態串流式傳輸等。
目的地設備116可以透過任何標準資料連接(包括網際網路連接)來從檔案伺服器114存取經編碼的視頻資料。這可以包括適於存取在檔案伺服器114上儲存的經編碼的視頻資料的無線信道(例如,Wi-Fi連接)、有線連接(例如,數位用戶線(DSL)、電纜數據機等)、或這兩者的組合。輸入介面122可以被配置為根據以下各項中的任何一項或多項進行操作:上文討論的用於從檔案伺服器114取回或接收媒體資料的各種協定、或者用於取回媒體資料的其它此類協定。
輸出介面108和輸入介面122可以表示無線發射機/接收機、數據機、有線連網組件(例如,乙太網卡)、根據各種IEEE 802.11標準中的任何一種標準進行操作的無線通信組件、或其它實體組件。在輸出介面108和輸入介面122包括無線組件的示例中,輸出介面108和輸入介面122可以被配置為根據蜂巢式通信標準(諸如4G、4G-LTE(長期演進)、改進的LTE、5G等)來傳輸資料(諸如經編碼的視頻資料)。在輸出介面108包括無線發射機的一些示例中,輸出介面108和輸入介面122可以被配置為根據其它無線標準(諸如IEEE 802.11規範、IEEE 802.15規範(例如,ZigBee™)、藍牙™標準等)來傳輸資料(諸如經編碼的視頻資料)。在一些示例中,來源設備102和/或目的地設備116可以包括相應的單晶片系統(SoC)設備。例如,來源設備102可以包括用於執行歸因於視頻編碼器200和/或輸出介面108的功能的SoC設備,並且目的地設備116可以包括用於執行歸因於視頻解碼器300和/或輸入介面122的功能的SoC設備。
本公開內容的技術可以應用於視頻譯碼,以支援各種多媒體應用中的任何一者,諸如空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流式視頻傳輸(諸如基於HTTP的動態自適應串流式傳輸(DASH))、被編碼到資料儲存媒體上的數位視頻、對在資料儲存媒體上儲存的數位視頻的解碼、或其它應用。
目的地設備116的輸入介面122從計算機可讀媒體110(例如,通信媒體、儲存設備112、檔案伺服器114等)接收經編碼的視頻位元流。經編碼的視頻位元流可以包括由視頻編碼器200定義的諸如以下語法元素的信令資訊(其還被視頻解碼器300使用):該語法元素具有描述視頻區塊或其它譯碼單元(例如,切片、圖片、圖片組、序列等)的特性和/或處理的值。顯示設備118將經解碼的視頻資料的經解碼的圖片顯示給用戶。顯示設備118可以表示各種顯示設備中的任何一者,諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器、或另一類型的顯示設備。
儘管在圖1中未示出,但是在一些示例中,視頻編碼器200和視頻解碼器300可以各自與音頻編碼器和/或音頻解碼器整合,並且可以包括適當的MUX-DEMUX單元或其它硬體和/或軟體,以處理包括公共資料串流中的音頻和視頻兩者的經多工的串流。
視頻編碼器200和視頻解碼器300各自可以被實現為各種適當的編碼器和/或解碼器電路中的任何一者,諸如一個或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場域可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體、或其任何組合。當該技術用軟體部分地實現時,設備可以將用於軟體的指令儲存在適當的非暫時性計算機可讀媒體中,並且使用一個或多個處理器在硬體中執行指令以執行本公開內容的技術。視頻編碼器200和視頻解碼器300中的每一者可以被包括在一個或多個編碼器或解碼器中,該一個或多個編碼器或解碼器中的任一者可以被整合為相應設備中的組合編碼器/解碼器(CODEC)的一部分。包括視頻編碼器200和/或視頻解碼器300的設備可以包括積體電路、微處理器、和/或無線通信設備(諸如蜂巢式電話)。
視頻編碼器200和視頻解碼器300可以根據視頻譯碼標準(諸如ITU-T H.265(還被稱為高效率視頻譯碼(HEVC))或對其的擴展(諸如多視圖和/或可縮放視頻譯碼擴展))進行操作。替代地,視頻編碼器200和視頻解碼器300可以根據其它專有或行業標準(諸如ITU-T H.266標準,還被稱為通用視頻譯碼(VVC))進行操作。在其它示例中,視頻編碼器200和視頻解碼器300可以根據專有視頻編解碼器/格式(諸如AOMedia video 1(AV1)、AV1的擴展和/或AV1的後續版本(例如,AV2))進行操作。在其它示例中,視頻編碼器200和視頻解碼器300可以根據其它專有格式或行業標準來操作。然而,本公開內容的技術不限於任何特定的譯碼標準或格式。通常,視頻編碼器200和視頻解碼器300可以被配置為結合使用SEI訊息來決定圖片方位和/或圖片品質度量的任何視頻譯碼技術來執行本公開內容的技術。
通常,視頻編碼器200和視頻解碼器300可以執行對圖片的基於區塊的譯碼。用語“區塊”通常指包括要被處理的(例如,在編碼和/或解碼程序中的被編碼的、被解碼的或以其它方式被使用的)資料的結構。例如,區塊可以包括亮度和/或色度資料的樣本的二維矩陣。通常,視頻編碼器200和視頻解碼器300可以對以YUV(例如,Y、Cb、Cr)格式表示的視頻資料進行譯碼。也就是說,視頻編碼器200和視頻解碼器300可以對亮度分量和色度分量進行譯碼,而不是對用於圖片的樣本的紅色、綠色和藍色(RGB)資料進行譯碼,其中,色度分量可以包括紅色色相色度分量和藍色色相色度分量兩者。在一些示例中,視頻編碼器200在進行編碼之前將所接收的經RGB格式化的資料轉換為YUV表示,並且視頻解碼器300將YUV表示轉換為RGB格式。替代地,預處理和後處理單元(未示出)可以執行這些轉換。
概括而言,本公開內容可以涉及對圖片的譯碼(例如,編碼和解碼)以包括對圖片的資料進行編碼或解碼的程序。類似地,本公開內容可以涉及對圖片的區塊的譯碼以包括對用於區塊的資料進行編碼或解碼的程序(例如,預測和/或殘差譯碼)。經編碼的視頻位元流通常包括用於表示譯碼決策(例如,譯碼模式)以及將圖片分割為區塊的語法元素的一系列值。因此,對圖片或區塊進行譯碼的引用通常應當被理解為對用於形成圖片或區塊的語法元素的值進行譯碼。
HEVC定義各種區塊,其包括譯碼單元(CU)、預測單元(PU)和轉換單元(TU)。根據HEVC,視頻譯碼器(諸如視頻編碼器200)根據四叉樹結構來將譯碼樹單元(CTU)分割為CU。也就是說,視頻譯碼器將CTU和CU分割為四個相等的、不重疊的正方形,並且四叉樹的每個節點具有零個或者四個子節點。沒有子節點的節點可以被稱為“葉節點”,並且這樣的葉節點的CU可以包括一個或多個PU和/或一個或多個TU。視頻譯碼器可以進一步分割PU和TU。例如,在HEVC中,殘差四叉樹(RQT)表示對TU的分割。在HEVC中,PU表示幀間預測資料,而TU表示殘差資料。經幀內預測的CU包括幀內預測資訊,諸如幀內模式指示。
作為另一示例,視頻編碼器200和視頻解碼器300可以被配置為根據VVC進行操作。根據VVC,視頻譯碼器(諸如視頻編碼器200)將圖片分割為多個譯碼樹單元(CTU)。視頻編碼器200可以根據樹結構(諸如四叉樹-二叉樹(QTBT)結構或多類型樹(MTT)結構)來分割CTU。QTBT結構去除多種分割類型的概念,諸如在HEVC的CU、PU和TU之間的分隔。QTBT結構包括兩個級別:根據四叉樹分割而分割的第一級別、以及根據二叉樹分割而分割的第二級別。QTBT結構的根節點對應於CTU。二叉樹的葉節點對應於譯碼單元(CU)。
在MTT分割結構中,可以使用四叉樹(QT)分割、二叉樹(BT)分割以及一種或多種類型的三叉樹(TT)(還被稱為三元樹(TT))分割來對區塊進行分割。三叉樹或三元樹分割是其中區塊被分為三個子區塊的分割。在一些示例中,三叉樹或三元樹分割將區塊劃分為三個子區塊,而不透過中心劃分原始區塊。MTT中的分割類型(例如,QT、BT和TT)可以是對稱的或不對稱的。
當根據AV1編解碼器進行操作時,視頻編碼器200和視頻解碼器300可以被配置為以區塊來對視頻資料進行譯碼。在AV1中,可以處理的最大譯碼區塊被稱為超級區塊。在AV1中,超級區塊可以是128x128個亮度樣本或者64x64 個亮度樣本。然而,在後續視頻譯碼格式(例如,AV2)中,超級區塊可以由不同的(例如,更大的)亮度樣本大小來定義。在一些示例中,超級區塊是區塊四叉樹的頂部級別。視頻編碼器200可以進一步將超級區塊分割為較小的譯碼區塊。視頻編碼器200可以使用正方形或非正方形分割來將超級區塊和其它譯碼區塊分割為較小的區塊。非正方形區塊可以包括N/2xN、NxN/2、N/4xN和NxN/4區塊。視頻編碼器200和視頻解碼器300可以對譯碼區塊中的每一者執行單獨的預測和轉換程序。
AV1還定義視頻資料的瓦片(tile)。瓦片是超級區塊的矩形陣列,其可以獨立於其它瓦片進行譯碼。也就是說,視頻編碼器200和視頻解碼器300可以分別對瓦片內的譯碼區塊進行編碼和解碼,而不使用來自其它瓦片的視頻資料。然而,視頻編碼器200和視頻解碼器300可以跨瓦片邊界來執行濾波。瓦片在大小方面可以是均勻的或不均勻的。基於瓦片的譯碼可以實現用於編碼器和解碼器實現的平行處理和/或多線程。
在一些示例中,視頻編碼器200和視頻解碼器300可以使用單個QTBT或MTT結構來表示亮度分量和色度分量中的每一者,而在其它示例中,視頻編碼器200和視頻解碼器300可以使用兩個或更多個QTBT結構或MTT結構,諸如用於亮度分量的一個QTBT/MTT結構以及用於兩個色度分量的另一個QTBT/MTT結構(或者用於相應色度分量的兩個QTBT/MTT結構)。
視頻編碼器200和視頻解碼器300可以被配置為使用四叉樹分割、QTBT分割、MTT分割、超級區塊分割或其它分割結構。
在一些示例中,CTU包括具有三個樣本陣列的圖片的亮度樣本的譯碼樹區塊(CTB)、色度樣本的兩個對應CTB、或者單色圖片或使用三個單獨的顏色平面來譯碼的圖片的樣本的CTB、以及用於對樣本進行譯碼的語法結構。CTB可以是針對N的某個值的NxN樣本區塊,使得將分量劃分為CTB是一分割。分量是來自以4:2:0、4:2:2或4:4:4顏色格式來構成圖片的三個陣列(亮度和兩個色度)中的一者的陣列或單個樣本、或以單色格式構成圖片的陣列或該陣列的單個樣本。在一些示例中,譯碼區塊是針對M和N的一些值的MxN樣本區塊,使得將CTB劃分為譯碼區塊是一分割。
可以以各種方式在圖片中對區塊(例如,CTU或CU)進行分組。作為一個示例,磚型區(brick)可以指在圖片中的特定瓦片內的CTU行的矩形區域。瓦片可以是在圖片中的特定瓦片列和特定瓦片行內的CTU的矩形區域。瓦片行指CTU的矩形區域,其具有與圖片的高度相等的高度以及由語法元素(例如,諸如在圖片參數集中)指定的寬度。瓦片列指CTU的矩形區域,其具有由語法元素(例如,諸如在圖片參數集中)指定的高度以及與圖片的寬度相等的寬度。
在一些示例中,可以將瓦片分割為多個磚型區,該多個磚型區中的每個磚型區可以包括在瓦片內的一個或多個CTU列。沒有被分割為多個磚型區的瓦片還可以被稱為磚型區。然而,作為瓦片的真實子集的磚型區可以不被稱為瓦片。圖片中的磚型區還可以是以切片來排列的。切片可以是圖片的整數個磚型區,其可以唯一地被包含在單個網路抽象層(NAL)單元中。在一些示例中,切片包括數個完整的瓦片或者僅一個瓦片的連續序列的完整磚型區。
本公開內容可以可互換地使用“NxN”和“N乘N”來指區塊(諸如CU或其它視頻區塊)在垂直維度和水平維度方面的樣本大小,例如,16x16個樣本或16乘16個樣本。通常,16x16 CU在垂直方向上將具有16個樣本(y = 16),並且在水平方向上將具有16個樣本(x = 16)。同樣地,NxN CU通常在垂直方向上具有N個樣本,並且在水平方向上具有N個樣本,其中N表示非負整數值。CU中的樣本可以按行和列來排列。此外,CU不一定需要在水平方向上具有與在垂直方向上相同的數量的樣本。例如,CU可以包括NxM個樣本,其中M不一定等於N。
視頻編碼器200對用於CU的表示預測和/或殘差資訊以及其它資訊的視頻資料進行編碼。預測資訊指示將如何預測CU以便形成用於CU的預測區塊。殘差資訊通常表示在編碼之前的CU的樣本與預測區塊之間的逐樣本差。
為了預測CU,視頻編碼器200通常可以透過幀間預測或幀內預測來形成用於CU的預測區塊。幀間預測通常指根據先前譯碼的圖片的資料來預測CU,而幀內預測通常指根據相同圖片的先前譯碼的資料來預測CU。為了執行幀間預測,視頻編碼器200可以使用一個或多個運動向量來產生預測區塊。視頻編碼器200通常可以執行運動搜索,以識別例如在CU與參考區塊之間的差異方面與CU緊密匹配的參考區塊。視頻編碼器200可以使用絕對差的總和(SAD)、平方差的總和(SSD)、平均絕對差(MAD)、均方差(MSD)、或其它這樣的差計算來計算差度量,以決定參考區塊是否與當前CU緊密匹配。在一些示例中,視頻編碼器200可以使用單向預測或雙向預測來預測當前CU。
VVC的一些示例還提供仿射運動補償模式,其可以被認為是幀間預測模式。在仿射運動補償模式下,視頻編碼器200可以決定表示非平移運動(諸如放大或縮小、旋轉、透視運動或其它不規則的運動類型)的兩個或更多個運動向量。
為了執行幀內預測,視頻編碼器200可以選擇幀內預測模式來產生預測區塊。VVC的一些示例提供六十七個幀內預測模式,其包括各種方向性模式、以及平面模式和DC模式。通常,視頻編碼器200選擇幀內預測模式,幀內預測模式描述與當前區塊(例如,CU的區塊)相鄰的樣本,根據該相鄰的樣本來預測當前區塊的樣本。假定視頻編碼器200以光柵掃描次序(左到右、上到下)對CTU和CU進行譯碼,這樣的樣本通常可以是在與當前區塊相同的圖片中在當前區塊的上方、左上方或左側。
視頻編碼器200對表示用於當前區塊的預測模式的資料進行編碼。例如,對於幀間預測模式,視頻編碼器200可以對表示使用各種可用幀間預測模式中的哪一種預測模式的資料以及用於對應模式的運動資訊進行編碼。對於單向或雙向幀間預測,例如,視頻編碼器200可以使用進階運動向量預測(AMVP)或合併模式來對運動向量進行編碼。視頻編碼器200可以使用類似的模式來對用於仿射運動補償模式的運動向量進行編碼。
AV1包括用於對視頻資料的譯碼區塊進行編碼和解碼的兩個通用技術。這兩個通用技術是幀內預測(例如,幀內預測或空間預測)和幀間預測(例如,幀間預測或時間預測)。在AV1的背景下,當使用幀內預測模式來預測視頻資料的當前幀的區塊時,視頻編碼器200和視頻解碼器300不使用來自視頻資料的其它幀的視頻資料。對於大多數幀內預測模式,視頻編碼器200基於在當前區塊中的樣本值與根據相同幀中的參考樣本產生的預測值之間的差來對當前幀的區塊進行編碼。視頻編碼器200決定基於幀內預測模式根據參考樣本而產生的預測值。
在諸如對區塊的幀內預測或幀間預測的預測之後,視頻編碼器200可以計算用於該區塊的殘差資料。殘差資料(諸如殘差區塊)表示在區塊與用於該區塊的預測區塊之間的逐樣本差,該預測區塊是使用對應的預測模式來形成的。視頻編碼器200可以將一個或多個轉換應用於殘差區塊,以在轉換域中而不是在樣本域中產生經轉換的資料。例如,視頻編碼器200可以將離散餘弦轉換(DCT)、整數轉換、小波轉換或概念上類似的轉換應用於殘差視頻資料。另外,視頻編碼器200可以在第一轉換之後應用二次轉換,諸如模式相關的不可分離二次轉換(MDNSST)、信號相關轉換、Karhunen-Loeve轉換(KLT)等。視頻編碼器200在應用一個或多個轉換之後產生轉換係數。
如上所述,在用於產生轉換係數的任何轉換之後,視頻編碼器200可以執行對轉換係數的量化。量化通常指如下的程序:在該程序中,對轉換係數進行量化以可能地減少用於表示轉換係數的資料量,從而提供進一步的壓縮。透過執行量化程序,視頻編碼器200可以減少與轉換係數中的一些或所有轉換係數相關聯的位元深度。例如,視頻編碼器200可以在量化期間將n位元值向下捨入為m位元值,其中n大於m。在一些示例中,為了執行量化,視頻編碼器200可以執行對要被量化的值的按位右移。
在量化之後,視頻編碼器200可以掃描轉換係數,從而從包括經量化的轉換係數的二維矩陣產生一維向量。掃描可以被設計為將較高能量(並且因此較低頻率)的轉換係數放在向量的前面,並且將較低能量(並且因此較高頻率)的轉換係數放在向量的後面。在一些示例中,視頻編碼器200可以利用預定義的掃描次序來掃描經量化的轉換係數以產生經串列化的向量,並且然後對向量的經量化的轉換係數進行熵編碼。在其它示例中,視頻編碼器200可以執行自適應掃描。在掃描經量化的轉換係數以形成一維向量之後,視頻編碼器200可以例如根據上下文自適應二進制算術譯碼(CABAC)來對一維向量進行熵編碼。視頻編碼器200還可以對用於描述與經編碼的視頻資料相關聯的元資料的語法元素的值進行熵編碼,以供視頻解碼器300在對視頻資料進行解碼時使用。
為了執行CABAC,視頻編碼器200可以將在上下文模型內的上下文指派給要被發送的符號。上下文可以涉及例如符號的相鄰值是否為零值。概率決定可以是基於被指派給符號的上下文的。
視頻編碼器200還可以例如在圖片標頭、區塊標頭、切片標頭中產生去往視頻解碼器300的語法資料(諸如基於區塊的語法資料、基於圖片的語法資料和基於序列的語法資料)、或其它語法資料(諸如序列參數集(SPS)、圖片參數集(PPS)或視頻參數集(VPS))。同樣地,視頻解碼器300可以對此類語法資料進行解碼以決定如何對對應的視頻資料進行解碼。
以這種方式,視頻編碼器200可以產生位元流,其包括經編碼的視頻資料,例如,描述將圖片分割為區塊(例如,CU)以及用於該區塊的預測和/或殘差資訊的語法元素。最終,視頻解碼器300可以接收位元流並且對經編碼的視頻資料進行解碼。
通常,視頻解碼器300執行與由視頻編碼器200執行的程序互反的程序,以對位元流的經編碼的視頻資料進行解碼。例如,視頻解碼器300可以使用CABAC以與視頻編碼器200的CABAC編碼程序基本上類似的、但是互反的方式來對用於位元流的語法元素的值進行解碼。語法元素可以定義用於將圖片分割為CTU、以及根據對應的分割結構(諸如QTBT結構)對每個CTU進行分割以定義CTU的CU的分割資訊。語法元素還可以定義用於視頻資料的區塊(例如,CU)的預測和殘差資訊。
殘差資訊可以由例如經量化的轉換係數來表示。視頻解碼器300可以對區塊的經量化的轉換係數進行逆量化和逆轉換以重新產生用於該區塊的殘差區塊。視頻解碼器300使用經信號通知的預測模式(幀內預測或幀間預測)和相關的預測資訊(例如,用於幀間預測的運動資訊)來形成用於該區塊的預測區塊。視頻解碼器300然後可以對預測區塊和殘差區塊(在逐個樣本的基礎上)進行組合以重新產生原始區塊。視頻解碼器300可以執行額外處理,諸如執行去區塊程序以減少沿著區塊的邊界的視覺偽影。
概括而言,本公開內容可能涉及“用信號通知”某些資訊(諸如語法元素)。用語“用信號通知”通常可以指對用於語法元素的值和/或用於對經編碼的視頻資料進行解碼的其它資料的傳送。也就是說,視頻編碼器200可以在位元流中用信號通知用於語法元素的值。通常,信令指在位元流中產生值。如上所述,來源設備102可以基本上即時地或不即時地(諸如當將語法元素儲存到儲存設備112以供目的地設備116稍後取回時可能發生)將位元流傳輸到目的地設備116。
概括而言,本公開內容描述用於對視頻資料進行譯碼的技術。具體而言,本公開內容描述用於對SEI訊息進行解碼的技術。本公開內容的SEI訊息可以包括指示圖片的方位的語法元素。在另一示例中,SEI訊息可以包括指示圖片品質度量的語法元素。視頻解碼器或其它設備可以對SEI訊息進行解碼,並且根據SEI訊息來處理視頻資料的圖片。
通用補充增強資訊(VSEI)標準(例如,ITU-T H.274和ISO/IEC 23002-7)規定視頻可用性資訊(VUI)訊息以及與VVC位元流一起使用的SEI訊息中的一些SEI訊息。SEI訊息使得視頻編碼器200能夠在位元流中包括元資料,該元資料對於對輸出圖片的樣本值的正確解碼不是必需的,但是可以用於各種其它目的。視頻編碼器200可以被配置為在存取單元中包括任何數量的SEI網路抽象層(NAL)單元,並且每個SEI NAL單元可以包括一個或多個SEI訊息。使用VVC的規範和系統可以指定編碼器來產生特定SEI訊息,或者可以定義對所接收的SEI訊息的特定類型的特定處理。
以下文檔規定顯示方位SEI訊息,以向解碼器(例如,視頻解碼器300)通知被推薦在顯示之前應用於經裁剪的解碼圖片的轉換:ISO/IEC JTC 1/SC 29/WG 11 N 18277,“Information technology — High efficiency coding and media delivery in heterogeneous environments — Part 2: High Efficiency Video Coding”,2019(“HEVC”)。在下面的表1中示出HEVC的顯示方位SEI訊息的語法結構。
表1 顯示方位SEI訊息語法
display_orientation( payloadSize ) { | 描述符 |
display_orientation_cancel_flag | u(1) |
if( !display_orientation_cancel_flag ) { | |
hor_flip | u(1) |
ver_flip | u(1) |
anticlockwise_rotation | u(16) |
display_orientation_persistence_flag | u(1) |
} | |
} |
如在表1中可以看出,HEVC的顯示方位SEI訊息允許對水平翻轉(hor_flip)、垂直翻轉(ver_flip)和逆時針旋轉(anticlockwise_rotation)轉換的指示。
3GPP在以下文檔中規定視頻方位的協調(CVO):技術規範(TS)26.114,“IP Multimedia Subsystem (IMS); Multimedia telephony; Media handling and interaction”,2021。CVO將在發送方側(例如,在來源設備102處)擷取的圖像的當前方位用信號通知給接收機(例如,目的地設備116),以進行適當的渲染和顯示。用於較低旋轉粒度的CVO資訊是以如下格式的字節來攜帶的,以支援水平翻轉和90度旋轉:
位元數量 7 6 5 4 3 2 1 0(LSB)
定義 0 0 0 0 C F R1 R0
LSB代表最低有效位。
用於較高旋轉粒度的CVO資訊是以如下格式的字節來攜帶的:
位元數量 7 6 5 4 3 2 1 0(LSB)
定義 R5 R4 R3 R2 C F R1 R0
VSEI標準的一些當前示例不支援任何方位元資料。HEVC顯示方位SEI訊息不考慮幀封裝情況,其中,旋轉應當應用於每個組成圖片而不是整個圖片。圖2示出經幀封裝的圖片的顯示旋轉的示例,其中,每個組成圖片應當分別被旋轉。如圖2所示,圖片150包括兩個組成圖片(例如,用於立體視頻的左視圖圖片和右視圖圖片)。使用本公開內容的技術,視頻編碼器200可以發送包括轉換類型語法元素的碼和SEI訊息,該轉換類型語法元素指導視頻解碼器300對組成圖片中的每個組成圖片執行旋轉轉換以實現經轉換的圖片152。
示例VSEI按區域封裝(RWP)SEI訊息提供實現將經裁剪的解碼圖片的顏色樣本重新映射到經投影的圖片上的資訊。然而,當全向視頻投影被指示要應用於圖片時,使用RWP SEI訊息。在適用於圖片的譯碼層視頻序列(CLVS)中不應存在具有等於0的rwp_cancel_flag的RWP SEI訊息。
圖片品質度量用於評估圖片品質和譯碼性能。以下文檔規定媒體的定時元資料度量(諸如峰值信雜比(PSNR)、結構相似性索引度量(SSIM)、視頻品質度量(VQM)、以及ISOBMFF(ISO/IEC基本媒體檔案格式)中的平均意見分數(MOS))的攜帶:ISO/IEC 23001-10,“Information technology — MPEG systems technologies — Part 10: Carriage of Timed Metadata Metrics of Media in ISO Base Media File Format”,2015。還在以下文檔中規定圖片品質相關排序以促進品質相關視域切換和沉浸式媒體度量:OMAF,ISO/IEC JTC1/SC29/WG11 N19042,“Text of ISO/IEC DIS 23090-2 2nd edition OMAF”,2020;以及沉浸式媒體度量(IMM),ISO/IEC JTC1/SC29/WG3 N0073,“IS of ISO/IEC 23090-6 Immersive Media Metrics”,2020。一些圖片品質度量(諸如PSNR和SSIM)可以僅在編碼器側獲得。攜帶此類資訊的SEI訊息能夠向系統應用提供相關資訊。
圖片方位SEI訊息
根據本公開內容的一個示例,視頻編碼器200被配置為產生圖片方位SEI訊息並且將其用信號通知,圖片方位SEI訊息包括在下面的表2中所示的一個或多個語法元素。具體而言,視頻編碼器200可以被配置為產生和編碼轉換類型語法元素(例如,por_transform_type),其中,轉換類型語法元素指示來自在多個轉換當中的要應用於圖片的一轉換。視頻編碼器200還可以被配置為產生和編碼在表2中列出的其它語法元素和旗標中的一者或多者。視頻解碼器300可以被配置為接收圖片方位SEI訊息,並且可以根據其中包含的語法元素來處理和/或顯示圖片。例如,視頻解碼器300可以被配置為將由轉換類型語法元素指示的轉換應用於經解碼的圖片。
表2 圖片方位SEI訊息語法
picture_orientation( payloadSize ) { | 描述符 |
por_cancel_flag | u(1) |
if( !por_cancel_flag ) { | |
por_persistence_flag | u(1) |
por _ constituent_picture_matching_flag | u(1) |
por_transform_type | u(5) |
} | |
} |
通常,圖片方位(POR)SEI訊息提供用於向視頻解碼器300通知被推薦在顯示之前應用於經解碼的圖片的轉換的資訊。在一些示例中,經解碼的圖片可以是經裁剪的圖片。
語法元素por_cancel_flag的值等於1指示當前SEI訊息按輸出順序取消任何先前POR SEI訊息的持續性。語法元素por_cancel_flag的值等於0指示隨後是POR資訊。
語法元素por_persistence_flag的值指定用於當前層的POR SEI訊息的持續性。
語法元素por_persistence_flag的值等於0指定POR SEI訊息僅適用於當前經解碼的圖片。
語法元素por_persistence_flag的值等於1指定POR SEI訊息適用於當前經解碼的圖片,並且針對當前層的所有後續圖片按輸出順序持續,直到以下條件中的一個或多個條件為真為止:
– 當前層的新CLV開始。
– 位元流結束。
– 輸出在與POR SEI訊息相關聯的存取單元(AU)中的當前層中的圖片,其按輸出順序跟隨當前圖片。
語法元素por_constituent_picture_matching_flag的值等於1指定該SEI訊息單獨適用於每個組成圖片,並且立體幀封裝格式由幀封裝佈置SEI訊息指示。語法元素por_component_picture_matching_flag的值等於0指定該SEI訊息適用於經裁剪的解碼圖片。
當以下條件中的任一條件為真時,語法元素por_constituent_picture_matching_flag的值應等於0:
– StereoFlag等於0。
– StereoFlag等於1並且fp_arrangement_type等於5。
StereoFlag的值等於0指示不存在適用於圖片的具有等於0的fp_arrangement_cancel_flag的幀封裝佈置SEI訊息。StereoFlag的值等於1指示相關聯的圖片是幀封裝圖片。
語法元素fp_arrangement_type的值等於5指示按輸出順序輸出的經裁剪的解碼圖片的分量平面形成交替的第一和第二組成幀的時間交織。
語法元素por_transform_type的值指定可以應用於圖片的轉換(例如,旋轉、鏡像或旋轉和鏡像的組合)。注意的是,在一些示例中,鏡像可以被稱為翻轉。當由por_transform_type指示的轉換指定旋轉和鏡像兩者時,視頻解碼器300可以被配置為在應用鏡像之前應用旋轉轉換,或者反之亦然。在下面的表3中指定por_transform_type的示例值。在一個示例中,por_transform_type從8到31的值被預留以供ITU-T|ISO/IEC未來使用。
表3 por_transform_type值
值 | 描述 |
0 | 無轉換 |
1 | 水平鏡像 |
2 | 旋轉180度(逆時針) |
3 | 在水平鏡像之前旋轉180度(逆時針) |
4 | 在水平鏡像之前旋轉90度(逆時針) |
5 | 旋轉90度(逆時針) |
6 | 在水平鏡像之前旋轉270度(逆時針) |
7 | 旋轉270度(逆時針) |
8..31 | 預留 |
表3的具體數值僅是一個示例。在其它示例中,可以指定更多或更少的轉換類型。此外,轉換可以按與在表3中所示的順序不同的順序來指定。
圖3是示出示例轉換類型的概念圖。在表3的示例中,當轉換語法元素具有為0的值時,視頻解碼器300可以不應用轉換。圖3示出針對其未應用轉換的原始圖片160。圖3中的其它轉換類型將參照原始圖片160來示出。當轉換語法元素具有為1的值時,視頻解碼器300可以對原始圖片160應用水平鏡像轉換以獲得圖片162。水平鏡像還可以被稱為水平翻轉。當轉換語法元素具有為2的值時,視頻解碼器300可以對原始圖片160應用180度逆時針旋轉轉換以獲得圖片164。當轉換語法元素具有為3的值時,視頻解碼器300可以對原始圖片160應用180度逆時針旋轉轉換,隨後是水平鏡像轉換,以獲得圖片166。
當轉換語法元素具有為4的值時,視頻解碼器300可以對原始圖片160應用90度逆時針旋轉轉換,隨後是水平鏡像轉換,以獲得圖片168。當轉換語法元素具有為5的值時,視頻解碼器300可以對原始圖片160應用90度逆時針旋轉轉換以獲得圖片170。當轉換語法元素具有為6的值時,視頻解碼器300可以對原始圖片160應用270度逆時針旋轉轉換,隨後是水平鏡像轉換,以獲得圖片172。當轉換語法元素具有為7的值時,視頻解碼器300可以對原始圖片160應用270度逆時針旋轉轉換以獲得圖片174。
圖4是示出用於對圖片方位補充增強資訊訊息進行譯碼的示例程序的流程圖。圖4示出本公開內容的編碼和解碼程序兩者。如圖4所示,編碼處理可以由包括視頻編碼器200的來源設備102來執行。解碼程序可以由包括視頻解碼器300的目的地設備116來執行。
在本公開內容的一個示例中,來源設備102可以被配置為接收圖片(400)。來源設備102還可以被配置為(例如,使用視頻編碼器200)對圖片進行編碼並且向目的地設備116發送經編碼的視頻位元流。來源設備102還可以被配置為決定圖片的推薦轉換類型(402)。推薦轉換類型可以是來自在多個轉換類型當中的一轉換類型。來源設備102還可以被配置為對包括轉換類型語法元素的圖片方位訊息進行編碼,其中,該轉換類型語法元素指示來自在多個轉換當中的要應用於圖片的一轉換(404)。
目的地設備116可以被配置為接收圖片(410)。目的地設備116還可以被配置為(例如,使用視頻解碼器300)對圖片進行解碼。目的地設備116還可以對包括轉換類型語法元素的圖片方位訊息進行解碼,其中,該轉換類型語法元素指示來自在多個轉換當中的要應用於圖片的一轉換(412)。目的地設備116還可以被配置為根據轉換類型語法元素來對圖片應用轉換,以形成經轉換的圖片(414),並且顯示經轉換的圖片(416)。
在本公開內容的一個示例中,圖片方位訊息包括圖片方位SEI訊息。在另一示例中,圖片方位訊息包括圖片方位開放位元流單元(OBU)。
如上所述,多個轉換包括旋轉轉換、鏡像轉換或旋轉和鏡像轉換的組合中的兩者或更多者。在更具體的示例中,多個轉換包括:第一轉換,其包括水平鏡像轉換;第二轉換,其包括180度逆時針旋轉轉換;第三轉換,其包括180度逆時針轉換和隨後的水平鏡像轉換;第四轉換,其包括90度逆時針轉換和隨後的水平鏡像轉換;第五轉換,其包括90度逆時針轉換;第六轉換,其包括270度逆時針轉換和隨後的水平鏡像轉換;以及第七轉換,其包括270度逆時針轉換。在另外的示例中,轉換類型語法元素還包括指示將不應用轉換的值。
在一些示例中,視頻編碼器200可以在SEI訊息中用信號通知高粒度的旋轉。高粒度的旋轉和鏡像可以適用於每個組成圖片。通常,高粒度的旋轉可以指示以相對小的間隔旋轉的程度。例如,高粒度的旋轉可以包括以小於90度的角度旋轉圖片。在每個組成圖片可以不同地旋轉的情況下,視頻編碼器200可以在SEI訊息或其它元資料類型中指定單獨的方位轉換類型或高粒度的旋轉,每一者應用於一個組成圖片。
在一些示例中,視頻編碼器200可以在CVO信令中指定組成圖片匹配旗標。組成圖片匹配旗標可以指示應用於每個組成圖片的旋轉粒度。
圖像品質度量SEI訊息
根據本公開內容的另一示例,視頻編碼器200被配置為產生包括在下面的表4中所示的語法元素中的一個或多個語法元素的圖片品質度量訊息(例如,SEI訊息和/或其它分封化結構)並且將其用信號通知。視頻解碼器300被配置為接收圖片品質度量SEI訊息,並且可以根據其中包含的語法元素來處理和/或顯示圖片。例如,目的地設備116和/或視頻解碼器300可以被配置為根據在圖片品質度量SEI訊息中指示的品質度量來對經解碼的圖片應用一個或多個後處理技術。示例後處理技術可以包括基於圖片品質來放大經解碼的圖片。在其它示例中,視頻解碼器300可以被配置為使用品質度量來選擇某些圖片以用於幀間預測。例如,當相同圖片的多個版本可用時,視頻解碼器300可以被配置為選擇具有最高品質度量(例如,最低信雜比)的圖片,以用作幀間預測中的參考圖片。
表4是一個示例圖片品質度量SEI訊息。圖片品質度量SEI訊息提供用於當前經解碼的圖片的每個顏色分量的品質度量。
表4 圖片品質度量SEI訊息語法
Picture_quality_metrics( payloadSize ) { | 描述符 |
pqm_metric_type | u(7) |
pqm_single_component_flag | u(1) |
for( cIdx = 0; cIdx < ( dph_sei_single_component_flag ? 1 : 3 ); cIdx++ ){ | |
if( pqm_sei_type = = 0 ) | |
pqm _ psnr[ cIdx ] | u(16) |
else if ( pqm_sei_type = = 1 ) | |
pqm_ssim[ cIdx ] | u(8) |
else if ( pqm_sei_type == 2 ) | |
pqm_msssim[ cIdx ] | u(8) |
else if ( pqm_sei_type == 3 ) | |
pqm_vqm[ cIdx ] | u(8) |
} | |
} |
語法元素pqm_metric_type的值指示與在表5中指定的分量相關聯的品質度量的類型。pqm_metric_type從4到127的值被預留以供ITU-T | ISO/IEC未來使用,並且在符合本規範的該版本的有效載荷資料中不應存在。
表5 對pqm_metric_type的解釋
pqm_metric_type | 度量 |
0 | PSNR |
1 | SSIM |
2 | MS-SSIM |
3 | VQM |
PSNR品質度量類型為峰值信雜比。SSIM品質度量類型是結構相似性索引。MS-SSIM品質度量是多尺度結構相似性索引。VQM品質度量類型是視頻品質度量。
語法元素pqm_single_component_flag的值等於1指定與圖片品質度量SEI訊息相關聯的圖片包含單個顏色分量。語法元素pqm_ single_component_flag的值等於0指定與圖片品質度量SEI訊息相關聯的圖片包含三個顏色分量。pqm_single_component_flag的值應等於(ChromaFormatIdc = = 0)。
語法元素pqm_psnr[ cIdx ]的值指定PSNR的值。經解碼的圖片的顏色分量cIdx的對應PSNR按如下推導(以浮點表示):
PSNR = pqm_psnr[ cIdx ] / 100;除了對於pqm_psnr[ cIdx ]等於0,PSNR =無窮大以外
語法元素pqm_ssim[ cIdx ]的值指定SSIM的值。經解碼的圖片的顏色分量cIdx的對應SSIM按如下推導(以浮點表示):
SSIM = ( pqm_ssim[ cIdx ] – 127 ) / 128
語法元素pqm_msssim[ cIdx ]的值指定MS-SSIM的值。經解碼的圖片的顏色分量cIdx的對應MS-SSIM按如下推導(以浮點表示):
MS SSIM = ( pqm_msssim[ cIdx ] – 127 ) / 128
語法元素pqm_vqm[ cIdx ]的值指定VQM的值。經解碼的圖片的顏色分量cIdx的對應VQM按如下推導(以浮點表示):
VQM = pqm_vqm[ cIdx ] / 50
圖片品質度量SEI訊息可以攜帶其它品質相關度量,諸如視頻品質的感知評估(PEVQ)、平均意見分數(MOS)和/或其它圖片品質度量。
在一些示例中,當圖片與立體幀封裝佈置SEI訊息相關聯時,圖片品質度量SEI訊息可以指定用於每個組成圖片的品質度量。當圖片與按區域幀封裝SEI訊息相關聯時,圖片品質度量SEI訊息可以指定用於每個區域的品質度量。可以向SEI訊息增加額外的語法元素,以指示對於每個組成圖片或每個區域是否存在圖片品質度量。
在其它示例中,圖片品質度量SEI訊息可以攜帶與SEI訊息相關聯的圖片的一個或多個子圖片或感興趣區域(ROI)的品質度量。還可以在SEI訊息中指定指示子圖片或ROI的數量的語法元素、指示子圖片或ROI位置的語法元素和/或指示子圖片或ROI大小的語法元素。
額外品質度量(諸如加權PSNR(wPSNR)和加權到球形均勻PSNR(WS-PSNR))可以被包括在SEI訊息中,以指示高動態範圍(HDR)和360視頻內容的品質。
在表6中提供另一示例圖片度量SEI訊息格式:
表6 圖像品質度量SEI訊息語法
Picture_quality_metrics( payloadSize ) { | 描述符 |
pqm_cnt_minus1 | u(8) |
for( i = 0; i <= pqm_cnt_minus1; i++ ) { | |
pqm_type[ i ] | u(8) |
pqm_value[ i ] | u(16) |
} | |
} |
上面的圖片度量SEI訊息提供當前經解碼的圖片的品質度量。
語法元素pqm_cnt_minus1加1的值指定透過SEI訊息指示的亮度分量品質度量的數量。
語法元素pqm_type[ i ]的值指示與如在表7中指定的經解碼的圖片或視頻序列相關聯的第i品質度量類型。
表7 對pqm_type的解釋
pqm_type | 度量 |
0 | PSNR |
1 | wPSNR |
2 | WS-PSNR |
3 | PSNR sequence |
4 | wPSNR sequence |
5 | WS-PSNR sequence |
PSNR
sequenc、wPSNR
sequence和WS-PSNR
sequence品質度量類型分別指示序列上的多個圖片的PSNR、wPSNR和WS-PSNR。
語法元素pqm_value[ i ]的值指定第i品質度量的值。當語法元素pqm_type的值為0時,則所儲存的16位元無符號整數pqm_value被解釋為PSNR值(以dB為單位),如下所示(以浮點表示),除了對於等於0的pqm_value值,PSNR等於無窮大以外。
;其中,M是整數(例如,100)。
當語法元素pqm_type的值為1時,則所儲存的16位元無符號整數pqm_value被解釋為wPSNR值(以dB為單位),如下所示(以浮點表示),除了對於等於0的pqm_value值,wPSNR等於無窮大以外。
;其中,M是整數(例如,100)。
當語法元素pqm_type的值為2時,則所儲存的16位元無符號整數pqm_value被解釋為WS-PSNR值(以dB為單位),如下所示(以浮點表示),除了對於等於0的pqm_value值,WS-PSNR等於無窮大以外。
;其中M是整數(例如,100)。
當語法元素pqm_type的值為3時,品質度量指示相關聯的圖片所屬的CLVS的平均亮度PSNR。16位元無符號整數pqm_value被解釋為序列級PSNR品質度量(以dB為單位)的結果,並且按如下推導(以浮點表示),除了對於pqm_value值等於0,PSNR等於無窮大。
;其中,M是整數(例如,100)。
當語法元素pqm_type的值為4時,品質度量指示相關聯的圖片所屬的CLVS的平均亮度加權PSNR。16位元無符號整數pqm_value被解釋為序列級wPSNR值(以dB為單位),如下所示(以浮點表示),除了對於pqm_value值等於0,wPSNR等於無窮大以外。
;其中,M是整數(例如,100)。
當語法元素pqm_type的值為5時,品質度量指示相關聯的圖片所屬的CLVS的平均亮度WS-PSNR。16位元無符號整數pqm_value被解釋為序列級WS-PSNR值(以dB為單位),如下所示(以浮點表示),除了對於pqm_value值等於0,WS-PSNR等於無窮大以外。
;其中,M是整數(例如,100)。
在另一示例中,可以在SEI訊息中包括額外品質度量類型,以指示適用於多個視頻幀的平均品質度量。可以在SEI訊息中指定第一語法元素,以指示在SEI訊息中指定的品質度量適用於相關聯的圖片並且針對當前層的所有後續圖片按輸出順序持續。可以在SEI訊息中指定第二語法元素,以按輸出順序取消任何先前品質度量的持續性。
在另一示例中,當針對CLVS的任何圖片存在平均品質度量(諸如序列級PSNR)時,針對CLVS的第一圖片應存在相關聯的圖片品質SEI訊息。適用於相同CLVS的所有SEI訊息的平均圖片度量應具有相同的內容。
圖5是示出用於對品質度量補充增強資訊訊息進行譯碼的示例程序的流程圖。圖5示出本公開內容的編碼和解碼程序兩者。如圖5所示,編碼程序可以由包括視頻編碼器200的來源設備102來執行。解碼程序可以由包括視頻解碼器300的目的地設備116來執行。
在本公開內容的一個示例中,來源設備102可以被配置為接收圖片(500)。來源設備102還可以被配置為(例如,使用視頻編碼器200)對圖片進行編碼並且向目的地設備116發送經編碼的視頻位元流。來源設備102還可以被配置為決定用於圖片的品質度量(502)。來源設備102還可以被配置為對包括品質度量語法元素的品質度量訊息進行編碼,其中,品質度量語法元素指示與圖片相關的品質度量的值(504)。
在本公開內容的另外示例中,來源設備102還可以被配置為在品質度量訊息中對品質度量類型語法元素進行編碼,其中,品質度量類型語法元素指示來自在多個類型的品質度量當中的透過品質度量語法元素指示的一類型的品質度量。在一個示例中,多個類型的品質度量包括峰值信雜比(PSNR)。在另一示例中,多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR或序列WS-PSNR。在上面的示例中,品質度量語法元素指示透過品質度量類型語法元素指示的品質度量的值。
目的地設備116可以被配置為接收圖片(510)。目的地設備116還可以被配置為(例如,使用視頻解碼器300)對圖片進行解碼。目的地設備116還可以對包括品質度量語法元素的品質度量訊息進行解碼,其中,品質度量語法元素指示與圖片相關的品質度量的值(512)。目的地設備116還可以被配置為根據品質度量的值來對圖片應用後處理技術,以形成經處理的圖片(514),並且顯示經處理的圖片(516)。
在本公開內容的另外示例中,目的地設備116還可以被配置為對品質度量訊息中的品質度量類型語法元素進行解碼,其中,品質度量類型語法元素指示來自在多個類型的品質度量當中的透過品質度量語法元素指示的一類型的品質度量。在一個示例中,多個類型的品質度量包括峰值信雜比(PSNR)。在另一示例中,多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR或序列WS-PSNR。在上面的示例中,品質度量語法元素指示透過品質度量類型語法元素指示的品質度量的值。
在本公開內容的一個示例中,品質度量訊息包括品質度量SEI訊息。在另一示例中,品質度量訊息包括品質度量開放位元流單元(OBU)。
在本公開內容的其它示例中,來源設備102和/或目的地設備116可以被配置為對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,第二品質度量語法元素指示與圖片的子圖片或感興趣區域相關的第二品質度量的第二值。
出於解釋的目的,在VVC(ITU-T H.266,正在開發中)和HEVC(ITU-T H.265)的背景下描述上面的技術。然而,本公開內容的技術可以由被配置為其它視頻譯碼標準和視頻譯碼格式(諸如AV1、AV1的未來版本以及AV1視頻譯碼格式的後繼者)的視頻編碼設備來執行。例如,與作為SEI訊息相反,這些訊息可以是分封化資料,諸如包括在本公開內容中描述的元資料中的至少一些元資料的開放位元流單元(OBU)。作為一個示例,在圖片方位SEI訊息內包括的上述語法中的一些或全部語法可以被包括在圖片方位OBU內,使得圖片方位OBU包括取消旗標、持續性旗標、組成圖片匹配旗標或轉換類型語法元素中的一者或多者。作為另一示例,在圖片品質度量SEI訊息內包括的上述語法中的一些或全部語法可以被包括在圖片品質度量OBU內,使得圖片品質度量OBU包括指示圖片的品質度量的一個或多個語法元素。
圖6是示出可以執行本公開內容的技術的示例視頻編碼器200的方塊圖。圖6是出於解釋的目的而提供的,並且不應當被認為是對如在本公開內容中廣泛地舉例說明和描述的技術的限制。出於解釋的目的,本公開內容描述根據VVC(ITU-T H.266,正在開發)和HEVC(ITU-T H.265)的技術的視頻編碼器200。然而,本公開內容的技術可以由被配置為其它視頻譯碼標準和視頻譯碼格式(諸如AV1以及AV1視頻譯碼格式的後繼者)的視頻編碼設備來執行。
在圖6的示例中,視頻編碼器200包括視頻資料記憶體230、模式選擇單元202、殘差產生單元204、轉換處理單元206、量化單元208、逆量化單元210、逆轉換處理單元212、重建單元214、濾波器單元216、解碼圖片緩衝器(DPB)218和熵編碼單元220。視頻資料記憶體230、模式選擇單元202、殘差產生單元204、轉換處理單元206、量化單元208、逆量化單元210、逆轉換處理單元212、重建單元214、濾波器單元216、DPB 218和熵編碼單元220中的任何一者或全部可以在一個或多個處理器中或者在處理電路中實現。例如,視頻編碼器200的單元可以被實現為一個或多個電路或邏輯元件,作為硬體電路的一部分,或者作為處理器、ASIC或FPGA的一部分。此外,視頻編碼器200可以包括額外的或替代的處理器或處理電路以執行這些功能和其它功能。
視頻資料記憶體230可以儲存要由視頻編碼器200的組件編碼的視頻資料。視頻編碼器200可以從例如視頻來源104(圖1)接收在視頻資料記憶體230中儲存的視頻資料。DPB 218可以充當參考圖片記憶體,其儲存參考視頻資料以在由視頻編碼器200對後續視頻資料進行預測時使用。視頻資料記憶體230和DPB 218可以由各種記憶體設備中的任何一者形成,諸如動態隨機存取記憶體(DRAM)(包括同步DRAM(SDRAM))、磁阻RAM(MRAM)、電阻性RAM(RRAM)、或其它類型的記憶體設備。視頻資料記憶體230和DPB 218可以由相同的記憶體設備或單獨的記憶體設備提供。在各個示例中,視頻資料記憶體230可以與視頻編碼器200的其它組件在晶片上(如示出的),或者相對於那些組件在晶片外。
在本公開內容中,對視頻資料記憶體230的引用不應當被解釋為限於在視頻編碼器200內部的記憶體(除非特別地描述為如此)或者在視頻編碼器200外部的記憶體(除非特別地描述為如此)。確切而言,對視頻資料記憶體230的引用應當被理解為儲存視頻編碼器200接收以用於編碼的視頻資料(例如,用於要被編碼的當前區塊的視頻資料)的參考記憶體。圖1的記憶體106還可以提供對來自視頻編碼器200的各個單元的輸出的暫時儲存。
示出圖6的各個單元以輔助理解由視頻編碼器200執行的操作。這些單元可以被實現為固定功能電路、可程式化電路、或其組合。固定功能電路指提供特定功能並且關於可以被執行的操作而預先設置的電路。可程式化電路指可以被程式化以執行各種任務並且在可以被執行的操作中提供彈性功能的電路。例如,可程式化電路可以執行軟體或韌體,軟體或韌體使得可程式化電路以透過軟體或韌體的指令定義的方式進行操作。固定功能電路可以執行軟體指令(例如,以接收參數或輸出參數),但是固定功能電路執行的操作類型通常是不可變的。在一些示例中,這些單元中的一個或多個單元可以是不同的電路區塊(固定功能或可程式化),並且在一些示例中,這些單元中的一個或多個單元可以是積體電路。
視頻編碼器200可以包括從可程式化電路形成的算術邏輯單元(ALU)、基本功能單元(EFU)、數位電路、類比電路和/或可程式化核心。在使用由可程式化電路執行的軟體來執行視頻編碼器200的操作的示例中,記憶體106(圖1)可以儲存視頻編碼器200接收並且執行的軟體的指令(例如,目標碼),或者在視頻編碼器200內的另一記憶體(未示出)可以儲存這樣的指令。
視頻資料記憶體230被配置為儲存所接收的視頻資料。視頻編碼器200可以從視頻資料記憶體230取回視頻資料的圖片,並且將視頻資料提供給殘差產生單元204和模式選擇單元202。視頻資料記憶體230中的視頻資料可以是要被編碼的原始視頻資料。
模式選擇單元202包括運動估計單元222、運動補償單元224和幀內預測單元226。模式選擇單元202可以包括額外功能單元,其根據其它預測模式來執行視頻預測。作為示例,模式選擇單元202可以包括調色板單元、區塊內複製單元(其可以是運動估計單元222和/或運動補償單元224的一部分)、仿射單元、線性模型(LM)單元等。
模式選擇單元202通常協調多個編碼通路(pass),以測試編碼參數的組合以及針對這樣的組合所得到的率失真值。編碼參數可以包括將CTU分割為CU、用於CU的預測模式、用於CU的殘差資料的轉換類型、用於CU的殘差資料的量化參數等。模式選擇單元202可以最終選擇編碼參數的具有比其它測試的組合更佳的率失真值的組合。
視頻編碼器200可以將從視頻資料記憶體230取回的圖片分割為一系列CTU,並且將一個或多個CTU封裝在切片內。模式選擇單元202可以根據樹結構(諸如上述MTT結構、QTBT結構、超級區塊結構或四叉樹結構)來分割圖片的CTU。如上所述,視頻編碼器200可以從根據樹結構來分割CTU,形成一個或多個CU。這樣的CU通常還可以被稱為“視頻區塊”或“區塊”。
通常,模式選擇單元202還控制其組件(例如,運動估計單元222、運動補償單元224和幀內預測單元226)以產生用於當前區塊(例如,當前CU,或者在HEVC中PU和TU的重疊部分)的預測區塊。對於當前區塊的幀間預測,運動估計單元222可以執行運動搜索以識別在一個或多個參考圖片(例如,在DPB 218中儲存的一個或多個先前經譯碼的圖片)中的一個或多個緊密匹配的參考區塊。具體地,運動估計單元222可以例如根據絕對差的總和(SAD)、平方差的總和(SSD)、平均絕對差(MAD)、均方差(MSD)等,來計算表示潛在參考區塊與當前區塊的相似程度的值。運動估計單元222通常可以使用在當前區塊與正被考慮的參考區塊之間的逐樣本差來執行這些計算。運動估計單元222可以識別從這些計算所得到的具有最低值的參考區塊,其指示與當前區塊最緊密匹配的參考區塊。
運動估計單元222可以形成一個或多個運動向量(MV),該運動向量限定相對於在當前圖片中的當前區塊的位置而言在參考圖片中的參考區塊的位置。然後,運動估計單元222可以將運動向量提供給運動補償單元224。例如,對於單向幀間預測,運動估計單元222可以提供單個運動向量,而對於雙向幀間預測,運動估計單元222可以提供兩個運動向量。然後,運動補償單元224可以使用運動向量來產生預測區塊。例如,運動補償單元224可以使用運動向量來取回參考區塊的資料。作為另一示例,如果運動向量具有分數樣本精確度,則運動補償單元224可以根據一個或多個內插濾波器來對用於預測區塊的值進行內插。此外,對於雙向幀間預測,運動補償單元224可以取回用於由相應的運動向量識別的兩個參考區塊的資料並且例如透過逐樣本平均或加權平均來將所取回的資料進行組合。
當根據AV1視頻譯碼格式進行操作時,運動估計單元222和運動補償單元224可以被配置為使用平移運動補償、仿射運動補償、重疊區塊運動補償(OBMC)和/或複合幀內-幀間預測來對視頻資料的譯碼區塊(例如,亮度和色度譯碼區塊兩者)進行編碼。
作為另一示例,對於幀內預測或幀內預測譯碼,幀內預測單元226可以根據與當前區塊相鄰的樣本來產生預測區塊。例如,對於方向性模式,幀內預測單元226通常可以數學上對相鄰樣本的值進行組合,並且跨當前區塊在所定義的方向上填充這些計算出的值以產生預測區塊。作為另一示例,對於DC模式,幀內預測單元226可以計算與當前區塊相鄰的樣本的平均,並且產生預測區塊以包括針對預測區塊的每個樣本的該得到的平均。
當根據AV1視頻譯碼格式進行操作時,幀內預測單元226可以被配置為使用方向幀內預測、非方向幀內預測、遞迴濾波器幀內預測、色度根據亮度(CFL)預測、區塊內複製(IBC)和/或調色板模式來對視頻資料的譯碼區塊(例如,亮度和色度譯碼區塊兩者)進行編碼。模式選擇單元202可以包括用於根據其它預測模式來執行視頻預測的額外功能單元。
模式選擇單元202將預測區塊提供給殘差產生單元204。殘差產生單元204從視頻資料記憶體230接收當前區塊的原始的未經編碼的版本,並且從模式選擇單元202接收預測區塊。殘差產生單元204計算在當前區塊與預測區塊之間的逐樣本差。所得到的逐樣本差定義用於當前區塊的殘差區塊。在一些示例中,殘差產生單元204還可以決定在殘差區塊中的樣本值之間的差,以使用殘差差分脈衝譯碼調變(RDPCM)來產生殘差區塊。在一些示例中,可以使用執行二進制減法的一個或多個減法器電路來形成殘差產生單元204。
在模式選擇單元202將CU分割為PU的示例中,每個PU可以與亮度預測單元和對應的色度預測單元相關聯。視頻編碼器200和視頻解碼器300可以支援具有各種大小的PU。如上文所指出的,CU的大小可以指CU的亮度譯碼區塊的大小,而PU的大小可以指PU的亮度預測單元的大小。假定特定CU的大小為2Nx2N,視頻編碼器200可以支援用於幀內預測的2Nx2N或NxN的PU大小、以及用於幀間預測的2Nx2N、2NxN、Nx2N、NxN或類似的對稱的PU大小。視頻編碼器200和視頻解碼器300還可以支援針對用於幀間預測的2NxnU、2NxnD、nLx2N和nRx2N的PU大小的非對稱分割。
在模式選擇單元202不將CU進一步分割為PU的示例中,每個CU可以與亮度譯碼區塊和對應的色度譯碼區塊相關聯。如上文,CU的大小可以指CU的亮度譯碼區塊的大小。視頻編碼器200和視頻解碼器300可以支援2Nx2N、2NxN 或 Nx2N 的CU大小。
對於其它視頻譯碼技術(諸如區塊內複製模式譯碼、仿射模式譯碼和線性模型(LM)模式譯碼),作為一些示例,模式選擇單元202經由與譯碼技術相關聯的相應單元來產生用於正被編碼的當前區塊的預測區塊。在一些示例中(諸如調色板模式譯碼),模式選擇單元202可以不產生預測區塊,而是替代地產生指示基於所選擇的調色板來重建區塊的方式的語法元素。在這樣的模式下,模式選擇單元202可以將這些語法元素提供給熵編碼單元220以被編碼。
如上所述,殘差產生單元204接收用於當前區塊和對應的預測區塊的視頻資料。然後,殘差產生單元204產生用於當前區塊的殘差區塊。為了產生殘差區塊,殘差產生單元204計算在預測區塊與當前區塊之間的逐樣本差。
轉換處理單元206將一個或多個轉換應用於殘差區塊,以產生轉換係數的區塊(本文中被稱為“轉換係數區塊”)。轉換處理單元206可以將各種轉換應用於殘差區塊,以形成轉換係數區塊。例如,轉換處理單元206可以將離散餘弦轉換(DCT)、方向轉換、Karhunen-Loeve轉換(KLT)、或概念上類似的轉換應用於殘差區塊。在一些示例中,轉換處理單元206可以對殘差區塊執行多個轉換,例如,初級轉換和二次轉換(諸如旋轉轉換)。在一些示例中,轉換處理單元206不對殘差區塊應用轉換。
當根據AV1進行操作時,轉換處理單元206可以對殘差區塊應用一個或多個轉換,以產生轉換係數的區塊(本文中被稱為“轉換係數區塊”)。轉換處理單元206可以對殘差區塊應用各種轉換,以形成轉換係數區塊。例如,轉換處理單元206可以應用水平/垂直轉換組合,其可以包括離散餘弦轉換(DCT)、非對稱離散正弦轉換(ADST)、翻轉ADST(例如,逆序ADST)和恆等轉換(IDTX)。當使用恆等轉換時,在垂直方向或水平方向中的一者上跳過轉換。在一些示例中,可以跳過轉換處理。
量化單元208可以對轉換係數區塊中的轉換係數進行量化,以產生經量化的轉換係數區塊。量化單元208可以根據與當前區塊相關聯的量化參數(QP)值來對轉換係數區塊的轉換係數進行量化。視頻編碼器200(例如,經由模式選擇單元202)可以透過調整與CU相關聯的QP值來調整被應用於與當前區塊相關聯的轉換係數區塊的量化程度。量化可能引入資訊損失,並且因此,經量化的轉換係數可能具有與由轉換處理單元206產生的原始轉換係數相比較低的精確度。
逆量化單元210和逆轉換處理單元212可以將逆量化和逆轉換分別應用於經量化的轉換係數區塊,以從轉換係數區塊重建殘差區塊。重建單元214可以基於經重建的殘差區塊和由模式選擇單元202產生的預測區塊來產生與當前區塊相對應的重建區塊(儘管潛在地具有某種程度的失真)。例如,重建單元214可以將經重建的殘差區塊的樣本增加到來自由模式選擇單元202產生的預測區塊的對應樣本,以產生經重建的區塊。
濾波器單元216可以對經重建的區塊執行一個或多個濾波器操作。例如,濾波器單元216可以執行去區塊操作以減少沿著CU的邊緣的區塊效應偽影。在一些示例中,可以跳過濾波器單元216的操作。
當根據AV1進行操作時,濾波器單元216可以對經重建的區塊執行一個或多個濾波器操作。例如,濾波器單元216可以執行去區塊操作以減少沿著CU的邊緣的區塊效應偽影。在其它示例中,濾波器單元216可以應用限制方向增強濾波器(CDEF),其可以在去區塊之後被應用並且可以包括基於估計的邊緣方向來應用不可分離的非線性低通方向濾波器。濾波器單元216還可以包括迴路恢復濾波器,其在CDEF之後被應用並且可以包括可分離的對稱歸一化維納濾波器(Wiener filter)或雙自導濾波器。
視頻編碼器200將經重建的區塊儲存在DPB 218中。例如,在不執行濾波器單元216的操作的示例中,重建單元214可以將經重建的區塊儲存到DPB 218。在執行濾波器單元216的操作的示例中,濾波器單元216可以將經濾波的重建區塊儲存到DPB 218。運動估計單元222和運動補償單元224可以從DPB 218取回從經重建的(並且潛在地經濾波的)區塊形成的參考圖片,以對後續經編碼的圖片的區塊進行幀間預測。另外,幀內預測單元226可以使用當前圖片的在DPB 218中的經重建的區塊來對當前圖片中的其它區塊進行幀內預測。
通常,熵編碼單元220可以對從視頻編碼器200的其它功能組件接收的語法元素進行熵編碼。例如,熵編碼單元220可以對來自量化單元208的經量化的轉換係數區塊進行熵編碼。作為另一示例,熵編碼單元220可以對來自模式選擇單元202的預測語法元素(例如,用於幀間預測的運動資訊或用於幀內預測的幀內模式資訊)進行熵編碼。熵編碼單元220可以對作為視頻資料的另一示例的語法元素執行一個或多個熵編碼操作,以產生經熵編碼的資料。例如,熵編碼單元220可以對資料執行上下文自適應可變長度譯碼(CAVLC)操作、CABAC操作、可變對可變(V2V)長度譯碼操作、基於語法的上下文自適應二進制算術譯碼(SBAC)操作、概率區間分割熵(PIPE)譯碼操作、指數哥倫布(Exponential-Golomb)編碼操作、或另一類型的熵編碼操作。在一些示例中,熵編碼單元220可以在其中語法元素未被熵編碼的旁路模式下操作。
視頻編碼器200可以輸出位元流,其包括重建切片或圖片的區塊所需要的經熵編碼的語法元素。具體地,熵編碼單元220可以輸出位元流。
根據AV1,熵編碼單元220可以被配置為符號對符號自適應多符號算術譯碼器。AV1中的語法元素包括N個元素的字母表,並且上下文(例如,概率模型)包括N個概率的集合。熵編碼單元220可以將概率儲存為n位元(例如,15位元)累積分佈函數(CDF)。熵編碼單元22可以利用基於字母表大小的更新因子來執行遞迴縮放以更新上下文。
關於區塊描述上述操作。這樣的描述應當被理解為用於亮度譯碼區塊和/或色度譯碼區塊的操作。如上所述,在一些示例中,亮度譯碼區塊和色度譯碼區塊是CU的亮度分量和色度分量。在一些示例中,亮度譯碼區塊和色度譯碼區塊是PU的亮度分量和色度分量。
在一些示例中,關於亮度譯碼區塊執行的操作不需要被重複用於色度譯碼區塊。作為一個示例,用於識別用於亮度譯碼區塊的運動向量(MV)和參考圖片的操作不需要被重複用於識別用於色度區塊的MV和參考圖片。確切而言,可以對用於亮度譯碼區塊的MV進行縮放以決定用於色度區塊的MV,並且參考圖片可以是相同的。作為另一示例,對於亮度譯碼區塊和色度譯碼區塊,幀內預測程序可以是相同的。
根據上面討論的SEI技術,視頻編碼器200表示被配置為對視頻資料進行編碼的設備的示例,該設備包括:被配置為儲存視頻資料的記憶體;以及在電路中實現並且被配置為進行以下操作的一個或多個處理單元:接收圖片;以及對包括轉換類型語法元素的圖片方位訊息進行編碼,其中,轉換類型語法元素指示來自在多個轉換當中的要應用於圖片的一轉換。視頻編碼器200還可以被配置為對包括品質度量語法元素的品質度量訊息進行編碼,其中,品質度量語法元素指示與圖片相關的品質度量的值。
圖7是示出可以執行本公開內容的技術的示例視頻解碼器300的方塊圖。圖7是出於解釋的目的而提供的,並且不是對如在本公開內容中廣泛地舉例說明和描述的技術的限制。出於解釋的目的,本公開內容描述根據VVC(ITU-T H.266,正在開發)和HEVC(ITU-T H.265)的技術的視頻解碼器300。然而,本公開內容的技術可以由被配置為其它視頻譯碼標準的視頻譯碼設備來執行。
在圖7的示例中,視頻解碼器300包括譯碼圖片緩衝器(CPB)記憶體320、熵解碼單元302、預測處理單元304、逆量化單元306、逆轉換處理單元308、重建單元310、濾波器單元312和解碼圖片緩衝器(DPB)134。CPB記憶體320、熵解碼單元302、預測處理單元304、逆量化單元306、逆轉換處理單元308、重建單元310、濾波器單元312和DPB 134中的任何一者或全部可以在一個或多個處理器中或者在處理電路中實現。例如,視頻解碼器300的單元可以被實現為一個或多個電路或邏輯元件,作為硬體電路的一部分,或者作為處理器、ASIC或FPGA的一部分。此外,視頻解碼器300可以包括額外的或替代的處理器或處理電路以執行這些功能和其它功能。
預測處理單元304包括運動補償單元316和幀內預測單元318。預測處理單元304可以包括用於根據其它預測模式來執行預測的額外的單元。作為示例,預測處理單元304可以包括調色板單元、區塊內複製單元(其可以形成運動補償單元316的一部分)、仿射單元、線性模型(LM)單元等。在其它示例中,視頻解碼器300可以包括更多、更少或不同的功能組件。
當根據AV1進行操作時,補償單元316可以被配置為使用平移運動補償、仿射運動補償、OBMC和/或複合幀間幀內預測來對視頻資料的譯碼區塊(例如,亮度和色度譯碼區塊兩者)進行解碼,如上所述。幀內預測單元318可以被配置為使用方向幀內預測、非方向幀內預測、遞迴濾波器幀內預測、CFL、區塊內複製(IBC)和/或調色板模式來對視頻資料的譯碼區塊(例如,亮度和色度譯碼區塊兩者)進行解碼。
CPB記憶體320可以儲存要由視頻解碼器300的組件解碼的視頻資料,諸如經編碼的視頻位元流。可以例如從計算機可讀媒體110(圖1)獲得在CPB記憶體320中儲存的視頻資料。CPB記憶體320可以包括儲存來自經編碼的視頻位元流的經編碼的視頻資料(例如,語法元素)的CPB。此外,CPB記憶體320可以儲存除了經譯碼的圖片的語法元素之外的視頻資料,諸如表示來自視頻解碼器300的各個單元的輸出的暫時資料。DPB 314通常儲存經解碼的圖片,視頻解碼器300可以輸出經解碼的圖片,和/或當對經編碼的視頻位元流的後續資料或圖片進行解碼時使用經解碼的圖片作為參考視頻資料。CPB記憶體320和DPB 314可以由各種記憶體設備中的任何一者形成,諸如DRAM(包括SDRAM)、MRAM、RRAM或其它類型的記憶體設備。CPB記憶體320和DPB 314可以由相同的記憶體設備或單獨的記憶體設備來提供。在各個示例中,CPB記憶體320可以與視頻解碼器300的其它組件在晶片上,或者相對於那些組件在晶片外。
另外或替代地,在一些示例中,視頻解碼器300可以從記憶體120(圖1)取回經譯碼的視頻資料。也就是說,記憶體120可以如上文所討論地利用CPB記憶體320來儲存資料。同樣,當視頻解碼器300的一些或全部功能是用要被視頻解碼器300的處理電路執行的軟體來實現的時,記憶體120可以儲存要被視頻解碼器300執行的指令。
示出圖7中示出的各個單元以輔助理解由視頻解碼器300執行的操作。這些單元可以被實現為固定功能電路、可程式化電路、或其組合。類似於圖6,固定功能電路指提供特定功能並且關於可以被執行的操作而預先設置的電路。可程式化電路指可以被程式化以執行各種任務並且在可以被執行的操作中提供彈性功能的電路。例如,可程式化電路可以執行軟體或韌體,軟體或韌體使得可程式化電路以透過軟體或韌體的指令定義的方式進行操作。固定功能電路可以執行軟體指令(例如,以接收參數或輸出參數),但是固定功能電路執行的操作的類型通常是不可變的。在一些示例中,這些單元中的一個或多個單元可以是不同的電路區塊(固定功能或可程式化),並且在一些示例中,這些單元中的一個或多個單元可以是積體電路。
視頻解碼器300可以包括從可程式化電路形成的ALU、EFU、數位電路、類比電路和/或可程式化核心。在視頻解碼器300的操作由在可程式化電路上執行的軟體執行的示例中,晶片上或晶片外記憶體可以儲存視頻解碼器300接收並且執行的軟體的指令(例如,目標碼)。
熵解碼單元302可以從CPB接收經編碼的視頻資料,並且對視頻資料進行熵解碼以重新產生語法元素。預測處理單元304、逆量化單元306、逆轉換處理單元308、重建單元310和濾波器單元312可以基於從位元流中提取的語法元素來產生經解碼的視頻資料。
通常,視頻解碼器300在逐區塊的基礎上重建圖片。視頻解碼器300可以單獨地對每個區塊執行重建操作(其中,當前正在被重建(即,被解碼)的區塊可以被稱為“當前區塊”)。
熵解碼單元302可以對定義經量化的轉換係數區塊的經量化的轉換係數的語法元素以及諸如量化參數(QP)和/或轉換模式指示的轉換資訊進行熵解碼。逆量化單元306可以使用與經量化的轉換係數區塊相關聯的QP來決定量化程度,並且同樣地,決定供逆量化單元306應用的逆量化程度。逆量化單元306可以例如執行按位左移操作以對經量化的轉換係數進行逆量化。逆量化單元306從而可以形成包括轉換係數的轉換係數區塊。
在逆量化單元306形成轉換係數區塊之後,逆轉換處理單元308可以將一個或多個逆轉換應用於轉換係數區塊,以產生與當前區塊相關聯的殘差區塊。例如,逆轉換處理單元308可以將逆DCT、逆整數轉換、逆Karhunen-Loeve轉換(KLT)、逆旋轉轉換、逆方向轉換或另一逆轉換應用於轉換係數區塊。
此外,預測處理單元304根據由熵解碼單元302進行熵解碼的預測資訊語法元素來產生預測區塊。例如,如果預測資訊語法元素指示當前區塊是經幀間預測的,則運動補償單元316可以產生預測區塊。在這種情況下,預測資訊語法元素可以指示在DPB 314中的要從其取回參考區塊的參考圖片、以及識別相對於在當前圖片中的當前區塊的位置而言在參考圖片中的參考區塊的位置的運動向量。運動補償單元316通常可以以與關於運動補償單元224(圖6)所描述的方式基本上類似的方式來執行幀間預測程序。
作為另一示例,如果預測資訊語法元素指示當前區塊是經幀內預測的,則幀內預測單元318可以根據透過預測資訊語法元素指示的幀內預測模式來產生預測區塊。再次,幀內預測單元318通常可以以與關於幀內預測單元226(圖6)所描述的方式基本上類似的方式來執行幀內預測程序。幀內預測單元318可以從DPB 314取回與當前區塊相鄰的樣本的資料。
重建單元310可以使用預測區塊和殘差區塊來重建當前區塊。例如,重建單元310可以將殘差區塊的樣本增加到預測區塊的對應樣本來重建當前區塊。
濾波器單元312可以對經重建的區塊執行一個或多個濾波器操作。例如,濾波器單元312可以執行去區塊操作以減少沿著經重建的區塊的邊緣的區塊效應偽影。不一定在所有示例中都執行濾波器單元312的操作。
視頻解碼器300可以將經重建的區塊儲存在DPB 314中。例如,在不執行濾波器單元312的操作的示例中,重建單元310可以將經重建的區塊儲存到DPB 314。在執行濾波器單元312的操作的示例中,濾波器單元312可以將經濾波的重建區塊儲存到DPB 314。如上文所討論的,DPB 314可以將參考資訊(諸如用於幀內預測的當前圖片以及用於後續運動補償的先前經解碼的圖片的樣本)提供給預測處理單元304。此外,視頻解碼器300可以從DPB 314輸出經解碼的圖片(例如,經解碼的視頻),以用於在諸如圖1的顯示設備118的顯示設備上的後續呈現。
根據上面討論的SEI技術,視頻解碼器300表示被配置為對視頻資料進行解碼的設備的示例,該設備包括:被配置為儲存視頻資料的記憶體;以及在電路中實現並且被配置為進行以下操作的一個或多個處理單元:接收圖片;以及對包括轉換類型語法元素的圖片方位訊息進行解碼,其中,轉換類型語法元素指示來自在多個轉換當中的要應用於圖片的一轉換。視頻解碼器300還可以被配置為對包括品質度量語法元素的品質度量訊息進行解碼,其中,品質度量語法元素指示與圖片相關的品質度量的值。
圖8是示出根據本公開內容的技術的用於對當前區塊進行編碼的示例方法的流程圖。當前區塊可以包括當前CU。儘管關於視頻編碼器200(圖1和圖6)進行描述,但是應當理解的是,其它設備可以被配置為執行與圖8的方法類似的方法。
在該示例中,視頻編碼器200最初預測當前區塊(350)。例如,視頻編碼器200可以形成用於當前區塊的預測區塊。然後,視頻編碼器200可以計算用於當前區塊的殘差區塊(352)。為了計算殘差區塊,視頻編碼器200可以計算在原始的未經編碼的區塊與用於當前區塊的預測區塊之間的差。然後,視頻編碼器200可以對殘差區塊進行轉換以及對殘差區塊的轉換係數進行量化(354)。接下來,視頻編碼器200可以掃描殘差區塊的經量化的轉換係數(356)。在掃描期間或在掃描之後,視頻編碼器200可以對轉換係數進行熵編碼(358)。例如,視頻編碼器200可以使用CAVLC或CABAC來對轉換係數進行編碼。然後,視頻編碼器200可以輸出區塊的經熵編碼的資料(360)。
圖9是示出根據本公開內容的技術的用於對視頻資料的當前區塊進行解碼的示例方法的流程圖。當前區塊可以包括當前CU。儘管關於視頻解碼器300(圖1和圖7)進行描述,但是應當理解的是,其它設備可以被配置為執行與圖9的方法類似的方法。
視頻解碼器300可以接收用於當前區塊的經熵編碼的資料(諸如經熵編碼的預測資訊和用於與當前區塊相對應的殘差區塊的轉換係數的經熵編碼的資料)(370)。視頻解碼器300可以對經熵編碼的資料進行熵解碼以決定用於當前區塊的預測資訊並且重新產生殘差區塊的轉換係數(372)。視頻解碼器300可以例如使用如由用於當前區塊的預測資訊指示的幀內預測模式或幀間預測模式來預測當前區塊(374),以計算用於當前區塊的預測區塊。然後,視頻解碼器300可以對所重新產生的轉換係數進行逆掃描(376),以創建經量化的轉換係數的區塊。然後,視頻解碼器300可以對轉換係數進行逆量化以及將逆轉換應用於轉換係數以產生殘差區塊(378)。最終,視頻解碼器300可以透過將預測區塊和殘差區塊進行組合來對當前區塊進行解碼(380)。
下文描述本公開內容的技術和設備的其它說明性方面。
方面1A-一種處理視頻資料的方法,所述方法包括:接收圖片;以及對圖片方位補充增強資訊(SEI)訊息進行譯碼,所述圖片方位SEI訊息包括以下各項中的一項或多項:取消旗標、持續性旗標、組成圖片匹配旗標或轉換類型語法元素,其中,所述轉換類型語法元素指示要應用於所述圖片的旋轉或鏡像中的一者或多者。
方面2A-根據方面1A所述的方法,其中,譯碼包括解碼,並且其中,所述方法還包括:根據所述圖片方位SEI訊息來處理所述圖片。
方面3A-根據方面1A或方面2A所述的方法,其中,所述圖片方位訊息包括圖片方位補充增強資訊(SEI)訊息。
方面4A-根據方面1A或方面2A所述的方法,其中,所述圖片方位訊息包括圖片方位開放位元流單元(OBU)。
方面5A-根據申請專利範圍1A所述的方法,其中,譯碼包括編碼。
方面6A-一種處理視頻資料的方法,所述方法包括:接收圖片;以及對圖片品質度量補充增強資訊(SEI)訊息進行譯碼,所述圖片品質度量SEI訊息包括指示所述圖片的品質度量的一個或多個語法元素。
方面7A-根據方面6A所述的方法,其中,譯碼包括解碼,並且其中,所述方法還包括:根據所述圖片品質度量SEI訊息來處理所述圖片。
方面8A-根據方面6A或方面7A所述的方法,其中,所述圖片方位訊息包括圖片品質度量補充增強資訊(SEI)訊息。
方面9A-根據方面6A-8A中任一項所述的方法,其中,所述圖片品質度量訊息包括一個或多個語法元素,所述一個或多個語法元素指示所述圖片的與所述圖片品質度量訊息相關聯的一個或多個子圖片或感興趣區域的品質度量。
方面10A-根據方面9A所述的方法,其中,所述一個或多個語法元素指示高動態範圍(HDR)或360視頻內容的品質度量。
方面11A-根據方面6A-10A中任一項所述的方法,其中,譯碼包括編碼。
方面12A-根據方面1A-10A所述的方法的任何組合。
方面13A-一種用於處理視頻資料的設備,所述設備包括用於執行根據方面1A-12A中任一項所述的方法的一個或多個構件。
方面14A-根據方面13A所述的設備,其中,所述一個或多個構件包括在電路中實現的一個或多個處理器。
方面15A-根據方面13A和14A中任一項所述的設備,還包括:用於儲存所述視頻資料的記憶體。
方面16A-根據方面13A-15A中任一項所述的設備,還包括:被配置為顯示經解碼的視頻資料的顯示器。
方面17A-根據方面13A-16A中任一項所述的設備,其中,所述設備包括以下各項中的一項或多項:相機、計算機、行動設備、廣播接收機設備或機上盒。
方面18A-根據方面13A-17A中任一項所述的設備,其中,所述設備包括視頻解碼器。
方面19A-根據方面13A-18A中任一項所述的設備,其中,所述設備包括視頻編碼器。
方面20A-一種在其上儲存有指令的計算機可讀儲存媒體,所述指令當被執行時使得一個或多個處理器執行根據方面1A-12A中任一項所述的方法。
方面1B-一種處理視頻資料的方法,所述方法包括:接收圖片;以及對包括品質度量語法元素的品質度量訊息進行譯碼,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
方面2B-根據方面1B所述的方法,還包括:對所述品質度量訊息中的品質度量類型語法元素進行譯碼,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
方面3B-根據方面2B所述的方法,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
方面4B-根據方面2B所述的方法,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
方面5B-根據方面2B所述的方法,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
方面6B-根據方面1B所述的方法,還包括:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
方面7B-根據方面1B所述的方法,還包括:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
方面8B-根據方面1B所述的方法,其中,譯碼包括解碼,並且其中,所述方法還包括:根據所述品質度量的所述值來對所述圖片應用後處理技術,以形成經處理的圖片;以及顯示所述經處理的圖片。
方面9B-根據方面1B所述的方法,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
方面10B-根據方面1B所述的方法,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
方面11B-一種被配置為處理視頻資料的裝置,所述裝置包括:被配置為儲存圖片的記憶體;以及在電路中實現並且與所述記憶體相通信的一個或多個處理器,所述一個或多個處理器被配置為:接收所述圖片;以及對包括品質度量語法元素的品質度量訊息進行譯碼,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
方面12B-根據方面11B所述的裝置,其中,所述一個或多個處理器還被配置為:對所述品質度量訊息中的品質度量類型語法元素進行譯碼,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
方面13B-根據方面12B所述的裝置,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
方面14B-根據方面12B所述的裝置,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
方面15B-根據方面12B所述的裝置,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
方面16B-根據方面11B所述的裝置,其中,所述一個或多個處理器還被配置為:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
方面17B-根據方面11B所述的裝置,其中,所述一個或多個處理器還被配置為:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
方面18B-根據方面11B所述的裝置,其中,所述裝置被配置為對所述品質度量訊息進行解碼,並且其中,所述一個或多個處理器還被配置為:根據所述品質度量的所述值來對所述圖片應用後處理技術,以形成經處理的圖片;以及顯示所述經處理的圖片。
方面19B-根據方面11B所述的裝置,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
方面20B-根據方面11B所述的裝置,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
方面21B-一種被配置為處理視頻資料的裝置,所述裝置包括:用於接收圖片的構件;以及用於對包括品質度量語法元素的品質度量訊息進行譯碼的構件,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
方面22B-根據方面21B所述的裝置,還包括:用於對所述品質度量訊息中的品質度量類型語法元素進行譯碼的構件,其中,所述品質度量類型語法元素指示來自多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
方面23B-根據方面22B所述的裝置,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
方面24B-根據方面22B所述的裝置,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
方面25B-根據方面22B所述的裝置,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
方面26B-根據方面21B所述的裝置,還包括:用於對包括第二品質度量語法元素的第二品質度量訊息進行譯碼的構件,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
方面27B-根據方面21B所述的裝置,還包括:用於對包括第二品質度量語法元素的第二品質度量訊息進行譯碼的構件,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
方面28B-根據方面21B所述的裝置,其中,所述用於譯碼的構件包括用於解碼的構件,並且其中,所述裝置還包括:用於根據所述品質度量的所述值來對所述圖片應用後處理技術以形成經處理的圖片的構件;以及用於顯示所述經處理的圖片的構件。
方面29B-根據方面21B所述的裝置,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
方面30B-根據方面21B所述的裝置,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
方面31B-一種儲存指令的非暫時性計算機可讀儲存媒體,所述指令當被執行時使得被配置為處理視頻資料的設備的一個或多個處理器進行以下操作:接收圖片;以及對包括品質度量語法元素的品質度量訊息進行譯碼,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
方面32B-根據方面31B所述的非暫時性計算機可讀儲存媒體,其中,所述指令還使得所述一個或多個處理器進行以下操作:對所述品質度量訊息中的品質度量類型語法元素進行譯碼,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
方面33B-根據方面32B所述的非暫時性計算機可讀儲存媒體,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
方面34B-根據方面32所述的非暫時性計算機可讀儲存媒體,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
方面35B-根據方面32B所述的非暫時性計算機可讀儲存媒體,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
方面36B-根據方面31B所述的非暫時性計算機可讀儲存媒體,其中,所述指令還使得所述一個或多個處理器進行以下操作:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
方面37B-根據方面31B所述的非暫時性計算機可讀儲存媒體,其中,所述指令還使得所述一個或多個處理器進行以下操作:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
方面38B-根據方面31B所述的非暫時性計算機可讀儲存媒體,其中,所述設備被配置為對所述品質度量訊息進行解碼,並且其中,所述指令還使得所述一個或多個處理器進行以下操作:根據所述品質度量的所述值來對所述圖片應用後處理技術,以形成經處理的圖片;以及顯示所述經處理的圖片。
方面39B-根據方面31B所述的非暫時性計算機可讀儲存媒體,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
方面40B-根據方面31B所述的非暫時性計算機可讀儲存媒體,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
方面1C-一種處理視頻資料的方法,所述方法包括:接收圖片;以及對包括品質度量語法元素的品質度量訊息進行譯碼,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
方面2C-根據方面1C所述的方法,還包括:對所述品質度量訊息中的品質度量類型語法元素進行譯碼,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
方面3C-根據方面2C所述的方法,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
方面4C-根據方面2C所述的方法,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
方面5C-根據方面2C-4C中任一項所述的方法,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
方面6C-根據方面1C-5C中任一項所述的方法,還包括:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
方面7C-根據方面1C-5C中任一項所述的方法,還包括:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
方面8C-根據方面1C-7C中任一項所述的方法,其中,譯碼包括解碼,並且其中,所述方法還包括:根據所述品質度量的所述值來對所述圖片應用後處理技術,以形成經處理的圖片;以及顯示所述經處理的圖片。
方面9C-根據方面1C-8C中任一項所述的方法,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
方面10C-根據方面1C-8C中任一項所述的方法,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
方面11C-一種被配置為處理視頻資料的裝置,所述裝置包括:被配置為儲存圖片的記憶體;以及在電路中實現並且與所述記憶體相通信的一個或多個處理器,所述一個或多個處理器被配置為:接收圖片;以及對包括品質度量語法元素的品質度量訊息進行譯碼,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
方面12C-根據方面11C所述的裝置,其中,所述一個或多個處理器還被配置為:對所述品質度量訊息中的品質度量類型語法元素進行譯碼,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
方面13C-根據方面12C所述的裝置,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
方面14C-根據方面12C所述的裝置,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
方面15C-根據方面12C-14C中任一項所述的裝置,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
方面16C-根據方面11C-15C中任一項所述的裝置,其中,所述一個或多個處理器還被配置為:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
方面17C-根據方面11C-15C中任一項所述的裝置,其中,所述一個或多個處理器還被配置為:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
方面18C-根據方面11C-17C中任一項所述的裝置,其中,所述裝置被配置為對所述品質度量訊息進行解碼,並且其中,所述一個或多個處理器還被配置為:根據所述品質度量的所述值來對所述圖片應用後處理技術,以形成經處理的圖片;以及顯示所述經處理的圖片。
方面19C-根據方面11C-18C中任一項所述的裝置,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
方面20C-根據方面11C-18C中任一項所述的裝置,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
方面21C-一種被配置為處理視頻資料的裝置,所述裝置包括:用於接收圖片的構件;以及用於對包括品質度量語法元素的品質度量訊息進行譯碼的構件,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
方面22C-根據方面21C所述的裝置,還包括:用於對所述品質度量訊息中的品質度量類型語法元素進行譯碼的構件,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
方面23C-根據方面22C所述的裝置,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
方面24C-根據方面22C所述的裝置,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
方面25C-根據方面22C-24C中任一項所述的裝置,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
方面26C-根據方面21C-25C中任一項所述的裝置,還包括:用於對包括第二品質度量語法元素的第二品質度量訊息進行譯碼的構件,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
方面27C-根據方面21C-25C中任一項所述的裝置,還包括:用於對包括第二品質度量語法元素的第二品質度量訊息進行譯碼的構件,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值
方面28C-根據方面21C-27C中任一項所述的裝置,其中,所述用於譯碼的構件包括用於解碼的構件,並且其中,所述裝置還包括:用於根據所述品質度量的所述值來對所述圖片應用後處理技術以形成經處理的圖片的構件;以及用於顯示所述經處理的圖片的構件。
方面29C-根據方面21C-28C中任一項所述的裝置,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
方面30C-根據方面21C-28C中任一項所述的裝置,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
方面31C-一種儲存指令的非暫時性計算機可讀儲存媒體,所述指令當被執行時使得被配置為處理視頻資料的設備的一個或多個處理器進行以下操作:接收圖片;以及對包括品質度量語法元素的品質度量訊息進行譯碼,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
方面32C-根據方面31C所述的非暫時性計算機可讀儲存媒體,其中,所述指令還使得所述一個或多個處理器進行以下操作:對所述品質度量訊息中的品質度量類型語法元素進行譯碼,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
方面33C-根據方面32C所述的非暫時性計算機可讀儲存媒體,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
方面34C-根據方面32所述的非暫時性計算機可讀儲存媒體,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
方面35C-根據方面32C-34C中任一項所述的非暫時性計算機可讀儲存媒體,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
方面36C-根據方面31C-35C中任一項所述的非暫時性計算機可讀儲存媒體,其中,所述指令還使得所述一個或多個處理器進行以下操作:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
方面37C-根據方面31C-35C中任一項所述的非暫時性計算機可讀儲存媒體,其中,所述指令還使得所述一個或多個處理器進行以下操作:對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
方面38C-根據方面31C-37C中任一項所述的非暫時性計算機可讀儲存媒體,其中,所述設備被配置為對所述品質度量訊息進行解碼,並且其中,所述指令還使得所述一個或多個處理器進行以下操作:根據所述品質度量的所述值來對所述圖片應用後處理技術,以形成經處理的圖片;以及顯示所述經處理的圖片。
方面39C-根據方面31C-38C中任一項所述的非暫時性計算機可讀儲存媒體,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
方面40C-根據方面31C-38C中任一項所述的非暫時性計算機可讀儲存媒體,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
要認識到的是,根據示例,本文描述的技術中的任何技術的某些動作或事件可以以不同的順序執行,可以被增加、被合併或被完全省略(例如,並非所有描述的動作或事件對於技術的實施都是必要的)。此外,在某些示例中,動作或事件可以例如透過多線程處理、中斷處理或多個處理器並行地而不是順序地執行。
在一個或多個示例中,所描述的功能可以用硬體、軟體、韌體或其任何組合來實現。如果用軟體來實現,則所述功能可以作為一個或多個指令或碼被儲存在計算機可讀媒體上或者透過計算機可讀媒體進行發送並且由基於硬體的處理單元執行。計算機可讀媒體可以包括計算機可讀儲存媒體(其對應於諸如資料儲存媒體的有形媒體)或者通信媒體(其包括例如根據通信協定來促進計算機程式從一個地方傳送到另一個地方的任何媒體)。以這種方式,計算機可讀媒體通常可以對應於(1)非暫時性的有形計算機可讀儲存媒體、或者(2)諸如信號或載波的通信媒體。資料儲存媒體可以是能夠由一個或多個計算機或者一個或多個處理器存取以取回用於實現在本公開內容中描述的技術的指令、代碼和/或資料結構的任何可用的媒體。計算機程式產品可以包括計算機可讀媒體。
舉例來說而非進行限制,這樣的計算機可讀儲存媒體可以包括RAM、ROM、EEPROM、CD-ROM或其它光碟儲存、磁碟儲存或其它磁儲存設備、快閃記憶體、或者能夠用於以指令或資料結構的形式儲存期望的程式碼以及能夠由計算機存取的任何其它媒體。此外,任何連接被適當地稱為計算機可讀媒體。例如,如果使用同軸電纜、光纖光纜、雙絞線、數位用戶線(DSL)或者無線技術(諸如紅外線、無線電和微波)來從網站、伺服器或其它遠程來源發送指令,則同軸電纜、光纖光纜、雙絞線、DSL或者無線技術(諸如紅外線、無線電和微波)被包括在媒體的定義中。然而,應當理解的是,計算機可讀儲存媒體和資料儲存媒體不包括連接、載波、信號或其它暫時性媒體,而是替代地針對非暫時性的有形儲存媒體。如本文所使用的,磁碟和光碟包括壓縮光碟(CD)、雷射光碟、光碟、數位多功能光碟(DVD)、軟碟和藍光光碟,其中,磁碟通常磁性地複製資料,而光碟利用雷射來光學地複製資料。上述各項的組合還應當被包括在計算機可讀媒體的範圍之內。
指令可以由一個或多個處理器(諸如一個或多個DSP、通用微處理器、ASIC、FPGA、或其它等效的積體或離散邏輯電路)執行。因此,如本文所使用的用語“處理器”和“處理電路”可以指前述結構中的任何一者或者適於實現本文描述的技術的任何其它結構。另外,在一些方面中,本文描述的功能可以在被配置用於編碼和解碼的專用硬體和/或軟體模組內提供,或者被併入經組合的編解碼器中。此外,所述技術可以在一個或多個電路或邏輯元件中完全實現。
本公開內容的技術可以在多種多樣的設備或裝置(包括無線手持機、積體電路(IC)或一組IC(例如,晶片組))中實現。在本公開內容中描述各種組件、模組或單元以強調被配置為執行所公開的技術的設備的功能方面,但是不一定要求透過不同的硬體單元來實現。確切而言,如上所述,各種單元可以被組合在編解碼器硬體單元中,或者由互操作的硬體單元的集合(包括如上文所描述的一個或多個處理器)結合適當的軟體和/或韌體來提供。
已經描述各個示例。這些示例和其它示例在所附的申請專利範圍的範圍內。
100:系統
102:來源設備
104:視頻來源
106:記憶體
108:輸出介面
110:計算機可讀媒體
112:儲存設備
114:檔案伺服器
116:目的地設備
118:顯示設備
120:記憶體
122:輸入介面
150:圖片
152:經轉換的圖片
160:原始圖片
162:圖片
164:圖片
166:圖片
168:圖片
170:圖片
172:圖片
174:圖片
200:視頻編碼器
202:模式選擇單元
204:殘差產生單元
206:轉換處理單元
208:量化單元
210:逆量化單元
212:逆轉換處理單元
214:重建單元
216:濾波器單元
218:解碼圖片緩衝器(DPB)
220:熵編碼單元
222:運動估計單元
224:運動補償單元
226:幀內預測單元
230:視頻資料記憶體
300:視頻解碼器
302:熵解碼單元
304:預測處理單元
306:逆量化單元
308:逆轉換處理單元
310:重建單元
312:濾波器單元
314:解碼圖片緩衝器(DPB)
316:運動補償單元
318:幀內預測單元
320:CPB記憶體
350:步驟
352:步驟
354:步驟
356:步驟
358:步驟
360:步驟
370:步驟
372:步驟
374:步驟
376:步驟
378:步驟
380:步驟
400:步驟
402:步驟
404:步驟
410:步驟
412:步驟
414:步驟
416:步驟
500:步驟
502:步驟
504:步驟
510:步驟
512:步驟
514:步驟
516:步驟
圖1是示出可以執行本公開內容的技術的示例視頻編碼和解碼系統的方塊圖。
圖2是示出圖片的示例旋轉的概念圖。
圖3是示出示例轉換類型的概念圖。
圖4是示出用於對圖片方位補充增強資訊訊息進行譯碼的示例程序的流程圖。
圖5是示出用於對品質度量補充增強資訊訊息進行譯碼的示例程序的流程圖。
圖6是示出可以執行本公開內容的技術的示例視頻編碼器的方塊圖。
圖7是示出可以執行本公開內容的技術的示例視頻解碼器的方塊圖。
圖8是示出根據本公開內容的技術的用於對當前區塊進行編碼的示例方法的流程圖。
圖9是示出根據本公開內容的技術的用於對當前區塊進行解碼的示例方法的流程圖。
102:來源設備
116:目的地設備
500:步驟
502:步驟
504:步驟
510:步驟
512:步驟
514:步驟
516:步驟
Claims (40)
- 一種處理視頻資料的方法,所述方法包括: 接收圖片;以及 對包括品質度量語法元素的品質度量訊息進行譯碼,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
- 根據請求項1所述的方法,還包括: 對所述品質度量訊息中的品質度量類型語法元素進行譯碼,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
- 根據請求項2所述的方法,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
- 根據請求項2所述的方法,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
- 根據請求項2所述的方法,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
- 根據請求項1所述的方法,還包括: 對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
- 根據請求項1所述的方法,還包括: 對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
- 根據請求項1所述的方法,其中,譯碼包括解碼,並且其中,所述方法還包括: 根據所述品質度量的所述值來對所述圖片應用後處理技術,以形成經處理的圖片;以及 顯示所述經處理的圖片。
- 根據請求項1所述的方法,其中,所述品質度量訊息包括品質度量補充增強資訊資訊(SEI)訊息。
- 根據請求項1所述的方法,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
- 一種被配置為處理視頻資料的裝置,所述裝置包括: 被配置為儲存圖片的記憶體;以及 在電路中實現並且與所述記憶體相通信的一個或多個處理器,所述一個或多個處理器被配置為: 接收所述圖片;以及 對包括品質度量語法元素的品質度量訊息進行譯碼,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
- 根據請求項11所述的裝置,其中,所述一個或多個處理器還被配置為: 對所述品質度量訊息中的品質度量類型語法元素進行譯碼,其中,所述品質度量類型語法元素指示來自多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
- 根據請求項12所述的裝置,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
- 根據請求項12所述的裝置,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
- 根據請求項12所述的裝置,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
- 根據請求項11所述的裝置,其中,所述一個或多個處理器還被配置為: 對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
- 根據請求項11所述的裝置,其中,所述一個或多個處理器還被配置為: 對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
- 根據請求項11所述的裝置,其中,所述裝置被配置為對所述品質度量訊息進行解碼,並且其中,所述一個或多個處理器還被配置為: 根據所述品質度量的所述值來對所述圖片應用後處理技術,以形成經處理的圖片;以及 顯示所述經處理的圖片。
- 根據請求項11所述的裝置,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
- 根據請求項11所述的裝置,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
- 一種被配置為處理視頻資料的裝置,所述裝置包括: 用於接收圖片的構件;以及 用於對包括品質度量語法元素的品質度量訊息進行譯碼的構件,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
- 根據請求項21所述的裝置,還包括: 用於對所述品質度量訊息中的品質度量類型語法元素進行譯碼的構件,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
- 根據請求項22所述的裝置,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
- 根據請求項22所述的裝置,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
- 根據請求項22所述的裝置,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
- 根據請求項21所述的裝置,還包括: 用於對包括第二品質度量語法元素的第二品質度量訊息進行譯碼的構件,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
- 根據請求項21所述的裝置,還包括: 用於對包括第二品質度量語法元素的第二品質度量訊息進行譯碼的構件,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
- 根據請求項21所述的裝置,其中,所述用於譯碼的構件包括用於解碼的構件,並且其中,所述裝置還包括: 用於根據所述品質度量的所述值來對所述圖片應用後處理技術以形成經處理的圖片的構件;以及 用於顯示所述經處理的圖片的構件。
- 根據請求項21所述的裝置,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
- 根據請求項21所述的裝置,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
- 一種儲存指令的非暫時性計算機可讀儲存媒體,所述指令當被執行時使得被配置為處理視頻資料的設備的一個或多個處理器進行以下操作: 接收圖片;以及 對包括品質度量語法元素的品質度量訊息進行譯碼,其中,所述品質度量語法元素指示與所述圖片相關的品質度量的值。
- 根據請求項31所述的非暫時性計算機可讀儲存媒體,其中,所述指令還使得所述一個或多個處理器進行以下操作: 對所述品質度量訊息中的品質度量類型語法元素進行譯碼,其中,所述品質度量類型語法元素指示來自在多個類型的品質度量當中的透過所述品質度量語法元素指示的一類型的品質度量。
- 根據請求項32所述的非暫時性計算機可讀儲存媒體,其中,所述多個類型的品質度量包括峰值信雜比(PSNR)。
- 根據請求項32所述的非暫時性計算機可讀儲存媒體,其中,所述多個類型的品質度量包括以下各項中的另外兩項:峰值信雜比(PSNR)、結構相似性索引(SSIM)、多尺度結構相似性索引(MS-SSIM)、視頻品質度量(VQM)、加權PSNR(wPSNR)、加權到球形均勻PSNR(WS-PSNR)、序列PSNR、序列wPSNR、或序列WS-PSNR。
- 根據請求項32所述的非暫時性計算機可讀儲存媒體,其中,所述品質度量語法元素指示透過所述品質度量類型語法元素指示的所述品質度量的所述值。
- 根據請求項31所述的非暫時性計算機可讀儲存媒體,其中,所述指令還使得所述一個或多個處理器進行以下操作: 對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的子圖片相關的第二品質度量的第二值。
- 根據請求項31所述的非暫時性計算機可讀儲存媒體,其中,所述指令還使得所述一個或多個處理器進行以下操作: 對包括第二品質度量語法元素的第二品質度量訊息進行譯碼,其中,所述第二品質度量語法元素指示與所述圖片的感興趣區域相關的第二品質度量的第二值。
- 根據請求項31所述的非暫時性計算機可讀儲存媒體,其中,所述設備被配置為對所述品質度量訊息進行解碼,並且其中,所述指令還使得所述一個或多個處理器進行以下操作: 根據所述品質度量的所述值來對所述圖片應用後處理技術,以形成經處理的圖片;以及 顯示所述經處理的圖片。
- 根據請求項31所述的非暫時性計算機可讀儲存媒體,其中,所述品質度量訊息包括品質度量補充增強資訊(SEI)訊息。
- 根據請求項31所述的非暫時性計算機可讀儲存媒體,其中,所述品質度量訊息包括品質度量開放位元流單元(OBU)。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163170267P | 2021-04-02 | 2021-04-02 | |
US63/170,267 | 2021-04-02 | ||
US202163214378P | 2021-06-24 | 2021-06-24 | |
US63/214,378 | 2021-06-24 | ||
US17/653,945 US11895336B2 (en) | 2021-04-02 | 2022-03-08 | Picture orientation and quality metrics supplemental enhancement information message for video coding |
US17/653,945 | 2022-03-08 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202241134A true TW202241134A (zh) | 2022-10-16 |
Family
ID=80952297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111108836A TW202241134A (zh) | 2021-04-02 | 2022-03-10 | 用於視頻譯碼的圖片方位和品質度量補充增強資訊訊息 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP4315865A1 (zh) |
JP (1) | JP2024512602A (zh) |
KR (1) | KR20230159427A (zh) |
BR (1) | BR112023019239A2 (zh) |
TW (1) | TW202241134A (zh) |
WO (1) | WO2022213006A1 (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130116782A (ko) * | 2012-04-16 | 2013-10-24 | 한국전자통신연구원 | 계층적 비디오 부호화에서의 계층정보 표현방식 |
US10110652B2 (en) * | 2014-10-14 | 2018-10-23 | Intel IP Corporation | Carriage of media content quality information |
US11089359B1 (en) * | 2019-05-12 | 2021-08-10 | Facebook, Inc. | Systems and methods for persisting in-band metadata within compressed video files |
-
2022
- 2022-03-09 WO PCT/US2022/071051 patent/WO2022213006A1/en active Application Filing
- 2022-03-09 BR BR112023019239A patent/BR112023019239A2/pt unknown
- 2022-03-09 KR KR1020237031913A patent/KR20230159427A/ko unknown
- 2022-03-09 EP EP22713243.8A patent/EP4315865A1/en active Pending
- 2022-03-09 JP JP2023558820A patent/JP2024512602A/ja active Pending
- 2022-03-10 TW TW111108836A patent/TW202241134A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
JP2024512602A (ja) | 2024-03-19 |
EP4315865A1 (en) | 2024-02-07 |
WO2022213006A1 (en) | 2022-10-06 |
BR112023019239A2 (pt) | 2023-10-17 |
KR20230159427A (ko) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW202110189A (zh) | 用於視訊寫碼的環繞運動補償 | |
CN114258675A (zh) | 用于视频编码的跨分量自适应环路滤波 | |
TW202127873A (zh) | 用於視頻寫碼中的子圖片的參考子圖片縮放比率 | |
CN113924776A (zh) | 使用不同的色度格式的具有未经滤波的参考样本的视频译码 | |
TW202106023A (zh) | 調色板模式下的增量量化參數訊令 | |
KR20230038709A (ko) | 다중 적응형 루프 필터 세트들 | |
TW202131676A (zh) | 視訊編碼中針對參考圖片重取樣的環繞偏移 | |
TW202143711A (zh) | 用於具有混合網路抽象層(nal)單元類型的視訊的高階語法 | |
CN115244934A (zh) | 视频编解码语法 | |
CN114982233A (zh) | 用信号通知视频译码中的缩放矩阵 | |
CN114830673A (zh) | 用于多个层的共享解码器图片缓冲器 | |
CN113994706A (zh) | 视频译码中的色度增量量化参数 | |
TW202205865A (zh) | 解塊濾波器參數訊號傳遞 | |
CN114930821A (zh) | 视频编解码中的自适应色彩变换的qp偏移的灵活信令通知 | |
US11895336B2 (en) | Picture orientation and quality metrics supplemental enhancement information message for video coding | |
WO2019161102A1 (en) | Signaling 360-degree video information | |
TW202215846A (zh) | 約束用於以不同位元深度對視頻資料進行譯碼的自適應迴路濾波的操作位元深度 | |
TW202127891A (zh) | 用於視訊編碼的高階語法中子圖像的訊令編號 | |
CN113994675A (zh) | 用于bdpcm模式的最大允许块大小 | |
TW202241134A (zh) | 用於視頻譯碼的圖片方位和品質度量補充增強資訊訊息 | |
TW202243482A (zh) | 用於視訊寫碼的圖片方位和品質度量補充增強資訊訊息 | |
CN116848845A (zh) | 用于视频译码的图片方位和质量度量补充增强信息消息 | |
CN117121490A (zh) | 用于视频译码的图片方位和质量度量补充增强信息消息 | |
TW202408247A (zh) | 補充增強資訊(sei)清單指示 | |
TW202348030A (zh) | 用於視訊譯碼中的訊框間譯碼的多重變換選擇的靈活啟動 |