TW202312739A - 綠色中繼資料訊號傳遞 - Google Patents

綠色中繼資料訊號傳遞 Download PDF

Info

Publication number
TW202312739A
TW202312739A TW111128764A TW111128764A TW202312739A TW 202312739 A TW202312739 A TW 202312739A TW 111128764 A TW111128764 A TW 111128764A TW 111128764 A TW111128764 A TW 111128764A TW 202312739 A TW202312739 A TW 202312739A
Authority
TW
Taiwan
Prior art keywords
bitstream
syntax element
picture
period
video
Prior art date
Application number
TW111128764A
Other languages
English (en)
Inventor
勇 何
莫哈美德塞伊德 克班
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW202312739A publication Critical patent/TW202312739A/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/127Prioritisation of hardware or computational resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

揭示用於處理視訊資料的系統、方法、裝置和電腦可讀取媒體。例如,一種用於處理視訊資料的裝置,可以包括:至少一個記憶體;及耦合到至少一個記憶體的至少一個處理器,該至少一個處理器被配置為:獲得位元串流;檢索與位元串流相關聯的細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;檢索與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;及基於細微性類型語法元素和時段類型語法元素解碼位元串流的一部分。

Description

綠色中繼資料訊號傳遞
本專利申請案主張2021年8月9日提出申請的美國臨時申請案第63/231,015號的權益,該申請案的全部內容在此經由引用併入並用於所有目的。
本案通常係關於視訊處理。例如,本案的態樣係關於改進關於綠色中繼資料的視訊譯碼技術(例如,編碼及/或解碼視訊)。
數位視訊功能可以整合到各種設備中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數碼相機、數位錄音設備、數位媒體播放機、視訊遊戲裝置、視訊遊戲機、蜂巢或衛星無線電話、所謂的「智慧型電話」、視訊電話會議設備、視訊串流設備等。此類設備允許對視訊資料進行處理和輸出以供消費。數位視訊資料包括大量的資料,以滿足消費者和視訊提供商的需求。例如,視訊資料的消費者期望具有高保真度、解析度、畫面播放速率等的最高品質的視訊。因此,滿足這些需求所需的大量視訊資料給處理和儲存視訊資料的通訊網路和設備帶來了負擔。
數位視訊設備可以實施視訊譯碼技術來壓縮視訊資料。根據一或多個視訊譯碼標準或格式執行視訊譯碼。例如,視訊譯碼標準或格式包括通用視訊譯碼(VVC)、高效視訊譯碼(HEVC)、高級視訊譯碼(AVC)、MPEG-2第2部分譯碼(MPEG代表運動圖片專家組)等,以及專有視訊譯轉碼器-解碼器(codec)/格式,例如由開放媒體聯盟開發的AOMedia Video 1(AV1)。視訊譯碼通常採用利用視訊影像或序列中存在的冗餘的預測方法(例如,訊框間預測、訊框內預測等)。視訊譯碼技術的一個目標是將視訊資料壓縮成使用較低位元速率的形式,同時避免或最小化視訊品質的降低。隨著不斷發展的視訊服務的出現,需要具有更高譯碼效率的譯碼技術。
本文描述了用於處理視訊資料的系統和技術。根據至少一個實例,提供了一種處理視訊的方法,包括:獲得位元串流;及檢索與位元串流相關聯的細微性類型語法元素,細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
揭示用於處理視訊資料的系統、方法、裝置和電腦可讀取媒體。在一個說明性實例中,提供了一種用於處理視訊資料的裝置。該裝置包括:至少一記憶體;及耦合到至少一個記憶體的至少一個處理器(例如,在電路中實施),該至少一個處理器被配置為:獲得位元串流;檢索與位元串流相關聯的細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;檢索與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;及基於細微性類型語法元素和時段類型語法元素解碼位元串流的一部分。
在另一實例中,提供了一種用於處理視訊資料的方法。該方法包括:獲得位元串流;檢索與位元串流相關聯的細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;檢索與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;及基於細微性類型語法元素和時段類型語法元素解碼位元串流的一部分。
在另一實例中,提供了一種具有指令的非暫時性電腦可讀取媒體,當該指令由一或多個處理器執行時使得一或多個處理器:獲得位元串流;檢索與位元串流相關聯的細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;檢索與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;及基於細微性類型語法元素和時段類型語法元素解碼位元串流的一部分。
在另一實例中,提供了一種用於處理視訊資料的裝置。該裝置包括:用於獲得位元串流的部件;用於檢索與位元串流相關聯的細微性類型語法元素的部件,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;用於檢索與位元串流相關聯的時段類型語法元素的部件,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;及用於基於細微性類型語法元素和時段類型語法元素解碼位元串流的一部分的部件。
在另一實例中,提供了一種用於處理視訊資料的裝置。該裝置包括:至少一記憶體;及耦合到至少一個記憶體的至少一個處理器(例如,在電路中實施),該至少一個處理器被配置為:獲得視訊資料;為位元串流產生細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;為位元串流產生與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;產生與視訊資料相關聯的位元串流,該位元串流包括細微性類型語法元素和時段類型語法元素;及輸出所產生的位元串流。
在另一實例中,提供了一種用於處理視訊資料的方法。該方法包括:獲得視訊資料;為位元串流產生細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;為位元串流產生與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;產生與視訊資料相關聯的位元串流,該位元串流包括細微性類型語法元素和時段類型語法元素;及輸出所產生的位元串流。
在另一實例中,提供了一種具有指令的非暫時性電腦可讀取媒體,當該指令由一或多個處理器執行時使得一或多個處理器:獲得視訊資料;為位元串流產生細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;為位元串流產生與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;產生與視訊資料相關聯的位元串流,該位元串流包括細微性類型語法元素和時段類型語法元素;及輸出所產生的位元串流。
在另一實例中,提供了一種用於處理視訊資料的裝置。該裝置包括:用於獲得視訊資料的部件;用於為位元串流產生細微性類型語法元素的部件,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;用於為位元串流產生與位元串流相關聯的時段類型語法元素的部件,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;用於產生與視訊資料相關聯的位元串流的部件,該位元串流包括細微性類型語法元素和時段類型語法元素;及用於輸出所產生的位元串流的部件。
根據至少一個其他實例,提供了一種用於處理視訊資料的裝置,包括至少一個記憶體和耦合到記憶體的一或多個處理器(例如,在電路中實施)。該一或多個處理器被配置為:獲得位元串流;及檢索與位元串流相關聯的細微性類型語法元素,細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
根據至少一個其他實例,提供了一種包括指令的非暫時性電腦可讀取媒體,當該指令由一或多個處理器執行時使得一或多個處理器:獲得位元串流;及檢索與位元串流相關聯的細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
根據至少一個其他實例,提供了一種用於處理視訊資料的裝置,包括:用於獲得位元串流的部件;及用於檢索與位元串流相關聯的細微性類型語法元素的部件,細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的圖片。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的切片(slice)。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的圖塊(tile)。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的子圖片。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的可擴展層(scalable layer)。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的譯碼樹單元(Coding Tree Unit ,CTU)行。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括檢索與位元串流相關聯的時段類型語法元素,該時段類型語法元素指定CM適用的即將到來的時段的類型。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括檢索與位元串流相關聯的圖片級別CM語法結構,該圖片級別CM語法結構指定在一時段內一或多個圖片的複雜度度量。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括檢索與位元串流相關聯的細微性級別CM語法結構,該細微性級別CM語法結構指定在一時段內一或多個實體的細微性級別複雜度度量。在一些態樣,一或多個實體包括切片、圖塊、子圖片和層中的至少一個。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括檢索與位元串流相關聯的子圖片語法元素,當時段跨越多個圖片時,在CM中訊號傳遞通知指示子圖片辨識符(ID)的子圖片語法元素。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括檢索與位元串流相關聯的譯碼樹塊(CTB)數語法元素,當細微性類型等於切片或圖塊並且時段跨越多個圖片時,可以在CM中訊號傳遞通知指示在一時段內的譯碼樹亮度塊的總數的CTB數語法元素。
在一些態樣中,上述方法、裝置和非暫時性電腦可讀取媒體可以包括檢索與位元串流相關聯的平均譯碼樹塊(CTB)數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的平均數。
在一些態樣,當在位元串流的至少一部分中存在可用的訊框內譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
在一些態樣,當在位元串流的至少一部分中存在可用的訊框間譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括檢索與位元串流的一或多個細微性段相關聯的一或多個品質恢復度量。在一些態樣,位元串流的一或多個細微性段包括切片、圖塊和子圖片中的至少一個。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括:接收補充增強資訊(SEI)訊息;及從SEI訊息中檢索細微性類型語法元素。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括基於與位元串流相關聯的CM來決定裝置的操作頻率。
在一些態樣,該裝置包括解碼器。
根據至少一個其他實例,提供了一種處理視訊的方法,包括:獲得視訊資料;產生與視訊資料相關聯的位元串流;及為位元串流產生細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
根據至少一個其他實例,提供了一種用於處理視訊資料的裝置,包括至少一個記憶體和耦合到記憶體的一或多個處理器(例如,在電路中實施)。該一或多個處理器被配置為:獲得視訊資料;產生與視訊資料相關聯的位元串流;及為位元串流產生細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
根據至少一個其他實例,提供了一種包括指令的非暫時性電腦可讀取媒體,當該指令由一或多個處理器執行時使得一或多個處理器:獲得視訊資料;產生與視訊資料相關聯的位元串流;及為位元串流產生細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
根據至少一個其他實例,提供了一種用於處理視訊資料的裝置,包括:用於獲得視訊資料的部件;用於產生與視訊資料相關聯的位元串流的部件;及用於為位元串流產生細微性類型語法元素的部件,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的圖片。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的切片。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的圖塊。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的子圖片。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的可擴展層。
在一些態樣,細微性類型語法元素的值指定CM適用於位元串流的譯碼樹單元(CTU)行。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括為位元串流產生指定CM適用的即將到來的時段的類型的時段類型語法元素。
在一些態樣中,上述方法、裝置和非暫時性電腦可讀取媒體可以包括為位元串流產生指定一時段內一或多個圖片的複雜度度量的圖片級別CM語法結構。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括為位元串流產生指定一時段內一或多個實體的細微性級別複雜度度量的細微性級別CM語法結構。在一些態樣,一或多個實體包括切片、圖塊、子圖片和層中的至少一個。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括為位元串流產生子圖片語法元素,當時段跨越多個圖片時,在CM中訊號傳遞通知指示子圖片辨識符(ID)的子圖片語法元素。
在一些態樣中,上述方法、裝置和非暫時性電腦可讀取媒體可以包括為位元串流產生譯碼樹塊(CTB)數語法元素,當細微性類型等於切片或圖塊並且時段跨越多個圖片時,可以在CM中訊號傳遞通知指示在一時段內的譯碼樹亮度塊的總數的譯碼樹塊(CTB)數語法元素。
在一些態樣中,上述方法、裝置和非暫時性電腦可讀取媒體可以包括為位元串流產生平均譯碼樹塊(CTB)數語法元素,該平均譯碼樹塊(CTB)數語法元素指示每個圖片每細微性的CTB或4×4塊的平均數。
在一些態樣,當在位元串流的至少一部分中存在可用的訊框內譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
在一些態樣,當在位元串流的至少一部分中存在可用的訊框間譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括為位元串流產生與位元串流的一或多個細微性段相關聯的一或多個品質恢復度量。
在一些態樣,位元串流的一或多個細微性段包括切片、圖塊和子圖片中的至少一個。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括:產生補充增強資訊(SEI)訊息;及在SEI訊息中包括細微性類型語法元素。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括儲存位元串流。
在一些態樣,上述方法、裝置和非暫時性電腦可讀取媒體可以包括發送位元串流。
在一些態樣,該裝置包括編碼器。
在一些態樣,該設備是、是其一部分及/或包括行動設備(例如,行動電話或所謂的「智慧型電話」或其他行動設備)、可穿戴設備、擴展現實設備(例如,虛擬實境(VR)設備、增強現實(AR)設備或混合現實(MR)設備)、相機、個人電腦、膝上型電腦、伺服器電腦、車輛或車輛的計算設備或部件、機器人設備或系統、電視或其他設備。在一些態樣,該設備包括用於擷取一或多個影像的相機或多個相機。在一些態樣,該設備包括用於顯示一或多個影像、通知及/或其他可顯示資料的顯示器。在一些態樣,該設備可以包括一或多個感測器(例如,一或多個慣性量測單元(IMU),諸如一或多個陀螺儀、一或多個加速度計、其任何組合及/或其他感測器)。
本概要不意欲辨識所要求保護的主題的關鍵或基本特徵,亦不意欲單獨用於決定所要求保護的主題的範疇。應經由參考本專利的整個說明書的適當部分、任何或所有附圖和每項請求項來理解主題。
在參考以下說明書、申請專利範圍和附圖時,上述以及其他特徵和實施例將變得更加明顯。
下文提供本案的某些態樣和實施例。這些態樣和實施例中的一些可以獨立地應用,並且它們中的一些可以組合應用,如對於本發明所屬領域中具有通常知識者來說將是顯而易見的。在下文的描述中,為了解釋的目的,闡述了具體細節,以便提供對本案的實施例的透徹理解。然而,顯而易見的是,可以在沒有這些具體細節的情況下實施各種實施例。附圖和說明並不意欲限制。
隨後的描述僅提供示例性實施例,並不意欲限制本案的範疇、適用性或配置。相反,接下來對示例性實施例的描述將為本發明所屬領域中具有通常知識者提供實施示例性實施例的使能描述。應當理解,在不脫離如所附請求項中所述的應用的精神和範疇的情況下,可以對元件的功能和佈置進行各種改變。
視訊譯碼設備實施視訊壓縮技術以有效地對視訊資料進行編碼和解碼。視訊壓縮技術可包括應用不同的預測模式,包括空間預測(例如,訊框內預測或訊框內預測)、時間預測(例如,訊框間預測或訊框間預測)、層間預測(跨視訊資料的不同層,及/或其他預測技術,以減少或移除視訊序列中固有的冗餘。視訊轉碼器可以將原始視訊序列的每個圖片分割成稱為視訊塊或譯碼單元的矩形區域(下文更詳細地描述)。可以使用特定預測模式對這些視訊塊進行編碼。
視訊塊可以一或多個方式劃分為一組或多組較小的塊。塊可以包括譯碼樹塊、預測塊、變換塊或其他合適的塊。除非另有規定,否則通常對「塊」的引用可指此類視訊塊(例如,譯碼樹塊、譯碼塊、預測塊、變換塊或其他適當塊或子塊,如具有通常知識者將理解的一樣)。此外,這些塊中的每一個在本文中亦可以互換地稱為「單元」(例如,譯碼樹單元(CTU)、譯碼單元、預測單元(PU)、變換單元(TU)等)。在一些情況下,單元可以指示在位元串流中編碼的譯碼邏輯單元,而塊可以指示程序所針對的目標視訊訊框緩衝器的一部分。
對於訊框間預測模式,視訊轉碼器可以搜尋類似於在位於另一時間位置的訊框(或圖片)中編碼的塊的塊,該訊框(或圖片)被稱為參考訊框或參考圖片。視訊轉碼器可以將搜尋限制為距要編碼的塊的特定空間位移。可以使用包括水平位移分量和垂直位移分量的二維(2D)運動向量來定位最佳匹配。對於訊框內預測模式,視訊轉碼器可以基於來自同一圖片內先前編碼的相鄰塊的資料,使用空間預測技術形成預測塊。
視訊轉碼器可以決定預測誤差。例如,可以將預測決定為被編碼塊中的圖元值與預測塊中圖元值之間的差。預測誤差亦可以稱為殘差。視訊轉碼器亦可以對預測誤差應用變換(例如,離散餘弦變換(DCT)或其他合適的變換)來產生變換係數。在變換之後,視訊轉碼器可以對變換係數進行量化。量化的變換係數和運動向量可以使用語法元素來表示,並且與控制資訊一起形成視訊序列的譯碼表示。在一些實例中,視訊轉碼器可對語法元素進行熵解碼,從而進一步減少其表示所需的位元數。
視訊解碼器可以使用上面論述的語法元素和控制資訊,構造用於解碼當前訊框的預測資料(例如,預測塊)。例如,視訊解碼器可以添加預測塊和壓縮預測誤差。視訊解碼器可以經由使用量化係數加權變換基函數來決定壓縮預測誤差。重建訊框與原始訊框之間的差異稱為重建誤差。
具有國際標準編號ISO/IEC 23001-11的節能媒體消耗(綠色中繼資料或綠色MPEG)標準(其全部內容在此經由引用併入並用於所有目的)規定了綠色中繼資料,以促進在媒體消耗期間減少能源使用。用於節能解碼的綠色中繼資料指定了兩個資訊集:複雜度度量(CM)中繼資料和解碼操作減少請求(DOR-Req)中繼資料。例如,解碼器可以使用CM中繼資料來改變處理器的操作頻率,從而降低解碼器功耗。在一個說明性實例中,在點對點視訊會議應用中,遠端編碼器(其可以產生編碼位元串流)可以接收DOR-Req中繼資料,並且可以使用該DOR-Req中繼資料來修改位元串流的解碼複雜度,從而減少本端解碼器功耗。經由訊號傳遞通知位元串流的解碼複雜度,本端解碼器可以能夠估計解碼位元串流所需的功率量,並且基於例如經由請求較少(或更多)複雜度的位元串流而剩餘的電池功率量來潛在地調整位元串流。在一些情況下,補充增強資訊(SEI)訊息可用於在位元串流(例如,AVC、HEVC、VVC、AV1或其他流)中的訊號傳遞通知綠色中繼資料。
在ISO/IEC 23001-11第二版中規定了AVC和HEVC的綠色中繼資料。在第三版綠色MPEG(MPEG MDS20584_WG03_N00330)的工作草案中提出了支援VVC編碼器-解碼器(codec)的新的綠色中繼資料,並在各種細微性規定了CM。可以改進語法結構以支援各種時段類型上的更多細微性類型。此外,使用單一類型訊號傳遞通知切片、圖塊、子圖片或層細微性的CM可能會有問題。在一些情況下,諸如對於VVC,編碼器可以將被編碼的視訊的圖片(例如,訊框)劃分成一或多個部分,諸如切片、圖塊、子圖片、層等。例如,圖片可以被劃分成一或多個圖塊並且每個圖塊可以被劃分成一或多個塊。切片可以包括多個圖塊或圖塊內的多個塊。子圖片可以是一或多個完整的矩形切片,每個矩形切片覆蓋圖片的矩形區域。子圖片可以或可以不獨立於相同圖片的其他子圖片進行譯碼。
目前,諸如針對AVC/HEVC的解碼器,可以使用多個切片和多個圖塊來辨識CM是針對切片還是圖塊計算的。例如,當切片數等於圖塊數時,辨識CM細微性比較複雜。另外,AVC和HEVC不支援子圖片細微性。定義不同類型的切片細微性和圖塊細微性以及定義子圖片和層細微性將是有益的。
VVC允許在譯碼層視訊序列(CLVS)內用不同的子圖片替換子圖片。譯碼視訊序列(CVS)可以是CLVS的分層集合。在一些情況下,使用子圖片辨識符(ID)將CM映射到特定子圖片的訊號傳遞是必要的。
VVC亦允許在CLVS中改變解析度。在一些情況下,解析每個切片標頭以便匯出一時段內的總譯碼塊數以解譯每個切片或圖塊的規一化編碼統計可能會很複雜。切片標頭可以包括在切片中,並且切片標頭可以傳達關於相關聯切片的資訊。可以在圖片標頭中傳送應用於圖片的所有切片的資訊。指示CTB總數的語法元素將有利於簡化推導。
目前,當所有塊皆被訊框內譯碼時,CM提供訊框內譯碼塊統計。P和B切片可能具有比訊框間譯碼塊更多的訊框內譯碼塊,或者P或B圖片可能具有比訊框間譯碼塊更多的訊框內譯碼塊。因此,CM可能不能準確地表示複雜度。訊框內譯碼塊指的是基於同一圖片內的另一個塊預測的塊,而訊框間譯碼塊指的是基於來自不同圖片的另一個塊預測的塊。I切片指的是包括訊框內譯碼塊而不包括訊框間譯碼塊的切片。P和B切片可以包括訊框內譯碼塊和訊框間譯碼塊兩者。
此外,在VVC中,品質度量可以分別應用於單個子圖片,而不是將品質度量應用於整個圖片。
本案描述了用於提供增強的綠色中繼資料訊號傳遞(諸如用於改進複雜度度量(CM)訊號傳遞)的系統、裝置、方法和電腦可讀取媒體(統稱為「系統和技術」)。例如,在一些情況下,提供細微性類型指示符(例如,細微性類型語法元素,諸如granularity_type)以支援各種細微性,諸如切片、圖塊、子圖片、可擴展層及/或其他細微性。在一些實例中,修改了時段類型語法元素(例如,period_type)的語義。
在一些情況下,系統和技術提供改進的複雜度度量(CM)訊號傳遞。例如,本文描述的系統和技術為視訊譯碼器(例如,視訊轉碼器、視訊轉碼器或組合的視訊轉碼器-解碼器)提供了為視訊的多個圖片指定適用於圖片的一部分(諸如切片、圖塊、子圖片及/或層)的CM值的能力。例如,如前述,可以為編碼視訊定義子圖片。子圖片包括圖片的一部分,諸如圖片的右上角。可以為子圖片指定CM,其中該CM不同於為圖片的切片(或其他部分)指定的至少一個其他CM。可以針對多個圖片(例如針對來自第一圖片的30個圖片)定義一次與子圖片相關聯的CM值。CM可以作為包括在編碼視訊中的中繼資料的一部分提供。允許為跨多個訊框的子圖片指定單個CM值有助於減小編碼視訊的中繼資料的大小,同時允許針對定義圖片的一部分的CM增加靈活性和細微性。
在一些態樣,提供了與解析度改變相關聯的CM訊號傳遞改變。在一些情況下,提供關於訊框內譯碼塊統計的CM訊號傳遞改變。在一些態樣,提供了子影像品質度量。
本文描述的系統和技術可以應用於任何現有的視訊譯碼器,諸如通用視訊譯碼(VVC)、高效視訊譯碼(HEVC)、高級視訊譯碼(AVC)、VP9、AV1格式/解碼器及/或正在開發或將要開發的其他視訊譯碼標準、解碼器、格式等。
圖1是圖示包括編碼設備104和解碼設備112的系統100的實例的方塊圖。編碼設備104可以是源設備的一部分,解碼設備112可以是接收設備的一部分。源設備及/或接收設備可以包括電子設備,例如行動或固定電話手持機(例如,智慧手機、蜂巢式電話等)、桌上型電腦、膝上型電腦或筆記型電腦、平板電腦、機上盒、電視、相機、顯示裝置、數位媒體播放機,視訊遊戲控制台、視訊流式設備、網際網路協定(IP)相機或任何其他合適的電子設備。在一些實例中,源設備和接收設備可以包括用於無線通訊的一或多個無線收發器。本文描述的譯碼技術適用於各種多媒體應用中的視訊譯碼,包括流式視訊發送(例如,經由網際網路)、電視廣播或發送、用於儲存在資料儲存媒體上的數位視訊的編碼、儲存在資料儲存媒體上的數位視訊的解碼,或其他應用。如本文所用,術語譯碼可指編碼及/或解碼。在一些實例中,系統100可以支援單向或雙向視訊發送以支援諸如視訊會議、視訊流式、視訊重播、視訊廣播、遊戲及/或視訊電話的應用。
編碼設備104(或編碼器)可用於使用視訊譯碼標準、格式、譯碼器或協定對視訊資料進行編碼以產生編碼的視訊位元串流。視訊譯碼標準和格式/譯碼器的實例包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual、ITU-T H.264(亦稱為ISO/IEC MPEG-4 AVC),包括其可擴展視訊譯碼(SVC)和多視圖視訊譯碼(MVC)擴展、高效視訊譯碼(HEVC)或ITU-T H.265和通用視訊譯碼(VVC)或ITU-T H.266。存在用於多層視訊譯碼的HEVC的各種擴展,包括範圍和螢幕內容譯碼擴展、三維視訊譯碼(3D-HEVC)和多視圖擴展(MV-HEVC)以及可縮放擴展(SHVC)。HEVC及其擴展由視訊譯碼聯合協調團隊(JCT-VC)以及ITU-T視訊譯碼專家組(VCEG)的3D視訊譯碼擴展開發聯合協調團隊(JCT-3V)和 ISO/IEC電影專家組(MPEG)開發的。VP9、由開放媒體聯盟(AOMedia)的開放媒體聯盟開發的AOMedia Video 1(AV1)和基本視訊譯碼(EVC)是可應用本文所述技術的其他視訊譯碼標準。
本文描述的技術可以應用於任何現有視訊譯碼器(例如,高效視訊譯碼(HEVC)、高級視訊譯碼(AVC)或其他合適的現有視訊譯碼器),及/或可以是用於正在開發的任何視訊譯碼標準及/或未來視訊譯碼標準(例如,VVC及/或正在開發或將要開發的其他視訊譯碼標準)的有效譯碼工具。例如,可以使用諸如VVC、HEVC、AVC及/或其擴展的視訊譯碼器來執行本文描述的實例。然而,本文描述的技術和系統亦可以適用於其他譯碼標準、譯碼器或格式,例如MPEG、JPEG(或用於靜止影像的其他譯碼標準)、VP9、AV1、其擴展,或已經可用或尚未可用或開發的其他合適的譯碼標準。例如,在一些實例中,編碼設備104及/或解碼設備112可以根據專有視訊譯碼器/格式操作,例如AV1、AVI的擴展及/或AV1的後續版本(例如,AV2),或其他專有格式或行業標準。因此,儘管可以參考特定視訊譯碼標準來描述本文描述的技術和系統,但本發明所屬領域中具有通常知識者將理解,不應將描述解釋為僅適用於該特定標準。
參照圖1,視訊源102可以向編碼設備104提供視訊資料。視訊源102可以是源設備的一部分,或者可以是除源設備之外的設備的一部分。視訊源102可以包括視訊擷取裝置(例如,攝像機、攝像電話、視訊電話等)、包含儲存的視訊的視訊存檔、提供視訊資料的視訊伺服器或內容提供者、從視訊伺服器或內容提供者接收視訊的視訊饋送介面,用於產生電腦圖形視訊資料的電腦圖形系統、這些源的組合或任何其他合適的視訊源。
來自視訊源102的視訊資料可以包括一或多個輸入圖片或訊框。圖片或訊框是靜止影像,在一些情況下是視訊的一部分。在一些實例中,來自視訊源102的資料可以是不是視訊的一部分的靜止影像。在HEVC、VVC和其他視訊譯碼規範中,視訊序列可以包括一系列圖片。圖片可以包括三個樣點陣列,表示為SL、SCb和SCr。SL是亮度樣點的二維陣列,SCb是Cb色度樣點的二維陣列,SCr是Cr色度樣點的二維陣列。色度樣點在本文中亦可稱為「色度」樣點。圖元可以參考圖片陣列中的給定位置的所有三個分量(亮度和色度樣點)。在其他實例中,圖片可以是單色的並且可以僅包括亮度樣點的陣列,在這種情況下,術語圖元和樣點可以互換使用。關於本文描述的用於說明目的的參考單個樣點的實例技術,相同的技術可以應用於圖元(例如,圖片陣列中的給定位置的所有三個樣點分量)。關於本文描述的用於說明目的的參考圖元(例如,圖片陣列中的給定位置的所有三個樣點分量)的實例技術,相同的技術可以應用於單個樣點。
編碼設備104的編碼器引擎106(或編碼器)對視訊資料進行編碼以產生編碼的視訊位元串流。在一些實例中,編碼的視訊位元串流(或「視訊位元串流」或「位元串流」)是一系列一或多個譯碼視訊序列。譯碼視訊序列(CVS)包括一系列存取單元(AU),從在基本層中具有隨機存取點圖片並且具有特定屬性的AU開始,直到並且不包括在基本層中具有隨機存取點圖片並且具有特定屬性的下一AU。例如,啟動CVS的隨機存取點圖片的特定屬性可以包括等於1的RASL標誌(例如,NoRaslOutputFlag)。否則,隨機存取點圖片(RASL標誌等於0)不會啟動CVS。存取單元(AU)包括一或多個譯碼圖片和與共享相同輸出時間的譯碼圖片相對應的控制資訊。圖片的譯碼切片在位元串流級別被封裝到稱為網路抽象層(NAL)單元的資料單元中。例如,HEVC視訊位元串流可以包括一或多個包括NAL單元的CVS。每個NAL單元皆有NAL單元標頭。在一個實例中,標頭對於H.264/AVC是一個位元組(除了多層擴展),對於HEVC是兩個位元組。NAL單元標頭中的語法元素採用指定的位元,因此對所有類型的系統和傳輸層可見,例如傳輸串流、即時傳輸(RTP)協定、檔案格式等。
HEVC標準中存在兩類NAL單元,包括視訊譯碼層(VCL)NAL單元和非VCL NAL單元。VCL NAL單元包括形成譯碼視訊位元串流的譯碼圖片資料。例如,在VCL NAL單元中存在形成譯碼視訊位元串流的位元序列。VCL NAL單元可以包括譯碼圖片資料的一個切片或切片片段(如下該),非VCL NAL單元包括與一或多個譯碼圖片相關的控制資訊。在一些情況下,NAL單元可以被稱為封包。HEVC AU包括包含譯碼圖片資料的VCL NAL單元和對應於譯碼圖片資料的非VCL NAL單元(若有的話)。除其他資訊外,非VCL NAL單元亦可以包含具有與解碼視訊位元串流相關的高級資訊的參數集。例如,參數集可以包括視訊參數集(VPS)、序列參數集(SPS)和圖片參數集(PPS)。在一些情況下,位元串流的每個切片或其他部分可以參考單個活動PPS、SPS及/或VPS,以允許解碼設備112存取可用於解碼位元串流的切片或其他部分的資訊。
NAL單元可以包含形成視訊資料的譯碼表示的位元序列(例如,編碼的視訊位元串流、位元串流的CVS等),例如視訊中圖片的譯碼表示。編碼器引擎106經由將每個圖片分割成多個切片來產生圖片的譯碼表示。切片獨立於其他切片,因此切片中的資訊在譯碼時不依賴於來自同一圖片中其他切片的資料。切片包括一或多個切片片段,包括獨立切片片段和一或多個依賴於先前切片片段的從屬切片片段(若存在)。
在HEVC中,切片被分割成亮度樣點和色度樣點的譯碼樹塊(CTB)。亮度樣點的CTB和色度樣點的一或多個CTB,連同樣點的語法,被稱為譯碼樹單元(CTU)。CTU亦可以稱為「樹塊」或「最大譯碼單元」(LCU)。CTU是HEVC編碼的基本處理單元。CTU可以分割為多個不同大小的譯碼單元(CU)。CU包含被稱為譯碼塊(CB)的亮度和色度樣點陣列。
亮度和色度CB可以被進一步分割為預測塊(PB)。PB是亮度分量或色度分量的樣點塊,其使用相同的運動參數進行訊框間預測或塊內複製(IBC)預測(當可用或啟用時)。亮度PB和一或多個色度PB連同相關聯的語法一起形成預測單元(PU)。對於訊框間預測,在位元串流中針對每個PU訊號傳遞通知運動參數集合(例如,一或多個運動向量、參考索引等),並用於亮度PB和一或多個色度PB的訊框間預測。運動參數亦可以稱為運動資訊。CB亦可以被分割成一或多個變換塊(TB)。TB表示應用殘差變換(例如,在一些情況下應用相同的二維變換)對預測殘留訊號進行譯碼的顏色分量的樣點的方形塊。變換單元(TU)表示亮度和色度樣點的TB以及相應的語法元素。下文更詳細地描述變換譯碼。
CU的大小對應於譯碼模式的大小,並且可以是正方形。例如,CU的大小可以是8×8樣點、16×16樣點、32×32樣點、64×64樣點,或者任何其他適當大小,直到相應的CTU的大小。短語「N×N」在本文中用於在垂直和水平尺寸態樣來代表視訊塊的圖元尺寸(例如,8圖元×8圖元)。塊中的圖元可以在行和列中排列。在一些實施方式中,塊在水平方向上可不具有與在垂直方向上相同數量的圖元。例如,與CU相關聯的語法資料可以描述將CU分割成一或多個PU。在CU是訊框內預測模式編碼還是訊框間預測模式編碼之間,分區模式可以不同。PU可以被分割成非正方形。例如,與CU相關聯的語法資料亦可以描述根據CTU將CU分割成一或多個TU。TU的形狀可以是正方形或非正方形。
根據HEVC標準,可以使用變換單元(TU)執行變換。TU可能因不同的CU而不同。可以根據給定CU內的PU的大小來決定TU的大小。TU可能與PU大小相同或更小。在一些實例中,可以使用稱為殘差四叉樹(RQT)的四叉樹結構將對應於CU的殘差樣點細分為更小的單元。RQT的葉節可以對應於TU。與TU相關聯的圖元差值可以被變換以產生變換係數。隨後可由編碼器引擎106量化變換係數。
一旦視訊資料的圖片被分割成CU,編碼器引擎106使用預測模式預測每個PU。隨後從原始視訊資料中減去預測單元或預測塊以獲得殘差(如下所述)。對於每個CU,可以使用語法資料在位元串流內訊號傳遞通知預測模式。預測模式可以包括訊框內預測(或圖片內預測)或訊框間預測(或圖片間預測)。訊框內預測利用圖片內空間相鄰樣點之間的相關性。例如,使用訊框內預測,從同一圖片中的相鄰影像資料預測每個PU,例如,使用DC預測來尋找PU的平均值、使用平面預測來將平面表面擬合到PU、使用方向預測來從相鄰資料外推或使用任何其他合適類型的預測。訊框間預測使用圖片之間的時間相關性,以便推導出針對影像樣點塊的運動補償預測。例如,使用訊框間預測,使用來自一或多個參考圖片(按輸出順序在當前圖片之前或之後)中的影像資料的運動補償預測來預測每個PU。例如,可以在CU級別做出是使用圖片間預測還是使用圖片內預測來對圖片區域進行解碼的決定。
編碼器引擎106和解碼器引擎116(在下文更詳細地描述)可以被配置為根據VVC操作。根據VVC,視訊譯碼器(例如編碼器引擎106及/或解碼器引擎116)將圖片分割成複數個譯碼樹單元(CTU)(其中亮度樣點的CTB和色度樣點的一或多個CTB以及用於樣點的語法被稱為CTU)。視訊譯碼器可以根據樹結構(例如四叉樹二叉樹(QTBT)結構或多類型樹(MTT)結構)來分割CTU。QTBT結構消除了多個分區類型的概念,例如HEVC的CU、PU和TU的分隔。QTBT結構包括兩個級別:包括根據四叉樹分割而分割的第一級,根據二叉樹分割而分割的第二級。QTBT結構的根節點對應於CTU。二叉樹的葉節點對應於譯碼單元(CU)。
在MTT分割結構中,塊可以使用四叉樹分割、二叉樹分割和一或多個類型的三叉樹分割來分割。三叉樹分割是其中塊被分割成三個子塊的分割。在一些實例中,三叉樹分割將一個塊劃分為三個子塊,而不經由中心劃分初始塊。MTT中的分割類型(例如三叉樹、二叉樹和三叉樹)可以是對稱或不對稱的。
當根據AV1譯碼器操作時,視訊轉碼器200和視訊解碼器300可以被配置為以塊為單位對視訊資料進行解碼。在AV1中,可處理的最大譯碼塊稱為超級塊。在AV1中,一個超級塊可以是128×128亮度樣點或64×64亮度樣點。然而,在後繼視訊譯碼格式(例如,AV2)中,超級塊可以由不同(例如,較大)的亮度樣點大小定義。在一些實例中,超級塊是塊四叉樹的頂層。視訊轉碼器200可進一步將超級塊分割成較小的譯碼塊。視訊轉碼器200可以使用正方形或非正方形分割將超級塊和其他譯碼塊分割成較小的塊。非正方形塊可以包括N/2×N、N×N/2、N/4×N和N×N/4塊。視訊轉碼器200和視訊解碼器300可以對每個譯碼塊執行單獨的預測和變換處理。
AV1亦定義了視訊資料的圖塊。圖塊是可以獨立於其他圖塊進行譯碼的超級塊的矩形陣列。亦即,視訊轉碼器200和視訊解碼器300可以分別對圖塊內的譯碼塊進行編碼和解碼,而不使用來自其他圖塊的視訊資料。然而,視訊轉碼器200和視訊解碼器300可以執行跨圖塊邊界的濾波。圖塊的大小可以是均勻的或不均勻的。基於圖塊的譯碼可以實現編碼器和解碼器實施方式的並行處理及/或多執行緒。
在一些實例中,視訊譯碼器可以使用單個QTBT或MTT結構來表示亮度和色度分量中的每一個,而在其他實例中,視訊譯碼器可以使用兩個或兩個以上QTBT或MTT結構,例如用於亮度分量的一個QTBT或MTT結構和用於兩個色度分量的另一QTBT或MTT結構(或用於各自色度分量的兩個QTBT及/或MTT結構)。
視訊譯碼器可以被配置為使用四叉樹分割、QTBT分割、MTT分割、超級塊分割或其他分割結構。
在一些實例中,圖片的一或多個切片被分配切片類型。切片類型包括訊框內譯碼切片(I切片)、訊框間譯碼P切片和訊框間譯碼B切片。I切片(訊框內譯碼訊框,獨立可解碼)是僅由訊框內預測進行譯碼的圖片的切片,並且因此是獨立可解碼的,因為I切片僅需要訊框內的資料來預測該切片的任何預測單元或預測塊。P切片(單向預測訊框)是可以用訊框內預測和單向訊框間預測進行譯碼的圖片的切片。P切片內的每個預測單元或預測塊用訊框內預測或訊框間預測進行譯碼。當應用訊框間預測時,預測單元或預測塊僅由一個參考圖片預測,並且因此參考樣點僅來自一訊框的一個參考區域。B切片(雙向預測訊框)是可以用訊框內預測和訊框間預測(例如,雙向預測或單向預測進行譯碼的圖片的切片。B切片的預測單元或預測塊可以從兩個參考圖片進行雙向預測,其中每個圖片貢獻一個參考區域,並且兩個參考區域的樣點集被加權(例如,具有相等的權重或具有不同的權重)以產生雙向預測塊的預測訊號。如前述,一個圖片的切片被獨立地譯碼。在一些情況下,圖片可被譯碼為僅一個切片。
如前述,圖片的圖片內預測利用圖片內空間相鄰樣點之間的相關性。存在複數個訊框內預測模式(亦稱為「訊框內模式」)。在一些實例中,亮度塊的訊框內預測包括35個模式,包括平面模式、DC模式和33個角度模式(例如,對角線訊框內預測模式和與對角線訊框內預測模式相鄰的角度模式)。訊框內預測的35種模式的索引如下文的表1所示。在其他實例中,可以定義更多訊框內模式,包括可能尚未由33個角度模式表示的預測角度。在其他實例中,與角度模式相關聯的預測角度可以不同於HEVC中使用的預測角度。
訊框內預測模式 相關名稱
0 訊框內_平面
1 訊框內_DC
2..34 訊框內_角度2..訊框內_角度3
表1–訊框內預測模式和相關名稱的規範
圖片間預測使用圖片之間的時間相關性,以便推導出針對影像樣點塊的運動補償預測。使用平移運動模型,塊在先前解碼的圖片(參考圖片)中的位置由運動向量(
Figure 02_image001
)指示,其中
Figure 02_image003
指定參考塊相對於當前塊的位置的水平位移,
Figure 02_image005
指定參考塊相對於當前塊的位置的垂直位移。在一些情況下,運動向量(
Figure 02_image007
Figure 02_image005
)可以是整數樣點精度(亦稱為整數精度),在這種情況下,運動向量指向參考訊框的整數圖元網格(或整數圖元樣點網格)。在一些情況下,運動向量(
Figure 02_image007
Figure 02_image005
)可以是分數樣點精度(亦稱為分數圖元精度或非整數精度)以更準確地擷取基礎物件的運動,而不限於參考訊框的整數圖元網格。運動向量的精度可以由運動向量的量化級別來表示。例如,量化級別可以是整數精度(例如,1圖元)或分數圖元精度(例如,¼圖元、½圖元或其他子圖元值)。當對應的運動向量具有分數取樣精度時,對參考圖片應用內插以推導出預測訊號。例如,可以對整數位置處可用的樣點進行濾波(例如,使用一或多個內插濾波器)以估計分數位置處的值。先前解碼的參考圖片由參考圖片列表的參考索引(refIdx)指示。運動向量和參考索引可以稱為運動參數。可以執行兩種圖片間預測,包括單預測和雙預測。
在使用雙預測(亦稱為雙向訊框間預測)的訊框間預測中,使用兩個運動參數集合(
Figure 02_image009
Figure 02_image011
Figure 02_image013
Figure 02_image015
)來產生兩個運動補償預測(來自相同的參考圖片或者可能來自不同的參考圖片)。例如,對於雙預測,每個預測塊使用兩個運動補償預測訊號,並且產生B個預測單元。隨後將這兩個運動補償預測合併以得到最終的運動補償預測。例如,可以經由平均來組合兩個運動補償預測。在另一實例中,可以使用加權預測,在此種情況下,可以對每個運動補償預測應用不同的權重。可用於雙預測的參考圖片儲存在兩個單獨的列表中,表示為列表0和列表1。可以使用運動估計程序在編碼器處推導出運動參數。
在使用單預測(亦稱為單向訊框間預測)的訊框間預測中,使用一個運動參數集合(
Figure 02_image009
Figure 02_image011
)從參考圖片產生運動補償預測。例如,對於單預測,每個預測塊最多使用一個運動補償預測訊號,並且產生P個預測單元。
PU可以包括與預測程序相關的資料(例如,運動參數或其他合適的資料)。例如,當使用訊框內預測對PU進行編碼時,PU可以包括描述用於PU的訊框內預測模式的資料。作為另一實例,當使用訊框間預測對PU進行編碼時,PU可以包括定義用於PU的運動向量的資料。定義用於PU的運動向量的資料可以描述,例如,運動向量的水平分量(
Figure 02_image003
)、運動向量的垂直分量(
Figure 02_image005
)、運動向量的解析度(例如,整數精度、四分之一圖元精度或八分之一圖元精度)、運動向量指向的參考圖片,運動向量的參考索引、參考圖片列表(例如,列表0、列表1或列表C)或其任何組合。
AV1包括用於編碼和解碼視訊資料的譯碼塊的兩種通用技術。兩種通用技術是訊框內預測(例如,訊框內預測或空間預測)和訊框間預測(例如,訊框間預測或時間預測)。在AV1的上下文中,當使用訊框內預測模式預測當前視訊資料訊框的塊時,視訊轉碼器200和視訊解碼器300不使用來自其他視訊資料訊框的視訊資料。對於大多數訊框內預測模式,視訊編碼設備104基於當前塊中的樣點值與從同一訊框中的參考樣點產生的預測值之間的差對當前訊框的塊進行編碼。視訊編碼設備104基於訊框內預測模式決定從參考樣點產生的預測值。
在使用訊框內及/或訊框間預測執行預測之後,編碼設備104可以執行變換和量化。例如,在預測之後,編碼器引擎106可以計算對應於PU的殘差值。殘差值可以包括被譯碼的圖元的當前塊(PU)和用於預測當前塊的預測塊(例如,當前塊的預測版本)之間的圖元差值。例如,在產生預測塊(例如,發出訊框間預測或訊框內預測)之後,編碼器引擎106可以經由從當前塊減去由預測單元產生的預測塊來產生殘差塊。殘差塊包括量化當前塊的圖元值和預測塊的圖元值之間的差異的圖元差值集合。在一些實例中,殘差塊可以以二維塊格式(例如,二維矩陣或圖元值陣列)來表示。在此類實例中,殘差塊是圖元值的二維表示。
在執行預測之後可能剩餘的任何殘差資料使用塊變換進行變換,塊變換可以基於離散餘弦變換、離散正弦變換、整數變換、小波變換、其他合適的變換函數或其任何組合。在一些情況下,一或多個塊變換(例如,大小為32×32、16×16、8×8、4×4或其他合適大小)可應用於每個CU中的殘差資料。在一些實施例中,TU可用於由編碼器引擎106實施的變換和量化程序。具有一或多個PU的給定CU亦可以包括一或多個TU。如下文進一步詳細描述的,可以使用塊變換將殘值變換成變換係數,隨後可以使用TU進行量化和掃瞄以產生用於熵譯碼的序列化變換係數。
在使用CU的PU進行訊框內預測或訊框間預測進行譯碼之後的一些實施例中,編碼器引擎106可以計算CU的TU的殘差資料。PU可以包括空間域(或圖元域)中的圖元資料。在應用塊變換之後,TU可以包括變換域中的係數。如前述,殘差資料可以對應於未編碼圖片的圖元之間的圖元差值和對應於PU的預測值。編碼器引擎106可以形成包括用於CU的殘差資料的TU,隨後可以變換TU以產生用於CU的變換係數。
編碼器引擎106可以執行變換係數的量化。量化經由量化變換係數來減少用於表示係數的資料量來提供進一步的壓縮。例如,量化可減少與部分或全部係數相關聯的位元深度。在一個實例中,具有n位元值的係數可在量化期間向下捨入到m位元值,其中n大於m。
一旦執行量化,譯碼視訊位元串流包括量化的變換係數、預測資訊(例如,預測模式、運動向量、塊向量等)、分割資訊和任何其他合適的資料,例如其他語法資料。譯碼視訊位元串流的不同元素隨後可由編碼器引擎106進行熵編碼。在一些實例中,編碼器引擎106可利用預定義的掃瞄順序來掃瞄量化的變換係數以產生可被熵編碼的序列化向量。在一些實例中,編碼器引擎106可以執行自我調整掃瞄。在掃瞄量化變換係數以形成向量(例如,一維向量)之後,編碼器引擎106可以對向量進行熵編碼。例如,編碼器引擎106可以使用上下文自我調整可變長度譯碼、上下文自我調整二進位算術譯碼、基於語法的上下文自我調整二進位算術譯碼、概率間隔劃分熵譯碼或另一合適的熵編碼技術。
編碼設備104的輸出110可以經由通訊鏈路120將構成編碼視訊位元串流資料的NAL單元發送到接收設備的解碼設備112。解碼設備112的輸入114可以接收NAL單元。通訊鏈路120可以包括由無線網路、有線網路或有線和無線網路的組合提供的通道。無線網路可以包括任何無線介面或無線介面的組合,並且可以包括任何合適的無線網路(例如,網際網路或其他廣域網、基於封包的網路、WiFi TM、射頻(RF)、超寬頻(UWB)、WiFi-Direct、蜂巢、5G新無線電(NR)、長期進化(LTE)、WiMax TM等)。有線網路可包括任何有線介面(例如,光纖、乙太網路、電力線乙太網路、同軸電纜乙太網路、數位訊號線(DSL)等)。有線及/或無線網路可以使用各種裝備來實施,例如基地台、路由器、存取點、橋接器、閘道、交換機等。編碼的視訊位元串流資料可以根據諸如無線通訊協定的通訊標準進行調制,並發送到接收設備。
在一些實例中,編碼設備104可以將編碼的視訊位元串流資料儲存在記憶體108中。輸出110可從編碼器引擎106或從記憶體108檢索編碼的視訊位元串流資料。記憶體108可以包括各種分散式或本端存取的資料儲存媒體中的任何一種。例如,記憶體108可以包括硬碟、儲存盤、快閃記憶體、揮發性或非揮發性記憶體,或者用於儲存編碼視訊資料的任何其他合適的數位儲存媒體。記憶體108亦可以包括用於儲存用於訊框間預測的參考圖片的解碼圖片緩衝器(DPB)。在另一實例中,記憶體108可以對應於檔案伺服器或另一中間存放裝置,該中間存放裝置可以儲存由源設備產生的編碼的視訊。在這種情況下,包括解碼設備112的接收設備可以經由資料串流或下載從存放裝置存取儲存的視訊資料。檔案伺服器可以是能夠儲存編碼的視訊資料並將該編碼的視訊資料發送到接收設備的任何類型的伺服器。實例檔案伺服器包括web伺服器(例如,對於網站)、FTP伺服器、網路附加儲存(NAS)設備或本端磁碟機。接收設備可以經由任何標準資料連接(包括網際網路連接)存取編碼的視訊資料。這可以包括無線通道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或兩者的組合,其適於存取儲存在檔案伺服器上的編碼的視訊資料。從記憶體108發送編碼的視訊資料可以是流發送、下載發送或其組合。
解碼設備112的輸入114接收編碼的視訊位元串流資料,並且可以將視訊位元串流資料提供給解碼器引擎116,或者提供給記憶體118以供解碼器引擎116稍後使用。例如,記憶體118可以包括用於儲存用於訊框間預測的參考圖片的DPB。包括解碼設備112的接收設備可以經由記憶體108接收要解碼的編碼的視訊資料。編碼的視訊資料可以根據諸如無線通訊協定之類的通訊標準進行調制,並發送到接收設備。用於發送編碼的視訊資料的通訊媒體可以包括任何無線或有線通訊媒體,例如射頻(RF)頻譜或一或多條實體傳輸線。通訊媒體可以形成基於封包的網路的一部分,例如區域網路、廣域網或諸如網際網路的全球網路。通訊媒體可包括路由器、交換機、基地台或可用於促進從源設備到接收設備的通訊的任何其他裝備。
解碼器引擎116可以經由熵解碼(例如,使用熵解碼器)和提取構成編碼視訊資料的一或多個譯碼視訊序列的元素來解碼編碼視訊位元串流資料。解碼器引擎116隨後可以對編碼的視訊位元串流資料重新縮放並執行逆變換。隨後,殘差資料被傳遞到解碼器引擎116的預測階段。隨後,解碼器引擎116預測區塊(例如,PU)。在一些實例中,預測被添加到逆變換的輸出(殘差資料)。
視訊解碼設備112可以將解碼的視訊輸出到視訊目標設備122,視訊目標設備122可以包括用於向內容的消費者顯示解碼的視訊資料的顯示器或其他輸出設備。在一些態樣中,視訊目標設備122可以是包括解碼設備112的接收設備的一部分。在一些態樣中,視訊目標設備122可以是除接收設備之外的單獨設備的一部分。
在一些實施例中,視訊編碼設備104及/或視訊解碼設備112可以分別與音訊編碼設備和音訊解碼設備整合。視訊編碼設備104及/或視訊解碼設備112亦可以包括實施上述譯碼技術所必需的其他硬體或軟體,例如一或多個微處理器、數位訊號處理器(DSP)、特殊應用積體電路(ASIC)、現場可程式設計閘陣列(FPGA),離散邏輯、軟體、硬體、韌體或其任何組合。視訊編碼設備104和視訊解碼設備112可以整合為各個設備中的組合編碼器/解碼器(譯碼器)的一部分。
圖1所示的實例系統是可在本文使用的一個說明性實例。使用本文描述的技術來處理視訊資料的技術可以由任何數位視訊編碼及/或解碼設備來執行。儘管本案的技術通常由視訊編碼設備或視訊解碼設備來執行,但是這些技術亦可以由組合的視訊轉碼器-解碼器(通常稱為「譯碼器」)來執行。此外,本案的技術亦可以由視訊前置處理器執行。源設備和接收設備僅僅是此類譯碼設備的實例,其中源設備產生譯碼視訊資料以發送到接收設備。在一些實例中,源設備和接收設備可以以基本對稱的方式操作,使得每個設備包括視訊編碼和解碼用部件。因此,實例系統可支援視訊設備之間的單向或雙向視訊發送,例如,用於視訊資料流式、視訊重播、視訊廣播或視訊電話。
HEVC標準的擴展包括多視圖視訊譯碼擴展(稱為MV-HEVC)和可縮放視訊譯碼擴展(稱為SHVC)。MV-HEVC和SHVC擴展共享分層譯碼的概念,在編碼的視訊位元串流中包括不同的層。譯碼視訊序列中的每一層由唯一的層辨識符(ID)定址。層ID可以存在於NAL單元的標頭中,以辨識與NAL單元相關聯的層。在MV-HEVC中,不同的層通常表示視訊位元串流中同一場景的不同視圖。在SHVC中,提供了不同的可縮放層,以不同的空間解析度(或圖片解析度)或不同的重建保真度表示視訊位元串流。可縮放層可以包括基本層(層ID=0)和一或多個增強層(層ID=1、2、…n)。基本層可以符合HEVC的第一版本的設定檔,並且表示位元串流中的最低可用層。與基本層相比,增強層具有增加的空間解析度、時間解析度或畫面播放速率及/或重建保真度(或品質)。增強層是分層組織的,並且可以(或可以不)依賴於較低的層。在一些實例中,可以使用單個標準譯碼器對不同層進行譯碼(例如,使用HEVC、SHVC或其他譯碼標準對所有層進行編碼)。在一些實例中,可以使用多標準譯碼器對不同層進行譯碼。例如,可以使用AVC對基本層進行譯碼,而可以使用HEVC標準的SHVC及/或MV-HEVC擴展對一或多個增強層進行譯碼。
通常,層包括VCL NAL單元集合和相應的非VCL NAL單元集合。NAL單元被分配特定的層ID值。從層可以依賴於較低層的意義上講,層可以是分層的。層集是指在位元串流中表示的自包含的層集,這意味著層集中的層可以依賴於解碼程序中的層集中的其他層,但不依賴於任何其他層進行解碼。因此,層集中的層可以形成能夠表示視訊內容的獨立位元串流。層集中的層集合可以經由子位元串流提取程序的操作從另一位元串流獲得。層集可以對應於解碼器想要根據某些參數進行操作時要解碼的層集合。
如前述,HEVC位元串流包括NAL單元組,包括VCL NAL單元和非VCL NAL單元。VCL NAL單元包括形成譯碼視訊位元串流的譯碼圖片資料。例如,在VCL NAL單元中存在形成譯碼視訊位元串流的位元序列。除其他資訊外,非VCL NAL單元亦可以包含具有與解碼視訊位元串流相關的高級資訊的參數集。例如,參數集可以包括視訊參數集(VPS)、序列參數集(SPS)和圖片參數集(PPS)。參數集的目標的實例包括位元速率效率、錯誤恢復能力和提供系統層介面。每個切片引用單個活動PPS、SPS和VPS以存取解碼設備112可用於解碼切片的資訊。可以為每個參數集譯碼辨識符(ID),包括VPS ID、SPS ID和PPS ID。SPS包括SPS ID和VPS ID。PPS包括PPS ID和SPS ID。每個切片標頭包括PPS ID。使用ID,可以針對給定切片辨識活動參數集。
PPS包括應用於給定圖片中所有切片的資訊。因此,圖片中的所有切片引用相同的PP。不同圖片中的切片亦可以引用相同的PPS。SPS包括應用於同一譯碼視訊序列(CVS)或位元串流中的所有圖片的資訊。如前述,譯碼視訊序列是一系列存取單元(AU),該存取單元以基本層中的隨機存取點圖片(例如,暫態解碼參考(IDR)圖片或斷開鏈路存取(BLA)圖片,或者其他適當的隨機存取點圖片)開始並且具有某些屬性(如前述),直到並且不包括具有基本層中的隨機存取點圖片並且具有某些屬性的下一個AU為止(或者以位元串流結尾)。在譯碼視訊序列中,SPS中的資訊不能在圖片之間改變。譯碼視訊序列中的圖片可以使用相同的SPS。VPS包括應用於譯碼視訊序列或位元串流內的所有層的資訊。VPS包括具有應用於整個譯碼視訊序列的語法元素的語法結構。在一些實施例中,VPS、SPS或PPS可以與編碼位元串流一起在帶內發送。在一些實施例中,VPS、SPS或PPS可以在與包含譯碼視訊資料的NAL單元不同的單獨發送中帶外發送。
本案通常可以指「訊號傳遞通知」某些資訊,諸如語法元素。術語「訊號傳遞通知」通常可以指對於語法元素及/或用於對編碼視訊資料進行解碼的其他資料的值的通訊。例如,視訊編碼設備104可以在位元串流中訊號傳遞通知語法元素的值。通常,訊號傳遞通知是指在位元串流中產生值。如前述,視訊源102可以基本上即時地或非即時地將位元串流運送到視訊目標設備122,諸如在將語法元素儲存到儲存108以供稍後由視訊目標設備122檢索時可能發生的情況。
視訊位元串流亦可以包括補充增強資訊(SEI)訊息。例如,SEI NAL單元可以是視訊位元串流的一部分。在一些情況下,SEI訊息可以包含解碼程序不需要的資訊。例如,SEI訊息中的資訊對於解碼器解碼位元串流的視訊圖片可能不是必需的,但是解碼器可以使用該資訊來改進圖片的顯示或處理(例如,解碼輸出)。SEI訊息中的資訊可以嵌入中繼資料。在一個說明性實例中,SEI訊息中的資訊可由解碼器側實體使用以改進內容的可視性。在一些實例中,某些應用標準可強制要求在位元串流中存在此類SEI訊息,以便可將品質的改進帶到符合該應用標準的所有設備(例如,用於訊框相容平面立體3DTV視訊格式的訊框打包SEI訊息的承載,在視訊的每一訊框攜帶SEI訊息的情況下,處理復原點SEI訊息,在DVB中使用泛掃瞄掃瞄矩形SEI訊息,以及許多其他實例)。
如前述,節能媒體消耗標準(ISO/IEC 23001-11)規定了綠色中繼資料,以促進在媒體消耗期間減少能源使用。綠色中繼資料包括複雜度度量(CM)中繼資料和解碼操作減少請求(DOR-Req)中繼資料。解碼器可以使用CM中繼資料來幫助調整執行解碼的處理器的操作頻率以説明降低功耗。如前述,本文描述了用於改進諸如CM訊號傳遞的綠色中繼資料的系統和技術。例如,在多個圖片上使用單一類型訊號傳遞通知切片、圖塊及/或子訊框細微性的CM可能會有問題。在一些態樣,本文描述的系統和技術改進綠色中繼資料的語法結構,以支援更多細微性類型(例如,切片細微性、圖塊細微性等),並且在一些情況下支援各種時段類型上的細微性類型。在一些態樣,本文描述的系統和技術提供訊號傳遞,以使用子圖片辨識符(ID)將一或多個CM映射到特定子圖片。在一些態樣,本文描述的系統和技術提供訊號傳遞(例如,語法元素)以指示塊(例如,CTB或其他塊)的總數。在一些情況下,此類訊號傳遞(指示塊的總數)可以簡化在一時段內的總譯碼塊的數量的推導,以解釋每個切片或圖塊的正規化編碼統計。訊號傳遞可以包括在編碼視訊所包括的CM中繼資料中。在一些態樣,本文描述的系統和技術提供用於訊框內譯碼塊統計的訊號傳遞。在一些情況下,此類訊框內譯碼塊統計訊號傳遞可以解決當所有塊皆是訊框內譯碼時(例如,當P和B切片具有比訊框間譯碼塊更多的訊框內譯碼塊時,當P或B圖片具有比訊框間譯碼塊更多的訊框內譯碼塊時等)CM提供訊框內譯碼塊統計時出現的問題。在一些態樣,本文描述的系統和技術提供了用於將品質度量分別應用於圖片的各個部分(例如,應用於各個子圖片)的機制,例如在VVC中,而不是將品質度量應用於整個圖片。
現在將描述上面提到的複雜度度量(CM)訊號傳遞的各個態樣。例如,在一些態樣,提供細微性類型指示符(例如,細微性類型語法元素,諸如granularity_type)以支援各種細微性(例如,細微性段),諸如切片、圖塊、子圖片、可擴展層及/或其他細微性。例如,編碼設備104可以在位元串流中或與位元串流一起訊號傳遞通知細微性類型指示符。細微性類型指示符可與時段類型語法元素組合使用,以支援適用於多個圖片的細微性CM訊號傳遞。在一些實例中,修改了時段類型語法元素(例如,period_type)的語義。在一個說明性實例中,下文的表2提供了用於VVC綠色中繼資料的CM訊號傳遞(在<>(例如<added language>)之間圖示對ISO/IEC 23001-11的補充): 表2–VVC CM的語法
大小 (bits) 描述符
period_type 8 無符號整數
granularity_type 8 無符號整數
if ( period_type == 2 ) {      
        num_seconds 16 無符號整數
}      
else if ( period_type == 3 ) {      
        num_pictures 16 無符號整數
       < }      
if ( granularity_type ==0) {      
        <picture_level_CMs()>      
        }      
else {      
        granularity_level_CMs()      
         }      
} >      
     
period_type語法元素(例如,變數)指定複雜度度量適用的即將到來的時段的類型,並且可以在下文的表3中定義period_type語法元素的值(作為說明性實例): 表3–VVC的period_type規範
描述
0x00 複雜度度量適用於單個圖片
0x01 複雜度度量適用於解碼順序中的所有圖片,直到(但不包括)包含下一個I切片的圖片
0x02 複雜度度量適用於以秒為單位的指定時間間隔內的所有圖片
0x03 複雜度度量適用於以解碼順序計數的指定數量的圖片
0x04-0xFF 保留
granularity_type語法元素指定了複雜度度量適用的細微性類型,並且可以在下文的表4中定義granularity_type語法元素的值(作為說明性實例): 表4–VVC的granularity_type規範
描述
0x00 CM適用於圖片的圖片細微性
0x01 CM適用於切片的切片細微性
0x02 CM適用於圖塊的圖塊細微性
0x03 CM適用於子圖片的子圖片細微性
0x04 CM適用於可擴展層的可擴展層細微性
0x05 CM適用於CTU行的CTU行細微性
0x07-0xFF 保留
picture_level_CMs語法結構指定了特定圖片在一時段內的複雜度度量。picture_level_CMs語法結構在本文中可稱為圖片級CM語法結構。
granularity_level_CMs語法結構指定了每個實體(諸如切片、圖塊、子圖片或層)在一時段內的細微性級別複雜度度量。granularity_level_CMs語法結構在本文中可稱為細微性級別CM語法結構。
圖2是圖示根據本案的態樣的視訊圖片200(亦稱為訊框或影像)的細微性級別CM的實例使用的圖。視訊圖片200包括運動中的騎自行車者202,騎自行車者騎過視訊圖片200的視圖,並且騎自行車者202出現在視訊圖片200的圖片集204中。視訊圖片200的每個圖片可以被(例如,經由諸如編碼設備104的編碼器)劃分成一或多個部分,諸如切片、圖塊、子圖片、層等。圖片集204中的圖片206被示為分成十六個切片208、四個圖塊210和一個子圖片212,其中每個圖塊210包括四個切片208,並且子圖片212包括圖片下部上的兩個圖塊210。
在一些情況下,能夠向解碼設備(例如,解碼設備112)指定時段類型和細微性類型允許更大的靈活性和減少的訊號傳遞,這是經由允許針對多個圖片的切片、圖塊、子圖片或層定義一次細微性級別CM來實現的。例如,編碼設備(例如,編碼設備104)可以將單個細微性級別CM應用於指定的時間間隔中的所有圖片的子圖片,而不是必須為每個圖片的子圖片定義細微性級別CM。在視訊圖片200中,當騎自行車者202在視訊中運動時,與圖片集204的其他區域(其具有較少運動或沒有運動)相比,騎自行車者202出現的區域可能更複雜地進行編碼/解碼,並且可以使用細微性級別CM為這些區域指定不同的CM。例如,可以為多個圖片(諸如圖片集204中的六個圖片(例如,num_pictures=6))的子圖片212區域(例如,granularity_type=3)指定一次細微性級別CM。經由允許針對特定的時間間隔(例如,圖片的集合數量、時間段等)設置細微性級別CM,可以在對應於圖片集204的第一圖片的中繼資料中使用單個細微性級別CM,並且基於指定的時間間隔,該細微性級別CM可以應用於圖片集204中的所有圖片。在圖片集204之後,可以調整子圖片212的細微性級別CM,因為騎自行車者202不再在子圖片212覆蓋的區域中,並且該區域現在可以不那麼複雜地進行編碼/解碼。類似地,可以為圖片中的任意數量的切片、圖塊、子圖片或層指定多個、可能不同的細微性級別CM,其中每個細微性級別CM可以應用於不同的即將到來的時段(例如,單個圖片、指定時間間隔內的所有圖片、多個圖片、直到包含下一個切片的圖片的所有圖片等)。
在一些態樣,編碼設備(例如,編碼設備104)可以為視訊的多個圖片指定使用於圖片的部分(諸如切片、圖塊、子圖片及/或層)的CM值。例如,根據一些態樣,編碼設備可以產生並訊號傳遞通知子影像CM訊號傳遞。子圖片CM訊號傳遞指示CM應用於一或多個圖片的哪些子圖片。在一個實例中,對於子圖片細微性,語法元素(例如,稱為子圖片語法元素)指示當時段跨越多個圖片時(例如,其中細微性級別CM應用於多個圖片),在CM中繼資料中訊號傳遞通知子圖片ID。下文的表5圖示一個實例: 表5 子圖片CM
大小 Size (bits) 描述符
     
if ( granularity_type == 0x03 && period_type > 0 ) {      
    num_subpics_minus1 16 無符號整數   
    for (i = 0; i <= num_subpics_minus1; i++)      
        subpic_id[ i ] 16 無符號整數   
        subpic_CM( i )      
        }      
     
}      
subpic_id[I]指定相關聯複雜度度量(CM)的子圖片ID。
subpic_CM是第i個子圖片複雜度度量結構。
在一些情況下,subpic_id及/或subpic_CM(i)可以由引用段位址的一或多個語法元素替換。在一些情況下,段可以是切片、圖塊或子圖片,該段位址可以辨識例如圖片的特定切片、圖塊及/或子圖片。作為實例,段位址[t]可以指示第t段的位址。因此,在細微性類型指定子圖片細微性的情況下,段位址[t]可以指示第t個子圖片的子圖片ID。
在一些情況下,態樣與解析度變化相關聯。例如,在VVC中,譯碼層視訊序列(CLVS)內的解析度變化適用於圖片、切片和圖塊細微性,但不適用於子圖片細微性。根據一些態樣,諸如當細微性類型等於切片(例如,來自表4的0x01)或圖塊(例如,來自表4的0x02),並且時段類型跨越多個圖片時,可以在綠色中繼資料(例如,在CM語法表中作為一或多個語法元素,諸如在以下表6中的num_ctbs_minus1)中訊號傳遞通知指示在一時段內譯碼樹亮度塊的總數的語法元素(例如,稱為譯碼樹塊(CTB)數語法元素)。下文的表6圖示一個實例: 表6 複雜度度量語法
大小 (bits) 描述符
     
if ( (granularity_type == 0x01 || granularity_type == 0x02) && period_type > 0 ) {      
    num_ctbs_minus1 16 無符號整數
    granularity_level_CMs( )      
    }      
     
}      
num_ctbs_minus1指定一時段內相關聯複雜度度量的譯碼樹塊的總數。
在一些態樣,替代語法元素(例如,avg_number_ctbs_minus1)可以指示每個圖片每細微性的CTB或4×4塊(或其他大小的塊)的平均數,而不是一時段內CTB的總數,以減少管理負擔。此類語法元素可以稱為平均CTB數語法元素。
在一些情況下,態樣與訊框內譯碼塊統計相關聯。例如,當前的綠色中繼資料CM語法僅在所有塊皆是訊框內譯碼塊時才訊號傳遞通知訊框內譯碼塊統計(例如,portion_intra_predicted_blocks_area==255)。下文的表7圖示提議的CM訊號傳遞更改,其中在<>(例如<added language>)之間圖示添加,而用刪除文字(例如deleted language)圖示刪除。當存在可用的訊框內譯碼塊時,訊號傳遞通知訊框內譯碼塊統計。當存在可用的訊框間譯碼塊時,訊號傳遞通知訊框間譯碼塊統計。 表7 建議的CM語法結構
大小 (bits) 描述符
     
        portion_intra_predicted_blocks_area 8 無符號整數
        if ( portion_intra_predicted_blocks_area <!= 0> = = 255) {      
                portion_planar_blocks_in_intra_area 8 無符號整數
                portion_dc_blocks_in_intra_area 8 無符號整數
                portion_angular_hv_blocks_in_intra_area 8 無符號整數
                portion_mip_blocks_in_intra_area 8 無符號整數
        }      
        else<if ( portion_intra_predicted_blocks_area != 255  )> {      
                portion_bi_and_gpm_predicted_blocks_area 8 無符號整數
        }      
        portion_deblocking_instances 8 無符號整數
        portion_sao_filtered_blocks 8 無符號整數
        portion_alf_filtered_blocks 8 無符號整數
     
}      
下文為VVC提供了表7中各種語法元素的定義實例:
portion_intra_predicted_blocks_area使用4樣點細微性指示指定時段的圖片中的訊框內預測的塊所覆蓋的區域部分,定義如下:
Figure 02_image017
(5-82)
NumIntraPredictedBlocks是使用4樣點細微性的指定時段中的訊框內預測塊的數量。在編碼器側,其計算如下:
Figure 02_image019
(5-83)
對於指定時段中X=4、8、16、32、64、128、256、512、1024、2048、4096的樣點數,其中NumIntraPredictedBlocks_X是使用訊框內預測的塊數。
NumIntraPredictedBlocks是從解碼器中的portion_intra_predicted_blocks_area和TotalNum4BlocksInPeriod匯出的。
portion_planar_blocks_in_intra_area指示指定的時段中訊框內預測區域中的訊框內平面預測塊區域的部分,定義如下:
Figure 02_image021
(5-84)
當不存在時,等於0。
NumPlanarPredictedBlocks是使用4樣點細微性的指定時段中訊框內平面預測塊的數量。在編碼器側,其計算如下:
Figure 02_image023
(5-85)
對於指定時段中X=4、8、16、32、64、128、256、512、1024、2048、4096的樣點數,其中NumIntraPlanarBlocks_X是使用訊框內平面預測的塊數。
NumPlanarPredictedBlocks是從解碼器中的portion_planar_blocks_in_intra_area和NumIntraPredictedBlocks匯出的。
portion_dc_blocks_in_intra_area指示指定的時段中訊框內預測區域中的訊框內DC預測塊區域的部分,定義如下:
Figure 02_image025
(5-86)
當不存在時,等於0。
NumDcPredictedBlocks是使用4樣點細微性的指定時段中的訊框內DC預測塊的數量。在編碼器側,其計算如下:
Figure 02_image027
(5-87)
對於指定時段中X=4、8、16、32、64、128、256、512、1024、2048、4096的樣點數,其中NumIntraDcBlocks_X是使用訊框內DC預測的塊數。
NumDcPredictedBlocks是從解碼器中的portion_dc_blocks_in_intra_area和NumIntraPredictedBlocks匯出的。
portion_angular_hv_blocks_in_intra_area(亦稱為portion_hv_blocks_in_intra_area)指示指定時段中訊框內預測區域中的訊框內水平方向和垂直方向預測塊區域的部分,定義如下:
Figure 02_image029
(5-88)
當不存在時,等於0。
NumHvPredictedBlocks是使用4樣點細微性的指定時段中的訊框內水平方向和垂直方向預測塊的數量。在編碼器側,其計算如下:
Figure 02_image031
(5-89)
對於指定時段中X=4、8、16、32、64、128、256、512、1024、2048、4096的樣點數,其中NumIntraHvBlocks_X是使用訊框內水平方向和垂直方向預測的塊數。
NumHvPredictedBlocks是從解碼器中的portion_hv_blocks_in_intra_area和NumIntraPredictedBlocks匯出的。
portion_mip_blocks_in_intra_area指示指定的時段中訊框內預測區域中的訊框內MIP預測塊區域的部分,定義如下:
Figure 02_image033
(5-90)
當不存在時,等於0。
NumMipPredictedBlocks是使用4樣點細微性的指定時段中的訊框內MIP預測塊的數量。在編碼器側,其計算如下:
Figure 02_image035
(5-91)
對於指定時段中X=4、8、16、32、64、128、256、512、1024、2048、4096的樣點數,其中NumIntraMipBlocks_X是使用訊框內MIP預測的塊數。
NumMipPredictedBlocks是從解碼器中的portion_mip_blocks_in_intra_area和NumIntraPredictedBlocks匯出的。
portion_bi_and_gpm_predicted_blocks_area使用4樣點細微性指示指定時段的圖片中的訊框間雙預測或GPM預測的塊所覆蓋的區域部分,定義如下:
Figure 02_image037
(5-92)
NumBiAndGpmPredictedBlocks是使用4樣點細微性的指定時段中訊框間雙預測或GPM預測塊的數量。在編碼器側,其計算如下:
Figure 02_image039
(5-93)
對於指定時段中X=4、4,8、16、32、64、128、256、512、1024、2048、4096的樣點數,其中NumBiPredictedXBlocks是使用訊框間雙預測或GPM預測的塊數。
NumBiPredictedXBlocks是從解碼器中的portion_bi_and_gpm_predicted_blocks_area和TotalNum4BlocksInPeriod匯出的。
portion_deblocking_instances指示在指定時段中,如本文件的術語和定義所定義的去塊濾波實例的部分,定義如下:
Figure 02_image041
(5-94)
NumDeblockingInstances是指定時段中的去塊濾波實例數。NumDeblockingInstances是從解碼器中的portion_deblocking_instances和MaxNumDeblockingInstances匯出的。
portion_sao_filtered_blocks指示使用4樣點細微性的指定時段中的SAO濾波的塊的部分。在編碼器側,其計算如下:
Figure 02_image043
(5-95)
NumSaoFilteredBlocks是使用4樣點細微性的指定時段中的SAO濾波的塊的數量。NumSaoFilteredBlocks是從解碼器中的pportion_sao_filtered_blocks、TotalNum4BlocksInPeriod匯出的。
portion_alf_filtered_blocks指示使用4樣點細微性的指定時段中的ALF濾波的塊的部分。在編碼器側,其計算如下:
Figure 02_image045
(5-96)
NumAlfFilteredBlocks是使用4樣點細微性的指定時段中的ALF濾波的塊的數量。NumAlfFilteredBlocks是從解碼器中的portion_alf_filtered_blocks、TotalNum4BlocksInPeriod匯出的。
在一些情況下,態樣與子圖片品質度量相關聯。例如,品質恢復度量可以應用於每個細微性段。在一些情況下,分段可以是切片、圖塊或子圖片。表8提供了針對綠色MPEG提出的基於子圖片的品質恢復度量的實例,其中在<>(例如<added language>)之間圖示添加。 表8 綠色中繼資料的品質恢復度量
green_metadata( payload_size ) 描述符
green_metadata_type u(8)
 switch ( green_metadata_type) {   
        case 0:      
                …   
                break;   
        case 1:   
                xsd_metric_number_minus1 u(4)
                for ( i=0; i<= xsd_metric_number_minus1; i++ ) {   
                        xsd_metric_type[ i ] u(8)
                        < xsd_subpic_number_minus1> ue(v)
                        for ( j=0; i<= xsd_subpic_number_minus1; j++ ) {   
                                xsd_metric_value[ i ]<[ j ]> u(16)
                        }   
                }   
                break;   
        default:  
 }  
xsd_subpic_number_minus1指定相關聯圖片中可用的子圖片數。當xsd_subpic_number_minus1等於0時,品質恢復度量將應用於整個圖片。
xsd_metric_type[i]指示第i個目標品質度量的目標品質度量的類型。
xsd_metric_value[i][j]包含相關聯的第j個子圖片的第i個目標品質度量的值。
當前品質度量描述了每個段的最後一張圖片的品質。本文描述的態樣允許SEI訊息攜帶描述相關聯圖片的品質的品質度量。例如,編碼設備(例如,圖1和圖4的編碼設備104)可以將品質度量添加到SEI訊息。
圖3是圖示根據本案的態樣的用於解碼編碼視訊300的程序的流程圖。在操作302,程序300可以包括獲得位元串流。在操作304,程序300可以包括檢索與位元串流相關聯的細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型。在一些情況下,細微性類型語法元素的值指定CM適用於位元串流的圖片或圖片的一部分,該圖片的一部分小於整個圖片。在一些情況下,細微性類型語法元素的值指定CM適用於位元串流的一或多個圖片的切片、圖塊、子圖片、可擴展層或譯碼樹單元(CTU)行中的至少一個。
在操作306,程序300可以包括檢索與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集。在一些情況下,時段類型語法元素指示即將到來的時段的指定時間間隔、即將到來的時段的圖片數量、即將到來的時段包括直到包括下一個切片的圖片的所有圖片,或者即將到來的時段包括單個圖片中的至少一個。在一些情況下,程序300亦可以包括檢索與位元串流相關聯的細微性級別CM語法結構,該細微性級別CM語法結構指定在即將到來的時段內位元串流的一或多個細微性段的細微性級別複雜度度量。在一些情況下,程序300亦可以包括檢索與位元串流相關聯的附加時段類型語法元素,附加時段類型語法元素與細微性類型語法元素相關聯,其中附加時段類型語法元素不同於時段類型語法元素,以及基於細微性類型語法元素和附加時段類型語法元素解碼位元串流的一部分。
在一些情況下,程序300亦可以包括檢索以下中的至少一個:與位元串流相關聯的子圖片語法元素,該子圖片語法元素指示當CM應用於多個圖片時訊號傳遞通知子圖片辨識符(ID);與位元串流相關聯的譯碼樹塊(CTB)數語法元素,當細微性類型等於切片或圖塊並且即將到來的時段跨越多個圖片時,可以在CM中訊號傳遞通知指示即將到來的時段上的譯碼樹亮度塊的總數的CTB數語法元素;或與位元串流相關聯的平均譯碼樹塊(CTB)數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的平均數。
在一些情況下,對於程序300,當在位元串流的至少一部分中存在可用的訊框內譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。在一些情況下,當在位元串流的至少一部分中存在可用的訊框間譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。在一些情況下,程序300亦可以包括在顯示器上顯示位元串流的至少一部分。在一些情況下,程序300亦可以包括基於與位元串流相關聯的CM來決定設備的操作頻率。
在操作308,程序300可以包括基於細微性類型語法元素和時段類型語法元素解碼位元串流的一部分。在一些情況下,程序300可以由行動設備、可穿戴設備、擴展現實設備、相機、個人電腦、車輛、機器人設備、電視或計算設備中的一個來執行。
圖4是圖示根據本案的態樣的用於編碼視訊的技術的流程圖400。在操作402,程序400可以包括獲得視訊資料。在操作404,程序400可以包括為位元串流產生細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型。在一些情況下,細微性類型語法元素的值指定CM適用於位元串流的圖片或圖片的一部分,該圖片的一部分小於整個圖片。在一些情況下,細微性類型語法元素的值指定CM適用於位元串流的一或多個圖片的切片、圖塊、子圖片、可擴展層或譯碼樹單元(CTU)行中的至少一個。
在操作406,程序400可以包括為位元串流產生與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集。在一些情況下,時段類型語法元素指示即將到來的時段的指定時間間隔、即將到來的時段的圖片數量、即將到來的時段包括直到包括下一個切片的圖片的所有圖片,或者即將到來的時段包括單個圖片中的至少一個。在一些情況下,時段類型語法元素指示即將到來的時段的指定時間間隔、即將到來的時段的圖片數量、即將到來的時段包括直到包括下一個切片的圖片的所有圖片,或者即將到來的時段包括單個圖片中的至少一個。
在一些情況下,程序400亦可以包括為位元串流產生細微性級別CM語法結構,該細微性級別CM語法結構指定在即將到來的時段內一或多個實體的細微性級別複雜度度量。在一些情況下,程序400亦可以包括為位元串流產生與細微性類型語法元素相關聯的附加時段類型語法元素,其中附加時段類型語法元素不同於時段類型語法元素,並且其中附加時段類型語法元素用於解碼具有細微性類型語法元素的位元串流的一部分。在一些情況下,程序400亦可以包括為位元串流產生以下中的至少一個:與位元串流相關聯的子圖片語法元素,該子圖片語法元素指示當CM應用於多個圖片時訊號傳遞通知子圖片辨識符(ID);與位元串流相關聯的譯碼樹塊(CTB)數語法元素,當細微性類型等於切片或圖塊並且即將到來的時段跨越多個圖片時,可以在CM中訊號傳遞通知指示即將到來的時段上的譯碼樹亮度塊的總數的CTB數語法元素;或與位元串流相關聯的平均譯碼樹塊(CTB)數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的平均數。
在一些情況下,對於程序400,當在位元串流的至少一部分中存在可用的訊框內譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。在一些情況下,當在位元串流的至少一部分中存在可用的訊框間譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。在一些情況下,程序400可以由行動設備、可穿戴設備、擴展現實設備、相機、個人電腦、車輛、機器人設備、電視或計算設備中的一個來執行。
在一些實現中,本文描述的程序(或方法)可以由計算設備或裝置(例如圖1所示的系統100)來執行。例如,可以由圖1和圖5所示的編碼設備104、另一視訊源側設備或視訊傳輸設備、圖1和圖6所示的解碼設備112及/或另一客戶端設備(例如播放機設備、顯示器或任何其他客戶端設備)來執行程序。在一些情況下,計算設備或裝置可以包括一或多個輸入裝置、一或多個輸出設備、一或多個處理器、一或多個微處理器、一或多個微型電腦及/或配置為執行本文所描述的一或多個程序的步驟的其他部件(多個)。
在一些實例中,計算設備可以包括行動設備、桌上型電腦、伺服器電腦及/或伺服器系統,或者其他類型的計算設備。計算設備的部件(例如,一或多個輸入裝置、一或多個輸出設備、一或多個處理器、一或多個微處理器、一或多個微型電腦及/或其他部件)可以在電路中實施。例如,部件可以包括及/或可以使用電子電路或其他電子硬體來實施,電子電路或其他電子硬體可以包括一或多個可程式設計電子電路(例如微處理器、圖形處理單元(GPU)、數位訊號處理器(DSP)、中央處理單元(CPU),及/或其他合適的電子電路),及/或可包括及/或使用電腦軟體、韌體或其任何組合來實施,以執行本文所述的各種操作。在一些實例中,計算設備或裝置可以包括配置成擷取包括視訊訊框的視訊資料(例如,視訊序列)的相機。在一些實例中,擷取視訊資料的相機或其他擷取裝置與計算設備分離,在這種情況下,計算設備接收或獲得擷取的視訊資料。計算設備可以包括配置成傳送視訊資料的網路介面。網路介面可被配置成傳送基於網際網路協定(IP)的資料或其他類型的資料。在一些實例中,計算設備或裝置可以包括用於顯示輸出視訊內容(例如視訊位元串流的圖片的樣點)的顯示器。
可以關於邏輯流程圖來描述該程序,邏輯流程圖的動作表示可在硬體、電腦指令或其組合中實施的操作序列。在電腦指令的上下文中,動作表示儲存在一或多個電腦可讀取儲存媒體上的電腦可執行指令,該電腦可執行指令在由一或多個處理器執行時執行操作。通常,電腦可執行指令包括執行特定功能或實施特定資料類型的常式、程式、物件、部件、資料結構等。描述操作的順序不意欲被解釋為限制,並且可以以任何順序及/或並行地組合任何數量的所描述的操作以實施該程序。
此外,該程序可以在配置有可執行指令的一或多個電腦系統的控制下執行,並且可以被實施為經由硬體或其組合在一或多個處理器上共同執行的代碼(例如,可執行指令、一或多個電腦程式或一或多個應用)。如前述,代碼可以例如以包括可由一或多個處理器執行的複數個指令的電腦程式的形式儲存在電腦可讀或機器可讀儲存媒體上。電腦可讀或機器可讀儲存媒體可以是非暫時的。
本文論述的譯碼技術可以在實例視訊編碼和解碼系統(例如,系統100)中實施。在一些實例中,系統包括提供稍後將由目標設備進行解碼的編碼的視訊資料的源設備。特別地,源設備經由電腦可讀取媒體向目標設備提供視訊資料。源設備和目標設備可包括各種設備中的任何一種,包括桌上型電腦、筆記本(即膝上型)、平板電腦、機上盒、電話手持設備,例如所謂的「智慧」手機、所謂的「智慧」墊、電視、相機、顯示裝置、數位媒體播放機,視訊遊戲控制台、視訊流式設備等。在某些情況下,源設備和目標設備可被配備用於無線通訊。
目標設備可以接收要經由電腦可讀取媒體解碼的已編碼的視訊資料。電腦可讀取媒體可以包括能夠將已編碼的視訊資料從源設備移動到目標設備的任何類型的媒體或設備。在一個實例中,電腦可讀取媒體可以包括通訊媒體,以使源設備能夠即時地將已編碼的視訊資料直接發送到目標設備。已編碼的視訊資料可以根據諸如無線通訊協定等的通訊標準進行調制,並發送到目標設備。通訊媒體可以包括任何無線或有線通訊媒體,例如射頻(RF)頻譜或一或多條實體傳輸線。通訊媒體可以形成基於封包的網路的一部分,例如區域網路、廣域網或諸如網際網路的全球網路。通訊媒體可包括路由器、交換機、基地台或可用於促進從源設備到目標設備的通訊的任何其他裝備。
在一些實例中,編碼的資料可以從輸出介面輸出到存放裝置。類似地,可經由輸入介面從存放裝置存取編碼的資料。存放裝置可以包括各種分散式或本端存取的資料儲存媒體中的任何一種,例如硬碟、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或者用於儲存編碼視訊資料的任何其他合適的數位儲存媒體。在另一實例中,存放裝置可以對應於檔案伺服器或另一中間存放裝置,該中間存放裝置可以儲存由源設備產生的編碼的視訊。目標設備可以經由資料串流或下載從存放裝置存取儲存的視訊資料。檔案伺服器可以是能夠儲存編碼的視訊資料並將該編碼的視訊資料發送到目標設備的任何類型的伺服器。實例檔案伺服器包括web伺服器(例如,對於網站)、FTP伺服器、網路附加儲存(NAS)設備或本端磁碟機。目標設備可以經由任何標準資料連接(包括網際網路連接)存取編碼的視訊資料。這可以包括無線通道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或兩者的組合,其適於存取儲存在檔案伺服器上的編碼的視訊資料。從存放裝置發送編碼的視訊資料可以是流發送、下載發送或其組合。
本案的技術不一定限於無線應用或設置。該技術可應用於支援各種多媒體應用中的任何一種的視訊譯碼,例如空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路流式視訊傳輸,例如HTTP上的動態自我調整資料流式(DASH),編碼到資料儲存媒體上的數位視訊、對儲存在資料儲存媒體上的數位視訊的解碼或其他應用。在一些實例中,系統可被配置為支援單向或雙向視訊發送以支援諸如視訊資料串流、視訊重播、視訊廣播及/或視訊電話之類的應用。
在一個實例中,源設備包括視訊源、視訊轉碼器和輸出介面。目標設備可以包括輸入介面、視訊解碼器和顯示裝置。源設備的視訊轉碼器可以被配置為應用本文揭示的技術。在其他實例中,源設備和目標設備可以包括其他部件或佈置。例如,源設備可以從外部視訊源(例如外部相機)接收視訊資料。同樣地,目標設備可以與外部顯示裝置介面,而不是包括整合的顯示裝置。
上面的實例系統只是一個實例。用於並行處理視訊資料的技術可以由任何數位視訊編碼及/或解碼設備來執行。儘管本案的技術通常由視訊編碼設備來執行,但是這些技術亦可以由視訊轉碼器/解碼器(通常被稱為「譯碼器」)來執行。此外,本案的技術亦可以由視訊前置處理器執行。源設備和目標設備僅僅是此類譯碼設備的實例,其中源設備產生譯碼視訊資料以發送到目標設備。在一些實例中,源設備和目標設備可以以基本對稱的方式操作,使得每個設備包括視訊編碼和解碼用部件。因此,實例系統可支援視訊設備之間的單向或雙向視訊發送,例如,用於視訊資料串流、視訊重播、視訊廣播或視訊電話。
視訊源可以包括視訊擷取裝置,例如攝像機、包含先前擷取的視訊的視訊存檔及/或從視訊內容提供者接收視訊的視訊饋送介面。作為另一替代方案,視訊源可以產生基於電腦圖形的資料作為源視訊,或者產生即時視訊、存檔視訊和電腦產生的視訊的組合。在某些情況下,若視訊源是攝像機,則源設備和目標設備可以形成所謂的照相電話或視訊電話。然而,如前述,本案中描述的技術通常可以應用於視訊譯碼,並且可以應用於無線及/或有線應用。在每種情況下,擷取的、預擷取的或電腦產生的視訊可以由視訊轉碼器編碼。編碼的視訊資訊隨後可以經由輸出介面輸出到電腦可讀取媒體上。
如前述,電腦可讀取媒體可以包括諸如無線廣播或有線網路發送的暫態媒體,或者諸如硬碟、快閃記憶體驅動器、光碟、數位視訊盤、藍光光碟或其他電腦可讀取媒體的儲存媒體(亦即,非暫態儲存媒體)。在一些實例中,網路服務器(未圖示)可以例如經由網路發送從源設備接收編碼的視訊資料並將編碼的視訊資料提供給目標設備。類似地,諸如磁碟衝壓設備的媒體生產設施的計算設備可以從源設備接收編碼的視訊資料,並產生包含編碼的視訊資料的磁碟。因此,在各種實例中,電腦可讀取媒體可以被理解為包括各種形式的一或多個電腦可讀取媒體。
目標設備的輸入介面從電腦可讀取媒體接收資訊。電腦可讀取媒體的資訊可以包括由視訊轉碼器定義的語法資訊,該語法資訊亦由視訊解碼器使用,其包括描述塊和其他譯碼單元(例如,圖片組(GOP))的特性及/或處理的語法元素。顯示裝置向使用者顯示解碼的視訊資料,並且可以包括各種顯示裝置中的任何一種,例如陰極射線管(CRT)、液晶顯示器(LCD)、等離子顯示器、有機發光二極體(OLED)顯示器或另一類型的顯示裝置。已經描述了本案的各種實施例。
編碼設備104和解碼設備112的具體細節分別在圖5和圖6中示出。圖5是圖示可以實施本案中描述的技術中的一或多個的實例編碼設備104的方塊圖。例如,編碼設備104可以產生本文描述的語法元素及/或結構(例如,綠色中繼資料的語法元素及/或結構,諸如複雜度度量(CM),或其他語法元素及/或結構)。編碼設備104可以對視訊切片、圖塊、子圖片等內的視訊塊執行訊框內預測和訊框間預測譯碼。如前述,訊框內解碼至少部分地依賴於空間預測以減少或移除給定視訊訊框或圖片內的空間冗餘。訊框間解碼至少部分地依賴於時間預測來減少或消除視訊序列的鄰近或周圍訊框內的時間冗餘。訊框內模式(I模式)可指幾種基於空間的壓縮模式中的任意一種。諸如單向預測(P模式)或雙向預測(B模式)的訊框間模式可指幾種基於時間的壓縮模式中的任意一種。
編碼設備104包括分割單元35、預測處理單元41、濾波器單元63、圖片記憶體64、加法器50、變換處理單元52、量化單元54和熵編碼單元56。預測處理單元41包括運動估計單元42、運動補償單元44和訊框內預測處理單元46。對於視訊塊重建,編碼設備104亦包括逆量化單元58、逆變換處理單元60和加法器62。濾波器單元63意欲表示一或多個迴路濾波器,例如解塊濾波器、自我調整迴路濾波器(ALF)和取樣自我調整偏移(SAO)濾波器。儘管濾波器單元63在圖5中被示出為迴路內濾波器,但是在其他配置中,濾波器單元63可以被實施為迴路後濾波器。後處理設備57可以對編碼設備104產生的編碼的視訊資料執行附加處理。本案的技術在某些情況下可以由編碼設備104實施。然而,在其他實例中,本案的一或多個技術可由後處理設備57來實施。
如圖5所示,編碼設備104接收視訊資料,分割單元35將資料分割成視訊塊。分割亦可以包括分割成切片、切片片段、圖塊或其他更大的單元,以及例如根據LCU和CU的四叉樹結構的視訊塊分割。編碼設備104通常圖示對要被編碼的視訊切片內的視訊塊進行編碼的部件。該切片可以被劃分為多個視訊塊(並且可能被劃分為稱為圖塊的視訊塊集合)。預測處理單元41可以基於錯誤結果(例如,譯碼率和失真位準等)為當前視訊塊選擇複數個可能的譯碼模式中的一個,例如複數個訊框內預測譯碼模式中的一或複數個訊框間預測譯碼模式中的一個。預測處理單元41可以將得到的訊框內或訊框間譯碼塊提供給加法器50以產生殘差塊資料,並提供給加法器62以重構用作參考圖片的編碼塊。
預測處理單元41內的訊框內預測處理單元46可以相對於與要被譯碼的當前塊在同一訊框或切片中的一或多個相鄰塊來執行當前視訊塊的訊框內預測譯碼以提供空間壓縮。預測處理單元41內的運動估計單元42和運動補償單元44相對於一或多個參考圖片中的一或多個預測塊來執行當前視訊塊的訊框間預測譯碼以提供時間壓縮。
運動估計單元42可以被配置成根據視訊序列的預定模式來決定視訊切片的訊框間預測模式。預定模式可以將序列中的視訊切片指定為P切片、B切片或GPB切片。運動估計單元42和運動補償單元44可以高度整合,但是出於概念目的而分別示出。由運動估計單元42執行的運動估計是產生運動向量的程序,其估計視訊塊的運動。例如,運動向量可以指示當前視訊訊框或圖片內的視訊塊的預測單元(PU)相對於參考圖片內的預測塊的位移。
預測塊是發現在圖元差態樣與要被譯碼的視訊塊的PU緊密匹配的塊,圖元差可以由絕對差和(SAD)、平方差和(SSD)或其他差度量來決定。在一些實例中,編碼設備104可以計算儲存在圖片記憶體64中的參考圖片的子整數圖元位置的值。例如,編碼設備104可以對參考圖片的四分之一圖元位置、八分之一圖元位置或其他分數圖元位置的值進行內插。因此,運動估計單元42可以執行相對於全圖元位置和分數圖元位置的運動搜尋,並輸出具有分數圖元精度的運動向量。
運動估計單元42經由將PU的位置與參考圖片的預測塊的位置進行比較,來計算訊框間譯碼的切片中的視訊塊的PU的運動向量。可以從第一參考圖片列表(列表0)或第二參考圖片列表(列表1)中選擇參考圖片,每個參考圖片列表辨識儲存在圖片記憶體64中的一或多個參考圖片。運動估計單元42將計算出的運動向量發送到熵編碼單元56和運動補償單元44。
由運動補償單元44執行的運動補償可涉及基於由運動估計決定的運動向量獲取或產生預測塊,可能執行子圖元精度的內插。在接收到用於當前視訊塊的PU的運動向量時,運動補償單元44可以在參考圖片列表中定位運動向量指向的預測塊。編碼設備104經由從被譯碼的當前視訊塊的圖元值減去預測塊的圖元值來形成殘差視訊塊,形成圖元差值。圖元差值形成塊的殘差資料,並且可以包括亮度和色度差分量。加法器50表示執行該減法運算的一或多個部件。運動補償單元44亦可以產生與視訊塊和視訊切片相關聯的語法元素,以供解碼設備112在對視訊切片的視訊塊進行解碼時使用。
訊框內預測處理單元46可以訊框內預測當前塊,作為由運動估計單元42和運動補償單元44執行的訊框間預測的替代,如前述。具體地,訊框內預測處理單元46可以決定用於對當前塊進行編碼的訊框內預測模式。在一些實例中,訊框內預測處理單元46可以使用各種訊框內預測模式(例如,在單獨的編碼遍期間)對當前塊進行編碼,並且訊框內預測處理單元46可以從測試的模式中選擇合適的訊框內預測模式來使用。例如,訊框內預測處理單元46可以使用針對各種測試的訊框內預測模式的率失真分析來計算率失真值,並且可以在測試的模式中選擇具有最佳率失真特性的訊框內預測模式。率失真分析通常決定編碼塊和被編碼以產生編碼塊的原始未編碼塊之間的失真(或誤差)量,以及用於產生編碼塊的位元速率(亦即,位元數)。訊框內預測處理單元46可以根據各種編碼塊的失真和速率來計算比率,以決定哪個訊框內預測模式表現出該塊的最佳率失真值。
在任何情況下,在為塊選擇訊框內預測模式之後,訊框內預測處理單元46可以向熵編碼單元56提供指示為塊選擇的訊框內預測模式的資訊。熵編碼單元56可以對指示所選擇的訊框內預測模式的資訊進行編碼。編碼設備104可以在所發送的位元串流配置資料中包括用於各種塊的編碼上下文的定義以及用於每個上下文的最可能的訊框內預測模式、訊框內預測模式索引表和修改的訊框內預測模式索引表的指示。位元串流配置資料可以包括複數個訊框內預測模式索引表和複數個修改的訊框內預測模式索引表(亦稱為編碼字元映射表)。
在預測處理單元41經由訊框間預測或訊框內預測產生當前視訊塊的預測塊之後,編碼設備104經由從當前視訊塊減去預測塊來形成殘差視訊塊。殘差塊中的殘差視訊資料可以包括在一或多個TU中並應用於變換處理單元52。變換處理單元52使用諸如離散餘弦變換(DCT)或概念上類似的變換等變換將殘差視訊資料變換為殘差變換係數。變換處理單元52可以將殘差視訊資料從圖元域轉換為變換域,例如頻域。
變換處理單元52可以將得到的變換係數發送到量化單元54。量化單元54對變換係數進行量化以進一步降低位元速率。量化處理可減少與部分或全部係數相關聯的位元深度。可以經由調整量化參數來修改量化程度。在一些實例中,量化單元54隨後可以執行包括量化的變換係數的矩陣的掃瞄。可替換地,熵編碼單元56可以執行掃瞄。
在量化之後,熵編碼單元56對量化的變換係數進行熵編碼。例如,熵編碼單元56可以執行上下文自我調整可變長度譯碼(CAVLC)、上下文自我調整二進位算術譯碼(CABAC)、基於語法的上下文自我調整二進位算術譯碼(SBAC)、概率間隔劃分熵(PIPE)譯碼或另一熵編碼技術。在由熵編碼單元56進行熵編碼之後,編碼位元串流可以被發送到解碼設備112,或者被存檔以供稍後由解碼設備112發送或檢索。熵編碼單元56亦可以對被解碼的當前視訊切片的運動向量和其他語法元素進行熵譯碼。
逆量化單元58和逆變換處理單元60分別應用逆量化和逆變換來重構圖元域中的殘差塊,以供稍後用作參考圖片的參考塊。運動補償單元44可以經由將殘差塊添加到參考圖片列表內的參考圖片之一的預測塊來計算參考塊。運動補償單元44亦可以將一或多個內插濾波器應用於重構的殘差塊,以計算用於運動估計的子整數圖元值。加法器62將重構的殘差塊添加到由運動補償單元44產生的運動補償預測塊中,以產生用於儲存在圖片記憶體64中的參考塊。該參考塊可由運動估計單元42和運動補償單元44用作參考塊,以對在隨後的視訊訊框或圖片中的塊進行訊框間預測。
以這種方式,圖5的編碼設備104表示被配置為執行本文描述的任何技術的視訊轉碼器的實例。在某些情況下,本案的一些技術亦可以由後處理設備57來實施。
圖6是圖示實例解碼設備112的方塊圖。解碼設備112包括熵解碼單元80、預測處理單元81、逆量化單元86、逆變換處理單元88、加法器90、濾波器單元91和圖片記憶體92。預測處理單元81包括運動補償單元82和訊框內預測處理單元84。在一些實例中,解碼設備112可以執行通常與關於圖5的編碼設備104描述的編碼程序相反的解碼程序。
在解碼程序中,解碼設備112接收表示編碼視訊切片的視訊塊和由編碼設備104發送的相關語法元素的編碼視訊位元串流。在一些實施例中,解碼設備112可以從編碼設備104接收編碼視訊位元串流。在一些實施例中,解碼設備112可以從網路實體79(例如伺服器、媒體感知網路部件(MANE)、視訊編輯器/拼接器,或者配置為實施上述技術中的一或多個的其他此類設備)接收經編碼的視訊位元串流。網路實體79可以包括亦可以不包括編碼設備104。在網路實體79將編碼的視訊位元串流發送到解碼設備112之前,可以由網路實體79實施本案中描述的一些技術。在一些視訊解碼系統中,網路實體79和解碼設備112可以是獨立設備的一部分,而在其他情況下,可以由包含解碼設備112的同一設備執行關於網路實體79描述的功能。
解碼設備112的熵解碼單元80對位元串流進行熵解碼,以產生量化係數、運動向量和其他語法元素。熵解碼單元80將運動向量和其他語法元素轉發到預測處理單元81。解碼設備112可以在視訊切片級別及/或視訊塊級別接收語法元素。熵解碼單元80可以處理和分析諸如VPS、SPS和PPS的一或多個參數集中的固定長度語法元素和可變長度語法元素二者。
當視訊切片被譯碼為訊框內譯碼(I)切片時,預測處理單元81的訊框內預測處理單元84可以基於訊號傳遞通知的訊框內預測模式和來自當前訊框或圖片的先前解碼塊的資料為當前視訊切片的視訊塊產生預測資料。當視訊訊框被譯碼為訊框間譯碼(即B、P或GPB)切片時,預測處理單元81的運動補償單元82基於從熵解碼單元80接收到的運動向量和其他語法元素為當前視訊切片的視訊塊產生預測塊。預測塊可以從參考圖片列表中的參考圖片中的一個產生。解碼設備112可以基於儲存在圖片記憶體92中的參考圖片,使用預設構造技術來構造參考訊框列表(列表0和列表1)。
運動補償單元82經由解析運動向量和其他語法元素來決定當前視訊切片的視訊塊的預測資訊,並使用該預測資訊為被解碼的當前視訊塊產生預測塊。例如,運動補償單元82可以在參數集中使用一或多個語法元素來決定用於對視訊切片的視訊塊進行解碼的預測模式(例如,訊框內或訊框間預測)、訊框間預測切片類型(例如B切片、P切片或GPB切片)、用於切片的一或多個參考圖片列表的構造資訊、切片的每個訊框間編碼視訊塊的運動向量、切片的每個訊框間譯碼視訊塊的訊框間預測狀態以及對當前視訊切片中的視訊塊進行解碼的其他資訊。
運動補償單元82亦可以基於內插濾波器執行內插。運動補償單元82可以使用由編碼設備104在對視訊塊進行編碼期間使用的內插濾波器來計算參考塊的子整數圖元的內插。在這種情況下,運動補償單元82可以從接收的語法元素決定由編碼設備104使用的內插濾波器,並且可以使用該內插濾波器來產生預測塊。
逆量化單元86對位元串流中提供的並由熵解碼單元80進行解碼的量化變換係數進行逆量化或去量化。逆量化處理可包括使用由編碼設備104為視訊切片之每一者視訊塊計算的量化參數來決定量化度,並且同樣地決定應該應用的逆量化度。逆變換處理單元88將逆變換(例如,逆DCT或其他適當的逆變換)、逆整數變換或概念上類似的逆變換處理應用於變換係數,以便在圖元域中產生殘差塊。
在運動補償單元82基於運動向量和其他語法元素產生當前視訊塊的預測塊之後,解碼設備112經由將來自逆變換處理單元88的殘差塊與由運動補償單元82產生的相應預測塊相加,形成解碼視訊塊。加法器90表示執行該加法運算的一或多個部件。若需要,迴路濾波器(在譯碼迴路中或在譯碼迴路之後)亦可用於平滑圖元轉換,或以其他方式提高視訊品質。濾波器單元91意欲表示一或多個迴路濾波器,例如解塊濾波器、自我調整迴路濾波器(ALF)和取樣自我調整偏移(SAO)濾波器。儘管濾波器單元91在圖6中被示出為迴路內濾波器,但是在其他配置中,濾波器單元91可以被實施為迴路後濾波器。隨後,將給定訊框或圖片中的解碼視訊塊儲存在圖片記憶體92中,圖片記憶體92儲存用於後續運動補償的參考圖片。圖片記憶體92亦儲存解碼視訊,用於稍後在顯示裝置上呈現,例如圖1所示的視訊目標設備122。
以這種方式,圖6的解碼設備112表示被配置為執行本文描述的任何技術的視訊解碼器的實例。
如本文所使用的,術語「電腦可讀取媒體」包括但不限於可攜式或非可攜式存放裝置、光學存放裝置和能夠儲存、包含或攜帶指令及/或資料的各種其他媒體。電腦可讀取媒體可以包括可以儲存資料的非暫時性媒體,並且不包括無線或經由有線連接傳播的載波及/或暫時性電子訊號。非暫時性媒體的實例可以包括但不限於磁碟或磁帶,諸如光碟(CD)或數位通用磁碟(DVD)之類的光學儲存媒體、快閃記憶體、記憶體或存放裝置。電腦可讀取媒體可以在其上儲存有代碼及/或機器可執行指令,這些指令可以表示程序、函數、副程式、程式、常式、副程式、模組、套裝軟體、軟體組件或指令、資料結構或程式語句的任何組合。程式碼片段可以經由傳遞及/或接收資訊、資料、引數、參數或記憶體內容來耦合到另一程式碼片段或硬體電路。可以經由任何合適的方式(包括記憶體共享、訊息傳遞、符記傳遞、網路發送等)傳遞、轉發或發送資訊、引數、參數、資料等。
在一些實施例中,電腦可讀存放裝置、媒體和記憶體可以包括包含位元串流等的電纜或無線訊號。然而,當提及時,非暫時性電腦可讀取儲存媒體明確地排除諸如能量,載波訊號,電磁波和訊號本身的媒體。
在上述描述中提供了具體細節,以提供對本文提供的實施例和實例的徹底理解。然而,本發明所屬領域中具有通常知識者將理解,可以在沒有這些具體細節的情況下實踐實施例。為了解釋清楚起見,在某些情況下,本技術可以被呈現為包括單獨的功能方塊,單獨的功能方塊包括以軟體或硬體和軟體的組合體現的方法來包括設備,設備部件,步驟或常式的功能方塊。除了圖中所示及/或本文所述的部件之外,亦可以使用其他部件。例如,電路、系統、網路、程序和其他部件可以以方塊圖形式被示出為部件,以便不會在不必要的細節上使實施例模糊。在其他情況下,可以在沒有不必要的細節的情況下示出已知的電路、程序、演算法、結構和技術,以避免使實施例模糊。
各個實施例可以在上面被描述為程序或方法,該程序和方法被圖示為流程圖、流程圖、資料流圖、結構圖或方塊圖。儘管流程圖可以將操作描述為順序程序,但許多操作可以並行或併發地執行。此外,可以重新安排操作順序。程序在其操作完成時終止,但可能有其他步驟未包含在圖中。程序可以對應於方法、函數、程序、子常式、副程式等。當程序對應於函數時,其終止可以對應於函數返回到調用函數或主函數。
可以使用儲存在電腦可讀取媒體中或以其他方式從電腦可讀取媒體中獲得的電腦可執行指令來實施根據上述實例的程序和方法。這些指令可以包括,例如,使得或以其他方式配置通用電腦、專用電腦或處理設備以執行某一功能或功能組的指令和資料。可以經由網路存取使用的部分電腦資源。電腦可執行指令可以是例如二進位檔案、中間格式指令(例如組合語言、韌體、原始程式碼等)。可用於儲存指令、所使用的資訊,及/或在根據所述實例的方法期間建立的資訊的電腦可讀取媒體的實例包括磁碟或光碟、快閃記憶體、設置有非揮發性記憶體的USB設備、網路存放裝置等。
根據這些揭示實施程序和方法的設備可以包括硬體、軟體、韌體、中介軟體、微代碼、硬體描述語言或其任何組合,並且可以採取各種形式因素的任何一種。當在軟體、韌體、中介軟體或微代碼中實施時,執行必要任務的程式碼或程式碼片段(例如,電腦程式產品)可以儲存在電腦可讀或機器可讀取媒體中。處理器可以執行必要的任務。典型的形式因素實例包括膝上型電腦、智慧手機、行動電話、平板電腦設備或其他小型個人電腦、個人數位助理、機架安裝設備、獨立設備等。本文描述的功能亦可以體現在周邊設備或外掛程式卡中。經由進一步的實例,這種功能亦可以在不同晶片之間的電路板上實施,或者在單個設備中執行的不同程序上實施。
指令、用於傳送此類指令的媒體、用於執行該指令的計算資源以及用於支援此類計算資源的其他結構是用於提供本案中描述的功能的實例部件。
在前述描述中,參考本案的具體實施例來描述本案的各個態樣,但是本發明所屬領域中具有通常知識者將認識到本案不限於此。因此,儘管在此已經詳細描述了本案的說明性實施例,但是應當理解,本案的概念可以以其他方式不同地體現和應用,並且所附請求項意欲被解釋為包括此類變型,除非受到現有技術的限制。可以單獨地或聯合地使用上述申請的各種特徵和態樣。此外,在不脫離本說明書更廣泛的精神和範疇的情況下,可以在本文所描述的那些環境和應用之外的任何數量的環境和應用中使用實施例。因此,說明書和附圖被認為是說明性的而不是限制性的。為了說明的目的,以特定順序描述了方法。應當理解,在替代實施例中,可以以與所描述的順序不同的順序來執行這些方法。
具有普通技術者將理解,本文中使用的小於(「<」)和大於(「>」)符號或術語可以分別替換為小於或等於(「
Figure 02_image047
」)和大於或等於(「
Figure 02_image049
」)符號,而不脫離本說明書的範疇。
在將部件描述為被「配置為」執行某些操作的情況下,可以例如經由設計電子電路或其他硬體來執行操作,通程序式設計可程式設計電子電路(例如微處理器,或其他合適的電子電路)來執行操作,或其任何組合來實現這種配置。
短語「耦合到」是指實體上直接或間接連接到另一部件的任何部件,及/或與另一部件通訊(例如,經由有線或無線連接來連接到其他部件,及/或其他合適的通訊介面)的任何部件。
列舉集合「中的至少一個」及/或集合中的「一或多個」的揭示中的請求項語言或其他語言指示集合中的一個成員或集合中的多個成員(在任何組合中)滿足該請求項。例如,請求項語言列舉的「A和B中的至少一個」是指A、B或A和B。在另一實例中,請求項語言列舉的「A、B和C中的至少一個」是指A、B、C、或A和B、或A和C、或B和C、或A和B和C。語言集合「中的至少一個」及/或集合中的「一或多個」不將集合限制為集合中列出的專案。例如,申請專利範圍語言列舉的「A和B中的至少一個」可以表示A、B或A和B,並且可以另外包括A和B集合中未列出的專案。
結合本文揭示的實施例描述的各種說明性邏輯區塊、模組、電路和演算法步驟可以實施為電子硬體、電腦軟體、韌體或其組合。為了清楚地說明硬體和軟體的這種可互換性,上面已經大體上就其功能性描述了各種說明性部件、方塊、模組、電路和步驟。這些功能是實現為硬體還是軟體取決於施加在整個系統上的特定應用和設計約束。具有普通技術者可以針對每個特定應用以不同的方式實施所描述的功能,但是這種實施方式決定不應被解釋為導致偏離本案的範疇。
本文所描述的技術亦可以在電子硬體、電腦軟體、韌體或其任何組合中實施。這些技術可以在各種設備(例如通用電腦、無線通訊設備手持機或具有多種用途的積體電路設備,包括在無線通訊設備手持機和其他設備中的應用)中的任何一種中實施。描述為模組或部件的任何特徵可以在整合邏輯裝置中一起實施,或者單獨地作為離散但可交互動操作的邏輯裝置來實施。若以軟體實施,則這些技術可以至少部分地由電腦可讀取資料儲存媒體實現,該電腦可讀取資料儲存媒體包括程式碼,該程式碼包括在執行時執行上述方法中的一或多個的指令。電腦可讀取資料儲存媒體可以形成電腦程式產品的一部分,電腦程式產品可以包括包裝材料。電腦可讀取媒體可包括記憶體或資料儲存媒體,例如隨機存取記憶體(RAM),例如同步動態隨機存取記憶體(SDRAM)、唯讀記憶體(ROM)、非揮發性隨機存取記憶體(NVRAM)、電子可抹除可程式設計唯讀記憶體(EEPROM)、快閃記憶體、磁或光資料儲存媒體等。附加地或替代地,可以至少部分地由電腦可讀通訊媒體來實現這些技術,該電腦可讀通訊媒體以指令或資料結構的形式攜帶或傳送程式碼,並且該程式碼可以由電腦(例如傳播的訊號或波)存取、讀取及/或執行。
該程式碼可由處理器執行,處理器可包括一或多個處理器,例如一或多個數位訊號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、現場可程式設計邏輯陣列(FPGA)或其他等效整合或離散邏輯電路。此類處理器可以被配置成執行本案中描述的任何技術。通用處理器可以是微處理器,但是在替代方案中,處理器可以是任何習知處理器、控制器、微控制器或狀態機。處理器亦可以實施為計算設備的組合,例如,DSP和微處理器、複數個微處理器的組合、一或多個微處理器與DSP核心的結合、或任何其他此類配置。因此,如本文所使用的術語「處理器」可指前述結構中的任何一個、前述結構的任何組合、或適於實施本文所述技術的任何其他結構或裝置。另外,在一些態樣中,本文所描述的功能可在專用軟體模組或配置用於編碼和解碼的硬體模組內提供,或併入組合的視訊轉碼器-解碼器(CODEC)中。
本案的說明性態樣包括:
態樣1. 一種用於處理視訊資料的裝置,包括:至少一個記憶體;及至少一個處理器,耦合到至少一個記憶體,該至少一個處理器被配置為:獲得位元串流;檢索與位元串流相關聯的細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;檢索與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;及基於細微性類型語法元素和時段類型語法元素解碼位元串流的一部分。
態樣2. 根據請求項1之裝置,其中細微性類型語法元素的值指定CM適用於位元串流的圖片或圖片的一部分,該圖片的一部分小於整個圖片。
態樣3. 根據請求項1之裝置,其中細微性類型語法元素的值指定CM適用於位元串流的一或多個圖片的切片、圖塊、子圖片、可擴展層或譯碼樹單元(CTU)行中的至少一個。
態樣4. 根據請求項1之裝置,其中時段類型語法元素指示即將到來的時段的指定時間間隔、即將到來的時段的圖片數量、即將到來的時段包括直到包括下一個切片的圖片的所有圖片,或者即將到來的時段包括單個圖片中的至少一個。
態樣5. 根據請求項1之裝置,其中至少一個處理器被配置為檢索與位元串流相關聯的細微性級別CM語法結構,細微性級別CM語法結構指定在即將到來的時段內位元串流的一或多個細微性段的細微性級別複雜度度量。
態樣6. 根據請求項1之裝置,其中至少一個處理器被配置為:檢索與位元串流相關聯的附加時段類型語法元素,附加時段類型語法元素與細微性類型語法元素相關聯,其中附加時段類型語法元素不同於時段類型語法元素;及基於細微性類型語法元素和附加時段類型語法元素解碼位元串流的一部分。
態樣7. 根據請求項1之裝置,其中至少一個處理器被配置為檢索以下中的至少一個:與位元串流相關聯的子圖片語法元素,該子圖片語法元素指示當CM應用於多個圖片時訊號傳遞通知子圖片辨識符(ID);與位元串流相關聯的譯碼樹塊(CTB)數語法元素,當細微性類型等於切片或圖塊並且即將到來的時段跨越多個圖片時,可以在CM中訊號傳遞通知指示即將到來的時段上的譯碼樹亮度塊的總數的CTB數語法元素;或與位元串流相關聯的平均譯碼樹塊(CTB)數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的平均數。
態樣8. 根據請求項1之裝置,其中當在位元串流的至少一部分中存在可用的訊框內譯碼塊時,與串流的至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
態樣9. 根據請求項1之裝置,其中當在位元串流的至少一部分中存在可用的訊框間譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
態樣10. 根據請求項1之裝置,其中至少一個處理器被配置為基於與位元串流相關聯的CM來決定裝置的操作頻率。
態樣11. 根據請求項1之裝置,亦包括被配置為顯示位元串流的至少一部分的顯示器。
態樣12. 根據請求項1之裝置,其中該裝置是行動設備、可穿戴設備、擴展現實設備、相機、個人電腦、車輛、機器人設備、電視機或計算設備中的一個。
態樣13. 一種用於處理視訊資料的方法,包括:獲得位元串流;檢索與位元串流相關聯的細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;檢索與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;及基於細微性類型語法元素和時段類型語法元素解碼位元串流的一部分。
態樣14. 根據請求項13之方法,其中細微性類型語法元素的值指定CM適用於位元串流的圖片或圖片的一部分,該圖片的一部分小於整個圖片。
態樣15. 根據請求項13之方法,其中細微性類型語法元素的值指定CM適用於位元串流的一或多個圖片的切片、圖塊、子圖片、可擴展層或譯碼樹單元(CTU)行中的至少一個。
態樣16. 根據請求項13之方法,其中時段類型語法元素指示即將到來的時段的指定時間間隔、即將到來的時段的圖片數量、即將到來的時段包括直到包括下一個切片的圖片的所有圖片,或者即將到來的時段包括單個圖片中的至少一個。
態樣17. 根據請求項13之方法,亦包括檢索與位元串流相關聯的細微性級別CM語法結構,細微性級別CM語法結構指定在即將到來的時段內位元串流的一或多個細微性段的細微性級別複雜度度量。
態樣18. 根據請求項13之方法,亦包括:檢索與位元串流相關聯的附加時段類型語法元素,附加時段類型語法元素與細微性類型語法元素相關聯,其中附加時段類型語法元素不同於時段類型語法元素,以及基於細微性類型語法元素和附加時段類型語法元素解碼位元串流的一部分。
態樣19. 根據請求項13之方法,亦包括檢索以下中的至少一個:與位元串流相關聯的子圖片語法元素,該子圖片語法元素指示當CM應用於多個圖片時訊號傳遞通知子圖片辨識符(ID);與位元串流相關聯的譯碼樹塊(CTB)數語法元素,當細微性類型等於切片或圖塊並且即將到來的時段跨越多個圖片時,可以在CM中訊號傳遞通知指示即將到來的時段上的譯碼樹亮度塊的總數的CTB數語法元素;或與位元串流相關聯的平均譯碼樹塊(CTB)數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的平均數。
態樣20. 根據請求項13之方法,其中當在位元串流的至少一部分中存在可用的訊框內譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
態樣21. 根據請求項13之方法,其中當在位元串流的至少一部分中存在可用的訊框間譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
態樣22. 根據請求項13之方法,亦包括在顯示器上顯示位元串流的至少一部分。
態樣23. 根據請求項13之方法,亦包括基於與位元串流相關聯的CM來決定設備的操作頻率。
態樣24. 一種用於處理視訊資料的裝置,包括:至少一個記憶體;及至少一個處理器,耦合到至少一個記憶體,該至少一個處理器被配置為:獲得視訊資料;為位元串流產生細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的細微性類型;為位元串流產生與位元串流相關聯的時段類型語法元素,該時段類型語法元素指示即將到來的時間段或CM適用的圖片集;產生與視訊資料相關聯的位元串流,該位元串流包括細微性類型語法元素和時段類型語法元素;及輸出所產生的位元串流。
態樣25. 根據請求項24之裝置,其中細微性類型語法元素的值指定CM適用於位元串流的圖片或圖片的一部分,該圖片的一部分小於整個圖片。
態樣26. 根據請求項24之裝置,其中細微性類型語法元素的值指定CM適用於位元串流的一或多個圖片的切片、圖塊、子圖片、可擴展層或譯碼樹單元(CTU)行中的至少一個。
態樣27. 根據請求項24之裝置,其中時段類型語法元素指示即將到來的時段的指定時間間隔、即將到來的時段的圖片數量、即將到來的時段包括直到包括下一個切片的圖片的所有圖片,或者即將到來的時段包括單個圖片中的至少一個。
態樣28. 根據請求項24之裝置,其中一或多個處理器被配置為為位元串流產生細微性級別CM語法結構,該細微性級別CM語法結構指定在即將到來的時段內一或多個實體的細微性級別複雜度度量。
態樣29. 根據請求項24之裝置,其中時段類型語法元素指示即將到來的時段的指定時間間隔、即將到來的時段的圖片數量、即將到來的時段包括直到包括下一個切片的圖片的所有圖片,或者即將到來的時段包括單個圖片中的至少一個。
態樣30. 根據請求項24之裝置,其中至少一個處理器被配置為為位元串流產生相關聯的附加時段類型語法元素,附加時段類型語法元素與細微性類型語法元素相關聯,其中附加時段類型語法元素不同於時段類型語法元素,並且其中附加時段類型語法元素用於解碼具有細微性類型語法元素的位元串流的一部分。
態樣31. 根據請求項24之裝置,其中至少一個處理器被配置為為位元串流產生以下中的至少一個:與位元串流相關聯的子圖片語法元素,該子圖片語法元素指示當CM應用於多個圖片時訊號傳遞通知子圖片辨識符(ID);與位元串流相關聯的譯碼樹塊(CTB)數語法元素,當細微性類型等於切片或圖塊並且即將到來的時段跨越多個圖片時,可以在CM中訊號傳遞通知指示即將到來的時段上的譯碼樹亮度塊的總數的CTB數語法元素;或與位元串流相關聯的平均譯碼樹塊(CTB)數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的平均數。
態樣32. 根據請求項24之裝置,其中當在位元串流的至少一部分中存在可用的訊框內譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
態樣33. 根據請求項24之裝置,其中當在位元串流的至少一部分中存在可用的訊框間譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
態樣34. 根據請求項24之裝置,亦包括被配置為擷取視訊資料的相機。
態樣35. 根據請求項24之裝置,其中該裝置是行動設備、可穿戴設備、擴展現實設備、相機、個人電腦、車輛、機器人設備、電視機或計算設備中的一個。
態樣36. 根據請求項1之裝置,其中至少一個處理器被配置為檢索與位元串流的一或多個細微性段相關聯的一或多個品質恢復度量。
態樣37. 根據請求項1之裝置,其中至少一個處理器被配置為:接收補充增強資訊(SEI)訊息;並從SEI訊息中檢索細微性類型語法元素。
態樣38. 根據請求項1之裝置,其中該裝置包括解碼器。
態樣39. 根據請求項1之裝置,其中該裝置包括被配置為擷取一或多個圖片的相機。
態樣40. 根據請求項13之方法,其中至少一個處理器被配置為檢索與位元串流的一或多個細微性段相關聯的一或多個品質恢復度量。
態樣41. 根據請求項13之方法,其中至少一個處理器被配置為:接收補充增強資訊(SEI)訊息;並從SEI訊息中檢索細微性類型語法元素。
態樣42. 根據請求項13之方法,其中該裝置包括解碼器。
態樣43. 根據請求項13之方法,其中該裝置包括被配置為擷取一或多個圖片的相機。
態樣44. 根據請求項24之裝置,其中至少一個處理器被配置為編碼與位元串流的一或多個細微性段相關聯的一或多個品質恢復度量。
態樣45. 根據請求項24之裝置,其中至少一個處理器被配置為:對具有細微性類型語法元素的補充增強資訊(SEI)訊息進行編碼。
態樣46. 根據請求項24之裝置,其中該裝置包括解碼器。
態樣47. 根據請求項24之裝置,其中該裝置包括被配置為擷取視訊資料的一或多個圖片的相機。
態樣48:一種處理視訊資料的方法,包括根據態樣24至47中任一態樣的操作中的一或多個。
態樣49:一種在其上儲存有指令的非暫時性電腦可讀取媒體,當該指令由一或多個處理器執行時,使一或多個處理器執行根據態樣13至23和態樣48中任一態樣的操作中的一或多個。
態樣50:一種用於處理視訊資料的裝置,包括用於執行根據態樣13至23和態樣48中任一態樣的操作中的一或多個的部件。
態樣1A: 一種用於處理視訊資料的裝置,包括:至少一個記憶體;及耦合到至少一個記憶體的一或多個處理器,該一或多個處理器被配置為:獲得位元串流;及檢索與位元串流相關聯的細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
態樣2A: 根據態樣1A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的圖片。
態樣3A: 根據態樣2A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的切片。
態樣4A: 根據態樣2A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的圖塊。
態樣5A: 根據態樣2A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的子圖片。
態樣6A: 根據態樣2A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的可擴展層。
態樣7A: 根據態樣2A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的譯碼樹單元(CTU)行。
態樣8A: 根據態樣1A至7A中任一態樣的裝置,其中一或多個處理器被配置為檢索與位元串流相關聯的時段類型語法元素,該時段類型語法元素指定CM適用的即將到來的時段的類型。
態樣9A: 根據態樣1A至8A中任一態樣的裝置,其中一或多個處理器被配置為檢索與位元串流相關聯的圖片級別CM語法結構,該圖片級別CM語法結構指定在一時段內一或多個圖片的複雜度度量。
態樣10A: 根據態樣1A至9A中任一態樣的裝置,其中一或多個處理器被配置為檢索與位元串流相關聯的細微性級別CM語法結構,該細微性級別CM語法結構指定在一時段內一或多個實體的細微性級別複雜度度量。
態樣11A: 根據態樣10A的裝置,其中一或多個實體包括切片、圖塊、子圖片和層中的至少一個。
態樣12A: 根據態樣1A至11A中任一態樣的裝置,其中一或多個處理器被配置為檢索與位元串流相關聯的子圖片語法元素,當時段跨越多個圖片時,在CM中訊號傳遞通知指示子圖片辨識符(ID)的子圖片語法元素。
態樣13A: 根據態樣1A至12A中任一態樣的裝置,其中一或多個處理器被配置為檢索與位元串流相關聯的譯碼樹塊(CTB)數語法元素,當細微性類型等於切片或圖塊並且時段跨越多個圖片時,可以在CM中訊號傳遞通知指示在一時段內的譯碼樹亮度塊的總數的CTB數語法元素。
態樣14A: 根據態樣1A至13A中任一態樣的裝置,其中一或多個處理器被配置為檢索與位元串流相關聯的平均譯碼樹塊(CTB)數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的平均數。
態樣15A: 根據態樣1A至14A中任一態樣的裝置,其中當在位元串流的至少一部分中存在可用的訊框內譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
態樣16A: 根據態樣1A至15A中任一態樣的裝置,其中當在位元串流的至少一部分中存在可用的訊框間譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
態樣17A: 根據態樣1A至16A中任一態樣的裝置,其中一或多個處理器被配置為檢索與位元串流的一或多個細微性段相關聯的一或多個品質恢復度量。
態樣18A: 根據態樣17A的裝置,其中位元串流的一或多個細微性段包括切片、圖塊和子圖片中的至少一個。
態樣19A: 根據態樣1A至18A中任一態樣的裝置,其中一或多個處理器被配置為:接收補充增強資訊(SEI)訊息;並從SEI訊息中檢索細微性類型語法元素。
態樣20A: 根據態樣1A至19A中任一態樣的裝置,其中一或多個處理器被配置為基於與位元串流相關聯的CM來決定裝置的操作頻率。
態樣21A: 根據態樣1A至20A中任一態樣的裝置,其中該裝置包括解碼器。
態樣22A: 根據態樣1A至21A中任一態樣的裝置,亦包括被配置為顯示一或多個輸出圖片的顯示器。
態樣23A: 根據態樣1A至22A中任一態樣的裝置,亦包括被配置為捕捉一或多個圖片的相機。
態樣24A: 根據態樣1A至23A中任一態樣的裝置,其中該裝置是行動設備。
態樣25A: 一種處理視訊資料的方法,包括根據態樣1A至24A中任一態樣的操作中的一或多個。
態樣26A: 一種在其上儲存有指令的非暫時性電腦可讀取媒體,當該指令由一或多個處理器執行時,使一或多個處理器執行根據態樣1A至24A中任一態樣的操作中的一或多個。
態樣27A: 一種用於處理視訊資料的裝置,包括用於執行根據態樣1A至24A中任一態樣的操作中的一或多個的部件。
態樣28A: 一種用於處理視訊資料的裝置,包括:記憶體;及耦合到記憶體的一或多個處理器,該一或多個處理器被配置為:獲得視訊資料;產生與視訊資料相關聯的位元串流;及為位元串流產生細微性類型語法元素,該細微性類型語法元素指定與位元串流相關聯的複雜度度量(CM)適用的細微性類型。
態樣29A: 根據態樣28A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的圖片。
態樣30A: 根據態樣29A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的切片。
態樣31A: 根據態樣29A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的圖塊。
態樣32A: 根據態樣29A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的子圖片。
態樣33A: 根據態樣29A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的可擴展層。
態樣34A: 根據態樣29A的裝置,其中細微性類型語法元素的值指定CM適用於位元串流的譯碼樹單元(CTU)行。
態樣35A: 根據態樣28A至34A中任一態樣的裝置,其中一或多個處理器被配置為為位元串流產生指定CM適用的即將到來的時段的類型的時段類型語法元素。
態樣36A: 根據態樣28A至35A中任一態樣的裝置,其中一或多個處理器被配置為為位元串流產生指定在一時段內一或多個圖片的複雜度度量的圖片級別CM語法結構。
態樣37A: 根據態樣28A至36A中任一態樣的裝置,其中一或多個處理器被配置為為位元串流產生細微性級別CM語法結構,該細微性級別CM語法結構指定在一時段內一或多個實體的細微性級別複雜度度量。
態樣38A: 根據態樣37A的裝置,其中一或多個實體包括切片、圖塊、子圖片和層中的至少一個。
態樣39A: 根據態樣28A至38A中任一態樣的裝置,其中一或多個處理器被配置為為位元串流產生子圖片語法元素,當時段跨越多個圖片時在CM中訊號傳遞通知指示子圖片辨識符(ID)的子圖片語法元素。
態樣40A: 根據態樣28A至39A中任一態樣的裝置,其中一或多個處理器被配置為為位元串流產生譯碼樹塊(CTB)數語法元素,當細微性類型等於切片或圖塊並且時段跨越多個圖片時,可以在CM中訊號傳遞通知指示在一時段內的譯碼樹亮度塊的總數的譯碼樹塊(CTB)數語法元素。
態樣41A: 根據態樣28A至40A中任一態樣的裝置,其中一或多個處理器被配置為為位元串流產生平均編碼樹塊(CTB)數語法元素,該平均譯碼樹塊(CTB)數語法元素指示每個圖片每細微性的CTB或4×4塊的平均數。
態樣42A: 根據態樣28A至41A中任一態樣的裝置,其中當在位元串流的至少一部分中存在可用的訊框內譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
態樣43A: 根據態樣28A至42A中任一態樣的裝置,其中當在位元串流的至少一部分中存在可用的訊框間譯碼塊時,與位元串流的至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
態樣44A: 根據態樣28A至43A中任一態樣的裝置,其中一或多個處理器被配置為為位元串流產生與位元串流的一或多個細微性段相關聯的一或多個品質恢復度量。
態樣45A: 根據態樣44A的裝置,其中位元串流的一或多個細微性段包括切片、圖塊和子圖片中的至少一個。
態樣46A: 根據態樣28A至45A中任一態樣的裝置,其中一或多個處理器被配置為:產生補充增強資訊(SEI)訊息;並在SEI訊息中包括細微性類型語法元素。
態樣47A: 根據態樣28A至46A中任一態樣的裝置,其中一或多個處理器被配置為儲存位元串流。
態樣48A: 根據態樣28A至47A中任一態樣的裝置,其中一或多個處理器被配置為發送位元串流。
態樣49A: 根據態樣28A至48A中任一態樣的裝置,其中該裝置包括編碼器。
態樣50A: 根據態樣28A至49A中任一態樣的裝置,亦包括被配置為顯示一或多個輸出圖片的顯示器。
態樣51A: 根據態樣28A至50A中任一態樣的裝置,亦包括被配置為捕捉一或多個圖片的相機。
態樣52A: 根據態樣28A至51A中任一態樣的裝置,其中該裝置是行動設備。
態樣53A: 一種處理視訊資料的方法,包括根據態樣28A至52A中任一態樣的操作中的一或多個。
態樣54A: 一種在其上儲存有指令的非暫時性電腦可讀取媒體,當該指令由一或多個處理器執行時,使一或多個處理器執行根據態樣28A至52A中任一態樣的操作中的一或多個。
態樣55A: 一種用於處理視訊資料的裝置,包括用於執行根據態樣28A至52A中任一態樣的操作中的一或多個的部件。
35:分割單元 41:預測處理單元 42:運動估計單元 44:運動補償單元 46:訊框內預測處理單元 50:加法器 52:變換處理單元 54:量化單元 56:熵編碼單元 57:後處理設備 58:逆量化單元 60:逆變換處理單元 62:加法器 63:濾波器單元 64:圖片記憶體 79:網路實體 80:熵解碼單元 81:預測處理單元 82:運動補償單元 84:訊框內預測處理單元 86:逆量化單元 88:逆變換處理單元 90:加法器 91:濾波器單元 92:圖片記憶體 100:系統 102:視訊源 104:編碼設備 106:編碼器引擎 108:記憶體 110:輸出 112:解碼設備 114:輸入 116:解碼器引擎 118:記憶體 120:通訊鏈路 122:視訊目標設備 200:視訊圖片 202:騎自行車者 204:圖片集 206:圖片 208:切片 210:圖塊 212:子圖片 300:解碼編碼視訊 302:操作 304:操作 306:操作 308:操作 400:程序 402:操作 404:操作 406:操作
下文參考以下附圖詳細描述本案的說明性實例:
圖1是圖示根據本案的一些實例的編碼設備和解碼設備的實例的方塊圖;
圖2是圖示視訊圖片的細微性級別複雜度度量的實例使用的圖;
圖3是圖示根據本案的態樣的用於解碼已編碼視訊的技術的流程圖;
圖4是圖示根據本案的態樣的用於編碼視訊的技術的流程圖;
圖5是圖示根據本案的一些實例的實例視訊解碼設備的方塊圖;及
圖6是圖示根據本案的一些實例的實例視訊編碼設備的方塊圖。
國內寄存資訊(請依寄存機構、日期、號碼順序註記) 無 國外寄存資訊(請依寄存國家、機構、日期、號碼順序註記) 無
200:視訊圖片
202:騎自行車者
204:圖片集
206:圖片
208:切片
210:圖塊
212:子圖片

Claims (35)

  1. 一種用於處理視訊資料的裝置,包括: 至少一個記憶體;和 至少一個處理器,耦合到該至少一個記憶體,該至少一個處理器被配置為: 獲得一位元串流; 檢索與該位元串流相關聯的一細微性類型語法元素,該細微性類型語法元素指定與該位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的一細微性類型; 檢索與該位元串流相關聯的一時段類型語法元素,該時段類型語法元素指示一即將到來的時間段或該CM適用的一圖片集;及 基於該細微性類型語法元素和該時段類型語法元素解碼該位元串流的一部分。
  2. 根據請求項1之裝置,其中該細微性類型語法元素的一值指定該CM適用於該位元串流的一圖片或該圖片的一部分,該圖片的一部分小於整個該圖片。
  3. 根據請求項1之裝置,其中該細微性類型語法元素的一值指定該CM適用於該位元串流的該一或多個圖片的一切片、一圖塊、一子圖片、一可擴展層或一譯碼樹單元(CTU)行中的至少一個。
  4. 根據請求項1之裝置,其中該時段類型語法元素指示該即將到來的時段的一指定時間間隔、該即將到來的時段的一圖片數量、該即將到來的時段包括直到包括下一個切片的一圖片的所有圖片,或者該即將到來的時段包括一單個圖片中的至少一個。
  5. 根據請求項1之裝置,其中該至少一個處理器被配置為檢索與該位元串流相關聯的一細微性級別CM語法結構,該細微性級別CM語法結構指定在該即將到來的時段內該位元串流的一或多個細微性段的細微性級別複雜度度量。
  6. 根據請求項1之裝置,其中該至少一個處理器被配置為: 檢索與該位元串流相關聯的一附加時段類型語法元素,該附加時段類型語法元素與該細微性類型語法元素相關聯,其中該附加時段類型語法元素不同於該時段類型語法元素;並且 基於該細微性類型語法元素和該附加時段類型語法元素解碼該位元串流的一部分。
  7. 根據請求項1之裝置,其中該至少一個處理器被配置為檢索以下中的至少一個: 與該位元串流相關聯的一子圖片語法元素,該子圖片語法元素指示當該CM應用於多個圖片時訊號傳遞通知一子圖片辨識符(ID); 與該位元串流相關聯的一譯碼樹塊(CTB)數語法元素,當該細微性類型等於一切片或一圖塊並且該即將到來的時段跨越多個圖片時,能夠在CM中訊號傳遞通知指示該即將到來的時段上的譯碼樹亮度塊的一總數的該CTB數語法元素;或 與該位元串流相關聯的一平均CTB數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的一平均數。
  8. 根據請求項1之裝置,其中當在該位元串流的至少一部分中存在可用的訊框內譯碼塊時,與該位元串流的該至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
  9. 根據請求項1之裝置,其中當在該位元串流的至少一部分中存在可用的訊框間譯碼塊時,與該位元串流的該至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
  10. 根據請求項1之裝置,其中該至少一個處理器被配置為基於與該位元串流相關聯的該CM來決定該裝置的一操作頻率。
  11. 根據請求項1之裝置,亦包括一顯示器,該顯示器被配置為顯示該位元串流的至少一部分。
  12. 根據請求項1之裝置,其中該裝置是一行動設備、一可穿戴設備、一擴展現實設備、一相機、一個人電腦、一車輛、一機器人設備、一電視機或一計算設備中的一個。
  13. 一種用於處理視訊資料的方法,包括以下步驟: 獲得一位元串流; 檢索與該位元串流相關聯的一細微性類型語法元素,該細微性類型語法元素指定與該位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的一細微性類型; 檢索與該位元串流相關聯的一時段類型語法元素,該時段類型語法元素指示一即將到來的時間段或該CM適用的一圖片集;及 基於該細微性類型語法元素和該時段類型語法元素解碼該位元串流的一部分。
  14. 根據請求項13之方法,其中該細微性類型語法元素的一值指定該CM適用於該位元串流的一圖片或該圖片的一部分,該圖片的一部分小於整個該圖片。
  15. 根據請求項13之方法,其中該細微性類型語法元素的一值指定該CM適用於該位元串流的該一或多個圖片的一切片、一圖塊、一子圖片、一可擴展層或一譯碼樹單元(CTU)行中的至少一個。
  16. 根據請求項13之方法,其中該時段類型語法元素指示該即將到來的時段的一指定時間間隔、該即將到來的時段的一圖片數量、該即將到來的時段包括直到包括下一個切片的一圖片的所有圖片,或者該即將到來的時段包括一單個圖片中的至少一個。
  17. 根據請求項13之方法,亦包括檢索與該位元串流相關聯的一細微性級別CM語法結構,該細微性級別CM語法結構指定在該即將到來的時段內該位元串流的一或多個細微性段的細微性級別複雜度度量。
  18. 根據請求項13之方法,亦包括以下步驟: 檢索與該位元串流相關聯的一附加時段類型語法元素,該附加時段類型語法元素與該細微性類型語法元素相關聯,其中該附加時段類型語法元素不同於該時段類型語法元素;及 基於該細微性類型語法元素和該附加時段類型語法元素解碼該位元串流的一部分。
  19. 根據請求項13之方法,亦包括檢索以下中的至少一個: 與該位元串流相關聯的一子圖片語法元素,該子圖片語法元素指示當該CM應用於多個圖片時訊號傳遞通知一子圖片辨識符(ID); 與該位元串流相關聯的一譯碼樹塊(CTB)數語法元素,當該細微性類型等於一切片或一圖塊並且該即將到來的時段跨越多個圖片時,能夠在CM中訊號傳遞通知指示該即將到來的時段上的譯碼樹亮度塊的一總數的該CTB數語法元素;或 與該位元串流相關聯的一平均CTB數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的一平均數。
  20. 根據請求項13之方法,其中當在該位元串流的至少一部分中存在可用的訊框內譯碼塊時,與該位元串流的該至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
  21. 根據請求項13之方法,其中當在該位元串流的至少一部分中存在可用的訊框間譯碼塊時,與該位元串流的該至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
  22. 根據請求項13之方法,亦包括在一顯示器上顯示該位元串流的至少一部分。
  23. 根據請求項13之方法,亦包括基於與該位元串流相關聯的該CM來決定一設備的一操作頻率。
  24. 一種用於處理視訊資料的裝置,包括: 至少一個記憶體;和 至少一個處理器,耦合到該至少一個記憶體,該至少一個處理器被配置為: 獲得視訊資料; 為一位元串流產生一細微性類型語法元素,該細微性類型語法元素指定與該位元串流相關聯的複雜度度量(CM)適用的一或多個圖片的一細微性類型; 為該位元串流產生與該位元串流相關聯的一時段類型語法元素,該時段類型語法元素指示一即將到來的時間段或該CM適用的一圖片集; 產生與該視訊資料相關聯的該位元串流,該位元串流包括該細微性類型語法元素和該時段類型語法元素;及 輸出所產生的位元串流。
  25. 根據請求項24之裝置,其中該細微性類型語法元素的一值指定該CM適用於該位元串流的一圖片或該圖片的一部分,該圖片的一部分小於整個該圖片。
  26. 根據請求項24之裝置,其中該細微性類型語法元素的一值指定該CM適用於該位元串流的該一或多個圖片的一切片、一圖塊、一子圖片、一可擴展層或一譯碼樹單元(CTU)行中的至少一個。
  27. 根據請求項24之裝置,其中該時段類型語法元素指示該即將到來的時段的一指定時間間隔、該即將到來的時段的一圖片數量、該即將到來的時段包括直到包括下一個切片的一圖片的所有圖片,或者該即將到來的時段包括一單個圖片中的至少一個。
  28. 根據請求項24之裝置,其中該至少一個處理器被配置為為該位元串流產生一細微性級別CM語法結構,該細微性級別CM語法結構指定在該即將到來的時段內一或多個實體的細微性級別複雜度度量。
  29. 根據請求項24之裝置,其中該時段類型語法元素指示該即將到來的時段的一指定時間間隔、該即將到來的時段的一圖片數量、該即將到來的時段包括直到包括下一個切片的一圖片的所有圖片,或者該即將到來的時段包括一單個圖片中的至少一個。
  30. 根據請求項24之裝置,其中該至少一個處理器被配置為為該位元串流產生相關聯的一附加時段類型語法元素,該附加時段類型語法元素與該細微性類型語法元素相關聯,其中該附加時段類型語法元素不同於該時段類型語法元素,並且其中該附加時段類型語法元素用於解碼具有該細微性類型語法元素的該位元串流的一部分。
  31. 根據請求項24之裝置,其中該至少一個處理器被配置為為該位元串流產生以下中的至少一個: 與該位元串流相關聯的一子圖片語法元素,該子圖片語法元素指示當該CM應用於多個圖片時訊號傳遞通知一子圖片辨識符(ID); 與該位元串流相關聯的一譯碼樹塊(CTB)數語法元素,當該細微性類型等於一切片或一圖塊並且該即將到來的時段跨越多個圖片時,可以在CM中訊號傳遞通知指示該即將到來的時段上的譯碼樹亮度塊的一總數的該CTB數語法元素;或 與該位元串流相關聯的一平均CTB數語法元素,該平均CTB數語法元素指示每個圖片每細微性的CTB或4×4塊的一平均數。
  32. 根據請求項24之裝置,其中當在該位元串流的至少一部分中存在可用的訊框內譯碼塊時,與該位元串流的該至少一部分相關聯地訊號傳遞通知訊框內譯碼塊統計。
  33. 根據請求項24之裝置,其中當在該位元串流的至少一部分中存在可用的訊框間譯碼塊時,與該位元串流的該至少一部分相關聯地訊號傳遞通知訊框間譯碼塊統計。
  34. 根據請求項24之裝置,亦包括被配置為擷取該視訊資料的一相機。
  35. 根據請求項24之裝置,其中該裝置是一行動設備、一可穿戴設備、一擴展現實設備、一相機、一個人電腦、一車輛、一機器人設備、一電視機或一計算設備中的一個。
TW111128764A 2021-08-09 2022-08-01 綠色中繼資料訊號傳遞 TW202312739A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163231015P 2021-08-09 2021-08-09
US63/231,015 2021-08-09
US17/816,237 US11838553B2 (en) 2021-08-09 2022-07-29 Green metadata signaling
US17/816,237 2022-07-29

Publications (1)

Publication Number Publication Date
TW202312739A true TW202312739A (zh) 2023-03-16

Family

ID=83049820

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111128764A TW202312739A (zh) 2021-08-09 2022-08-01 綠色中繼資料訊號傳遞

Country Status (4)

Country Link
US (1) US11838553B2 (zh)
KR (1) KR20240046714A (zh)
TW (1) TW202312739A (zh)
WO (1) WO2023019071A1 (zh)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9866846B2 (en) * 2014-10-14 2018-01-09 Samsung Electronics Co., Ltd. Method and apparatus for video processing with complexity information

Also Published As

Publication number Publication date
WO2023019071A1 (en) 2023-02-16
US20230056436A1 (en) 2023-02-23
US11838553B2 (en) 2023-12-05
KR20240046714A (ko) 2024-04-09

Similar Documents

Publication Publication Date Title
JP6780054B2 (ja) マルチレイヤビデオコーディングにおける3次元ルックアップテーブルベースの色域スケーラビリティ
CN111201790B (zh) 基于色度量化参数偏移的编解码方法、装置、存储介质
US11368684B2 (en) Adaptation parameter sets (APS) for adaptive loop filter (ALF) parameters
US11190758B2 (en) Block-based quantized residual domain pulse code modulation assignment for intra prediction mode derivation
TWI633780B (zh) 高效率視訊寫碼擴展中之目標輸出層之選擇
TW202037163A (zh) 改善的子劃分內預測
TW202121899A (zh) 針對局部雙樹的調色板預測器更新
TW201735608A (zh) 用於產生對視訊之顏色再映射資訊之補充增強資訊訊息之方法及系統
KR102138407B1 (ko) 색 공간 스케일러빌리티에 대한 3d 칼라 예측을 위한 비트 심도 값들의 시그널링
CN115398920A (zh) 用于颜色格式支持的自适应环路滤波
TW202203650A (zh) 解碼圖片緩衝器(dpb)操作和存取單元定界符(aud)
US20230179805A1 (en) Adaptive film grain synthesis
CA3198449A1 (en) Intra prediction using enhanced interpolation filters
US11838553B2 (en) Green metadata signaling
US20240015326A1 (en) Non-separable transform for inter-coded blocks
US20230124010A1 (en) Histogram of gradient generation
JP2023552980A (ja) 高ビット深度ビデオコーディングのライスパラメータ導出のための低複雑度の履歴使用
CN117769835A (zh) 绿色元数据信令
WO2024011065A1 (en) Non-separable transform for inter-coded blocks