TW202133616A - 視訊編解碼中的畫面標頭訊框內隨機存取畫面和漸進解碼器刷新訊號傳遞 - Google Patents

視訊編解碼中的畫面標頭訊框內隨機存取畫面和漸進解碼器刷新訊號傳遞 Download PDF

Info

Publication number
TW202133616A
TW202133616A TW109145716A TW109145716A TW202133616A TW 202133616 A TW202133616 A TW 202133616A TW 109145716 A TW109145716 A TW 109145716A TW 109145716 A TW109145716 A TW 109145716A TW 202133616 A TW202133616 A TW 202133616A
Authority
TW
Taiwan
Prior art keywords
picture
nal unit
gdr
irap
picture header
Prior art date
Application number
TW109145716A
Other languages
English (en)
Inventor
莫哈美德塞伊德 克班
瓦迪姆 賽萊金
艾達希克里斯南 拉瑪蘇拉莫尼安
瑪塔 卡克基維克茲
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW202133616A publication Critical patent/TW202133616A/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一種處理視訊資料的方法包括:獲得位元串流,和在該位元串流中的編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面。定位IRAP或GDR畫面可包括:從位元串流中的畫面標頭網路抽象層(NAL)單元獲得語法元素,該語法元素指示與畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面。畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素。

Description

視訊編解碼中的畫面標頭訊框內隨機存取畫面和漸進解碼器刷新訊號傳遞
本專利申請案主張於2019年12月23日提出申請的美國臨時專利申請案第62/953,035號的權益,其全部內容經由引用併入本文。
本案係關於視訊編碼及視訊解碼。
數位視訊能力可以被合併到廣泛的設備中,包括數位電視、數位直接廣播系統、無線廣播系統、個人數位助理(PDAs)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數碼相機、數位記錄設備、數位媒體播放機、視訊遊戲設備、視訊遊戲機、蜂巢或衛星無線電電話、所謂的「智慧型電話」、視訊電話會議設備、視訊資料串流設備等等。數位視訊設備實現視訊編解碼(coding)技術,諸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分、高級視訊編解碼(AVC)、ITU-T H.265/高效視訊編解碼(HEVC)定義的標準以及該等標準的擴展中描述的彼等技術。藉由實現此種視訊編解碼技術,視訊設備可以更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊編解碼技術包括空間(畫面內)預測及/或時間(畫面間)預測,以減少或移除視訊序列中固有的冗餘。對於基於區塊的視訊編解碼,視訊片段(亦即,視訊畫面或視訊畫面的一部分)可以被分割成視訊區塊,其亦可以被稱為編解碼樹單元(CTUs)、編解碼單元(CUs)及/或編解碼節點。使用針對同一畫面中的相鄰區塊中的參考取樣的空間預測來編碼畫面的訊框內編解碼的(I)片段中的視訊區塊。畫面的訊框間編解碼的(P或B)片段中的視訊區塊可以使用針對同一畫面中的相鄰區塊中的參考取樣的空間預測,或針對其他參考畫面中的參考取樣的時間預測。畫面可被稱為訊框,並且參考畫面可被稱為參考訊框。
通常,本案描述了與用於在視訊編解碼中用信號發送訊框內隨機存取畫面(IRAP)或漸進解碼刷新(GDR)畫面的技術相關的技術。例如,本案描述了其中視訊編碼器可在畫面標頭網路抽象層(NAL)單元中用信號發送語法元素的技術。語法元素指示與畫面標頭相關聯的畫面必須是IRAP或GDR畫面。該語法元素可使得設備(諸如包括視訊解碼器的設備)能夠定位與IRAP或GDR畫面相關聯的畫面標頭,而無需在NAL單元串流中向後搜尋畫面標頭NAL單元。
在一個實例中,本公共描述了一種處理視訊資料的方法,該方法包括:獲得包括該視訊資料的編碼的畫面的集合的位元串流;及在該位元串流中的編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中定位該IRAP或GDR畫面包括:從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面;及基於該語法元素決定與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在另一實例中,本案描述了一種編碼視訊資料的方法,該方法包括:產生該視訊資料的畫面的集合的編碼的畫面;及將畫面標頭網路抽象層(NAL)單元包括在包括該編碼的畫面的位元串流中,其中該畫面標頭NAL單元包括語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在另一實例中,本案描述了一種用於處理視訊資料的設備,該設備包括:記憶體,被配置為儲存視訊資料的編碼的畫面;及以電路實現的一或多個處理器,該一或多個處理器被配置為:在該位元串流中的編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中該一或多個處理器被配置使得該一或多個處理器執行作為定位該IRAP或GDR畫面的部分的以下操作:從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面;及基於該語法元素,決定與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在另一實例中,本案描述了一種用於編碼視訊資料的設備,該設備包括:記憶體,被配置為儲存視訊資料;及以電路實現的一或多個處理器,該一或多個處理器被配置為:產生視訊資料的畫面的集合的編碼的畫面;將畫面標頭網路抽象層(NAL)單元包括在包括該編碼的畫面的位元串流中,其中該畫面標頭NAL單元包括語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在另一實例中,本案描述了一種用於處理視訊資料的設備,該設備包括:用於包括視訊資料的編碼的畫面的集合的位元串流的構件;及用於在該位元串流中的編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面的構件,其中該用於定位該IRAP或GDR畫面的構件包括:用於從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得語法元素的構件,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面;及用於基於該語法元素決定與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面的構件,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在另一實例中,本案描述了一種用於編碼視訊資料的設備,該設備包括:用於產生視訊資料的畫面的集合的編碼的畫面的構件;及用於將畫面標頭網路抽象層(NAL)單元包括在包括該編碼的畫面的位元串流中的構件,其中該畫面標頭NAL單元包括指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面的語法元素,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在另一實例中,本案描述了一種其上儲存有指令的電腦可讀取儲存媒體,該等指令在被執行時促使一或多個處理器進行以下操作:獲得包括視訊資料的編碼的畫面的集合的位元串流;及在該位元串流中的編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中促使該一或多個處理器定位該IRAP或GDR畫面的該等指令包括在被執行時促使該一或多個處理器進行以下操作的指令:從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面的語法元素;及基於該語法元素決定與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在另一實例中,本案描述了一種其上儲存有指令的電腦可讀取儲存媒體,該等指令在被執行時促使一或多個處理器進行以下操作:產生視訊資料的畫面的集合的編碼的畫面;及將畫面標頭網路抽象層(NAL)單元包括在包括該編碼的畫面的位元串流中,其中該畫面標頭NAL單元包括語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在以下附圖和描述中闡述了一或多個實例的細節。其他特徵、目的和優點將從說明書、附圖和請求項中顯而易見。
在視訊內的隨機點處開始重播視訊的能力是現代視訊編解碼的重要特徵。在通用視訊編解碼(VVC)及其他視訊編解碼標準中,可藉由將特定類型的畫面編碼為訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面來實現隨機存取。在VVC中,可以基於包含IRAP和GDR畫面的編碼的片段的網路抽象層(NAL)單元的NAL單元類型,來識別IRAP和GDR畫面。此外,在VVC中,畫面與畫面標頭NAL單元相關聯,其中該畫面標頭NAL單元在包含畫面的編碼的片段的NAL單元之前按位元串流順序用信號傳輸。因此,當執行隨機存取時,設備(例如,視訊解碼器)可識別NAL單元,其NAL單元類型指示其中包含的編碼的片段屬於IRAP或GDR畫面。設備隨後必須以位元串流順序向後搜尋以便發現畫面標頭,使得設備可對IRAP或GDR畫面進行解碼,或者向前前進到畫面標頭以用於稍後解碼。
以此種方式向後搜尋可能減慢執行隨機存取的處理。本案描述可解決此問題的技術。在一個實例中,視訊編碼器可產生視訊資料的畫面的集合的編碼的畫面。在此實例中,視訊編碼器可在包括編碼的畫面的位元串流中包括畫面標頭NAL單元。畫面標頭NAL單元包括指示與畫面標頭NAL單元相關聯的畫面必須是IRAP或漸進解碼器刷新(GDR)畫面的語法元素。由於此語法元素,執行隨機存取的設備可直接將畫面標頭NAL單元識別為與IRAP或GDR畫面相關聯,而無需在位元串流中向後搜尋以發現此畫面標頭NAL單元。
圖1是示出可執行本案的技術的示例性視訊編碼和解碼系統100的方塊圖。本案的技術整體上涉及編解碼(編碼及/或解碼)視訊資料。通常,視訊資料包括用於處理視訊的任何資料。因此,視訊資料可包括原始、未編碼的視訊、編碼的視訊、解碼的(例如,重構的)視訊以及視訊中繼資料,諸如訊號傳遞資料。
如圖1中所示,在該實例中,系統100包括源設備102,其中該源設備提供待由目的地設備116解碼和顯示的編碼的視訊資料。具體而言,源設備102經由電腦可讀取媒體110將視訊資料提供給目的地設備116。源設備102和目的地設備116可包括廣泛的設備中的任一個,包括:桌上型電腦、筆記本(亦即,膝上型)電腦、平板電腦、機上盒、電話手持設備(諸如智慧型電話)、電視、相機、顯示設備、數位媒體播放機、視訊遊戲機、視訊資料串流設備等。在一些情況下,源設備102和目的地設備116可以被配備用於無線通訊,並且因此可被稱為無線通訊設備。
在圖1的實例中,源設備102包括視訊源104、記憶體106、視訊編碼器200和輸出介面108。目的地設備116包括輸入介面122、視訊解碼器300、記憶體120和顯示設備118。根據本案,源設備102的視訊編碼器200和目的地設備116的視訊解碼器300可被配置為應用與用於在視訊編解碼中用信號發送訊框內隨機存取畫面(IRAP)或漸進解碼刷新(GDR)畫面的技術相關的技術。因此,源設備102表示視訊編碼設備的實例,而目的地設備116表示視訊解碼設備的實例。在其他實例中,源設備和目的地設備可包括其他元件或佈置。例如,源設備102可從外部視訊源(諸如外部相機)接收視訊資料。同樣地,目的地設備116可以與外部顯示設備對接,而非包括整合的顯示設備。
如圖1中所示的系統100僅僅是一個實例。通常,任何數位視訊編碼及/或解碼設備可執行與用於在視訊編解碼中用信號發送IRAP或GDR畫面的技術相關的技術。源設備102和目的地設備116僅為其中源設備102產生編碼的視訊資料以傳輸到目的地設備116的此種編解碼設備的實例。本案將「編解碼」設備稱為執行資料的編解碼(編碼及/或解碼)的設備。因此,視訊編碼器200和視訊解碼器300分別表示編解碼設備(具體而言,視訊編碼器和視訊解碼器)的實例。在一些實例中,源設備102和目的地設備116可以以大致對稱的方式操作,使得源設備102和目的地設備116中的每一個包括視訊編碼和解碼用元件。因此,系統100可以支援視訊源設備102和目的地設備116之間的單向或雙向視訊傳輸,例如用於視訊資料串流、視訊重播、視訊廣播或視訊電話。
通常,視訊源104表示視訊資料(亦即,原始的、未編碼的視訊資料)的源,並且向視訊編碼器200提供視訊資料的連續一系列畫面(亦稱為「訊框」),其中視訊編碼器200對畫面的資料進行編碼。源設備102的視訊源104可以包括視訊擷取設備,諸如攝像機、包含先前擷取的原始視訊的視訊存檔及/或用於從視訊內容提供者接收視訊的視訊饋送介面。作為另一替代方案,視訊源104可產生基於電腦圖形的資料作為源視訊,或即時視訊、存檔視訊和電腦產生的視訊的組合。在每種情況下,視訊編碼器200對擷取的、預擷取的或電腦產生的視訊資料進行編碼。視訊編碼器200可以將畫面從接收的順序(有時被稱為「顯示順序」)重新佈置成用於編解碼的編解碼順序。視訊編碼器200可產生包括編碼的視訊資料的位元串流。隨後,源設備102可以經由輸出介面108將編碼的視訊資料輸出到電腦可讀取媒體110上以用於由例如目的地設備116的輸入介面122接收及/或取得。
源設備102的記憶體106和目的地設備116的記憶體120表示通用記憶體。在一些實例中,記憶體106、120可以儲存原始視訊資料,例如,來自視訊源104的原始視訊和來自視訊解碼器300的原始解碼的視訊資料。另外地或替代地,記憶體106、120可以分別儲存可由例如視訊編碼器200和視訊解碼器300執行的軟體指令。儘管在該實例中與視訊編碼器200和視訊解碼器300分開示出記憶體106和記憶體120,但是應當理解,視訊編碼器200和視訊解碼器300亦可以包括用於功能類似或等同目的的內部記憶體。此外,記憶體106、120可以儲存例如從視訊編碼器200輸出的和輸入到視訊解碼器300的編碼的視訊資料。在一些實例中,記憶體106、120的部分可被分配為一或多個視訊緩衝器,例如用於儲存原始的、解碼的及/或編碼的視訊資料。
電腦可讀取媒體110可表示能夠將編碼的視訊資料從源設備102傳輸到目的地設備116的任何類型的媒體或設備。在一個實例中,電腦可讀取媒體110表示使得源設備102能夠例如經由射頻網路或基於電腦的網路將編碼的視訊資料即時地直接傳輸到目的地設備116的通訊媒體。根據諸如無線通訊協定的通訊標準,輸出介面108可調制包括編碼的視訊資料的傳輸信號,並且輸入介面122可解調接收的傳輸信號。通訊媒體可以包括任何無線或有線通訊媒體,諸如射頻(RF)譜或者一或多條實體傳輸線。通訊媒體可以形成基於封包的網路的一部分,諸如區域網路、廣域網路或諸如網際網路的全球網路。通訊媒體可以包括路由器、交換機、基地台或可以有助於促進從源設備102到目的地設備116的通訊的任何其他裝備。
在一些實例中,電腦可讀取媒體110可以包括儲存設備112。源設備102可以將編碼的資料從輸出介面108輸出到儲存設備112。類似地,目的地設備116可以經由輸入介面122存取來自儲存設備112的編碼的資料。儲存設備112可以包括各種分散式或本端存取的資料儲存媒體中的任何一個,諸如硬碟、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存編碼的視訊資料的任何其他合適的數位儲存媒體。
在一些實例中,電腦可讀取媒體110可包括檔案伺服器114或可儲存由源設備102產生的編碼的視訊資料的另一中間儲存設備。源設備102可以將編碼的視訊資料輸出到檔案伺服器114或可以儲存由源設備102產生的編碼的視訊的另一中間儲存設備。目的地設備116可以經由資料串流或下載存取來自檔案伺服器114的儲存的視訊資料。檔案伺服器114可以是能夠儲存編碼的視訊資料並將該編碼的視訊資料傳輸到目的地設備116的任何類型的伺服器設備。檔案伺服器114可以表示web伺服器(例如,用於網站)、檔案傳輸通訊協定(FTP)伺服器、內容遞送網路設備或網路附加儲存(NAS)設備。目的地設備116可以經由任何標準資料連接(包括網際網路連接)存取來自檔案伺服器114的編碼的視訊資料。這可以包括適合於存取儲存在檔案伺服器114上的編碼的視訊資料的無線通道(例如,Wi-Fi連接)、有線連接(例如,數位用戶線(DSL)、電纜數據機等)或兩者的組合。檔案伺服器114和輸入介面122可以被配置為根據資料串流協定、下載傳輸協定或其組合來操作。
輸出介面108和輸入介面122可以表示無線發射器/接收器、數據機、有線聯網單元(例如,乙太網路卡)、根據各種IEEE 802.11標準中的任一個進行操作的無線通訊元件或其他實體元件。在其中輸出介面108和輸入介面122包括無線元件的實例中,輸出介面108和輸入介面122可以被配置為根據蜂巢通訊標準(諸如,4G、4G-LTE(長期進化)、LTE高級、5G等)傳輸資料(諸如,編碼的視訊資料)。在其中輸出介面108包括無線發射器的一些實例中,輸出介面108和輸入介面122可以被配置為根據其他無線標準(諸如,IEEE 802.11規範、IEEE 802.15規範(例如,ZigBee™)、藍牙™標準等)傳輸資料(例如,編碼的視訊資料)。在一些實例中,源設備102及/或目的地設備116可以包括各自的晶片上系統(SoC)設備。例如,源設備102可以包括用於執行歸因於視訊編碼器200及/或輸出介面108的功能的SoC設備,並且目的地設備116可以包括用於執行歸因於視訊解碼器300及/或輸入介面122的功能的SoC設備。
本案的技術可以應用於視訊編解碼以支援各種多媒體應用中的任何一個,諸如空中傳輸電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(諸如HTTP上的動態可適性資料串流(DASH))、編碼到資料儲存媒體上的數位視訊、對儲存在資料儲存媒體上的數位視訊的解碼,或其他應用。
目的地設備116的輸入介面122從電腦可讀取媒體110(例如,通訊媒體、儲存設備112、檔案伺服器114等)接收編碼的視訊位元串流。編碼的視訊位元串流可以包括由視訊編碼器200定義的亦由視訊解碼器300使用的訊號傳遞資訊,諸如具有描述視訊區塊或其他編解碼的單元(例如,片段、畫面、畫面群組、序列等)的特徵及/或處理的值的語法元素。顯示設備118向使用者顯示解碼的視訊資料的解碼的畫面。顯示設備118可以表示各種顯示設備中的任何一個,諸如陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型的顯示設備。
儘管在圖1中未圖示,但是在一些實例中,視訊編碼器200和視訊解碼器300中的每一個可以與音訊編碼器及/或音訊解碼器整合,並且可以包括適當的MUX-DEMUX單元或其他硬體及/或軟體,以處置在共用資料串流中包括音訊和視訊兩者的多工串流。若適用的話,MUX-DEMUX單元可以符合ITUH.223多工器協定或諸如使用者資料包通訊協定(UDP)的其他協定。
視訊編碼器200和視訊解碼器300中的每一個可以被實現為各種合適的編碼器及/或解碼器電路中的任何一種,諸如一或多個微處理器、數位訊號處理器(DSPs)、特殊應用積體電路(ASICs)、現場可程式設計閘陣列(FPGAs)、離散邏輯、軟體、硬體、韌體或其任何組合。當該技術部分地以軟體實現時,設備可以將用於軟體的指令儲存在合適的、非暫態電腦可讀取媒體中,並且使用一或多個處理器在硬體中執行該等指令以執行本案的技術。視訊編碼器200和視訊解碼器300中的每一個可以包括在一或多個編碼器或解碼器中,編碼器或解碼器中的任一個可以被整合為相應設備中的組合的編碼器/解碼器(CODEC)的一部分。包括視訊編碼器200及/或視訊解碼器300的設備可以包括積體電路、微處理器及/或無線通訊設備,諸如蜂巢式電話。
視訊編碼器200和視訊解碼器300可以根據視訊編解碼標準(諸如ITU-T H.265,亦被稱為高效視訊編解碼(HEVC)或其擴展,諸如多視圖及/或可縮放視訊編解碼擴展)進行操作。或者,視訊編碼器200和視訊解碼器300可以根據其他專有或行業標準進行操作,諸如ITU-T H.266,亦被稱為通用視訊編解碼(VVC)。在Bross等人的「Versatile Video Coding(草案7)」,ITU-T SG 16 WP 3和ISO/IEC JTC 1/SC 29/WG 11的聯合視訊專家組(JVET),第16次會議:日內瓦,CH,2019年10月1-11日,JVET-P2001-v14(以下稱為「VVC草案7」)中描述了VVC標準的最近草案。然而,本案的技術不限於任何特定編解碼標準。
通常,視訊編碼器200和視訊解碼器300可以執行畫面的基於區塊的編解碼。術語「區塊」通常指包括要處理的(例如,編碼的、解碼的或以其他方式在編碼及/或解碼處理中使用的)資料的結構。例如,區塊可以包括亮度及/或色度資料的取樣的二維矩陣。通常,視訊編碼器200和視訊解碼器300可以對以YUV(例如,Y、Cb、Cr)格式表示的視訊資料進行編解碼。亦即,視訊編碼器200和視訊解碼器300可以對亮度和色度分量進行編解碼,而不是對畫面的取樣的紅色、綠色和藍色(RGB)資料進行編解碼,其中色度分量可以包括紅色色調和藍色色調色度分量。在一些實例中,視訊編碼器200在編碼之前將接收的RGB格式化資料轉換為YUV表示,並且視訊解碼器300將YUV表示轉換為RGB格式。或者,預處理和後處理單元(未圖示)可以執行該等轉換。
本案可以通常指畫面的編解碼(例如,編碼和解碼)以包括對畫面的資料進行編碼或解碼的處理。類似地,本案可以指畫面的區塊的編解碼以包括對區塊的資料進行編碼或解碼的處理,例如預測及/或殘差編解碼。編碼的視訊位元串流通常包括表示編解碼決策(例如,編解碼模式)和將畫面分割成區塊的語法元素的一系列值。因此,對畫面或區塊進行編解碼的代表通常應理解為對形成畫面或區塊的語法元素的值進行編解碼。
HEVC定義各種區塊,包括:編解碼單元(CUs)、預測單元(PUs)和變換單元(TUs)。根據HEVC,視訊編解碼器(諸如視訊編碼器200)根據四元樹結構將編解碼樹單元(CTU)分割成CU。亦即,視訊編解碼器將CTU和CU分割成四個相等、非重疊正方形,並且四元樹的每一個節點具有零或四個子節點。沒有子節點的節點可被稱為「葉節點」,並且此種葉節點的CU可以包括一或多個PU及/或者一或多個TU。視訊編解碼器可以進一步分割PU和TU。例如,在HEVC中,殘差四元樹(RQT)表示TU的分割。在HEVC中,PU表示訊框間預測資料,而TU表示殘差資料。訊框內預測的CU包括訊框內預測資訊,諸如訊框內模式指示。
作為另一實例,視訊編碼器200和視訊解碼器300可以被配置為根據VVC進行操作。根據VVC,視訊編解碼器(諸如視訊編碼器200)將畫面分割成複數個編解碼樹單元(CTUs)。視訊編碼器200可以根據樹結構(諸如四元樹-二元樹(QTBT)結構或多類型樹(MTT)結構)分割CTU。QTBT結構去除多個分割類型的概念,諸如HEVC的CU、PU及TU之間的分離。QTBT結構包括兩個級:根據四元樹分割而分割的第一級,和根據二元樹分割而分割的第二級。QTBT結構的根節點對應於CTU。二元樹的葉節點對應於編解碼單元(CUs)。
在MTT分割結構中,可以使用四元樹(QT)分割、二元樹(BT)分割和一或多個類型的三元樹(TT)(亦稱為三進位樹(TT))分割來分割區塊。三元樹或三進位樹分割是其中區塊被分成三個子區塊的分割。在一些實例中,三元樹或三進位樹分割在不經由中心劃分原始區塊的情況下將區塊劃分成三個子區塊。MTT中的分割類型(例如,QT、BT和TT)可以是對稱的或不對稱的。
在一些實例中,視訊編碼器200和視訊解碼器300可以使用單個QTBT或MTT結構來表示亮度分量和色度分量中的每一個,而在其他實例中,視訊編碼器200和視訊解碼器300可以使用兩個或更多個QTBT或MTT結構,諸如用於亮度分量的一個QTBT/MTT結構和用於兩個色度分量的另一個QTBT/MTT結構(或者用於各自的色度分量的兩個QTBT/MTT結構)。
視訊編碼器200和視訊解碼器300可以被配置為使用每個HEVC的四元樹分割、QTBT分割、MTT分割或其他分割結構。出於解釋的目的,本案的技術的描述是針對QTBT分割來呈現的。然而,應當理解,本案的技術亦可以應用於配置為使用四元樹分割或其他類型的分割的視訊編解碼器。
區塊(例如,CTU或CU)可以以各種方式在畫面中分組。作為一個實例,塊可指畫面中的特定圖塊內的CTU行的矩形區域。圖塊可為畫面中的特定圖塊列及特定圖塊行內的CTU的矩形區域。圖塊列指具有等於畫面的高度的高度及由語法元素(例如,諸如在畫面參數集中)指定的寬度的CTU的矩形區域。圖塊行指具有由語法元素(例如,諸如在畫面參數集中)指定的高度及等於畫面的寬度的寬度的CTU的矩形區域。
在一些實例中,可將圖塊分割成多個磚塊(brick),該多個磚塊中的每一磚塊可包括圖塊內的一或多個CTU行。未被分割成多個磚塊的圖塊亦可以被稱為磚塊。然而,作為圖塊的真實子集的磚塊可以不被稱為圖塊。
畫面中的磚塊亦可以被佈置在片段中。片段可以是畫面的整數個磚塊,其可以僅僅包含在單個網路抽象層(NAL)單元中。在一些實例中,片段包括多個完整圖塊或僅一個圖塊的完整磚塊的連續序列。
本案可以互換地使用「N×N」及「N乘N」來指區塊(諸如CU或其他視訊區塊)在垂直和水平維度方面的取樣維度,例如,16×16取樣或16乘16取樣。通常,16×16 CU將在垂直方向上具有16個取樣(y=16)並且在水平方向上具有16個取樣(x=16)。同樣地,N×N CU通常在垂直方向上具有N個取樣並且在水平方向上具有N個取樣,其中N表示非負整數值。CU中的取樣可以按行和列佈置。此外,CU不一定需要在水平方向上具有與在垂直方向上相同數量的取樣。例如,CU可以包括N×M個取樣,其中M不一定等於N。
視訊編碼器200對表示預測及/或殘差資訊以及其他資訊的CU的視訊資料進行編碼。預測資訊指示將如何預測CU以便為CU形成預測區塊。殘差資訊通常表示編碼之前的CU與預測區塊的取樣之間的逐取樣差。
為了預測CU,視訊編碼器200通常可以經由訊框間預測或訊框內預測來為CU形成預測區塊。訊框間預測通常指從先前編解碼的畫面的資料對CU進行預測,而訊框內預測通常指從相同的畫面的先前編解碼的資料對CU進行預測。為了執行訊框間預測,視訊編碼器200可以使用一或多個運動向量來產生預測區塊。視訊編碼器200通常可執行運動搜尋以例如在CU與參考區塊之間的差異方面識別緊密匹配CU的參考區塊。視訊編碼器200可以使用絕對差和(SAD)、平方差和(SSD)、平均絕對差(MAD)、均方差(MSD)或其他此種差計算來計算差度量,以決定參考區塊是否緊密匹配當前CU。在一些實例中,視訊編碼器200可以使用單向預測或雙向預測來預測當前CU。
JEM的一些實例亦提供可被視為訊框間預測模式的仿射運動補償模式。在仿射運動補償模式中,視訊編碼器200可以決定表示非平移運動(諸如放大或縮小、旋轉、透視運動或其他不規則運動類型)的兩個或更多個運動向量。
為了執行訊框內預測,視訊編碼器200可以選擇訊框內預測模式來產生預測區塊。VVC的一些實例提供67個訊框內預測模式,包括各種方向模式以及平面模式和DC模式。通常,視訊編碼器200選擇訊框內預測模式,該模式描述當前區塊(例如,CU的區塊)的此種相鄰取樣,從該相鄰取樣預測當前區塊的取樣。假設視訊編碼器200按光柵掃瞄順序(從左到右、從上到下)對CTU和CU進行編解碼,則此種取樣通常可以在與當前區塊的畫面相同的畫面中的當前區塊的上方、左上方或者左側。
視訊編碼器200對表示當前區塊的預測模式的資料進行編碼。例如,對於訊框間預測模式,視訊編碼器200可以對表示使用各種可用訊框間預測模式中的哪一種模組的資料以及對應模式的運動資訊進行編碼。例如,對於單向或雙向訊框間預測,視訊編碼器200可以使用高級運動向量預測(AMVP)或合併模式對運動向量進行編碼。視訊編碼器200可以使用類似模式對仿射運動補償模式的運動向量進行編碼。
在預測(諸如區塊的訊框內預測或訊框間預測)之後,視訊編碼器200可以計算區塊的殘差資料。殘差資料(諸如殘差區塊)表示區塊與使用對應預測模式形成的區塊的預測區塊之間的逐取樣差。視訊編碼器200可以將一或多個變換應用於殘差區塊,以在變換域而非取樣域中產生變換的資料。例如,視訊編碼器200可以將離散餘弦變換(DCT)、整數變換、小波變換或概念上類似的變換應用於殘差視訊資料。此外,視訊編碼器200可以在第一次變換之後應用二次變換,諸如取決於模式的不可分二次變換(MDNSST)、取決於信號的變換、Karhunen-Loeve變換(KLT)等。視訊編碼器200在應用一或多個變換之後產生變換係數。
如前述,在用於產生變換係數的任何變換之後,視訊編碼器200可以執行變換係數的量化。量化通常指其中對變換係數進行量化以可能減少用於表示變換係數的資料量的處理,這提供進一步壓縮。藉由執行量化處理,視訊編碼器200可以減少與一些或所有變換係數相關聯的位元深度。例如,視訊編碼器200可以在量化期間將n位元值向下捨入到m位元值,其中n大於m。在一些實例中,為了執行量化,視訊編碼器200可以執行要被量化的值的逐位右移。
在量化之後,視訊編碼器200可以掃瞄變換係數,從包括量化的變換係數的二維矩陣產生一維向量。該掃瞄可以被設計為將較高能量(並且因此較低頻率)的變換係數放置在向量的前面,並且將較低能量(並且因此較高頻率)的變換係數放置在向量的後面。在一些實例中,視訊編碼器200可以利用預定義掃瞄順序來掃瞄量化的變換係數以產生序列化向量,並且隨後對向量的量化的變換係數進行熵編碼。在其他實例中,視訊編碼器200可以執行可適性掃瞄。在掃瞄量化的變換係數以形成一維向量之後,視訊編碼器200可以例如根據上下文可適性二進位算術編解碼(CABAC)對一維向量進行熵編碼。視訊編碼器200亦可以對描述與編碼的視訊資料相關聯的中繼資料的語法元素的值進行熵編碼,以由視訊解碼器300在對視訊資料進行解碼時使用。
為了執行CABAC,視訊編碼器200可以將上下文模型內的上下文分配給要傳輸的符號。上下文可以涉及例如符號的相鄰值是否為零值。機率決定可以基於分配給符號的上下文。
視訊編碼器200可以例如在畫面標頭、區塊標頭、片段標頭中向視訊解碼器300進一步產生諸如基於區塊的語法資料、基於畫面的語法資料和基於序列的語法資料的語法資料,或者諸如序列參數集(SPS)、畫面參數集(PPS)或視訊參數集(VPS)的其他語法資料。視訊解碼器300同樣可以解碼此種語法資料以決定如何解碼對應的視訊資料。畫面標頭是包含適用於編解碼的畫面的所有片段的語法元素的語法結構。
以此種方式,視訊編碼器200可以產生包括編碼的視訊資料的位元串流,例如,描述將畫面分割成區塊(例如,CU)的語法元素以及該區塊的預測及/或殘差資訊。最終,視訊解碼器300可以接收位元串流並對編碼的視訊資料進行解碼。
通常,視訊解碼器300執行與由視訊編碼器200執行的處理互逆的處理,以對位元串流的編碼的視訊資料進行解碼。例如,視訊解碼器300可以以基本上類似於視訊編碼器200的CABAC編碼處理但與其互逆的方式,使用CABAC來對位元串流的語法元素的值進行解碼。語法元素可以定義用於將畫面分割成CTU的分割資訊和根據對應分割結構(諸如QTBT結構)對每個CTU進行分割,以定義CTU的CU。語法元素可以進一步定義視訊資料的區塊(例如,CU)的預測和殘差資訊。
殘差資訊可以由例如量化的變換係數表示。視訊解碼器300可以對區塊的量化的變換係數進行逆量化和逆變換,以再現該區塊的殘差區塊。視訊解碼器300使用用信號發送的預測模式(訊框內或訊框間預測)和相關預測資訊(例如,用於訊框間預測的運動資訊)來形成區塊的預測區塊。隨後,視訊解碼器300可以組合預測區塊和殘差區塊(在逐取樣的基礎上)以再現原始區塊。視訊解碼器300可以執行附加處理,諸如執行解區塊處理以減少沿著區塊的邊界的視覺偽影。
位元串流可包括網路抽象層(NAL)單元的序列。NAL單元是包含NAL單元中的資料類型的指示,及含有該資料的位元組的語法結構,該位元組具有必要時穿插有仿真防止位元的原始位元組序列有效負荷(RBSP)的形式。NAL單元中的每一個可包括NAL單元標頭並且可封裝RBSP。NAL單元標頭可包括指示NAL單元類型代碼的語法元素。由NAL單元的NAL單元標頭指定的NAL單元類型代碼指示NAL單元的類型。RBSP可以是包含在NAL單元內封裝的整數數目位元組的語法結構。在一些情況下,RBSP包括零位元。
在HEVC、VVC及其他視訊編解碼規範中,每個NAL單元包括指示NAL單元的NAL單元類型的語法元素(例如,nal_unit_type)。此外,視訊解碼器300可以基於NAL單元的NAL單元類型將NAL單元識別為與複數個畫面類型中的一個相關聯。該等畫面類型可包括暫態解碼刷新(IDR)畫面、清除隨機存取(CRA)畫面、時間子層存取(Temporal Sub-Layer Access,TSA)畫面、斷鏈存取(Broken Link Access,BLA)畫面、以及非IDR、CRA或TSA畫面的編碼的畫面。
理想地,應該以最小的延遲量來執行以此種方式的通道切換和跳轉。HEVC、VVC及其他視訊編解碼規範提供用於實現對位元串流的隨機存取的機制。隨機存取指從不是位元串流中的第一編碼的畫面的編碼的畫面開始對位元串流的解碼。在各種視訊應用(諸如廣播及資料串流)中可能需要對位元串流的隨機存取。對位元串流的隨機存取可以使使用者能夠在任何時間調諧到節目,在不同通道之間切換,跳轉到視訊的特定部分,或者切換到不同的位元串流以進行串流適配(例如,位元元速率的適配、訊框速率的適配、空間解析度的適配等)。可以藉由在視訊位元串流中以規則間隔包括隨機存取畫面,來實現通道切換和跳轉。以規則間隔將訊框內隨機存取點(IRAP)畫面插入到位元串流中可實現隨機存取。IRAP畫面的示例性類型包括IDR畫面、CRA畫面及BLA畫面。因此,IDR畫面、CRA畫面及BLA畫面被統稱為IRAP畫面。在基礎層中包含IRAP畫面的存取單元在本文中可被稱作IRAP存取單元。
若必要的參數集在需要啟用時可用,則可以正確地解碼IRAP畫面和按解碼順序的所有後續非隨機存取跳過前導(RASL)畫面,而無需執行按解碼順序在IRAP畫面之前的任何畫面的解碼處理。位元串流中可存在僅含有不是IRAP畫面的I片段(亦即,其中視訊編解碼器可使用訊框內預測但不使用訊框間預測的片段)的畫面。
IDR畫面僅包含I片段。IDR畫面可以是按解碼順序的位元串流中的第一畫面,或者可以稍後出現在位元串流中。每個IDR畫面是按解碼順序的編碼視訊序列的第一畫面。按解碼順序在IDR畫面之後的畫面不能使用在IDR畫面之前解碼的畫面作為參考。因此,依賴於IDR畫面進行隨機存取的位元串流可比使用額外類型的隨機存取畫面的位元串流具有顯著更低的編解碼效率。IDR存取單元是包含IDR畫面的存取單元。
IDR畫面可能會導致解碼處理將所有參考畫面標記為「不用於參考」。因為標記為「不用於參考」的參考畫面可從儲存參考畫面的解碼畫面緩衝器(DPB)移除,所以IDR畫面可「清除」DPB。可以在沒有來自按解碼順序在IDR畫面之前的任何畫面的訊框間預測的情況下,對按解碼順序在IDR畫面之後的所有編碼的畫面進行解碼。按解碼順序的每個編碼的視訊序列的第一畫面是IDR畫面或BLA畫面,或亦是位元串流的第一畫面的CRA畫面。當存取單元的基礎層中的編碼的畫面為IDR畫面時,存取單元可被稱作IDR存取單元。在一些實例中,編解碼的視訊序列為存取單元的序列,該存取單元的序列按解碼順序包括IDR存取單元或由IDR存取單元組成,該IDR存取單元後面跟著零個或更多個存取單元,該零個或更多個存取單元不是具有等於1的NoRaslOutputFlag的IRAP存取單元,包括直到但不包括任何後續IDR存取單元的所有後續存取單元。
然而,因為IDR畫面開始編解碼的視訊序列並且可始終清除DPB,所以按解碼順序在IDR畫面之後的畫面無法使用按解碼順序在IDR畫面之前解碼的畫面以用於參考。為了提高編解碼效率,CRA畫面可允許按解碼順序在CRA畫面之後但按輸出順序在CRA畫面之前的畫面使用在CRA之前解碼的畫面以用於參考。
CRA畫面類型促進從視訊序列中間的任何隨機存取點(RAP)開始的解碼。將CRA畫面插入視訊序列中可比將IDR畫面插入相同的視訊序列中更高效。在HEVC和潛在的其他視訊編解碼規範中,從CRA畫面開始的位元串流可以是符合位元串流。
CRA畫面允許按解碼順序在CRA畫面之後但按輸出順序在CRA畫面之前的畫面使用在CRA畫面之前解碼的畫面以用於參考。按解碼順序在CRA畫面之後但按輸出順序在CRA畫面之前的畫面被稱作與CRA畫面相關聯的前導畫面(或CRA畫面的前導畫面)。CRA存取單元是其中基礎層的編碼的畫面是CRA畫面的存取單元。
若解碼從IDR畫面或按解碼順序在CRA畫面之前出現的CRA畫面開始,則CRA畫面的前導畫面可以是可正確解碼的。然而,當從CRA畫面的隨機存取發生時,CRA畫面的前導畫面可以是不可解碼的。因此,視訊解碼器一般在隨機存取解碼期間解碼CRA畫面的前導畫面。為了防止來自取決於解碼開始的位置可能不可用的參考畫面的錯誤傳播,按解碼順序和輸出順序兩者在CRA畫面之後的畫面皆不可以使用按解碼順序或輸出順序在CRA畫面之前的任何畫面(包括前導畫面)作為參考。
BLA畫面一般源自CRA畫面的位置處的位元串流拼接,並且在拼接的位元串流中,拼接點CRA畫面被改變為BLA畫面。BLA存取單元是在基礎層中包含BLA畫面的存取單元。BLA畫面與CRA畫面之間的一個差異如下。對於CRA畫面,若解碼從按解碼順序在CRA畫面之前的RAP畫面開始,則相關聯的前導畫面是可正確解碼的。然而,當從CRA畫面的隨機存取發生時(亦即,當解碼從CRA畫面開始時,或者換言之,當CRA畫面是位元串流中的第一畫面時),與CRA畫面相關聯的前導畫面可能是不可正確解碼的。相反,即使當解碼從按解碼順序在BLA畫面之前的RAP畫面開始時,亦可能不存在其中與BLA畫面相關聯的前導畫面是可解碼的場景。
即使當特定CRA畫面或特定BLA畫面是位元串流中的第一畫面時,與特定CRA畫面或特定BLA畫面相關聯的前導畫面中的一些亦可以是可正確解碼的。該等前導畫面可被稱作可解碼前導畫面(DLPs)。其他前導畫面可被稱作不可解碼前導畫面(NLPs)。NLP亦可被稱作標記用於丟棄(TFD)畫面。
GDR可使得設備能夠編解碼畫面集合,諸如按解碼順序佈置的畫面的序列或系列。此種畫面的序列在本文中被稱為「GDR畫面集合」或「GDR集合」。在遍歷整個GDR集合時(例如,在到達GDR集合的末尾之後),視訊編解碼設備可按解碼順序隨機存取在該集合之後的一或多個編碼的畫面。在各種實例中,視訊編解碼設備可正確地或準確地解碼GDR集合的最後畫面的全部。在此種實例中,GDR集合的第一畫面可表示「GDR畫面」,並且GDR集合中的最後畫面可表示「復原點畫面」。復原點畫面又可表示其中全部畫面被包括在「刷新」或「前景」區域中的畫面。因此,在GDR集合中的一系列畫面上漸進刷新畫面,直到在復原點畫面處、畫面被完全刷新為止。視訊編解碼設備可使用特定SEI訊息(諸如,「復原點」SEI訊息及/或「區域刷新資訊」SEI訊息),決定GDR集合的界限、以及關於GDR集合的其他資訊。
在VVC草案7中,片段NAL單元具有指示IDR_W_RADL、IDR_N_LP、CRA_NUT、GDR_NUT的NAL單元類型(NUTs),其對應於IRAP或GDR畫面片段資料。具有IDR_W_RADL的NAL單元類型的片段NAL單元與具有隨機存取可解碼前導畫面的IDR畫面相關聯。具有IDR_N_LP的NAL單元類型的片段NAL單元與不具有前導畫面的IDR畫面相關聯。具有CRA_NUT的NAL單元類型的片段NAL單元與CRA畫面相關聯。具有GDR_NUT的NAL單元類型的片段NAL單元與GDR畫面相關聯。片段資料之前是具有畫面標頭NAL單元類型(NUT)(PH_NUT)的NAL單元。在VVC草案7中,為了在位元串流中定位IRAP或GDR畫面,設備將需要首先定位具有IDR_W_RADL、IDR_N_LP、CRA_NUT或GDR_NUT NAL單元類型的片段,隨後返回並且定位與該片段相關聯的畫面標頭。可能期望藉由在畫面標頭中用信號發送隨機存取畫面或GDR畫面來直接定位隨機存取畫面或GDR畫面,以便加速定位隨機存取畫面和GDR畫面的處理。
根據本案的技術,在畫面標頭的開始處或附近指示以下欄位或標誌,該欄位或標誌指示IRAP(或IRAP的類型)或GDR畫面。對應的PH_NUT連同此標誌將使IRAP及GDR畫面的偵測更簡單。以下實例示出兩種解決方案:基於用信號發送標誌(例如,irap_or_gdr_pic_flag)的第一技術,以及包括用信號發送欄位(例如,irap_gdr_idc)的第二技術,該欄位用信號發送特定類型的IRAP或GDR畫面。
根據本案的第一技術,畫面標頭RBSP包括可指示與畫面標頭RBSP相關聯的畫面必須是IRAP或GDR畫面的標誌(例如,irap_or_gdr_pic_flag)。在以下文字和整個本案中,對VVC草案7中的文字的改變用<!>……</!>標籤標記。從VVC草案7刪除文字用<dlt>……</dlt>標籤標記。 =================VVC草案7改變開始================= 7.3.2.6畫面標頭RBSP語法
picture_header_rbsp( ) { 描述符
     <!>irap_or_gdr_pic_flag</!> u(1)
    non_reference_picture_flag u(1)
     <!>if( irap_or_gdr_pic_flag )</!>  
gdr_pic_flag u(1)
    no_output_of_prior_pics_flag u(1)
     if( gdr_pic_flag )  
recovery_poc_cnt ue(v)
    ph_pic_parameter_set_id ue(v)
 
7.4.3.6 畫面標頭 RBSP 語義 PH包含與PH相關聯的編解碼的畫面的所有片段共用的資訊。 <!>irap_or_gdr_pic_flag 等於1指定與PH相關聯的畫面是IRAP或GDR。irap_or_gdr_pic_flag等於0指定與PH相關聯的畫面既不是IRAP畫面亦不是GDR畫面。</!>non_reference_picture_flag 等於1指定與PH相關聯的畫面從不用作參考畫面。non_reference_picture_flag等於0指定與PH相關聯的畫面可以用作或可以不用作參考畫面。gdr_pic_flag 等於1指定與PH相關聯的畫面是GDR畫面。gdr_pic_flag等於0指定與PH相關聯的畫面不是GDR畫面。<!>當不存在時,推斷其等於0。</!> =================VVC草案7改變結束=================
因此,根據本案的第一技術,視訊編碼器200可產生視訊資料的畫面集合的編碼的畫面。此外,視訊編碼器200可在包括編碼的畫面的位元串流中包括畫面標頭NAL單元。在一些實例中,畫面標頭NAL單元包括指示與畫面標頭NAL單元相關聯的畫面是IRAP畫面或GDR畫面的第一語法元素(例如,irap_or_gdr_pic_flag)。在一些實例中,第一語法元素指示與畫面標頭NAL單元相關聯的畫面既不是IRAP畫面亦不是GDR畫面。在一些實例中,第一語法元素指示與畫面標頭NAL單元相關聯的畫面不是IRAP畫面,但可以是GDR畫面。在一些實例中,第一語法元素指示與畫面標頭NAL單元相關聯的畫面可以是或可以不是IRAP畫面,但可以不是GDR畫面。畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素。與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。若畫面標頭NAL單元是在畫面的第一編碼的片段NAL單元之前的畫面標頭NAL單元,則畫面可與畫面標頭NAL單元相關聯。
類似地,在一些實例中,視訊解碼器300或另一設備(例如,中間網路設備等)可獲得包括視訊資料的編碼的畫面的集合的位元串流;及在該位元串流中的編碼的畫面當中定位IRAP或GDR畫面,其中定位該IRAP或GDR畫面包括:從該位元串流中的畫面標頭NAL單元獲得第一語法元素(例如,irap_or_gdr_pic_flag),該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面是IRAP或GDR畫面。在一些實例中,第一語法元素指示與畫面標頭NAL單元相關聯的畫面不是IRAP畫面,但可以是GDR畫面。在一些實例中,第一語法元素指示與畫面標頭NAL單元相關聯的畫面可以是或可以不是IRAP畫面,但可以不是GDR畫面。畫面標頭NAL單元可包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素。與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
根據本案的第二技術,指示IDR、CRA、GDR類型的欄位被包括在畫面標頭中。例如,在下文所示出的實例中,將2位元欄位(例如,irap_gdr_idc)添加到畫面標頭RBSP,如下文所示出: =================== VVC草案7改變開始=================== 7.3.2.6畫面標頭RBSP語法
picture_header_rbsp( ) { 描述符
<!>irap_gdr_idc </!> u(2)
    non_reference_picture_flag u(1)
</dlt>  gdr_pic_flag</dlt> <dlt>u(1)</dlt>
    no_output_of_prior_pics_flag u(1)
<dlt>   if( gdr_pic_flag )</dlt>  
<!> if(irap_gdr_idc  = =  3)</!>  
recovery_poc_cnt ue(v)
    ph_pic_parameter_set_id ue(v)
 
7.4.3.6 畫面標頭 RBSP 語義 PH包含與PH相關聯的編解碼的畫面的所有片段共用的資訊。 <!>irap_gdr_idc 等於0指示不是IRAP或GDR的畫面。irap_gdr_pic_idc等於1指示IDR畫面,irap_gdr_idc等於2指示CRA畫面。irap_gdr_idc等於3指示GDR畫面。</!>non_reference_picture_flag 等於1指定與PH相關聯的畫面從不用作參考畫面。non_reference_picture_flag等於0指定與PH相關聯的畫面可以用作或可以不用作參考畫面。 <dlt>gdr_pic_flag 等於1指定與PH相關聯的畫面是GDR畫面。gdr_pic_flag等於0指定與PH相關聯的畫面不是GDR畫面。</dlt>recovery_poc_cnt 指定按輸出順序的解碼的畫面的復原點。若當前畫面是與PH相關聯的GDR畫面,並且在CLVS中存在按解碼順序在當前GDR畫面之後並且具有等於當前GDR畫面的PicOrderCntVal加上recovery_poc_cnt的值的PicOrderCntVal的畫面picA,則畫面picA被稱為復原點畫面。否則,具有大於當前畫面的PicOrderCntVal加上recovery_poc_cnt的值的PicOrderCntVal的按輸出順序的第一畫面被稱作復原點畫面。復原點畫面不應按解碼順序在當前GDR畫面之前。recovery_poc_cnt的值應在0到maxPicOrderCntlsb-1(包含性)的範圍內。 注意1-當gdr_enabled_flag等於1並且當前畫面的PicOrderCntVal大於或等於相關聯的GDR畫面的RpPicOrderCntVal時,按輸出順序的當前和後續解碼的畫面與藉由從按解碼順序在相關聯的GDR畫面之前的先前IRAP畫面(當存在時)開始解碼處理而產生的對應畫面精確匹配。 ================== VVC草案7改變結束=================
因此,在一些實例中,視訊編碼器200可產生視訊資料的畫面集合的編碼的畫面。此外,視訊編碼器200可在包括編碼的畫面的位元串流中包括畫面標頭NAL單元,第一語法元素(例如,irap_gdr_idc)指示與畫面標頭NAL單元相關聯的畫面是:(i)既不是IRAP亦不是GDR畫面,(ii)IDR畫面,(iii)CRA畫面,還是(iv)GDR畫面,其中:畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
類似地,在一些實例中,設備(例如,視訊解碼器300或另一類型的設備)可獲得包括視訊資料的編碼的畫面的集合的位元串流。設備可定位位元串流中的編碼的畫面當中的IRAP或GDR畫面。作為定位IRAP或GDR畫面的部分,設備可從位元串流中的畫面標頭NAL單元獲得第一語法元素(例如,irap_gdr_idc),該第一語法元素指示與畫面標頭NAL單元相關聯的畫面是:(i)既不是IRAP畫面亦不是GDR畫面,(ii)IDR畫面,(iii)CRA畫面,還是(iv)GDR畫面。基於第一語法元素指示與NAL單元相關聯的畫面是IRAP或GDR畫面,設備由此已定位IRAP或GDR畫面。畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素。與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
PH_IRAP_GDR_NUT 用於指示 IRAP GDR 畫面
根據本案的第三技術,可針對畫面標頭定義NAL單元類型以指示與IRAP或GDR畫面相關聯的畫面標頭。換言之,IRAP或GDR畫面可以被指示為PH_NUT的一部分。特定PH_NUT類型可直接指示隨機存取畫面開始或漸進解碼器刷新開始。這可以以各種方式實現。下文描述一個實例,其中單個PH_IRAP_GDR_NUT類型指示IRAP_GDR類型PH_NUT,該IRAP_GDR類型PH_NUT僅指示畫面是IRAP或GDR畫面而不指定特定類型。與畫面標頭相關聯的片段將在其NUT中攜帶子IRAP或GDR類型。 ===================VVC草案7改變開始================= 7.3.2.6畫面標頭RBSP語法
picture_header_rbsp( ) { 描述符
    non_reference_picture_flag u(1)
<!> if(nal_unit_type  ==  PH_IRAP_GDR_NUT)</!>  
gdr_pic_flag u(1)
    no_output_of_prior_pics_flag u(1)
     if( gdr_pic_flag )  
recovery_poc_cnt ue(v)
    ph_pic_parameter_set_id ue(v)
 
7.4.3.6 畫面標頭 RBSP 語義 PH包含與PH相關聯的編解碼的畫面的所有片段共用的資訊。non_reference_picture_flag 等於1指定與PH相關聯的畫面從不用作參考畫面。non_reference_picture_flag等於0指定與PH相關聯的畫面可以用作或可以不用作參考畫面。gdr_pic_flag 等於1指定與PH相關聯的畫面是GDR畫面。gdr_pic_flag等於0指定與PH相關聯的畫面不是GDR畫面。<!>當不存在時,推斷其等於0。<!> 5-NAL 單元類型代碼和 NAL 單元類型類別
nal_unit_type nal_unit_type 的名稱 NAL 單元和 RBSP 語法結構的內容 NAL 單元類型類別
 
19 PH_NUT 畫面標頭 picture_header_rbsp( ) non-VCL
<!>20</!> <!>PH_IRAP_GDR_NUT</!> <!>用於IRAP或GDR的畫面標頭 picture_header_rbsp( )</!> <!>non-VCL</!>
..  
================== VVC草案7改變結束===================
因此,在一些實例中,視訊編碼器200可產生視訊資料的畫面集合的編碼的畫面。在此種實例中,視訊編碼器200可在包括編碼的畫面的位元串流中包括畫面標頭NAL單元。畫面標頭NAL單元的NAL單元類型指示與畫面標頭NAL單元相關聯的畫面是:(i)IRAP畫面或GDR畫面,還是(ii)與畫面標頭NAL單元相關聯的畫面既不是IRAP畫面也不是GDR畫面。畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
類似地,在一個實例中,設備(例如,視訊解碼器300或另一設備)可獲得包括視訊資料的編碼的畫面的集合的位元串流。在此實例中,設備可在位元串流中的編碼的畫面當中定位IRAP或GDR畫面。作為定位IRAP或GDR畫面的部分,設備可基於位元串流中的畫面標頭NAL單元的NAL單元類型來決定與畫面標頭NAL單元相關聯的畫面是:(i)IRAP或GDR畫面,還是(ii)與畫面標頭NAL單元相關聯的畫面既不是IRAP畫面也不是GDR畫面。在此實例中,畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
根據本案的第四技術,可在畫面標頭中用信號發送片段層NUT。例如,根據本案的第四技術,提出在PH_NUT中攜帶片段層NUT(例如,IDR_W_RADL、CRA_NUT、TRAIL_NUT、……)。在此情況下,片段可具有通用SLICE_NUT而不需要特定NUT,因為其將在與片段相關聯的畫面標頭中被攜帶。具有TRAIL_NUT的NAL單元類型的NAL單元與尾部畫面相關聯。尾部畫面與按解碼順序在IRAP或GDR畫面之後的IRAP或GDR畫面相關聯。對於攜帶混合NAL單元類型的畫面,可以使用通用PH_NUT。對於混合NAL單元類型畫面,在此情況下,可在片段標頭中用信號發送單獨的片段類型。例如,片段標頭中的irap_gdr_idc欄位可以指示子類型(亦即,IDR_W_RADL、IDR_N_LP、CRA、GDR)。
在此種實例中,對於每個畫面,畫面標頭是強制性的。在本案的其他實例中,對於每個畫面,PH不是強制性的。當mixed_nalu_types_in_pic_flag等於1時,可在PH處用信號發送片段層特定NUT作為PH NUT類型,並且片段層NUT可由具有在片段標頭中用信號發送的IRAP或GDR指示的SLICE_NUT指示代替。片段標頭級別NAL單元類型是從除了mixed_nal_unit_case之外的相關聯的PH_NUT類型匯出的。 ================= VVC草案7改變開始===================7.4.3.4 畫面參數集 RBSP 語義 mixed_nalu_types_in_pic_flag 等於1指定參考PPS的每個畫面具有多於一個VCL NAL單元,並且VCL NAL單元不具有相同的nal_unit_type值,並且畫面不是IRAP畫面。mixed_nalu_types_in_pic_flag等於0指定參考PPS的每個畫面具有一或多個VCL NAL單元,並且參考PPS的每個畫面的VCL NAL單元具有相同的nal_unit_type值。 當no_mixed_nalu_types_in_pic_constraint_flag等於1時,mixed_nalu_types_in_pic_flag的值應等於0。 對於在亦包含具有nal_unit_type的另一值的一或多個片段的畫面picA(亦即,畫面picA的mixed_nalu_types_in_pic_flag的值等於1)中具有在IDR_W_RADL到CRA_NUT(包含性)的範圍內的nal_unit_type值nalUnitTypeA的每一片段,以下適用: - 片段應屬於針對其對應subpic_treated_as_pic_flag[i]的值等於1的子畫面subpicA。 - 片段不應屬於包含具有不等於nalUnitTypeA的nal_unit_type的VCL NAL單元的picA的子畫面。 - 對於按解碼順序的CLVS中的所有後續PU,subpicA中的片段的RefPicList[0]和RefPicList[1]皆不應包括有效條目中按解碼順序在picA之前的任何畫面。 7.3.7.1通用片段標頭語法
slice_header( ) { 描述符
    slice_pic_order_cnt_lsb u(v)
     if( subpics_present_flag )  
          slice_subpic_id u(v)
<!> if (mixed_nalu_types_in_pic_flag == 1 )</!>  
<!>     irap_gdr_idc</!> <!>u(2)</!>
     if( rect_slice_flag  | |  NumTilesInPic > 1 )  
          slice_address u(v)
     if( !rect_slice_flag  &&  NumTilesInPic > 1 )  
          num_tiles_in_slice_minus1 ue(v)
    slice_type ue(v)
<!>irap_gdr_idc 等於0指示IDR_W_RADL畫面。irap_gdr_pic_idc等於1指示IDR_N_LP畫面,irap_gdr_idc等於2指示CRA畫面。irap_gdr_idc等於3指示GDR畫面。</!> ================= VVC草案7改變結束==================
因此,在一些實例中,視訊編碼器200可產生包括視訊資料的編碼的畫面的集合和與該編碼的畫面的集合中的畫面相關聯的畫面標頭NAL單元的位元串流。作為產生位元串流的部分,視訊編碼器200可在位元串流中包括指示在與畫面標頭NAL單元相關聯的畫面中存在多個MAL單元類型的第一語法元素。視訊編碼器200可基於在與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型,而在畫面標頭NAL單元中包括第二語法元素。第二語法元素指示與畫面標頭NAL單元相關聯的畫面是(i)具有RADL的IDR畫面,(ii)不具有前導畫面的IDR畫面,(iii)CRA畫面,還是(iv)GDR畫面。
類似地,在此實例中,設備(例如,視訊解碼器300或另一設備)可獲得包括視訊資料的編碼的畫面的集合和與該編碼的畫面的集合中的畫面相關聯的畫面標頭NAL單元的位元串流。設備可基於指示與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型的第一語法元素,來從畫面標頭NAL單元獲得第二語法元素,其中該第二語法元素指示與畫面標頭NAL單元相關聯的畫面是(i)具有隨機存取可解碼前導(RADL)的暫態解碼器刷新(IDR)畫面,(ii)不具有前導畫面的IDR畫面,(iii)清除隨機存取(CRA)畫面,還是(iv)漸進解碼器刷新(GDR)畫面。
在VVC(草案7)規範中,若畫面是GDR畫面,則在PH中用信號發送recovery_poc_cnt。對於其中GDR片段可以與IRAP片段組合的混合NAL單元情況,導致非GDR畫面。需要用信號發送GDR片段的recovery_poc_cnt。根據本案的第五技術,可在子畫面/片段級別用信號發送recovery_poc_cnt,或可改變gdr_pic_flag的定義以在具有GDR片段的畫面中包括混合NAL單元類型。 ================== VVC草案7改變開始====================7.3.7.1 通用片段標頭語法
slice_header( ) { 描述符
    slice_pic_order_cnt_lsb u(v)
     if( subpics_present_flag )  
          slice_subpic_id u(v)
<!> if (mixed_nalu_types_in_pic_flag == 1 && nal_unit_type == GDR_NUT )</!>  
<!>     recovery_poc_cnt </!> <!>ue(v)</!>
     if( rect_slice_flag  | |  NumTilesInPic > 1 )  
          slice_address u(v)
     if( !rect_slice_flag  &&  NumTilesInPic > 1 )  
          num_tiles_in_slice_minus1 ue(v)
    slice_type ue(v)
recovery_poc_cnt 指定按輸出順序的解碼的畫面的復原點。若當前畫面是與PH相關聯的GDR畫面,並且在CLVS中存在按解碼順序在當前GDR畫面之後並且具有等於當前GDR畫面的PicOrderCntVal加上recovery_poc_cnt的值的PicOrderCntVal的畫面picA,則畫面picA被稱為復原點畫面。否則,具有大於當前畫面的PicOrderCntVal加上recovery_poc_cnt的值的PicOrderCntVal的按輸出順序的第一畫面被稱作復原點畫面。復原點畫面不應按解碼順序在當前GDR畫面之前。recovery_poc_cnt的值應在0到maxPicOrderCntLsb-1(包含性)的範圍內。 注意1-當gdr_enabled_flag等於1並且當前畫面的PicOrderCntVal大於或等於相關聯的GDR畫面的RpPicOrderCntVal時,按輸出順序的當前和後續解碼的畫面與藉由從按解碼順序在相關聯的GDR畫面之前的先前IRAP畫面(當存在時)開始解碼處理而產生的對應畫面精確匹配。3.1 漸進解碼刷新( GDR )畫面: 針對其每個VCL NAL單元的nal_unit_type等於GDR_NUT的畫面。 7.4.3.6畫面標頭RBSP語義 PH包含與PH相關聯的編解碼的畫面的所有片段共用的資訊。non_reference_picture_flag 等於1指定與PH相關聯的畫面從不用作參考畫面。non_reference_picture_flag等於0指定與PH相關聯的畫面可以用作或可以不用作參考畫面。gdr_pic_flag 等於1指定與PH </dlt>相關聯的畫面是</dlt><!>包含<!>GDR<dlt>畫面</dlt><!>片段</!>。gdr_pic_flag等於0指定與PH相關聯的畫面不是GDR畫面。 ================= VVC草案7改變結束==================
因此,在一些實例中,視訊編碼器200可產生視訊資料的畫面集合的編碼的畫面和與編碼的畫面的集合中的畫面相關聯的畫面標頭NAL單元。視訊編碼器200可在片段標頭中包括指示在與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型、並且畫面標頭NAL單元的NAL單元類型為GDR畫面NAL單元類型的第一語法元素。基於在與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型、並且畫面標頭NAL單元的NAL單元類型為GDR畫面NAL單元類型,視訊編碼器200可在畫面標頭中包括指示復原點的第二語法元素。
類似地,在一些實例中,視訊解碼器300或另一設備可獲得包括視訊資料的編碼的畫面的集合和與該編碼的畫面的集合中的畫面相關聯的畫面標頭NAL單元的位元串流。視訊解碼器300可基於指示在與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型、並且畫面標頭NAL單元的NAL單元類型為GDR畫面NAL單元類型的第一語法元素,來獲得指示復原點的第二語法元素。
本案可以通常代表「用信號發送」某些資訊,諸如語法元素。術語「用信號發送」可以通常指用以對編碼的視訊資料進行解碼的語法元素及/或其他資料的值的通訊。亦即,視訊編碼器200可以在位元串流中用信號發送語法元素的值。通常,用信號發送指在位元串流中產生值。如前述,源設備102可以基本上即時或非即時地(諸如可在將語法元素儲存到儲存裝置112以供稍後由目的地設備116取得時發生)將位元串流傳輸到目的地設備116。
圖2是示出可執行本案的技術的示例性視訊編碼器200的方塊圖。圖2是出於解釋的目的而提供的,並且不應被認為是對本案中廣泛例示和描述的技術的限制。出於解釋的目的,本案在諸如HEVC視訊編解碼標準和開發中的H.266/VCC視訊編解碼標準的視訊編解碼標準的上下文中描述視訊編碼器200。然而,本案的技術不限於該等視訊編解碼標準,並且通常適用於視訊編碼和解碼。
在圖2的實例中,視訊編碼器200包括視訊資料記憶體230、模式選擇單元202、殘差產生單元204、變換處理單元206、量化單元208、逆量化單元210、逆變換處理單元212、重構單元214、濾波器單元216、解碼畫面緩衝器(DPB)218及熵編碼單元220。視訊資料記憶體230、模式選擇單元202、殘差產生單元204、變換處理單元206、量化單元208、逆量化單元210、逆變換處理單元212、重構單元214、濾波器單元216、DPB 218及熵編碼單元220中的任一者或全部可以以一或多個處理器實現或以處理電路實現。例如,視訊編碼器200的單元可以被實現為作為硬體電路的一部分或者作為處理器、ASIC或FPGA的一部分的一或多個電路或邏輯元件。此外,視訊編碼器200可以包括附加的或替代的處理器或處理電路以執行該等和其他功能。
視訊資料記憶體230可以儲存要由視訊編碼器200的元件編碼的視訊資料。視訊編碼器200可以從例如視訊源104(圖1)接收儲存在視訊資料記憶體230中的視訊資料。DPB 218可以充當儲存參考視訊資料以在視訊編碼器200預測後續視訊資料中使用的參考畫面記憶體。視訊資料記憶體230和DPB 218可以由各種記憶體設備中的任一種形成,諸如動態隨機存取記憶體(DRAM),包括同步DRAM(SDRAM)、磁阻RAM(MRAM)、電阻RAM(RRAM)或其他類型的記憶體設備。視訊資料記憶體230和DPB 218可以由相同的記憶體設備或單獨的記憶體設備提供。如圖所示,在各種實例中,視訊資料記憶體230可以與視訊編碼器200的其他元件一起在晶片上,或者相對於彼等元件在晶片外。
在本案中,對視訊資料記憶體230的代表不應被解釋為限於視訊編碼器200內部的記憶體(除非明確地如此描述)或視訊編碼器200外部的記憶體(除非明確地如此描述)。相反,對視訊資料記憶體230的代表應理解為儲存視訊編碼器200接收的用於編碼的視訊資料(例如,要被編碼的當前區塊的視訊資料)的參考記憶體。圖1的記憶體106亦可以提供來自視訊編碼器200的各種單元的輸出的臨時儲存。
示出圖2的各種單元以説明理解由視訊編碼器200執行的操作。該單元可以實現為固定功能電路、可程式設計電路或其組合。固定功能電路指提供特定功能並且在可以執行的操作上預設的電路。可程式設計電路指可以被程式設計以執行各種任務並且在可以執行的操作中提供靈活功能的電路。例如,可程式設計電路可以執行使得可程式設計電路以由軟體或韌體的指令定義的方式進行操作的軟體或韌體。固定功能電路可以執行軟體指令(例如,以接收參數或輸出參數),但固定功能電路執行的操作的類型通常是不可變的。在一些實例中,該單元中的一或多個可以是不同的電路區塊(固定功能或可程式設計),並且在一些實例中,該一或多個單元可以是積體電路。
視訊編碼器200可以包括算數邏輯單位(ALUs)、基本功能單元(EFUs)、數位電路、類比電路及/或由可程式設計電路形成的可程式設計核心。在其中使用由可程式設計電路執行的軟體來執行視訊編碼器200的操作的實例中,記憶體106(圖1)可以儲存視訊編碼器200接收和執行的軟體的指令(例如,目標代碼),或者視訊編碼器200內的另一記憶體(未圖示)可以儲存此種指令。
視訊資料記憶體230被配置為儲存接收的視訊資料。視訊編碼器200可以從視訊資料記憶體230取得視訊資料的畫面,並且將視訊資料提供到殘差產生單元204和模式選擇單元202。視訊資料記憶體230中的視訊資料可以是要被編碼的原始視訊資料。
模式選擇單元202包括運動估計單元222、運動補償單元224和訊框內預測單元226。模式選擇單元202可以包括附加的功能單元以根據其他預測模式執行視訊預測。作為實例,模式選擇單元202可以包括調色板單元、區塊內複製單元(其可以是運動估計單元222及/或運動補償單元224的一部分)、仿射單元、線性模型(LM)單元等。
模式選擇單元202通常協調多個編碼遍次,以測試編碼參數的組合以及針對此種組合得到的率失真值。編碼參數可以包括將CTU分割成CU、CU的預測模式、CU的殘差資料的變換類型、CU的殘差資料的量化參數等。模式選擇單元202可以最終選擇具有比其他測試組合更好的率失真值的編碼參數的組合。
視訊編碼器200可以將從視訊資料記憶體230取得的畫面分割成一系列CTU,並且將一或多個CTU封裝在片段內。模式選擇單元202可以根據樹結構(諸如上文描述的HEVC的QTBT結構或四元樹結構)分割畫面的CTU。如前述,視訊編碼器200可以經由根據樹結構分割CTU來形成一或多個CU。此種CU亦可以通常被稱為「視訊區塊」或「區塊」。
通常,模式選擇單元202亦控制其元件(例如,運動估計單元222、運動補償單元224和訊框內預測單元226)以產生當前區塊(例如,當前CU,或在HEVC中,PU和TU的重疊部分)的預測區塊。對於當前區塊的訊框間預測,運動估計單元222可以執行運動搜尋以識別一或多個參考畫面(例如,儲存在DPB 218中的一或多個先前編碼的畫面)中的一或多個緊密匹配的參考區塊。具體而言,運動估計單元222可以例如根據絕對差和(SAD)、平方差和(SSD)、平均絕對差(MAD)、均方差(MSD)等來計算表示潛在參考區塊與當前區塊如何相似的值。運動估計單元222通常可以使用當前區塊與所考慮的參考區塊之間的逐取樣差來執行該等計算。運動估計單元222可以識別具有從該等計算得到的最低值的參考區塊,從而指示與當前區塊最緊密匹配的參考區塊。
運動估計單元222可以形成定義參考畫面中的參考區塊的位置相對於當前畫面中的當前區塊的位置的一或多個運動向量(MVs)。隨後,運動估計單元222可以將運動向量提供給運動補償單元224。例如,對於單向訊框間預測,運動估計單元222可以提供單個運動向量,而對於雙向訊框間預測,運動估計單元222可以提供兩個運動向量。隨後,運動補償單元224可以使用運動向量產生預測區塊。例如,運動補償單元224可以使用運動向量取得參考區塊的資料。作為另一實例,若運動向量具有分數取樣精度,則運動補償單元224可以根據一或多個內插濾波器對預測區塊的值進行內插。此外,對於雙向訊框間預測,運動補償單元224可以取得由各自運動向量識別的兩個參考區塊的資料,並且例如藉由逐取樣平均或加權平均來組合取得的資料。
作為另一實例,對於訊框內預測或訊框內預測編解碼,訊框內預測單元226可以從與當前區塊相鄰的取樣產生預測區塊。例如,對於定向模式,訊框內預測單元226通常可以數學地組合相鄰取樣的值,並且在當前區塊的定義方向上填充該等計算值以產生預測區塊。作為另一實例,對於DC模式,訊框內預測單元226可以計算當前區塊的相鄰取樣的平均值,並且產生預測區塊以對於預測區塊的每個取樣包括該得到的平均值。
模式選擇單元202將預測區塊提供給殘差產生單元204。殘差產生單元204從視訊資料記憶體230接收當前區塊的原始、未編碼的版本並且從模式選擇單元202接收預測區塊。殘差產生單元204計算當前區塊與預測區塊之間的逐取樣差。所得到的逐取樣差定義當前區塊的殘差區塊。在一些實例中,殘差產生單元204亦可以決定殘差區塊中的取樣值之間的差,以使用殘差差分脈碼調制(RDPCM)來產生殘差區塊。在一些實例中,可以使用執行二進位減法的一或多個減法器電路來形成殘差產生單元204。
此外,在一些實例中,模式選擇單元202可決定畫面是否將被編碼為IRAP畫面、GDR畫面或另一類型的畫面。模式選擇單元202亦可產生用於編碼的畫面的畫面標頭。因此,在圖2的實例中,模式選擇單元202包括畫面標頭單元229。畫面標頭單元229可根據本案的技術中的任一者產生畫面標頭。例如,畫面標頭單元229可產生包括以下語法元素的畫面標頭NAL單元,該語法元素指示與畫面標頭NAL單元相關聯的畫面必須是IRAP或GDR畫面。此畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素。
在模式選擇單元202將CU分割成PU的實例中,每個PU可以與亮度預測單元和對應的色度預測單元相關聯。視訊編碼器200和視訊解碼器300可以支援具有各種大小的PU。如上所示,CU的大小可以指CU的亮度編解碼區塊的大小,並且PU的大小可以指PU的亮度預測單元的大小。假設特定CU的大小為2N×2N,則視訊編碼器200可以支援針對訊框內預測的2N×2N或N×N的PU大小、以及用於訊框間預測的2N×2N、2N×N、N×2N、N×N或類似大小的對稱PU大小。視訊編碼器200和視訊解碼器300亦可以支援針對訊框間預測的2N×nU、2N×nD、nL×2N和nR×2N的PU大小的不對稱分割。
在其中模式選擇單元202沒有進一步將CU分割成PU的實例中,每個CU可以與亮度編解碼區塊和對應色度編解碼區塊相關聯。如上文,CU的大小可以指CU的亮度編解碼區塊的大小。視訊編碼器200和視訊解碼器300可以支援2N×2N、2N×N或N×2N的CU大小。
對於諸如訊框內區塊複製模式編解碼、仿射模式編解碼和線性模型(LM)模式編解碼的其他視訊編解碼技術,作為少數實例,模式選擇單元202經由與編解碼技術相關聯的相應單元來產生正被編碼的當前區塊的預測區塊。在一些實例中,諸如調色板模式編解碼,模式選擇單元202可以不產生預測區塊,而是產生指示其中基於選擇的調色板來重構區塊的方式的語法元素。在此種模式中,模式選擇單元202可以將該等語法元素提供給熵編碼單元220以進行編碼。
如前述,殘差產生單元204接收當前區塊和對應預測區塊的視訊資料。隨後,殘差產生單元204產生當前區塊的殘差區塊。為了產生殘差區塊,殘差產生單元204計算預測區塊與當前區塊之間的逐取樣差。
變換處理單元206將一或多個變換應用於殘差區塊以產生變換係數的區塊(在本文中被稱為「變換係數區塊」)。變換處理單元206可以將各種變換應用於殘差區塊以形成變換係數區塊。例如,變換處理單元206可以將離散餘弦變換(DCT)、方向變換、Karhunen-Loeve變換(KLT)或概念上類似的變換應用於殘差區塊。在一些實例中,變換處理單元206可以對殘差區塊執行多次變換,例如一次變換和二次變換,諸如旋轉變換。在一些實例中,變換處理單元206不將變換應用於殘差區塊。
量化單元208可以量化變換係數區塊中的變換係數,以產生量化的變換係數區塊。量化單元208可以根據與當前區塊相關聯的量化參數(QP)值來量化變換係數區塊的變換係數。視訊編碼器200(例如,經由模式選擇單元202)可以藉由調整與CU相關聯的QP值,來調整應用於與當前區塊相關聯的變換係數區塊的量化程度。量化可以引入資訊損失,並且因此,量化的變換係數可以比由變換處理單元206產生的原始變換係數具有的更低精度。
逆量化單元210和逆變換處理單元212可以分別將逆量化和逆變換應用於量化的變換係數區塊,以從變換係數區塊重構殘差區塊。重構單元214可以基於重構的殘差區塊和由模式選擇單元202產生的預測區塊,來產生對應於當前區塊的重構的區塊(儘管可能具有一定程度的失真)。例如,重構單元214可以將重構的殘差區塊的取樣添加到來自由模式選擇單元202產生的預測區塊的對應取樣以產生重構的區塊。
濾波器單元216可以對重構的區塊執行一或多個濾波器操作。例如,濾波器單元216可以執行解區塊操作以減少沿著CU的邊緣的區塊效應偽像。在一些實例中,可以跳過濾波器單元216的操作。
視訊編碼器200將重構的區塊儲存在DPB 218中。例如,在不需要濾波器單元216的操作的實例中,重構單元214可以將重構的區塊儲存到DPB 218。在需要濾波器單元216的操作的實例中,濾波器單元216可以將濾波的重構的區塊儲存到DPB 218。運動估計單元222和運動補償單元224可以從DPB 218取得由重構的(並且可能濾波的)區塊形成的參考畫面,以對後續編碼的畫面的區塊進行訊框間預測。另外,訊框內預測單元226可以使用DPB 218中的當前畫面的重構的區塊,來對當前畫面中的其他區塊進行訊框內預測。
通常,熵編碼單元220可以對從視訊編碼器200的其他功能元件接收的語法元素進行熵編碼。例如,熵編碼單元220可以對來自量化單元208的量化的變換係數區塊進行熵編碼。作為另一實例,熵編碼單元220可以對來自模式選擇單元202的預測語法元素(例如,用於訊框間預測的運動資訊或用於訊框內預測的訊框內模式資訊)進行熵編碼。熵編碼單元220可以對作為視訊資料的另一實例的語法元素執行一或多個熵編碼操作,以產生熵編碼的資料。例如,熵編碼單元220可以對資料執行上下文可適性可變長度編解碼(CAVLC)操作、CABAC操作、可變到可變(V2V)長度編解碼操作、基於語法的上下文可適性二進位算術編解碼(SBAC)操作、機率區間分割熵(PIPE)編解碼操作、指數哥倫佈編碼操作,或另一類型的熵編碼操作。在一些實例中,熵編碼單元220可以在旁路模式下操作,在該旁路模式中不對語法元素進行熵編碼。
視訊編碼器200可以輸出包括對片段或畫面的區塊進行重構所需的熵編碼的語法元素的位元串流。具體而言,熵編碼單元220可以輸出位元串流。
以上所描述的操作是針對區塊來描述的。此種描述應當被理解為用於亮度編解碼區塊及/或色度編解碼區塊的操作。如前述,在一些實例中,亮度編解碼區塊和色度編解碼區塊是CU的亮度和色度分量。在一些實例中,亮度編解碼區塊和色度編解碼區塊是PU的亮度和色度分量。
在一些實例中,不需要針對色度編解碼區塊重複針對亮度編解碼區塊執行的操作。作為一個實例,識別亮度編解碼區塊的運動向量(MV)和參考畫面的操作不需為了識別色度區塊的MV和參考畫面而重複。相反,亮度編解碼區塊的MV可以被縮放以決定色度區塊的MV,並且參考畫面可以是相同的。作為另一實例,對於亮度編解碼區塊和色度編解碼區塊,訊框內預測處理可以是相同的。
視訊編碼器200表示被配置為對視訊資料進行編碼的設備的實例,該設備包括被配置為儲存視訊資料的記憶體,和以電路實現並且被配置為執行以下操作的一或多個處理單元:產生該視訊資料的畫面集合的編碼的畫面;及將畫面標頭NAL單元包括在包括該編碼的畫面的位元串流中,其中該畫面標頭NAL單元包括第一語法元素,該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是IRAP或GDR畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在一些實例中,視訊編碼器200的處理單元可以被配置為:產生視訊資料的畫面集合的編碼的畫面;及在包括編碼的畫面的位元串流中包括畫面標頭NAL單元,第一語法元素指示與畫面標頭NAL單元相關聯的畫面是:(i)既不是IRAP亦不是GDR畫面,(ii)IDR畫面,(iii)CRA畫面,還是(iv)GDR畫面,其中:畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
在一些實例中,視訊編碼器200的處理單元可以被配置為:產生視訊資料的畫面集合的編碼的畫面;及在包括編碼的畫面的位元串流中包括畫面標頭NAL單元,其中畫面標頭NAL單元的NAL單元類型指示與畫面標頭NAL單元相關聯的畫面是:(i)IRAP畫面或GDR畫面,還是(ii)與畫面標頭NAL單元相關聯的畫面既不是IRAP畫面亦不是GDR畫面,其中:畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
在一些實例中,視訊編碼器200的處理單元可以被配置為:產生包括視訊資料的編碼的畫面和與該編碼的畫面的集合中的畫面相關聯的畫面標頭網路抽象層(NAL)單元的位元串流,其中產生位元串流包括:基於第一語法元素指示在與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型,在畫面標頭NAL單元中包括第二語法元素,其中該第二語法元素指示與該畫面標頭NAL單元相關聯的畫面是:(i)具有RADL的IDR畫面,(ii)不具有前導畫面的IDR畫面,(iii)CRA畫面,還是(iv)GDR畫面。
在一些實例中,視訊編碼器200的處理單元可以被配置為:產生視訊資料的畫面集合的編碼的畫面和與該編碼的畫面的集合中的畫面相關聯的畫面標頭NAL單元;及基於語法元素指示在與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型、並且畫面標頭NAL單元的NAL單元類型為GDR畫面NAL單元類型,來包括指示復原點的語法元素。
圖3是示出可執行本案的技術的示例性視訊解碼器300的方塊圖。圖3是出於解釋的目的而提供的,並且不是對本案中廣泛例示和描述的技術的限制。出於解釋的目的,本案描述了根據VVC和HEVC的技術的視訊解碼器300。然而,本案的技術可以由被配置為其他視訊編解碼標準的視訊編解碼設備來執行。
在圖3的實例中,視訊解碼器300包括編解碼畫面緩衝器(CPB)記憶體320、熵解碼單元302、預測處理單元304、逆量化單元306、逆變換處理單元308、重構單元310、濾波器單元312和解碼畫面緩衝器(DPB)314。CPB記憶體320、熵解碼單元302、預測處理單元304、逆量化單元306、逆變換處理單元308、重構單元310、濾波器單元312和DPB 314中的任一者或全部可以以一或多個處理器實現或以處理電路實現。例如,視訊解碼器300的單元可以被實現為一或多個電路或邏輯元件,作為硬體電路的一部分或者作為處理器、ASIC或FPGA的一部分。此外,視訊解碼器300可以包括附加的或替代的處理器或處理電路,以執行該等和其他功能。
預測處理單元304包括運動補償單元316和訊框內預測單元318。預測處理單元304可以包括附加單元以根據其他預測模式執行預測。作為實例,預測處理單元304可以包括調色板單元、區塊內複製單元(其可以形成運動補償單元316的一部分)、仿射單元、線性模型(LM)單元等。在其他實例中,視訊解碼器300可以包括更多、更少或不同的功能元件。
CPB記憶體320可以儲存要由視訊解碼器300的元件解碼的視訊資料,諸如編碼的視訊位元串流。可以例如從電腦可讀取媒體110(圖1)獲得儲存在CPB記憶體320中的視訊資料。CPB記憶體320可以包括儲存來自編碼的視訊位元串流的編碼的視訊資料(例如,語法元素)的CPB。此外,CPB記憶體320可以儲存除編碼的畫面的語法元素之外的視訊資料,諸如表示來自視訊解碼器300的各種單元的輸出的臨時資料。DPB 314通常儲存解碼的畫面,其中視訊解碼器300可以在對編碼的視訊位元串流的後續資料或畫面進行解碼時,輸出該解碼的畫面及/或將該解碼的畫面用作參考視訊資料。CPB記憶體320和DPB 314可以由各種記憶體設備中的任一種形成,諸如DRAM,包括SDRAM、MRAM、RRAM或其他類型的記憶體設備。CPB記憶體320和DPB 314可以由相同的記憶體設備或單獨的記憶體設備提供。在各種實例中,CPB記憶體320可以與視訊解碼器300的其他元件一起在晶片上,或相對於彼等元件在晶片外。
另外地或替代地,在一些實例中,視訊解碼器300可以從記憶體120(圖1)取得編碼的視訊資料。亦即,記憶體120可以儲存如上文關於CPB記憶體320所論述的資料。同樣地,當以軟體實現視訊解碼器300的一些或全部功能以由視訊解碼器300的處理電路執行時,記憶體120可以儲存由視訊解碼器300執行的指令。
圖示圖3中所示的各種單元以説明理解由視訊解碼器300執行的操作。該單元可以被實現為固定功能電路、可程式設計電路或其組合。類似於圖2,固定功能電路指提供特定功能並且在可以執行的操作上預設的電路。可程式設計電路指可以被程式設計以執行各種任務並且在可以執行的操作中提供靈活功能的電路。例如,可程式設計電路可以執行使得可程式設計電路以由軟體或韌體的指令定義的方式進行操作的軟體或韌體。固定功能電路可以執行軟體指令(例如,以接收參數或輸出參數),但固定功能電路執行的操作的類型通常是不可變的。在一些實例中,該單元中的一或多個可以是不同的電路區塊(固定功能或可程式設計),並且在一些實例中,該單元中的一或多個可以是積體電路。
視訊解碼器300可以包括ALU、EFU、數位電路、類比電路及/或由可程式設計電路形成的可程式設計核心。在其中視訊解碼器300的操作由在可程式設計電路上執行的軟體執行的實例中,晶片上或晶片外記憶體可以儲存視訊解碼器300接收和執行的軟體的指令(例如,目標代碼)。
熵解碼單元302可以從CPB記憶體320接收編碼的視訊資料並且對視訊資料進行熵解碼以再現語法元素。預測處理單元304、逆量化單元306、逆變換處理單元308、重構單元310和濾波器單元312可以基於從位元串流提取的語法元素來產生解碼的視訊資料。
在圖3的實例中,視訊解碼器300包括可以使視訊解碼器300能夠執行隨機存取的隨機存取單元321。作為執行隨機存取的部分,隨機存取單元321可以根據本案的一或多個技術來定位IRAP及GDR畫面以及相關聯的畫面標頭。例如,在一個實例中,隨機存取單元321可在位元串流中的編碼的畫面當中定位IRAP或GDR畫面。作為定位IRAP或GDR畫面的部分,隨機存取單元321可從位元串流中的畫面標頭NAL單元獲得指示與畫面標頭NAL單元相關聯的畫面必須是IRAP或GDR畫面的語法元素。隨機存取單元321可基於語法元素決定與畫面標頭NAL單元相關聯的畫面是IRAP或GDR畫面。
通常,視訊解碼器300在逐區塊的基礎上重構畫面。視訊解碼器300可以個別地對每個區區塊執行重構操作(其中當前正被重構(亦即,被解碼)的區塊可以被稱為「當前區塊」)。
熵解碼單元302可以對定義量化的變換係數區塊的量化的變換係數的語法元素以及變換資訊(諸如,量化參數(QP)及/或(多個)變換模式指示)進行熵解碼。逆量化單元306可以使用與量化的變換係數區塊相關聯的QP來決定量化程度,並且同樣地,決定逆量化單元306要應用的逆量化程度。逆量化單元306可以例如執行逐位左移操作來對量化的變換係數進行逆量化。由此,逆量化單元306可以形成包括變換係數的變換係數區塊。
在逆量化單元306形成變換係數區塊之後,逆變換處理單元308可以將一或多個逆變換應用於變換係數區塊以產生與當前區塊相關聯的殘差區塊。例如,逆變換處理單元308可以將逆DCT、逆整數變換、逆Karhunen-Loeve變換(KLT)、逆旋轉變換、逆方向變換或另一逆變換應用於變換係數區塊。
此外,預測處理單元304根據由熵解碼單元302熵解碼的預測資訊語法元素來產生預測區塊。例如,若預測資訊語法元素指示當前區塊是訊框間預測的,則運動補償單元316可以產生預測區塊。在此種情況下,預測資訊語法元素可以指示從其取得參考區塊的DPB 314中的參考畫面,以及識別參考畫面中的參考區塊的位置相對於當前畫面中的當前區塊的位置的運動向量。運動補償單元316可以通常以基本上類似於針對運動補償單元224(圖2)所描述的方式的方式執行訊框間預測處理。
作為另一實例,若預測資訊語法元素指示當前區塊是訊框內預測的,則訊框內預測單元318可以根據由預測資訊語法元素指示的訊框內預測模式來產生預測區塊。同樣,訊框內預測單元318可以以基本上類似於針對訊框內預測單元226(圖2)所描述的方式的方式執行訊框內預測處理。訊框內預測單元318可以從DPB 314取得當前區塊的相鄰取樣的資料。
重構單元310可以使用預測區塊和殘差區塊來重構當前區塊。例如,重構單元310可以將殘差區塊的取樣添加到預測區塊的對應取樣以重構當前區塊。
濾波器單元312可以對重構的區塊執行一或多個濾波器操作。例如,濾波器單元312可以執行解區塊操作以減少沿著重構的區塊的邊緣的區塊效應偽像。未必在所有實例中執行濾波器單元312的操作。
視訊解碼器300可以將重構的區塊儲存在DPB 314中。例如,在其中不執行濾波器單元312的操作的實例中,重構單元310可將重構的區塊儲存到DPB 314。在其中執行濾波器單元312的操作的實例中,濾波器單元312可將濾波的重構的區塊儲存到DPB 314。如前述,DPB 314可以將參考資訊(諸如用於訊框內預測的當前畫面的取樣和用於後續運動補償的先前解碼的畫面的取樣)提供給預測處理單元304。此外,視訊解碼器300可以輸出來自DPB 314的解碼的畫面(例如,解碼的視訊),用於後續在顯示設備(諸如,圖1的顯示設備118)上呈現。
以此種方式,視訊解碼器300表示視訊解碼設備的實例,該視訊解碼設備包括被配置為儲存視訊資料的記憶體,以及以電路實現並且被配置為執行以下操作的一或多個處理單元:獲得包括視訊資料的編碼的畫面的集合的位元串流;及在該位元串流中的該編碼的畫面當中定位IRAP或GDR畫面,其中定位該IRAP或GDR畫面包括:從該位元串流中的畫面標頭NAL單元獲得第一語法元素,該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是IRAP或GDR畫面;及基於該語法元素,決定與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面。該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在一些實例中,視訊解碼器300的處理單元被配置為:獲得包括視訊資料的編碼的畫面的集合的位元串流;和在該位元串流中的編碼的畫面當中定位IRAP或GDR畫面,其中定位該IRAP或GDR畫面包括:從該位元串流中的畫面標頭NAL單元獲得第一語法元素,該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面是:(i)既不是IRAP畫面亦不是GDR畫面,(ii)暫態解碼刷新(IDR)畫面,(iii)CRA畫面,還是(iv)GDR畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
在一些實例中,視訊解碼器300的處理單元被配置為:獲得包括視訊資料的編碼的畫面的集合的位元串流;在該位元串流中的編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中定位該IRAP或GDR畫面包括:基於該位元串流中的畫面標頭NAL單元的網路抽象層(NAL)單元類型,決定與該畫面標頭NAL單元相關聯的畫面是:(i)訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,還是(ii)與該畫面標頭NAL單元相關聯的畫面既不是IRAP畫面亦不是GDR畫面,其中:畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
在一些實例中,視訊解碼器300的處理單元被配置為:獲得包括視訊資料的編碼的畫面的集合和與該編碼的畫面的集合中的畫面相關聯的畫面標頭網路抽象層(NAL)單元的位元串流;及基於第一語法元素指示與該畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型,從該畫面標頭NAL單元獲得第二語法元素,其中該第二語法元素指示與該畫面標頭NAL單元相關聯的畫面是:(i)具有隨機存取可解碼前導(RADL)的暫態解碼器刷新(IDR)畫面,(ii)不具有前導畫面的IDR畫面,(iii)清除隨機存取(CRA)畫面,亦是(iv)漸進解碼器刷新(GDR)畫面。
在一些實例中,視訊解碼器300的處理單元被配置為:獲得包括視訊資料的編碼的畫面的集合和與該編碼的畫面的集合中的畫面相關聯的畫面標頭網路抽象層(NAL)單元的位元串流;及基於語法元素指示在與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型、並且畫面標頭NAL單元的NAL單元類型為漸進解碼器刷新(GDR)畫面NAL單元類型,獲得指示復原點的語法元素。
圖4是示出用於對當前區塊進行編碼的示例性方法的流程圖。當前區塊可包括當前CU。儘管針對視訊編碼器200(圖1和圖2)進行了描述,但是應當理解,其他設備可以被配置為執行類似於圖4的方法的方法。
在該實例中,視訊編碼器200最初預測當前區塊(350)。例如,視訊編碼器200可以形成當前區塊的預測區塊。隨後,視訊編碼器200可以計算當前區塊的殘差區塊(352)。為了計算殘差區塊,視訊編碼器200可以計算原始的未編碼的區塊與當前區塊的預測區塊之間的差。隨後,視訊編碼器200可以變換和量化殘差區塊的變換係數(354)。接下來,視訊編碼器200可以掃瞄殘差區塊的量化的變換係數(356)。在掃瞄期間或在掃瞄之後,視訊編碼器200可以對變換係數進行熵編碼(358)。例如,視訊編碼器200可使用CAVLC或CABAC來對變換係數進行編碼。隨後,視訊編碼器200可以輸出區塊的熵編碼的資料(360)。
圖5是示出用於對視訊資料的當前區塊進行解碼的示例性方法的流程圖。當前區塊可包括當前CU。儘管針對視訊解碼器300(圖1和圖3)進行了描述,但是應當理解,其他設備可以被配置為執行類似於圖5的方法的方法。
視訊解碼器300可以接收當前區塊的熵編碼的資料,諸如熵編碼的預測資訊和與當前區塊相對應的殘差區塊的變換係數的熵編碼的資料(370)。視訊解碼器300可以對熵編碼的資料進行熵解碼,以決定當前區塊的預測資訊並再現殘差區塊的變換係數(372)。視訊解碼器300可以例如使用由當前區塊的預測資訊指示的訊框內或訊框間預測模式來預測當前區塊(374),以計算當前區塊的預測區塊。隨後,視訊解碼器300可以逆掃瞄再現的變換係數(376),以建立量化的變換係數的區塊。隨後,視訊解碼器300可以對變換係數進行逆量化和逆變換以產生殘差區塊(378)。視訊解碼器300可以藉由組合預測區塊和殘差區塊來對當前區塊進行最終解碼(380)。
圖6是示出根據本案的一或多個技術的視訊編碼器200的示例性操作的流程圖。在圖6的實例中,視訊編碼器200可產生視訊資料的畫面集合的編碼的畫面(600)。例如,視訊編碼器200可以對畫面進行編碼,例如,如針對圖2所描述的。
另外,視訊編碼器200可在包括編碼的畫面的位元串流中包括畫面標頭NAL單元(602)。畫面標頭NAL單元包括指示與畫面標頭NAL單元相關聯的畫面必須是IRAP或GDR畫面的語法元素(例如,irap_or_gdr_pic_flag)。例如,若語法元素等於1,則語法元素可指示與畫面標頭NAL單元相關聯的畫面是IRAP或GDR畫面、並且不是任何其他類型的畫面。畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素。與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
圖7是示出根據本案的一或多個技術的用於處理視訊資料的示例性操作的流程圖。處理視訊資料可包括解碼視訊資料、處置視訊資料用於傳輸到其他設備、以及涉及視訊資料的其他動作。圖7的操作可以由視訊解碼器300、目的地設備116或另一設備(諸如中間網路設備)來執行。為了便於解釋,本案參考視訊解碼器300描述圖7。
在圖7的實例中,視訊解碼器300獲得包括視訊資料的編碼的畫面的集合的位元串流(700)。此外,視訊解碼器300可以在位元串流中的編碼的畫面當中定位IRAP或GDR畫面(702)。作為定位IRAP或GDR畫面的部分,視訊解碼器300可從位元串流中的畫面標頭NAL單元獲得指示與畫面標頭NAL單元相關聯的畫面必須是IRAP或GDR畫面的語法元素(例如,irap_or_gdr_pic_flag)(704)。視訊解碼器300可基於語法元素決定與畫面標頭NAL單元相關聯的畫面是IRAP或GDR畫面(706)。畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素。與畫面標頭NAL單元相關聯的畫面在編碼的畫面的集合中。
此外,在圖7的實例中,視訊解碼器300可對與畫面標頭NAL單元相關聯的畫面進行解碼(708)。例如,視訊解碼器300可以如針對圖3所描述的對畫面進行解碼。在其他實例中,在設備定位IRAP或GDR畫面之後,設備可將IRAP和GDR畫面的位置的指示提供到另一設備,例如用於對畫面進行解碼。
以下是根據本案的一或多個技術的各態樣的非限制性列表。
態樣1A。一種處理視訊資料的方法,該方法包括:獲得包括該視訊資料的編解碼的畫面的集合的位元串流;及在該位元串流中的編解碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中定位該IRAP或GDR畫面包括:從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得第一語法元素,該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,或者與該畫面標頭NAL單元相關聯的畫面既不是IRAP亦不是GDR畫面,其中:畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編解碼的畫面的集合中。
態樣2A。根據態樣1A所述的方法,進一步包括:基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面是否為GDR畫面的第二語法元素。
態樣3A。根據態樣1A到2A中任一項所述的方法,進一步包括:對與畫面標頭NAL單元相關聯的畫面進行解碼。
態樣4A。一種對視訊資料進行編碼的方法,該方法包括:產生視訊資料的畫面的集合的編解碼的畫面;及將畫面標頭網路抽象層(NAL)單元包括在包括編解碼的畫面的位元串流中,其中該畫面標頭NAL單元包括第一語法元素,該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,或者與該畫面標頭NAL單元相關聯的畫面既不是IRAP亦不是GDR畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在編解碼的畫面的集合中。
態樣5A。根據態樣4A所述的方法,其中基於該畫面為IRAP或GDR畫面,該畫面標頭NAL單元包括指示該畫面是否為GDR畫面的第二語法元素。
態樣1B。一種處理視訊資料的方法,該方法包括:獲得包括視訊資料的編解碼的畫面的集合的位元串流;及在該位元串流中的編解碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中定位該IRAP或GDR畫面包括:從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得第一語法元素,該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面是:(i)既不是訊框內隨機存取畫面(IRAP)亦不是漸進解碼器刷新(GDR)畫面,(ii)暫態解碼刷新(IDR)畫面,(iii)清除隨機存取(CRA)畫面,還是(iv)GDR畫面,其中:畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編解碼的畫面的集合中。
態樣2B。根據態樣1B所述的方法,進一步包括:基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為GDR畫面,從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面的復原點的第二語法元素。
態樣3B。根據態樣1B到2B中任一項所述的方法,進一步包括對與畫面標頭NAL單元相關聯的畫面進行解碼。
態樣4B。一種對視訊資料進行編碼的方法,該方法包括:產生視訊資料的畫面的集合的編解碼的畫面;及將畫面標頭網路抽象層(NAL)單元包括在包括編解碼的畫面的位元串流中,該第一語法元素指示與畫面標頭NAL單元相關聯的畫面是:(i)既不是訊框內隨機存取畫面(IRAP)亦不是漸進解碼器刷新(GDR)畫面,(ii)暫態解碼刷新(IDR)畫面,(iii)清除隨機存取(CRA)畫面,還是(iv)GDR畫面,其中:畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並與該畫面標頭NAL單元相關聯的畫面在該編解碼的畫面的集合中。
態樣5B。根據態樣4B所述的方法,進一步包括:基於與畫面標頭NAL單元相關聯的畫面是GDR畫面,在畫面標頭NAL單元中包括指示與畫面標頭NAL單元相關聯的畫面的復原點的第二語法元素。
態樣1C。一種處理視訊資料的方法,該方法包括:獲得包括該視訊資料的編解碼的畫面的集合的位元串流;及在該位元串流中的編解碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中定位該IRAP或GDR畫面包括:基於該位元串流中的畫面標頭NAL單元的網路抽象層(NAL)單元類型,決定與該畫面標頭NAL單元相關聯的畫面是:(i)訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,還是(ii)與該畫面標頭NAL單元相關聯的畫面既不是IRAP畫面亦不是GDR畫面,其中:畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編解碼的畫面的集合中。
態樣2C。根據態樣1C所述的方法,進一步包括:基於畫面標頭NAL單元的NAL單元類型指示與畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,從畫面標頭NAL單元獲得指示與畫面標頭NAL單元相關聯的畫面是否為GDR畫面的第二語法元素。
態樣3C。根據態樣1C到2C中任一項所述的方法,進一步包括對與畫面標頭NAL單元相關聯的畫面進行解碼。
態樣4C。一種對視訊資料進行編碼的方法,該方法包括:產生該視訊資料的畫面的集合的編解碼的畫面;及將畫面標頭網路抽象層(NAL)單元包括在包括編解碼的畫面的位元串流中,其中該畫面標頭NAL單元的NAL單元類型指示與該畫面標頭NAL單元相關聯的畫面是:(i)訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,還是(ii)與該畫面標頭NAL單元相關聯的畫面既不是IRAP畫面亦不是GDR畫面,其中:畫面標頭NAL單元包含適用於與畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與畫面標頭NAL單元相關聯的畫面在編解碼的畫面的集合中。
態樣5C。根據態樣4C所述的方法,進一步包括:基於與畫面標頭NAL單元相關聯的畫面是GDR畫面,在畫面標頭NAL單元中包括指示與畫面標頭NAL單元相關聯的畫面是否是GDR畫面的第二語法元素。
態樣1D。一種處理視訊資料的方法,該方法包括:獲得位元串流,該位元串流包括該視訊資料的編解碼的畫面的集合和與該編解碼的畫面的集合中的畫面相關聯的畫面標頭網路抽象層(NAL)單元;及基於第一語法元素指示與該畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型,從該畫面標頭NAL單元獲得第二語法元素,其中該第二語法元素指示與該畫面標頭NAL單元相關聯的畫面是:(i)具有隨機存取可解碼前導(RADL)的暫態解碼器刷新(IDR)畫面,(ii)不具有前導畫面的IDR畫面,(iii)清除隨機存取(CRA)畫面,還是(iv)漸進解碼器刷新(GDR)畫面。
態樣2D。根據態樣1D所述的方法,其中:該畫面標頭NAL單元是第一畫面標頭NAL單元,並且該方法進一步包括:從該位元串流獲得第二畫面標頭NAL單元;及基於第三語法元素指示與該第二畫面標頭NAL單元相關聯的畫面中不存在多個NAL單元類型,基於該第二畫面標頭NAL單元的NAL單元類型,決定與該第二畫面標頭NAL單元相關聯的畫面的畫面類型。
態樣3D。根據態樣1D-2D中任一項所述的方法,進一步包括對與第一畫面標頭NAL單元相關聯的畫面進行解碼和對與第二畫面標頭NAL單元相關聯的畫面進行解碼中的至少一個。
態樣4D。一種對視訊資料進行編碼的方法,該方法包括:產生位元串流,該位元串流包括該視訊資料的編解碼的畫面的集合和與該編解碼的畫面的集合中的畫面相關聯的畫面標頭網路抽象層(NAL)單元,其中產生該位元串流包括:基於第一語法元素指示在與該畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型,在該畫面標頭NAL單元中包括第二語法元素,其中該第二語法元素指示與該畫面標頭NAL單元相關聯的畫面是(i)具有隨機存取可解碼前導(RADL)的暫態解碼器刷新(IDR)畫面,(ii)不具有前導畫面的IDR畫面,(iii)清除隨機存取(CRA)畫面,還是(iv)漸進解碼器刷新(GDR)畫面。
態樣5D。根據態樣4D所述的方法,其中:該畫面標頭NAL單元是第一畫面標頭NAL單元,並且產生該位元串流進一步包括:在該位元串流中包括第二畫面標頭NAL單元,其中基於在與該第二畫面標頭NAL單元相關聯的畫面中不存在多個NAL單元類型,該第二畫面標頭的NAL單元類型指示與該第二畫面標頭NAL單元相關聯的畫面的畫面類型。
態樣1E。一種處理視訊資料的方法,該方法包括:獲得位元串流,該位元串流包括該視訊資料的編解碼的畫面的集合和與該編解碼的畫面的集合中的畫面相關聯的畫面標頭網路抽象層(NAL)單元;及基於語法元素指示在與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型、並且畫面標頭NAL單元的NAL單元類型為漸進解碼器刷新(GDR)NAL單元類型,獲得指示復原點的語法元素。
態樣2E。根據態樣1E所述的方法,進一步包括對與畫面標頭NAL單元相關聯的畫面進行解碼。
態樣3E。一種對視訊資料進行編碼的方法,該方法包括:產生該視訊資料的畫面的集合的編解碼的畫面和與該編解碼的畫面的集合中的畫面相關聯的畫面標頭網路抽象層(NAL)單元;及基於語法元素指示在與畫面標頭NAL單元相關聯的畫面中存在多個NAL單元類型、並且畫面標頭NAL單元的NAL單元類型是漸進解碼器刷新(GDR)畫面NAL單元類型,包括指示復原點的語法元素。
態樣1F。根據態樣1A到5A、1B到3B、1C到3C、1D到3D、1E或2E中任一項所述的方法,進一步包括從IRAP或GDR畫面開始執行位元串流的隨機存取。
態樣2F。根據態樣1F所述的方法,其中從IRAP畫面開始執行位元串流的隨機存取包括執行清除隨機存取、暫態解碼器刷新或斷鏈存取處理中的至少一個。
態樣3F。根據態樣1F所述的方法,其中從GDR畫面開始執行位元串流的隨機存取包括執行漸進解碼刷新處理。
態樣1G。一種用於對視訊資料進行編解碼的設備,該設備包括用於執行態樣1A到3F中任一項所述的方法的一或多個部件。
態樣2G。根據態樣1G所述的設備,其中該一或多個構件包括以電路實現的一或多個處理器。
態樣3G。根據態樣1G和2G中任一項所述的設備,進一步包括用於儲存該視訊資料的記憶體。
態樣4G。根據態樣1G到3G中任一項所述的設備,進一步包括被配置為顯示解碼的視訊資料的顯示器。
態樣5G。根據態樣1G到4G中任一項所述的設備,其中該設備包括相機、電腦、行動設備、廣播接收器設備或機上盒中的一或多個。
態樣6G。根據態樣1G到5G中任一項所述的設備,其中該設備包括視訊解碼器。
態樣7G。根據態樣1G到6G中任一項所述的設備,其中該設備包括視訊編碼器。
態樣8H。一種其上儲存有指令的電腦可讀取儲存媒體,該等指令在被執行時促使一或多個處理器執行態樣1A到3F中任一項所述的方法。
態樣1I。一種處理視訊資料的方法,該方法包括:
獲得包括該視訊資料的編碼的畫面的集合的位元串流;及在該位元串流中的該編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中定位該IRAP或GDR畫面包括:從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面;及基於該語法元素決定與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
態樣2I。根據態樣1I所述的方法,其中該語法元素為第一語法元素,該方法進一步包括:基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面是否為GDR畫面的第二語法元素。
態樣3I。根據態樣1I或2I所述的方法,進一步包括對與該畫面標頭NAL單元相關聯的畫面進行解碼。
態樣4I。一種對視訊資料進行編碼的方法,該方法包括:產生該視訊資料的畫面的集合的編碼的畫面;及將畫面標頭網路抽象層(NAL)單元包括在包括該編碼的畫面的位元串流中,其中該畫面標頭NAL單元包括語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
態樣5I。根據態樣4I所述的方法,其中該方法進一步包括:基於該畫面為IRAP或GDR畫面,在該畫面標頭NAL單元中包括指示該畫面是否為GDR畫面的第二語法元素。
態樣6I。一種用於處理視訊資料的設備,該設備包括:記憶體,被配置為儲存該視訊資料的編碼的畫面;及以電路實現的一或多個處理器,該一或多個處理器被配置為:在位元串流中的編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中該一或多個處理器被配置使得該一或多個處理器執行作為定位該IRAP或GDR畫面的部分的以下操作:從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面;及基於該語法元素決定與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
態樣7I。根據態樣6I所述的設備,其中該語法元素為第一語法元素,該一或多個處理器進一步被配置為:基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面是否為GDR畫面的第二語法元素。
態樣8I。根據態樣6I或7I所述的設備,其中該一或多個處理器進一步被配置為對與該畫面標頭NAL單元相關聯的畫面進行解碼。
態樣9I。一種用於對視訊資料進行編碼的設備,該設備包括:記憶體,被配置為儲存該視訊資料;及以電路實現的一或多個處理器,該一或多個處理器被配置為:產生視訊資料的畫面的集合的編碼的畫面;將畫面標頭網路抽象層(NAL)單元包括在包括該編碼的畫面的位元串流中,其中該畫面標頭NAL單元包括語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
態樣10I。根據態樣9I所述的設備,其中該一或多個處理器進一步被配置為:基於該畫面為IRAP或GDR畫面,在該畫面標頭NAL單元中包括指示該畫面是否為GDR畫面的第二語法元素。
態樣11I。一種用於處理視訊資料的設備,該設備包括:用於包括該視訊資料的編碼的畫面的集合的位元串流的構件;及用於在該位元串流中的編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面的構件,其中該用於定位該IRAP或GDR畫面的構件包括:用於從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得語法元素的構件,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面;及用於基於該語法元素決定與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面的構件,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
態樣12I。根據態樣11I所述的設備,其中該語法元素為第一語法元素,該設備進一步包括:用於基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面、從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面是否為GDR畫面的第二語法元素的構件。
態樣13I。根據態樣11I或12I所述的設備,其中該設備進一步包括用於對與畫面標頭NAL單元相關聯的畫面進行解碼的構件。
態樣14I。一種用於對視訊資料進行編碼的設備,該設備包括:用於產生視訊資料的畫面的集合的編碼的畫面的構件;及用於將畫面標頭網路抽象層(NAL)單元包括在包括該編碼的畫面的位元串流中的構件,其中該畫面標頭NAL單元包括指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面的語法元素,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
態樣15I。根據態樣14I所述的設備,其中該設備進一步包括用於基於該畫面為IRAP或GDR畫面而在該畫面標頭NAL單元中包括指示該畫面是否為GDR畫面的第二語法元素的構件。
態樣16I。一種其上儲存有指令的電腦可讀取儲存媒體,該等指令在被執行時促使一或多個處理器進行以下操作:獲得包括視訊資料的編碼的畫面的集合的位元串流;在該位元串流中的編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中促使該一或多個處理器定位該IRAP或GDR畫面的該等指令包括在被執行時促使該一或多個處理器進行以下操作的指令:從該位元串流中的畫面標頭網路抽象層(NAL)單元獲得指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面的語法元素;及基於該語法元素決定與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
態樣17I。根據態樣16I所述的電腦可讀取儲存媒體,其中該語法元素為第一語法元素,該等指令進一步促使該一或多個處理器進行以下操作:基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為IRAP或GDR畫面,從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面是否為GDR畫面的第二語法元素。
態樣18I。根據態樣16I或17I所述的電腦可讀取儲存媒體,其中該等指令在被執行時進一步促使該一或多個處理器對與該畫面標頭NAL單元相關聯的畫面進行解碼。
態樣19I。一種其上儲存有指令的電腦可讀取儲存媒體,該等指令在被執行時促使一或多個處理器進行以下操作:產生視訊資料的畫面的集合的編碼的畫面;將畫面標頭網路抽象層(NAL)單元包括在包括該編碼的畫面的位元串流中,其中該畫面標頭NAL單元包括語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中:該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,並且與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
態樣20I。根據態樣19I所述的電腦可讀取儲存媒體,其中該等指令在被執行時進一步促使該一或多個處理器進行以下操作:基於該畫面為IRAP或GDR畫面,在該畫面標頭NAL單元中包括指示該畫面是否為GDR畫面的第二語法元素。
應認識到,取決於實例,本文中所描述的任何技術中的某些動作或事件可以以不同的循序執行,可以被添加、合併或完全省略(例如,並非所有描述的動作或事件對於技術的實踐皆是必須的)。此外,在某些實例中,可以例如經由多執行緒處理、中斷處理或多個處理器併發地(而不是順序地)執行動作或事件。
在一或多個實例中,所描述的功能可以以硬體、軟體、韌體或其任何組合來實現。若以軟體實現,則功能可以作為一或多個指令或代碼儲存在電腦可讀取媒體上或在電腦可讀取媒體上傳輸,並且由基於硬體的處理單元來執行。電腦可讀取媒體可以包括電腦可讀取儲存媒體,其對應於諸如資料儲存媒體的有形媒體,或者包括例如根據通訊協定來促進將電腦程式從一個地方轉移到另一個地方的任何媒體的通訊媒體。以此種方式,電腦可讀取媒體通常可對應於(1)非暫態的有形電腦可讀取儲存媒體,或者(2)諸如信號或載波的通訊媒體。資料儲存媒體可以是可由一或多個電腦或一或多個處理器存取以取得用於實現本案中所描述的技術的指令、代碼及/或資料結構的任何可用媒體。電腦程式產品可以包括電腦可讀取媒體。
舉例而言(但並非限制),此種電腦可讀取儲存媒體可以包括RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存設備、快閃記憶體,或者可用於儲存以指令或資料結構形式的並且可以由電腦存取的期望的程式碼的任何其他媒體。此外,任何連接皆被適當地稱為電腦可讀取媒體。例如,若使用同軸電纜、光纖電纜、雙絞線、數位用戶線(DSL)或者諸如紅外線、無線電和微波的無線技術從網站、伺服器或其他遠端源傳輸指令,則媒體的定義包括同軸電纜、光纖電纜、雙絞線、DSL或者諸如紅外線、無線電和微波的無線技術。然而,應該理解的是,電腦可讀取儲存媒體和資料儲存媒體不包括連接、載波、信號或其他暫態媒體,而是針對非暫態的有形儲存媒體。如本文中所使用的磁碟和光碟包括壓縮光碟(CD)、雷射光碟、光碟、數位多功能光碟(DVD)和藍光光碟,其中磁碟通常磁性地再現資料,而光碟利用雷射光學地再現資料。上述各項的組合亦應包括在電腦可讀取媒體的範圍內。
指令可以由一或多個處理器執行,諸如一或多個數位訊號處理器(DSPs)、通用微處理器、特殊應用積體電路(ASIC)、現場可程式閘陣列(FPGA),或其他等效的積體或離散邏輯電路。因此,如本文中所使用的術語「處理器」和「處理電路」可以指任何前述結構或適合於實現本文中所描述的技術的任何其他結構。另外,在一些態樣,本文中所描述的功能可以在被配置用於編碼和解碼的專用硬體及/或軟體模組內提供,或者可以結合在組合轉碼器中。另外,該技術可以在一或多個電路或邏輯元件中完全實現。
本案的技術可以在各種設備或裝置中實現,包括無線手持設備、積體電路(IC)或IC的集合(例如,晶片集)。在本案中描述了各種元件、模組或單元,以強調被配置為執行所揭示的技術的設備的功能態樣,但不一定需要由不同的硬體單元來實現。相反,如前述,各種單元可以組合在轉碼器硬體單元中,或者由包括如前述的一或多個處理器的多個交互動操作硬體單元、結合適當的軟體及/或韌體來提供。
100:視訊編碼和解碼系統 102:源設備 104:視訊源 106:記憶體 108:輸出介面 110:電腦可讀取媒體 112:儲存設備 114:檔案伺服器 116:目的地設備 118:顯示設備 120:記憶體 122:輸入介面 200:視訊編碼器 202:模式選擇單元 204:殘差產生單元 206:變換處理單元 208:量化單元 210:逆量化單元 212:逆變換處理單元 214:重構單元 216:濾波器單元 218:解碼畫面緩衝器 220:熵編碼單元 222:運動估計單元 224:運動補償單元 226:訊框內預測單元 230:視訊資料記憶體 300:視訊解碼器 302:熵解碼單元 304:預測處理單元 306:逆量化單元 308:逆變換處理單元 310:重構單元 312:濾波器單元 314:解碼畫面緩衝器 316:運動補償單元 318:訊框內預測單元 320:CPB記憶體 321:隨機存取單元 350:操作 352:操作 354:操作 356:操作 358:操作 360:操作 370:操作 372:操作 374:操作 376:操作 378:操作 380:操作 600:操作 602:操作 700:操作 702:操作 704:操作 706:操作 708:操作
圖1是示出可執行本案的技術的示例性視訊編碼和解碼系統的方塊圖。
圖2是示出可執行本案的技術的示例性視訊編碼器的方塊圖。
圖3是示出可執行本案的技術的示例性視訊解碼器的方塊圖。
圖4是示出用於對當前區塊進行編碼的示例性方法的流程圖。
圖5是示出用於對視訊資料的當前區塊進行解碼的示例性方法的流程圖。
圖6是示出根據本案的一或多個技術的視訊編碼器的示例性操作的流程圖。
圖7是示出根據本案的一或多個技術的用於處理視訊資料的示例性操作的流程圖。
國內寄存資訊(請依寄存機構、日期、號碼順序註記) 無 國外寄存資訊(請依寄存國家、機構、日期、號碼順序註記) 無
700:操作
702:操作
704:操作
706:操作
708:操作

Claims (20)

  1. 一種處理視訊資料的方法,該方法包括以下步驟: 獲得包括該視訊資料的編碼的畫面的的一集合的一位元串流;及 在該位元串流中的該編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中定位該IRAP或GDR畫面之步驟包括以下步驟: 從該位元串流中的一畫面標頭網路抽象層(NAL)單元獲得一語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的一畫面必須是一訊框內隨機存取畫面(IRAP)或一漸進解碼器刷新(GDR)畫面;及 基於該語法元素,決定與該畫面標頭NAL單元相關聯的該畫面為一IRAP或GDR畫面,其中: 該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及 與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
  2. 如請求項1所述之方法,其中該語法元素是一第一語法元素,該方法進一步包括以下步驟: 基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為一IRAP或GDR畫面,從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面是否為一GDR畫面的一第二語法元素。
  3. 如請求項1所述之方法,進一步包括以下步驟:對與該畫面標頭NAL單元相關聯的該畫面進行解碼。
  4. 一種編碼視訊資料的方法,該方法包括以下步驟: 產生該視訊資料的畫面的一集合的編碼的畫面;及 在包括該編碼的畫面的一位元串流中包括一畫面標頭網路抽象層(NAL)單元,其中該畫面標頭NAL單元包括一語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的一畫面必須是一訊框內隨機存取畫面(IRAP)或一漸進解碼器刷新(GDR)畫面,其中: 該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及 與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
  5. 如請求項4所述之方法,其中該方法進一步包括以下步驟:基於該畫面為一IRAP或一GDR畫面,在該畫面標頭NAL單元中包括指示該畫面是否為一GDR畫面的一第二語法元素。
  6. 一種用於處理視訊資料的設備,該設備包括: 一記憶體,被配置為儲存該視訊資料的編碼的畫面;及 以電路實現的一或多個處理器,該一或多個處理器被配置為: 在位元串流中的該編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中該一或多個處理器被配置使得該一或多個處理器執行作為定位該IRAP或GDR畫面的部分的以下操作: 從該位元串流中的一畫面標頭網路抽象層(NAL)單元獲得一語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的一畫面必須是一訊框內隨機存取畫面(IRAP)或一漸進解碼器刷新(GDR)畫面;及 基於該語法元素,決定與該畫面標頭NAL單元相關聯的畫面為一IRAP或一GDR畫面,其中: 該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及 與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
  7. 如請求項6所述之設備,其中該語法元素是一第一語法元素,該一或多個處理器進一步被配置為: 基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為一IRAP或一GDR畫面,從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面是否為一GDR畫面的一第二語法元素。
  8. 如請求項6所述之設備,其中該一或多個處理器進一步被配置為:對與該畫面標頭NAL單元相關聯的畫面進行解碼。
  9. 一種用於編碼視訊資料的設備,該設備包括: 一記憶體,被配置為儲存該視訊資料;及 以電路實現的一或多個處理器,該一或多個處理器被配置為: 產生該視訊資料的畫面的一集合的編碼的畫面;及 在包括該編碼的畫面的一位元串流中包括一畫面標頭網路抽象層(NAL)單元,其中該畫面標頭NAL單元包括一語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的一畫面必須是一訊框內隨機存取畫面(IRAP)或一漸進解碼器刷新(GDR)畫面,其中: 該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及 與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
  10. 如請求項9所述之設備,其中該一或多個處理器進一步被配置以:基於該畫面為一IRAP或GDR畫面,在該畫面標頭NAL單元中包括指示該畫面是否為一GDR畫面的一第二語法元素。
  11. 一種用於處理視訊資料的設備,該設備包括: 用於包括該視訊資料的編碼的畫面的一集合的一位元串流的構件;及 用於在該位元串流中的該編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面的構件,其中該用於定位該IRAP或GDR畫面的構件包括: 用於從該位元串流中的一畫面標頭網路抽象層(NAL)單元獲得一語法元素的構件,該語法元素指示與該畫面標頭NAL單元相關聯的一畫面必須是一訊框內隨機存取畫面(IRAP)或一漸進解碼器刷新(GDR)畫面;及 用於基於該語法元素決定與該畫面標頭NAL單元相關聯的畫面為一IRAP或一GDR畫面的構件,其中: 該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及 與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
  12. 如請求項11所述之設備,其中該語法元素是一第一語法元素,該設備進一步包括: 用於基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為一IRAP或一GDR畫面、從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面是否為一GDR畫面的一第二語法元素的構件。
  13. 如請求項11所述之設備,其中該設備進一步包括:用於對與該畫面標頭NAL單元相關聯的畫面進行解碼的構件。
  14. 一種用於編碼視訊資料的設備,該設備包括: 用於產生該視訊資料的畫面的一集合的編碼的畫面的構件;及 用於在包括該編碼的畫面的一位元串流中包括一畫面標頭網路抽象層(NAL)單元的構件,其中該畫面標頭NAL單元包括一語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的畫面必須是一訊框內隨機存取畫面(IRAP)或一漸進解碼器刷新(GDR)畫面,其中: 該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及 與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
  15. 如請求項14所述之設備,其中該設備進一步包括:用於基於該畫面為一IRAP或一GDR畫面而在該畫面標頭NAL單元中包括指示該畫面是否為一GDR畫面的一第二語法元素的構件。
  16. 一種其上儲存有指令的電腦可讀取儲存媒體,該等指令在被執行時促使一或多個處理器進行以下操作: 獲得包括該視訊資料的編碼的畫面的一集合的位元串流;及 在該位元串流中的該編碼的畫面當中定位訊框內隨機存取畫面(IRAP)或漸進解碼器刷新(GDR)畫面,其中促使該一或多個處理器定位該IRAP或GDR畫面的該等指令包括在被執行時促使該一或多個處理器進行以下操作的指令: 從該位元串流中的一畫面標頭網路抽象層(NAL)單元獲得一語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的一畫面必須是一訊框內隨機存取畫面(IRAP)或一漸進解碼器刷新(GDR)畫面;及 基於該語法元素,決定與該畫面標頭NAL單元相關聯的畫面為一IRAP或一GDR畫面,其中: 該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及 與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的該集合中。
  17. 如請求項16所述之電腦可讀取儲存媒體,其中該語法元素是一第一語法元素,該等指令進一步促使該一或多個處理器進行以下操作: 基於該第一語法元素指示與該畫面標頭NAL單元相關聯的畫面為一IRAP或一GDR畫面,從該畫面標頭NAL單元獲得指示與該畫面標頭NAL單元相關聯的畫面是否為一GDR畫面的一第二語法元素。
  18. 如請求項16所述之電腦可讀取儲存媒體,其中該等指令在被執行時進一步促使該一或多個處理器對與該畫面標頭NAL單元相關聯的畫面進行解碼。
  19. 一種其上儲存有指令的電腦可讀取儲存媒體,該等指令在被執行時促使一或多個處理器進行以下操作: 產生該視訊資料的畫面的一集合的編碼的畫面;及 在包括該編碼的畫面的一位元串流中包括一畫面標頭網路抽象層(NAL)單元,其中該畫面標頭NAL單元包括一語法元素,該語法元素指示與該畫面標頭NAL單元相關聯的一畫面必須是一訊框內隨機存取畫面(IRAP)或一漸進解碼器刷新(GDR)畫面,其中: 該畫面標頭NAL單元包含適用於與該畫面標頭NAL單元相關聯的畫面的所有片段的語法元素,以及 與該畫面標頭NAL單元相關聯的畫面在該編碼的畫面的集合中。
  20. 如請求項19所述之電腦可讀取儲存媒體,其中該等指令在被執行時進一步促使該一或多個處理器進行以下操作:基於該畫面為一IRAP或一GDR畫面,在該畫面標頭NAL單元中包括指示該畫面是否為一GDR畫面的一第二語法元素。
TW109145716A 2019-12-23 2020-12-23 視訊編解碼中的畫面標頭訊框內隨機存取畫面和漸進解碼器刷新訊號傳遞 TW202133616A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962953035P 2019-12-23 2019-12-23
US62/953,035 2019-12-23
US17/130,759 US11356705B2 (en) 2019-12-23 2020-12-22 Picture header intra random access picture and gradual decoder refresh signaling in video coding
US17/130,759 2020-12-22

Publications (1)

Publication Number Publication Date
TW202133616A true TW202133616A (zh) 2021-09-01

Family

ID=76437367

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109145716A TW202133616A (zh) 2019-12-23 2020-12-23 視訊編解碼中的畫面標頭訊框內隨機存取畫面和漸進解碼器刷新訊號傳遞

Country Status (8)

Country Link
US (1) US11356705B2 (zh)
EP (1) EP4082207B1 (zh)
JP (1) JP2023517426A (zh)
KR (1) KR20220112785A (zh)
CN (1) CN114846802A (zh)
BR (1) BR112022011752A2 (zh)
TW (1) TW202133616A (zh)
WO (1) WO2021133909A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112022008667A2 (pt) * 2019-11-05 2022-07-19 Lg Electronics Inc Método e dispositivo para processar informação de imagem para codificação de imagem/vídeo
US11395007B2 (en) * 2019-12-12 2022-07-19 Tencent America LLC Method for signaling dependent and independent picture header
WO2021134019A1 (en) 2019-12-26 2021-07-01 Bytedance Inc. Constraints on coding of layered video
KR20220115958A (ko) 2019-12-26 2022-08-19 바이트댄스 아이엔씨 코딩된 비트스트림들에서의 비디오 계층들의 시그널링에 대한 제약들
US11758171B2 (en) * 2019-12-27 2023-09-12 Alibaba Group Holding Limited Methods and systems for performing gradual decoding refresh processing on pictures
WO2021134055A1 (en) 2019-12-27 2021-07-01 Bytedance Inc. Subpicture signaling in parameter sets
CN115004669A (zh) 2020-01-09 2022-09-02 字节跳动有限公司 不同sei消息的解码顺序
EP4117291A4 (en) * 2020-03-05 2024-03-27 Lg Electronics Inc METHOD AND DEVICE FOR CODING/DECODING VIDEOS WITH MIXED UNITS AND METHOD FOR TRANSMITTING BIT STREAMS
MX2022008860A (es) * 2020-04-24 2022-10-18 Atins Inc Metodo y dispositivo de decodificacion de video.

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11418813B2 (en) * 2019-09-20 2022-08-16 Tencent America LLC Signaling of inter layer prediction in video bitstream
US11706428B2 (en) * 2020-04-06 2023-07-18 Tencent America LLC Method for signaling picture header in coded video stream

Also Published As

Publication number Publication date
US11356705B2 (en) 2022-06-07
CN114846802A (zh) 2022-08-02
EP4082207A1 (en) 2022-11-02
EP4082207C0 (en) 2024-01-17
EP4082207B1 (en) 2024-01-17
KR20220112785A (ko) 2022-08-11
US20210195248A1 (en) 2021-06-24
BR112022011752A2 (pt) 2022-08-30
JP2023517426A (ja) 2023-04-26
WO2021133909A1 (en) 2021-07-01

Similar Documents

Publication Publication Date Title
TW202133616A (zh) 視訊編解碼中的畫面標頭訊框內隨機存取畫面和漸進解碼器刷新訊號傳遞
US10306253B2 (en) Signaling of parameter sets in files of multi-layer bitstreams
US20210029371A1 (en) Wraparound motion compensation in video coding
TW202115977A (zh) 用於視訊編碼的跨分量自我調整迴路濾波
CN114097209A (zh) 视频译码中的存取单元中的适应性参数集
US11303935B2 (en) Deriving coding system operational configuration
TW201444341A (zh) 用於視訊寫碼中之隨機存取之視訊緩衝操作
TW202123705A (zh) 低頻不可分離變換(lfnst)訊號傳遞
US11706460B2 (en) Storage and delivery of video data for video coding
US11632540B2 (en) Reference picture scaling ratios for reference picture resampling in video coding
CN115486066A (zh) 在视频编解码中的独立子图片信令通知
US11153583B2 (en) Spatial scalability support in video encoding and decoding
CN114375575A (zh) 用于视频编解码的高层语法中的子图片信令
TW202143722A (zh) 在視訊解碼中的經解碼視訊序列起點存取單元
US11895336B2 (en) Picture orientation and quality metrics supplemental enhancement information message for video coding
CN111713106A (zh) 用信号发送360度视频信息
US11863787B2 (en) Maximum allowed block size for BDPCM mode
US11412263B2 (en) Arithmetic coder byte stuffing signaling for video coding
CN114503590A (zh) 用信号发送针对变换跳过中的残差值的译码方案以进行视频译码
TW202141977A (zh) 視訊解碼中的變換跳過塊的係數編碼
US20240015332A1 (en) Supplemental enhancement information (sei) manifest indication
TW202126039A (zh) 用於視訊解碼的參數集訊號傳遞