TWI807138B - 用於發信新元素的nal單元報頭結構的方法和系統 - Google Patents

用於發信新元素的nal單元報頭結構的方法和系統 Download PDF

Info

Publication number
TWI807138B
TWI807138B TW108143896A TW108143896A TWI807138B TW I807138 B TWI807138 B TW I807138B TW 108143896 A TW108143896 A TW 108143896A TW 108143896 A TW108143896 A TW 108143896A TW I807138 B TWI807138 B TW I807138B
Authority
TW
Taiwan
Prior art keywords
abstraction layer
layer unit
network abstraction
picture
syntax
Prior art date
Application number
TW108143896A
Other languages
English (en)
Other versions
TW202029775A (zh
Inventor
魯林 陳
徐志瑋
黃毓文
Original Assignee
新加坡商聯發科技(新加坡)私人有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 新加坡商聯發科技(新加坡)私人有限公司 filed Critical 新加坡商聯發科技(新加坡)私人有限公司
Publication of TW202029775A publication Critical patent/TW202029775A/zh
Application granted granted Critical
Publication of TWI807138B publication Critical patent/TWI807138B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/68Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving the insertion of resynchronisation markers into the bitstream

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

公開了一種視訊編解碼的方法和裝置。在編碼端,接收視訊資料,其中編碼設備支持GDR(漸進解碼刷新)圖片類型。生成在NAL(網路訪問層)單元報頭中包括第一語法的語法結構,其中由第一語法指示的NAL單元類型包括GDR圖片類型。從視訊資料生成包括語法結構的編碼視訊資料。還公開了用於解碼側的相應方法和裝置。

Description

用於發信新元素的NAL單元報頭結構的方法和系統
本發明涉及視訊編解碼。特別地,本發明涉及用於指示視訊的圖片屬性的高級語法設計。
VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之間的新的聯合視訊專家團隊(JVET)於2017年10月27日成立,以開發通用視訊編解碼器(Versatile Video Codec,簡寫為VVC),具有超出HEVC(ITU-T H.265|ISO/IEC 23008-2)的功能的一種新的視訊壓縮標準。新一代視訊壓縮技術旨在提高壓縮效率,幷提供適用於各種應用(包括沉浸式媒體內容)的更多功能。
VVC的工作草案(working draft,簡寫為WD)(ITU-T SG 16 WP 3和ISO/IEC JTC 1/SC 29/WG 11的聯合視訊探索小組(JVET)中的(“Versatile Video Coding(Draft 3)”,第12屆會議,2018年10月,中國澳門,文檔:JVET-L1001)開始指定高級語法,同時許多其他編解碼工具和核心實驗也在評估中。NAL(Network Access Layer,網路訪問層)單元結構基本上是從HEVC繼承的。在VVC的WD中,如下所示,NAL單元報頭語法和NAL單元類型代碼以及NAL單元類型類分別在7.3.1.2和表7-1中。
7.3.1.2 NAL單元報頭語法
Figure 108143896-A0305-02-0004-1
Figure 108143896-A0305-02-0004-2
Figure 108143896-A0305-02-0005-3
根據JVET-L1001中的7.3.1.2 NAL單元報頭語法,NAL單元報頭由關於NAL單元結構的各種字段組成。這些字段被打包為2個字節(即16位元)。如以上語法表中所示,NAL單元類型(NUT),nal_unit_type在NAL單元報頭中發信,並且支持各種NAL單元類型。期望設計新的NAL單元報頭語法,其更適合於支持在NAL單元結構中發信新元素。
公開了一種視訊編解碼的方法和裝置。在編碼端,接收視訊資料,其中編碼設備支持GDR(漸進解碼刷新)圖片類型。生成在NAL(網路訪問層)單元報頭中包括第一語法的語法結構,其中由第一語法指示的NAL單元類型包括GDR圖片類型。從視訊資料生成包括語法結構的編碼視訊資料。
在一個實施例中,語法結構還包括第二語法,以指示語法結構中是否存在NAL單元報頭字段資料。如果第一語法指示GDR圖片類型並且第二語法指示在語法結構中存在NAL單元報頭字段資料,則在NAL單元報頭字段資料中發信GDR相關資料。GDR相關資料可以包括刷新區域標誌,以指示編碼圖像區域是否屬於當前圖片中的刷新區域。例如,編碼圖像區域對應於編碼切片組。在另一個示例中,編碼圖像區域對應於編碼切片。與GDR相關的資料還可以包括GDR圖片計數語法,以指示按輸出順序在恢復點之前的當前和後續 已解碼GDR圖片的數量。與GDR相關的資料還可以包括恢復圖片計數,以指定按輸出順序解碼圖像的恢復點。
在一個實施例中,NAL單元類型包括DRAP(Dependent Random Access Poin,從屬隨機訪問點)圖片類型。在一個實施例中,NAL單元類型包括IRAP(Intra Random Access Point,幀內隨機訪問點)圖片類型。
公開了一種存儲位元流的非暫時性計算機可讀介質。位元流包括與多個視訊幀相對應的壓縮格式的資料,其中該資料符合語法結構,該語法結構包括NAL(網路訪問層)單元報頭中的第一語法,其中由第一語法指示的NAL單元類型包括:GDR(Gradual Decoding Refresh,漸進解碼刷新)圖片類型。
110~130:步驟
第1圖示出了根據本發明實施例的用於結合了語法設計的編碼設備的示例性流程圖,其中,語法結構包括NAL(網路訪問層)單元報頭中的語法和由包括GDR圖片類型的第一語法指示的NAL單元類型。
以下描述是實施本發明的最佳構想模式。進行該描述是為了說明本發明的一般原理,而不應被認為是限制性的。本發明的範圍最好通過參考所附的申請專利範圍來確定。
從系統和應用的角度來看,希望在更高的語法級別上發信或暴露編碼圖片的某些屬性。
在本發明的一個實施例中,將隨機訪問屬性作為附加字段添加到NAL單元報頭中。整個NAL單元報頭使用具有固定位長的兩步字段。前8位元 中的NAL單元報頭字段標誌可以指示是否存在下一個固定位元字段。
應用可以使用發信的資訊來適當地執行隨機訪問處理。這裡引用了一些定義(一些定義來自HEVC),隨後是具有根據本發明實施例的語法和語義的兩個示例性設計。
一些涉及的語義定義如下:幀內隨機訪問點(IRAP)圖片:一種編碼圖片,在解碼過程中,對於幀間預測,除自身以外,均不參考其他圖片。
即時解碼刷新(instantaneous decoding refresh,簡寫為IDR)圖片:IRAP圖片,它是按解碼順序編解碼視訊序列(CVS)的第一張圖片。
非IRAP圖片:不是IRAP圖片的編碼圖片。
關聯的IRAP圖片:按解碼順序的前一個IRAP圖片。
前導圖片:非IRAP圖片,在輸出順序中位於關聯的IRAP圖片之前。
隨機訪問非參考前導圖片(random access non-reference leading,簡寫為RANL):一種前導圖片,未將其用作同一關聯IRAP圖片的尾隨圖片(trailing picture)的解碼過程的參考圖片。
尾隨圖片:非IRAP圖片,以輸出順序跟隨相關的IRAP圖片。
隨機訪問(random access):在位元流的起始點以外的一點上開始對位元流進行解碼的操作。
從屬隨機訪問點(dependent random access point,簡寫為DRAP)圖片:尾隨圖片,除了與之關聯的IRAP圖片以外,不包含對圖片的引用。以解碼順序和輸出順序在DRAP圖像之後的任何圖像均不得包含對以解碼順序或輸出順序在DRAP圖像之前的任何圖像的引用,但與DRAP圖像相關的IRAP圖像除外。
恢復點(recovery point):位元流中的一個點,在隨機訪問之後,可以恢 復由位元流表示的解碼圖像的精確表示或近似表示。
漸進解碼刷新(gradual decoding refresh,簡寫為GDR)圖片:一種非IRAP圖片,其中包含與指示的恢復點有關的刷新區域。
設計示例1:示例性NAL單元報頭語法和語義如下所示。
NAL單元報頭語法
Figure 108143896-A0305-02-0008-4
示例性NAL單元報頭字段資料如下所示。
NAL單元報頭字段資料
Figure 108143896-A0305-02-0008-5
Figure 108143896-A0305-02-0009-6
在以上示例中,nal_unit_type指定了包含在NAL單元中的RBSP資料結構的類型,如在下表7-1A中所指定的,並且對IRAP-NUT的內容進行了修改。
Figure 108143896-A0305-02-0009-20
等於1的nuh_field_present_flag指定nuh_field_data的8位元(根據需要可以為16位元)作為NAL單元報頭的附加部分存在。nuh_field_present_flag等於0表示不存在nuh_field_data的8位元(根據需要可以為16位元),並且進一步指定nal_unit_type等於IRAP_NUT時,內容是即時解碼刷新(IDR)圖片的編碼切片;當nal_unit_type等於non-IRAP_NUT時,內容是相關隨機訪問點(DRAP)圖片的編碼切片片段。random_access_type指定與NAL單元相關聯的隨機訪問類型,如表7-2A中所指定。
Figure 108143896-A0305-02-0009-21
Figure 108143896-A0305-02-0010-9
如以上語法表中所示,NAL單元類型(NUT)nal_unit_type在NAL單元報頭中發信,包括NON_IRAP和IRAP_NUT類型。
注:RAP_TYPE1可用於向封閉的(closed)GOP發信,表明可以實現無縫隨機 訪問。RAP_TYPE1可用於向開放GOP發信,表明由於對位元流中不存在的圖片的引用,隨機訪問可能會導致解碼錯誤。RAP_TYPE3可用於向開放GOP發信,取決於在解碼應用中處理前導圖片的能力,可以將前導圖片不用作參考圖片用於相同的關聯IRAP圖片的尾隨圖片的解碼過程,並且可以實現隨機訪問。
對於等於0、1或2的random_access_type,num_leading_pic_plus1減1指定關聯的IRAP圖片的前導圖片的數量。對於random_access_type等於3的num_Leading_pic_plus1減1,指定按輸出順序在恢復點之前的已解碼GDR圖片數量。
nuh_temporal_id_plus1減1指定NAL單元的時間標識符。nuh_temporal_id_plus1的值不應等於0。當不存在nuh_temporal_id_plus1時,推斷其值為等於1(例如,對於IDR圖片和DRAP圖片,其推斷為1)。
如以上表格中針對NAL單元報頭和NAL單元報頭字段資料所示,語法設計支持隨機訪問圖片並且語法nuh_field_present_flag包括在NAL單元報頭中。如果nuh_field_present_flag為真,則隨後發信nuh_field_data( )(即,NAL單元報頭字段資料)。
設計示例2:示例NAL單元報頭語法和語義如下所示:
NAL單元報頭語法
Figure 108143896-A0305-02-0011-10
Figure 108143896-A0305-02-0012-11
示例NAL單元報頭字段資料如下所示。
Figure 108143896-A0305-02-0012-12
在以上示例中,nal_unit_type指定包含在NAL單元中的RBSP資料結構的類型,如以下修改的表7-1B中所指定的那樣,其中對於GDR_NUT,所添加的nal_unit_type等於2。
Figure 108143896-A0305-02-0012-22
Figure 108143896-A0305-02-0013-14
等於1的nuh_field_present_flag指定nuh_field_data的8位元(根據需要可以為16位元)作為NAL單元報頭的附加部分存在。nuh_field_present_flag等於0表示不存在8位元(根據需要可以為16位元)nuh_field_data,並且進一步指定nal_unit_type等於IRAP_NUT時,內容是即時解碼刷新(IDR)圖片的編碼切片片段;當nal_unit_type等於非IRAP_NUT時,將內容編碼為相關隨機訪問點(DRAP)圖片的切片片段。
random_access_type指定與NAL單元關聯的隨機訪問類型,如以下修改的表7-2B中所指定。
Figure 108143896-A0305-02-0013-25
Figure 108143896-A0305-02-0014-26
注:RAP_TYPE1可用於向封閉GOP發信,表明可以實現無縫隨機訪問。RAP_TYPE1可用於向開放GOP發信,表明由於對位元流中不存在的圖片的引用,隨機訪問可能會導致解碼錯誤。RAP_TYPE3可用於向開放GOP發信,取決於在解碼應用中處理前導圖片的能力,可以將前導圖片不用作參考圖片用於相同的關聯IRAP圖片的尾隨圖片的解碼過程,並且可以實現隨機訪問。
對於等於0、1或2的random_access_type,num_leading_pic_plus1減1指定關聯的IRAP圖片的前導圖片的數量。
refreshed_region_flag等於1表示切片屬於當前圖片中的刷新區域。refreshed_region_flag等於0表示切片可能不屬於當前圖片中的刷新區域。
gdr_pic_count指示在恢復點之前的輸出順序中的當前和後續已解碼GDR圖片的數量。gdr_pic_count是一個計數器,對於輸出順序中恢復點之前的最後一個解碼的GDR圖片,其應為1。
nuh_temporal_id_plus1減1指定NAL單元的時間標識符。nuh_temporal_id_plus1的值不應等於0。當不存在nuh_temporal_id_plus1時,其值推斷為等於1(例如,對於IDR圖片和DRAP圖片,推斷其為1)。
在一些實施例中,可以為例如HEVC中的refreshed_region_flag、 exact_match_flag和broken_link_flag的附加資訊指定諸如nuh_reserved_zero_3bits的保留的零位元。
如以上表格中針對NAL單元報頭和NAL單元報頭字段資料所示,語法設計支持用於編碼切片的隨機訪問圖片和GDR圖片、IRAP和非IRAP圖片。此外,語法nuh_field_present_flag包括在NAL單元報頭中。如果nuh_field_present_flag為真,則隨後發信nuh_field_data( )(即,NAL單元報頭字段資料)。
根據本發明的另一實施例,將隨機訪問屬性作為附加字段添加到NAL單元報頭中。整個NAL單元報頭是固定的兩個8位元字段。就NAL單元類型而言,字段中的某些元素可能會被忽略。
設計示例3:示例性NAL單元報頭語法和語義如下所示。
NAL單元報頭語法
Figure 108143896-A0305-02-0015-17
Figure 108143896-A0305-02-0016-18
在以上示例中,forbidden_zero_bit應等於0。nal_unit_type指定NAL單元中包含的RBSP資料結構的類型,如以下對IRAP-NUT內容進行修改的表7-C中所指定的。
Figure 108143896-A0305-02-0016-19
在以上示例性語法設計中,等於1的end_nuh_field_flag指定應忽略後續位元,當nal_unit_type等於IRAP_NUT時,內容為即時解碼刷新(IDR)圖片的編碼的切片;當nal_unit_type等於非IRAP_NUT時,內容為相關隨機訪問點(DRAP)圖片的編碼切片片段。end_nuh_field_flag等於0表示後續位元應用於NAL單元類型。
random_access_type指定與NAL單元關聯的隨機訪問類型,如以下修改的表7-2C中所指定。
Figure 108143896-A0305-02-0016-27
Figure 108143896-A0305-02-0017-28
Figure 108143896-A0305-02-0018-29
注:RAP_TYPE1可用於向封閉的GOP發信,表明可以實現無縫隨機訪問。RAP_TYPE1可用於向開放GOP發信,表明由於對位元流中不存在的圖片的引用,隨機訪問可能會導致解碼錯誤。RAP_TYPE3可用於向開放GOP發信,取決於在解碼應用中處理前導圖片的能力,可以將前導圖片不用作參考圖片用於相同的關聯IRAP圖片的尾隨圖片的解碼過程,並且可以實現隨機訪問。
在以上語法設計示例中,num_leading_pic_plus1和nuh_temporal_id_plus1的定義與先前描述的相同。
nuh_reserved_zero_3bits應等於'000'。ITU-T|ISO/IEC將來可能會指定nuh_reserved_zero_3bits的其他值。解碼器應忽略nuh_reserved_zero_3bits值不等於'000'的NAL單元(即從位元流中刪除並丟棄)。
nuh_reserved_zero_6bits應等於'000000'。將來,ITU-T|ISO/IEC可能會指定nuh_reserved_zero_6bits的其他值。解碼器應忽略nuh_reserved_zero_6bits值不等於'000000'的NAL單元(即從位元流中刪除並丟棄)。
如以上表格中針對NAL單元報頭和NAL單元報頭字段資料所示,語法設計支持更多類型的隨機訪問圖片。此外,語法nuh_field_present_flag包括在NAL單元報頭中。如果nuh_field_present_flag為真,則隨後發信nuh_field_data( )(即,NAL單元報頭字段資料)。
在以上實施例中,NAL單元類型與已編碼切片相關聯以指示已編碼切片的NUT,諸如NON_IRAP、IRAP或GDR類型。然而,發信NUT的本發明不限於已編碼切片。也可以使用其他編碼圖像區域。在以下示例中,編碼圖像區域對應於編碼圖塊組。
設計示例4:示例性NAL單元報頭語法和語義如下所示:
NAL單元報頭語法
Figure 108143896-A0305-02-0019-31
NAL單元報頭語義
在以上語法示例中,forbidden_zero_bit應等於0。nal_unit_type指定修改的表7-1B中指定的NAL單元中包含的RBSP資料結構的類型(對於設計示例2),添加的nal_unit_type等於2用於GDR_NUT。
在以上語法示例中,等於1的end_nuh_field_flag指定應忽略後續位元,當nal_unit_type等於IRAP_NUT時,內容是即時解碼刷新(IDR)圖片的編碼切片;當nal_unit_type等於non-IRAP_NUT時,內容是相關隨機訪問點(DRAP)圖片的編碼切片片段。end_nuh_field_flag等於0表示後續位元應用於NAL單元類型。
random_access_type指定與針對設計示例2的修改的表7-2B中指定的與NAL單元相關聯的隨機訪問類型。
在以上語法示例中,num_leading_pic_plus1、refreshed_region_flag、gdr_pic_count和nuh_temporal_id_plus1具有與之前相同的定義。
nuh_reserved_zero_3bits應等於'000'。ITU-T|ISO/IEC將來可能會指定nuh_reserved_zero_3bits的其他值。解碼器應忽略nuh_reserved_zero_3bits值不等於'000'的NAL單元(即從位元流中刪除並丟棄)。
uh_reserved_zero_4bits應等於'0000'。ITU-T|ISO/IEC將來可能會指定nuh_reserved_zero_4bits的其他值。解碼器應忽略nuh_reserved_zero_4bits值不等於'0000'的NAL單元(即從位元流中刪除並丟棄)。
nuh_reserved_zero_6bits應該等於'000000'。將來,ITU-T|ISO/IEC可能會指定nuh_reserved_zero_6bits的其他值。解碼器應忽略nuh_reserved_zero_6bits值不等於'000000'的NAL單元(即從位元流中刪除並丟棄)。
在基於設計示例4的一些實施例中,可以為例如HEVC中的refreshed_region_flag、exact_match_flag和broken_link_flag的附加資訊指定諸如nuh_reserved_zero_4bits的保留的零位元。
在ITU-T SG 16 WP 3和ISO/IEC JTC 1/SC 29/WG 11的聯合 視訊探索小組(JVET)的JVET-M1001((“Versatile VideoCoding(Draft 5)”,第13次會議,2019年1月,摩洛哥,馬拉喀什,文檔:JVET-M1001)中,在上次會議中更新的表7-1D中添加了一些NAL單元類型代碼和NAL單元類型類(RASL_NUT,RADL_NUT,IDR_NUT,CRA_NUT),如下所示。
更新的表7-1D-NAL單元類型代碼和NAL單元類型類
Figure 108143896-A0305-02-0021-32
Figure 108143896-A0305-02-0022-33
Figure 108143896-A0305-02-0023-34
在上表中,乾淨隨機訪問(clean random access,簡寫為CRA)圖片可能在位元流中具有關聯的RASL或RADL圖片。nal_unit_type等於IDR_N_LP的即時解碼刷新(IDR)圖片在位元流中沒有關聯的前導圖片。具有等於IDR_W_RADL的nal_unit_type的IDR圖片在位元流中不具有關聯的RASL圖片,但是可以在位元流中具有關聯的RADL圖片。
在基於MPEG的媒體文件格式(ISOBMFF)(“ISO based media file format”,ISO/IEC 14496-12,W17277,2015年2月)中,流訪問點在附件I中指定。
對於每個SAP,將屬性ISAP、TSAP、ISAU、TDEC、TEPT和TPTF標識和定義為:
- TSAP是媒體流中任何訪問單元的最早表示時間,因此,可以使用從ISAP開始的位元流中的資料正確地解碼呈現時間大於或等於TSAP的媒體流中的所有訪問單元,而不使用在ISAP之前的任何資料。
- ISAP是位元流中的最大位置,因此可以使用從ISAP開始的位元流資料(不使用在ISAP之前的任何資料)正確地解碼呈現時間大於或等於TSAP的媒體流的所有訪問單元。
- ISAU是最新訪問單元在位元流中按解碼順序在媒體流中的開始位置,以便使用此最新訪問單元和在解碼順序上之後的訪問單元(並且不使用解碼順序中在先的訪問單元)可以正確解碼呈現時間大於或等於TSAP的媒體流的所有訪問單元。
注意ISAU始終大於或等於ISAP。
- TDEC是媒體流中任何訪問單元的最早呈現時間,可以使用從ISAU開始的位元流中的資料正確解碼,而不使用在ISAU之前的任何資料。
- TEPT是從位元流中的ISAU開始的媒體流的任何訪問單元的最早呈現時間。
- TPTF是以位元流中的解碼順序從ISAU開始的媒體流的第一個訪問單元的呈現時間。
定義了六種類型的SAP,其屬性如下:
- Type 1:TEPT=TDEC=TSAP=TPTF
- Type 2:TEPT=TDEC=TSAP<TPTF
- Type 3:TEPT<TDEC=TSAP<=TPTF
- Type 4:TEPT<=TPTF<TDEC=TSAP
- Type 5:TEPT=TDEC<TSAP
- Type 6:TEPT<TDEC<TSAP
注意SAP的類型僅取決於可正確解碼的訪問單元及其在顯示順序中的排列方式。這些類型非正式地與一些通用術語相對應:
˙類型1對應於某些編碼方案中所謂的“封閉GoP隨機訪問點”(其中,從ISAP開始,按照解碼順序,所有訪問單元都可以正確解碼,從而導致正確解碼訪問單元的沒有間隙的連續時間序列),此外,解碼順序中的該訪問單元也是顯示順序的第一個訪問單元。
˙類型2對應於某些編碼方案中稱為“封閉GoP隨機訪問點”的類型,對於該類型,從ISAU開始的媒體流中按解碼順序排列的第一個訪問單元不是按顯示順序排列的第一個訪問單元。
˙類型3對應於某些編碼方案中所謂的“開放GoP隨機訪問點”,其中在解碼順序中在ISAU之後存在一些無法正確解碼且呈現時間小於TSAP的訪問單元。
˙類型4對應於某些編碼方案中稱為“漸進解碼刷新(GDR)隨機訪問點”的類型,其中在解碼順序中從ISAU開始和在ISAU之後,某些訪問單元不能被正確解碼且呈現時間小於TSAP
˙類型5對應於以下情況:從ISAP開始,至少有一個按解碼順序的訪問單元無法正確解碼,並且呈現時間大於TDEC,並且TDEC是從ISAU開始的任何訪問單元的最早呈現時間。
˙類型6對應於以下情況:從ISAP開始,至少有一個按解碼順序的訪問單元無法正確解碼,並且呈現時間大於TDEC,並且TDEC不是從ISAU開始的任何訪問單元的最早呈現時間。
(For each SAP the properties, ISAP, TSAP, ISAU, TDEC, TEPT, and TPTF are identified and defined as:
- TSAP is the earliest presentation time of any access unit of the media stream such that all access units of the media stream with presentation time greater than or equal to TSAP can be correctly decoded using data in the Bitstream starting at ISAP and no data before ISAP.
- ISAP is the greatest position in the Bitstream such that all access units of the media stream with presentation time greater than or equal to TSAP can be correctly decoded using Bitstream data starting at ISAP and no data before ISAP.
- ISAU is the starting position in the Bitstream of the latest access unit in decoding order within the media stream such that all access units of the media stream with presentation time greater than or equal to TSAP can be correctly decoded using this latest access unit and access units following in decoding order and no access units earlier in decoding order.
NOTE ISAU is always greater than or equal to ISAP.
- TDEC is the earliest presentation time of any access unit of the media stream that can be correctly decoded using data in the Bitstream starting at ISAU and no data before ISAU.
- TEPT is the earliest presentation time of any access unit of the media stream starting at ISAU in the Bitstream.
- TPTF is the presentation time of the first access unit of the media stream in decoding order in the Bitstream starting at ISAU.
Six types of SAPs are defined with properties as follows:
- Type 1: TEPT = TDEC = TSAP = TPTF
- Type 2: TEPT = TDEC = TSAP < TPTF
- Type 3: TEPT < TDEC = TSAP <= TPTF
- Type 4: TEPT <= TPTF < TDEC = TSAP
- Type 5: TEPT = TDEC < TSAP
- Type 6: TEPT < TDEC < TSAP
NOTE The type of SAP is dependent only on which Access Units are correctly decodable and their arrangement in presentation order. The types informally correspond with some common terms:
˙ Type 1 corresponds to what is known in some coding schemes as a “Closed GoP random access point” (in which all access units, in decoding order, starting from ISAP can be correctly decoded, resulting in a continuous time sequence of correctly decoded access units with no gaps) and in addition the access unit in decoding order is also the first access unit in presentation order.
˙ Type 2 corresponds to what is known in some coding schemes as a “Closed GoP random access point”, for which the first access unit in decoding order in the media stream starting from ISAU is not the first access unit in presentation order.
˙ Type 3 corresponds to what is known in some coding schemes as an “Open GoP random access point”, in which there are some access units in decoding order following ISAU that cannot be correctly decoded and have presentation times less than TSAP.
˙ Type 4 corresponds to what is known in some coding schemes as an "Gradual Decoding Refresh (GDR) random access point”, in which there are some access units in decoding order starting from and following ISAU that cannot be correctly decoded and have presentation times less than TSAP.
˙ Type 5 corresponds to the case for which there is at least one access unit in decoding order starting from ISAP that cannot be correctly decoded and has presentation time greater than TDEC and where TDEC is the earliest presentation time of any access unit starting from ISAU.
˙ Type 6 corresponds to the case for which there is at least one access unit in decoding order starting from ISAP that cannot be correctly decoded and has presentation time greater than TDEC and where TDEC is not the earliest presentation time of any access unit starting from ISAU.)
在HEVC中,恢復點SEI(補充增強資訊)消息幫助解碼器確定在解碼器啟動隨機訪問之後或在編碼器指示CVS中的斷開鏈接之後,解碼過程何時將生成可接受的圖片以供顯示。當訪問單元以與恢復點SEI消息相關聯的解碼順序開始解碼處理時,在該SEI消息中指定的輸出順序中的恢復點處或恢復點之後的所有解碼圖片被指示為內容正確或近似正確。在與恢復點SEI消息相關聯的圖片處或之前通過隨機訪問產生的解碼圖片在內容上不需要正確,並且從與恢復點SEI消息相關聯的圖片開始的解碼過程的操作可能包含對解碼圖 片緩衝區中不可用圖片的引用。
在HEVC中,區域刷新資訊SEI消息指示當前SEI消息適用的切片片段是否屬於當前圖片的刷新區域。不是IRAP訪問單元並且包含恢復點SEI消息的訪問單元稱為漸進解碼刷新(GDR)訪問單元,其對應的圖片稱為GDR圖片。與指示的恢復點圖片相對應的訪問單元被稱為恢復點訪問單元。
在HEVC中,與從屬隨機訪問點指示SEI消息相關聯的圖片被稱為DRAP(dependent random access point,簡寫為從屬隨機訪問點)圖片。從屬隨機訪問點指示SEI消息的存在指示對圖片順序和圖片參考施加的約束。這些約束可以使解碼器能夠以解碼順序和輸出順序適當解碼DRAP圖片及其後的圖片,而無需解碼除關聯的IRAP圖片以外的任何其他圖片。
基於JVET-M1001的草案,ISOBMFF中的前三個SAP類型用IDR、CRA、RADL和RASL的圖片屬性相應地尋址,如上面更新的表7-1D中所示。然而,從系統和應用的觀點來看,期望更多類型的圖片,並且將其指定為規範信令,而不是像HEVC中那樣使用各種SEI消息。
在HEVC中,恢復點SEI消息以輸出順序指定解碼圖片的恢復點,並且區域刷新資訊SEI消息指定GDR圖片。這些對應於ISOBMFF中的SAP類型4。具有從屬隨機訪問點指示SEI消息的DRAP圖片對應於ISOBMFF中的DRAP樣本和相關的DRAP樣本分組。
具有添加IDR、CRA、RADL和RASL的相同動機,該IDR、CRA、RADL和RASL通常是較高級別的資訊,並且對於文件編寫器和系統應用程式非常有用。本發明提出如下表7-1E中那樣添加GDR_NUT和DRAP_NUT的NAL單元類型。
修改的表7-1E-NAL單元類型代碼和NAL單元類型類。
Figure 108143896-A0305-02-0027-40
Figure 108143896-A0305-02-0028-36
注-漸進解碼刷新(GDR)圖片不是IRAP圖片、CRA圖片或IDR圖片。當從GDR訪問單元開始解碼過程時,每個GDR圖片中的刷新區域被指示為內容正確或近似正確的圖片區域,並且當最後一個GDR圖片是恢復點圖片時,最後一個GDR圖片中的刷新區域覆蓋了整個圖片。
注-從屬隨機訪問點(DRAP)圖片是TRAIL_NUT圖片。除了與其關聯的IRAP圖片、CRA圖片或IDR圖片以外,它不包含對圖片的引用。以解碼順序和輸出順序在DRAP圖像之後的任何圖像均不得包含對以解碼順序或輸出順序在DRAP圖像之前的任何圖像的引用,但與DRAP圖片相關的IRAP圖像、CRA圖像或IDR圖像除外。
對應的信令在如下的NAL單元報頭結構中,同時保持報頭長度為16位元。NAL單元報頭語法
Figure 108143896-A0305-02-0028-37
Figure 108143896-A0305-02-0029-38
注-當nal_unit_type等於DRAP_NUT或GDR_NUT時,nuh_temporal_id_plus1推斷為1。多層擴展可能會在將來使用。
在以上語法設計中,如下定義了一些新的NAL單元報頭語義。
refreshed_region_flag等於1表示圖塊組屬於當前圖片中的刷新區域。
refreshed_region_flag等於0表示圖塊組可能不屬於當前圖片中的刷新區域。
最後一個GDR圖片中的刷新區域覆蓋了整個圖片。
recovery_poc_cnt按輸出順序指定解碼圖片的恢復點。recovery_poc_cnt等於0的GDR圖片是恢復點圖片。
drap_poc_cnt以輸出順序將DRAP圖片位置指定給其關聯的IRAP圖片、CRA圖片或IDR圖片。
作為一些實施例,可以將NAL單元報頭結構中的那些保留的零位元指定為附加資訊,作為HEVC中的exact_match_flag和breaked_link_flag的標誌。
前述實施例中描述的位元流可以被存儲在非暫時性計算機可讀 介質中。例如,位元流包括與多個視訊幀相對應的壓縮格式的資料,其中該資料符合語法結構,該語法結構包括NAL(網路訪問層)單元報頭中的第一語法,其中,由第一語法指示的NAL單元類型包括GDR(漸進解碼刷新)圖片類型。
第1圖示出了根據本發明實施例的用於結合了語法設計的編碼設備的示例性流程圖,其中,語法結構包括NAL(網路訪問層)單元報頭中的語法以及由第一語法指示的NAL單元類型包括GDR圖片類型。流程圖中所示的步驟以及本公開中的其他後續流程圖可被實現為可在編碼器側和/或解碼器側的一個或多個處理器(例如,一個或多個CPU)上執行的程式代碼。流程圖中所示的步驟也可以基於硬體來實現,例如被佈置為執行流程圖中的步驟的一個或多個電子設備或處理器。根據該方法,在步驟110,在編碼設備處接收視訊資料,其中,編碼設備支持GDR(漸進解碼刷新)圖片類型。在步驟120中生成在NAL(網路訪問層)單元報頭中包括第一語法的語法結構,其中由第一語法指示的NAL單元類型包括GDR圖片類型。在步驟130中生成包括來自視訊資料的語法結構的編碼視訊資料。
該方法還可以通過執行相應的相反步驟而應用於解碼設備中。例如,在解碼側,接收包括語法結構的編碼視訊資料,其中在編碼視訊資料中支持GDR(漸進解碼刷新)圖片類型。從語法結構解析NAL(網路訪問層)單元報頭中的第一語法,其中由第一語法指示的NAL單元類型包括GDR圖片類型。從包括語法結構的編碼視訊資料中生成解碼視訊資料。
上面示出的流程圖旨在示出結合了本發明實施例的用於媒體流的服務器和客戶端之間的消息傳送的示例。所屬領域具有通常知識者可以在不脫離本發明的精神的情況下修改每個步驟,重新佈置步驟,拆分步驟或組合步驟以實施本發明。
呈現以上描述是為了使所屬領域具有通常知識者能夠實踐在特 定應用及其要求的上下文中提供的本發明。對所描述的實施例的各種修改對於所屬領域具有通常知識者將是顯而易見的,並且本文中定義的一般原理可以應用於其他實施例。因此,本發明並不旨在限於所示出和描述的特定實施例,而是與與本文所公開的原理和新穎特徵相一致的最廣範圍相一致。在以上詳細描述中,示出了各種具體細節以便提供對本發明的透徹理解。然而,所屬領域具有通常知識者將理解可以實施本發明。
如上所述的本發明的實施例可以以各種硬體、軟體代碼或兩者的組合來實現。例如,本發明的實施例可以是集成到視訊壓縮晶片中的電路或集成到視訊壓縮軟體中以執行本文所述處理的程式代碼。本發明的實施例還可以是要在蘇偉信號處理器(DSP)上執行以執行本文描述的處理的程式代碼。本發明還可涉及由計算機處理器、數位信號處理器、微處理器或現場可程式化門陣列(FPGA)執行的許多功能。這些處理器可以被配置為通過執行定義本發明所體現的特定方法的機器可讀軟體代碼或韌體代碼來執行根據本發明的特定任務。可以以不同的程式化語言和不同的格式或樣式來開發軟體代碼或韌體代碼。也可以為不同的目標平台編譯軟體代碼。然而,不同的代碼格式、軟體代碼的樣式和語言以及配置代碼以執行根據本發明的任務的其他方式將不脫離本發明的精神和範圍。
在不脫離本發明的精神或基本特徵的情況下,本發明可以以其他特定形式實施。所描述的示例在所有方面僅應被認為是說明性的而非限制性的。因此,本發明的範圍由所附申請專利範圍而不是前述描述來指示。落入申請專利範圍等同含義和範圍內的所有改變均應包含在其範圍之內。
110~130:步驟

Claims (19)

  1. 一種視訊編碼方法,該方法包括:在編碼設備處接收視訊資料,其中,該編碼設備支持漸進解碼刷新圖片的網路抽象層單元類型;生成語法結構,其中該語法結構包括網路抽象層單元的網路抽象層單元報頭中的第一語法,其中,該第一語法指示從包括該漸進解碼刷新圖片的網路抽象層單元類型的一組類型中選擇的網路抽象層單元類型;該網路抽象層單元報頭中的第二語法,該第二語法指示該網路抽象層單元報頭中是否存在網路抽象層單元報頭字段資料,以及如果該第一語法指示該漸進解碼刷新圖片的網路抽象層單元類型,並且該第二語法指示在該網路抽象層單元報頭中存在該網路抽象層單元報頭字段資料,該網路抽象層單元報頭字段資料存在刷新區域標誌,則該刷新區域標誌指示該網路抽象層單元中包含的相應編碼圖片區域是否屬於當前圖片中的刷新區域;以及根據該語法結構以及該視訊資料生成該網路抽象層單元中的編碼視訊資料,其中,該漸進解碼刷新圖片的網路抽象層單元類型屬於漸進解碼刷新網路抽象層單元類型。
  2. 如申請專利範圍第1項所述之方法,其中,在該第一語法指示該漸進解碼刷新圖片的網路抽象層單元類型,並且該第二語法指示在該網路抽象層單元報頭中存在該網路抽象層單元報頭字段資料的情況下,該語法結構還包括該網路抽象層單元報頭字段資料中包含的漸進解碼刷新相關資料,該漸進 解碼刷新相關資料包括該刷新區域標誌。
  3. 如申請專利範圍第2項所述之方法,其中,該編碼圖像區域對應於編碼圖塊組。
  4. 如申請專利範圍第2項所述之方法,其中,該編碼圖像區域對應於編碼切片。
  5. 如申請專利範圍第1項所述之方法,其中,該漸進解碼刷新相關資料包括漸進解碼刷新圖片計數語法,以指示在輸出順序中在恢復點之前的當前和後續解碼的漸進解碼刷新圖片的數量。
  6. 如申請專利範圍第1項所述之方法,其中,該漸進解碼刷新相關資料包括恢復圖片計數,以按輸出順序指定解碼圖像的恢復點。
  7. 如申請專利範圍第1項所述之方法,其中,該組類型包括從屬隨機訪問點圖片類型。
  8. 如申請專利範圍第1項所述之方法,其中,該組類型包括幀內隨機訪問點圖片類型。
  9. 一種視訊編碼裝置,該裝置包括一個或多個電子電路或處理器,被佈置為:在編碼設備處接收視訊資料,其中,該編碼裝置支持漸進解碼刷新圖片的網路抽象層單元類型;生成語法結構,其中該語法結構包括網路抽象層單元的網路抽象層單元報頭中的第一語法,其中,該第一語法指示從包括該漸進解碼刷新圖片的網路抽象層單元類型的一組類型中選擇的網路抽象層單元類型;該網路抽象層單元報頭中的第二語法,該第二語法指示該網路抽象層單元報頭中是否存在網路抽象層單元報頭字段資料,以及 如果該第一語法指示該漸進解碼刷新圖片的網路抽象層單元類型,並且該第二語法指示在該網路抽象層單元報頭中存在該網路抽象層單元報頭字段資料,該網路抽象層單元報頭字段資料存在刷新區域標誌,則該刷新區域標誌指示該網路抽象層單元中包含的相應編碼圖片區域是否屬於當前圖片中的刷新區域;以及根據該語法結構以及該視訊資料生成該網路抽象層單元中的編碼視訊資料,其中,該漸進解碼刷新圖片的網路抽象層單元類型屬於漸進解碼刷新網路抽象層單元類型。
  10. 一種視訊解碼方法,該方法包括:藉由解碼設備接收依據語法結構在網路抽象層單元安排的編碼視訊資料,其中,該解碼設備中支持漸進解碼刷新圖片類型;解析該語法結構以獲得該網路抽象層單元的網路抽象層單元報頭中的第一語法,其中,該第一語法指示從包括該漸進解碼刷新圖片的網路抽象層單元類型的一組類型中選擇的網路抽象層單元類型,該網路抽象層單元報頭中的第二語法,該第二語法指示該網路抽象層單元報頭中是否存在網路抽象層單元報頭字段資料,以及如果該第一語法指示該漸進解碼刷新圖片的網路抽象層單元類型,並且該第二語法指示在該網路抽象層單元報頭中存在該網路抽象層單元報頭字段資料,該網路抽象層單元報頭字段資料存在刷新區域標誌,則該刷新區域標誌指示該網路抽象層單元中包含的相應編碼圖片區域是否屬於當前圖片中的刷新區域;以及依據該第一語法元素、第二語法元素和該刷新區域標誌中的一個或多個從 該編碼視訊資料中生成解碼視訊資料,其中,該漸進解碼刷新圖片的網路抽象層單元類型屬於漸進解碼刷新網路抽象層單元類型。
  11. 如申請專利範圍第10項所述之方法,其中,在該第一語法指示該漸進解碼刷新圖片的網路抽象層單元類型,並且該第二語法指示在該網路抽象層單元報頭中存在該網路抽象層單元報頭字段資料的情況下,該語法結構還包括該網路抽象層單元報頭字段資料中包含的漸進解碼刷新相關資料,該漸進解碼刷新相關資料包括該刷新區域標誌。
  12. 如申請專利範圍第11項所述之方法,其中,該編碼圖像區域對應於編碼圖塊組。
  13. 如申請專利範圍第11項所述之方法,其中,該編碼圖像區域對應於編碼切片。
  14. 如申請專利範圍第10項所述之方法,其中,該漸進解碼刷新相關資料包括漸進解碼刷新圖片計數語法,以指示按照輸出順序在恢復點之前的當前和後續解碼的漸進解碼刷新圖片的數量。
  15. 如申請專利範圍第10項所述之方法,其中,該漸進解碼刷新相關資料包括恢復圖片計數,以按輸出順序指定解碼圖像的恢復點。
  16. 如申請專利範圍第10項所述之方法,其中,該網路抽象層單元類型包括從屬隨機訪問點圖片類型。
  17. 如申請專利範圍第10項所述之方法,其中,該網路抽象層單元類型包括幀內隨機訪問點圖片類型。
  18. 一種視訊解碼裝置,該裝置包括一個或多個電子電路或處理器,該電子電路或處理器被佈置為:接收依據語法結構在網路抽象層單元安排的編碼視訊資料,其中,該裝置 中支持漸進解碼刷新圖片的網路抽象層單元類型;解析該語法結構以獲得該網路抽象層單元的網路抽象層單元報頭中的第一語法,其中,該第一語法指示從包括該漸進解碼刷新圖片的網路抽象層單元類型的一組類型中選擇的網路抽象層單元類型,該網路抽象層單元報頭中的第二語法,該第二語法指示該網路抽象層單元報頭中是否存在網路抽象層單元報頭字段資料,以及如果該第一語法指示該漸進解碼刷新圖片的網路抽象層單元類型,並且該第二語法指示在該網路抽象層單元報頭中存在該網路抽象層單元報頭字段資料,該網路抽象層單元報頭字段資料存在刷新區域標誌,則該刷新區域標誌指示該網路抽象層單元中包含的相應編碼圖片區域是否屬於當前圖片中的刷新區域;以及依據該第一語法元素、第二語法元素和該刷新區域標誌中的一個或多個從該編碼視訊資料中生成解碼視訊資料,其中,該漸進解碼刷新圖片的網路抽象層單元類型屬於漸進解碼刷新網路抽象層單元類型。
  19. 一種非臨時性計算機可讀介質,其存儲程式代碼,一個或多個處理器執行該程式代碼時,使得該一個或多個處理器執行解碼處理,該解碼處理包括:接收依據語法結構在網路抽象層單元安排的編碼視訊資料,其中,該裝置中支持漸進解碼刷新圖片的網路抽象層單元類型;解析該語法結構以獲得該網路抽象層單元的網路抽象層單元報頭中的第一語法,其中,該第一語法指示從包括該漸進解碼刷新圖片的網路抽象層單元類型的一組類型中選擇的 網路抽象層單元類型,該網路抽象層單元報頭中的第二語法,該第二語法指示該網路抽象層單元報頭中是否存在網路抽象層單元報頭字段資料,以及如果該第一語法指示該漸進解碼刷新圖片的網路抽象層單元類型,並且該第二語法指示在該網路抽象層單元報頭中存在該網路抽象層單元報頭字段資料,該網路抽象層單元報頭字段資料存在刷新區域標誌,則該刷新區域標誌指示該網路抽象層單元中包含的相應編碼圖片區域是否屬於當前圖片中的刷新區域;以及依據該第一語法元素、第二語法元素和該刷新區域標誌中的一個或多個從該編碼視訊資料中生成解碼視訊資料,其中,該漸進解碼刷新圖片的網路抽象層單元類型屬於漸進解碼刷新網路抽象層單元類型。
TW108143896A 2018-12-03 2019-12-02 用於發信新元素的nal單元報頭結構的方法和系統 TWI807138B (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US201862774351P 2018-12-03 2018-12-03
US62/774,351 2018-12-03
US201862774901P 2018-12-04 2018-12-04
US62/774,901 2018-12-04
US201962816292P 2019-03-11 2019-03-11
US62/816,292 2019-03-11
US16/699,272 2019-11-29
US16/699,272 US10972755B2 (en) 2018-12-03 2019-11-29 Method and system of NAL unit header structure for signaling new elements

Publications (2)

Publication Number Publication Date
TW202029775A TW202029775A (zh) 2020-08-01
TWI807138B true TWI807138B (zh) 2023-07-01

Family

ID=70849536

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108143896A TWI807138B (zh) 2018-12-03 2019-12-02 用於發信新元素的nal單元報頭結構的方法和系統

Country Status (2)

Country Link
US (1) US10972755B2 (zh)
TW (1) TWI807138B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112021012096A2 (pt) * 2018-12-20 2021-09-08 Telefonaktiebolaget Lm Ericsson (Publ) Métodos para decodificar e codificar um fluxo contínuo de bits, portadora, e, aparelhos de decodificação e codificação para decodificar e codificar um fluxo contínuo de bits
CN113557733A (zh) 2019-03-11 2021-10-26 华为技术有限公司 视频译码中的逐步解码刷新
US11265580B2 (en) * 2019-03-22 2022-03-01 Tencent America LLC Supplemental enhancement information messages for neural network based video post processing
US11902546B2 (en) * 2019-06-19 2024-02-13 Sharp Kabushiki Kaisha Systems and methods for signaling network abstraction layer unit information in video coding
US11457242B2 (en) * 2019-06-24 2022-09-27 Qualcomm Incorporated Gradual random access (GRA) signalling in video coding
WO2021134018A1 (en) 2019-12-26 2021-07-01 Bytedance Inc. Signaling of decoded picture buffer parameters in layered video
EP4062635A4 (en) 2019-12-26 2022-12-28 ByteDance Inc. CONSTRAINTS ON SIGNALING VIDEO LAYERS IN ENCODED BITSTREAMS
KR20220113404A (ko) 2019-12-27 2022-08-12 바이트댄스 아이엔씨 비디오 서브픽처들을 시그널링하기 위한 신택스
WO2021142369A1 (en) * 2020-01-09 2021-07-15 Bytedance Inc. Signalling of the wavefront parallel processing
CN115606183A (zh) * 2020-04-07 2023-01-13 抖音视界有限公司(Cn) 参考图片环绕的剪裁操作
CN115668917A (zh) 2020-04-09 2023-01-31 抖音视界有限公司 视频编解码中的去块信令通知
WO2021204251A1 (en) 2020-04-10 2021-10-14 Beijing Bytedance Network Technology Co., Ltd. Use of header syntax elements and adaptation parameter set
WO2021209061A1 (en) 2020-04-17 2021-10-21 Beijing Bytedance Network Technology Co., Ltd. Presence of adaptation parameter set units
WO2021222036A1 (en) 2020-04-26 2021-11-04 Bytedance Inc. Conditional signaling of video coding syntax elements
KR20230025787A (ko) 2020-06-22 2023-02-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 코딩된 비디오에서 양자화 정보의 시그널링
US11962936B2 (en) * 2020-09-29 2024-04-16 Lemon Inc. Syntax for dependent random access point indication in video bitstreams
CN116547971A (zh) * 2020-10-26 2023-08-04 抖音视界有限公司 Vvc视频编解码中的滚动样点组
EP4300957A1 (en) * 2022-06-30 2024-01-03 Nokia Technologies Oy A method, an apparatus and a computer program product for implementing gradual decoding refresh

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130114735A1 (en) * 2011-11-04 2013-05-09 Qualcomm Incorporated Video coding with network abstraction layer units that include multiple encoded picture partitions
US20140092963A1 (en) * 2012-09-28 2014-04-03 Qualcomm Incorporated Signaling of regions of interest and gradual decoding refresh in video coding
US20140192897A1 (en) * 2013-01-07 2014-07-10 Qualcomm Incorporated Gradual decoding refresh with temporal scalability support in video coding
US20160219273A1 (en) * 2014-06-18 2016-07-28 Telefonaktiebolaget L M Ericsson (Publ) Robust encoding and decoding of pictures in video

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability
US9648325B2 (en) * 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
KR101851479B1 (ko) * 2014-01-03 2018-04-23 노키아 테크놀로지스 오와이 파라미터 세트 코딩

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130114735A1 (en) * 2011-11-04 2013-05-09 Qualcomm Incorporated Video coding with network abstraction layer units that include multiple encoded picture partitions
US20140092963A1 (en) * 2012-09-28 2014-04-03 Qualcomm Incorporated Signaling of regions of interest and gradual decoding refresh in video coding
US20140192897A1 (en) * 2013-01-07 2014-07-10 Qualcomm Incorporated Gradual decoding refresh with temporal scalability support in video coding
US20160219273A1 (en) * 2014-06-18 2016-07-28 Telefonaktiebolaget L M Ericsson (Publ) Robust encoding and decoding of pictures in video

Also Published As

Publication number Publication date
TW202029775A (zh) 2020-08-01
US20200177923A1 (en) 2020-06-04
US10972755B2 (en) 2021-04-06

Similar Documents

Publication Publication Date Title
TWI807138B (zh) 用於發信新元素的nal單元報頭結構的方法和系統
US10893288B2 (en) Decoders and methods thereof for managing pictures in video decoding process
US8615038B2 (en) Video coding, decoding and hypothetical reference decoder
US11997313B2 (en) Dependent random access point pictures
US9774927B2 (en) Multi-layer video stream decoding
EP2837189B1 (en) Devices for identifying a leading picture
US20140126640A1 (en) Absolute or Explicit Reference Picture Signaling
US8731065B2 (en) Dynamic image stream processing method and device, and dynamic image reproduction device and dynamic image distribution device using the same
US20240056586A1 (en) Arrangements and methods of encoding picture belonging to a temporal level
JP2022042506A (ja) メディアファイルのためのブランド
US20140003520A1 (en) Differentiating Decodable and Non-Decodable Pictures After RAP Pictures
EP2936809B1 (en) Multi-layer video stream decoding