TWI777601B - 靜止圖像設定檔之偵測 - Google Patents
靜止圖像設定檔之偵測 Download PDFInfo
- Publication number
- TWI777601B TWI777601B TW110120597A TW110120597A TWI777601B TW I777601 B TWI777601 B TW I777601B TW 110120597 A TW110120597 A TW 110120597A TW 110120597 A TW110120597 A TW 110120597A TW I777601 B TWI777601 B TW I777601B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- profile
- decoder
- picture
- bitstream
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 60
- 238000012545 processing Methods 0.000 claims description 67
- 230000015654 memory Effects 0.000 claims description 48
- 230000004044 response Effects 0.000 claims description 44
- 238000004590 computer program Methods 0.000 claims description 17
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 claims 6
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 claims 6
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 11
- 230000002123 temporal effect Effects 0.000 description 9
- 241000023320 Luma <angiosperm> Species 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本發明提供一種用於判定符合一第一設定檔之一解碼器能夠解碼符合一第二設定檔之一視訊位元流之一第一圖像之方法及解碼器。該方法包含獲得(601)一指示值,該指示值指示符合一設定檔。該方法包含判定(603)該視訊位元流中之該第一圖像是否為一靜止圖像。該方法包含回應於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像(705),判定符合該第一設定檔之該解碼器能夠解碼該視訊位元流之該第一圖像。
Description
本申請案係關於用於視訊編碼及解碼之方法及設備。
HEVC及VVC
高效率視訊寫碼(HEVC)係由ITU-T (國際電信聯盟電信標準化部門)及MPEG (動畫專家群)標準化之一基於區塊之視訊編解碼器,其利用時間及空間預測兩者。使用來自當前圖像內之框內(I)預測來達成空間預測。使用來自先前解碼之參考圖像之區塊層級上之單向(P)或雙向框間(B)預測來達成時間預測。在編碼器中,將原始像素資料與經預測像素資料之間的差異(被稱為殘差)變換至頻域中,對該差異進行量化且接著在與必要預測參數(諸如預測模式及運動向量)一起傳輸之前進行熵寫碼,該等必要預測參數亦經熵寫碼。解碼器執行熵解碼、逆量化及逆變換以獲得殘差,且接著將殘差添加至一框內或框間預測以重建一圖像。
MPEG及ITU-T正在聯合視訊探索小組(JVET)內研究HEVC之後繼者。正在開發之此視訊編解碼器之名稱係多功能視訊寫碼(VVC)。VVC規範之當前版本係JVET-S0152-v5。
分量
一視訊序列由一系列影像組成,其中各影像由一或多個分量組成。各分量可被描述為樣本值之二維矩形陣列。通常,一視訊序列中之一影像由三個分量組成:一個亮度分量Y,其中樣本值係亮度值;及兩個色度分量Cb及Cr,其中樣本值係色度值。通常,在各維度中,色度分量之大小比亮度分量小1/2。例如,一高清晰度(HD)影像之亮度分量之大小將為1920x1080且色度分量將各自具有960x540之尺寸。色度分量有時被稱為色彩分量。
區塊及單元
一區塊係二維樣本陣列。在視訊寫碼中,將各分量分割為區塊,且經寫碼視訊位元流由一系列區塊組成。通常,在視訊寫碼中,將影像分割為覆蓋影像之一特定區域之單元。各單元由來自組成該特定區域之全部分量之全部區塊組成且各區塊屬於一個單元。H.264中之巨集區塊及高效率視訊寫碼(HEVC)中之寫碼單元(CU)及VVC之當前版本係單元之實例。CU可遞迴地分割為更小CU。頂部層級處之CU被稱為寫碼樹單元(CTU)。
一區塊可替代地被定義為二維陣列,在寫碼中使用之一變換應用於該二維陣列。以名稱「變換區塊」指涉此等區塊。替代地,一區塊可被定義為二維陣列,一單一預測模式應用於該二維陣列。此等區塊可被稱為「預測區塊」。在此應用中,術語「區塊」不束縛於此等定義之任何特定者,因為本文中之描述可應用於任一定義。
NAL單元
HEVC及VVC兩者定義一網路抽象層(NAL)。HEVC及VVC中之全部資料(即,視訊寫碼層(VCL)或非VCL資料兩者)封裝於NAL單元中。一VCL NAL單元含有表示圖像樣本值之資料。一非VCL NAL單元含有額外相關聯資料,諸如參數集及補充增強資訊(SEI)訊息。HEVC及VVC之當前版本中之NAL單元以稱為NAL單元標頭之一標頭起始。HEVC及VVC之當前版本之NAL單元標頭之語法以一forbidden_zero_bit起始,forbidden_zero_bit應始終等於0以防止起始碼模擬。在不具有forbidden_zero_bit的情況下,一些MPEG系統可能將HEVC視訊位元流及VVC視訊位元流與其他資料混淆,但NAL單元標頭中之0位元使得全部可能HEVC位元流及VVC位元流可唯一地識別為HEVC位元流或VVC位元流。nal_unit_type、nuh_layer_id及nuh_temporal_id_plus1碼字指定NAL單元之NAL單元類型,其識別NAL單元中攜載什麼類型之資料、NAL單元所屬之層ID及時間ID。NAL單元類型指示且指定應如何剖析及解碼NAL單元。VVC之當前版本中之NAL單元標頭(在表1中展示)非常類似於HEVC中之NAL單元標頭,但nal_unit_type少使用1個位元且代替性地保留此位元以供未來使用。
NAL單元之其餘位元組係由NAL單元類型指示之類型之酬載。一位元流由一系列串接(concatenated) NAL單元組成。
表1-VVC NAL單元標頭語法
Nal_unit_header( ) { | 描述符 |
forbidden_zero_bit | f(1) |
nuh_reserved_zero_bit | u(6) |
nuh_layer_id | u(6) |
nal_unit_type | u(5) |
nuh_temporal_id_plus1 | u(3) |
} |
一解碼器或位元流剖析器可在查看NAL單元標頭之後斷定應如何處置(例如,剖析及解碼) NAL單元。NAL單元之其餘位元組係由NAL單元類型指示之類型之酬載。一位元流由一系列串接NAL單元組成。
解碼順序係NAL單元應被解碼之順序,其相同於位元流內之NAL單元之順序。解碼順序可不同於輸出順序,輸出順序係藉由解碼器輸出經解碼圖像諸如用於顯示之順序。
NAL單元類型指示且定義應如何剖析及解碼NAL單元。一VCL NAL單元提供關於當前圖像之圖像類型之資訊。在表2中展示VVC草案之當前版本之NAL單元類型。
表2-VVC草案之當前版本中之NAL單元類型
nal_unit_type | nal_unit_type 之名稱 | NAL 單元及RBSP 語法結構之內容 | NAL 單元 類型類別 |
0 | TRAIL_NUT | 一尾隨圖像或子圖像之經寫碼圖塊(slice)* slice_layer_rbsp( ) | VCL |
1 | STSA_NUT | 一STSA圖像或子圖像之經寫碼圖塊* slice_layer_rbsp( ) | VCL |
2 | RADL_NUT | 一RADL圖像或子圖像之經寫碼圖塊* slice_layer_rbsp( ) | VCL |
3 | RASL_NUT | 一RASL圖像或子圖像之經寫碼圖塊* slice_layer_rbsp( ) | VCL |
4..6 | RSV_VCL_4.. RSV_VCL_6 | 保留非IRAP VCL NAL單元類型 | VCL |
7 8 | IDR_W_RADL IDR_N_LP | 一IDR圖像或子圖像之經寫碼圖塊* slice_layer_rbsp( ) | VCL |
9 | CRA_NUT | 一CRA圖像或子圖像之經寫碼圖塊* slice_layer_rbsp( ) | VCL |
10 | GDR_NUT | 一GDR圖像或子圖像之經寫碼圖塊* slice_layer_rbsp( ) | VCL |
11 12 | RSV_IRAP_11 RSV_IRAP_12 | 保留IRAP VCL NAL單元類型 | VCL |
13 | DCI_NUT | 解碼能力資訊 decoding_capability_information_rbsp( ) | 非VCL |
14 | VPS_NUT | 視訊參數集 video_parameter_set_rbsp( ) | 非VCL |
15 | SPS_NUT | 序列參數集 seq_parameter_set_rbsp( ) | 非VCL |
16 | PPS_NUT | 圖像參數集 pic_parameter_set_rbsp( ) | 非VCL |
17 18 | PREFIX_APS_NUT SUFFIX_APS_NUT | 適應參數集 adaptation_parameter_set_rbsp( ) | 非VCL |
19 | PH_NUT | 圖像標頭 picture_header_rbsp( ) | 非VCL |
20 | AUD_NUT | AU定界符 access_unit_delimiter_rbsp( ) | 非VCL |
21 | EOS_NUT | 序列結束 end_of_seq_rbsp( ) | 非VCL |
22 | EOB_NUT | 位元流結束 end_of_bitstream_rbsp( ) | 非VCL |
23 24 | PREFIX_SEI_NUT SUFFIX_SEI_NUT | 補充增強資訊 sei_rbsp( ) | 非VCL |
25 | FD_NUT | 填充符資料(Filler data) filler_data_rbsp( ) | 非VCL |
26 27 | RSV_NVCL_26 RSV_NVCL_27 | 保留非VCL NAL單元類型 | 非VCL |
28..31 | UNSPEC_28.. UNSPEC_31 | 未指定非VCL NAL單元類型 | 非VCL |
*指示當pps_mixed_nalu_types_in_pic_flag等於0時之一圖像之一性質及當pps_mixed_nalu_types_in_pic_flag等於1時之子圖像之一性質。 |
時間層
在HEVC中且在VVC草案之當前版本中,全部圖像皆與指定圖像屬於什麼時間層之一TemporalId值相關聯。從NAL單元標頭中之nuh_temporal_id_plus1語法元素解碼TemporalId值。在HEVC中,要求編碼器設定TemporalId值,使得當丟棄較高時間層時,屬於一較低層之圖像係完全可解碼的。例如,假定一編碼器已使用時間層0、1及2輸出一位元流。則移除全部層2之NAL單元或移除全部層1及2之NAL單元將導致可毫無問題地解碼之位元流。此藉由編碼器必須遵守之HEVC規範及VVC規範中之限制來確保。例如,不容許一時間層之一圖像參考一較高時間層之一圖像。
圖像單元、存取單元及存取單元定界符
VVC之當前版本中之一圖像單元(PU)被定義為其中VCL NAL單元全部屬於相同層之一組NAL單元,其等根據一指定分類規則彼此相關聯,在解碼順序上連續,且恰好含有一個經寫碼圖像。在VVC之先前版本中,PU被稱為層存取單元。在HEVC中,PU被稱為一存取單元(AU)。
在VVC中,一存取單元係屬於不同層且含有與從經解碼圖像緩衝器(DPB)輸出之相同時間相關聯(即,具有相同POC值)之經寫碼圖像的一組PU。
在VVC之當前版本中,一存取單元可以一存取單元定界符(AUD) NAL單元起始,該AUD NAL單元指示存取單元之起始及經寫碼圖像中容許之圖塊(slice)之類型(即,I、I-P或I-P-B)以及存取單元是否為一IRAP或GDR存取單元。在HEVC中,一存取單元以一AUD起始係選用的。下文在表3中展示VVC草案之當前版本中之存取單元定界符NAL單元之語法及語義。
表3-VVC草案之當前版本中之存取單元定界符RBSP語法
access_unit_delimiter_rbsp( ) { | 描述符 |
aud_irap_or_gdr_au_flag | u(1) |
aud_pic_type | u(3) |
rbsp_trailing_bits( ) | |
} |
等於1之aud_irap_or_gdr_au_flag
指定含有AU定界符之AU係一IRAP或GDR AU。等於0之aud_irap_or_gdr_au_flag指定含有AU定界符之AU並非一IRAP或GDR AU。
aud_pic_type
指示含有AU定界符NAL單元之AU中之經寫碼圖像之全部圖塊之sh_slice_type值係表4中針對aud_pic_type之給定值列出之集合之成員。aud_pic_type之值在位元流中應等於0、1或2。aud_pic_type之其他值經保留以供ITU‑T | ISO/IEC未來使用。符合此規範之此版本之解碼器應忽略aud_pic_type之保留值。
表4-aud_pic_type之解譯
aud_pic_type | 可存在於 AU 中之 sh_slice_type 值 |
0 | I |
1 | P, I |
2 | B, P, I |
層-相依及獨立層
層在VVC中被定義為全部具有nuh_layer_id之一特定值之一組VCL NAL單元及相關聯非VCL NAL單元。
VVC之當前版本中之一經寫碼層視訊序列(CLVS)被定義為以解碼順序由一CLVS起始(CLVSS) PU,其後接著並非CLVSS PU之零或多個PU,包含全部後續PU直至但不包含作為一CLVSS PU之任何後續PU組成的一PU序列。
在圖1中繪示PU、AU及CLVS之間的關係。
在VVC之當前版本中,層可彼此獨立地寫碼,即,具有例如nuh_layer_id 0之一層可不預測來自具有例如nuh_layer_id 1之另一層之視訊資料。在VVC之當前版本中,亦可使用層之間的相依寫碼,此實現支援具有SNR、空間及視圖可擴展性之可擴展寫碼。
圖像順序計數(POC)
HEVC中之圖像藉由其等之圖像順序計數(POC)值(亦被稱為全POC值)識別。各圖塊含有一碼字pic_order_cnt_lsb,該碼字針對一圖像中之全部圖塊皆應相同。pic_order_cnt_lsb亦被稱為全POC之最低有效位元(lsb),此係因為其係一固定長度碼字且僅傳訊全POC之最低有效位元。編碼器及解碼器兩者追蹤POC且將POC值指派給所編碼/解碼之各圖像。可藉由4至16個位元傳訊pic_order_cnt_lsb。存在用於HEVC中之一變數MaxPicOrderCntLsb,該變數被設定為最大pic_order_cnt_lsb值加1。此意謂,若使用8個位元來傳訊pic_order_cnt_lsb,則最大值係255且MaxPicOrderCntLsb被設定為2^8 = 256。一圖像之圖像順序計數值在HEVC中被稱為PicOrderCntVal。通常,當前圖像之PicOrderCntVal簡稱為PicOrderCntVal。期望POC在VVC之最終版本中以一類似方式工作。
框內隨機存取點(IRAP)圖像及經寫碼視訊序列(CVS)
HEVC中之一框內隨機存取點(IRAP)圖像係在其解碼程序中不參考除自身以外之任何圖像進行預測之一圖像。HEVC中呈解碼順序之位元流中之第一圖像必須為一IRAP圖像,但一IRAP圖像亦可額外地更晚出現在位元流中。HEVC指定三種類型之IRAP圖像,斷鏈存取(broken link access) (BLA)圖像、瞬時解碼器再新(instantaneous decoder refresh) (IDR)圖像及乾淨隨機存取(clean random access) (CRA)圖像。
HEVC中之一經寫碼視訊序列(CVS)係以解碼順序以一IRAP存取單元起始,其後接著零或多個AU直至但不包含下一IRAP存取單元的一存取單元序列。
IDR圖像始終起始一新的CVS。一IDR圖像可具有相關聯隨機存取可解碼前導(RADL)圖像。一IDR圖像不具有相關聯隨機存取經跳過前導(RASL)圖像。
HEVC中之一BLA圖像亦起始一新的CVS,且對解碼程序具有與一IDR圖像相同之效應。然而,HEVC中之一BLA圖像可含有指定一組非空參考圖像之語法元素。一BLA圖像可具有相關聯RASL圖像,該等相關聯RASL圖像並非由解碼器輸出且可能無法解碼,此係因為其等可含有對可能不存在於位元流中之圖像之參考。一BLA圖像亦可具有經解碼之相關聯RADL圖像。未在VVC之當前版本中定義BLA圖像。
一CRA圖像可具有相關聯RADL或RASL圖像。正如一BLA圖像,一CRA圖像可含有指定一組非空參考圖像之語法元素。針對CRA圖像,可設定一旗標以指定相關聯RASL圖像並非由解碼器輸出,此係因為其等可能為無法解碼的,因為其等可含有對不存在於位元流中之圖像之參考。一CRA可起始一CVS。
在VVC草案之當前版本中,一CVS係以解碼順序以一CVS起始(CVSS)存取單元起始,其後接著零或多個AU直至但不包含下一CVSS存取單元的一存取單元序列。一CVSS存取單元可含有一IRAP圖像,即,一IDR或一CRA圖像,或一逐漸解碼再新(gradual decoding refresh) (GDR)圖像。一CVS可含有一或多個CLVS。
GDR圖像基本上用於針對低延遲寫碼進行編碼之位元流中之隨機存取,其中一全IRAP圖像將引起過多延遲。一GDR圖像可使用逐圖像更新視訊之逐漸框內再新,其中各圖像僅為部分框內寫碼的。鑑於在GDR圖像處調諧位元流,與GDR圖像一起傳訊一恢復POC計數,其指定視訊何時完全再新且準備好輸出。VVC中之一GDR圖像可起始一CVS或CLVS。GDR圖像包含於當前VVC草案中但並非HEVC標準之一規範部分,其中其代替性地可用一SEI訊息來指示。
圖塊
HEVC中之圖塊概念將圖像劃分為獨立寫碼之圖塊,其中一圖像中之一個圖塊之解碼獨立於相同圖像之其他圖塊。在VVC草案規範之一先前版本中,圖塊被稱為影像塊(tile)群組。
圖塊之一個目的係在資料丟失之情況中啟用再同步。在HEVC中,一圖塊係一組CTU。在VVC之當前版本中亦支援圖塊,且一VVC圖像可被分割為光柵掃描圖塊抑或矩形圖塊。一光柵掃描圖塊由呈光柵掃描順序之若干完整影像塊組成。一矩形圖塊由一群組影像塊組成,該等影像塊在一起佔據圖像中之一矩形區域或一個影像塊內部之連續數目個CTU列。各圖塊具有包括語法元素之一圖塊標頭。在解碼圖塊時使用來自此等語法元素之經解碼圖塊標頭值。各圖塊攜載於一個VCL NAL單元中。
各圖塊具有定義由圖塊使用之寫碼類型(即,預測類型)之一圖塊類型,即,一圖塊是否為一框內預測經寫碼I圖塊、單向預測經寫碼P圖塊或一雙向預測經寫碼B圖塊。在圖塊標頭中用一slice_type語法元素傳訊圖塊類型,該語法元素可具有表5中之以下值之一者:
表5-與slice_type之名稱關聯
slice_type | slice_type 之名稱 |
0 | B (B圖塊) |
1 | P (P圖塊) |
2 | I (I圖塊) |
一圖像可由不同圖塊類型之圖塊組成。然而,具有一特定pic_type值或NAL單元類型之一圖像可限於僅支援I圖塊或僅支援I圖塊及P圖塊。例如,AUD中之具有一IRAP NAL單位類型之一圖像或具有等於0之pic_type之一圖像應僅含有I圖塊,且AUD中之具有等於1之pic_type之一圖像可僅含有I圖塊及P圖塊,而具有等於2之pic_type之一圖像可含有任何圖塊類型之圖塊,即,I圖塊、P圖塊或B圖塊。
在表6中繪示與理解本文中描述之發明概念相關之VVC之當前版本中之圖塊標頭語法之部分。
表6-圖塊標頭語法
slice_header( ) { | 描述符 |
picture_header_in_slice_header_flag | u(1) |
if( picture_header_in_slice_header_flag ) | |
picture_header_structure( ) | |
… | |
if( ph_inter_slice_allowed_flag ) | |
slice_type | ue(v) |
… | |
} |
參數集
HEVC及VVC指定三種類型之參數集:圖像參數集(PPS)、序列參數集(SPS)及視訊參數集(VPS)。PPS含有對一整個圖像共同之資料,SPS含有對一經寫碼視訊序列(CVS)共同之資料,且VPS含有對多個CVS共同之資料,例如,用於位元流中之多個層之資料。
VVC之當前版本亦指定一個額外參數集,適應參數集(APS)。APS攜載一適應性迴路濾波器(ALF)工具、一亮度映射及色度縮放(LMCS)工具以及一縮放清單工具所需之參數。
解碼能力資訊(DCI)
DCI指定在解碼工作階段期間可能不改變且可對解碼器瞭解例如最大數目之所容許子層有用的資訊。DCI中之資訊對於解碼程序之操作並非必要的。在VVC規範之先前草案中,DCI被稱為解碼參數集(DPS)。在本文中之描述中,DCI被定義為一參數集。
解碼能力資訊亦含有對位元流之一組通用約束,其給出在寫碼工具、NAL單元類型等方面從位元流期望什麼之解碼器資訊。在VVC之當前版本中,亦可在VPS或SPS中傳訊通用約束資訊。
圖像標頭
在VVC之當前版本中,一經寫碼圖像含有一圖像標頭。圖像標頭含有對相關聯圖像之全部圖塊共同之語法元素。鑑於經寫碼圖像中僅存在一個圖塊,圖像標頭可在其自身之NAL單元中用NAL單元類型PH_NUT傳訊或包含於圖塊標頭中。此藉由圖塊標頭語法元素picture_header_in_slice_header_flag指示,其中等於1之一值指定圖像標頭包含於圖塊標頭中,且等於0之一值指定圖像標頭攜載於其自身之NAL單元中。針對其中並非全部圖像皆為單圖塊圖像之一CVS,各經寫碼圖像前面必須為在其自身之NAL單元中傳訊之一圖像標頭。HEVC不支援圖像標頭。
在表7中展示與理解本文中描述之發明概念相關之VVC之當前版本中之圖像標頭語法及語義之部分。
表7-圖像標頭語法
picture_header_structure( ) { | 描述符 |
ph_gdr_or_irap_pic_flag | u(1) |
ph_non_ref_pic_flag | u(1) |
if( ph_gdr_or_irap_pic_flag ) | |
ph_gdr_pic_flag | u(1) |
… | |
} |
等於1之ph_gdr_or_irap_pic_flag
指定當前圖像係一GDR或IRAP圖像。等於0之ph_gdr_or_irap_pic_flag指定當前圖像並非一GDR圖像且可為或可能並非一IRAP圖像。
等於1之ph_gdr_pic_flag
指定與PH相關聯之圖像係一GDR圖像。等於0之ph_gdr_pic_flag指定與PH相關聯之圖像並非一GDR圖像。當不存在時,ph_gdr_pic_flag之值被推斷為等於0。當sps_gdr_enabled_flag等於0時,ph_gdr_pic_flag之值應等於0。
註釋1-當ph_gdr_or_irap_pic_flag等於1且ph_gdr_pic_flag等於0時,與PH相關聯之圖像係一IRAP圖像。
設定檔、階層及層級
HEVC及VVC中之一設定檔被定義為規範之語法之一指定子集。
當前VVC規範包括Main 10設定檔、Main 10靜止圖像設定檔、Main 4:4:4 10設定檔及Main 4:4:4 10靜止圖像設定檔,其中10指示支援每像素10個位元之一位元深度且4:4:4指示支援4:4:4色度之經取樣像素。Main 10及Main 4:4:4 10係視訊設定檔,而Main 10靜止圖像及Main 4:4:4 10靜止圖像設定檔係靜止圖像設定檔。HEVC亦包括此四個設定檔及另外若干範圍擴展設定檔及可縮放設定檔。
HEVC及VVC將一層級定義為對可由規範之語法元素及變數採取之值之一組經定義約束。針對全部設定檔定義相同組層級,其中各層級之定義之大多數態樣在不同設定檔中係共同的。在指定約束內,個別實施方案可支援各所支援設定檔之一不同層級。
HEVC及VVC將一階層定義為對位元流中之語法元素之值施加之一指定類別之層級約束。層級約束巢套於一階層內,且符合一特定階層及層級之一解碼器能夠解碼符合該層級之相同階層或較低階層或其下方之任何層級的全部位元流。
Main 10及Main 10靜止圖像設定檔在VVC之當前版本中定義如下:
Main 10及Main 10靜止圖像設定檔
符合Main 10或Main 10靜止圖像設定檔之位元流應遵守以下約束:
- 在符合Main 10靜止圖像設定檔之一位元流中,位元流應僅含有一個圖像。
- 所參考SPS應具有等於0或1之sps_chroma_format_idc。
- 所參考SPS應具有在0至2 (包含端值)之範圍內之sps_bitdepth_minus8。
- 在符合Main 10靜止圖像設定檔之一位元流中,所參考SPS應具有等於0之max_dec_pic_buffering_minus1[ sps_max_sublayers_minus1 ]。
- 所參考SPS應具有等於0之sps_palette_enabled_flag。
- 在符合Main 10設定檔而不符合Main 10靜止圖像設定檔之一位元流中,所參考VPS (當可用時)及所參考SPS中之全部i值之general_level_idc及sublayer_level_idc[ i ]不應等於255 (其指示層級15.5)。
- 應滿足子句A.4 (如適用)中針對Main 10或Main 10靜止圖像設定檔指定之階層及層級約束。
一位元流符合Main 10設定檔藉由general_profile_idc等於1來指示。
一位元流符合Main 10靜止圖像設定檔藉由general_profile_idc等於3來指示。
註釋-當如上文指定般指示一位元流符合Main 10靜止圖像設定檔且所指示層級並非層級15.5時,亦滿足指示位元流符合Main 10設定檔之條件。
在一特定階層之一特定層級處符合Main 10設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為符合Main 10或Main 10靜止圖像設定檔。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
在一特定階層之一特定層級處符合Main 10靜止圖像設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為符合Main 10靜止圖像設定檔。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
以類似於Main 10及Main 10靜止圖像設定檔之一方式指定VVC中之Main 4:4:4 10及Main 4:4:4 10靜止圖像設定檔,惟sps_chroma_format_idc可在從0至3之範圍內除外。
VVC規範之當前版本之一問題在於,符合Main 10靜止圖像設定檔但不符合Main 10設定檔之一解碼器將無法從一Main 10視訊位元流解碼一經提取IRAP圖像,除非首先重寫經提取位元流之SPS中之general_profile_idc。為了支援此功能性而必須重寫一位元流係非所要的。
VVC規範之當前版本之另一問題在於,即使將general_profile_idc重寫至包括一個以上圖像之一視訊位元流之Main 10靜止圖像設定檔,該位元流仍不會是一合法位元流,此係因為Main 10靜止圖像設定檔要求位元流中僅存在一個圖像。為了解碼位元流中之第一圖像,在解碼位元流之前,將需要從位元流丟棄全部其餘圖像以使其成為一單圖像位元流。
根據發明概念之一些實施例,一種用於判定符合一第一設定檔之一解碼器能夠解碼符合一第二設定檔之一視訊位元流之一第一圖像之方法包含獲得一指示值(indicator value),該指示值指示符合一設定檔。該方法包含判定該視訊位元流中之該第一圖像是否為一靜止圖像。該方法包含回應於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像,判定符合該第一設定檔之該解碼器能夠解碼該視訊位元流之該第一圖像。
可達成之一優點在於無需重寫一Main 10位元流以使一Main 10靜止圖像解碼器能夠解碼來自Main 10位元流之一個圖像。
發明概念之一些版本之另一優點在於,想要解碼一視訊位元流之第一圖像之一程式不必在將位元流發送至一順應式靜止圖像解碼器之前首先剝離(strip off)其餘圖像。
根據發明概念之其他實施例,提供包含發明概念之上述實施例之類似操作之解碼器、電腦程式及電腦程式產品。
現將在下文中參考隨附圖式更充分描述發明概念,其中展示發明概念之實施例之實例。然而,發明概念可以許多不同形式體現且不應被解釋為限於本文中闡述之實施例。實情係,此等實施例經提供使得本發明將為透徹的且完整的,且將充分傳達本發明概念之範疇給熟習此項技術者。亦應注意,此等實施例並不互斥。來自一項實施例之組件可默認被假定為在另一實施例中存在/使用。
以下描述呈現所揭示標的物之各種實施例。此等實施例被呈現為教示實例且不應被解釋為限制所揭示標的物之範疇。例如,在不脫離所描述標的物之範疇的情況下,可修改、省略或擴充所描述實施例之某些細節。
發明概念之各種實施例提供一種用於在一指示值(例如,其從一視訊位元流中之一參數集中之一語法元素解碼)指示位元流符合一設定檔B (例如,一視訊設定檔)且判定位元流之第一圖像係一靜止圖像(例如,一IRAP圖像)時判定該位元流符合一設定檔A (例如,一靜止圖像設定檔)的方法。
在發明概念之一項實施例中,藉由判定第一圖像中之全部VCL NAL單元之NAL單元類型係IRAP NAL單元類型來判定第一圖像係一IRAP圖像。
在發明概念之另一實施例中,由從一圖像標頭或一存取單元定界符中之一語法元素解碼之一值判定第一圖像係一IRAP圖像。
在圖2中進一步繪示用於描述發明概念之術語。圖2中之一虛線指示該框在VVC中係選用的。一位元流1攜載一或多個經寫碼圖像。與一經寫碼圖像相關聯之NAL單元之組在VVC之當前版本中且被稱為一圖像單元(PU) 2。一VVC位元流可以解碼能力資訊(DCI) 12起始,其後接著在各經寫碼視訊序列(CVS)之開頭之一視訊參數集(VPS) 13、序列參數集(SPS) 14及圖像參數集(PPS) 15。亦可在任何經寫碼圖像之前傳訊一PPS 15。一PU 2必須包括包含一圖塊標頭(SH) 31及圖塊資料32之至少一個經寫碼圖塊22。一PU 2必須包含一個圖像標頭(PH) 21。在VVC之當前版本中,PH 21可在其自身之NAL單元中或在相同於一圖塊22之NAL單元中(更明確言之在SH 31中)傳訊。一存取單元定界符(AUD) 11可作為一存取單元中之第一NAL單元進行傳訊。
儘管發明概念應主要藉由VVC中所使用之術語來描述,然熟習此項技術者應理解,發明概念亦可適用於其他當前及未來視訊編解碼器。
一「靜止圖像」被定義為一單一靜態圖像。一經寫碼靜止圖像始終為框內寫碼的,即,不從除其自身以外之任何其他圖像進行預測。此意謂圖像中之全部區塊皆為框內寫碼之區塊,且經寫碼靜止圖像中不存在使用來自任何其他圖像之預測之資料。可從一組移動圖像提取(即,從視訊提取)一靜止圖像。
一預測或預測性圖像被定義為從除其自身以外之另一圖像進行預測之一經寫碼圖像。
術語「外部構件」被定義為未在位元流中提供而是由一些其他構件提供之資訊,例如經由可能在一不同資料通道中提供之後設資料、作為解碼器中之一常數等。HEVC及VVC兩者容許藉由外部構件提供某些資訊(例如,參數集)。
在進一步詳細描述實施例之前,圖3繪示如本文中描述之可分別用於編碼及解碼位元流之一編碼器300及解碼器306之一操作環境之一實例。編碼器300自網路302及/或自儲存器304接收視訊,且將視訊編碼為位元流(如下文描述),且經由網路308將經編碼視訊傳輸至解碼器306。儲存裝置304可為多通道音訊信號之一儲存庫之部分,諸如一商店或一串流視訊服務之一儲存庫、一單獨儲存組件、一行動裝置之一組件等。解碼器306可為具有一媒體播放器312之一裝置310之部分。裝置310可為一行動裝置、一機上裝置、一桌上型電腦及類似物。
圖4係繪示根據發明概念之一些實施例之經組態以解碼視訊圖框之解碼器306之元件之一方塊圖。如展示,解碼器306可包含經組態以提供與其他裝置/實體/功能/等之通信之一網路介面電路405 (亦被稱為一網路介面)。解碼器306亦可包含耦合至網路介面電路405之一處理器電路401 (亦被稱為一處理器),及耦合至處理器電路之一記憶體電路403 (亦被稱為記憶體)。記憶體電路403可包含當藉由處理器電路401執行時引起處理器電路執行根據本文中揭示之實施例之操作之電腦可讀程式碼。
根據其他實施例,處理器電路401可被定義為包含記憶體,使得無需一單獨記憶體電路。如本文中論述,可藉由處理器401及/或網路介面405執行解碼器306之操作。例如,處理器401可控制網路介面405以自編碼器300接收通信。此外,模組可儲存於記憶體403中,且此等模組可提供指令,使得當藉由處理器401執行一模組之指令時,處理器401執行各自操作及/或引起解碼器306或其他節點/功能執行各自操作。根據一些實施例,一解碼器306及/或其之一(若干)元件/(若干)功能可體現為一/若干虛擬節點及/或一/若干虛擬機。
圖5係繪示根據發明概念之一些實施例之經組態以編碼視訊圖框之編碼器300之元件之一方塊圖。如展示,編碼器300可包含經組態以提供與其他裝置/實體/功能/等之通信之一網路介面電路505 (亦被稱為一網路介面)。編碼器300亦可包含耦合至網路介面電路505之一處理器電路501 (亦被稱為一處理器),及耦合至處理器電路之一記憶體電路503 (亦被稱為記憶體)。記憶體電路503可包含當藉由處理器電路501執行時引起處理器電路執行根據本文中揭示之實施例之操作之電腦可讀程式碼。
根據其他實施例,處理器電路501可被定義為包含記憶體,使得無需一單獨記憶體電路。如本文中論述,可藉由處理器501及/或網路介面505執行編碼器300之操作。例如,處理器501可控制網路介面505以將通信傳輸至解碼器306及/或透過網路介面505自一或多個其他網路節點/實體/伺服器(諸如其他編碼器節點、儲存伺服器等)接收通信。此外,模組可儲存於記憶體503中,且此等模組可提供指令,使得當藉由處理器501執行一模組之指令時,處理器501執行各自操作。根據一些實施例,一編碼器300及/或其之一(若干)元件/(若干)功能可體現為一/若干虛擬節點及/或一/若干虛擬機。
如先前指示,當前VVC規範之一問題在於,符合Main 10靜止圖像設定檔但不符合Main 10設定檔之一解碼器將無法從一Main 10視訊位元流解碼一經提取IRAP圖像,除非首先重寫經提取位元流之SPS中之general_profile_idc。為了支援此功能性而必須重寫一位元流係非所要的。
當前VVC規範之另一問題在於,即使將general_profile_idc重寫至包括一個以上圖像之一視訊位元流之Main 10靜止圖像設定檔,該位元流仍不會是一合法位元流,此係因為Main 10靜止圖像設定檔要求位元流中僅存在一個圖像。為了解碼位元流中之第一圖像,在解碼位元流之前,將需要從位元流丟棄全部其餘圖像以使其成為一單圖像位元流。
在以下描述中,術語設定檔A、設定檔B及設定檔C將用於區分存在於諸如一視訊位元流之一位元流中之各種設定檔。
在發明概念之一第一實施例中,若一指示值(例如,其編碼於一視訊位元流中之一參數集中之一語法元素中或由外部構件提供)指示位元流符合一設定檔B (例如,一視訊設定檔)且判定位元流之第一圖像係一靜止圖像(例如,一IRAP圖像),則判定該位元流符合一設定檔A (例如,一靜止圖像設定檔)。
一編碼器可執行以下步驟之一子集或全部用於指示一視訊位元流符合一設定檔A (其中設定檔A可為一靜止圖像設定檔):
1. 將一指示值編碼於位元流中之一語法元素中(例如,一參數集中),其中該指示值指示符合設定檔A或設定檔B (例如,一視訊設定檔)。例如,該語法元素可為general_profile_idc。
2. 將一靜止圖像編碼至位元流且在靜止圖像中傳訊其係一靜止圖像(例如,藉由將靜止圖像之全部VCL NAL單元之NAL單元類型設定為一IRAP NAL單元類型或藉由在圖像標頭或AUD中傳訊指示圖像係一IRAP圖像之一或多個值)
一提取器可執行以下步驟之一子集或全部用於從符合一設定檔B之一視訊位元流提取一圖像以符合一設定檔A:
1. 從位元流提取一參數集。
2. 從位元流中之一語法元素(例如,從參數集)解碼一指示值,其中該指示值指示符合一特定設定檔。例如,該語法元素可為general_profile_idc。
3. 判定指示值指示位元流符合設定檔A或設定檔B。
4. 從位元流提取與參數集(若提取參數集)相關聯之一靜止圖像(例如,一IRAP圖像)。
5. 組合經提取參數集與經提取靜止圖像以形成一靜止圖像位元流
一解碼器可執行以下步驟之一子集或全部用於判定一視訊位元流是否符合一設定檔A (其中設定檔A可為一靜止圖像設定檔):
1. 獲得一指示值,其中該指示值指示符合一特定設定檔。該指示值可從位元流中之一語法元素(例如,從一參數集)解碼或由外部構件提供。例如,該語法元素可為general_profile_idc。
2. 從位元流中之一第一圖像判定第一圖像是否為一靜止圖像
3. 回應於指示值指示一設定檔B (其中設定檔B可為一視訊設定檔)且第一圖像被判定為一靜止圖像:
a. 判定位元流符合設定檔A
b. 使用符合設定檔A之一解碼器解碼位元流
4. 回應於指示值指示一設定檔C (其中設定檔C係不同於設定檔A及B之一設定檔)或第一圖像並非一靜止圖像(即,其係一預測圖像):
a. 判定位元流不符合設定檔A。
在解碼器可執行之上述步驟中,「靜止圖像」意謂指代不取決於任何其他圖像(例如,從其預測)之一影像或圖像,諸如一IRAP圖像。
上述步驟不一定按順序進行且可省略一些步驟。例如,一解碼器可選擇首先檢查指示值是否指示符合設定檔B。若位元流符合設定檔B,則解碼器亦在判定位元流是否符合設定檔A之前檢查第一圖像是否為一靜止圖像。否則(若位元流不符合設定檔B),解碼器跳過檢查第一圖像是否為一靜止圖像之步驟且直接判定位元流不符合設定檔A。
在第一實施例之一個版本中,靜止圖像係一IRAP圖像,即,從位元流中之第一圖像判定第一圖像是否為一靜止圖像包括:判定第一圖像是否為一IRAP圖像。
在實施例之另一版本中,靜止圖像可為並非從其他圖像預測之任何類型之圖像。此一圖像之一實例係立即再新(即,恢復POC計數等於0)之一GDR圖像。此一圖像之更一般實例係具有指示其係一預測性圖像之一圖像類型之一圖像,但該圖像係完全框內寫碼的。
在此第一實施例之另一版本中,判定位元流符合設定檔A額外地包括確認第一圖像係位元流之僅有圖像。一解碼器可藉由以下步驟來檢查圖像是否為位元流中之僅有圖像:
- 從位元流(例如,從一參數集、圖像標頭或圖塊標頭)獲得指示圖像是否為位元流中之僅有圖像之一指示值。
- 藉由外部構件獲得圖像係位元流中之僅有圖像之資訊。
- 剖析位元流以偵測位元流是否包括一個以上圖像(例如,藉由識別具有不同於第一圖像之POC之一NAL單元或識別屬於一第二圖像之一AUD),或第一圖像是否為位元流中之僅有圖像(例如,藉由直接在第一圖像之後獲得具有NAL單元類型EOB_NUT之一NAL單元或剖析至位元流之末尾而不識別除第一圖像以外之另一圖像)
在此第一實施例之另一版本中,符合一靜止圖像設定檔A且不符合設定檔B之一解碼器將能夠解碼包括一個以上圖像之一設定檔B視訊位元流之第一圖像(但無法解碼其餘圖像)。
在此第一實施例之又一變化形態中,執行以下步驟以判定一視訊位元流符合一靜止圖像設定檔A:
1. 獲得一指示值,其中該指示值指示符合並非靜止圖像設定檔A之一視訊設定檔B。
2. 判定視訊位元流中之第一圖像係一靜止圖像。在一個版本中,此包括判定第一圖像係一IRAP圖像。
3. 回應於指示值指示符合並非一靜止圖像設定檔之一視訊設定檔B且視訊位元流中之第一圖像被判定為一靜止圖像,判定位元流符合靜止圖像設定檔A。
在根據第一實施例之一第二實施例中,藉由檢查第一圖像中之各VCL NAL單元之NAL單元類型來判定第一圖像是否為一IRAP圖像。此可藉由掃描位元流之第一圖像之NAL單元標頭且判定各NAL單元類型具有對應於一IRAP類型之一值而完成。在VVC中,IRAP NAL單元類型係IDR_W_RADL、IDR_N_LP及CRA_NUT。
下文以添加斜體字及粗體字展示可如何根據此實施例改變當前VVC規範中之Main 10及Main 10靜止圖像設定檔之定義之一實例:
Main 10及Main 10靜止圖像設定檔
符合Main 10或Main 10靜止圖像設定檔之位元流應遵守以下約束:
…
在一特定階層之一特定層級處符合Main 10靜止圖像設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為符合Main 10靜止圖像設定檔 或位元流被指示為符合 Main 10 設定檔,且位元流僅含有一個圖像,且全部 VCL NAL 單元之 nal_unit_type 在 IDR_W_RADL 至 CRA_NUT ( 包含端值 ) 之範圍內
。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
下文以添加斜體字及粗體字展示可如何根據此實施例改變當前VVC規範中之Main 10及Main 10靜止圖像設定檔之定義之另一實例。在此實例中,除先前實例之外,Main 10靜止圖像設定檔亦將支援解碼包括一個以上圖像之一視訊位元流之第一IRAP圖像:
Main 10及Main 10靜止圖像設定檔
符合Main 10或Main 10靜止圖像設定檔之位元流應遵守以下約束:
…
- 在一特定階層之一特定層級處符合Main 10靜止圖像設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流之 第一圖像
:
- 位元流被指示為符合Main 10靜止圖像設定檔 或位元流被指示為符合 Main 10 設定檔 , 且位元流之第一圖像之全部 VCL NAL 單元之 nal_unit_type 在 IDR_W_RADL 至 CRA_NUT ( 包含端值 ) 之範圍內
。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
可如何改變當前VVC規範中之Main 10、Main 10靜止圖像、Main 4:4:4 10及Main 4:4 10靜止圖像設定檔之定義之其他實例在2020年6月22日至7月1日藉由電話會議提供給ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG第11次至第19次會議之聯合視訊專家小組(JVET)之一提案中。
根據此提案,含有一單一IRAP圖像且符合Main 10設定檔之一位元流亦符合Main 10靜止圖像設定檔。同樣地,含有一單一IRAP圖像且符合Main 4:4:4 10設定檔之一位元流亦符合Main 4:4:4 10靜止圖像設定檔。在以下段落中描述關於此提案之進一步細節。
在發明概念之一第三實施例中,由從位元流中之第一圖像之一圖像標頭(或圖塊標頭)中之一或多個語法元素解碼之一或多個值判定第一圖像是否為一靜止圖像。
下文以添加斜體字及粗體字展示可如何改變Main 4:4:4 10及Main 4:4:4 10靜止圖像設定檔之定義之一實例:
符合Main 4:4:4 10或Main 4:4:4 10靜止圖像設定檔之位元流應遵守以下約束:
…
在一特定階層之一特定層級處符合Main 4:4:4 10靜止圖像設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為
符合Main 4:4:4 10靜止圖像或 所述
Main 10靜止圖像設定檔; 或
符合 Main 10 設定檔,且位元流僅含有一個圖像,且全部 VCL NAL 單元之 nal_unit_type 在 IDR_W_RADL 至 CRA_NUT ( 包含端值 ) 之範圍內;或
符合 Main 4:4:4 10 設定檔,且位元流僅含有一個圖像,且全部 VCL NAL 單元之 nal_unit_type 在 IDR_W_RADL 至 CRA_NUT ( 包含端值 ) 之範圍內
。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
下文以添加斜體字及粗體字展示可如何根據此實施例改變當前VVC規範中之Main 10及Main 10靜止圖像設定檔之定義之一實例:
Main 10及Main 10靜止圖像設定檔
符合Main 10或Main 10靜止圖像設定檔之位元流應遵守以下約束:
…
在一特定階層之一特定層級處符合Main 10靜止圖像設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為符合Main 10靜止圖像設定檔 或位元流被指示為符合 Main 10 設定檔,且位元流僅含有一個圖像,且 ph_gdr_or_irap_pic_flag 等於 1 且 ph_gdr_pic_flag 等於 0
。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
可如何改變當前VVC規範中之Main 10、Main 10靜止圖像、Main 4:4:4 10及Main 4:4 10靜止圖像設定檔之定義之其他實例在2020年6月22日至7月1日藉由電話會議提供給ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG第11次至第19次會議之聯合視訊專家小組(JVET)之一提案中,該提案之細節如下。
在另一實例中,圖像標頭包括僅指示圖像是否為一IRAP圖像之一新旗標。例如,旗標可被稱為ph_irap_pic_flag,且可如下文以添加斜體字及粗體字展示般改變當前VVC規範中之Main 10及Main 10靜止圖像設定檔之定義。
Main 10及Main 10靜止圖像設定檔
符合Main 10或Main 10靜止圖像設定檔之位元流應遵守以下約束:
…
- 在一特定階層之一特定層級處符合Main 10靜止圖像設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為符合Main 10靜止圖像設定檔 或位元流被指示為符合 Main 10 設定檔,且位元流僅含有一個圖像,且 ph_irap_pic_flag 等於 1
。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
Main 4:4:4 10及Main 4:4:4 10靜止圖像設定檔
符合Main 4:4:4 10或Main 4:4:4 10靜止圖像設定檔之位元流應遵守以下約束:
…
- 在一特定階層之一特定層級處符合Main 4:4:4 10靜止圖像設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為
符合Main 4:4:4 10靜止圖像或 所述
Main 10靜止圖像設定檔; 或
符合 Main 10 設定檔,且位元流僅含有一個圖像,且 ph_gdr_or_irap_pic_flag 等於 1 且 ph_gdr_pic_flag 等於 0 ;或
符合 Main 4:4:4 10 設定檔,且位元流僅含有一個圖像,且 ph_gdr_or_irap_pic_flag 等於 1 且 ph_gdr_pic_flag 等於 0 。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
VVC中之當前設定檔定義
VVC中之設定檔在JVET-S0152-v5中定義如下。
Main 10及Main 10靜止圖像設定檔
符合Main 10或Main 10靜止圖像設定檔之位元流應遵守以下約束:
- 在符合Main 10靜止圖像設定檔之一位元流中,位元流應僅含有一個圖像。
- 所參考SPS應具有等於0或1之sps_chroma_format_idc。
- 所參考SPS應具有在0至2 (包含端值)之範圍內之sps_bitdepth_minus8。
- 在符合Main 10靜止圖像設定檔之一位元流中,所參考SPS應具有等於0之max_dec_pic_buffering_minus1[ sps_max_sublayers_minus1 ]。[Ed. (YK):可能最好不對Main 10靜止圖像設定檔具有此約束,使得當從一Main 10位元流提取一框內圖像以形成一Main 10靜止圖像位元流時,提取器/「編碼器」不必改變SPS中之max_dec_pic_buffering_minus1[ ]之值。]
- 所參考SPS應具有等於0之sps_palette_enabled_flag。
- 在符合Main 10設定檔而不符合Main 10靜止圖像設定檔之一位元流中,所參考VPS (當可用時)及所參考SPS中之全部i值之general_level_idc及sublayer_level_idc[ i ]不應等於255 (其指示層級15.5)。
- 應滿足子句A.4 (如適用)中針對Main 10或Main 10靜止圖像設定檔指定之階層及層級約束。
一位元流符合Main 10設定檔藉由general_profile_idc等於1來指示。
一位元流符合Main 10靜止圖像設定檔藉由general_profile_idc等於3來指示。
註釋-當如上文指定般指示一位元流符合Main 10靜止圖像設定檔且所指示層級並非層級15.5時,亦滿足指示位元流符合Main 10設定檔之條件。
在一特定階層之一特定層級處符合Main 10設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為符合Main 10或Main 10靜止圖像設定檔。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
在一特定階層之一特定層級處符合Main 10靜止圖像設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為符合Main 10靜止圖像設定檔。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
Main 4:4:4 10及Main 4:4:4 10靜止圖像設定檔
符合Main 4:4:4 10或Main 4:4:4 10靜止圖像設定檔之位元流應遵守以下約束:
- 在符合Main 4:4:4 10靜止圖像設定檔之一位元流中,位元流應僅含有一個圖像。
- 所參考SPS應具有在0至3 (包含端值)之範圍內之sps_chroma_format_idc。
- 所參考SPS應具有在0至2 (包含端值)之範圍內之sps_bitdepth_minus8。
- 在符合Main 4:4:4 10靜止圖像設定檔之一位元流中,所參考SPS應具有等於0之max_dec_pic_buffering_minus1[ sps_max_sublayers_minus1 ]。[Ed.(YK):可能最好不對Main 4:4:4 10靜止圖像設定檔具有此約束,使得當從一Main 4:4:4 10位元流提取一框內圖像以形成一Main 4:4:4 10靜止圖像位元流時,提取器/「編碼器」不必改變SPS中之max_dec_pic_buffering_minus1[ ]之值。]
- 在符合Main 4:4:4 10設定檔而不符合Main 4:4:4 10靜止圖像設定檔之一位元流中,所參考VPS (當可用時)及所參考SPS中之全部i值之general_level_idc及sublayer_level_idc[ i ]不應等於255 (其指示層級15.5)。
- 應滿足子句A.4 (如適用)中針對Main 4:4:4 10或Main 4:4:4 10靜止圖像設定檔指定之階層及層級約束。
一位元流符合Main 4:4:4 10設定檔藉由general_profile_idc等於2來指示。
一位元流符合Main 4:4:4 10靜止圖像設定檔藉由general_profile_idc等於4來指示。
註釋-當如上文指定般指示一位元流符合Main 4:4:4 10靜止圖像設定檔且所指示層級並非層級15.5時,亦滿足指示位元流符合Main 4:4:4 10設定檔之條件。
在一特定階層之一特定層級處符合Main 4:4:4 10設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為符合Main 4:4:4 10、Main 10、Main 4:4:4 10靜止圖像或Main 10靜止圖像設定檔。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
在一特定階層之一特定層級處符合Main 4:4:4 10靜止圖像設定檔之解碼器應能夠解碼全部以下條件適用之全部位元流:
- 位元流被指示為符合Main 4:4:4 10靜止圖像或Main 10靜止圖像設定檔。
- 位元流被指示為符合低於或等於指定階層之一階層。
- 位元流被指示為符合並非層級15.5且低於或等於指定層級之一層級。
在發明概念之一替代實施例中,判定第一圖像是否為一靜止圖像係由從第一圖像之存取單元之一存取單元定界符(AUD)中之一語法元素解碼之一值來判定。例如,該語法元素可為指定存取單元是否包括一靜止圖像(諸如一IRAP或GDR存取單元)之一旗標(例如,aud_irap_or_gdr_au_flag)。在另一版本中,AUD中之語法元素僅指定圖像是否為一IRAP圖像。
現將根據發明概念之一些實施例參考圖6至圖13之流程圖論述解碼器306 (其使用圖4之方塊圖之結構實施)之操作。例如,模組可儲存於圖4之記憶體403中,且此等模組可提供指令,使得當藉由各自通信裝置處理電路401執行一模組之指令時,處理電路401執行流程圖之各自操作。
轉至圖6,在方塊601中,處理電路401在方塊601中獲得一指示值,該指示值指示符合一設定檔。例如,指示值可指示視訊位元流符合一第一設定檔、一第二設定檔或一第三設定檔。
轉至圖8,在發明概念之一項實施例中,在方塊801中,處理電路401可從位元流中之一語法元素獲得指示值。
在發明概念之另一實施例中,在方塊803中,處理電路401可從一解碼能力資訊(DCI)或一參數集中之一語法元素獲得指示值。參數集可為一視訊參數集(VPS)、一序列參數集(SPS)或一圖像參數集(PPS)等之一者。
在發明概念之又一實施例中,在方塊805中,處理電路401可從外部構件獲得指示值。外部構件可為在不同於視訊位元流之一資料通道中提供之後設資料、作為解碼器中之一常數等。
返回至圖6,在方塊603中,處理電路401判定視訊位元流中之一第一圖像是否為一靜止圖像。在發明概念之一項實施例中,處理電路401可藉由判定視訊位元流中之第一圖像是否為一框內隨機存取點(IRAP)圖像來判定該第一圖像是否為一靜止圖像。替代地,處理電路401可藉由從語法元素獲得一或多個值來判定視訊位元流中之第一圖像是否為一靜止圖像,其中來自語法元素之值指定視訊位元流中之第一圖像是否為一靜止圖像。語法元素可存在於視訊位元流中。在另一實例中,語法元素未存在於視訊位元流中而是從外部構件獲得,諸如從不同於視訊位元流之一資料通道獲得。
轉至圖9,在發明概念之另一實施例中,處理電路401可藉由透過以下步驟判定第一圖像係一靜止圖像而判定第一圖像是否為一靜止圖像:在方塊901中,獲得第一圖像之各視訊寫碼層網路抽象層(NAL)單元之一NAL單元類型;及在方塊903中,判定第一圖像之全部視訊寫碼層NAL單元具有表示一框內隨機存取點(IRAP)圖像之一NAL單元類型。
轉至圖10,在發明概念之另一實施例中,處理電路401可藉由透過以下步驟判定第一圖像係一靜止圖像而判定第一圖像是否為一靜止圖像:在方塊1001中,從來自第一圖像之一圖像標頭、來自第一圖像之一圖塊標頭或來自與第一圖像相關聯之一存取單元定界符(AUD)之語法元素解碼一或多個值;及在方塊1003中,從該一或多個值判定圖像是否為一靜止圖像。該等值可僅從圖像標頭解碼,或僅從圖塊標頭解碼,或從來自圖像標頭及圖塊標頭兩者之語法元素組合解碼。
在發明概念之又一實施例中,處理電路401可藉由判定第一圖像是否為具有等於0之一恢復圖像順序計數(POC)計數之一逐漸解碼再新(GDR)圖像來判定第一圖像是否為一靜止圖像。
在發明概念之其他實施例中,處理電路401可藉由從語法元素獲得一或多個值來判定第一圖像是否為一靜止圖像,其中來自語法元素之值指定視訊位元流中之第一圖像是否為一靜止圖像。
返回至圖6,在方塊605中,處理電路401回應於指示值指示符合一第二設定檔且第一圖像係一靜止圖像而判定位元流符合第一設定檔。在如圖7中繪示之其他實施例中,在方塊705中,處理電路401回應於指示值指示符合第二設定檔且第一圖像被判定為一靜止圖像,而判定符合第一設定檔之解碼器能夠解碼視訊位元流之第一圖像。換言之,解碼器將能夠解碼視訊位元流之第一圖像。第一設定檔可為一靜止圖像設定檔。第二設定檔可為一視訊設定檔及/或不同於第一設定檔。
在方塊607中,處理電路401可回應於指示值指示符合第二設定檔且第一圖像係一靜止圖像而使用符合第一設定檔之一解碼器來解碼位元流。如上文指示,在一些實施例中,如圖7中繪示,在方塊707中,處理電路401可回應於指示值指示符合第二設定檔且第一圖像被判定為一靜止圖像,而使用符合第一設定檔之一解碼器來解碼位元流之第一圖像。在此等實施例中,處理電路401可能夠或可能無法解碼位元流之其他部分。
在方塊609中,處理電路401回應於指示值指示符合一第三設定檔抑或第一圖像並非一靜止圖像,而不使用符合第一設定檔之一解碼器來解碼位元流。換言之,如上文指示,在一些實施例中,如圖7中繪示,在方塊709中,處理電路401回應於指示值指示符合一第三設定檔抑或第一圖像被判定為並非一靜止圖像,而不使用符合第一設定檔之一解碼器來解碼位元流之第一圖像。第三設定檔不同於第一設定檔及第二設定檔。
轉至圖11,在方塊1101中,處理電路401回應於指示值指示符合第三設定檔或第一圖像被判定為並非一靜止圖像,而判定視訊位元流不符合第一設定檔。此係因為第一圖像不符合第一設定檔。在一些實施例中,如圖11中繪示,在方塊1103中,處理電路401回應於指示值指示符合第三設定檔或第一圖像被判定為並非一靜止圖像,而判定解碼器可能無法解碼如上文指示之視訊位元流之第一圖像。
關於通信裝置及相關方法之一些實施例,來自圖6之流程圖之各種操作可為選用的。例如,關於實例實施例1 (下文闡述)之方法,圖6之方塊607及609之操作可為選用的。
關於通信裝置及相關方法之一些實施例,來自圖7之流程圖之各種操作可為選用的。例如,在一些實施例中,方塊707及709之操作可為選用的。
轉至圖12,繪示發明概念之又一實施例以判定視訊位元流是否符合第一設定檔。在方塊1201中,處理電路401判定第一圖像是否為位元流中之僅有圖像。在方塊1203中,處理電路401回應於指示值指示符合第二設定檔且第一圖像被判定為一靜止圖像且第一圖像被判定為位元流中之僅有圖像,而判定解碼器能夠解碼視訊位元流之第一圖像。
靜止圖像可為不取決於任何其他圖像(例如,不從其進行預測)之一影像或圖像、一IRAP圖像或具有等於0之恢復POC計數之一GDR圖像之至少一者。換言之,靜止圖像可為不取決於任何其他圖像之一影像或圖像、未從任何其他圖像預測之一影像、一IRAP圖像或具有等於0之恢復POC計數之一GDR圖像之至少一者。
解碼器306可執行作為發明概念之其他動作,諸如形成一靜止圖像位元流。轉至圖13,在方塊1301中,處理電路401可從位元流提取一參數集。在方塊1303中,處理電路401可藉由從位元流中之一語法元素解碼指示值來獲得指示值。回應於在方塊1305中,指示值指示位元流符合第一設定檔或第二設定檔,處理電路401可在方塊1307中從位元流提取與參數集相關聯之一靜止圖像,且在方塊1309中組合從位元流提取之參數集與從位元流提取之靜止圖像以形成一靜止圖像位元流而無需將指示值重寫至語法元素。
下文論述實例實施例。
實施例1. 一種用於判定一視訊位元流符合一第一設定檔之方法,該方法包括:
獲得(601)一指示值,該指示值指示符合一設定檔;
判定(603)該視訊位元流中之一第一圖像是否為一靜止圖像;及
回應(605)於該指示值指示符合一第二設定檔且該第一圖像係一靜止圖像,判定該位元流符合該第一設定檔。
實施例2. 如實施例1之方法,其進一步包括:
回應於該指示值指示符合一第三設定檔或該第一圖像被判定為並非一靜止圖像,判定(1101)該視訊位元流不符合該第一設定檔。
實施例3. 如實施例1至2之任何者之方法,其中獲得該指示值包括:從該位元流中之一語法元素解碼(801)該指示值。
實施例4. 如實施例1至2之任何者之方法,其中獲得該指示值包括:從一解碼能力資訊(DCI)或一參數集中之一語法元素解碼(803)該指示值。
實施例5. 如實施例4之方法,其中該參數集包括一視訊參數集(VPS)、一序列參數集(SPS)或一圖像參數集(PPS)之一者。
實施例6. 如實施例1至2之任何者之方法,其中獲得該指示值包括:從外部構件獲得(805)該指示值。
實施例7. 如實施例1至6之任何者之方法,其中該第一設定檔係一靜止圖像設定檔。
實施例8. 如實施例1至7之任何者之方法,其中該第二設定檔係一視訊設定檔。
實施例9. 如實施例1至8之任何者之方法,其中該第二設定檔不同於該第一設定檔。
實施例10. 如實施例2至9之任何者之方法,其中該第三設定檔不同於該第一設定檔及該第二設定檔。
實施例11. 如實施例1至10之任何者之方法,其進一步包括回應於該指示值指示符合該第二設定檔且該第一圖像係一靜止圖像,而使用符合該第一設定檔之一解碼器來解碼(607)該位元流。
實施例12. 如實施例2至11之任何者之方法,其進一步包括回應於該指示值指示符合該第三設定檔抑或該第一圖像並非一靜止圖像,而不使用符合該第一設定檔之一解碼器來解碼(609)該位元流。
實施例13. 如實施例1至12之任何者之方法,其中判定該視訊位元流中之該第一圖像是否為一靜止圖像包括:判定該第一圖像是否為一框內隨機存取點(IRAP)圖像。
實施例14. 如實施例1至12之任何者之方法,其中判定該視訊位元流中之該第一圖像是否為一靜止圖像包括:從語法元素獲得一或多個值,其中來自語法元素之該等值指定該視訊位元流中之該第一圖像是否為一靜止圖像。
實施例15. 如實施例1至12之任何者之方法,其中判定該第一圖像是否為一靜止圖像包括:藉由以下步驟判定該第一圖像係一靜止圖像:
獲得(901)該第一圖像之各視訊寫碼層網路抽象層(NAL)單元之一NAL單元類型;及
判定(903)該第一圖像之全部視訊寫碼層NAL單元具有表示一框內隨機存取點(IRAP)圖像之一NAL單元類型。
實施例16. 如實施例1至12之任何者之方法,其中判定該第一圖像是否為一靜止圖像包括:藉由以下步驟判定該第一圖像係一靜止圖像:
從來自該第一圖像之一圖像標頭或該第一圖像之一圖塊標頭之一或多個語法元素解碼(1001)一或多個值;及
從該一或多個值判定(1003)該圖像係一靜止圖像。
實施例17. 如實施例1至16之任何者之方法,其進一步包括
判定(1201)該第一圖像是否為該位元流中之僅有圖像;及
回應於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像且該第一圖像被判定為該位元流中之該僅有圖像,判定(1203)該位元流符合該第一設定檔。
實施例18. 如實施例1至17之任何者之方法,其進一步包括:
從該位元流提取(1301)一參數集;
藉由從該位元流中之一語法元素解碼該指示值來獲得(1303)該指示值;及
回應於該指示值指示(1305)該位元流符合該第一設定檔或該第二設定檔:
從該位元流提取(1307)與該參數集相關聯之一靜止圖像;及
組合(1309)從該位元流提取之該參數集與從該位元流提取之該靜止圖像以形成一靜止圖像位元流而無需將該指示值重寫至該語法元素。
實施例19. 一種用於判定一視訊位元流符合一第一設定檔之解碼器(306),該解碼器經調適以執行包括以下步驟之操作:
獲得(601)一指示值,該指示值指示符合一設定檔;
判定(603)該視訊位元流中之一第一圖像是否為一靜止圖像;及
回應於該指示值指示符合一第二設定檔且該第一圖像係一靜止圖像,判定(605)該位元流符合該第一設定檔。
實施例20. 如實施例19之解碼器(306),其中該解碼器進一步經調適以執行根據實施例2至18之任何者之操作。
實施例21. 一種用於判定一視訊位元流符合一第一設定檔之解碼器(306),該解碼器包括:
處理電路(401);及
記憶體(403),其與該處理電路耦合,其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行包括以下步驟之操作之指令:
獲得(601)一指示值,該指示值指示符合一設定檔;
判定(603)該視訊位元流中之一第一圖像是否為一靜止圖像;及
回應於該指示值指示符合一第二設定檔且該第一圖像係一靜止圖像,判定(605)該位元流符合該第一設定檔。
實施例22. 如實施例21之解碼器,其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行包括以下步驟之進一步操作之進一步指令:
回應於該指示值指示符合一第三設定檔或該第一圖像被判定為並非一靜止圖像,判定(1101)該視訊位元流不符合該第一設定檔。
實施例23. 如實施例21至22之任何者之解碼器,其中在獲得該指示值時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括從該位元流中之一語法元素解碼(801)該指示值。
實施例24. 如實施例21至22之任何者之解碼器,其中在獲得該指示值時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括從一解碼能力資訊(DCI)或一參數集中之一語法元素解碼(803)該指示值。
實施例25. 如實施例24之解碼器,其中該參數集包括一視訊參數集(VPS)、一序列參數集(SPS)或一圖像參數集(PPS)之一者。
實施例26. 如實施例22至25之任何者之解碼器,其中在獲得該指示值時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括從外部構件獲得(805)該指示值。
實施例27. 如實施例21至26之任何者之解碼器,其中該第一設定檔係一靜止圖像設定檔。
實施例28. 如實施例21至27之任何者之解碼器,其中該第二設定檔係一視訊設定檔。
實施例29. 如實施例21至28之任何者之解碼器,其中該第二設定檔不同於該第一設定檔。
實施例30. 如實施例22至29之任何者之解碼器,其中該第三設定檔不同於該第一設定檔及該第二設定檔。
實施例31. 如實施例21至30之任何者之解碼器,其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括回應於該指示值指示符合該第二設定檔且該第一圖像係一靜止圖像,而使用符合該第一設定檔之一解碼器來解碼(607)該位元流。
實施例32. 如實施例21至31之任何者之解碼器,其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括回應於該指示值指示符合該第三設定檔抑或該第一圖像並非一靜止圖像,而不使用符合該第一設定檔之一解碼器來解碼(609)該位元流。
實施例33. 如實施例21至32之任何者之解碼器,其中在判定該視訊位元流中之該第一圖像是否為一靜止圖像時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括判定該第一圖像是否為一框內隨機存取點(IRAP)圖像。
實施例34. 如實施例21至32之任何者之解碼器,其中判定該視訊位元流中之該第一圖像是否為一靜止圖像包括:從語法元素獲得一或多個值,其中來自語法元素之該等值指定該視訊位元流中之該第一圖像是否為一靜止圖像。
實施例35. 如實施例21至32之任何者之解碼器,其中在判定該第一圖像是否為一靜止圖像時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括藉由以下步驟判定該第一圖像係一靜止圖像:
獲得(901)該第一圖像之各視訊寫碼層網路抽象層(NAL)單元之一NAL單元類型;及
判定(903)該第一圖像之全部視訊寫碼層NAL單元具有表示一IRAP圖像之一NAL單元類型。
實施例36. 如實施例21至32之任何者之解碼器,其中在判定該第一圖像是否為一靜止圖像時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括藉由以下步驟判定該第一圖像係一靜止圖像:
從來自該第一圖像之一圖像標頭或該第一圖像之一圖塊標頭之一或多個語法元素解碼(1001)一或多個值;及
從該一或多個值判定(1003)該圖像係一靜止圖像。
實施例37. 如實施例21至36之任何者之解碼器,其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行包括以下步驟之進一步操作之進一步指令:
判定(1201)該第一圖像是否為該位元流中之僅有圖像;及
回應於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像且該第一圖像被判定為該位元流中之該僅有圖像,判定(1203)該位元流符合該第一設定檔。
實施例38. 如實施例21至37之任何者之解碼器,其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行包括以下步驟之進一步操作之進一步指令:
從該位元流提取(1301)一參數集;
藉由從該位元流中之一語法元素解碼該指示值來獲得(1303)該指示值;及
回應於該指示值指示(1305)位元流符合該第一設定檔或該第二設定檔:
從該位元流提取(1307)與該參數集相關聯之一靜止圖像;及
組合(1309)從該位元流提取之該參數集與從該位元流提取之該靜止圖像以形成一靜止圖像位元流而無需將該指示值重寫至該語法元素。
實施例39. 一種電腦程式,其包括待藉由一解碼器(306)之處理電路(401)執行之程式碼,藉此該程式碼之執行引起該解碼器(306)執行包括以下步驟之操作:
獲得(601)一指示值,該指示值指示符合一設定檔;
判定(603)視訊位元流中之一第一圖像是否為一靜止圖像;及
回應於該指示值指示符合一第二設定檔且該第一圖像係一靜止圖像,判定(605)該位元流符合一第一設定檔。
實施例40. 如實施例39之電腦程式,其中該電腦程式包括待藉由該解碼器(306)之處理電路(401)執行之進一步程式碼,藉此該程式碼之執行引起該解碼器(306)執行根據實施例2至18之任何者之操作。
實施例41. 一種電腦程式產品,其包括包含待藉由一解碼器(306)之處理電路(401)執行之程式碼之一非暫時性儲存媒體,藉此該程式碼之執行引起該解碼器(306)執行包括以下步驟之操作:
獲得(601)一指示值,該指示值指示符合一設定檔;
判定(603)視訊位元流中之一第一圖像是否為一靜止圖像;及
回應於該指示值指示符合一第二設定檔且該第一圖像係一靜止圖像,判定(605)該位元流符合一第一設定檔。
實施例42. 如實施例41之電腦程式產品,其中該非暫時性儲存媒體包含待藉由該解碼器(306)之該處理電路(401)執行之進一步程式碼,藉此該程式碼之執行引起該解碼器(306)執行根據實施例2至18之任何者之操作。
下文提供對本發明中使用之各種縮寫/首字母縮寫之說明。
縮寫 說明
AU 存取單元
AUD 存取單元定界符
ALF 適應性迴路濾波器
APS 適應性參數集
BDOF 雙向光流
BLA 斷鏈存取
CLVS 經寫碼層視訊序列
CRA 乾淨隨機存取
CVS 經寫碼視訊流
CVSSCVS 起始
CU 寫碼單元
DCI 解碼能力資訊
DMVR 解碼器運動向量細化
DPS 解碼參數集
DRAP 相依隨機存取點
GDR 逐漸解碼再新
HEVC 高效率視訊寫碼
IDR 瞬時解碼再新
IRAP 框內隨機存取點
LMCS 亮度映射及色度縮放
MPEG 動畫專家群
MVD 運動向量差
NAL 網路抽象層
NALU NAL單元
NUT NAL單元類型
PPS 圖像參數集
RADL 隨機存取可解碼前導
RAP 隨機存取點
RASL 隨機存取經跳過前導
RBSP 原始位元組序列酬載
RPL 參考圖像清單
SEI 補充增強層
SPS 序列參數集
STSA 逐步時間層存取
VCL 視訊寫碼層
VPS 視訊參數集
VVC 多功能視訊寫碼
下文識別參考。
1. JVET-S0152-v5,多功能視訊寫碼,聯合視訊專家小組
一般而言,本文中使用之全部術語應根據其等在相關技術領域中之普通含義來解釋,除非明確給出及/或從使用其之上下文暗示一不同含義。對一/一個/該元件、設備、組件、構件、步驟等之全部參考應被開放性地解釋為指代元件、設備、組件、構件、步驟等之至少一個例項,除非另有明確規定。本文中揭示之任何方法之步驟不必按所揭示的確切順序執行,除非一步驟被明確描述為在另一步驟之後或之前及/或暗示一步驟必須在另一步驟之後或之前。本文中揭示之實施例之任何者之任何特徵可在適當情況下應用於任何其他實施例。同樣地,實施例之任何者之任何優點可應用於任何其他實施例,且反之亦然。從以下描述將明白隨附實施例之其他目的、特徵及優點。
術語單元可具有電子學、電裝置及/或電子裝置之領域中之習知含義,且可包含例如用於實行各自任務、程序、計算、輸出及/或顯示功能等(像諸如本文中描述之功能)之電及/或電子電路、裝置、模組、處理器、記憶體、邏輯固態及/或離散裝置、電腦程式或指令。
在本發明概念之各種實施例之上文描述中,應理解,本文中使用之術語僅用於描述特定實施例之目的且不旨在限制本發明概念。除非另有定義,否則本文中使用之所有術語(包含技術及科學術語)具有與本發明概念所屬領域之一般技術者所通常理解相同之含義。將進一步理解,術語(諸如在常用字典中定義之術語)應被解釋為具有與其等在本說明書之內容脈絡及相關技術中之含義一致之一含義,且將不會以一理想化或過度正式的意義進行解釋,除非本文中明確如此定義。
當一元件被稱為「連接」、「耦合」、「回應」(或其等之變體)於另一元件時,其可直接連接、耦合或回應於另一元件或可存在中介元件。相比之下,當一元件被稱為「直接連接」、「直接耦合」、「直接回應」(或其等之變體)於另一元件時,不存在中介元件。在各處,相同數字指代相同元件。此外,如本文中使用之「耦合」、「連接」、「回應」或其等之變體可包含無線耦合、連接或回應。如本文中使用,單數形式「一」、「一個」及「該」亦旨在包含複數形式,除非上下文另有明確指示。為簡潔及/或清楚起見,可未詳細描述眾所周知的功能或構造。術語「及/或」(縮寫為「/」)包含相關聯所列品項之一或多者之任何及全部組合。
將理解,儘管術語第一、第二、第三等可在本文中用於描述各種元件/操作,然此等元件/操作不應受此等術語限制。此等術語僅用於區分一個元件/操作與另一元件/操作。因此,在不脫離本發明概念之教示的情況下,一些實施例中之一第一元件/操作可在其他實施例中被稱為一第二元件/操作。在說明書各處,相同元件符號或相同參考指示符表示相同或類似元件。
如本文中使用,術語「包括(comprise、comprising、comprises)」、「包含(include、including、includes)」、「具有(have、has、having)」或其等之變體係開放式的,且包含一或多個所陳述特徵、整數、元件、步驟、組件或功能但不排除一或多個其他特徵、整數、元件、步驟、組件、功能或其等之群組之存在或添加。此外,如本文中使用,源於拉丁文片語「exempli gratia」之常見縮寫「e.g. (例如)」可用於引入或指定一先前提及品項之一或若干一般實例且不旨在限制此品項。源於拉丁文片語「id est」之常見縮寫「i.e. (即)」可用於指定來自更一般敘述之一特定品項。
本文中參考電腦實施方法、設備(系統及/或裝置)及/或電腦程式產品之方塊圖及/或流程圖來描述實例實施例。應理解,可藉由用一或多個電腦電路執行之電腦程式指令來實施方塊圖及/或流程圖之一方塊及方塊圖及/或流程圖中之方塊之組合。可將此等電腦程式指令提供至一通用電腦電路、專用電腦電路及/或其他可程式化資料處理電路之一處理器電路以產生一機器,使得經由電腦及/或其他可程式化資料處理設備之處理器執行之指令變換及控制電晶體、儲存於記憶體位置中之值及此電路內之其他硬體組件,以實施方塊圖及/或一或若干流程圖方塊中指定之功能/動作,且藉此產生用於實施方塊圖及/或(若干)流程圖方塊中指定之功能/動作之構件(功能性)及/或結構。
此等電腦程式指令亦可儲存於一有形電腦可讀媒體中而可引導一電腦或其他可程式化資料處理設備以一特定方式運作,使得儲存於電腦可讀媒體中之指令產生一製品,該製品包含實施方塊圖及/或一或若干流程圖方塊中指定之功能/動作之指令。因此,本發明概念之實施例可體現在於一處理器(諸如一數位信號處理器)上運行之硬體及/或軟體(包含韌體、常駐軟體、微代碼等)中,其等可統稱為「電路」、「一模組」或其等之變體。
亦應注意,在一些替代實施方案中,在方塊中提及之功能/動作可不按流程圖中所提及之順序發生。例如,取決於所涉及之功能性/動作,連續展示之兩個方塊事實上可實質上同時執行,或方塊有時可按相反順序執行。此外,流程圖及/或方塊圖之一給定方塊之功能性可分為多個方塊,及/或流程圖及/或方塊圖之兩個或更多個方塊之功能性可至少部分整合。最終,在不脫離發明概念之範疇的情況下,可在所繪示之方塊之間添加/插入其他方塊,及/或可省略方塊/操作。此外,儘管一些圖包含通信路徑上之箭頭以展示一主要通信方向,然應理解,通信可在與所描繪箭頭相反之方向上發生。
在實質上不脫離本發明概念之原理的情況下,可對實施例作出許多變動及修改。全部此等變動及修改在本文中旨在包含於本發明概念之範疇內。因此,上文揭示之標的物應被視為闡釋性的且非限制性的,且實施例之實例旨在涵蓋全部此等修改、增強及其他實施例,其等落入本發明概念之精神及範疇內。因此,在法律容許之最大程度上,本發明概念之範疇應由包含實施例之實例及其等之等效物之本發明之最廣泛可允許解釋來判定,且不應受限於或限於前述詳細描述。
1:位元流
2:圖像單元(PU)
11:存取單元定界符(AUD)
12:解碼能力資訊(DCI)
13:視訊參數集(VPS)
14:序列參數集(SPS)
15:圖像參數集(PPS)
21:圖像標頭(PH)
22:經寫碼圖塊
31:圖塊標頭(SH)
32:圖塊資料
300:編碼器
302:網路
304:儲存器/儲存裝置
306:解碼器
308:網路
310:裝置
312:媒體播放器
401:處理器電路/處理器/處理電路
403:記憶體電路/記憶體
405:網路介面電路/網路介面
501:處理器電路/處理器
503:記憶體電路/記憶體
505:網路介面電路/網路介面
601:方塊/獲得
603:方塊/判定
605:方塊/回應/判定
607:方塊/解碼
609:方塊/不解碼
705:方塊/回應/判定
707:方塊/解碼
709:方塊/不解碼
801:方塊/解碼
803:方塊/解碼
805:方塊/獲得
901:方塊/獲得
903:方塊/判定
1001:方塊/解碼
1003:方塊/判定
1101:方塊/判定
1103:方塊/判定
1201:方塊/判定
1203:方塊/判定
1301:方塊/提取
1303:獲得
1305:方塊/指示
1307:方塊/提取
1309:方塊/組合
經包含以提供本發明之一進一步理解且併入於本申請案中並構成本申請案之一部分之隨附圖式繪示發明概念之某些非限制性實施例。在圖式中:
圖1係繪示圖像單元(PU)、存取單元(AU)及經寫碼層序列(CLVS)之間的關係之一圖;
圖2係繪示在描述發明概念之各種實施例時使用之一位元流及術語之一方塊圖;
圖3係繪示其中可根據發明概念之一些實施例實施編碼器及解碼器之一系統之一環境之一實例之一方塊圖;
圖4係繪示根據一些實施例之一解碼器之一方塊圖;
圖5係繪示根據一些實施例之一編碼器之一方塊圖;及
圖6至圖13係繪示根據發明概念之一些實施例之一解碼器之操作之流程圖。
601:方塊/獲得
603:方塊/判定
705:方塊/回應/判定
707:方塊/解碼
709:方塊/不解碼
Claims (49)
- 一種用於判定符合一第一設定檔之一解碼器能夠解碼符合一第二設定檔之一視訊位元流之一第一圖像之方法,該方法包括: 獲得(601)一指示值,該指示值指示符合一設定檔; 判定(603)該視訊位元流中之該第一圖像是否為一靜止圖像;及 回應(705)於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像,判定符合該第一設定檔之該解碼器能夠解碼該視訊位元流之該第一圖像。
- 如請求項1之方法,其中該指示值指示位元流符合該設定檔。
- 如請求項1至2中任一項之方法,其進一步包括: 回應於該指示值指示符合一第三設定檔或該第一圖像被判定為並非一靜止圖像,判定(1101)該視訊位元流不符合該第一設定檔。
- 如請求項1至2中任一項之方法,其進一步包括: 回應於該指示值指示符合一第三設定檔或該第一圖像被判定為並非一靜止圖像,判定(1103)該解碼器可能無法解碼該視訊位元流之該第一圖像,其中該第三設定檔不同於該第一設定檔及該第二設定檔。
- 如請求項1至2中任一項之方法,其中獲得該指示值包括:從該位元流中之一語法元素解碼(801)該指示值。
- 如請求項1至2中任一項之方法,其中獲得該指示值包括:從外部構件獲得(805)該指示值。
- 如請求項5之方法,其中獲得該指示值包括:從一解碼能力資訊DCI或一參數集中之一語法元素解碼(803)該指示值。
- 如請求項7之方法,其中該參數集包括一視訊參數集VPS、一序列參數集SPS或一圖像參數集PPS之一者。
- 如請求項1至2中任一項之方法,其中該第二設定檔不同於該第一設定檔。
- 如請求項1至2中任一項之方法,其中該第一設定檔係一靜止圖像設定檔且該第二設定檔係一視訊設定檔。
- 如請求項1至2中任一項之方法,其進一步包括回應於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像,使用符合該第一設定檔之一解碼器來解碼(707)該位元流之該第一圖像。
- 如請求項2之方法,其進一步包括回應於該指示值指示符合該第三設定檔抑或該第一圖像被判定為並非一靜止圖像,不使用符合該第一設定檔之一解碼器來解碼(709)該位元流之該第一圖像。
- 如請求項1至2中任一項之方法,其中判定該視訊位元流中之該第一圖像是否為一靜止圖像包括:判定該第一圖像是否為一框內隨機存取點IRAP圖像。
- 如請求項1至2中任一項之方法,其中判定該視訊位元流中之該第一圖像是否為一靜止圖像進一步包括:判定該第一圖像是否為具有等於0之一恢復圖像順序計數POC計數之一逐漸解碼再新GDR圖像。
- 如請求項1至2中任一項之方法,其中判定該視訊位元流中之該第一圖像是否為一靜止圖像包括:從語法元素獲得一或多個值,其中來自語法元素之該等值指定該視訊位元流中之該第一圖像是否為一靜止圖像。
- 如請求項1至2中任一項之方法,其中判定該第一圖像是否為一靜止圖像包括藉由以下步驟判定該第一圖像係一靜止圖像: 從來自該第一圖像之一圖像標頭、來自該第一圖像之一圖塊標頭或來自與該第一圖像相關聯之一存取單元定界符(AUD)之一或多個語法元素解碼(1001)一或多個值;及 從該一或多個值判定(1003)該圖像係一靜止圖像。
- 如請求項1至2中任一項之方法,其中判定該第一圖像是否為一靜止圖像包括藉由以下步驟判定該第一圖像係一靜止圖像: 獲得(901)該第一圖像之各視訊寫碼層網路抽象層NAL單元之一NAL單元類型;及 判定(903)該第一圖像之全部視訊寫碼層NAL單元具有表示一框內隨機存取點IRAP圖像之一NAL單元類型。
- 如請求項1至2中任一項之方法,其進一步包括 判定(1201)該第一圖像是否為該位元流中之一僅有圖像;及 回應於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像且該第一圖像被判定為該位元流中之該僅有圖像,判定(1203)該解碼器能夠解碼該位元流之該第一圖像。
- 如請求項1至2中任一項之方法,其進一步包括: 從該位元流提取(1301)一參數集; 藉由從該位元流中之一語法元素解碼該指示值來獲得(1303)該指示值;及 回應於該指示值指示(1305)位元流符合該第一設定檔或該第二設定檔: 從該位元流提取(1307)與該參數集相關聯之一靜止圖像;及 組合(1309)從該位元流提取之該參數集與從該位元流提取之該靜止圖像以形成一靜止圖像位元流而無需將該指示值重寫至該語法元素。
- 如請求項1至2中任一項之方法,其中該靜止圖像係以下之至少一者: 不取決於任何其他圖像之一影像或圖像; 不從任何其他圖像進行預測之一影像或圖像; 一IRAP圖像;及 具有等於0之恢復POC計數之一GDR圖像。
- 如請求項1至2中任一項之方法,其中符合該第一設定檔之該解碼器(306)係具有一媒體播放器(312)之一裝置(310)之部分。
- 一種解碼器(306),其用於判定符合一第一設定檔之該解碼器能夠解碼符合一第二設定檔之一視訊位元流之一第一圖像,該解碼器經調適以執行包括以下步驟之操作: 獲得(601)一指示值,該指示值指示符合一設定檔; 判定(603)該視訊位元流中之該第一圖像是否為一靜止圖像;及 回應於該指示值指示符合該第二設定檔且該第一圖像係一靜止圖像,判定(705)符合該第一設定檔之該解碼器能夠解碼該位元流之該第一圖像。
- 如請求項22之解碼器(306),其中該解碼器經進一步調適以執行如請求項2至21中任一項之操作。
- 如請求項22至23中任一項之解碼器(306),其中該解碼器(306)係具有一媒體播放器(312)之一裝置(310)之部分。
- 一種解碼器(306),其用於判定符合一第一設定檔之該解碼器能夠解碼符合一第二設定檔之一視訊位元流之一第一圖像,該解碼器包括: 處理電路(401);及 記憶體(403),其與該處理電路耦合,其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行包括以下步驟之操作之指令: 獲得(601)一指示值,該指示值指示符合一設定檔; 判定(603)該視訊位元流中之該第一圖像是否為一靜止圖像;及 回應於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像,判定(705)符合該第一設定檔之該解碼器能夠解碼該位元流之該第一圖像。
- 如請求項25之解碼器(306),其中該指示值指示位元流符合該設定檔。
- 如請求項25至26中任一項之解碼器(306),其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行包括以下步驟之進一步操作之進一步指令: 回應於該指示值指示符合一第三設定檔或該第一圖像被判定為並非一靜止圖像,判定(1101)該視訊位元流不符合該第一設定檔。
- 如請求項25至26中任一項之解碼器(306),其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行包括以下步驟之進一步操作之進一步指令: 回應於該指示值指示符合一第三設定檔或該第一圖像被判定為並非一靜止圖像,判定(1103)該解碼器可能無法解碼該視訊位元流之該第一圖像。
- 如請求項25至26中任一項之解碼器(306),其中在獲得該指示值時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括從該位元流中之一語法元素解碼(801)該指示值。
- 如請求項25至26中任一項之解碼器(306),其中在獲得該指示值時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括從外部構件獲得(805)該指示值。
- 如請求項29之解碼器(306),其中在獲得該指示值時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括從一解碼能力資訊DCI或一參數集中之一語法元素解碼(803)該指示值。
- 如請求項31之解碼器(306),其中該參數集包括一視訊參數集VPS、一序列參數集SPS或一圖像參數集PPS之一者。
- 如請求項25至26中任一項之解碼器(306),其中該第三設定檔不同於該第一設定檔及該第二設定檔。
- 如請求項25至26中任一項之解碼器(306),其中該第一設定檔係一靜止圖像設定檔且該第二設定檔係一視訊設定檔。
- 如請求項25至26中任一項之解碼器(306),其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括回應於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像,使用符合該第一設定檔之一解碼器來解碼(707)該位元流之該第一圖像。
- 如請求項25至26中任一項之解碼器(306),其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括回應於該指示值指示符合該第三設定檔抑或該第一圖像被判定為並非一靜止圖像,不使用符合該第一設定檔之一解碼器來解碼(709)該位元流之該第一圖像。
- 如請求項25至26中任一項之解碼器(306),其中在判定該視訊位元流中之該第一圖像是否為一靜止圖像時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括判定該第一圖像是否為一框內隨機存取點IRAP圖像。
- 如請求項25至26中任一項之解碼器(306),其中在判定該第一圖像是否為一靜止圖像時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括藉由以下步驟判定該第一圖像係一靜止圖像: 獲得(901)該第一圖像之各視訊寫碼層網路抽象層NAL單元之一NAL單元類型;及 判定(903)該第一圖像之全部視訊寫碼層NAL單元具有表示一IRAP圖像之一NAL單元類型。
- 如請求項25至26中任一項之解碼器(306),其中在判定該視訊位元流中之該第一圖像是否為一靜止圖像時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括判定該第一圖像是否為具有等於0之恢復POC計數之一GDR圖像。
- 如請求項25至26中任一項之解碼器(306),其中在判定該視訊位元流中之該第一圖像是否為一靜止圖像時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括從語法元素獲得一或多個值,其中來自語法元素之該等值指定該視訊位元流中之該第一圖像是否為一靜止圖像。
- 如請求項25至26中任一項之解碼器(306),其中在判定該第一圖像是否為一靜止圖像時,該記憶體包含當藉由該處理電路執行時引起該解碼器執行進一步操作之進一步指令,該等進一步操作包括藉由以下步驟判定該第一圖像係一靜止圖像: 從來自該第一圖像之一圖像標頭、來自該第一圖像之一圖塊標頭或來自與該第一圖像相關聯之一存取單元定界符(AUD)之一或多個語法元素解碼(1001)一或多個值;及 從該一或多個值判定(1003)該圖像係一靜止圖像。
- 如請求項25至26中任一項之解碼器(306),其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行包括以下步驟之進一步操作之進一步指令: 判定(1201)該第一圖像是否為該位元流中之一僅有圖像;及 回應於該指示值指示符合該第二設定檔且該第一圖像被判定為一靜止圖像且該第一圖像被判定為該位元流中之該僅有圖像,判定(1203)該解碼器能夠解碼該位元流之該第一圖像。
- 如請求項25至26中任一項之解碼器(306),其中該記憶體包含當藉由該處理電路執行時引起該解碼器執行包括以下步驟之進一步操作之進一步指令: 從該位元流提取(1301)一參數集; 藉由從該位元流中之一語法元素解碼該指示值來獲得(1303)該指示值;及 回應於該指示值指示(1305)位元流符合該第一設定檔或該第二設定檔: 從該位元流提取(1307)與該參數集相關聯之一靜止圖像;及 組合(1309)從該位元流提取之該參數集與從該位元流提取之該靜止圖像以形成一靜止圖像位元流而無需將該指示值重寫至該語法元素。
- 如請求項25至26中任一項之解碼器(306),其中一靜止圖像係以下之至少一者: 不取決於任何其他圖像之一影像或圖像; 不從任何其他圖像進行預測之一影像或圖像; 一IRAP圖像;及 具有等於0之恢復POC計數之一GDR圖像。
- 如請求項25至26中任一項之解碼器(306),其中該解碼器(306)係具有一媒體播放器(312)之一裝置(310)之部分。
- 一種電腦程式,其包括待藉由符合一第一設定檔之一解碼器(306)之處理電路(401)執行之程式碼,藉此該程式碼之執行引起該解碼器(306)執行包括以下步驟之操作: 獲得(601)一指示值,該指示值指示符合一設定檔; 判定(603)一視訊位元流中之一第一圖像是否為一靜止圖像;及 回應於該指示值指示符合一第二設定檔且該第一圖像被判定為一靜止圖像,判定(705)符合該第一設定檔之該解碼器(306)能夠解碼該視訊位元流之該第一圖像。
- 如請求項46之電腦程式,其中該電腦程式包括待藉由該解碼器(306)之處理電路(401)執行之進一步程式碼,藉此該程式碼之執行引起該解碼器(306)執行如請求項2至21中任一項之操作。
- 一種電腦程式產品,其包括包含待藉由符合一第一設定檔之一解碼器(306)之處理電路(401)執行之程式碼之一非暫時性儲存媒體,藉此該程式碼之執行引起該解碼器(306)執行包括以下步驟之操作: 獲得(601)一指示值,該指示值指示符合一設定檔; 判定(603)一視訊位元流中之一第一圖像是否為一靜止圖像;及 回應於該指示值指示符合一第二設定檔且該第一圖像被判定為一靜止圖像,判定(705)符合該第一設定檔之該解碼器(306)能夠解碼該視訊位元流之該第一圖像。
- 如請求項48之電腦程式產品,其中該非暫時性儲存媒體包含待藉由該解碼器(306)之該處理電路(401)執行之進一步程式碼,藉此該程式碼之執行引起該解碼器(306)執行如請求項2至21中任一項之操作。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063036080P | 2020-06-08 | 2020-06-08 | |
US63/036,080 | 2020-06-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202203652A TW202203652A (zh) | 2022-01-16 |
TWI777601B true TWI777601B (zh) | 2022-09-11 |
Family
ID=78846316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110120597A TWI777601B (zh) | 2020-06-08 | 2021-06-07 | 靜止圖像設定檔之偵測 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230308668A1 (zh) |
EP (1) | EP4162694A4 (zh) |
JP (1) | JP7535134B2 (zh) |
CN (1) | CN116018808A (zh) |
TW (1) | TWI777601B (zh) |
WO (1) | WO2021251878A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12069310B2 (en) * | 2021-09-29 | 2024-08-20 | Tencent America LLC | Techniques for constraint flag signaling for range extension |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140112383A1 (en) * | 2012-10-19 | 2014-04-24 | Broadcom Corporation | Decoding video streams using decoders supporting a different encoding profile |
US20150016542A1 (en) * | 2013-07-11 | 2015-01-15 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding video data |
US20160286239A1 (en) * | 2012-11-30 | 2016-09-29 | Sony Corporation | Image processing device and method |
US20160295211A1 (en) * | 2013-12-27 | 2016-10-06 | Sony Corporation | Decoding device and decoding method, and encoding device and encoding method |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020122574A1 (ko) * | 2018-12-13 | 2020-06-18 | 에스케이텔레콤 주식회사 | 코딩 툴 설정 방법 및 영상 복호화 장치 |
-
2021
- 2021-06-07 TW TW110120597A patent/TWI777601B/zh not_active IP Right Cessation
- 2021-06-07 CN CN202180041065.9A patent/CN116018808A/zh active Pending
- 2021-06-07 EP EP21821243.9A patent/EP4162694A4/en active Pending
- 2021-06-07 JP JP2022575337A patent/JP7535134B2/ja active Active
- 2021-06-07 WO PCT/SE2021/050541 patent/WO2021251878A1/en active Application Filing
- 2021-06-07 US US18/008,644 patent/US20230308668A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140112383A1 (en) * | 2012-10-19 | 2014-04-24 | Broadcom Corporation | Decoding video streams using decoders supporting a different encoding profile |
US20160286239A1 (en) * | 2012-11-30 | 2016-09-29 | Sony Corporation | Image processing device and method |
US20150016542A1 (en) * | 2013-07-11 | 2015-01-15 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding video data |
US20160295211A1 (en) * | 2013-12-27 | 2016-10-06 | Sony Corporation | Decoding device and decoding method, and encoding device and encoding method |
Also Published As
Publication number | Publication date |
---|---|
EP4162694A1 (en) | 2023-04-12 |
US20230308668A1 (en) | 2023-09-28 |
JP2023529191A (ja) | 2023-07-07 |
EP4162694A4 (en) | 2024-01-10 |
JP7535134B2 (ja) | 2024-08-15 |
CN116018808A (zh) | 2023-04-25 |
TW202203652A (zh) | 2022-01-16 |
WO2021251878A1 (en) | 2021-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11044487B2 (en) | Signaling change in output layer sets | |
US20210314584A1 (en) | Signaling change in output layer sets | |
JP7222043B2 (ja) | ビデオコーディングにおけるデコード機能情報のストレージ | |
KR102540022B1 (ko) | 인코딩된 비디오 비트스트림에 포함된 데이터의 양을 줄이기 위한 파라미터 세트의 시그널링 파라미터 값 정보 | |
CN114503575A (zh) | 对静止图像配置文件的语法元素的约束 | |
US20220109848A1 (en) | Adaptation parameter set storage in video coding | |
US11818337B2 (en) | Constraints on reference picture lists entries | |
US20220303558A1 (en) | Compact network abstraction layer (nal) unit header | |
CN116830573A (zh) | 交叉随机访问点信令增强 | |
US20220078463A1 (en) | Picture header presence | |
TWI777601B (zh) | 靜止圖像設定檔之偵測 | |
US20220286710A1 (en) | Signaling of access unit delimiter | |
CN116724549A (zh) | 跨随机接入点样点组 | |
KR20220160104A (ko) | 양방향 픽처 조건에 기초한 디코딩 | |
CN116547971A (zh) | Vvc视频编解码中的滚动样点组 | |
JP2022549798A (ja) | サブピクチャスライス位置導出を伴うセグメント位置シグナリング | |
US12022084B2 (en) | Video coding layer up-switching indication | |
JP7411787B2 (ja) | セグメント存在情報を提供すること | |
US20230247211A1 (en) | Scalability using temporal sublayers | |
WO2024177552A1 (en) | Refresh indicator for coded video | |
CN117296326A (zh) | 用于视频编码和视频解码的方法、装置和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |