TW202139697A - 量化相關參數之傳訊技術 - Google Patents

量化相關參數之傳訊技術 Download PDF

Info

Publication number
TW202139697A
TW202139697A TW110100790A TW110100790A TW202139697A TW 202139697 A TW202139697 A TW 202139697A TW 110100790 A TW110100790 A TW 110100790A TW 110100790 A TW110100790 A TW 110100790A TW 202139697 A TW202139697 A TW 202139697A
Authority
TW
Taiwan
Prior art keywords
flag
enabled
sps
slices
hiding
Prior art date
Application number
TW110100790A
Other languages
English (en)
Other versions
TWI792149B (zh
Inventor
賴貞延
莊子德
陳慶曄
徐志瑋
Original Assignee
聯發科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 聯發科技股份有限公司 filed Critical 聯發科技股份有限公司
Publication of TW202139697A publication Critical patent/TW202139697A/zh
Application granted granted Critical
Publication of TWI792149B publication Critical patent/TWI792149B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Steroid Compounds (AREA)
  • Peptides Or Proteins (AREA)

Abstract

視訊解碼器解析適用於包括當前圖片的當前視訊圖片序列的序列參數集(SPS),SPS包括第一從屬量化標誌和第一符號隱藏標誌。 當第一從屬量化標誌指示針對當前序列啟用從屬量化時,解碼器解析第二從屬量化標誌以指示是否使用從屬量化來量化當前圖片的一個或多個切片。 當第二從屬量化標誌指示當前圖片的一個或多個切片未使用從屬量化且第一符號隱藏標誌指示對當前序列啟用符號隱藏時,解碼器解析第二符號隱藏標誌以指示是否符號隱藏用於量化當前圖片的一個或多個切片。

Description

量化相關參數之傳訊技術
本公開一般涉及視訊編碼。 特別地,本公開涉及傳訊(signaling)變換和量化相關參數的方法。
除非本文另有說明,本節中描述的方法不是下面列出的申請專利範圍的現有技術,並且不能通過包含在本節中而承認為現有技術。
在實現高效視訊編碼(HEVC)的視訊編解碼系統中,輸入視訊信號是從重建信號預測的,重建信號是從編碼圖片區域導出的。 通過線性變換處理預測殘差信號。 變換係數與位元流中的其他輔助資訊一起被量化和熵編碼。 重建信號是在對逆量化變換係數進行逆變換之後根據預測信號和重建殘差信號生成的。 重建信號通過環路濾波進一步處理以去除編碼偽影。 解碼後的圖片存儲在幀緩衝器中,用於輸出和預測輸入視訊信號中的未來圖片。
在HEVC中,編碼圖片被劃分為由相關聯的編解碼樹單元(CTU)表示的非重疊方形塊區域。編碼圖片可以由切片集合表示,每個切片包含整數個 CTU。切片中的各個 CTU 按光柵掃描順序進行處理。可以使用最多兩個運動向量和參考索引來使用幀內預測或幀間預測來解碼雙向預測(bi-predictive,簡寫為B)切片,以預測每個塊的樣本值。使用至多一個運動向量和參考索引來使用幀內預測或幀間預測解碼預測(predictive,簡寫為P)切片,以預測每個塊的樣本值。僅使用幀內預測對幀內 (intra,簡寫為I) 切片進行解碼。
可以使用遞歸四叉樹(QT)結構將CTU劃分為多個非重疊編解碼單元(CU)以適應各種局部運動和紋理特性。為每個 CU 指定一個或多個預測單元 (PU)。預測單元與相關聯的 CU 語法一起用作傳訊預測子資訊的基本單元。指定的預測過程用於預測 PU 內相關像素樣本的值。可以使用殘差四叉樹 (RQT) 結構進一步分割 CU,以表示相關聯的預測殘差信號。 RQT 的葉節點對應於變換單元 (TU)。變換單元包括大小為8x8、16x16或32x32的亮度樣本的變換塊(TB)或四個大小為4x4的亮度樣本的變換塊,以及4:2:0顏色格式的圖片的色度樣本的兩個對應變換塊。整數變換應用於變換塊,量化係數的水平值(level value)與其他邊資訊一起在位元流中進行熵編解碼。
術語編解碼樹塊 (CTB)、編解碼塊 (CB)、預測塊 (PB) 和變換塊 (TB) 被定義為分別指定與 CTU、CU、PU 和 TU相關聯的一個顏色分量的2D樣本陣列。因此,一個 CTU 由一個亮度 CTB、兩個色度 CTB 和相關的句法元素組成。類似的關係適用於 CU、PU 和 TU。樹分區通常同時應用於亮度和色度,但當色度達到某些最小尺寸時會出現例外情況。在其他一些編解碼標準中,每個 CTU 可以被四叉樹分割成一個或多個較小尺寸的編解碼單元 (CU),四叉樹使用二元和三元分裂的嵌套多類型樹。生成的 CU 分區可以是正方形或矩形。
為了實現跨空間頻率的均勻量化(uniform quantization),量化矩陣(QM)根據其相關頻率範圍內的感知靈敏度對與變換係數相關聯的每個頻率通道(frequency channel)進行加權,使得變換塊中的較低頻率係數被量化為比高頻係數更精細的量化步長(finer quantization step size)。在解碼器處,相應的量化矩陣對每個頻率通道的逆量化變換係數進行反向加權。量化矩陣已成功應用於各種視訊編解碼標準,如 H.264/AVC(高級視訊編解碼)和 H.265/HEVC(高效視訊編解碼)以及眾多商業產品中,以提高視訊內容的主觀品質。
以下概述僅是說明性的,並不旨在以任何方式進行限制。即,提供以下概要以介紹本文描述的新穎且非顯而易見的技術的概念、亮點、益處和優點。在下面的詳細描述中進一步描述了選擇而不是所有的實現。因此,以下概述不旨在確定要求保護的主題的基本特徵,也不旨在用於確定要求保護的主題的範圍。
本公開的一些實施例提供了一種用於傳訊或解析量化相關參數的方法。在一些實施例中,視訊解碼器從位元流接收資料以被解碼為包括一個或多個切片的當前圖片。解碼器從適用於包括當前圖片的視訊圖片的當前序列的位元流解析序列參數集(SPS),SPS包括第一從屬(dependent)量化標誌和第一符號(sign)隱藏標誌。當第一從屬量化標誌指示針對當前序列啟用從屬量化時,視訊解碼器從位元流解析第二從屬量化標誌以指示是否使用從屬量化來量化當前圖片的一個或多個切片。當第二從屬量化標誌指示未對當前圖片的一個或多個切片使用從屬量化並且第一符號隱藏標誌指示為當前序列啟用符號隱藏時,視訊解碼器從位元流解析第二符合隱藏標誌,用於指示是否使用符號隱藏來量化當前圖片的一個或多個切片。視訊解碼器基於當前圖片的一個或多個切片的逆量化變換係數基於是否使用從屬量化以及是否使用符號隱藏來重建當前圖片。
當符號隱藏用於量化當前圖片的一個或多個切片時,一個或多個切片中的係數子集的第一非零變換係數的符號位元是基於係數子集中的所有非零係數和的奇偶校驗確定的。當對當前圖片的一個或多個切片使用從屬量化時,當前圖片的一個或多個切片中的當前變換係數被限制為根據網格結構基於重建順序中當前變換係數之前的變換係數確定的一組允許(重建)值。一個或多個切片的變換係數由純量量化器量化,該純量量化器由按照重建順序在當前變換係數之前的變換係數的奇偶校驗確定。
在一些實施例中,僅針對當前圖片的一個或多個切片啟用從屬量化和符號隱藏中的一個。換句話說,從屬量化和符號隱藏在位元流中專門傳訊。在一些實施例中,第一從屬量化標誌和第一符號隱藏標誌在SPS中被排他地傳訊,並且當第一從屬量化標誌在SPS中被明確地傳訊以啟用從屬量化時,第一符號隱藏標誌在SPS中不被傳訊並且被推斷為禁用。
在一些實施例中,在適用於當前圖片的一個或多個切片的圖片報頭中傳訊第二從屬量化標誌。在一些實施例中,在適用於當前圖片的一個或多個切片的圖片報頭中傳訊第二符號隱藏標誌。在一些實施例中,當第二從屬量化標誌指示從屬量化用於當前圖片的一個或多個切片時,解碼器推斷將針對當前圖片的一個或多個切片禁用符號隱藏並且不解析第二符號隱藏標誌。
在以下詳細描述中,通過示例的方式闡述了許多具體細節以便提供對相關教導的透徹理解。 基於本文描述的教導的任何變化、派生和/或擴展都在本公開的保護範圍內。 在一些情況下,與本文公開的一個或多個示例實現有關的眾所周知的方法、過程、組件和/或電路可以在沒有細節的相對較高的水平上進行描述,以避免不必要地模糊本公開的教導的方面。 I. 符號資料隱藏
符號資料隱藏(或符號位元隱藏或符號隱藏)是在量化變換係數時使用的位元率降低技術。具體地,基於係數子集中所有非零係數之和的奇偶校驗(parity)來推斷係數子集(例如,變換係數的 4x4 編解碼組)的第一非零變換係數的符號位元,而不是在位元流中顯示地發信。
在一些實施例中,符號隱藏技術被應用如下:如果4x4係數子集滿足特定條件,則不編碼(4x4係數子集的)第一非零係數的符號位元(例如,coeff_sign_flag),並且解碼器從該係數子集中所有非零係數之和的奇偶校驗中推斷符號位元。 (對於某些編解碼標準,語法元素 coeff_sign_flag[n] 指定係數子集中掃描位置 n 的變換係數水平(level)的符號。)
在HEVC中,僅當以下條件為真時才應用符號隱藏:
(last_non_zero_position_in_subset - first_non_zero_position_in_subset) > = 閾值
如果符號隱藏被應用於係數子集,則位元流的編碼器確保該係數子集中所有非零係數之和的奇偶校驗與第一非零係數的符號位元匹配。 II. 網格編解碼的量化 Trellis Coded Quantization 簡寫為 TCQ
網格編解碼的量化(TCQ)是網格結構和集合劃分的組合。通過沿著網格結構找到具有最小失真的路徑,可以找到具有最小失真(通過例如均方誤差或 MSE 測量)的幾個樣本的編解碼輸出。
在一些實施例中,應用TCQ來實現從屬純量量化。具體而言,變換係數的可容許重建值的集合取決於在重建順序中在當前變換係數水平之前的變換係數水平的值。第1圖示出了用於TCQ從屬量化的兩個純從屬量量化器,由Q0和Q1表示。可用重建水平的位置由量化步長 Δ 唯一指定。兩個定純量化器 Q0 和 Q1 的特點如下:
Q0:第一量化器Q0的重建水平由量化步長Δ的偶數整數倍給出。當使用此量化器時,根據 t' = 2⋅k⋅Δ 計算重建的變換係數 t',其中 k 表示相關的變換係數水平(​​傳輸的量化索引)。
Q1:第二量化器Q1的重構級別由量化步長Δ的奇整數倍給出,此外,重構級別等於0。第二量化器Q1的重建水平由量化步長Δ的奇整數倍以及另外的等於0的重建水平給出。變換係數水平 k 到重建變換係數 t' 的映射根據 t'= (2⋅k – sgn(k) )⋅Δ 指定,其中 sgn(⋅) 表示符號函數 sgn(x) = ( k = = 0 ? 0 : ( k < 0 ? –1 : 1 ) )。
所使用的純量量化器(Q0或Q1)沒有在位元流中明確地傳訊。它由在編解碼/重建順序中位於當前變換係數之前的變換係數水平的奇偶校驗確定。切換由具有四個狀態的有限狀態機完成。第2圖示出了對應於在從屬純量量化中使用的網格結構的有限狀態機。
在量化過程中,視訊編碼器/解碼器使用維特比算法遍歷網格結構。第3圖示出了量化過程所使用的網格結構。在每個階段,每個狀態具有較小失真的路徑保持不變。因此,在反向遍歷時可以唯一確定路徑。找到具有最小失真的幾個樣本的水平相當於找到以最小失真結束的路徑。
對於一些實施例,第4圖圖示了用於每個編解碼組(CG)中的係數的四通道(four-pass)句法傳訊方法。如下所示: • 通道1 :為每個掃描位置傳輸以下標誌(使用熵編解碼中的常規模式): sig_coeff_flag 以及,當sig_coeff_flag 等於1 時,par_level_flag 和rem_abs_gt1_flag; • 通道 2:對於rem_abs_gt1_flag 等於1 的所有掃描位置,使用算術編解碼引擎的常規模式對rem_abs_gt2_flag 進行編解碼; • 通道 3:對於rem_abs_gt2_flag 等於1 的所有掃描位置,非二進位語法元素abs_remainder 在算術編解碼引擎的旁路(bypass) 模式下編解碼; 以及 • 通道4:對於sig_coeff_flag 等於1 的所有掃描位置,在算術編解碼引擎的旁路模式下對語法元素sign_flag 進行編解碼。
第5圖示出了編解碼組中掃描位置的概率模型的選擇。該圖示出了被分成多個編解碼組(coding group,簡寫為CG)的變換塊500。每個 CG 包括 4x4 掃描位置的變換係數。例如,對於 CG 510,黑色方塊代表當前掃描位置,散列方塊(hashed square)代表其局部鄰域(local neighbourhood)。局部鄰域用於選擇當前掃描位置的概率模型。上下文建模和二值化取決於局部鄰域的以下措施: • numSig:局部鄰域中非零層的數量; • sumAbs1:在局部鄰域中第一通道後部分重建的絕對水平(level)的總和(absLevel1); • sumAbs:局部鄰域中重建的絕對水平的總和 • d = x + y,其中x 和y 分別是當前TU 中x 軸和y 軸的位置。
sig_flag的上下文模型依賴於當前狀態,可以如下推導: •對於亮度分量: ctxIdSig = 18 * max(0, state−1) + min( sumAbs1, 5 ) + ( d < 2 ? 12 : ( d < 5 ? 6 : 0 ) ); •對於色度分量: ctxIdSig = 12 * max(0, state−1) + min( sumAbs1, 5 ) + ( d < 2 ? 6 : 0 ) );
par_level_flag 的上下文模型描述如下: •如果當前掃描位置等於最後一個非零水平的位置(由傳輸的 x 和 y 坐標所示),則 ctxIdPar 設置為等於 0。 •否則,如果當前顏色分量是亮度分量,則上下文索引設置為 ctxIdPar = 1 + min( sumAbs1 – numSig, 4 ) + ( d == 0 ? 15 : ( d < 3 ? 10 : ( d < 10 ? 5 : 0 ) ) ) •否則(當前顏色分量是色度分量), 則上下文索引設置為 ctxIdPar = 1 + min( sumAbs1 – numSig, 4 ) + ( d == 0 ? 5 : 0 )
rem_abs_gtx_flag的上下文描述如下: ctxIdGt1 = ctxIdPar ctxIdGt2 = ctxIdPar
非二進位語法元素abs_remainder使用與HEVC中相同類別的萊斯代碼(Rice code)被二進位化。萊斯參數 RicePar 確定如下: • 如果 sumAbs – numSig 小於 12,則將 RicePar 設置為等於 0。 • 否則,如果 sumAbs – numSig 小於 25,則將 RicePar 設置為等於 1。 • 否則,將 RicePar 設置為等於 2。 III.        從屬量化和符號隱藏的傳訊
對於一些實施例,根據表1指定適用於包括視訊圖片序列的編解碼層視訊序列(coded layer video sequence,簡寫為CLVS)的序列參數集(sequence parameter set,簡寫為SPS): 1: 示例的序列參數集 (SPS)
seq_parameter_set_rbsp( ) { 描述符
sps_decoding_parameter_set_id u(4)
sps_video_parameter_set_id u(4)
sps_max_sublayers_minus1 u(3)
sps_reserved_zero_4bits u(4)
sps_ptl_dpb_hrd_params_present_flag u(1)
   if( sps_ptl_dpb_hrd_params_present_flag )  
      profile_tier_level( 1, sps_max_sublayers_minus1 )  
gdr_enabled_flag u(1)
sps_seq_parameter_set_id u(4)
chroma_format_idc u(2)
   if( chroma_format_idc  = =  3 )  
separate_colour_plane_flag u(1)
  ref_pic_resampling _enabled_flag u(1)
pic_width_max_in_luma_samples ue(v)
pic_height_max_in_luma_samples ue(v)
sps_log2_ctu_size_minus5 u(2)
subpics_present_flag u(1)
   if( subpics_present_flag ) {  
     sps_ num_subpics_minus1 u(8)
      for( i = 0; i  <=  sps_num_subpics_minus1; i++ ) {  
        subpic_ctu_top_left_x [ i ] u(v)
        subpic_ctu_top_left_y [ i ] u(v)
        subpic_width_minus1 [ i ] u(v)
        subpic_height_minus1 [ i ] u(v)
        subpic_treated_as_pic_flag [ i ] u(1)
        loop_filter_across_subpic_enabled_flag [ i ] u(1)
      }  
   }  
  sps_subpic_id_present_flag u(1)
   if( sps_subpics_id_present_flag ) {  
     sps_subpic_id_signalling_present_flag u(1)
      if( sps_subpics_id_signalling_present_flag ) {  
        sps_subpic_id_len_minus1 ue(v)
         for( i = 0; i  <=   sps_num_subpics_minus1; i++ )  
           sps_subpic_id [ i ] u(v)
      }  
   }  
bit_depth_minus8 ue(v)
min_qp_prime_ts_minus4 ue(v)
sps_weighted_pred_flag u(1)
sps_weighted_bipred_flag u(1)
log2_max_pic_order_cnt_lsb_minus4 u(4)
  sps_poc_msb_flag u(1)
   if( sps_poc_msb_flag )  
     poc_msb_len_minus1 ue(v)
   if( sps_max_sublayers_minus1 > 0 )  
sps_sublayer_dpb_params_flag u(1)
   if( sps_ptl_dpb_hrd_params_present_flag )  
      dpb_parameters( 0, sps_max_sublayers_minus1, sps_sublayer_dpb_params_flag )  
  long_term_ref_pics_flag u(1)
  inter _layer_ref_pics_present_flag u(1)
  sps_idr_rpl_present_flag u(1)
  rpl1_same_as_rpl0_flag u(1)
   for( i = 0; i < !rpl1_same_as_rpl0_flag ? 2 : 1; i++ ) {  
num_ref_pic_lists_in_sps [ i ] ue(v)
      for( j = 0; j < num_ref_pic_lists_in_sps[ i ]; j++)  
         ref_pic_list_struct( i, j )  
   }  
   if( ChromaArrayType != 0 )  
qtbtt_dual_tree_intra_flag u(1)
  log2_min_luma_coding_block_size_minus2 ue(v)
partition_constraints_override_enabled_flag u(1)
sps_log2_diff_min_qt_min_cb_intra_slice_luma ue(v)
sps_log2_diff_min_qt_min_cb_inter_slice ue(v)
sps_max_mtt_hierarchy_depth_inter_slice ue(v)
sps_max_mtt_hierarchy_depth_intra_slice_luma ue(v)
   if( sps_max_mtt_hierarchy_depth_intra_slice_luma  !=  0 ) {  
sps_log2_diff_max_bt_min_qt_intra_slice_luma ue(v)
sps_log2_diff_max_tt_min_qt_intra_slice_luma ue(v)
   }  
   if( sps_max_mtt_hierarchy_depth_inter_slice  !=  0 ) {  
sps_log2_diff_max_bt_min_qt_inter_slice ue(v)
sps_log2_diff_max_tt_min_qt_inter_slice ue(v)
   }  
   if( qtbtt_dual_tree_intra_flag ) {  
     sps_log2_diff_min_qt_min_cb_intra_slice_chroma ue(v)
     sps_max_mtt_hierarchy_depth_intra_slice_chroma ue(v)
      if( sps_max_mtt_hierarchy_depth_intra_slice_chroma  !=  0 ) {  
        sps_log2_diff_max_bt_min_qt_intra_slice_chroma ue(v)
        sps_log2_diff_max_tt_min_qt_intra_slice_chroma ue(v)
      }  
   }  
sps_max_luma_transform_size_64_flag u(1)
sps_joint_cbcr_enabled_flag u(1)
   if( ChromaArrayType != 0 ) {  
     same_qp_table_for_chroma u(1)
      numQpTables = same_qp_table_for_chroma ? 1 : ( sps_joint_cbcr_enabled_flag ? 3 : 2 )  
      for( i = 0; i < numQpTables; i++ ) {  
qp_table_start_minus26 [ i ] se(v)
        num_points_in_qp_table_minus1 [ i ] ue(v)
         for( j = 0; j <= num_points_in_qp_table_minus1[ i ]; j++ ) {  
           delta_qp_in_val_minus1 [ i ][ j ] ue(v)
           delta_qp_diff_val [ i ][ j ] ue(v)
         }  
      }  
   }  
sps_sao_enabled_flag u(1)
sps_alf_enabled_flag u(1)
  sps_transform_skip_enabled_flag u(1)
   if( sps_transform_skip_enabled_flag )  
sps_bdpcm_enabled_flag u(1)
   if( sps_bdpcm_enabled_flag  &&  chroma_format_idc  = =  3 )  
     sps_bdpcm_chroma_enabled_flag u(1)
sps_ref_wraparound_enabled_flag u(1)
   if( sps_ref_wraparound_enabled_flag )  
sps_ref_wraparound_offset_minus1 ue(v)
sps_temporal_mvp_enabled_flag u(1)
   if( sps_temporal_mvp_enabled_flag )  
sps_sbtmvp_enabled_flag u(1)
sps_amvr_enabled_flag u(1)
sps_bdof_enabled_flag u(1)
   if( sps_bdof_enabled_flag )  
sps_bdof_pic_present_flag u(1)
sps_smvd_enabled_flag u(1)
sps_dmvr_enabled_flag u(1)
   if( sps_dmvr_enabled_flag)  
sps_dmvr_pic_present_flag u(1)
sps_mmvd_enabled_flag u(1)
sps_isp_enabled_flag u(1)
sps_mrl_enabled_flag u(1)
sps_mip_enabled_flag u(1)
   if( ChromaArrayType != 0 )  
sps_cclm_enabled_flag u(1)
   if( chroma_format_idc  = =  1 ) {  
sps_chroma_horizontal_collocated_flag u(1)
sps_chroma_vertical_collocated_flag u(1)
   }  
sps_mts_enabled_flag u(1)
   if( sps_mts_enabled_flag ) {  
sps_explicit_mts_intra_enabled_flag u(1)
sps_explicit_mts_inter_enabled_flag u(1)
   }  
  sps_sbt_enabled_flag u(1)
sps_ affine _enabled_flag u(1)
   if( sps_affine_enabled_flag ) {  
sps_affine_type_flag u(1)
  sps_affine_amvr_enabled_flag u(1)
sps_affine_prof_enabled_flag u(1)
      if( sps_affine_prof_enabled_flag )  
sps_prof_pic_present_flag u(1)
   }  
   if( chroma_format_idc  = =  3 ) {  
sps_palette_enabled_flag u(1)
sps_act_enabled_flag u(1)
   }  
sps_bcw_enabled_flag u(1)
sps_ibc_enabled_flag u(1)
sps_ciip_enabled_flag u(1)
   if( sps_mmvd_enabled_flag )  
sps_fpel_mmvd_enabled_flag u(1)
sps_ triangle _enabled_flag u(1)
sps_lmcs_enabled_flag u(1)
sps_lfnst_enabled_flag u(1)
sps_ladf_enabled_flag u(1)
   if( sps_ladf_enabled_flag ) {  
     sps_num_ladf_intervals_minus2 u(2)
     sps_ladf_lowest_interval_qp_offset se(v)
      for( i = 0; i < sps_num_ladf_intervals_minus2 + 1; i++ ) {  
        sps_ladf_qp_offset [ i ] se(v)
        sps_ladf_delta_threshold_minus1 [ i ] ue(v)
      }  
   }  
sps_ scaling_list_enabled_flag u(1)
  sps_loop_filter_across_virtual_boundaries_disabled_present_flag u(1)
   if( sps_loop_filter_across_virtual_boundaries_disabled_present_flag ) {  
     sps_num_ver_virtual_boundaries u(2)
      for( i = 0; i < sps_num_ver_virtual_boundaries; i++ )  
        sps_virtual_boundaries_pos_x [ i ] u(13)
     sps_num_hor_virtual_boundaries u(2)
      for( i = 0; i < sps_num_hor_virtual_boundaries; i++ )  
        sps_virtual_boundaries_pos_y [ i ] u(13)
   }  
   if( sps_ptl_dpb_hrd_params_present_flag ) {  
sps_general_hrd_params_present_flag u(1)
      if( sps_general_hrd_params_present_flag ) {  
         general_hrd_parameters( )  
         if( sps_max_sublayers_minus1 > 0 )  
           sps_sublayer_cpb_params_present_flag u(1)
         firstSubLayer = sps_sublayer_cpb_params_present_flag ? 0 :                sps_max_sublayers_minus1  
         ols_hrd_parameters( firstSubLayer, sps_max_sublayers_minus1 )  
      }  
   }  
field_seq_flag u(1)
vui_parameters_present_flag u(1)
   if( vui_parameters_present_flag )  
      vui_parameters( ) /* Specified in ITU-T H.SEI | ISO/IEC 23002-7 */  
  sps_extension_flag u(1)
   if( sps_extension_flag )  
      while( more_rbsp_data( ) )  
        sps_extension_data_flag u(1)
   rbsp_trailing_bits( )  
}  
在一些實施例中,添加SPS標誌用於從屬量化。 相關的語法和語義如表2所示: 2 : 具有添加標誌的SPS用於從屬量化:
seq_parameter_set_rbsp ( ) { 描述符
 
sps_sao_enabled_flag u(1)
sps_alf_enabled_flag u(1)
  sps_transform_skip_enabled_flag u(1)
   if( sps_transform_skip_enabled_flag )  
sps_bdpcm_enabled_flag u(1)
   if( sps_bdpcm_enabled_flag  &&  chroma_format_idc  = =  3 )  
     sps_bdpcm_chroma_enabled_flag u(1)
sps_ref_wraparound_enabled_flag u(1)
   if( sps_ref_wraparound_enabled_flag )  
sps_ref_wraparound_offset_minus1 ue(v)
  …  
sps_dep_quant_enabled_flag u(1)
   
   if( picture_header_extension_present_flag ) {  
     ph_extension_length ue(v)
      for( i = 0; i < ph_extension_length; i++)  
        ph_extension_data_byte [ i ] u(8)
   }  
   rbsp_trailing_bits( )  
}  
sps_dep_quant_enabled_flag的值為1指定從屬量化可用於CLVS中的圖片解碼。 sps_dep_quant_enabled_flag 的值為 0 指定在 CLVS 中不使用從屬量化。 當 sps_dep_quant_enabled_flag 不存在時,它被推斷為等於 0。
在一些實施例中,當前圖片所參考的圖片參數集(PPS)包括用於啟用從屬量化的語法元素。 表 3 示出了示例圖片報頭(header),其中使用從屬量化的 SPS 標誌來確定是否在圖片水平傳訊啟用從屬量化。 3 :圖片報頭使用 SPS 標誌用於從屬量化
picture_header_rbsp( ) {  
 
   if ( !pps_dep_quant_enabled_flag && sps_dep_quant_enabled_flag)  
     pic_dep_quant_enabled_flag u(1)
   if( !pic_dep_quant_enabled_flag )  
     sign_data_hiding_enabled_flag u(1)
   if( deblocking_filter_override_enabled_flag ) {  
     pic_deblocking_filter_override_present_flag u(1)
      if( pic_deblocking_filter_override_present_flag ) {  
        pic_deblocking_filter_override_flag u(1)
 
為0的pic_dep_quant_enabled_flag的值指定對於與圖片報頭相關聯的切片禁用從屬量化。 pic_dep_quant_enabled_flag 的值為 1 指定對與 PH 關聯的切片啟用從屬量化。當 pic_dep_quant_enabled_flag 不存在且 sps_dep_quant_enabled_flag 為 0 時,pic_dep_quant_enabled_flag 被推斷為 0。否則,當 pic_dep_quant_enabled_flag 不存在且 sps_dep_quant_enabled_flag 為 1 時,pic_dep_quant_enabled_flag 的值被推斷為pps_dep_quant_enable_idc – 1。
pps_dep_quant_enabled_idc的值為0指定語法元素pic_dep_quant_enabled_flag可以存在於參考PPS的圖片報頭中。 pps_dep_quant_enabled_idc 的值為 1 或 2 指定語法元素 pic_dep_quant_enabled_flag 不存在於參考 PPS 的 PH 中。 (pps_dep_quant_enabled_idc 的值為 3 保留供將來使用。)
在一些實施例中,SPS標誌被添加用於從屬量化和符號隱藏,並且用於從屬量化的標誌和用於符號隱藏的標誌被排他地傳訊。具體而言,僅當從屬量化被禁用(sps_dep_quant_enabled_flag 為 0)時,才傳訊 sps_sign_data_hiding_enabled_flag。相關的語法和語義如表 4 所示。 4 :具有標誌的 SPS 用於從屬量化和符號隱藏
seq_parameter_set_rbsp ( ) { 描述符
 
sps_sao_enabled_flag u(1)
sps_alf_enabled_flag u(1)
  sps_transform_skip_enabled_flag u(1)
   if( sps_transform_skip_enabled_flag )  
sps_bdpcm_enabled_flag u(1)
   if( sps_bdpcm_enabled_flag  &&  chroma_format_idc  = =  3 )  
     sps_bdpcm_chroma_enabled_flag u(1)
sps_ref_wraparound_enabled_flag u(1)
   if( sps_ref_wraparound_enabled_flag )  
sps_ref_wraparound_offset_minus1 ue(v)
  …  
sps_dep_quant_enabled_flag u(1)
  if (!sps_dep_quant_enabled_flag)  
sps_ sign_data_hiding_enabled_flag u(1)
   if( picture_header_extension_present_flag ) {  
     ph_extension_length ue(v)
      for( i = 0; i < ph_extension_length; i++)  
        ph_extension_data_byte [ i ] u(8)
   }  
   rbsp_trailing_bits( )  
}  
語法元素sps_sign_data_hiding_enabled_flag的值為0指定在CLVS中禁用符號隱藏。 sign_data_hiding_enabled_flag 的值為 1 表示在 CLVS 中啟用符號隱藏。 當 sps_sign_data_hiding_enabled_flag 不存在時,它被推斷為等於 0。 表 5 顯示了一個示例的圖片報頭,其中用於從屬量化和符號隱藏的SPS標誌用於確定是否在圖片水平傳訊從屬量化啟用和符號隱藏啟用 (適用於圖片的切片)。 5: 圖片報頭使用 SPS 標誌用於 從屬量化和符號隱藏
picture_header_rbsp( ) {  
 
   if ( !pps_dep_quant_enabled_flag && sps_dep_quant_enabled_flag)  
     pic_dep_quant_enabled_flag u(1)
   if( !pic_dep_quant_enabled_flag && sps_sign_data_hiding_enabled_flag)  
     sign_data_hiding_enabled_flag u(1)
   if( deblocking_filter_override_enabled_flag ) {  
     pic_deblocking_filter_override_present_flag u(1)
      if( pic_deblocking_filter_override_present_flag ) {  
        pic_deblocking_filter_override_flag u(1)
 
在一些實施例中,用於符號隱藏的標誌在SPS中用於從屬量化的標誌之前傳訊,並且用於從屬量化的標誌和用於符號隱藏的標誌被排他地傳訊。 具體而言,僅當符號隱藏被禁用(sps_sign_data_hiding_enabled_flag 為 0)時才會傳訊 sps_dep_quant_enabled_flag。 表 6 顯示了相應的示例 SPS。 6 :在從屬量化之前傳訊符號隱藏的 SPS
seq_parameter_set_rbsp ( ) { 描述符
 
sps_sao_enabled_flag u(1)
sps_alf_enabled_flag u(1)
  sps_transform_skip_enabled_flag u(1)
   if( sps_transform_skip_enabled_flag )  
sps_bdpcm_enabled_flag u(1)
   if( sps_bdpcm_enabled_flag  &&  chroma_format_idc  = =  3 )  
     sps_bdpcm_chroma_enabled_flag u(1)
sps_ref_wraparound_enabled_flag u(1)
   if( sps_ref_wraparound_enabled_flag )  
sps_ref_wraparound_offset_minus1 ue(v)
  …  
sps_ sign_data_hiding_enabled_flag  
  if (!sps_sign_data_hiding_enabled_flag)  
   sps_dep_quant_enabled_flag u(1)
   if( picture_header_extension_present_flag ) {  
     ph_extension_length ue(v)
      for( i = 0; i < ph_extension_length; i++)  
        ph_extension_data_byte [ i ] u(8)
   }  
   rbsp_trailing_bits( )  
}  
在一些實施例中,用於從屬量化和符號隱藏的SPS標誌都在SPS中傳訊,但是它們被限制為排他地啟用。 相關的語法和語義如表 7 所示。 7 :傳訊 符號隱藏和從屬量化的SPS
seq_parameter_set_rbsp ( ) { 描述符
 
sps_sao_enabled_flag u(1)
sps_alf_enabled_flag u(1)
  sps_transform_skip_enabled_flag u(1)
   if( sps_transform_skip_enabled_flag )  
sps_bdpcm_enabled_flag u(1)
   if( sps_bdpcm_enabled_flag  &&  chroma_format_idc  = =  3 )  
     sps_bdpcm_chroma_enabled_flag u(1)
sps_ref_wraparound_enabled_flag u(1)
   if( sps_ref_wraparound_enabled_flag )  
sps_ref_wraparound_offset_minus1 ue(v)
  …  
sps_ sign_data_hiding_enabled_flag u(1)
 sps_dep_quant_enabled_flag u(1)
   if( picture_header_extension_present_flag ) {  
     ph_extension_length ue(v)
      for( i = 0; i < ph_extension_length; i++)  
        ph_extension_data_byte [ i ] u(8)
   }  
   rbsp_trailing_bits( )  
}  
如果sps_sign_data_hidigin_enabled_flag等於1,則sps_dep_quant_enabled_flag的值被約束為等於0,並且如果sps_dep_quant_enabled_flag等於1,則sps_sign_data_hidigin_enabled_flag的值被約束為等於0。
在一些實施例中,聯合從屬量化/符號隱藏指示符存在於SPS中以指示從屬量化和符號隱藏的開關。 相關的語法和語義如表 8 所示。 8: 具有 聯合從屬量化/符號隱藏指示符的SPS
seq_parameter_set_rbsp ( ) { 指示符
 
sps_sao_enabled_flag u(1)
sps_alf_enabled_flag u(1)
  sps_transform_skip_enabled_flag u(1)
   if( sps_transform_skip_enabled_flag )  
sps_bdpcm_enabled_flag u(1)
   if( sps_bdpcm_enabled_flag  &&  chroma_format_idc  = =  3 )  
     sps_bdpcm_chroma_enabled_flag u(1)
sps_ref_wraparound_enabled_flag u(1)
   if( sps_ref_wraparound_enabled_flag )  
sps_ref_wraparound_offset_minus1 ue(v)
  …  
sps_dq_ sh_enabled_idc u(2)
   if( picture_header_extension_present_flag ) {  
     ph_extension_length ue(v)
      for( i = 0; i < ph_extension_length; i++)  
        ph_extension_data_byte [ i ] u(8)
   }  
   rbsp_trailing_bits( )  
}  
語法元素sps_dp_sh_enabled_idc是聯合從屬量化/符號隱藏指示符。 sps_dp_sh_enabled_idc 的值為 0 指定 pps_dep_quant_enabled_idc 為 0 並且 pic_dep_quant_enabled_flag 和 sign_data_hiding_enabled_flag 不存在於圖片報頭中。 sps_dp_sh_enabled_idc 的值為 1 指定 sign_data_hiding_enabled_flag 不存在於圖片報頭中。 sps_dp_sh_enabled_idc 的值為 2 指定 pps_dep_quant_enabled_idc 等於 0 並且圖片報頭中不存在 pic_dep_quant_enabled_flag。 sps_dp_sh_enabled_idc 的值為 3 保留供將來使用。 當 sps_dp_sh_enabled_idc 不存在時,它被推斷為 0。表 9 示出了使用 sps_dp_sh_enabled_idc 指示符的圖片報頭。 9 :使用 SPS 從屬量化/符號隱藏指示符的圖片報頭
picture_header_rbsp( ) {  
 
   if ( !pps_dep_quant_enabled_flag && sps_dp_sh_enabled_idc==1)  
     pic_dep_quant_enabled_flag u(1)
   if( !pic_dep_quant_enabled_flag && sps_dp_sh_enabled_idc==2)  
     sign_data_hiding_enabled_flag u(1)
   if( deblocking_filter_override_enabled_flag ) {  
     pic_deblocking_filter_override_present_flag u(1)
      if( pic_deblocking_filter_override_present_flag ) {  
        pic_deblocking_filter_override_flag u(1)
 
在一些實施例中,存在用於從屬量化和符號隱藏的SPS標誌,但是在這兩個標誌之間沒有條件發訊(conditional signalling)。 在一些實施例中,用於從屬量化和符號隱藏的兩個SPS標誌被限制為不都是1,即,它們被排他地啟用。 SPS 中的相關語法和語義如表 10 所示。 10: 用於從屬量化和符號隱藏的標誌的SPS
seq_parameter_set_rbsp ( ) { 描述符
 
sps_sao_enabled_flag u(1)
sps_alf_enabled_flag u(1)
  sps_transform_skip_enabled_flag u(1)
   if( sps_transform_skip_enabled_flag )  
sps_bdpcm_enabled_flag u(1)
   if( sps_bdpcm_enabled_flag  &&  chroma_format_idc  = =  3 )  
     sps_bdpcm_chroma_enabled_flag u(1)
sps_ref_wraparound_enabled_flag u(1)
   if( sps_ref_wraparound_enabled_flag )  
sps_ref_wraparound_offset_minus1 ue(v)
  …  
sps_ sign_data_hiding_enabled_flag u(1)
 sps_dep_quant_enabled_flag u(1)
   if( picture_header_extension_present_flag ) {  
     ph_extension_length ue(v)
      for( i = 0; i < ph_extension_length; i++)  
        ph_extension_data_byte [ i ] u(8)
   }  
   rbsp_trailing_bits( )  
}  
在如上表5所示的圖片報頭中,從屬量化和符號隱藏的相關語法不能同時出現,如果相應的SPS啟用標誌不被啟用,則它們不應出現在圖片報頭中。在一些實施例中,如果SPS中的從屬量化啟用標誌等於0,則圖片報頭中不應存在從屬量化相關語法,無論符號隱藏標誌指示開啟還是關閉。
在一些實施例中,如果sps_dep_quant_enabled_flag等於1,則在圖片報頭中傳訊pic_dep_quant_enabled_flag。傳訊條件不包括PPS標誌(例如pps_dep_quant_enabled_flag)。例如,如果 sps_dep_quant_enabled_flag 等於 0,則 pic_dep_quant_enabled_flag 不應存在。
在一些實施例中,在pic_dep_quant_enabled_flag之前傳訊sign_data_hiding_enabled_flag。這兩個標誌之間沒有條件傳訊(conditional signalling)。在一些實施例中,這兩個標誌不能都為1,即,它們應被排他地啟用。如果 sign_data_hiding_enabled_flag 等於 1,則 pic_dep_quant_enabled_flag 不得出現在圖片報頭中。 IV. 示例的 視訊編碼器
第6圖說明可實施符號隱藏和從屬量化的實例視訊編碼器600。如圖所示,視訊編碼器600從視訊源605接收輸入視訊信號並將該信號編碼成位元流695。視訊編碼器600具有用於對來自視訊源605的信號進行編碼的若干組件或模組,至少包括自以下選擇的一些組件:變換模組610、量化模組611、逆量化模組614、逆變換模組615、圖片內(intra-picture)估計模組620、幀內預測模組625、運動補償模組630、運動估計模組635、環路濾波器645、重建圖片緩衝器650、MV緩衝器665和MV預測模組675,以及熵編碼器690。運動補償模組630和運動估計模組635是幀間預測模組640的一部分。
在一些實施例中,模組610-690是由計算設備或電子裝置的一個或多個處理單元(例如,處理器)執行的軟體指令模組。在一些實施例中,模組610-690是由電子設備的一個或多個積體電路(IC)實現的硬體電路模組。儘管模組610-690被示為單獨的模組,但是一些模組可以組合成單個模組。
視訊源605提供未壓縮的呈現每個視訊幀的像素資料的原始視訊信號。減法器 608 計算視訊源 605 的原始視訊像素資料與來自運動補償模組 630 或幀內預測模組 625 的預測像素資料 613 之間的差值。變換模組 610 將該差值(或殘差像素資料或殘差信號609)轉換成變換係數(例如,通過執行離散餘弦變換或DCT)。量化模組611將變換係數量化為量化資料(或量化係數)612,其由熵編碼器690編碼為位元流695。
逆量化模組614對量化資料(或量化係數)612進行逆量化以獲得變換係數,並且逆變換模組615對變換係數執行逆變換以產生重建殘差619。重建殘差619與預測像素資料613相加以生成重建像素資料617。在一些實施例中,重建像素資料617臨時存儲在行緩衝器(line buffer)(未示出)中,用於圖片內預測和空間MV預測。重建像素由環路濾波器645濾波並存儲在重建圖片緩衝器650中。在一些實施例中,重建圖片緩衝器650是視訊編碼器600外部的記憶體。在一些實施例中,重建圖片緩衝器650是視訊編碼器600內部的記憶體。
圖片內估計模組620基於重建像素資料617執行幀內預測以產生幀內預測資料。幀內預測資料被提供給熵編碼器690以被編碼成位元流695。幀內預測資料也被幀內預測模組625使用以產生預測像素資料613。
運動估計模組635通過產生MV參考存儲在重建圖片緩衝器650中的先前解碼幀的像素資料來執行幀間預測。這些MV被提供給運動補償模組630以產生預測像素資料。
代替在位元流中編碼完整的實際MV,視訊編碼器600使用MV預測來生成預測MV,並且用於運動補償的MV與預測MV之間的差異被編碼為殘差運動資料並存儲在位元流 695中。
MV預測模組675基於為編碼先前的視訊幀而產生的參考MV,即用於執行運動補償的運動補償MV,產生預測的MV。 MV預測模組675從來自MV緩衝器665的先前視訊幀中擷取參考MV。視訊編碼器600將針對當前視訊幀生成的MV存儲在MV緩衝器665中作為用於生成預測MV的參考MV。
MV預測模組675使用參考MV來創建預測的MV。預測的 MV 可以通過空間 MV 預測或時間 MV 預測來計算。當前幀的預測的 MV 和運動補償 MV(MC MV)之間的差異(殘差運動資料)被熵編碼器 690 編碼到位元流 695 中。
熵編碼器690通過使用諸如上下文自適應二進位算術編解碼(CABAC)或霍夫曼編解碼的熵編解碼技術將各種參數和資料編碼到位元流695中。熵編碼器690將各種報頭元素、標誌連同量化的變換係數612和殘差運動資料作為語法元素編碼到位元流695中。位元流695繼而被存儲在存儲設備中或通過網路等通信媒介傳輸到解碼器。
環路濾波器645對重建的像素資料617執行濾波或平滑操作以減少編碼的偽影,特別是在像素塊的邊界處。在一些實施例中,所執行的濾波操作包括樣本自適應偏移(SAO)。在一些實施例中,濾波操作包括自適應環路濾波器(ALF)。
第7圖示出了實現符號隱藏和從屬量化的視訊編碼器600的部分。具體地,該圖圖示了編碼器600的組件,其生成、量化和熵編碼變換係數為位元流695。如圖所示,變換模組610將原始像素資料變換為要由量化器611量化的變換係數。係數奇偶校驗模組700計算係數子集(例如,4x4編解碼組)中所有非零係數之和的奇偶校驗710。當對子集啟用符號隱藏時,編碼器600通過例如改變係數子集中的係數的最低有效位元(least significant bit)來確保該係數子集中所有非零係數之和的奇偶校驗與第一非零係數的符號位元匹配,或通過強制禁用符號隱藏。
量化器611基於是否啟用從屬量化以及是否啟用符號隱藏來量化接收的係數。當符號隱藏被啟用時,第一非零係數的符號位元不是提供給熵編碼器690的量化係數612的一部分。當從屬量化被啟用時,當前變換係數的量化被限制為一組可容許值,其根據網格結構的重建順序,基於在當前變換係數之前的變換係數確定。
熵編碼器690將量化係數612連同指示是否啟用從屬量化和/或符號隱藏的標誌一起熵編碼到位元流695中。在一些實施例中,從屬量化和/或符號隱藏標誌被排他地傳訊,例如,僅當用於從屬量化的標誌指示從屬量化被禁用時才顯式傳訊用於符號隱藏的標誌,否則推斷符號隱藏被禁用。在一些實施例中,用於從屬量化和/或符號隱藏的標誌在適用於序列中的圖片的序列水平(例如,在SPS)和在適用於圖片的切片的圖片水平(例如,在PH)被傳訊。
第8圖概念性地說明視訊編碼器600用於從屬量化和符號隱藏的過程800。在一些實施例中,計算設備的一個或多個處理單元(例如,處理器)通過執行存儲在計算機可讀介質中的指令來實現編碼器600來執行過程800。在一些實施例中,實現編碼器600的電子裝置執行過程800。
編碼器接收(在塊810)資料以被編碼為具有一個或多個切片的當前圖片到位元流中。
編碼器(在塊820)將適用於包括當前圖片的視訊圖片序列的序列參數集(SPS)編碼到位元流中。 SPS包括第一從屬量化標誌(例如表4所示的sps_dep_quant_enabled_flag)和第一符號隱藏標誌(例如表4所示的sps_sign_data_hiding_enabled_flag)。在一些實施例中,對當前圖片的一個或多個切片僅啟用從屬量化和符號隱藏中的一個。換句話說,從屬量化和符號隱藏在位元流中專門傳訊。在一些實施例中,第一從屬量化標誌和第一符號隱藏標誌在SPS中被排他地傳訊,並且當第一從屬量化標誌在SPS中被明確地傳訊以啟用從屬量化時,第一符號隱藏標誌在SPS中不被傳訊,並被推斷為禁用符號隱藏。
編碼器確定(在塊830)第一從屬量化標誌是否指示針對當前序列啟用從屬量化。如果啟用了從屬量化,則過程進行到 840。否則,過程進行到 860。
編碼器將第二從屬量化標誌(例如,表5中所示的pic_dep_quant_enabled_flag)傳訊(在塊840)到位元流中以指示從屬量化是否用於量化當前圖片的一個或多個切片。在一些實施例中,在適用於當前圖片的一個或多個切片的圖片報頭中傳訊第二從屬量化標誌。
編碼器確定(在塊850)第二從屬量化標誌是否指示從屬量化被用於當前圖片的一個或多個切片。如果使用從屬量化,則過程進行到塊855。如果不使用從屬量化,則過程進行到塊860。當對當前圖片的一個或多個切片使用從屬量化時,當前圖片的一個或多個切片中的當前變換係數被限制為一組可允許的(重建)值,這些值是基於根據網格結構在重建順序中位於當前變換係數之前的變換係數確定的。一個或多個切片的變換係數由純量量化器量化,該純量量化器由按照重建順序在當前變換係數之前的變換係數的奇偶校驗確定。
編碼器推斷(在塊855)對於當前圖片的一個或多個切片將禁用符號隱藏並且不解析第二符號隱藏標誌。然後過程進行到880。
編碼器確定(在塊860)第一符號隱藏標誌是否指示對當前序列啟用符號隱藏。如果對當前序列啟用了符號隱藏,則過程進行到塊870。如果沒有對當前序列啟用符號隱藏,則過程進行到865。
編碼器推斷(在塊865)對於當前圖片的一個或多個切片禁用符號隱藏並且不解析第二符號隱藏標誌。然後過程進行到880。
編碼器將第二符號隱藏標誌(例如,表5中所示的sign_data_hiding_enable_flag)傳訊(在塊870)到位元流中以指示是否使用符號隱藏來量化當前圖片的一個或多個切片。在一些實施例中,在適用於當前圖片的一個或多個切片的圖片報頭中傳訊第二符號隱藏標誌。當符號隱藏用於量化當前圖片的一個或多個切片時,一個或多個切片中的係數子集的第一非零變換係數的符號位元基於係數子集中的所有非零係數之和的奇偶校驗確定。然後過程進行到880。
編碼器將當前圖片的一個或多個切片的量化變換係數編碼(在塊880)到位元流中。基於是否使用從屬量化以及是否使用符號隱藏來執行變換係數的量化。 V. 示例 的視訊解碼器
第9圖說明可實施符號隱藏和從屬量化的實例視訊解碼器900。如圖所示,視訊解碼器900是圖片解碼或視訊解碼電路,其接收位元流995並將位元流的內容解碼為視訊幀的像素資料以供顯示。視訊解碼器900具有用於解碼位元流995的若干組件或模組,包括選自逆量化模組911、逆變換模組910、幀內預測模組925、運動補償模組930、環路濾波器945、解碼圖片緩衝器950、MV緩衝器965、MV預測模組975和解析器990的一些組件。運動補償模組930是幀間預測模組940的一部分。
在一些實施例中,模組910-990是由計算設備的一個或多個處理單元(例如,處理器)執行的軟體指令模組。在一些實施例中,模組910-990是由電子設備的一個或多個IC實現的硬體電路模組。儘管模組910-990被示為單獨的模組,但是一些模組可以組合成單個模組。
解析器990(或熵解碼器)接收位元流995並根據由視訊編解碼或圖片編解碼標准定義的語法執行初始解析。解析的語法元素包括各種報頭元素、標誌以及量化資料(或量化係數)912。解析器990通過使用諸如上下文自適應二進位算術編解碼(CABAC)或霍夫曼編碼解析出各語法元素。
逆量化模組911對量化資料(或量化係數)912進行逆量化以獲得變換係數,逆變換模組910對變換係數916進行逆變換以產生重建殘差信號919。重建殘差信號919與來自幀內預測模組925或運動補償模組930的預測像素資料913相加以產生解碼像素資料917。解碼像素資料由環路濾波器945濾波並存儲在解碼圖片緩衝器950中。在一些實施例中,解碼圖片緩衝器950是視訊解碼器900外部的記憶體。在一些實施例中,解碼圖片緩衝器950是視訊解碼器900內部的記憶體。
幀內預測模組925從位元流995接收幀內預測資料,並根據該資料從存儲在解碼圖片緩衝器950中的解碼像素資料917產生預測像素資料913。在一些實施例中,解碼像素資料917也存儲在行緩衝器(未示出)中,用於圖片內預測和空間MV預測。
在一些實施例中,解碼圖片緩衝器950的內容用於顯示。顯示設備955或者擷取解碼圖片緩衝器950的內容用於直接顯示,或者擷取解碼圖片緩衝器的內容到顯示緩衝器。在一些實施例中,顯示設備通過像素傳輸(pixel transport)從解碼圖片緩衝器950接收像素值。
運動補償模組930根據運動補償MV (MC MV)從存儲在解碼圖片緩衝器950中的解碼像素資料917產生預測像素資料913。通過將從位元流995接收的殘差運動資料與從MV預測模組975接收的預測MV相加來解碼這些運動補償MV。
MV預測模組975基於為解碼先前的視訊幀而產生的參考MV,例如,用於執行運動補償的運動補償MV,產生預測的MV。 MV預測模組975從MV緩衝器965中檢索先前視訊幀的參考MV。視訊解碼器900在MV緩衝器965中存儲為解碼當前視訊幀而產生的運動補償MV作為用於產生預測MV的參考MV。
環路濾波器945對解碼的像素資料917執行濾波或平滑操作以減少編碼的偽影,特別是在像素塊的邊界處。在一些實施例中,所執行的濾波操作包括樣本自適應偏移(SAO)。在一些實施例中,濾波操作包括自適應環路濾波器(ALF)。
第10圖說明了實現符號隱藏和從屬量化的視訊解碼器900的部分。具體地,該圖圖示了解碼器900的組件,其解析、解量化和逆變換來自位元流995的係數。如圖所示,熵解碼器990將從位元流995解析的量化變換係數912提供給逆量化器911。
熵解碼器990還解析位元流995以獲得指示是否啟用從屬量化和/或符號隱藏的標誌。在一些實施例中,從屬量化和/或符號隱藏標誌被排他地傳訊,例如,僅當用於從屬量化的標誌指示從屬量化被禁用時才顯式傳訊用於符號隱藏的標誌,否則推斷符號隱藏被禁用。在一些實施例中,用於從屬量化和/或符號隱藏的標誌在適用於序列中的圖片的序列水平(例如,在SPS)和適用於圖片的切片的圖片水平(例如,在PH)被傳訊。
逆量化器911基於是否啟用從屬量化以及是否啟用符號隱藏來對變換係數進行逆量化。當符號隱藏被啟用時,第一個非零係數的符號位元沒有在位元流中顯式地傳訊,而是基於係數子集(例如,4x4 編解碼組)中所有非零係數之和由係數奇偶校驗模組 1000 計算的奇偶校驗 1010 推斷出來的。當從屬量化被啟用時,當前變換係數的逆量化被限制為一組允許值(admissible value),這些值是基於根據網格結構在重建順序中位於當前變換係數之前的變換係數確定的.
逆變換模組910繼而接收由逆量化器911提供的逆量化係數916並且執行逆變換以重建當前塊的像素資料。
第11圖概念性地說明視訊解碼器900用於從屬量化和符號隱藏的過程1100。在一些實施例中,計算設備的一個或多個處理單元(例如,處理器)實現解碼器900通過執行存儲在計算機可讀介質中的指令來執行過程1100。在一些實施例中,實現解碼器900的電子裝置執行過程1100。
解碼器接收(在塊1110)來自位元流的資料以被解碼為具有一個或多個切片的當前圖片。
解碼器(在塊1120)從適用於包括當前圖片的視訊圖片序列的位元流解析序列參數集(SPS)。SPS包括第一從屬量化標誌(例如表4所示的sps_dep_quant_enabled_flag)和第一符號隱藏標誌(例如表4所示的sps_sign_data_hiding_enabled_flag)。在一些實施例中,對當前圖片的一個或多個切片僅啟用從屬量化和符號隱藏中的一個。換句話說,從屬量化和符號隱藏在位元流中被排他的傳訊。在一些實施例中,第一從屬量化標誌和第一符號隱藏標誌在SPS中被排他地傳訊,並且當第一從屬量化標誌在SPS中被明確地傳訊以啟用從屬量化時,第一符號隱藏標誌在SPS中不被傳訊,且被推斷為禁用符號隱藏。
解碼器確定(在塊1130)第一從屬量化標誌是否指示對當前序列啟用從屬量化。如果啟用了從屬量化,則過程進行到 1140。否則,過程進行到 1160。
解碼器從位元流解析(在塊1140)第二從屬量化標誌(例如,表5中所示的pic_dep_quant_enabled_flag)以指示是否使用從屬量化來量化當前圖片的一個或多個切片。在一些實施例中,在適用於當前圖片的一個或多個切片的圖片報頭中傳訊第二從屬量化標誌。
解碼器確定(在塊1150)第二從屬量化標誌是否指示從屬量化被用於當前圖片的一個或多個切片。如果使用從屬量化,則過程進行到塊1155。如果不使用從屬量化,則過程進行到塊1160。當對當前圖片的一個或多個切片使用從屬量化時,當前圖片的一個或多個切片中的當前變換係數被限制為一組可允許的(重建)值,這些值是基於根據網格結構在重建順序中位於當前變換係數之前的變換係數確定的。一個或多個切片的變換係數由純量量化器量化,該純量量化器由按照重建順序在當前變換係數之前的變換係數的奇偶校驗確定。
解碼器推斷(在塊1155)對於當前圖片的一個或多個切片將禁用符號隱藏並且不解析第二符號隱藏標誌。然後過程進行到 1180。
解碼器確定(在塊1160)第一符號隱藏標誌是否指示對當前序列啟用符號隱藏。如果對當前序列啟用了符號隱藏,則過程進行到塊1170。如果沒有對當前序列啟用符號隱藏,則過程進行到1165。
解碼器推斷(在塊1165)對當前圖片的一個或多個切片禁用符號隱藏並且不解析第二符號隱藏標誌。然後過程進行到 1180。
解碼器從位元流解析(在塊1170)第二符號隱藏標誌(例如,表5中所示的sign_data_hiding_enable_flag)以指示是否使用符號隱藏來量化當前圖片的一個或多個切片。在一些實施例中,在適用於當前圖片的一個或多個切片的圖片報頭中傳訊第二符號隱藏標誌。當符號隱藏用於量化當前圖片的一個或多個切片時,一個或多個切片中的係數子集的第一非零變換係數的符號位元基於該係數子集中的所有非零係數之和的奇偶校驗確定。然後過程進行到塊1180。
解碼器基於當前圖片的一個或多個切片的逆量化的變換係數來重建(在塊1180)當前圖片。基於是否使用從屬量化以及是否使用符號隱藏來對變換係數進行逆量化。 VI. 示例的 電子系統
許多上述特徵和應用被實現為被指定為記錄在計算機可讀存儲介質(也稱為計算機可讀介質)上的一組指令的軟體進程。當這些指令由一個或多個計算或處理單元(例如,一個或多個處理器、處理器的核心或其他處理單元)執行時,它們使處理單元執行指令中指示的動作。計算機可讀介質的示例包括但不限於 CD-ROM、閃存驅動器、隨機存取記憶體 (RAM) 晶片、硬碟驅動器、可擦除可程式化只讀記憶體 (EPROM)、電可擦除可程式化只讀記憶體 (EEPROM) ) 等。計算機可讀介質不包括無線或通過有線連接傳輸的載波和電子信號。
在本說明書中,術語“軟體”意在包括駐留在只讀記憶體中的韌體或存儲在磁記憶體中的應用程式,這些應用程式可以讀入記憶體以供處理器處理。此外,在一些實施例中,多個軟體發明可以被實現為較大程式的子部分,同時保留不同的軟體發明。在一些實施例中,多個軟體發明也可以實現為單獨的程式。最後,一起實現這裡描述的軟體發明的單獨程式的任何組合都在本公開的範圍內。在一些實施例中,當安裝軟體程式以在一個或多個電子系統上運行時,軟體程式定義了執行和實施軟體程式的操作的一個或多個特定機器實現。
第12圖概念性地示出了實現本公開的一些實施例的電子系統1200。電子系統1200可以是計算機(例如,台式計算機、個人計算機、平板計算機等)、電話、PDA或任何其他種類的電子設備。這種電子系統包括各種類型的計算機可讀介質和用於各種其他類型的計算機可讀介質的接口。電子系統1200包括匯流排1205、處理單元1210、圖形處理單元(GPU)1215、系統記憶體1220、網路1225、只讀記憶體1230、永久存儲設備1235、輸入設備1240和輸出設備 1245。
匯流排1205共同代表通信連接電子系統1200的眾多內部設備的所有系統、外圍和晶片組匯流排。例如,匯流排1205通信連接處理單元1210與GPU 1215、只讀記憶體 1230、系統記憶體 1220 和永久存儲設備 1235。
為了執行本公開的過程,處理單元1210從這些不同的記憶體單元檢索要執行的指令和要處理的資料。在不同的實施例中,處理單元可以是單個處理器或多核處理器。一些指令被傳遞到 GPU 1215 並由 GPU 1215 執行。GPU 1215 可以卸載各種計算或補充由處理單元 1210 提供的圖片處理。
只讀記憶體(ROM)1230存儲靜態資料和指令,由處理單元1210和電子系統的其他模組使用。另一方面,永久存儲設備1235是讀寫存儲設備。該設備是非易失性記憶體單元,即使在電子系統1200關閉時也能存儲指令和資料。本公開的一些實施例使用大容量存儲設備(例如磁碟或光碟及其對應的磁碟驅動器)作為永久存儲設備1235。
其他實施例使用可移動存儲設備(例如軟碟、閃存設備等,及其對應的磁碟驅動器)作為永久存儲設備。與永久存儲設備1235一樣,系統記憶體1220是讀寫存儲設備。然而,與存儲設備1235不同,系統記憶體1220是易失性讀寫記憶體,例如隨機存取記憶體。系統記憶體1220存儲處理器在運行時使用的一些指令和資料。在一些實施例中,根據本公開的過程存儲在系統記憶體1220、永久存儲設備1235和/或只讀記憶體1230中。例如,各種存儲單元包括用於根據本公開處理多媒體剪輯的指令與一些實施例。從這些不同的記憶體單元,處理單元1210檢索要執行的指令和要處理的資料,以便執行一些實施例的過程。
匯流排1205還連接到輸入和輸出設備1240和1245。輸入設備1240使用戶能夠向電子系統傳送資訊和選擇命令。輸入設備1240包括字母數位鍵盤和定點設備(也稱為“光標控制設備”)、照相機(例如,網路攝像頭)、麥克風或用於接收語音命令的類似設備等。輸出設備1245顯示由電子系統或否則輸出資料。輸出設備1245包括打印機和顯示設備,例如陰極射線管(CRT)或液晶顯示器(LCD),以及揚聲器或類似的音頻輸出設備。一些實施例包括用作輸入和輸出設備的設備,例如觸摸屏。
最後,在第12圖中,匯流排1205還通過網路適配器(未示出)將電子系統1200耦合到網路1225。以此方式,計算機可以是計算機網路(例如局域網(“LAN”)、廣域網(“WAN”)或內聯網,或網路的網路(network of networks),例如因特網。可以結合本公開使用電子系統1200的任何或所有組件。
一些實施例包括將計算機程式指令存儲在機器可讀或計算機可讀介質(或者稱為計算機可讀存儲介質、機器可讀介質或機器可讀存儲介質)。此類計算機可讀介質的一些示例包括 RAM、ROM、只讀光碟 (CD-ROM)、可記錄光碟 (CD-R)、可重寫光碟 (CD-RW)、只讀數位多功能光碟(例如、DVD-ROM、雙層DVD-ROM)、各種可刻錄/可重寫DVD(如DVD-RAM、DVD-RW、DVD+RW等)、閃存(如SD卡、mini-SD)卡、微型 SD 卡等)、磁性和/或固態硬碟驅動器、只讀和可記錄藍光® 光碟、超密度光碟、任何其他光學或磁性介質以及軟碟。計算機可讀介質可以存儲可由至少一個處理單元執行並且包括用於執行各種操作的指令集的計算機程式。計算機程式或計算機代碼的示例包括諸如由編譯器產生的機器代碼,以及包括由計算機、電子組件或使用解釋器的微處理器執行的高級代碼的文件。
雖然上述討論主要涉及執行軟體的微處理器或多核處理器,但許多上述特徵和應用由一個或多個積體電路執行,例如專用積體電路 (ASIC) 或現場可程式化門陣列 (FPGA)。在一些實施例中,這種積體電路執行存儲在電路本身上的指令。此外,一些實施例執行存儲在可程式化邏輯設備(PLD)、ROM或RAM設備中的軟體。
如在本說明書和本申請的任何申請專利範圍中使用的,術語“計算機”、“服務器”、“處理器”和“記憶體”均指電子或其他技術設備。這些術語不包括人或人群。出於說明書的目的,術語顯示或顯示意味著在電子設備上顯示。在本說明書和本申請的任何申請專利範圍中使用的術語“計算機可讀介質”、“計算機可讀媒介”和“機器可讀介質”完全限於有形的物理對象,這些對像以可由計算機讀取的形式存儲資訊。這些術語不包括任何無線信號、有線下載信號和任何其他臨時信號。
雖然已經參考許多具體細節描述了本公開,但是所屬領域具有通常知識者將認識到,在不脫離本公開的精神的情況下,可以以其他具體形式來體現本公開。 此外,許多圖(包括第8圖和第11圖)概念性地說明了過程。 這些過程的特定操作可能不會按照所示和描述的確切順序執行。 具體的操作可以不是在一個連續的一系列操作中進行,在不同的實施例中可以進行不同的具體操作。 此外,該過程可以使用幾個子過程來實現,或者作為一個更大的宏過程的一部分。 因此,所屬領域具有通常知識者將理解,本公開不受前述說明性細節的限制,而是由所附申請專利範圍限定。
文中描述的主題有時示出了包含在其它不同部件內的或與其它不同部件連接的不同部件。應當理解:這樣描繪的架構僅僅是示例性的,並且,實際上可以實施實現相同功能的許多其它架構。在概念意義上,實現相同功能的部件的任何布置是有效地“相關聯的”,以使得實現期望的功能。因此,文中被組合以獲得特定功能的任意兩個部件可以被視爲彼此“相關聯的”,以實現期望的功能,而不管架構或中間部件如何。類似地,這樣相關聯的任意兩個部件還可以被視爲彼此“可操作地連接的”或“可操作地耦接的”,以實現期望的功能,並且,能夠這樣相關聯的任意兩個部件還可以被視爲彼此“操作上可耦接的”,以實現期望的功能。“操作上可耦接的”的具體示例包含但不限於:實體地可聯結和/或實體地相互、作用的部件、和/或無線地可相互作用和/或無線地相互作用的部件、和/或邏輯地相互作用的和/或邏輯地可相互作用的部件。
此外,關於文中基本上任何複數和/或單數術語的使用,只要對於上下文和/或應用是合適的,所屬技術領域具有通常知識者可以將複數變換成單數,和/或將單數變換成複數。為清楚起見,這裡可以明確地闡述各種單數/複數排列。
所屬技術領域具有通常知識者將會理解,通常,文中所使用的術語,特別是在所附申請專利範圍(例如,所附申請專利範圍中的主體)中所使用的術語通常意在作爲“開放性”術語(例如,術語“包含”應當被解釋爲“包含但不限幹”,術語“具有”應當被解釋爲“至少具有”,術語“包含”應當被解釋爲“包含但不限幹”等)。所屬技術領域具有通常知識者還將理解,如果意在所介紹的申請專利範圍陳述對象的具體數目,則這樣的意圖將會明確地陳述在申請專利範圍中,在缺乏這樣的陳述的情況下,不存在這樣的意圖。例如,爲了幫助理解,所附申請專利範圍可以包含使用介紹性短語“至少一個”和“一個或更多個”來介紹申請專利範圍陳述對象。然而,這樣的短語的使用不應當被解釋爲:用不定冠詞“一個(a或an)”的申請專利範圍陳述對象的介紹將包含這樣介紹的申請專利範圍陳述對象的任何申請專利範圍限制爲只包含一個這樣的陳述對象的發明,即使在同一申請專利範圍包含介紹性短語“一個或更多個”或“至少一個”以及諸如“一個(a)”或“一個(an)”之類的不定冠詞的情況下(例如,“一個(a)”和/或“一個(an)”應當通常被解釋爲意味著“至少一個”或“一個或更多個”)也如此;上述對以定冠詞來介紹申請專利範圍陳述對象的情況同樣適用。另外,即使明確地陳述了介紹的申請專利範圍陳述對象的具體數目,但所屬技術領域具有通常知識者也會認識到:這樣的陳述通常應當被解釋爲意味著至少所陳述的數目(例如,僅有“兩個陳述對象”而沒有其他修飾語的陳述通常意味著至少兩個陳述對象,或兩個或更多個陳述對象)。此外,在使用類似於“A、B和C中的至少一個等”的慣用語的情況下,通常這樣的結構意在所屬技術領域具有通常知識者所理解的該慣用語的含義(例如,“具有A、B和C中的至少一個的系統”將包含但不限於具有單獨的A、單獨的B、單獨的C、A和B —起、A和C 一起、B和C 一起和/或A、B和C 一起的系統等)。在使用類似於“A、B或C中的至少一個等”的慣用語的情況下,通常這樣的結構意在所屬技術領域具有通常知識者所理解的該慣用語的含義(例如,“具有A、B或C中的至少一個的系統”將包含但不限於具有單獨的A、單獨的B、單獨的C、A和B —起、A和C 一起、B和C 一起和/或A、B和C 一起的系統等)。所屬技術領域具有通常知識者將進一歩理解,不管在說明書、申請專利範圍中還是在附圖中,表示兩個或更多個可替換的術語的幾乎任意析取詞和/或短語應當理解成考慮包含術語中的一個、術語中的任一個或所有兩個術語的可能性。例如,短語“A或B”應當被理解成包含“A”、“B”、或“A和B”的可能性。
從前述內容可以理解,本文已經出於說明的目的描述了本公開的各種實施方式,並且在不脫離本公開的範圍和精神的情況下可以進行各種修改。因此,本文公開的各種實施方式不旨在是限制性的,真正的範圍和精神由所附申請專利範圍指示。
500:塊 510:編解碼組 600:視訊編碼器 605:視訊源 608:減法器 609:殘差信號 695、995:位元流 610:變換模組 611:量化模組 612、912:量化係數 613、913:預測像素資料 614、911:逆量化模組 615、910:逆變換模組 616:變換係數 617:重建像素資料 619:重建殘差 620:圖片內估計模組 625、925:幀內預測模組 630、930:運動補償模組 635:運動估計模組 640、940:幀間預測模組 645、945:環路濾波器 650、950:重建圖片緩衝器 665、965:MV緩衝器 675、975:MV預測模組 690:熵編碼器 700、1000:係數奇偶校驗模組 710、1010:奇偶校驗 800、1100:過程 810~880、1110~1180:塊 900:視訊解碼器 917:解碼像素資料 990:解析器 919:重建殘差信號 955:顯示設備 1000:係數奇偶校驗模組 1200:電子系統 1205:匯流排 1210:處理單元 1215:圖形處理單元 1220:系統記憶體 1225:網路 1230:只讀記憶體 1235:永久存儲設備 1240:輸入設備 1245:輸出設備
附圖被包括以提供對本公開的進一步理解,並且併入並構成本公開的一部分。附圖圖示了本公開的實施方式並且與描述一起用於解釋本公開的原理。可以理解的是,附圖不一定是按比例繪製的,因為在實際實施中,為了清楚地說明本公開的概念,一些部件可能被示出為與尺寸不成比例。 第1圖示出了用於從屬量化的兩個純量量化器。 第2圖示出了對應於在從屬純量量化中使用的網格結構的有限狀態機。 第3圖示出了量化過程所使用的格狀結構。 第4圖圖示了用於每個編解碼組中的係數的四通道句法傳訊方法。 第5圖示出了編解碼組中掃描位置的概率模型的選擇。 第6圖示出了可實施符號隱藏和從屬量化的實例視訊編碼器。 第7圖示出了實現符號隱藏和從屬量化的視訊編碼器的部分。 第8圖概念性地說明視訊編碼器用於從屬量化和符號隱藏的過程。 第9圖示出了可實施符號隱藏和從屬量化的實例視訊解碼器。 第10圖示出了實現符號隱藏和從屬量化的視訊解碼器的部分。 第11圖概念性地說明視訊解碼器用於從屬量化和符號隱藏的過程。 第12圖概念性地示出了實施本公開的一些實施例的電子系統。
1100:過程
1110~1180:塊

Claims (12)

  1. 一種視訊解碼方法,包括: 接收來自位元流的資料以將其解碼為包括一個或多個切片的當前圖片; 從適用於包括該當前圖片的當前視訊圖片序列的該位元流解析序列參數集,該序列參數集包括第一從屬量化標誌和第一符號隱藏標誌; 當該第一從屬量化標誌指示該當前序列啟用從屬量化時,從該位元流中解析第二從屬量化標誌以指示是否使用從屬量化對該當前圖片的該一個或多個切片進行量化; 當該第二從屬量化標誌指示該當前圖片的該一個或多個切片未使用從屬量化且該第一符號隱藏標誌指示對該當前序列啟用符號隱藏時,從該位元流中解析第二符號隱藏標誌以指示是否使用符號隱藏對該當前圖片的該一個或多個切片進行量化;以及 基於是否使用從屬量化以及是否使用符號隱藏,基於該當前圖片的該一個或多個切片的逆量化變換係數來重建該當前圖片。
  2. 如請求項1所述之視訊解碼方法,其中,當該第二從屬量化標誌指示對該一個或多個切片啟用從屬量化時,推斷為該當前圖片的該一個或多個切片禁用符號隱藏,並且該第二符號隱藏標誌未被解析。
  3. 如請求項1所述之視訊解碼方法,其中當該第一符號隱藏標誌指示對該當前序列禁用符號隱藏時,推斷對該當前圖片的該一個或多個切片禁用符號隱藏,並且該第二符號隱藏標誌未被解析。
  4. 如請求項1所述之視訊解碼方法,其中對於該當前圖片的該一個或多個切片僅啟用從屬量化和符號隱藏之一。
  5. 如請求項1所述之視訊解碼方法,其中,當使用符號隱藏對該當前圖片的該一個或多個切片進行量化時,該一個或多個切片中的係數子集的第一非零變換係數的符號位元基於該係數子集中所有非零係數之和的奇偶校驗確定。
  6. 如請求項1所述之視訊解碼方法,其中當從屬量化用於量化該當前圖片的該一個或多個切片時,該當前圖片的該一個或多個切片中的當前變換係數被限制為一組容許值,該組容許值是基於在重建中該當前變換係數之前的變換係數確定的。
  7. 如請求項6所述之視訊解碼方法,其中,該一個或多個切片的該變換係數由純量量化器量化,該純量量化器由按照重建順序在該當前變換係數之前的該變換係數的奇偶校驗確定。
  8. 如請求項1所述之視訊解碼方法,其中在適用於該當前圖片的該一個或多個切片的圖片報頭中傳訊該第二從屬量化標誌。
  9. 如請求項1所述之視訊解碼方法,其中在適用於該當前圖片的該一個或多個切片的圖片報頭中傳訊該第二符號隱藏標誌。
  10. 如請求項1所述之視訊解碼方法,其中,在該序列參數集中排他地傳訊該第一從屬量化標誌和該第一符號隱藏標誌,其中當該第一從屬量化標誌在該序列參數集中被明確地傳訊以啟用從屬量化時,該第一符號隱藏標誌在該序列參數集中不被傳訊,且被推斷為禁用符號隱藏。
  11. 一種視訊編碼方法,包括: 接收原始像素資料以將其編碼為包含一個或多個切片的當前圖片到位元流中; 將適用於包括該當前圖片的視訊圖片的當前序列的序列參數集編碼到該位元流中,該序列參數集包括第一從屬量化標誌和第一符號隱藏標誌; 當該第一從屬量化標誌指示對該當前序列啟用從屬量化時,在該位元流中傳訊第二從屬量化標誌,用於指示是否使用從屬量化來量化該當前圖片的該一個或多個切片; 當該第二從屬量化標誌指示該當前圖片的一該個或多個切片未使用從屬量化且該第一符號隱藏標誌指示為該當前序列啟用符號隱藏時,傳訊該位元流中的第二符號隱藏標誌以指示是否使用符號隱藏對該當前圖片的該一個或多個切片進行量化;以及 基於是否使用從屬量化以及是否使用符號隱藏,將該當前圖片的該一個或多個切片的量化變換係數編碼到該位元流中。
  12. 一種電子裝置,包括: 視訊解碼器電路,被配置為執行包括以下操作的操作: 接收來自位元流的資料以將其解碼為包括一個或多個切片的當前圖片; 從適用於包括該當前圖片的當前視訊圖片序列的該位元流解析序列參數集,該序列參數集包括第一從屬量化標誌和第一符號隱藏標誌; 當該第一從屬量化標誌指示該當前序列啟用從屬量化時,從該位元流中解析第二從屬量化標誌以指示是否使用從屬量化對該當前圖片的該一個或多個切片進行量化; 當該第二從屬量化標誌指示該當前圖片的該一個或多個切片未使用從屬量化且該第一符號隱藏標誌指示對該當前序列啟用符號隱藏時,從該位元流中解析第二符號隱藏標誌以指示是否使用符號隱藏對該當前圖片的該一個或多個切片進行量化;以及 基於是否使用從屬量化以及是否使用符號隱藏,基於該當前圖片的該一個或多個切片的逆量化變換係數來重建該當前圖片。
TW110100790A 2020-01-10 2021-01-08 量化相關參數之傳訊技術 TWI792149B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US202062959694P 2020-01-10 2020-01-10
US62/959,694 2020-01-10
US202062962077P 2020-01-16 2020-01-16
US62/962,077 2020-01-16
US17/143,823 2021-01-07
US17/143,823 US11297320B2 (en) 2020-01-10 2021-01-07 Signaling quantization related parameters

Publications (2)

Publication Number Publication Date
TW202139697A true TW202139697A (zh) 2021-10-16
TWI792149B TWI792149B (zh) 2023-02-11

Family

ID=76760517

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110100790A TWI792149B (zh) 2020-01-10 2021-01-08 量化相關參數之傳訊技術

Country Status (7)

Country Link
US (1) US11297320B2 (zh)
EP (1) EP4088457A4 (zh)
KR (1) KR20220123713A (zh)
CN (1) CN114930817A (zh)
MX (1) MX2022008555A (zh)
TW (1) TWI792149B (zh)
WO (1) WO2021139770A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021100863A1 (en) * 2019-11-22 2021-05-27 Sharp Kabushiki Kaisha Systems and methods for signaling tiles and slices in video coding
CN116260980A (zh) * 2020-02-05 2023-06-13 Lg电子株式会社 用于图像编解码方法的编解码设备和发送图像数据的设备
KR20220146647A (ko) * 2020-05-19 2022-11-01 구글 엘엘씨 품질-정규화된 비디오 트랜스코딩을 위한 동적 파라미터 선택
WO2023004590A1 (zh) * 2021-07-27 2023-02-02 Oppo广东移动通信有限公司 一种视频解码、编码方法及设备、存储介质
WO2023184248A1 (zh) * 2022-03-30 2023-10-05 Oppo广东移动通信有限公司 视频编解码方法、装置、设备、系统及存储介质
WO2023184250A1 (zh) * 2022-03-30 2023-10-05 Oppo广东移动通信有限公司 视频编解码方法、装置、设备、系统及存储介质
WO2024008060A1 (en) * 2022-07-05 2024-01-11 Mediatek Inc. Method and apparatus of dependent quantization for video coding
WO2024060099A1 (zh) * 2022-09-21 2024-03-28 Oppo广东移动通信有限公司 编解码方法、码流、编码器、解码器以及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9001883B2 (en) * 2011-02-16 2015-04-07 Mediatek Inc Method and apparatus for slice common information sharing
US9066110B2 (en) * 2011-03-08 2015-06-23 Texas Instruments Incorporated Parsing friendly and error resilient merge flag coding in video coding
CN104883576B (zh) * 2011-08-29 2017-11-14 苗太平洋控股有限公司 以amvp模式产生预测区块的方法
US9148663B2 (en) * 2011-09-28 2015-09-29 Electronics And Telecommunications Research Institute Method for encoding and decoding images based on constrained offset compensation and loop filter, and apparatus therefor
US20150117536A1 (en) * 2013-10-30 2015-04-30 Nvidia Corporation Video decoder techniques
CN107566848B (zh) * 2016-06-30 2020-04-14 华为技术有限公司 编解码的方法及装置
US11451840B2 (en) * 2018-06-18 2022-09-20 Qualcomm Incorporated Trellis coded quantization coefficient coding
EP3850843A4 (en) * 2018-09-14 2021-11-24 Huawei Technologies Co., Ltd. SLICING AND TILING OF SUBPICTURE SIGNALING IN VIDEO ENCODING
US11356667B2 (en) * 2018-12-20 2022-06-07 Telefonaktiebolaget Lm Ericsson (Publ) Methods providing encoding and/or decoding of video using a syntax indicator and picture header

Also Published As

Publication number Publication date
MX2022008555A (es) 2023-02-13
EP4088457A1 (en) 2022-11-16
EP4088457A4 (en) 2024-01-31
US20210218966A1 (en) 2021-07-15
TWI792149B (zh) 2023-02-11
US11297320B2 (en) 2022-04-05
KR20220123713A (ko) 2022-09-08
WO2021139770A1 (en) 2021-07-15
CN114930817A (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN112640448B (zh) 编码转换系数的熵编解码方法与装置
TW202139697A (zh) 量化相關參數之傳訊技術
TWI751771B (zh) 視訊和影像編解碼中之高階信息發信
US10523966B2 (en) Coding transform blocks
TWI750624B (zh) 編解碼變換係數的方法及裝置
TWI792074B (zh) 發信圖像以及視訊的塊分割
US11350131B2 (en) Signaling coding of transform-skipped blocks
TWI785502B (zh) 在分塊中指明切片之切片組塊的視訊編解碼方法及電子裝置
TWI784362B (zh) 視訊編解碼方法及裝置
US11785214B2 (en) Specifying video picture information
CN114731433B (zh) 一种视频编解码方法及装置
TWI832602B (zh) 轉換係數符號的熵編碼
WO2022217417A1 (zh) 编解码方法、编码器、解码器以及存储介质
TW202349954A (zh) 自適應編解碼的圖像以及視訊資料
TW202412522A (zh) 約束卷積模型的係數
KR20220045231A (ko) 서브화상 구조의 시그널링
TW202349951A (zh) 塊分區圖像及視訊資料
TW202325025A (zh) 具有編碼參數的局部照明補償