TWI772951B - 用於編解碼視訊序列的方法和裝置 - Google Patents
用於編解碼視訊序列的方法和裝置 Download PDFInfo
- Publication number
- TWI772951B TWI772951B TW109138375A TW109138375A TWI772951B TW I772951 B TWI772951 B TW I772951B TW 109138375 A TW109138375 A TW 109138375A TW 109138375 A TW109138375 A TW 109138375A TW I772951 B TWI772951 B TW I772951B
- Authority
- TW
- Taiwan
- Prior art keywords
- sub
- syntax
- picture
- sps
- video sequence
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 66
- 241000023320 Luma <angiosperm> Species 0.000 description 39
- 238000013139 quantization Methods 0.000 description 37
- 239000011159 matrix material Substances 0.000 description 20
- 230000005540 biological transmission Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000005192 partition Methods 0.000 description 10
- 238000013507 mapping Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 239000012634 fragment Substances 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 1
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008825 perceptual sensitivity Effects 0.000 description 1
- 229920000069 polyphenylene sulfide Polymers 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
Abstract
用於視訊編解碼的方法和裝置被公開。根據一種方法,位元流被生成或接收,其中該位元流包括第一語法和第二語法。該第一語法與用於表示第三語法的集合的位元目標數量有關,並且每個第三語法指定子圖像集合中的一子圖像的一子圖像標識符(ID)。第二語法與子圖像集合中的子圖像的總數量有關,其中可由位元的目標數量表示的第一數量等於或大於子圖像的總數量。根據另一種方法,子圖像ID語法對於不同的子圖像具有不同的值。
Description
本發明涉及視訊編解碼,更具體地,涉及視訊編解碼的發送子圖像資訊的技術。
適應性幀內/幀間視訊編解碼已經廣泛用於各種視訊編解碼標準中,例如運動圖像專家組-2(Moving Picture Experts Group,MPEG-2),高級視訊編解碼(advanced video coding,簡稱AVC)和高效視訊編解碼(High Efficiency Video Coding,簡稱HEVC)。在適應性幀內/幀間視訊編解碼中,輸入訊號由幀內/幀間預測子預測以生成預測殘差。殘差通常藉由二維變換和量化進行處理。量化的變換係數被編解碼。高效率視訊編解碼(High Efficiency Video Coding,HEVC)標準是在ITU-T視訊編解碼專家組(Video Coding Experts Group,VCEG)和ISO/IEC運動圖像專家組(Moving Picture Experts Group,MPEG)標準化組織的聯合視訊項目下開發的,尤其是與稱為視訊編解碼聯合協作小組(Joint Collaborative Team on Video Coding,JCT-VC)的合作而開發的。在HEVC中,一個片段(Slice)被分割為多個編解碼樹單元(coding tree units,以下簡稱為CTU)。在主配置文檔(profile)中,CTU的最小尺寸和最大尺寸由序列參數集合(sequence parameter set,SPS)中的語法元素指定。允許的CTU大小可以是8x8,16x16,32x32或64x64。對於每個片段,依據光栅掃描(raster scan)順序,片段內的CTU被處理。
CTU還被分割為多個編解碼單元(multiple coding units,CU)以適應各種局部特性。藉由四分樹或四分樹分割,CTU被進一步分割成多個CU。QT分割將大小為4Nx4N的塊拆分為4個相等的大小為2Nx2N的子塊。CTU可以是單個CU(即不拆分),也可拆分成四個大小相等的較小單元,它們對應於編解碼樹的節點。如果這些單元是編解碼樹的葉節點,則它們將成為CU。否則,四分樹拆分過程被重複,直到節點的大小達到序列參數集合(sequence parameter set)中指定的最小允許CU大小為止。
依據HEVC,每個CU可被分為一個或多個預測單元(prediction units,PU)。與CU一起,PU作為共享預測資訊的基本代表塊。在每個PU内部,相同的預測處理被應用,并且以PU為基礎,相關資訊被發送到解碼器。依據PU分割類型,CU可被分為一個,兩個或者四個PU。HEVC定義了將CU分解為PU的八種形狀,包括分割類型2Nx2N,2NxN,Nx2N,NxN,2NxnU,2NxnD,nLx2N和nRx2N。與CU不同,PU只能依據HEVC分割一次。
在透過基於PU分割類型的預測處理獲得殘差塊之後,可以依據類似於CU的編解碼樹的另一四分樹結構,CU的預測殘差被分割成變換單元(transform unit,TU)。TU是具有殘差或變換係數的基本代表塊,該殘差和變換係數用於應用整數變換(integer transform)和量化。對於每個TU,與TU具有相同大小的一整數變換被應用以獲得殘差係數。在基於TU的量化之後,這些係數被傳送到解碼器。
第1圖示出示例性適應性幀間/幀內視訊編解碼系統,其結合了變換和量化以處理預測殘差。對於幀間預測,運動估計(Motion Estimation,簡稱ME)/運動補償(Motion Compenstaion,簡稱MC)112被用來提供預測資料(基於來自其他圖像的視訊資料)。開關114選擇幀內預測110或幀間預測資料,並且所選擇的預測資料被提供給加法器116以形成預測誤差,也被稱為殘差。預測誤差隨後由變換(Transform,簡稱T)118處理,然後由量化(Quantization,簡稱Q)120處理。然後,經變換和量化的殘差由熵編碼器122編碼,以包括在與壓縮視訊資料相對應的視訊位元流中。然後,與變換係數相關聯的位元流與諸如運動,編解碼模式以及與圖像區域相關聯的其他資訊之類的輔助資訊打包在一起。輔助資訊也可藉由熵編碼來壓縮以減少所需的頻寬。因此,如第1圖所示,與輔助資訊相關聯的資料被提供給熵編碼器122。當幀間預測模式被使用時,一個或多個參考圖像也必須在編碼器端被重構。因此,經變換和量化的殘差由逆量化(Inverse Quantization,簡稱IQ)124和逆變換(Inverse Transformation,簡稱IT)126處理以恢復殘差。然後在重構(Reconstruction,簡稱REC)128處,殘差被加回到預測資料136以重構視訊資料。重構的視訊資料可被存儲在參考圖像緩衝器134中,並用於其他幀的預測。
如第1圖所示,輸入視訊資料在編碼系統中經歷了一系列處理。由於一系列處理,來自REC 128的重構視訊資料可能遭受各種損害。因此,在重構的視訊資料被存儲至參考圖像緩衝器134中之前,環路濾波器130常常被應用於重構的視訊資料,以提高視訊品質。例如,解塊濾波器(de-blocking filter,簡稱DF)和樣本適應性偏移(Sample Adaptive Offset,簡稱SAO)已經被用於高效視訊編解碼(High Efficiency Video Coding,簡稱HEVC)標準中。環路濾波器還可包括適應性環路濾波器(Adaptive Loop Filter,簡稱ALF)。環路濾波器資訊可能必須合併到位元流中,以便解碼器可以正確恢復所需的資訊。因此,環路濾波器資訊被提供至熵編碼器122以合併到位元流中。在第1圖中,在重構樣本被存儲在參考圖像緩衝器134中之前,環路濾波器130用於重構的視訊。第1圖中的系統旨在示出典型視訊編碼器的示例性結構。它可能對應於HEVC系統或H.264。
第2圖示出用於第1圖中的編碼器系統的相應視訊解碼器的系統框圖。由於編碼器還包含用於重構視訊資料的本地解碼器,因此除熵解碼器210外,一些解碼器組件已在編碼器中被使用。此外,在解碼器側,僅運動補償220被需要。開關146選擇幀內預測或幀間預測,並且所選擇的預測資料被提供給重構(reconstruction,簡稱REC)128以與恢復的殘差組合。除了對壓縮的殘差執行熵解碼之外,熵解碼210還負責輔助資訊的熵解碼,並且將輔助資訊提供給各個塊。例如,幀內模式資訊被提供至幀內預測110,幀間模式資訊被提供至運動補償220,環路濾波器資訊被提供至環路濾波器130,以及殘差被提供至逆量化124。這些殘差由IQ 124,IT 126和隨後的重構過程來處理以重構視訊資料。再次,來自REC 128的重構的視訊資料經歷如第2圖所示的包括IQ 124和IT 126的一系列處理,並且受到編碼偽像的影響。重構的視訊資料由環路濾波器130進一步處理。
默認量化矩陣表示
量化矩陣(quantization matrix,簡稱QM)已用於各種視訊編解碼標準中。例如,量化矩陣被用於第1圖中的量化120和第2圖中的逆量化124。意味著對殘差訊號的編解碼的基於塊的混合視訊編解碼方案,可使用頻率依賴縮放來控制變換單元(transform unit,簡稱TU)中不同頻率上的量化失真的的分佈。為了在空間頻率上實現感知上均勻的量化,量化矩陣可被設計,以根據在相關頻率範圍內的感知靈敏度,對與變換係數相關聯的每個頻率通道進行加權。因此,與高頻係數相比,變換塊中的低頻係數將以更精細的量化步長進行量化。相應的量化矩陣可被用來在解碼器側對加權的反變換係數進行反加權。
量化矩陣已經在諸如H.264/AVC和H.265/HEVC(高效視訊編解碼)之類的視訊編解碼標準中被成功地利用,這允許改善視訊內容的主觀品質。由於其有效性,量化矩陣已被廣泛用於眾多視訊編解碼產品中。
HEVC規範包括四個尺寸為4x4、8×8、16×16和32×32的整數逆變換矩陣。這些變換矩陣是相同大小的DCT-2矩陣的整數近似,旨在保留離散余弦變換(disctrete cosine transform,簡稱DCT)係數的結構。一額外的4×4 離散正弦變換(discrete sine transform,簡稱DST)矩陣被指定,該矩陣應用於幀內預測4×4塊的殘差。為了區別於DST,四個DCT被稱為HEVC核心變換。
量化矩陣正在被評估用於新興的新視訊編解碼標準中,該標準被稱為多功能視訊編解碼(Versatile Video Coding,簡稱VVC),作為下一代視訊編解碼標準和H.265/HEVC的後繼標準。在本公開中,量化矩陣也被稱為縮放矩陣。
當頻率依賴縮放被啓用時,大小為4x4和8x8的量化矩陣具有如第3圖所示的默認值。如第3圖所示,4x4矩陣310用於幀内和幀間模式的亮度和色度分量。在幀内模式下,8×8矩陣320用於亮度和色度分量,以及在幀間模式下,8×8矩陣330用於亮度和色度分量。
例如,對於變換塊的不同大小和類型,以下20種量化矩陣可被支援。
•亮度:幀内4x4,幀間4x4,幀内8x8,幀間8x8,幀内16x16,幀間16x16,幀内32x32,幀間32x32
•Cb:幀内4x4,幀間4x4,幀内8x8,幀間8x8,幀内16x16,幀間16x16
•Cr:幀内4x4,幀間4x4,幀内8x8,幀間8x8,幀内16x16,幀間16x16
例如,為了減少存儲量化矩陣所需的記憶體,8x8矩陣被用來生成16x16和32x32量化矩陣。藉由使用複製進行上採樣,大小為16x16和32x32的變換塊的默認量化矩陣從相同類型的默認8x8量化矩陣中獲取。該過程在第4圖中示出:圖中的點填充塊412指示,8x8量化矩陣410中的量化矩陣條目被複製到16x16量化矩陣420中的2x2區域422中,並被複製到32x32量化矩陣430中4x4區域432中。
亮度映射和色度縮放(
Luma Mapping and Chroma Scaling
,簡稱
LMCS
)
多功能視訊編解碼(Versatile Video Coding,簡稱VVC)是由聯合視訊專家組開發的新興視訊編解碼標準,該聯合組由ITU-T第16研究組視訊編解碼專家組和ISO/IEC JTC1 SC29/WG11(運動圖像專家組(Moving Picture Experts Group,簡稱MPEG))。VVC基於高效視訊編解碼(High Efficient Video Coding,簡稱HEVC)視訊標準,具有改進和新的編解碼工具。例如,重塑處理是VTM-4.0(VVC測試模型4.0版)中採用的新編解碼工具。重塑處理也被稱為亮度映射和色度縮放(Luma Mapping and Chroma Scaling,簡稱LMCS)。當重塑被應用時,在環路濾波之前,視訊樣本在重塑域中進行編碼和重構。藉由使用逆重塑,重塑域重構的樣本被轉換為原始域。經環路濾波的原始域重構樣本被存儲在解碼圖像緩衝區中。對於幀間模式,藉由使用前向重塑,運動補償(motion compensated,簡稱MC)預測子被轉換為重塑域。第5圖示出在解碼器側的重塑處理的示例。
如第5圖所示,位元流由上下文適應性二進位算術編碼(context-adaptive binary arithmetic coding,簡稱CABAC)解碼器510(即CABAC-1
),逆量化(即Q-1
)和逆變換(T-1
)處理得出重構的亮度殘差Yres。重構的亮度殘差被提供至亮度重構塊520以生成重構的亮度訊號。對於幀內模式,預測子來自幀內預測塊530。對於幀間模式,預測子來自運動補償塊540。由於在編碼器側重塑被應用於亮度訊號,因此在預測子被提供至重構塊520之前,前向重塑550被應用於來自運動補償塊540的預測子。逆重塑560被應用於來自重構塊520的重構亮度訊號以恢復未重塑的重構亮度訊號。然後,在訊號被存儲至解碼圖像緩衝器(decoded picture buffer,簡稱DPB)580中之前,環路濾波器570被應用於未重塑的重構亮度訊號。
一種用於編解碼視訊序列的方法和裝置被公開,子圖像編解碼模式被包括其中。根據本發明,與視訊序列的編碼資料相對應的位元流在編碼器側被生成或在解碼器側被接收,其中該位元流包括第一語法和第二語法,第一語法對應於用於表示第三語法的集合的位元的目標數量,並且每個第三語法指定子圖像集合中的一子圖像的一子圖像ID,第二語法對應於該子圖像集合中的子圖像的總數量,其中第一語法的第一值的計算等於或大於第二語法的第二值的計算。基於包括子圖像集合的資訊,視訊序列在編碼器側被編碼或者在解碼器側被解碼。
在一實施例中,在編碼器側第一語法和第二語法被發送,或者在解碼器側在序列參數集合(sequence parameter set,簡稱SPS)中被解析。在另一實施例中,在序列參數集合(sequence parameter set,簡稱SPS),圖像參數集合(picture parameter set,簡稱PPS),片段報頭(slice header,簡稱SH),圖像報頭(picture header,簡稱PH)或其組合中,第一語法和第二語法在編碼器側被發送或者在解碼器側被解析。
在一實施例中,第一語法對應於位元的目標數量減1。在一示例中,第一語法在序列參數集合(sequence parameter set,簡稱SPS)中,並被指定為sps_subpic_id_len_minus1,用於表示位元的目標數量減1。在另一示例中,第一數量可由位元的目標數量表示,位元的目標數量對應於(1 <<((位元的目標數量減1)+1),其中“<<”表示算術左移運算。在另一示例中,第二語法在序列參數集合(sequence parameter set,簡稱SPS)中,並被指定為sps_num_subpic_minus1,用於表示子圖像集合中的子圖像的總數量減1。
在一實施例中,第一語法對應於位元的目標數量減去偏移量並加上第一值,其中第一值對應於Ceil(Log2(子圖像的總數量)),以及其中“Ceil”是上限功能,“Log2”是以2為底數的對數函數。
用於編解碼視訊序列的另一種方法和裝置被公開,其中子圖像編解碼模式被包括。根據本發明,與視訊序列的編碼資料相對應的位元流在編碼器側被生成或在解碼器側被接收,其中該位元流包括子圖像標識符(ID)語法,以及每個子圖像ID語法指定子圖像集合中的一子圖像的一子圖像ID。其中如果第一子圖像與第二子圖像不同,則第一子圖像的第一子圖像ID語法與第二子圖像的第二子圖像ID語法具有不同的值。基於包括子圖像集合的資訊,視訊序列在編碼器側視訊序列被編碼或者在解碼器側被解碼。
在一實施例中,位元流滿足位元流一致性要求,如果第一子圖像不同於第二子圖像,則第一子圖像的第一子圖像ID語法與第二子圖像的第二子圖像ID語法不同。在另一實施例中,在序列參數集合(sequence parameter set,簡稱SPS),圖像參數集合(picture parameter set,簡稱PPS),片段報頭(slice header,簡稱SH),圖像報頭(picture header,簡稱PH)或其組合中,子圖像ID語法的集合在編碼器側被發送或者在解碼器側被解析。
以下描述是實施本發明的最佳構想模式。該描述的進行是出於說明本發明的一般原理的目的,而不應被認為是限制性的。本發明的範圍最好透過參考所附的申請專利範圍來確定。
發送子圖像資訊
在VVC Draft 7標準中,JVET-P2001 (B. Bross, et al., “Versatile Video Coding (Draft 7)”, Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 16th Meeting: Geneva, CH, 1–11 Oct. 2019, Document: JVET-P2001-vB),子圖像編解碼被支援。關於子圖像的資訊在包括序列參數集合(sequence parameter set,簡稱SPS)和圖像參數集合(picture parameter set,簡稱PPS)的位元流中發送。
根據JVET-P2001,SPS中的子圖像資訊的發送在表1中示出。表 1 : SPS 中子圖像資訊的發送
… | |
subpics_present_flag | u(1) |
if( subpics_present_flag ) { | |
sps_ num_subpics_minus1 | u(8) |
for( i = 0; i <= sps_num_subpics_minus1; i++ ) { | |
subpic_ctu_top_left_x [ i ] | u(v) |
subpic_ctu_top_left_y [ i ] | u(v) |
subpic_width_minus1 [ i ] | u(v) |
subpic_height_minus1 [ i ] | u(v) |
subpic_treated_as_pic_flag [ i ] | u(1) |
loop_filter_across_subpic_enabled_flag [ i ] | u(1) |
} | |
} | |
sps_subpic_id_present_flag | u(1) |
if( sps_subpics_id_present_flag ) { | |
sps_subpic_id_signalling_present_flag | u(1) |
if( sps_subpics_id_signalling_present_flag ) { | |
sps_subpic_id_len_minus1 | ue(v) |
for( i = 0; i <= sps_num_subpics_minus1; i++ ) | |
sps_subpic_id [ i ] | u(v) |
} | |
} | |
… |
在上表中,subpics_present_flag
等於1表示子圖像參數存在於SPS RBSP語法中。subpics_present_flag等於0表示子圖像參數不存在於SPS RBSP語法中。
註2–當位元流是子位元流提取過程的結果並且僅包含子位元流提取過程的輸入位元流的子圖像的子集合時,可能需要將SPS的RBSP中的subpics_present_flag的值設置為等於1。
sps_num_subpics_minus1
加1表示子圖像的數量。sps_num_subpics_minus1的範圍應在0到254之間。如果sps_num_subpics_minus1不存在,則sps_num_subpics_minus1的值被推斷為等於0。
sps_subpic_id_present_flag
等於1表示在SPS中存在子圖像ID映射。sps_subpic_id_present_flag等於0表示SPS中不存在子圖像ID映射。
sps_subpic_id_signalling_present_flag
等於1表示在SPS中發送子圖像ID映射。sps_subpic_id_signalling_present_flag等於0表示未在SPS中發送子圖像ID映射。如果sps_subpic_id_signalling_present_flag不存在,則sps_subpic_id_signalling_present_flag的值被推斷為等於0。
sps_subpic_id_len_minus1
加1表示用於表示語法元素sps_subpic_id [i]的位元數量。sps_subpic_id_len_minus1的值應在0到15之間,包括0和15。
sps_subpic_id
[i]表示第i個子圖像的子圖像ID。sps_subpic_id [i]語法元素的長度為sps_subpic_id_len_minus1+1位元。當sps_subpic_id [i]不存在時,並且當sps_subpic_id_present_flag等於0時,對於0到sps_num_subpics_minus1(包括端點)之間的每個i,sps_subpic_id [i]的值被推斷為等於i。
根據JVET-P2001,PPS中子圖像資訊的發送如表2所示。表 2 : PPS 中子圖像資訊的發送
… | |
pps_subpic_id_signalling_present_flag | u(1) |
if( pps_subpics_id_signalling_present_flag ) { | |
pps_num_subpics_minus1 | ue(v) |
pps_subpic_id_len_minus1 | ue(v) |
for( i = 0; i <= pps_num_subpic_minus1; i++ ) | |
pps_subpic_id [ i ] | u(v) |
} | |
… |
pps_subpic_id_len_minus1
加1指定用於表示語法元素pps_subpic_id [i]的位元數量。pps_ subpic_id_len_minus1的值應在0到15之間,包括0和15。
位元流一致性的要求是,對於編解碼層視訊序列(coded layer video sequence,簡稱CLVS)中的編碼圖像所引用的所有PPS,pps_subpic_id_len_minus1的值應當相同。
pps_subpic_id
[i]表示第i個子圖像的子圖像ID。pps_subpic_id [i]語法元素的長度為pps_subpic_id_len_minus1+1位元。
根據JVET-P2001,圖像報頭(Picture Header,簡稱PH)中的子圖像資訊的發送在表3中示出。表 3 : PH 中子圖像資訊的發送
if( sps_subpic_id_present_flag && !sps_subpic_id_signalling_flag ) { | |
ph_subpic_id_signalling_present_flag | u(1) |
if( ph_subpics_id_signalling_present_flag ) { | |
ph_subpic_id_len_minus1 | ue(v) |
for( i = 0; i <= sps_num_subpics_minus1; i++ ) | |
ph_subpic_id [ i ] | u(v) |
} | |
} |
ph_subpic_id_signalling_present_flag
等於1表示在PH中發送子圖像ID映射。ph_subpic_id_signalling_present_flag等於0表示在PH中未發送子圖像ID映射。
ph_subpic_id_len_minus1
加1指定用於表示語法元素ph_subpic_id [i]的位元數量。pic_subpic_id_len_minus1的值應在0到15的範圍內(包括0和15)。
位元流一致性的要求是,對於CLVS中的編解碼圖像所引用的所有PH,ph_subpic_id_len_minus1的值應當相同。
ph_subpic_id
[i]指定第i個子圖像的子圖像ID。ph_subpic_id [i]語法元素的長度為ph_subpic_id_len_minus1 +1位元。
列表SubpicIdList [i]可導出如下:
for(i = 0; i <= sps_num_subpics_minus1; i ++)
SubpicIdList [i] = sps_subpic_id_present_flag?
(sps_subpic_id_signalling_present_flag?sps_subpic_id [i]:
(ph_subpic_id_signalling_present_flag?ph_subpic_id [i]:pps_subpic_id [i])):i
儘管VVC Draft 7標準指定了用於表示語法元素sps_subpic_id [i]的位元數量(例如sps_subpic_id_len_minus1加1)和子圖像總數量(例如sps_num_subpics_minus1 +1),但該標準並未解決的問題是每個子圖像都需要有自己的ID才能區分各種子圖像。因此,本發明公開了一種解決該問題的方法。
方法
1
:根據本發明的實施例的子圖像資訊的發送約束
為了解決這個問題,根據本發明的實施例,子圖像資訊的發送被提出。子圖像資訊的發送的實施例是基於表2。
根據JVET-P2001,語法(sps_subpic_id_len_minus1)在SPS中發送以指示用於表示語法元素sps_subpic_id [i]的位元數量。同樣,語法(sps_num_subpics_minus1
加1)指定子圖像的數量。在本發明的實施例中,基於sps_num_subpics_minus1的值進一步被約束在sps_subpic_id_len_minus1的範圍。例如,(1 <<(sps_subpic_id_len_minus1加1))的值應大於或等於(sps_num_subpics_minus1加1),其中“<<”對應于算術左移運算,1 << x對應於2的x次冪以及x是整數。又例如,sps_subpic_id_len_minus1的值應大於或等於Ceil(Log2(sps_num_subpics_minus1 plus))– 1,其中Ceil()對應於上限函數,而Ceil(x)代表大於或等於x的最小整數 。
在另一實施例中,相同的約束被應用於PPS中的pps_subpic_id_len_minus1
。例如,(1 <<(pps_subpic_id_len_minus1加1))的值應大於或等於(pps_num_subpics_minus1
加1)。在另一實施例中,相同的約束被應用於PH中的ph_subpic_id_len_minus1
。例如,(1 <<(ph_subpic_id_len_minus1
加1))的值應大於或等於(ph_num_subpics_minus1加1)。
發送彩色視訊的劃分資訊
在JVET-P2001中,彩色視訊的劃分資訊在SPS中被發送,如表4所示。表 4 :在 SPS 中發送彩色視訊的劃分資訊
… | |
log2_min_luma_coding_block_size_minus2 | ue(v) |
partition_constraints_override_enabled_flag | u(1) |
sps_log2_diff_min_qt_min_cb_intra_slice_luma | ue(v) |
sps_log2_diff_min_qt_min_cb_inter_slice | ue(v) |
sps_max_mtt_hierarchy_depth_inter_slice | ue(v) |
sps_max_mtt_hierarchy_depth_intra_slice_luma | ue(v) |
if( sps_max_mtt_hierarchy_depth_intra_slice_luma != 0 ) { | |
sps_log2_diff_max_bt_min_qt_intra_slice_luma | ue(v) |
sps_log2_diff_max_tt_min_qt_intra_slice_luma | ue(v) |
} | |
if( sps_max_mtt_hierarchy_depth_inter_slice != 0 ) { | |
sps_log2_diff_max_bt_min_qt_inter_slice | ue(v) |
sps_log2_diff_max_tt_min_qt_inter_slice | ue(v) |
} | |
if( qtbtt_dual_tree_intra_flag ) { | |
sps_log2_diff_min_qt_min_cb_intra_slice_chroma | ue(v) |
sps_max_mtt_hierarchy_depth_intra_slice_chroma | ue(v) |
if( sps_max_mtt_hierarchy_depth_intra_slice_chroma != 0 ) { | |
sps_log2_diff_max_bt_min_qt_intra_slice_chroma | ue(v) |
sps_log2_diff_max_tt_min_qt_intra_slice_chroma | ue(v) |
} | |
} |
sps_log2_diff_min_qt_min_cb_intra_slice_luma
指定由CTU的四叉樹分割產生的亮度葉塊的亮度樣本中最小尺寸的以2為底的對數與片段_類型等於2(參考SPS)的片段(即I幀)的亮度CU的亮度樣本中最小編解碼塊尺寸的以2為底的對數之間的默認差值。當partition_constraints_override_enabled_flag等於1時,默認差值可由PH中存在的pic_log2_diff_min_qt_min_cb_luma覆蓋(參考SPS)。 sps_log2_diff_min_qt_min_cb_intra_slice_luma的值應在0到CtbLog2SizeY-MinCbLog2SizeY範圍內。CTU的四叉樹分割產生的亮度葉塊的亮度樣本中最小尺寸的以2為底的對數可由如下導出:
MinQtLog2SizeIntraY = sps_log2_diff_min_qt_min_cb_intra_slice_luma + MinCbLog2SizeY.
sps_log2_diff_min_qt_min_cb_inter_slice
指定由CTU的四叉樹分割產生的亮度葉塊的亮度樣本中最小尺寸的以2為底的對數與片段_類型等於0(即B幀)或等於1(即P幀)(參考SPS)的片段的亮度CU的亮度樣本中最小編解碼塊尺寸的以2為底的對數之間的默認差值。當partition_constraints_override_enabled_flag等於1時,默認差值可由PH中存在的pic_log2_diff_min_qt_min_cb_luma覆蓋(參考SPS)。sps_log2_diff_min_qt_min_cb_inter_slice的值應在0到CtbLog2SizeY-MinCbLog2SizeY範圍內(包含端點)。CTU的四叉樹分產生的亮度葉塊的亮度樣本中最小尺寸的以2為底的對數可由如下導出:
MinQtLog2SizeInterY = sps_log2_diff_min_qt_min_cb_inter_slice + MinCbLog2SizeY.
sps_max_mtt_hierarchy_depth_inter_slice
指定編解碼單元的默認最大層次深度,該編解碼單元由片段_類型等於0(B)或1(P)(參考SPS)的片段中的四叉樹葉的多類型樹分割產生。當partition_constraints_override_enabled_flag等於1時,默認最大層次深度可由PH中存在的pic_max_mtt_hierarchy_depth_inter_slice覆蓋(參考SPS)。sps_max_mtt_hierarchy_depth_inter_slice的值應在0到2 *(CtbLog2SizeY-MinCbLog2SizeY)的範圍内,包含端點。
sps_max_mtt_hierarchy_depth_intra_slice_luma
指定編解碼單元的默認最大層次深度,該編解碼單元是由片段_類型等於2(I)(參考SPS)的片段中的四叉樹葉進行多類型樹分割產生。當partition_constraints_override_enabled_flag等於1時,默認最大層次深度可被由PH中存在的pic_max_mtt_hierarchy_depth_intra_slice_luma覆蓋(參考SPS)。sps_max_mtt_hierarchy_depth_intra_slice_luma的值應在0到2 *(CtbLog2SizeY-MinCbLog2SizeY)範圍內,包含端點。
方法
2
:根據本發明的實施例的發送彩色視訊的劃分資訊
根據本發明的一實施例,語法(sps_log2_diff_min_qt_min_cb_intra_slice_luma
),在SPS中發送,指定在由CTU的四叉樹分割產生的亮度葉塊的亮度樣本中最小尺寸的以2為底的對數與片段_類型等於2(即I幀)(參考SPS)的片段的亮度CU的亮度樣本中最小編解碼塊尺寸的以2為底的對數之間的默認差值。sps_log2_diff_min_qt_min_cb_inter_slice
在SPS中被發送來指定亮度編解碼塊(使用三元樹分割產生的)的亮度樣本中最大尺寸(寬度或高度)的以2為底的對數與片段_類型等於0(即B幀)或等於1(即P幀)(參考SPS)的片段的亮度葉塊(由CTU的四叉樹分割產生的)的亮度樣本中最小尺寸(寬度或高度)的以2為底的對數之間的默認差值。
如果MTT(多重變換類型)不被允許,即sps_max_mtt_hierarchy_depth_intra_slice_luma或sps_max_mtt_hierarchy_depth_inter_slice_luma等於0,則由CTU的四叉樹分割產生的亮度葉塊的亮度採樣的最小尺寸被推斷為亮度CU的亮度樣本中的最小編解碼塊大小。這樣,sps_log2_diff_min_qt_min_cb_intra_slice_luma
和sps_log2_diff_min_qt_min_cb_inter_slice
不需要被發送。在一實施例中,在sps_max_mtt_hierarchy_depth_intra_slice_luma
和sps_max_mer_hierarchy_depth_interslice
之後,sps_log2_diff_min_qt_min_cb_intra_slice_luma
和sps_log2_diff_min_qt_min_cb_inter_slice
被發送。僅當sps_max_mtt_hierarchy_depth_intra_slice_luma
不等於0時,sps_log2_diff_min_qt_min_cb_intra_slice_luma
將被發送。否則,它被推斷為零。僅當sps_max_mtt_hierarchy_depth_inter_slice
不等於0時,sps_log2_diff_min_qt_min_cb_inter_slice
才會被發出。 否則,它被推斷為零。 而且,上述實施例可以擴展到色度語法,即,sps_log2_diff_min_qt_min_cb_intra_slice_chroma
。
根據本發明的一實施例的彩色視訊的分割資訊的發送在表5中示出。表 5 :根據本發明的實施例在 SPS 中發送彩色視訊的分割資訊
//sps_log2_diff_min_qt_min_cb_intra_slice_luma// | //ue(v)// |
// sps_log2_diff_min_qt_min_cb_inter_slice// | //ue(v)// |
sps_max_mtt_hierarchy_depth_inter_slice | ue(v) |
sps_max_mtt_hierarchy_depth_intra_slice_luma | ue(v) |
if( sps_max_mtt_hierarchy_depth_intra_slice_luma != 0 ) { | |
sps_log2_diff_min_qt_min_cb_intra_slice_luma | ue(v) |
sps_log2_diff_max_bt_min_qt_intra_slice_luma | ue(v) |
sps_log2_diff_max_tt_min_qt_intra_slice_luma | ue(v) |
} | |
if( sps_max_mtt_hierarchy_depth_inter_slice != 0 ) { | |
sps_log2_diff_min_qt_min_cb_inter_slice | ue(v) |
sps_log2_diff_max_bt_min_qt_inter_slice | ue(v) |
sps_log2_diff_max_tt_min_qt_inter_slice | ue(v) |
} | |
if( qtbtt_dual_tree_intra_flag ) { | |
//sps_log2_diff_min_qt_min_cb_intra_slice_chroma// | //ue(v)// |
sps_max_mtt_hierarchy_depth_intra_slice_chroma | ue(v) |
if( sps_max_mtt_hierarchy_depth_intra_slice_chroma != 0 ) { | |
sps_log2_diff_min_qt_min_cb_intra_slice_chroma | ue(v) |
sps_log2_diff_max_bt_min_qt_intra_slice_chroma | ue(v) |
sps_log2_diff_max_tt_min_qt_intra_slice_chroma | ue(v) |
} | |
} |
上面的語法表是基於表4中的常規語法表設計的,其中雙斜杠(即“//”)內的文本表示已刪除的文本,而斜體樣式的文本則表示插入的文本。
在
APS
和
PH
發送
LMCS
的發送語法和縮放列表
在JVET-P2001中,LMCS的發送語法以及APS和PH中的縮放列表分別在表6和表7中顯示。表 6 :在 APS 發送 LMCS 的語法和縮放列表資料
表 7 :在 PH 發送 LMCS 的語法和 PH 的縮放列表資料
adaptation_parameter_set_rbsp( ) { | Descriptor |
adaptation_parameter_set_id | u(5) |
aps_params_type | u(3) |
if( aps_params_type = = ALF_APS ) | |
alf_data( ) | |
else if( aps_params_type = = LMCS_APS ) | |
lmcs_data( ) | |
else if( aps_params_type = = SCALING_APS ) | |
scaling_list_data( ) | |
aps_extension_flag | u(1) |
if( aps_extension_flag ) | |
while( more_rbsp_data( ) ) | |
aps_extension_data_flag | u(1) |
rbsp_trailing_bits( ) | |
} |
… | |
if( sps_lmcs_enabled_flag ) { | |
pic_lmcs_enabled_flag | u(1) |
if( pic_lmcs_enabled_flag ) { | |
pic_lmcs_aps_id | u(2) |
if( ChromaArrayType != 0 ) | |
pic_chroma_residual_scale_flag | u(1) |
} | |
} | |
if( sps_scaling_list_enabled_flag ) { | |
pic_scaling_list_present_flag | u(1) |
if( pic_scaling_list_present_flag ) | |
pic_scaling_list_aps_id | u(3) |
} |
方法
3
:根據本發明的實施例發送彩色視訊的分割資訊
在APS和PH中,LMCS的語法和縮放列表被發送。為了使語法發送更加靈活,在一實施例中,在PH中的pic_lmcs_enabled_flag之前,pic_lmcs_enabled_present_flag被發送以指示LMCS資訊(即pic_lmcs_aps_id或pic_chroma_residual_scale_flag)是否在PH中發送。如果pic_lmcs_enabled_present_flag被啓用,pic_lmcs_enabled_flag被發送,並且pic_lumc_aps_id,pic_lmcs_aps_id和pic_chroma_residual_scale_flag被發送。否則,(如果pic_lmcs_enabled_present_flag為假),則與LMCS相關的語法無需在PH中發送。在另一實施例中,LMCS語法可以在片段報頭中發送,以進一步增加LMCS的靈活性。例如,如果sps_lmcs_enabled_flag被啓用且pic_lmcs_enabled_present_flag為假,則slice_lmcs_enabled_flag將被發送。此外,如果slice_lmcs_enabled_flag為真,則其他與LMCS有關的語法(即slice_lumc_aps_id,slice_lmcs_aps_id和slice_chroma_residual_scale_flag)將被發送。在另一實施例中,如果sps_lmcs_enabled_flag被啓用,則無論pic_lmcs_enabled_present_flag如何, slice_lmcs_enabled_flag都會被發送。此外,在片段報頭中發送的LMCS參數可以覆蓋在PH中發送的LMCS參數。表 8 :根據本發明的實施例在 PH 中發送 LMCS 資料的語法
表9:根據本發明的實施例在片段報頭中發送LMCS資料的語法
if( sps_lmcs_enabled_flag ) { | |
pic_lmcs_enabled_present_flag | |
if (pic_lmcs_enabled_present_flag) { | |
pic_lmcs_enabled_flag | u(1) |
if( pic_lmcs_enabled_flag ) { | |
pic_lmcs_aps_id | u(2) |
if( ChromaArrayType != 0 ) | |
pic_chroma_residual_scale_flag | u(1) |
} | |
} | |
} |
if(sps_lmcs_enabled_flag && ! pic_lmcs_enabled_present_flag) { |
slice_ lmcs_enabled_flag |
if(slice_lmcs_enabled_flag) { |
slice_lmcs_aps_id |
if( ChromaArrayType != 0 ) |
slice_chroma_residual_scale_flag |
} |
} |
pic_lmcs_enabled_present_flag
等於1指定pic_lmcs_enabled_flag,pic_lmcs_aps_id和pic_chroma_residual_scale_flag存在於PH中。 pic_lmcs_enabled_present_flag等於0表示pic_lmcs_enabled_flag,pic_lmcs_aps_id和pic_chroma_residual_scale_flag不存在於PH中。如果pic_lmcs_enabled_present_flag不存在,則其被推斷為等於0。
slice_lmcs_enabled_flag
等於1表示具有色度縮放的亮度映射在片段中被啟用。slice_lmcs_enabled_flag等於0表示具有色度縮放的亮度映射在片段中被禁用。如果slice_lmcs_enabled_flag不存在,則slice_lmcs_enabled_flag的值被推斷為等於pic_lmcs_enabled_flag。
slice_lmcs_aps_id
表示片段所參考的LMCS APS的adaptive_parameter_set_id。具有等於LMCS_APS的aps_params_type和等於slice_lmcs_aps_id的adaptation_parameter_set_id的APS NAL單元的TemporalId應當小於或等於編解碼後的片段NAL單元的TemporalId。當slice_lmcs_enabled_flag等於1並且slice_lmcs_aps_id不存在時,slice_lmcs_aps_id的值被推斷為等於pic_lmcs_aps_id的值。
slice_chroma_residual_scale_flag
等於1表示片段的色度殘差縮放被啓用。slice_chroma_residual_scale_flag等於0表示片段的色度殘差縮放被禁用。當slice_lmcs_enabled_flag等於1且slice_chroma_residual_scale_flag不存在時,slice_chroma_residual_scale_flag被推斷為等於pic_chroma_residual_scale_flag。
在另一實施例中,以上語法設計也可應用於縮放列表的發送。例如,在PH中的pic_scaling_list_present_flag之前, pic_scaling_list_enabled_present_flag被發送,以指示與縮放列表相關的語法(即pic_scaling_list_present_flag和pic_scaling_list_aps_id)是否在PH中被發送。此外,僅當pic_scaling_list_enabled_present_flag為真時,pic_scaling_list_present_flag和pic_scaling_list_aps_id才會存在於PH中。否則(即pic_scaling_list_enabled_present_falg為假),與縮放列表相關的語法不需要在PH中發送。在另一實施例中,縮放列表語法可以在片段報頭中發送。例如,如果sps_scaling_list_enabled_flag被啓用,並且pic_scaling_list_enabled_present_flag為假,則slice_scaling_list_enabled_flag將在片段報頭中發送。此外,如果slice_scaling_list_enabled_flag為真,則其他與縮放列表相關的語法(即slice_scaling_list_aps_id)被發送。在另一示例中,如果sps_scaling_list_enabled_flag被啓用,則無論pic_scaling_list_enabled_present_flag如何,slice_scaling_list_enabled_flag都將在片段報頭中發送。同樣,在片段報頭中發送的縮放列表可覆蓋在PH中發送的縮放列表。表 10 :根據本發明的實施例在 PH 發送所發列表資料的語法
表 11 :根據本發明的實施例在片段報頭發送縮放列表資料的語法
if( sps_scaling_list_enabled_flag ) { | |
pic_scaling_list_enabled_present_flag | |
if (pic_scaling_list_enabled_present_flag) { | |
pic_scaling_list_present_flag | u(1) |
if( pic_scaling_list_present_flag ) | |
pic_scaling_list_aps_id | u(3) |
} | |
} |
if(sps_scaling_list_enabled_flag && ! pic_scaling_list_enabled_present_flag) { |
slice_ scaling_list_present_flag |
if(slice_scaling_list_present_flag) { |
slice_scaling_list_aps_id |
} |
} |
pic_scaling_list_enabled_present_flag等於1表示pic_scaling_list_present_flag和pic_scaling_list_aps_id存在於PH中。pic_scaling_list_enabled_present_flag等於0表示pic_scaling_list_present_flag和pic_scaling_list_aps_id不存在於PH中。如果pic_scaling_list_enabled_present_flag不存在,則其被推斷為等於0。
slice_scaling_list_present_flag
等於1表示用於片段的縮放列表資料是基於參考縮放列表APS中包含的縮放列表資料而導出的。slice_scaling_list_present_flag等於0表示用於片段的縮放列表資料被設置為等於16。如果slice_scaling_list_present_flag不存在,則slice_scaling_list_present_flag的值被推斷為等於pic_scaling_list_present_flag。
slice_scaling_list_aps_id
表示縮放列表APS的adaptation_parameter_set_id。具有等於SCALING_APS的aps_params_type和等於slice_scaling_list_aps_id的adaptive_parameter_set_id的APS NAL單元的TemporalId應當小於或等於編解碼後的片段NAL單元的TemporalId。如果adaptation_parameter_set_id不存在並且slice_scaling_list_present_flag等於1,則slice_scaling_list_aps_id的值被推斷為等於pic_scaling_list_aps_id。
子圖像
ID
在JVET-P2001,VVC草案中,一圖像可包括幾個子圖像。為了標識單獨的子圖像,相應的子圖像id在SPS,PPS或圖像報頭中發送,以指定每個子圖像的索引。在本發明中,提出增加約束以確保發送的子圖像的子圖像id是唯一的。相關的語法和語義如下。
子圖像
ID
:提出的方法
1
如在JVET-P2001中指定的,sps_subpic_id
[i]指定第i個子圖像的子圖像ID。sps_subpic_id [i]語法元素的長度為sps_subpic_id_len_minus1 +1位元。當sps_subpic_id [i]不存在時,並且當sps_subpic_id_present_flag等於0時,對於0到sps_num_subpics_minus1(包括端點)之間的每個i,sps_subpic_id [i]的值被推斷為等於i。根據本發明的實施例,如果i不等於j,則位元流一致性要求是:sps_subpic_id [i]和sps_subpic_id [j]應當不同。
如在JVET-P2001中指定的,pps_subpic_id
[i]指定第i個子圖像的子圖像ID。pps_subpic_id [i]語法元素的長度為pps_subpic_id_len_minus1 +1位元。根據本發明的實施例,如果i不等於j,則位元流一致性的要求是:pps_subpic_id [i]和pps_subpic_id [j]應當不同。
如在JVET-P2001中指定的,ph_subpic_id [i]表示第i個子圖像的子圖像ID。ph_subpic_id [i]語法元素的長度為ph_subpic_id_len_minus1 +1位元。根據本發明的實施例,如果i不等於j,則位元流一致性的要求是:ph_subpic_id [i]和ph_subpic_id [j]應當不同。
列表SubpicIdList [i]可如下導出:
for(i = 0; i <= sps_num_subpics_minus1; i ++)
SubpicIdList [i] = sps_subpic_id_present_flag?
子圖像ID:提出的方法2
為了很好地區分每個子圖像,代替在子圖像ID上添加位元流一致性要求,其可根據本發明的實施例藉由約束SubpicIdList[]來實現。根據該實施例的語法設計的示例如下所示。
ph_subpic_id[i]指定第i個子圖像的子圖像ID。ph_subpic_id[i]語法元素的長度為ph_subpic_id_len_minus1+1位元。根據一實施例,列表SubpicIdList[i]可導出如下:
根據本發明的實施例,如果i不等於j,則位元流一致性的要求是:SubpicIdList[i]和SubpicIdList[j]應當不同。
子圖像ID:提出的方法3
如在JVET-P2001中指定的,語法(即sps_subpic_id_len_minus1)在SPS中被發送,以指示用於表示語法元素sps_subpic_id[i]的位元數量,並且sps_num_subpics_minus1加1指定子圖像的數量。在一實施例中,基於sps_num_subpics_minus1的值,sps_num_subpics_minus1的範圍進一步被約束。例如,(1<<(sps_subpic_id_len_minus1加1))的值應大於或等於(sps_num_subpics_minus1加1)。在另一示例中,sps_subpic_id_len_minus1的值應大於或等於Ceil(Log2(sps_num_subpics_minus1 plus))-1。在另一實施例中,相同的約束將被應用於PPS中的pps_subpic_id_len_minus1
。例如,(1 <<(pps_subpic_id_len_minus1加1))的值應大於或等於(pps_num_subpics_minus1
加1)。在另一實施例中,相同的約束被應用於PH中的ph_subpic_id_len_minus1
。例如,(1 <<(ph_subpic_id_len_minus1
加1))的值應大於或等於(ph_num_subpics_minus1加1)。
在另一實施例中, sps/pps/ph_subpic_id_len_minus1被重命名為sps/ pps/ph_subpic_id_len_minus_offset,以及sps/pps/ph_subpic_id_len_minus_offset加上偏移量,其中該偏移量被設置為等於Ceil(Log2_spsmin(sps/pps_num_subpics_minus1加1)。
pps_num_subpics_minus1
加1表示參考PPS的編解碼圖像中的子圖像數量。
位元流一致性的要求是pps_num_subpic_minus1的值應等於sps_num_subpics_minus1。
pps_subpic_id_len_minus_offset
plus Ceil(Log2(pps_num_subpics_minus1加1))表示用於表示語法元素pps_subpic_id [i]的位元數量。pps_ subpic_id_len_minus1的值應在0到15之間(包括0和15)。
位元流一致性的要求是,對於CLVS中的編解碼圖像所參考的所有PPS,pps_subpic_id_len_minus1的值應當相同。
pps_subpic_id
[i]指定第i個子圖像的子圖像ID。pps_subpic_id [i]語法元素的長度為pps_subpic_id_len_minus1 +1位元。
ph_subpic_id_len_minus_offset plus Ceil(Log2(pps_num_subpics_minus1加1))指定用於表示語法元素ph_subpic_id [i]的位元數量。pic_subpic_id_len_minus1的值應在0到15之間(包括0和15)。
位元流一致性的要求是,對於CLVS中的編解碼圖像所參考的所有PH,ph_subpic_id_len_minus1的值應當相同。
ph_subpic_id [i]指定第i個子圖像的子圖像ID。ph_subpic_id [i]語法元素的長度為ph_subpic_id_len_minus1 +1位元。
列表SubpicIdList [i]可如下導出:
for(i = 0; i <= sps_num_subpics_minus1; i ++)
SubpicIdList [i] = sps_subpic_id_present_flag? (76)
(sps_subpic_id_signalling_present_flag?sps_subpic_id [i]: (ph_subpic_id_signalling_present_flag?ph_subpic_id [i]:pps_subpic_id [i])):i
任一前述提出的方法可在編碼器和/或解碼器中實現。例如,任一所提出的方法可在編碼器的幀間/幀內/預測/變換模組和/或解碼器的逆變換/幀間/幀內/預測模組中實現。可替代地,任一提出的方法可被實現為耦合到編碼器的逆變換/幀間/幀內/預測模組和/或解碼器的幀間/幀內/預測/變換模組的電路,以提供幀間/幀内/預測/變換模組所需的資訊。
第6圖示出根據本發明的實施例的使用約束子圖像語法的示例性編碼系統的流程圖。流程圖中所示的步驟可被實現為在編碼器側的一個或多個處理器(例如,一個或多個CPU)上可執行的程式碼。流程圖中所示的步驟也可以基於硬體來實現,例如被佈置為執行流程圖中的步驟的一個或多個電子設備或處理器。根據該方法,在步驟610中,與視訊序列的編碼資料相對應的位元流在編碼器側被生成或在解碼器側被接收,其中,該位元流包括第一語法和第二語法,第一語法對應於用來表示第三語法集合的位元的目標數量,每個第三語法指定子圖像集合中的一子圖像的一子圖像ID,第二語法對應於該子圖像集合中的子圖像的總數量,以及其中對第一語法的第一值進行的計算等於或大於對第二語法的第二值進行的計算。在步驟620中,基於包括子圖像集合的資訊,視訊序列在編碼器側被編碼或者在解碼器側被解碼。
第7圖示出根據本發明實施例的使用約束的子圖像語法的另一示例性編解碼系統的流程圖。根據該方法,在步驟710中,與視訊序列的編碼資料相對應的位元流在編碼器側被生成或在解碼器側被接收,其中,該位元流包括子圖像ID語法集合,並且每個子圖像ID語法指定子圖像集合的一子圖像的一子圖像ID,以及其中如果第一子圖像與第二子圖像不同,則第一子圖像的第一子圖像ID語法與第二子圖像的第二子圖像ID語法具有不同的值。在步驟720中,基於包括子圖像集合的資訊,視訊序列在編碼器側被編碼或者在解碼器側被解碼。
所示的流程圖旨在說明根據本發明的視訊編碼的示例。本領域之通常技術者可以修改每個步驟,重新佈置步驟,拆分步驟或組合步驟以實踐本發明,而不背離本發明的精神。在本公開中,特定的語法和語義已被用來說明用於實現本發明的實施例的示例。本領域之通常技術者可藉由用等同的語法和語義替換語法和語義來實踐本發明,而不脫離本發明的精神。
上述描述被給出以使本领域之通常技术者能夠實踐在特定應用及其要求的上下文中提供的本發明。對所描述的實施例的各種修改對於本领域之通常技术者將是顯而易見的,並且本文中定義的一般原理可以應用於其他實施例。因此,本發明不旨在限於所示出和描述的特定實施例,而是與符合本文公開的原理和新穎性特徵的最寬範圍相一致。在以上詳細描述中,示出了各種具體細節以便提供對本發明的透徹理解。然而,本领域之通常技术者將理解,本發明可被實施。
如上所述的本發明的實施例可以以各種硬體,軟體代碼或兩者的組合來實現。例如,本發明的實施例可以是集成到視訊壓縮晶片中的一個或多個電路或集成到視訊壓縮軟體中以執行本文描述的處理的程式碼。本發明的實施例還可以是在數位訊號處理器(Digital Signal Processor,DSP)上執行以執行本文描述的處理的程式碼。本發明還可涉及由電腦處理器,數位訊號處理器,微處理器或現場可程式設計閘陣列(field programmable gate arragy,簡稱FPGA)執行的許多功能。該些處理器可被配置為藉由執行定義本發明所體現的特定方法的機器可讀軟體代碼或韌體代碼來執行根據本發明的特定任務。軟體代碼或韌體代碼可以不同的程式設計語言和不同的格式或樣式來開發。軟體代碼也可被編譯用於不同的目標平臺。然而,不同的代碼格式,軟體代碼的樣式和語言以及配置代碼以執行根據本發明的任務的其他手段將不脫離本發明的精神和範圍。
在不脫離本發明的精神或基本特徵的情況下,本發明可以以其他特定形式實施。所描述的示例在所有方面僅應被認為是說明性的而非限制性的。因此,本發明的範圍由所附申請專利範圍而不是前述描述來指示。落在申請專利範圍的等同含義和範圍內的所有改變均應包含在其範圍之內。
110:幀内預測
112:運動估計/運動補償
114:開關
116:加法器
118:變換
120:量化
122:熵編碼器
124:逆量化
126:逆變換
128:重構
130:環路濾波器
134:參考圖像緩衝器
146:開關
210:熵解碼
220:運動補償
302:用戶端
304:點雲內容
306:解析器模組
308:2D平面視訊位元流
310、320、330:矩陣
410、420、430:量化矩陣
412:點填充塊
422、432:區域
510:上下文適應性二進位算術編碼解碼器
520:重構塊
530:幀內預測塊
540:運動補償塊
550:前向重塑
560:逆重塑
570:環路濾波器
580:解碼圖像緩衝器
610、620、710、720:步驟
第1圖示出視訊轉碼器的示例性框圖,其中,視訊轉碼器結合了幀內/幀間預測,變換和量化處理。
第2圖示出視頻解碼器的示例性框圖,其中視頻解碼器結合幀內/幀間預測,逆變換和去量化處理。
第3圖示出基於4x4和8x8共用的基本縮放比例矩陣的示例,用於在幀內和幀間編碼模式下導出亮度和色度分量的更大的縮放比例矩陣。
第4圖示出藉由使用複製進行上採樣,從相同類型的基於共用的8x8量化矩陣中,導出大小為16x16和32x32的變換塊的量化矩陣的示例。
第5圖示出引入亮度重塑處理的視訊解碼器的示例性框圖。
第6圖示出根據本發明的實施例的使用約束子圖像語法的示例性編解碼系統的流程圖。
第7圖示出根據本發明的實施例的使用約束子圖像語法的示例性編解碼系統的流程圖。
610、620:步驟
Claims (13)
- 一種用於編解碼一視訊序列的方法,其中一子圖像編解碼模式被包括,該方法包括: 在一編碼器側生成或在一解碼器側接收對應於該視訊序列的編碼資料的一位元流,其中該位元流包括一第一語法和一第二語法,該第一語法對應於用於表示一第三語法集合的多個位元的一目標數量,每個第三語法指定一子圖像集合中一子圖像的一子圖像標識符,每個第二語法對應於該子圖像集合中多個子圖像的一總數量,以及其中對該第一語法的一第一值進行的計算等於或大於對該第二語法的一第二值進行的計算;以及 基於包括該子圖像集合的資訊,在該編碼器側編碼或在該解碼器側解碼該視訊序列。
- 如請求項1所述之用於編解碼一視訊序列的方法,其中,在序列參數集合中,該第一語法和該第二語法在該編碼器側被發送,或在該解碼器側被解析。
- 如請求項1所述之用於編解碼一視訊序列的方法,其中,在序列參數集合,圖像參數集合,片段報頭,圖像報頭或以上結合中,該第一語法和該第二語法在該編碼器側被發送,或在該解碼器側被解析。
- 如請求項1所述之用於編解碼一視訊序列的方法,其中,該第一語法的該第一值是該多個位元的該目標數量減1。
- 如請求項4所述之用於編解碼一視訊序列的方法,其中,該第一語法在序列參數集合中,並被指定為sps_subpic_id_len_minus1,用於表示該多個位元的該目標數量減1。
- 如請求項4所述之用於編解碼一視訊序列的方法,其中,用於計算該第一語法的該第一值對應於(1<<((該多個位元的該目標數量減1)+1),以及其中“<<”表示算術左移運算。
- 如請求項4所述之用於編解碼一視訊序列的方法,其中,該第二語法在序列參數集合中,並被指定為sps_num_subpic_minus1,用於表示該子圖像集合的該多個子圖像的該縂數量減1。
- 如請求項1所述之用於編解碼一視訊序列的方法,其中,該第一語法對應於該多個位元的該目標數量減去偏移量再加上該第一值,以及其中該第一值對應於Ceil(Log2(該多個子圖像的該總數量),並且其中“Ceil”是上限函數,而“Log2”是以2為底數的函數。
- 如請求項1所述之用於編解碼一視訊序列的方法,其中,該位元流滿足位元流一致性要求:該第一值等於或大於該多個子圖像的總數量。
- 一種用於編解碼一視訊序列的裝置,其中一子圖像編解碼模式被包括,該裝置包括一個或多個電子電路,被設置為:在一編碼器側生成或在一解碼器側接收對應於該視訊序列的編碼資料的一位元流,其中該位元流包括一第一語法和一第二語法,該第一語法對應於用於表示一第三語法集合的多個位元的一目標數量,每個第一語法指定一子圖像集合中一子圖像的一子圖像標識符,每個第二語法對應於該子圖像集合中多個子圖像的一總數量,以及其中對該第一語法的一第一值進行的計算等於或大於對該第二語法的一第二值進行的計算;以及基於包括該子圖像集合的資訊,在該編碼器側編碼或在該解碼器側解碼該視訊序列。
- 一種用於解碼一視訊序列的方法,其中一子圖像編解碼模式被包括,該方法包括:在一編碼器側生成或在一解碼器側接收對應於該視訊序列的編碼資料的一位元流,其中該位元流包括一子圖像標識符語法集合,每個子圖像標識符語法指定一子圖像集合中一子圖像的一子圖像標識符,以及其中如果一第一子圖像與一第二子圖像不同,該第一子圖像的一第一子圖像標識符語法與該第二子圖像的一第二圖像標識符語法具有不同值;以及 基於包括該子圖像集合的資訊,在該編碼器側編碼或在該解碼器側解碼該視訊序列。
- 如請求項11所述之用於解碼一視訊序列的方法,其中,該位元流滿足位元流一致性要求:如果該第一子圖像與該第二子圖像不同,該第一子圖像的該第一子圖像標識符語法與該第二子圖像的該第二子圖像標識符語法不同。
- 如請求項11所述之用於解碼一視訊序列的方法,其中,在序列參數集合,圖像參數集合,片段報頭,圖像報頭或以上結合中,該子圖像標識符語法的集合在該編碼器側被發送或在該解碼器側被解析。
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962930705P | 2019-11-05 | 2019-11-05 | |
US62/930,705 | 2019-11-05 | ||
US201962954022P | 2019-12-27 | 2019-12-27 | |
US62/954,022 | 2019-12-27 | ||
US202062958205P | 2020-01-07 | 2020-01-07 | |
US62/958,205 | 2020-01-07 | ||
US17/087,671 | 2020-11-03 | ||
US17/087,671 US11509938B2 (en) | 2019-11-05 | 2020-11-03 | Method and apparatus of signaling subpicture information in video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202135528A TW202135528A (zh) | 2021-09-16 |
TWI772951B true TWI772951B (zh) | 2022-08-01 |
Family
ID=75688372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109138375A TWI772951B (zh) | 2019-11-05 | 2020-11-04 | 用於編解碼視訊序列的方法和裝置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11509938B2 (zh) |
EP (1) | EP4042703A4 (zh) |
KR (1) | KR20220085833A (zh) |
CN (2) | CN114586369B (zh) |
TW (1) | TWI772951B (zh) |
WO (1) | WO2021088919A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020156534A1 (en) | 2019-02-01 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Interactions between in-loop reshaping and intra block copy |
CN113383547A (zh) | 2019-02-01 | 2021-09-10 | 北京字节跳动网络技术有限公司 | 环路整形和帧间编解码工具之间的相互作用 |
CN113574889B (zh) | 2019-03-14 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 环路整形信息的信令和语法 |
WO2020192614A1 (en) | 2019-03-23 | 2020-10-01 | Beijing Bytedance Network Technology Co., Ltd. | Restrictions on adaptive-loop filtering parameter sets |
CN116743997A (zh) | 2019-12-27 | 2023-09-12 | 阿里巴巴(中国)有限公司 | 用信号通知子图像划分信息的方法和装置 |
US11659207B2 (en) * | 2020-06-08 | 2023-05-23 | Qualcomm Incorporated | General constraints of syntax elements for video coding |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140086342A1 (en) * | 2012-09-24 | 2014-03-27 | Qualcomm Incorporated | Sequence level flag for sub-picture level coded picture buffer parameters |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7450831B2 (en) | 2003-04-16 | 2008-11-11 | Lsi Corporation | Method for DVD-subpicture compositing in 420 chroma format |
WO2007114023A1 (ja) | 2006-03-30 | 2007-10-11 | Pioneer Corporation | 情報記録装置および情報記録方法 |
CN102318345B (zh) * | 2009-02-27 | 2014-07-30 | 富士通株式会社 | 动态图像编码装置、动态图像编码方法 |
US20120026394A1 (en) | 2010-07-30 | 2012-02-02 | Emi Maruyama | Video Decoder, Decoding Method, and Video Encoder |
JP2012248984A (ja) * | 2011-05-26 | 2012-12-13 | Sony Corp | 信号送信装置、信号送信方法、信号受信装置、信号受信方法及び信号伝送システム |
US9621906B2 (en) * | 2012-12-10 | 2017-04-11 | Lg Electronics Inc. | Method for decoding image and apparatus using same |
WO2018221368A1 (ja) | 2017-05-31 | 2018-12-06 | シャープ株式会社 | 動画像復号装置、及び動画像符号化装置 |
WO2019002662A1 (en) * | 2017-06-26 | 2019-01-03 | Nokia Technologies Oy | APPARATUS, METHOD AND COMPUTER PROGRAM FOR OMNIDIRECTIONAL VIDEO |
KR102371574B1 (ko) | 2017-07-06 | 2022-03-07 | 프라운 호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 분할된 비디오 스트리밍 개념 |
KR20210107128A (ko) * | 2019-01-09 | 2021-08-31 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 비디오 인코더, 비디오 디코더 및 대응하는 방법 |
ES2980868T3 (es) * | 2019-03-11 | 2024-10-03 | Huawei Tech Co Ltd | Direcciones de segmento basadas en sub-imagen en codificación de vídeo |
JP2022540397A (ja) * | 2019-07-05 | 2022-09-15 | 華為技術有限公司 | 識別子シグナリングを用いたビデオコーディングビットストリーム抽出 |
-
2020
- 2020-11-03 US US17/087,671 patent/US11509938B2/en active Active
- 2020-11-04 TW TW109138375A patent/TWI772951B/zh active
- 2020-11-05 EP EP20885052.9A patent/EP4042703A4/en active Pending
- 2020-11-05 WO PCT/CN2020/126716 patent/WO2021088919A1/en unknown
- 2020-11-05 KR KR1020227018086A patent/KR20220085833A/ko not_active Application Discontinuation
- 2020-11-05 CN CN202080073817.5A patent/CN114586369B/zh active Active
- 2020-11-05 CN CN202311392238.9A patent/CN117294860A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140086342A1 (en) * | 2012-09-24 | 2014-03-27 | Qualcomm Incorporated | Sequence level flag for sub-picture level coded picture buffer parameters |
Non-Patent Citations (3)
Title |
---|
http://phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php?id=8857 * |
網路文獻 B. Bross et al., "Versatile Video Coding (Draft 7)," Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 16th Meeting: Geneva, CH, 1–11 October 2019 * |
網路文獻 B. Bross et al., "Versatile Video Coding (Draft 7)," Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 16th Meeting: Geneva, CH, 1–11 October 2019。http://phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php?id=8857 |
Also Published As
Publication number | Publication date |
---|---|
CN114586369A (zh) | 2022-06-03 |
KR20220085833A (ko) | 2022-06-22 |
EP4042703A1 (en) | 2022-08-17 |
US20210136420A1 (en) | 2021-05-06 |
EP4042703A4 (en) | 2023-07-12 |
CN114586369B (zh) | 2023-11-14 |
US11509938B2 (en) | 2022-11-22 |
WO2021088919A1 (en) | 2021-05-14 |
CN117294860A (zh) | 2023-12-26 |
TW202135528A (zh) | 2021-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11831816B2 (en) | Sub-picture motion vectors in video coding | |
US20240196021A1 (en) | Tile Based Addressing In Video Coding | |
TWI846132B (zh) | 用於視訊編碼系統之跨分量適應性迴圈濾波器的語法傳訊限制方法和裝置 | |
TWI772951B (zh) | 用於編解碼視訊序列的方法和裝置 | |
TW202046738A (zh) | 視訊編碼系統之語法傳訊和參照限制的方法和裝置 | |
US20230247208A1 (en) | Harmonization of Raster Scan And Rectangular Tile Groups In Video Coding | |
KR20220063262A (ko) | 서브픽처 기반 비디오 코딩에서 서브픽처당 하나의 슬라이스의 지시 | |
US11477445B2 (en) | Methods and apparatuses of video data coding with tile grouping | |
RU2792176C2 (ru) | Кодер видео, декодер видео и соответствующие способы | |
TW202139717A (zh) | 圖像和視訊編解碼中發信切片分割資訊之方法和裝置 | |
TW202143714A (zh) | 圖片和視訊編解碼中以信號通知片和切片分區資訊的方法和裝置 |