TWI774075B - 視頻編解碼之具有不同色度格式的多假設預測模式之方法和裝置 - Google Patents
視頻編解碼之具有不同色度格式的多假設預測模式之方法和裝置 Download PDFInfo
- Publication number
- TWI774075B TWI774075B TW109133764A TW109133764A TWI774075B TW I774075 B TWI774075 B TW I774075B TW 109133764 A TW109133764 A TW 109133764A TW 109133764 A TW109133764 A TW 109133764A TW I774075 B TWI774075 B TW I774075B
- Authority
- TW
- Taiwan
- Prior art keywords
- current block
- mode
- prediction
- block
- chroma blocks
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1883—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Color Television Systems (AREA)
Abstract
公開了一種用於視頻編解碼的方法和設備。根據該方法,在編碼器側接收當前塊,或者在解碼器側接收包括當前塊的壓縮資料,其中,當前塊包括一個亮度塊和一個或多個色度塊,該當前塊是通過使用單個分區樹將一個圖像區域分割為包含當前塊的一個或多個分區塊而生成的。確定當前塊的目標編解碼模式。然後,根據目標編解碼模式對當前塊進行編碼或解碼,其中,如果目標編碼模式對應於多假設預測模式並且其寬度、高度或面積小於閾值,則禁用針對所述一個或多個色度塊的預測的附加假設。
Description
本發明涉及使用CIIP(Combined Inter/Intra Prediction,幀間/幀內聯合預測)的視頻編解碼的預測。特別地,本發明公開了針對小尺寸塊提高處理吞吐量的技術。
高效視頻編碼(HEVC)是由視頻編碼聯合協作團隊(JCT-VC)開發的新的國際視頻編碼標準。HEVC基於混合的基於塊的運動補償類DCT變換編碼架構。壓縮的基本單位稱為編碼單位(CU),是2Nx2N的正方形塊,每個CU可以遞歸拆分為四個較小的CU,直到達到預定義的最小大小。每個CU包含一個或多個預測單元(PU)。
為了在HEVC中實現混合編解碼架構的最佳編碼效率,每個PU有兩種預測模式(即幀內預測和幀間預測)。對於幀內預測模式,空間相鄰的重構像素可用於生成方向預測。
在開發HEVC標準之後,在ITU-T SG 16 WP 3和ISO/IEC JTC 1/SC 29/WG 11的聯合視頻探索小組(JVET)的指導下,正在開發另一種合併
的視頻編碼標準,稱為通用視頻編碼(VVC)。對VVC評估了各種新的編解碼工具以及一些現有的編解碼工具。
在VTM(VVC測試模型)軟件中,當CU在合併模式下編碼時,並且如果CU包含至少64個亮度採樣(即CU寬度XCU高度等於或大於64),則附加標誌(CIIP標誌)以CU級別發出信號,以指示是否將組合幀間/幀內預測(CIIP)模式應用於當前CU。為了形成CIIP預測,首先從兩個附加語法元素獲取或隱式分配幀內預測模式。例如,將平面模式隱式地指定為幀內預測模式。再例如,可以使用多達四個可能的幀內預測模式:DC,平面,水平或垂直。然後,使用常規幀內和幀間解碼過程導出幀間預測(現有的預測假設)和幀內預測信號(其他預測假設)。最後,對幀間和幀內預測信號進行加權平均以獲得CIIP預測。可以在JVET-L0100中找到該算法的更詳細說明(M.-S.Chiang,et al.,“CE10.1.1:Multi-hypothesis prediction for improving AMVP mode,skip or merge mode,and intra mode,”ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,12th Meeting:Macao,CN,Oct.2018,Document:JVET-L0100)。
三角預測
對於VTM,在JVET-L0124中(R.-L.Liao,et al.,“CE10.3.1.b:Triangular prediction unit mode,”ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,12th Meeting:Macao,CN,Oct.2018,Document:JVET-L0124)和JVET-L0208(T.Poirier,et al.,“CE10 related:multiple prediction unit shapes,”ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,12th Meeting:Macao,CN,Oct.2018,Document:JVET-L0208)中,提出了三角預測單元模式(TPM)的方案。概念是引入用於運動補償預測的新三角形分區。如第1圖所示,其中標號110與120表示將CU沿對角線或對角線反方向分為兩個三角形預測單元PU1與PU2,每個CU中的三角形預測單元使用其自己的單預測運動矢量和參考幀進
行幀間預測。在預測三角形預測單元之後,對角線邊緣執行自適應加權處理。然後,將變換和量化過程應用於整個CU。注意,該模式僅應用於跳過和合併模式。用信號通知一個附加標誌以指示是否應用了TPM。
自適應加權處理
在預測每個三角形預測單元之後,將自適應加權處理應用於兩個三角形預測單元之間的對角邊緣,以得出整個CU的最終預測。列出了兩個加權因子組,如下所示:.第一加權因子組:{7/8、6/8、4/8、2/8、1/8}和{7/8、4/8、1/8}分別用於亮度和色度樣本;.第二加權因子組:使用{7/8、6/8、5/8、4/8、3/8、2/8、1/8}和{6/8、4/8、2/8}分別用於亮度和色度樣本。
基於兩個三角形預測單元的運動矢量的比較,選擇一個加權因子組。當兩個三角形預測單元的參考圖片彼此不同或者它們的運動矢量差大於16個像素時,使用第二加權因子組。否則,將使用第一個加權因子組。在第2圖中示出了一個示例,其中示出了針對亮度塊的加權因子210,並且示出了針對色度塊的加權因子220。可以在JVET-L0124和JVET-L0208中找到對該算法的更詳細說明。
幾何合併模式(GEO)
JVET-P0068(H.Gao,et al.,“CE4:CE4-1.1,CE4-1.2 and CE4-1.14:Geometric Merge Mode(GEO)”,ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,16th Meeting:Geneva,CH,1-11 October 2019,Document:P0068)提出了幾何合併模式(也稱為幾何劃分模式,geometric partitioning mode,GPM),使用了與TPM相同的預測因子混合概念並擴展了混合多達32種角度和5種距離偏移的140種不同模式。
在P0068中,將140種模式定義為CE4-1.1。為了進一步降低複雜性,在CE4-1.2中,以108種模式和80模式測試了GEO。在CE4-1.14中,測試了類似TPM的簡化運動存儲。
第3A圖示出了在VTM-6.0中用於TPM的分區形狀(311-312),第3B圖示出了為非矩形幀間塊提出的附加形狀(313-319)。
與TPM相似,對於不小於8×8的單預測塊允許針對幀間預測提出的GEO分區,以便在解碼器側具有與雙預測塊相同的儲存帶寬使用率。用於GEO分區的運動矢量預測與TPM對齊。同樣,兩個預測之間的TPM混合應用於內部邊界。
幾何合併模式的分割邊界由角度φ i和距離偏移ρi描述,如圖4所示。角度φ i表示0到360度之間的量化角度,距離偏移ρi表示最大距離ρmax的量化偏移。另外,排除與二叉樹分割和TPM分割重疊的分割方向。
GEO角度和距離量化
角度φ i用固定步長在0到360度之間量化。在CE4-1.1、具有108種模式的CE4-1.2、和CE4-1.14中,以步長11.25度從0到360度之間量化角度φ i,這導致總共32個角度,如第5A圖所示。
在具有80個模式的CE4-1.2中,角度φ i仍以11.25度的步長進行量化;但是,由於在自然值中,目標對象和運動大多是水平的,因此去除了接近垂直方向的角度(例如,接近水平分割邊界)。第5B圖示出了具有24個值的減少的角度。從最大可能距離ρmax以固定步長量化距離ρ i。ρ max的值可以通過等式(1)在幾何上得出,其中w或h等於8並用log2縮放的短邊長度進行縮放。對於φ等於0度的情況,ρmax等於w/2,對於φ等於90度的情況,ρmax等於h/2。向後移的“1.0”樣本是為了避免分割邊界太靠近拐角。
在CE4-1.1和CE4-1.14中,距離ρi用5步量化。結合32個角度,共有140種分割模式,其中不包括二叉樹和TPM分割。在CE4-1.2-中,距離ρi用4步量化。結合32個角度,總共有108種分割模式,其中不包括二叉樹和TPM分割。在CE4-1.2中,距離ρi用4步量化。結合24個角度,一共有80種分割模式,不包括二叉樹和TPM分割。
模式信令
根據建議的方法,GEO模式與TPM模式一起作為附加的合併模式發送信號,如表1所示。
merge_geo_flag[][]用4個CABAC上下文模型發信號,其中前三個是根據上方和左側相鄰塊的模式得出的,第四個是根據當前塊的縱橫比得出的。merge_geo_flag[][]指示當前塊是使用GEO模式還是TPM模式,類似於“most probable mode”標誌。
geo_partition_idx[][]用作查找表的索引,該表存儲角度φi和距
離ρi對。geo_partition_idx使用截斷的二進制編碼,並使用旁路進行二進制化。
公開了一種用於視頻編解碼的方法和設備。根據該方法,在編碼器側接收當前塊,或者在解碼器側接收包括當前塊的壓縮資料,其中,當前塊包括一個亮度塊和一個或多個色度塊,該當前塊是通過分割而生成的。使用單個分區樹將圖像區域劃分為一個或多個包括當前塊的分區塊,並且為當前塊允許一個或多個包括多假設預測模式的編解碼工具。單個分區樹是用於亮度和色度的單個樹。確定當前塊的目標編解碼模式。然後,根據目標編解碼模式對當前塊進行編碼或解碼,其中,如果目標編解碼模式對應於多假設預測模式,並且目標的寬度,高度或面積小於閾值,則禁用針對所述一個或多個色度塊的預測的附加假設。
在一個實施例中,如果所述一個或多個色度塊的寬度小於閾值並且閾值等於4,則禁用針對所述一個或多個色度塊的預測的附加假設。
在一個實施例中,多假設預測模式對應於組合幀間/幀內預測(CIIP)模式。在另一個實施例中,多假設預測模式對應於三角預測模式(TPM)。在又一個實施例中,多假設預測模式對應於幾何合併模式(GEO)。
在一個實施例中,當前塊為色度格式4:4:4、4:2:2或4:2:0。
在一個實施例中,閾值在標準中隱式地預定義或在視頻位元流的變換單元(TU)或變換塊(TB)、編碼單元(CU)或編碼塊(CB)、編碼樹單元(CTU)或編碼樹塊(CTB)、切片(tile)、圖塊、圖塊組、序列參數集(SPS)、圖片參數集(PPS)或圖片級別以信號通知。
在一個實施例中,圖像區域對應於編碼樹單元(CTU)。
610-630、710-730:步驟
110、120、311、312:三角形分區
210、220:加權因子
313-319:附加形狀
第1圖示出了TPM(三角預測模式)的示例,其中CU在對角線方向或對角線反方向上被分成兩個三角預測單元。使用其自身的單方向預測運動矢量和參考幀索引對CU中的每個三角形預測單元進行幀間預測,以根據單預測候選項生成預測。
第2圖示出了自適應加權過程的示例,其中示出了亮度塊(左)和色度塊(右)的加權。
第3A圖說明了VTM-6.0中公開的三角預測模式(TPM)的分區形狀第3B圖示出了正在討論的用於幾何合併模式的其他形狀。
第4圖示出了由角度φ i和距離偏移ρ i描述的幾何合併模式的分割邊界。
第5A圖示出了其中以步長11.25度從0到360度之間量化角度φ i的示例,這導致總共32個角度。
第5B圖示出了一個示例,其中以步長11.25度從0度到360度之間對角度φ i進行量化,並且去除了一些接近垂直方向的角度,這導致總共24個角度。
第6圖示出了根據本發明實施例的用於視頻編碼的示例性預測的流程圖,其中針對小的色度塊禁用了預測的附加假設。
第7圖示出了根據本發明實施例的用於視頻解碼的示例性預測的流程圖,其中針對小的色度塊禁用了預測的附加假設。
以下描述是實施本發明的最佳構想模式。進行該描述是為了說明本發明的一般原理,而不應被認為是限制性的。本發明的範圍最好通過參考
所附的請求保護範圍來確定。
為了提高編解碼效率,公開了多重假設(multiple hypothesis,MH)預測模式。當當前塊使用MH預測模式時,通過加權平均處理將附加的預測假設與現有的預測假設組合,並且組合的預測是當前塊的最終預測。為了克服與小區塊相關的處理效率問題,公開了一種多假設(MH)預測模式的簡化方法,其中根據本發明,MH預測模式在某些條件下不應用於色度塊。當MH預測模式未應用於色度塊時,這意味著預測的附加假設不會與色度塊的現有預測假設結合在一起,並且將現有的預測假設用作當前色度塊的最終預測。將MH預測模式應用於色度塊時,這意味著將附加的預測假設與現有的預測假設相結合,並且將組合的預測用作當前色度塊的最終預測。當使能所提出的方法並且滿足預定條件時,應用所提出的方法。
在一個實施例中,MH預測模式可以是CIIP,TPM或GEO。
在另一個實施例中,即使在CU級的MH模式的原始標誌(例如,CIIP,TPM或GEO)為真,也可以應用所提出的方法。例如,即使CU級CIIP標誌為真,MH模式也不應用於色度塊。這意味著亮度塊的最終預測是組合預測,它由現有的預測假設和附加的預測假設形成;對於色度塊,最終預測是現有預測。
當前的VVC支持包括QT,BT和TT在內的靈活分區機制。在這種分隔結構中,對於亮度分量,塊大小可以在128至4的範圍內,對於色度分量可以在64至2的範圍內。小塊大小(即2xN)的引入導致低效的硬件實現。這會導致流水線延遲,並且在硬體體系結構中需要2xN像素的處理。在大多數硬體實現中,每1個CPU(或GPU)時鐘4x1像素用於亮度和色度。但是,可以斷言,對於2xN的塊,每1個時鐘處理需要一個額外的2x2像素。另外,2xN的內存訪問(讀取和寫入)效率低下,其是因為在每次訪問中僅提取2x1像素。
幀內塊比幀間塊具有更多的依賴性。最擔心的是2xN的幀內塊。在雙樹情況下,亮度的最小大小被設置為4x4.2xN的限制已被廢除。但是,在單樹情況下仍然存在一些2xN幀內色度塊(例如,用於CIIP的2xN幀內色度塊)。為了解決該問題,在另一個實施例中,“MH模式不應用於色度塊”表示預測的其他假設未與色度塊的原始(現有)預測假設結合在一起。在CIIP的情況下,“MH模式不應用於色度塊”意味著對於色度塊,幀內預測不與幀間預測結合,從而直接使用幀間預測。
在另一個實施例中,針對色度格式4:4:4啟用了所提出的方法。
在另一個實施例中,針對色度格式4:2:0啟用所提出的方法。
在另一個實施例中,針對色度格式4:2:2啟用了所提出的方法。
在另一個實施例中,針對色度格式4:2:1啟用了所提出的方法。
在另一個實施例中,針對色度格式4:1:1啟用了所提出的方法。
在另一個實施例中,所提出的方法針對色度格式4:0:0(即,單色度)啟用。
在另一個實施例中,預定義條件是根據塊的寬度,高度或面積。
在一個子實施例中,“塊”在該實施例中可以是亮度塊或色度塊。當該塊表示色度塊時,相應的塊寬度或高度取決於所使用的色度格式。例如,如果使用的色度格式為4:2:0,則將相應的塊寬度配置為並置亮度塊的寬度的一半。
在一個子實施例中,預定條件是塊寬度小於閾值1和/或塊高度
小於閾值2。例如,當啟用CIIP標誌並且相應的色度塊的塊寬度小於4時,使用所提出的方法(MH預測模式不應用於色度塊)。色度塊可以是Cb成分或Cr成分的色度塊。
在另一個子實施例中,預定義條件是塊寬度大於閾值1和/或塊高度大於閾值2。
在另一個子實施例中,預定義條件是塊面積小於閾值3。
在另一個子實施例中,預定義條件是塊面積大於閾值3。
在另一個實施例中,閾值1可以是正整數,例如1、2、4、8、16、32、64、128、256、512或1024。
在另一個實施例中,閾值1可以是在TU(或TB),CU(或CB),CTU(或CTB),切片,圖塊,圖塊組,SPS,PPS或圖片級別中定義的變量。變量為1、2、4、8、16、32、64、128、256、512或1024。
在另一個實施例中,閾值2可以是正整數,例如1、2、4、8、16、32、64、128、256、512或1024。
在另一個實施例中,閾值2可以是在TU(或TB),CU(或CB),CTU(或CTB),切片,圖塊,圖塊組,SPS,PPS或圖片級別中定義的變量。變量為1、2、4、8、16、32、64、128、256、512或1024。
在另一個實施例中,閾值3可以是正整數,例如1、2、4、8、16、32、64、128、256、512或1024。
在另一個實施例中,閾值3可以是在TU(或TB),CU(或CB),CTU(或CTB),切片,圖塊,圖塊組,SPS,PPS或圖片級別中定義的變量。變量可以是1、2、4、8、16、32、64、128、256、512或1024。
在另一個子實施例中,閾值1和閾值2可以相同。
在另一個子實施例中,閾值1,閾值2和/或閾值3對於不同的
色度格式可以不同。
在另一實施例中,本發明中的“塊”可以是CU,CB,TU或TB。
在另一個實施例中,取決於TU(或TB),CU(或CB),CTU(或CTB),條帶,圖塊,圖塊組,SPS,PPS或圖片級別的顯式標誌來使能所提出的方法。
在另一個實施例中,所提出的方法可以用於亮度塊,即,在某些條件下多重假設(MH)預測模式不應用於亮度塊。當所提出的方法被使能並且滿足預定條件時,所提出的方法被應用。
可以應用以上方法的任何組合。例如,當使用色度格式4:4:4且色度塊寬度或高度小於4時,MH模式不會應用於色度。又例如,當使用色度格式4:2:0且色度塊寬度(取決於所使用的色度格式)小於4時,MH模式不應用於色度。換句話說,當滿足MH模式的其他使能條件時(例如,假設MH模式為CIIP,則啟用CIIP標誌),並且色度塊寬度(取決於所使用的色度格式)大於或等於4,則MH模式為不僅適用於亮度塊,而且適用於色度塊。
可以在編碼器和/或解碼器中實現任何上述提議的方法。例如,可以在編碼器的幀內/幀間編碼模塊,運動補償模塊,解碼器的合併候選導出模塊中實現任何所提出的方法。可替代地,任何所提出的方法可以被實現為耦合到編碼器的幀內/幀間編碼模塊和/或運動補償模塊,解碼器的合併候選導出模塊的電路。
第6圖示出了根據本發明實施例的用於視頻編碼的示例性預測的流程圖,其中對於小的色度塊禁用了預測的附加假設(現有的預測被用作針對小的色度塊的最終預測)。流程圖中所示的步驟以及本公開中的其他後續流程圖可被實現為可在編碼器側和/或解碼器側的一個或多個處理器(例如,一個或多個CPU)上執行的程序代碼。流程圖中所示的步驟也可以基於硬件來實現,
例如被佈置為執行流程圖中的步驟的一個或多個電子設備或處理器。根據該方法,在步驟610中接收包括一個亮度塊和一個或多個色度塊的當前塊,其中通過使用單個分區樹將圖像區域劃分成一個或多個包括當前塊的分區塊來生成當前塊。並允許當前塊使用一個或多個包含多假設預測模式的編解碼工具。單個分區樹是用於亮度和色度的單個樹。在步驟620中確定當前塊的目標編解碼模式。在步驟630中,根據目標編解碼模式對當前塊進行編碼,其中如果目標編解碼模式對應多假設預測模式,并且所述一個或多個色度塊的寬度,高度或面積小於閾值,則針對所述一個或多個色度塊的預測的附加假設被禁用。
[0073]第7圖示出了根據本發明實施例的用於視頻解碼的示例性預測的流程圖,其中對於小的色度塊禁用了預測的附加假設(現有的預測被用作針對小的色度塊的最終預測)。根據該方法,在步驟710中接收包括當前塊的壓縮資料,其中當前塊包括一個亮度塊和一個或多個色度塊,通過使用單個分區樹將圖像區域劃分成一個或多個來生成包括當前塊的更多分區塊。包括多假設預測模式的一個或多個編碼工具被允許用於當前塊。單個分區樹是用於亮度和色度的單個樹。在步驟720中確定當前塊的目標編解碼模式。在步驟730中,根據目標編解碼模式對當前塊進行解碼,其中如果目標編解碼模式對應多假設預測模式,并且所述一個或多個色度塊的寬度,高度或面積小於閾值,則針對所述一個或多個色度塊的預測的附加假設被禁用。
所示的流程圖旨在說明根據本發明的視頻編解碼的示例。本領域技術人員可以修改每個步驟,重新佈置步驟,拆分步驟或組合步驟以實踐本發明,而不背離本發明的精神。在本公開中,已經使用特定的語法和語義來說明用於實現本發明的實施例的示例。技術人員可以通過用等效的語法和語義替換語法和語義來實踐本發明,而不脫離本發明的精神。
呈現以上描述是為了使本領域具有通常技藝者能夠實踐在特定
應用及其要求的上下文中提供的本發明。對所描述的實施例的各種修改對於本領域技術人員將是顯而易見的,並且本文中定義的一般原理可以應用於其他實施例。因此,本發明並不旨在限於所示出和描述的特定實施例,而是與與本文所公開的原理和新穎特徵相一致的最廣範圍相一致。在以上詳細描述中,示出了各種具體細節以便提供對本發明的透徹理解。然而,本領域技術人員將理解可以實施本發明。
如上所述的本發明的實施例可以以各種硬件,軟件代碼或兩者的組合來實現。例如,本發明的實施例可以是集成到視頻壓縮芯片中的一個或多個電路電路,或者是集成到視頻壓縮軟件中以執行本文所述處理的程序代碼。本發明的實施例還可以是要在數字信號處理器(DSP)上執行以執行本文描述的處理的程序代碼。本發明還可以包括由計算機處理器,數字信號處理器,微處理器或現場可編程門陣列(FPGA)執行的許多功能。這些處理器可以被配置為通過執行定義本發明所體現的特定方法的機器可讀軟件代碼或固件代碼來執行根據本發明的特定任務。可以以不同的編程語言和不同的格式或樣式來開發軟件代碼或固件代碼。也可以為不同的目標平台編譯軟件代碼。然而,不同的代碼格式,軟件代碼的樣式和語言以及配置代碼以執行根據本發明的任務的其他手段將不脫離本發明的精神和範圍。
在不脫離本發明的精神或基本特徵的情況下,本發明可以以其他特定形式實施。所描述的示例在所有方面僅應被認為是說明性的而非限制性的。因此,本發明的範圍由所附請求保護範圍而不是前述描述來指示。落在請求保護範圍的等同含義和範圍內的所有改變均應包含在其範圍之內。
610-630:步驟
Claims (18)
- 一種視頻編碼的方法,該方法包括:接收包括一個亮度塊和一個或多個色度塊的當前塊,其中,通過使用單個分區樹將圖像區域劃分成一個或多個包括當前塊的分區塊來生成當前塊,以及當前塊允許使用包括多假設預測模式的一個或多個編解碼工具的編碼工具;確定當前塊的目標編解碼模式;和根據目標編解碼模式對當前塊進行編碼,其中,如果所述目標編解碼模式與多假設預測模式相對應,並且所述一個或多個色度塊的寬度,高度或面積小於閾值,則禁用針對所述一個或多個色度塊的預測的附加假設。
- 如請求項1所述的方法,其中,所述預測的附加假設是幀內預測,並且如果所述一個或多個色度塊的寬度小於值等於4的閾值,則禁用針對所述一個或多個色度塊的幀內預測。
- 如請求項1所述的方法,其中,所述多假設預測模式對應於幀間/幀內組合預測(CIIP)模式。
- 如請求項1所述的方法,其中,所述多假設預測模式對應於三角預測模式(TPM)。
- 如請求項1所述的方法,其中,所述多假設預測模式對應於幾何合併模式(GEO)。
- 如請求項1所述的方法,其中,所述當前塊為色度格式4:4:4、4:2:2或4:2:0。
- 如請求項1所述的方法,其中,所述閾值在視頻比特流的變換單元(TU)或變換塊(TB),編碼單元(CU)或編碼塊(CB),編碼樹單元(CTU)或編碼樹塊(CTB),切片,圖塊,圖塊組,序列參數集(SPS),圖 片參數集(PPS)或圖片級別信號發送。
- 如請求項1所述的方法,其中,所述圖像區域對應於編碼樹單元(CTU)。
- 一種視頻編碼的設備,該設備包括一個或多個電子電路或處理器,用於:接收包括一個亮度塊和一個或多個色度塊的當前塊,其中,通過使用單個分區樹將圖像區域劃分為包括當前塊的一個或多個分區塊,以及所述當前塊允許使用包括多假設預測模式的一個或多個編解碼工具;確定當前塊的目標編碼模式;和根據目標編解碼模式對當前塊進行編碼,其中,如果所述一個或多個色度塊的寬度,高度或面積小於閾值並且所述目標編碼模式對應多假設預測模式,則禁用針對所述一個或多個色度塊的預測的附加假設。
- 一種視頻解碼的方法,所述方法包括:接收包括當前塊的壓縮資料,其中當前塊包括一個亮度塊和一個或多個色度塊,通過使用單個分區樹將圖像區域劃分成包括當前塊的一個或多個分區塊來生成當前塊,以及當前塊允許包括多假設預測模式的一個或多個編解碼工具;確定當前塊的目標編解碼模式;和根據目標編解碼模式對當前塊進行解碼,其中,如果目標編解碼模式與多假設預測模式相對應,並且所述一個或多個色度塊的寬度,高度或面積小於閾值,則禁用針對所述一個或多個色度塊的預測的附加假設。
- 如請求項10所述的方法,其中,所述預測的附加假設是幀內預測,並且如果所述一個或多個色度塊的寬度小於值等於4的閾值,則禁用針對所述一個或多個色度塊的幀內預測。
- 如請求項10所述的方法,其中,所述多假設預測模式對應於組合幀間/幀內預測(CIIP)模式。
- 如請求項10所述的方法,其中,所述多假設預測模式對應於三角預測模式(TPM)。
- 如請求項10所述的方法,其中,所述多假設預測模式對應於幾何合併模式(GEO)。
- 如請求項10所述的方法,其中,所述當前塊為色度格式4:4:4、4:2:2或4:2:0。
- 如請求項10所述的方法,其中所述閾值在視頻位元流的變換單元(TU)或變換塊(TB)、編碼單元(CU)或編碼塊(CB)、編碼樹單元(CTU)或編碼樹塊(CTB)、切片、圖塊、圖塊組、序列參數集(SPS)、圖片參數集(PPS)或圖片級別解析。
- 如請求項10所述的方法,其中,所述圖像區域對應於編碼樹單元(CTU)。
- 一種視頻解碼的裝置,所述裝置包括一個或多個電子電路或處理器,所述電子電路或處理器被佈置為:接收包括當前塊的壓縮資料,其中當前塊包括一個亮度塊和一個或多個色度塊,通過使用單個分區樹將圖像區域劃分成包括當前塊的一個或多個分區塊來生成當前塊,以及當前塊允許一個或多個包括多假設預測模式的編解碼工具;確定當前塊的目標編解碼模式;以及根據目標編解碼模式對當前塊進行解碼,其中,如果目標編解碼模式與多假設預測模式相對應,並且所述一個或多個色度塊的寬度、高度或面積小於閾值,則禁用針對所述一個或多個色度塊的預測的附加假設。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962907699P | 2019-09-29 | 2019-09-29 | |
US62/907,699 | 2019-09-29 | ||
WOPCT/CN2020/118961 | 2020-09-29 | ||
PCT/CN2020/118961 WO2021058033A1 (en) | 2019-09-29 | 2020-09-29 | Method and apparatus of combined inter and intra prediction with different chroma formats for video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202121901A TW202121901A (zh) | 2021-06-01 |
TWI774075B true TWI774075B (zh) | 2022-08-11 |
Family
ID=75166765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109133764A TWI774075B (zh) | 2019-09-29 | 2020-09-29 | 視頻編解碼之具有不同色度格式的多假設預測模式之方法和裝置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11831928B2 (zh) |
EP (1) | EP4029265A4 (zh) |
KR (1) | KR20220061247A (zh) |
CN (1) | CN114731427A (zh) |
MX (1) | MX2022003827A (zh) |
TW (1) | TWI774075B (zh) |
WO (1) | WO2021058033A1 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111083491B (zh) | 2018-10-22 | 2024-09-20 | 北京字节跳动网络技术有限公司 | 细化运动矢量的利用 |
WO2020098644A1 (en) | 2018-11-12 | 2020-05-22 | Beijing Bytedance Network Technology Co., Ltd. | Bandwidth control methods for inter prediction |
KR20210089149A (ko) * | 2018-11-16 | 2021-07-15 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 인터 및 인트라 통합 예측 모드 가중치 |
CN117319644A (zh) | 2018-11-20 | 2023-12-29 | 北京字节跳动网络技术有限公司 | 基于部分位置的差计算 |
WO2020177755A1 (en) | 2019-03-06 | 2020-09-10 | Beijing Bytedance Network Technology Co., Ltd. | Usage of converted uni-prediction candidate |
WO2021107532A1 (ko) * | 2019-11-26 | 2021-06-03 | 한국전자통신연구원 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
CN118285095A (zh) * | 2021-09-16 | 2024-07-02 | 抖音视界有限公司 | 视频处理方法、设备和介质 |
WO2023154359A1 (en) * | 2022-02-11 | 2023-08-17 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and devices for multi-hypothesis-based prediction |
WO2024017188A1 (en) * | 2022-07-22 | 2024-01-25 | Mediatek Inc. | Method and apparatus for blending prediction in video coding system |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013155028A1 (en) * | 2012-04-09 | 2013-10-17 | Vid Scale, Inc. | Weighted prediction parameter signaling for video coding |
US20140169475A1 (en) * | 2012-12-17 | 2014-06-19 | Qualcomm Incorporated | Motion vector prediction in video coding |
WO2019147628A1 (en) * | 2018-01-24 | 2019-08-01 | Vid Scale, Inc. | Generalized bi-prediction for video coding with reduced coding complexity |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020263493A1 (en) * | 2019-06-24 | 2020-12-30 | Alibaba Group Holding Limited | Method and system for processing luma and chroma signals |
US11206413B2 (en) * | 2019-08-13 | 2021-12-21 | Qualcomm Incorporated | Palette predictor updates for local dual trees |
US11463693B2 (en) * | 2019-08-30 | 2022-10-04 | Qualcomm Incorporated | Geometric partition mode with harmonized motion field storage and motion compensation |
US11509910B2 (en) * | 2019-09-16 | 2022-11-22 | Tencent America LLC | Video coding method and device for avoiding small chroma block intra prediction |
-
2020
- 2020-09-29 EP EP20869647.6A patent/EP4029265A4/en active Pending
- 2020-09-29 MX MX2022003827A patent/MX2022003827A/es unknown
- 2020-09-29 CN CN202080068079.5A patent/CN114731427A/zh active Pending
- 2020-09-29 KR KR1020227013214A patent/KR20220061247A/ko active Search and Examination
- 2020-09-29 WO PCT/CN2020/118961 patent/WO2021058033A1/en unknown
- 2020-09-29 US US17/764,385 patent/US11831928B2/en active Active
- 2020-09-29 TW TW109133764A patent/TWI774075B/zh active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013155028A1 (en) * | 2012-04-09 | 2013-10-17 | Vid Scale, Inc. | Weighted prediction parameter signaling for video coding |
US20140169475A1 (en) * | 2012-12-17 | 2014-06-19 | Qualcomm Incorporated | Motion vector prediction in video coding |
WO2019147628A1 (en) * | 2018-01-24 | 2019-08-01 | Vid Scale, Inc. | Generalized bi-prediction for video coding with reduced coding complexity |
Non-Patent Citations (2)
Title |
---|
網路文獻 CHIANG, man-shu et al CE10.1.1: Multi-hypothesis prediction for improving AMVP mode, skip or merge mode, and intra mode, JVET-L0100-v1 Joint Video Experts Team (JVET) oflTU-T SG I6 WP 3 and ISO/[EC JTC I/SC29/WG 11 12th Meeting: Macao, CN 12 October 2018 (2018-10-12) http://phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php?id=4181 * |
網路文獻 CHIANG, man-shu et al CE10.1.4: Simplification of combined inter and intra prediction, JVET-M0177-v1 Joint Video Experts Team (JVET)of lTU-T SG I6 WP 3 and ISO/[EC JTC I/SC29/WG II 13th Meeting: Marrakeeh, MA 18 January 2019 (2019-01-18) http://phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php?id=4984; * |
Also Published As
Publication number | Publication date |
---|---|
EP4029265A4 (en) | 2023-11-08 |
US20220360824A1 (en) | 2022-11-10 |
MX2022003827A (es) | 2023-01-26 |
US11831928B2 (en) | 2023-11-28 |
WO2021058033A1 (en) | 2021-04-01 |
CN114731427A (zh) | 2022-07-08 |
TW202121901A (zh) | 2021-06-01 |
KR20220061247A (ko) | 2022-05-12 |
EP4029265A1 (en) | 2022-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI774075B (zh) | 視頻編解碼之具有不同色度格式的多假設預測模式之方法和裝置 | |
RU2710667C1 (ru) | Способ и устройство привязки к текущему изображению для кодирования видео | |
TWI665909B (zh) | 使用解碼器側圖框內預測推導的視訊編解碼的方法及裝置 | |
CN107431815B (zh) | 处理视频信号的方法及其设备 | |
TWI692973B (zh) | 利用自適應運動向量解析度和子塊預測模式進行視訊編解碼的當前圖像參考的方法和裝置 | |
EP3202150B1 (en) | Rules for intra-picture prediction modes when wavefront parallel processing is enabled | |
RU2683165C1 (ru) | Внутреннее предсказание блочного копирования с асимметричными разделами и схемами поиска на стороне кодера, диапазоны поиска и подходы к разделению | |
CN107431806B (zh) | 用于处理视频信号的方法及其设备 | |
WO2020228578A1 (en) | Method and apparatus of luma most probable mode list derivation for video coding | |
TWI655863B (zh) | 視訊處理系統中基於預測子的分割的方法及裝置 | |
US20180035123A1 (en) | Encoding and Decoding of Inter Pictures in a Video | |
WO2020123442A1 (en) | Method and apparatus for deblocking an image | |
BR112021016270A2 (pt) | Método de codificação de vídeo e codificador, decodificador, meio legível por computador | |
BR112021013644A2 (pt) | Codificador, decodificador e métodos correspondentes de adaptação de filtro de deblocagem | |
CN116781879A (zh) | 视频编解码中的子块去块方法及装置 | |
TWI821103B (zh) | 在視訊編解碼系統中使用邊界匹配進行重疊塊運動補償的方法和裝置 | |
CN110771166B (zh) | 帧内预测装置和方法、编码、解码装置、存储介质 | |
US20220224890A1 (en) | Method and Apparatus of Partitioning Small Size Coding Units with Partition Constraints | |
EP3959874A1 (en) | Method and apparatus of chroma direct mode generation for video coding | |
TWI821108B (zh) | 用於視訊編碼系統中幾何分割模式之移動向量分配的方法和裝置 | |
TWI853402B (zh) | 視訊編解碼方法及相關裝置 | |
TW202344053A (zh) | 使用梯度和模板改進幀內模式推導和預測的方法和裝置 | |
TW202345594A (zh) | 視訊編解碼方法和裝置 | |
TW202349956A (zh) | 在視訊編解碼系統中使用解碼器導出的幀內預測的方法和裝置 | |
TW202341737A (zh) | 在視訊編解碼中使用發送預定分區的cu劃分方法和裝置 |