TW202002658A

TW202002658A - 零單元的劃分

Info

Publication number: TW202002658A
Application number: TW108122735A
Authority: TW
Inventors: 張凱; 張莉; 劉鴻彬; 莊孝強; 王悅
Original assignee: 大陸商北京字節跳動網絡技術有限公司; 美商字節跳動有限公司
Priority date: 2018-06-29
Filing date: 2019-06-28
Publication date: 2020-01-01
Also published as: WO2020003183A1; CN110662038B; CN110662038A; TWI707580B

Abstract

零單元（ZU）在視頻的編碼或解碼中被使用。視頻處理的一個示例方法包括，由於視頻數據塊具有尺寸S×T，並且S和T中的至少一個是非二的冪數，確定視頻數據塊將被編碼為ZU塊；將ZU塊劃分為兩個單元、三個單元或四個單元中的一個；以及，通過對該單元編碼而生成位元流。

Description

零單元的劃分

本專利文件一般地涉及圖像和視頻編碼技術。 [相關申請的交叉引用] 根據適用的專利法和/或依據巴黎公約的規則，本申請及時要求於2018年6月29日提交的國際專利申請第PCT/CN2018/093631號、於2018年7月2日提交的美國臨時專利申請第62/693,415號以及於2018年7月6日提交的國際專利申請第PCT/CN2018/094767號的優先權和權益。出於根據美國法律的所有目的，該國際專利申請第PCT/CN2018/093631號、美國臨時申請第62/693,415號和國際專利申請第PCT/CN2018/094767號的全部公開內容通過引用併入作為本申請的公開內容的一部分。

數位視訊佔據網際網路和其它數位通信網路上最大的頻寬使用。隨著能夠接收和顯示視頻的所連接的使用者設備的數量增加，預計數位視訊使用的頻寬需求將繼續增長。

描述了與專用編碼單元（CU）和/或編碼樹單元（CTU）相關的用於提高編碼效率的設備、系統和方法。具體地，本公開的技術公開了提供增強例如處理位於視頻數據塊的邊界處的子塊（例如，在圖片、條帶、片等中）的零單元。所描述的方法可以應用於現有的視頻編碼標準（例如，高效視頻編碼（HEVC））和未來的視頻編碼標準或視頻編解碼器兩者。

在一個代表性方面中，所公開的技術可以被用於提供視頻編碼的方法，其可以實現在視訊編碼器中。該方法包括由於視頻數據塊具有尺寸S×T、S和T的至少一個是非二的冪數，確定視頻數據塊將被編碼為零單元（ZU）塊；將ZU塊劃分為兩個單元、三個單元或四個單元中的一個；以及通過編碼單元生成位元流。

在另一示例方面，公開了另一種視頻處理的方法。該方法包括接收對應於編碼為零單元（ZU）塊的視頻數據塊的位元流，該零單元（ZU）塊被劃分為兩個單元、三個單元或四個單元，視頻數據塊具有尺寸S×T；以及通過解碼位元流生成視頻數據塊。

在另一示例方面，公開了另一種視頻處理的方法。該方法包括由於塊具有非二的冪數的高度或寬度，確定視頻數據塊將被編碼為零單元（ZU）塊；使用劃分方案來劃分視頻數據塊，其中，劃分方案將視頻數據塊劃分為兩個單元、三個單元或四個單元中的一個；通過編碼視頻數據塊生成位元流，其中，劃分方案使用與用於對作為非零單元塊的另一塊的劃分的信令通知相同的語法來發信令通知。

在另一示例方面，公開了另一種視頻處理的方法。該方法包括接收對應於視頻數據塊的位元流，視頻數據塊由於視頻數據塊具有尺寸S×T、S和T的至少一個是非二的冪數，而被編碼為零單元（ZU）塊，其中，使用將視頻數據塊劃分為兩個單元、三個單元或四個單元中的一個的劃分方案將視頻數據塊劃分，並且其中，劃分方案在位元流中使用與用於信令通知非零單元塊的劃分相同的語法來信令通知；基於信令通知，解碼位元流解碼以生成視頻數據塊。

在另一示例方面，公開了另一種視頻處理的方法。該方法包括由於視頻數據塊具有尺寸S×T、S和T的至少一個是非二的冪數，確定視頻數據塊將被編碼為零單元（ZU）塊；使用從ZU塊劃分方案的組中選擇的劃分方案將ZU塊劃分為兩個單元、三個單元或四個單元中的一個；編碼該單元；以及在位元流中信令通知被編碼的單元。這裡，ZU塊劃分方案的組是可用於分割編碼單元（CU）的劃分方案的組的子集。

在另一示例方面，公開了另一種視頻處理的方法。該方法包括接收對應於視頻數據塊的位元流，視頻數據塊具有尺寸；接收信令通知，該信令通知指示由於視頻數據塊具有尺寸S×T、S和T的至少一個是非二的冪數，視頻數據塊作為零單元（ZU）塊被劃分，使用從ZU塊劃分方案的組中選擇的劃分方案將塊劃分；以及基於信令通知，解碼對應於單元的位元流以重建視頻數據塊。這裡，ZU塊劃分方案的組是可用於分割編碼單元（CU）的劃分方案的組的子集。

在另一示例方面，公開了另一種視頻處理的方法。該方法包括由於視頻數據塊具有尺寸，尺寸的至少一個是非二的冪數，確定視頻數據塊將被編碼為零單元（ZU）塊；在確定ZU塊位於I條帶或幀內編碼圖片中時，將ZU塊劃分為兩個單元、三個單元或四個單元中的一個；編碼單元；以及在位元流中信令通知編碼的單元。

在另一示例方面，公開了另一種視頻處理的方法。該方法包括接收對應於視頻數據塊的位元流，視頻數據塊具有尺寸；接收信令通知，該信令通知指示視頻數據塊包括從零單元（ZU）塊劃分的單元，零單元（ZU）塊具有至少高度或寬度為非二的冪數，並且在無變換和殘差編碼的情況下被編碼，劃分的ZU塊位於I條帶或幀內編碼圖片中；以及基於信令通知，解碼對應於單元的位元流以重建視頻數據塊。

在另一代表性方面中，上述方法以處理器可執行代碼的形式體現並且儲存在電腦可讀程式介質中。

在另一代表性方面中，公開了一種配置為或可操作為進行上述方法的設備。該設備可以包括處理器，該處理器被程式設計以實現該方法。

在另一代表性方面中，視頻解碼器裝置可實現如本文所述的方法。

在附圖、說明書和權利要求中更詳細地描述了本公開的技術的上述和其它方面和特徵。

由於對更高解析度視頻的需求日益增加，視頻編碼方法和技術在現代技術中無處不在。視頻轉碼器通常包括壓縮或解壓縮數位視訊的電子電路或軟體，並且視頻轉碼器被不斷改進以提供更高的編碼效率。視頻轉碼器將未壓縮視訊轉換為壓縮格式，或反之亦然。視頻品質、用於表示視頻的資料量（由位元速率確定）、編碼和解碼演算法的複雜性、對資料丟失和錯誤的敏感性、編輯便利性、隨機訪問以及端到端延遲（遲延）之間存在複雜的關係。壓縮格式通常符合標準視訊壓縮規範，例如高效視頻編碼（HEVC）標準（也稱為H.265或MPEG-H第2部分）、即將最終確定的通用視頻編碼標準，或其它當前和/或未來的視頻編碼標準。

所公開的技術的實施例可以應用於現有的視頻編碼標準（例如，HEVC，H.265）和未來的標準以改善壓縮性能。在本文件中使用章節標題來提高描述的可讀性而不是以任何方式將討論或實施例（和/或實現方式）僅限於各個章節。

在本文件中使用章節標題以便於理解，並且不將章節中公開的實施例僅限於該章節。此外，雖然參考通用視頻編碼或其它特定視頻轉碼器描述了某些實施例，但是所公開的技術還可應用於其它視頻編碼技術。此外，雖然一些實施例詳細描述了視頻編碼步驟，但是應當理解的是，撤銷編碼的相應解碼步驟將由解碼器實現。此外，術語視頻處理包括視頻編碼或壓縮、視頻解碼或解壓縮以及視頻轉碼，其中視頻像素從一種壓縮格式表示為另一壓縮格式或以不同的壓縮位元速率表示。

1. 視頻編碼的示例實施例

圖1示出了典型HEVC視訊編碼器和解碼器的示例性框圖。產生符合HEVC的位元流的編碼演算法通常如下進行。每個圖片被分割為塊狀區域，其中精確的塊劃分被傳送到解碼器。視頻序列的第一圖片（以及在對視頻序列的每個乾淨隨機訪問點處的第一圖片）僅使用幀內預測（在同一圖片內使用區域到區域的空間上的資料的一些預測，而不基於其它圖片）進行編碼。對於序列的所有剩餘圖片或隨機訪問點之間的圖片，對於大多數塊通常使用幀間時間預測編碼模式。幀間預測的編碼過程包括選擇包含選定的參考圖片和運動向量（MV）的運動資料，該參考圖片和運動向量（MV）將被應用於預測每個塊的樣本。編碼器和解碼器通過應用運動補償（MC）來生成相同的幀間預測信號，該運動補償（MC）使用作為輔助信息發送的MV和模式決定資料。

通過線性空間變換對幀內預測或幀間預測的殘差信號進行變換，其中該殘差信號是原始塊與其預測之間的差異。然後對變換係數進行縮放、量化、熵編碼並與預測信息一起發送。

編碼器複製解碼器處理環路（見圖1中的灰色陰影框），使得兩者都將為後續資料生成相同的預測。因此，量化的變換係數通過逆縮放構造，並且然後進行逆變換以複製殘差信號的解碼的近似值。然後將殘差加入到預測中，並且然後可以將該加法的結果輸入一個或兩個環路濾波器，以平滑由逐塊處理和量化引起的偽影（artifact）。最終的圖片表示（即解碼器輸出的複製）儲存在解碼的圖片緩衝器中以用於後續圖片的預測。通常，圖片的編碼或解碼處理的順序常常不同於它們從來源到達的順序，需要區分解碼器的解碼順序（即位元流順序）和輸出順序（即顯示順序）。

通常期望將由HEVC編碼的視頻材料作為逐行掃描圖像輸入（由於源視頻源自該格式或者由於由編碼之前的去隔行（deinterlacing）產生）。在HEVC設計中不存在顯式編碼特徵以支援隔行掃描的使用，因為隔行掃描不再用於顯示器，並且在分佈時變得非常不常見。但是，已經在HEVC中提供了中繼資料語法以允許編碼器指示，隔行掃描的視頻已經通過將隔行掃描視頻的每個場（即每個視頻幀的偶數或奇數行）編碼為單獨的圖片而被發送，或者隔行掃描的視頻已經通過將每個隔行掃描的幀編碼為HEVC編碼的圖片而被發送。這提供了一種有效的編碼隔行掃描的視頻的方法，而無需加重解碼器需支援隔行掃描的視頻的特殊的解碼過程的負擔。

1.1. H.264/AVC中的劃分樹結構的示例

先前標準中的編碼層的核心是巨集塊，包含16×16的亮度（luma）樣本塊、以及在4：2：0顏色採樣的通常情況下的兩個對應的8×8的色度（chroma）樣本塊。

幀內編碼塊使用空間預測來利用像素之間的空間相關性。兩種劃分被定義為：16x16和4x4。

幀間編碼塊通過估計圖片之間的運動來使用時間預測而不是空間預測。可以對於16x16巨集區塊或其任何子巨集區塊劃分16x8、8x16、8x8、8x4、4x8、4x4來獨立地估計運動，如圖2所示。每子巨集區塊劃分僅允許一個運動向量（MV）。

1.2. HEVC中的劃分樹結構的示例

在HEVC中，通過使用表示為編碼樹的四叉樹結構將編碼樹單元（CTU）劃分成編碼單元（CU），以適應各種局部特性。使用幀間（時間）預測還是幀內（空間）預測來對圖片區域進行編碼的決定是在CU級做出的。根據預測單元（PU）劃分類型，每個CU可以進一步劃分成一個、兩個或四個PU。在一個PU內部，應用相同的預測過程，並且在PU的基礎上將相關信息發送到解碼器。在通過基於PU劃分類型應用預測過程而獲得了殘差塊之後，可以根據類似於CU的編碼樹的另一個四叉樹結構將CU劃分為變換單元（TU）。HEVC結構的關鍵特徵之一是它具有多個劃分概念，包括CU、PU和TU。

對使用HEVC的混合視頻編碼中涉及的某些特徵包括：

（1）編碼樹單元（CTU）和編碼樹塊（CTB）結構：HEVC中的類似結構是編碼樹單元（CTU），其具有由編碼器選擇的尺寸並且可以大於傳統巨集區塊。CTU由亮度CTB和相應的色度CTB以及語法元素組成。亮度CTB的尺寸L×L可以被選擇為L=16、32或64個樣本，較大的尺寸通常能夠實現更好的壓縮。然後，HEVC支援使用樹結構和類似四叉樹的信令來將CTB劃分為更小的塊。

（2）編碼單元（CU）和編碼塊（CB）：CTU的四叉樹語法指定其亮度CB和色度CB的尺寸和位置。四叉樹的根與CTU相關聯。因此，亮度CTB的尺寸是亮度CB的最大支持尺寸。將CTU劃分成亮度CB和色度CB是信令聯合的。一個亮度CB和通常兩個色度CB以及相關聯的語法一起形成編碼單元（CU）。CTB可以僅包含一個CU或者可以被劃分以形成多個CU，並且每個CU具有相關聯的、向預測單元（PU）以及變換單元（TU）的樹的劃分。

（3）預測單元和預測塊（PB）：使用幀間圖片預測還是幀內圖片預測來對圖片區域編碼的決策是在CU級進行的。PU劃分結構的根在CU級。取決於基本預測類型決策，然後可以在尺寸上進一步劃分亮度CB和色度CB，並根據亮度和色度預測塊（PB）對其進行預測。HEVC支援從64×64到4×4樣本的可變PB尺寸。圖3示出了對於M×M CU所允許的PB的示例。

（4）變換單元（TU）和變換塊：使用塊變換對預測殘差進行編碼。TU樹結構的根在CU級。亮度CB殘差可以與亮度變換塊（TB）相同，或者可以被進一步劃分成更小的亮度TB。這同樣適用於色度TB。對於正方形TB尺寸4×4、8×8、16×16和32×32，定義類似於離散余弦變換（DCT）的整數基函數。對於亮度幀內圖片預測殘差的4×4變換，可以替代地指定從離散正弦變換（DST）的形式導出的整數變換。

1.2.1. 樹結構的劃分到TB和TU的示例

對於殘差編碼，可以將CB遞迴地劃分為變換塊（TB）。由殘差四叉樹信令通知劃分。僅指定正方形CB和TB劃分，其中塊可以被遞迴地劃分到象限（quadrant），如圖4所示。對於尺寸為M×M的給定亮度CB，標誌（flag）表明是否將該CB劃分成四個尺寸為M/2×M/2的塊。如果如SPS中指示的殘差四叉樹的最大深度所信令通知的，每個象限能夠進一步劃分，則為每個象限分配標誌，該標誌指示是否將其劃分成四個象限。由殘差四叉樹產生的葉節點塊是變換塊，通過變換編碼對其進一步處理。編碼器指示它將使用的最大和最小亮度TB尺寸。當CB尺寸大於最大TB尺寸時，劃分是隱含的。當劃分將導致亮度TB尺寸小於所指示的最小值時，不劃分是隱含的。除了當亮度TB尺寸為4×4時，色度TB尺寸在每個維度上是亮度TB尺寸的一半，在亮度TB尺寸為4×4的情況下，單個4×4色度TB被用於由四個4×4亮度TB覆蓋的區域。在幀內圖片預測的CU的情況下，最近鄰的TB（在CB內或在CB外）的解碼後樣本被用作用於幀內圖片預測的參考資料。

與先前的標準相反，HEVC設計允許TB跨越多個PB以用於幀間預測的CU，以使四叉樹結構的TB劃分的潛在編碼效率益處最大化。

1.2.2. 圖片邊界編碼的示例

圖片的邊界以最小允許的亮度CB大小為單位定義。因此，在圖片的右邊界和底邊界，一些CTU可能會覆蓋部分位於圖片邊界之外的區域。該條件被解碼器檢測到，並且CTU四叉樹根據需要被隱式地分割，以將CB大小減小到整個CB將適合到圖片中的程度。

圖5示出了一個幀的劃分結構的示例，其中解析度為416×240像素，尺寸為7 CTB×4 CTB，其中CTB的大小為64×64。如圖5所示，部分位於右邊界和底邊界之外的CTB具有隱含的分割（虛線，表示為502），並且完全落在外面的CU就被跳過（不被編碼）。

在圖5所示的示例中，突出顯示的CTB（504），其行CTB索引等於2且列CTB索引等於3，在當前圖片內具有64×48像素，並且不適合64×64 CTB。因此，它被強制分割為32×32而沒有分割標誌信號。對於左上角的32×32，它被幀完全覆蓋。當它選擇根據速率-失真成本以較小的塊編碼時（對於左上角的16×16用8×8，並且其餘的以16×16編碼），需要編碼幾個分割標誌。這些分割標誌（用於是否將左上角的32×32分割為四個16×16塊的一個標誌，以及用於信令通知一個16×16是否被進一步分割，以及對於在左上角的16×16中的四個8×8塊中的每一個是否進一步分割8×8的標誌）必須被明確地信令通知。右上角的32×32塊存在類似情況。對於兩個底部32×32塊，因為它們部分位於圖片邊界（506）的外部，需要應用進一步的QT分割而不用信令通知。圖6A和6B分別示出了圖5中突出顯示的CTB（504）的細分和信令方法。

1.2.3. CTB大小指示的示例

表1中示出了用於一般序列參數集的示例RBSP（原始字節序列有效載荷）語法表。

表1：RBSP 語法結構

相應的語義包括：

log2_min_luma_coding_block_size_minus3 加3指定最小亮度編碼塊大小；以及

log2_diff_max_min_luma_coding_block_siz e指定最大亮度編碼塊大小和最小亮度編碼塊大小之間的差異。

變數：MinCbLog2SizeY，CtbLog2SizeY，MinCbSizeY，CtbSizeY，PicWidthInMinCbsY，PicWidthInCtbsY，PicHeightInMinCbsY，PicHeightInCtbsY，PicSizeInMinCbsY，PicSizeInCtbsY，PicSizeInSamplesY，PicWidthInSamplesC和PicHeightInSamplesC 通過以下得到：

MinCbLog2SizeY=log2_min_luma_coding_block_size_minus3+3

CtbLog2SizeY=MinCbLog2SizeY+log2_diff_max_min_luma_coding_block_size

MinCbSizeY=1>>MinCbLog2SizeY

CtbSizeY=1>>CtbLog2SizeY

PicWidthInMinCbsY=pic_width_in_luma_samples/MinCbSizeY

PicWidthInCtbsY=Ceil（pic_width_in_luma_samples÷CtbSizeY）

PicHeightInMinCbsY=pic_height_in_luma_samples/MinCbSizeY

PicHeightInCtbsY=Ceil（pic_height_in_luma_samples÷CtbSizeY）

PicSizeInMinCbsY=PicWidthInMinCbsY*PicHeightInMinCbsY

PicSizeInCtbsY=PicWidthInCtbsY*PicHeightInCtbsY

PicSizeInSamplesY=pic_width_in_luma_samples*pic_height_in_luma_samples

PicWidthInSamplesC=pic_width_in_luma_samples/SubWidthC

PicHeightInSamplesC=pic_height_in_luma_samples/SubHeightC

變數CtbWidthC和CtbHeightC，其分別指定每個色度CTB陣列的寬度和高度，通過以下得到：

如果chroma_format_idc等於0（單色）或者separate_colour_plane_flag等於1，則CtbWidthC和CtbHeightC都等於0；

否則，CtbWidthC和CtbHeightC通過以下得到：

CtbWidthC=CtbSizeY/SubWidthC

CtbHeightC=CtbSizeY/SubHeightC

1.3. 在JEM中具有較大CTU的四叉樹加二叉樹塊結構的示例

在一些實施例中，使用被稱為聯合探索模型（JEM）的參考軟體探索未來的視頻編碼技術。除二叉樹結構外，JEM還描述了四叉樹加二叉樹（QTBT）和三叉樹（TT）結構。

1.3.1. QTBT塊劃分結構的示例

與HEVC相比，QTBT結構消除了多種劃分類型的概念，即它消除了CU、PU和TU概念的區別，並為CU劃分形狀提供了更大的靈活性。在QTBT塊結構中，CU可以具有正方形或矩形形狀。如圖7A所示，首先用四叉樹結構劃分編碼樹單元（CTU）。四叉樹葉節點進一步由二叉樹結構劃分。在二叉樹分割中有兩種分割類型，對稱水平分割和對稱垂直分割。二叉樹葉節點被稱為編碼單元（CU），並且該分段用於預測和變換處理而無需任何進一步劃分。這意味著CU、PU和TU在QTBT編碼塊結構中具有相同的塊大小。在JEM中，CU有時由不同顏色分量的編碼塊（CB）組成——例如，一個CU在4：2：0色度格式的P和B條帶的情況下包含一個亮度CB和兩個色度CB；並且有時由單個分量的CB組成——例如，一個CU在I條帶的情況下僅包含一個亮度CB或僅兩個的色度CB。

為QTBT劃分方案定義了以下參數：

- CTU大小：四叉樹的根節點大小，與HEVC中的概念相同

- MinQTSize：最小允許的四叉樹葉節點大小

- MaxBTSize：最大允許的二叉樹根節點大小

- MaxBTDepth：最大允許的二叉樹深度

- MinBTSize：最小允許的二叉樹葉節點大小

在QTBT劃分結構的一個示例中，CTU大小設置為128×128個亮度樣本，以及兩個相應的64×64色度樣本塊，MinQTSize設置為16×16，MaxBTSize設置為64×64， MinBTSize（對於寬度和高度兩者）設置為4×4，並且MaxBTDepth設置為4。四叉樹劃分首先應用於CTU以生成四叉樹葉節點。四叉樹葉節點可以具有從16×16（即，MinQTSize）到128×128（即，CTU大小）的大小。如果四叉樹葉節點為128×128，則它將不會被二叉樹進一步分割，因為大小超過了MaxBTSize（即64×64）。否則，四叉樹葉節點可以被二叉樹進一步分割。因此，四叉樹葉節點也是二叉樹的根節點，並且其具有二叉樹深度為0。當二叉樹深度達到MaxBTDepth（即4）時，不考慮進一步的分割。當二叉樹節點的寬度等於MinBTSize（即4）時，不考慮進一步的水平分割。類似地，當二叉樹節點的高度等於MinBTSize時，不考慮進一步的垂直分割。通過預測和變換處理進一步處理二叉樹的葉節點，而無需任何進一步的劃分。在JEM中，最大CTU大小為256×256亮度樣本。

圖7A示出了通過使用QTBT進行塊劃分的示例。圖7B示出了相應的樹表示。實線指示四叉樹分割，並且虛線指示二叉樹分割。在二叉樹的每個分割（即，非葉）節點中，用信號通知一個標誌以指示使用哪種分割類型（即，水平或垂直），其中0指示水平分割，並且1指示垂直分割。對於四叉樹分割，不需要指示分割類型，因為四叉樹分割總是同時水平和垂直地分割塊以產生具有相同大小的4個子塊。

此外，QTBT方案支援亮度和色度具有單獨的QTBT結構的能力。目前，對於P和B條帶，一個CTU中的亮度和色度CTB共用相同的QTBT結構。然而，對於I條帶，亮度CTB通過QTBT結構劃分為CU，並且色度CTB通過另一QTBT結構劃分為色度CU。這意味著I條帶中的CU由亮度分量的編碼塊或兩個色度分量的編碼塊組成，並且P或B條帶中的CU由所有三個顏色分量的編碼塊組成。

在HEVC中，限制小塊的幀間預測以減少運動補償的記憶體訪問，使得對於4×8和8×4塊不支持雙向預測，並且對於4×4塊不支持幀間預測。在JEM的QTBT中，這些限制被移除。

1.4. 用於多功能視頻編碼（VVC）的三叉樹（TT）

圖8A示出了四叉樹（QT）劃分的示例，並且圖8B和8C分別示出了垂直和水平二叉樹（BT）劃分的示例。在一些實施例中，除了四叉樹和二叉樹之外，還支持三叉樹（TT）劃分，例如水平和垂直中心側三叉樹（如圖8D和8E所示）。

在一些實現方式中，支援兩個級別的樹：區域樹（四叉樹）和預測樹（二叉樹或三叉樹）。首先通過區域樹（RT）對CTU進行劃分。RT葉可以進一步用預測樹（PT）分割。還可以用PT進一步分割PT葉，直到達到最大PT深度。PT葉是基本的編碼單元。為方便起見，它仍被稱為CU。CU無法進一步分割。預測和變換都以與JEM相同的方式應用於CU。整個劃分結構稱為“多類型樹”。

1.5. 替代視頻編碼技術中的劃分結構的示例

在一些實施例中，支持稱為多樹類型（MTT）的樹結構（其是QTBT的一般化）。在QTBT中，如圖9所示，首先用四叉樹結構劃分編碼樹單元（CTU）。四叉樹葉節點進一步由二叉樹結構劃分。

MTT的結構由兩種類型的樹節點構成：區域樹（RT）和預測樹（PT），支援九種類型的劃分，如圖10A至10I所示。區域樹可以遞迴地將CTU分割成方形塊，直到分成4×4大小的區域的葉節點。在區域樹中的每個節點處，可以從三種樹類型中的一個形成預測樹：二叉樹、三叉樹和非對稱二叉樹。在PT分割中，禁止在預測樹的分支中具有四叉樹劃分。與在JEM中一樣，亮度樹和色度樹在I條帶中分開。

通常，除了上下文推導之外，RT信令與JEM中的QT信令相同。對於PT信令，需要多達4個額外的二進位位元（bin），如圖11所示。第一個二進位位元指示PT是否被進一步分割。該二進位位元的上下文基於對進一步分割的可能性與當前塊與其相鄰塊的相對大小高度相關的觀察來計算。如果進一步分割PT，則第二個二進位位元指示其是水平劃分還是垂直劃分。在一些實施例中，中心側三叉樹和非對稱二叉樹（ABT）的存在增加了“高”塊或“寬”塊的出現。第三個二進位位元表示劃分的樹的類型，即它是二叉樹/三叉樹還是非對稱二叉樹。在二叉樹/三叉樹的情況下，第四個二進位位元表示樹的類型。在非對稱二叉樹的情況下，第四個二進位位元指示對於水平劃分樹的向上或向下類型，對於垂直劃分樹的向右或向左類型。

1.5.1. 圖片邊界處的限制的示例

在一些實施例中，如果CTB/LCU大小由M×N指示（通常M等於N，如HEVC/JEM中所定義），並且對於位於圖片（或片或條帶或其它類型）邊界的CTB，K × L個樣本處於圖片邊界內。

在圖片底邊界和右邊界上的CU分割規則可以應用於任何編碼樹配置QTBT + TT、QTBT + ABT或QTBT + TT + ABT。它們包括以下兩個方面：

（1）如果給定編碼樹節點（CU）的一部分部分地位於圖片外部，則總是允許沿著相關邊界方向（沿著底邊界的水平分割定向，如圖12A所示，沿右邊界的垂直分割定向，如圖12B所示）的CU的二元對稱分割。如果當前CU的右下角在幀外（如圖12C所示），則只允許CU的四叉樹分割。另外，如果當前二叉樹深度大於最大二叉樹深度並且當前CU在幀邊界上，則啟用二元分割以確保到達幀邊界。

（2）關於三叉樹分割過程，在產生的子CU之間的第一邊界或第二邊界恰好位於圖片的邊界上的情況下，允許三叉樹分割。如果分割線（由分割產生的兩個子CU之間的邊界）與圖片邊界完全匹配，則允許不對稱二叉樹分割。

2. 現有實現方式的示例

現有實現方式，CTU或CU的寬度或高度可能不等於2^N ，其中N是正整數。這些情況很難處理。具體來說，如果行數或列數不是2^N 的形式，則可能難以設計具有不包括除法的整數運算的變換。

在一個示例中，為了避免CTU或CU具有不等於2^N 的寬度或高度，CTU或CU被強制分割為更小，直到寬度和高度兩者都是2^N 的形式或通過填充或使用變換跳過。如果以更靈活的方式處理這些塊，則可以進一步改善編碼增益。

在另一個示例中，對於寬度或高度不是2^N 形式的CU定義變換。這種變換在實際的視頻編碼應用中是不期望的。

3. 使用基於本公開的技術的零單元的示例方法

本公開的技術的實施例克服了現有實施方式的缺點，從而為視頻編碼提供了更高的效率。具體地，提出零單元塊作為特殊的CU/CTU，並且塊在當且僅當其高度和/或寬度不是2^N 的形式時被解釋為零單元。

在以下針對各種實現方式所描述的示例中闡明了使用零單元來提高視頻編碼效率並增強現有和未來的視頻編碼標準。下面提供的本公開的技術的示例解釋了一般概念，並不意欲被解釋為限制。在示例中，除非明確地相反指示，否則可以組合這些示例中描述的各種特徵。在另一示例中，這些示例中描述的各種特徵可以應用於使用向後相容的塊大小的圖片邊界編碼和使用劃分樹進行可視媒體編碼的方法。圖13示出了圖片邊界處的零單元（具有像素或樣本的尺寸）的示例。

示例A. 零單元可以進一步分割為兩個單元（BT或ABT）、三個單元（TT、FTT）或四個單元（QT、EQT）。從零單元分割的分割單元可以是零單元，或者它可以是正常CU，其具有2^N 的形式的寬度或高度。假設零單位Z的大小為S×T。

（a）在一個示例中，Z可以用BT分割為兩個單元，二者具有大小為 S/2×T。

（b）在一個示例中，Z可以用BT分割為兩個單元，二者具有大小為 S×T/2。

（c）在一個示例中，假設2^N >S≤2^N+1 ，Z可以用BT分割為兩個單元，其具有大小為2^N ×T和（S-2^N ）×T，或（S-2^N ）×T和2^N ×T。

（d）在一個示例中，假設2^N >T≤2^N+1 ，Z可以用BT分割為兩個單元，其具有大小為S×2^N 和S×（T-2^N ），或S×（T-2^N ）和S×2^N 。

（e）在一個示例中，Z可以用TT分割為三個單元，其具有大小為S/4×T、S/2×T和S/4×T。

（f）在一個示例中，Z可以用TT分割為三個單元，其具有大小為S×T/4、S×T/2和S×T/4。

（g）在一個示例中，假設2^N >S>2^N +1，Z可以用TT分割為三個單元，其具有大小為2^N-1 ×T、2^N-1 ×T和（S-2^N ）×T，或2^N-1 ×T、（S-2^N ）×T和2^N-1 ×T，或（S-2^N ）×T、2^N ^‑ ¹ ×T和2^N-1 ×T。

（h）在一個示例中，假設2^N >T≤2^N+1 ，Z可以用TT分割為三個單元，其具有大小為S×2^N-1 、S×2^N-1 和S×（T-2^N ），或S×2^N-1 、S×（T-2^N ）和S×2^N-1 ，或S×（T-2^N ）、S×2^N ^‑ ¹ 和S×2^N-1 。

（i）在一個示例中，Z可以用QT分割為四個單元，均具有大小為 S/2×T/2。

（j）在一個示例中，假設2^N >S≤2^N+1 ，Z可以用QT分割為四個單元，具有大小為2^N ×T/2、2^N ×T/2、（S-2^N ）×T/2和（S-2^N ）×T/2，或（S-2^N ）×T/2、（S-2^N ）×T/2、2^N ×T/2和2^N ×T/2。

（k）在一個示例中，假設2^N >T≤2^N+1 ，Z可以用QT分割為四個單元，具有大小為 S/2×2^N 、S/2×2^N 、S/2×（T-2^N ）和S/2×（T-2^N ），或S/2×（T-2^N ）、S/2×（T-2^N ）、S/2×2^N 和S/2×2^N 。

（l）在一個示例中，假設2^N >S≤2^N+1 和2^M >T≤2^M+1 ，Z可以用QT分割為四個單元，具有大小為2^N ×2^M 、2^N ×2^M 、（S-2^N ）×（T-2^M ）和（S-2^N ）×（T-2^M ），或（S-2^N ）×（T-2^M ）、（S-2^N ）×（T-2M）、2^N ×2^M 和2^N ×2^M ，或2^N ×（T-2^M ）、2^N ×（T-2^M ）、（S-2^N ）× 2M和（S-2^N ）×2^M ，或（S-2^N ）×2^M 、（S-2^N ）×2^M 、2^N ×（T-2^M ）和2^N ×（T-2^M ）。

（m）在一個示例中，所有分割單元的寬度/高度應為偶數。如果一個劃分結構導致單元的寬度或高度為奇數，則自動禁止這樣的劃分結構。

或者，此外，跳過這種劃分結構的信令。

（n）在一個示例中，Z 可以用TT分割為三個單元。

在一個示例中，假設3*2^N >S>=3*2^N+1 ，三個單元的大小分別為2^N ×T、2^N+1 ×T和（S-3*2^N ）×T。

在一個示例中，假設3*2^N >T>=3*2^N +1，三個單元的大小分別為Sx2^N 、Sx2^N+1 和S×（T-3*2^N ）。

（o）在一個示例中，所有分割單元的寬度和/或高度應為K * M的形式，其中M是允許的編碼單元/預測單元的最小寬度和/或高度，諸如4；K是大於0的整數。如果一個劃分結構導致單元的寬度或高度不是這樣的形式，則自動禁止該劃分結構。

例如，假設劃分結構中分割單元的寬度和高度為W和H，如果W >M或H >M或（W＆（M-1）！= 0）或（H＆（M-1）！ = 0），則禁止該劃分結構。

或者，此外，跳過這種劃分結構的信令。

或者，所有分割的非ZU的寬度和/或高度應為K*M的形式，其中M是允許的編碼單元/預測單元的最小寬度和/或高度，諸如4。在這種情況下，如果分割的零單元不遵循此限制但非ZU遵循此限制，則仍允許劃分結構。

示例B. ZU的分割信令方法與正常CU的分割信令方法相同。

a. 在一個示例中，可以使用不同的上下文來編碼ZU或非ZU。

b. 或者，對於ZU，僅允許正常CU的部分分割方法。

i. 對ZU所允許的正常CU的分割方法的子集由ZU大小和/或圖片/條帶/片邊界位置（底部、右部、右下部等）和/或條帶類型確定。

ii. 在一個示例中，對於ZU只允許QT和BT劃分結構。

iii. 或者，此外，在ZU分割信息中不發信號通知是否使用TT以及如何使用TT（以及除QT / BT之外的其它種類的劃分結構）。

iv. 或者，此外，ZU的分割信令方法仍然與正常CU的分割信令方法保持相同，然而，TT（或其它類型的劃分結構）的指示的上下文可以進一步取決於當前塊是否是ZU。

示例C. 在一個實施例中，ZU必須在I條帶或幀內編碼圖像中分割。

在一個示例中，ZU的寬度或高度不是2N的形式。

在一個示例中，則當以下條件成立時，CU被視為ZU，

i）W> = T0且H> = T1。T0和/或T1是諸如128或256的整數。

ii）W> = T0或H> = T1。T0和/或T1是諸如128或256的整數。

iii）W×H> = T。T是諸如16384或65536的整數。

上述示例可以結合在下面描述的方法的上下文中——例如，方法1400和1500，其可以在視頻解碼器和/或視訊轉碼器處實現。

圖14示出了用於視頻編碼的示例性方法的流程圖，其可以在視訊轉碼器中實現。方法1400包括，在步驟1410處，確定視頻數據塊的尺寸。

方法1400包括，在步驟1420處，在確定至少一個尺寸是非二的冪時，將視頻數據塊作為零單元（ZU）塊來信令通知，其是不可變換的。

在一些實施例中，非二的冪是不能以2N的形式表示的任何非零數字。例如，不包括二的冪的整數（例如，1，3，5，6，7，9，10，11，12，13，14，15，17，18，...）的每個都是非二的冪。

在一些實施例中，可以在示例2的上下文中定義不可變換，使得不對零單元調用變換、逆變換、量化和去量化操作。例如，零單元的不可變換屬性是其被推斷為用跳過模式進行編碼，並且因此，不需要明確地用信令通知跳過模式。在其它實施例中，可以在示例3的上下文中定義不可變換，使得儘管可能存在非零殘差，但對於零單元沒有定義變換和逆變換操作。

圖15示出了用於視頻編碼的另一示例性方法的流程圖，該方法可以在視頻解碼器中實現。該流程圖包括與圖14中所示並且在上面描述的類似的一些特徵和/或步驟。本章節中可能未單獨描述這些特徵和/或步驟中的至少一些。

方法1500包括，在步驟1510處，接收對應於視頻數據塊的位元流。

方法1500包括，在步驟1520處，接收信令，其指示視頻數據塊是零單元（ZU）塊，該零單元（ZU）塊是不可變換的，並且具有非二的冪的至少一個尺寸。

方法1500包括，在步驟1530處，基於信令解碼位元流以重建視頻數據塊。

在一些實施例中，方法1400和方法1500，以及如在示例1的上下文中所描述的，可以進一步包括視頻數據塊的尺寸是偶數，具有2N形式，或者具有2KN的形式，其中K = 1，2，3，4…。在其它實施例中，信令可以不包括合併索引或跳過標記、和/或不包括prediction_mode_flag、和/或包括ZU塊的至少一個尺寸的最大值或最小值。在示例中，信令在視頻參數集（VPS）、序列參數集（SPS）、圖片參數集（PPS）、條帶標頭、編碼樹單元（CTU）或編碼單元（CU）中。

在一些實施例中，ZU塊的運動信息從大小為2N×2M的相鄰塊的運動信息繼承。

在一個實施例中，並且如在示例7的上下文中所描述的，ZU塊被分割為兩個或更多個單元。在示例中，兩個或更多個單元中的至少一個是零單元。在另一個示例中，在兩個或更多個單元中的至少一個是尺寸為2N×2M的編碼單元（CU）。

4. 所公開的技術的示例實現方式

圖16是示出可以用於實現本公開的技術的各個部分的電腦系統或其它控制設備1600的架構的示例的框圖，本公開的技術包括（但不限於）方法1400和方法1500。在圖16中，電腦系統1600包括經由互連1625連接的一個或多個處理器1605和記憶體1610。互連1625可以代表通過適當的橋接器、適配器連接的任何一個或多個單獨的物理匯流排、點對點連接或兩者。因此，互連1625可以包括例如，系統匯流排、周邊元件連接（PCI）匯流排、雙向傳輸匯流排（HyperTransport）或工業標準架構（ISA）匯流排、小型電腦系統介面（SCSI）匯流排、通用序列匯流排（USB）、IIC（I2C）匯流排或電氣和電子工程師協會（IEEE）標準674匯流排，有時也稱為「Firewire」。

（一個或多個）處理器1605可以包括中央處理單元（CPU）以控制例如主機電腦的整體操作。在某些實施例中，（一個或多個）處理器1605通過執行記憶體1610中儲存的軟體或韌體來實現這一點。（一個或多個）處理器1605可以是或可以包括一個或多個可程式設計通用或專用微處理器、數位訊號處理器（DSP）、可程式設計控制器、專用積體電路（ASIC）、可程式設計邏輯器件（PLD）等，或這些器件的組合。

記憶體1610可以是或可以包括電腦系統的主記憶體。記憶體1610表示任何合適形式的隨機存取記憶體（RAM）、唯讀記憶體（ROM）、快閃記憶體等，或其組合。在使用中，記憶體1610可以包含機器指令集，當由處理器1605執行該機器指令集時，使得處理器1605進行操作以實現本公開技術的實施例。

通過互連1625也連接到（一個或多個）處理器1605的是（可選的）網路介面控制器1615。網路介面控制器1615向電腦系統1600提供與遠端設備通信的能力，遠端設備例如儲存器用戶端和/或其它儲存器伺服器，並且網路介面控制器1615可以是例如乙太網介面控制器或光纖通道介面控制器。

圖17示出了可用於實現本公開技術的各個部分的移動設備1700的示例實施例的框圖，包括（但不限於）方法1400和方法1500。移動設備1700可以是膝上型電腦、智慧型電話、平板電腦、可擕式攝像機或能夠處理視頻的其它類型的設備。移動設備1700包括用於處理資料的處理器或控制器1701，以及與處理器1701通信以儲存和/或緩衝資料的記憶體1702。例如，處理器1701可以包括中央處理單元（CPU）或微控制器單元（MCU）。在一些實現方式中，處理器1701可以包括現場可程式設計閘陣列（FPGA）。在一些實現方式中，移動設備1700包括用於智慧型電話設備的各種可視和/或通信資料處理功能的圖形處理單元（GPU）、視頻處理單元（VPU）和/或無線通訊單元或與之通信。例如，記憶體1702可以包括並儲存處理器可執行代碼，其在由處理器1701執行時配置移動設備1700以執行各種操作，例如接收信息、命令和/或資料，處理信息和資料，並且將處理後的信息/資料發送或提供給諸如致動器或外部顯示器的另一個設備。

為了支援移動設備1700的各種功能，記憶體1702可以儲存信息和資料，諸如指令、軟體、值、圖像以及由處理器1701處理或參考的其它資料。例如，各種類型的隨機存取記憶體（RAM）設備、唯讀記憶體（ROM）設備、快閃記憶體設備和其它合適的儲存介質可已被用於實現記憶體1702的儲存功能。在一些實現方式中，移動設備1700包括輸入/輸出（I/O）介面1703，以將處理器1701和/或記憶體1702與其它模組、單元或設備介面。例如，I/O介面1703可以利用與典型資料通信標準（例如，在雲中的一個或多個電腦與使用者設備之間的）相容的各種類型的無線介面，以將處理器1701與記憶體1702介面。在一些實現方式中，移動設備1700可以經由I/O介面1703使用有線連接與其它設備介面。移動設備1700還可以與其它外部介面（例如資料記憶體）和/或視覺或音訊顯示器1704介面，以取回和傳送資料和信息，該資料和信息可由處理器處理、儲存在記憶體中或在顯示器1704或外部設備的輸出單元上展示。例如，顯示器1704可以顯示包括塊（CU、PU或TU）的視頻幀，該塊基於是否使用運動補償演算法並根據所公開的技術對塊進行編碼來應用塊內複製。

在一些實施例中，視頻解碼器設備可以實現使用如本文中所描述的零單元的方法以用於視頻解碼。該方法的各種特徵可以類似於上述各種方法。

在一些實施例中，視頻解碼方法可以使用解碼設備來實現，該解碼設備在如圖16和圖17中所述的硬體平臺上實現。

可以使用以下解決方案的列表來捕獲本文描述的一些實施例。

1. 一種視頻編碼方法（例如，圖18中所描述的方法1800），包括：確定（步驟1802）視頻數據塊將被編碼為零單元（ZU）塊，視頻數據塊具有尺寸S×T；將ZU塊劃分（步驟1804）為兩個單元、三個單元或四個單元中的一個；以及通過編碼單元生成（步驟1806）位元流。

2. 一種視頻解碼方法（例如，圖19中所描述的方法1900）包括：接收（步驟1902）對應於編碼為零單元（ZU）塊的視頻數據塊的位元流，該零單元（ZU）塊被劃分為兩個單元、三個單元或四個單元，該視頻數據塊具有尺寸S×T；以及通過解碼位元流生成（步驟1904）視頻數據塊。

3. 如解決方案1或2所述的方法，其中，ZU塊使用二叉樹劃分方案被劃分為兩個單元，每個ZU塊具有尺寸S/2×T。

4. 如解決方案1或2所述的方法，其中，ZU塊使用二叉樹劃分方案被劃分為兩個單元，每個單元具有尺寸S×T/2。

5. 如解決方案1或2所述的方法，其中，作為2^N >S≤2^N+1 的ZU塊使用二叉樹劃分方案被劃分為兩個單元的結果，兩個單元的第一單元具有尺寸2^N ×T 並且兩個單元的第二單元具有尺寸（S-2^N ）×T。

6. 如解決方案1或2所述的方法，其中，作為2^N >S≤2^N+1 的ZU塊使用二叉樹劃分方案被劃分為兩個單元的結果，兩個單元的第一單元具有尺寸（S-2^N ）×T 並且兩個單元的第二單元具有尺寸2^N ×T。

7. 如解決方案1或2所述的方法，其中，作為2^N >T≤2^N+1 的ZU塊使用二叉樹劃分方案被劃分為兩個單元的結果，兩個單元的第一單元具有尺寸S×2^N 並且兩個單元的第二單元具有尺寸S×（T-2^N ）。

8. 如解決方案1或2所述的方法，其中，作為2^N >T≤2^N+1 的ZU塊使用二叉樹劃分方案被劃分為兩個單元的結果，兩個單元的第一單元具有尺寸S×（T-2^N ）並且兩個單元的第二單元具有尺寸S×2^N 。

9. 如解決方案1或2所述的方法，其中，ZU塊使用三叉樹劃分方案被劃分為三個單元，三個單元中的兩個單元的每一個具有尺寸S/4×T 並且三個單元中的一個單元具有尺寸S/2×T。

10. 如解決方案1或2所述的方法，其中，ZU塊使用三叉樹劃分方案被劃分為三個單元，三個單元中的兩個具有尺寸S×T/4並且三個單元中的一個具有尺寸S×T/2。

11. 如解決方案1或2所述的方法，其中，作為2^N >S≤2^N+1 的ZU塊使用三叉樹劃分方案被劃分為三個單元的結果，第一單元具有尺寸2^N-1 ×T，第二單元具有尺寸（S-2^N ）×T，並且第三單元具有尺寸2^N-1 ×T。

12. 如解決方案1或2所述的方法，其中，作為2^N >T≤2^N+1 的ZU塊使用三叉樹劃分方案被劃分為三個單元的結果，第一單元具有尺寸S×2^N-1 ，第二單元具有尺寸S×（T-2^N ），並且第三單元具有尺寸S×2^N-1 。

13. 如解決方案1或2所述的方法，其中，ZU塊使用四叉樹劃分方案被劃分為四個單元，每個單元具有尺寸S/2×T/2。

14. 如解決方案1或2所述的方法，其中，作為2^N >S≤2^N+1 的ZU塊使用四叉樹劃分方案被劃分為四個單元的結果，第一單元具有尺寸2^N ×T/2，第二單元具有尺寸2^N ×T/2，並且第三單元具有尺寸S/2×（T-2^N ），並且第四單元具有尺寸S/2×（T-2^N ）。

15. 如解決方案1或2所述的方法，其中，作為2^N >T≤2^N+1 的ZU塊使用四叉樹劃分方案被劃分為四個單元的結果，第一單元具有尺寸S/2×2^N ，第二單元具有尺寸S/2×2^N ，並且第三單元具有尺寸S/2×（T-2^N ），並且第四單元具有尺寸S/2×（T-2^N ）。

16. 如解決方案1或2所述的方法，其中，作為2^N >S≤2^N+1 並且2^M >T≤2^M+1 的ZU塊使用四叉樹劃分方案被劃分為四個單元的結果，第一單元具有尺寸2^N ×2^M ，第二單元具有尺寸2^N ×2^M ，並且第三單元具有尺寸（S-2^N ）×（T-2^M ），並且第四單元具有尺寸（S-2^N ）×（T-2^M ）。

17. 如解決方案1或2所述的方法，其中，作為2^N >S≤2^N+1 並且2^M >T≤2^M+1 的ZU塊使用四叉樹劃分方案被劃分為四個單元的結果，第一單元具有尺寸2^N ×（T-2^M ），第二單元具有尺寸2^N ×（T-2^M ），並且第三單元具有尺寸（S-2^N ）×2^M ，並且第四單元具有尺寸（S-2^N ）×2M。

18. 如解決方案1或2所述的方法，其中，ZU塊的每個單元的高度和/或寬度是偶數。

19. 如解決方案1或2所述的方法，其中，ZU塊使用三叉樹劃分方案被分割為三個單元。

20. 如解決方案19所述的方法，其中，作為3*2^N >S≤3*2^N+1 的ZU塊被劃分的結果，三個單元中的第一單元具有尺寸2^N ×T，三個單元中的第二單元具有尺寸（S-3*2^N ）×T，並且三個單元中的第三單元具有尺寸2^N+1 ×T。

21. 如解決方案19所述的方法，其中，作為3*2^N >T≤3*2^N+1 的ZU塊被劃分的結果，三個單元中的第一單元具有尺寸S×2^N ，三個單元中的第二單元具有尺寸S×（T-3*2^N ），並且三個單元中的第三單元具有尺寸S×2^N+1 。

22. 如解決方案1或2所述的方法，其中，單元具有K*M形式的尺寸，其中M和K是整數。

23. 如解決方案1或2所述的方法，其中，單元具有K*M形式的尺寸，M是允許的編碼單元的最小高度或最小寬度並且單元從非ZU塊劃分。

24. 如解決方案22所述的方法，其中，導致不以K*M形式的單元的ZU塊劃分方案的信令通知被跳過。

25. 如解決方案23所述的方法，其中，導致從非ZU塊劃分的不以K*M形式的單元的劃分方案的信令通知被跳過。

26. 一種視頻編碼方法，包括：確定視頻數據塊將被編碼為零單元（ZU）塊；使用劃分方案來劃分視頻數據塊，其中，劃分方案將視頻數據塊劃分為兩個單元、三個單元或四個單元中的一個；通過編碼視頻數據塊生成位元流，其中，劃分方案使用與用於對作為非零單元塊的另一視頻數據塊的劃分的信令通知相同的語法來發信令通知。

27. 一種視頻解碼方法，包括：接收對應於被編碼為零單元（ZU）塊的視頻數據塊的位元流，其中，使用將視頻數據塊劃分為兩個單元、三個單元或四個單元中的一個的劃分方案將視頻數據塊劃分，並且其中，劃分方案在位元流中使用與用於信令通知非零單元塊的劃分相同的語法來信令通知；基於信令通知，解碼位元流以生成視頻數據塊。

28. 一種視頻編碼方法，包括：確定視頻數據塊將被編碼為零單元（ZU）塊，視頻數據塊具有尺寸；使用從ZU塊劃分方案的組中選擇的劃分方案將ZU塊劃分為兩個單元、三個單元或四個單元中的一個；編碼單元；以及在位元流中信令通知編碼的單元。這裡，ZU塊劃分方案的組是可用於分割編碼單元（CU）的劃分方案的組的子集。

29. 一種視頻解碼方法，包括：接收對應於視頻數據塊的位元流，視頻數據塊具有尺寸；接收信令通知，該信令通知指示視頻數據塊包括從零單元（ZU）塊劃分的單元，使用從ZU塊劃分方案的組中選擇的劃分方案來將該劃分的ZU塊劃分；以及基於信令通知，解碼對應於單元的位元流以重建視頻數據塊。這裡，ZU塊劃分方案的組是可用於分割編碼單元（CU）的劃分方案的組的子集。

30. 如解決方案28或29所述的方法，其中，ZU塊劃分方案的組基於ZU塊的大小或者與圖片、條帶、片或條帶類型的一個有關的ZU塊的位置中的一個。

31. 如解決方案28或29所述的方法，其中，可用的ZU塊劃分方案的組限於四叉樹劃分方案和二叉樹劃分方案。

32. 如解決方案28或29所述的方法，其中，ZU塊使用三叉樹劃分方案被劃分為三個單元，並且ZU塊的信令通知不包括與劃分方案有關的信息。

33. 如解決方案28或29所述的方法，其中，ZU塊劃分方案的組與可用於分割編碼單元（CU）的劃分方案的組相同，並且基於視頻數據塊是ZU塊來選擇用於信令通知分割ZU塊的指示的上下文。

34. 一種視頻編碼方法，包括：確定視頻數據塊將被編碼為零單元（ZU）塊，視頻數據塊具有尺寸；在確定ZU塊位於I條帶或幀內編碼圖片中時，將ZU塊劃分為兩個單元、三個單元或四個單元中的一個；編碼單元；以及在位元流中信令通知編碼的單元。

35. 一種視頻解碼方法，包括：接收對應於視頻數據塊的位元流，視頻數據塊具有尺寸；接收信令通知，該信令通知指示視頻數據塊包括從零單元（ZU）塊劃分的單元，劃分的ZU塊位於I條帶或幀內編碼圖片中；以及基於信令通知，解碼對應於單元的位元流以重建視頻數據塊。

36. 如解決方案34或35所述的方法，其中，ZU塊的至少一個尺寸是非二的冪數。

37. 如解決方案34或35所述的方法，其中，視頻數據塊是編碼單元（CU）塊，並且其中，CU塊由於至少一個尺寸為大於閾值的整數而被看待為ZU塊。

38. 一種視頻系統中的裝置，包括處理器和其上具有指令的非暫態性的記憶體，其中，當由處理器執行指令時，使得處理器實現如解決方案1到37中的任一個所述的方法。

39. 一種儲存在非暫態性的電腦可讀介質上的電腦程式產品，電腦程式產品包括用於執行解決方案1到37中的任一個中的方法的程式碼。

40. 如本文件中所描述的方法、裝置或系統。

從前述內容可以理解，本文已經出於說明的目的描述了本公開技術的具體實施例，但是可以在不脫離本發明範圍的情況下進行各種修改。因此，本公開的技術除了所附權利要求外不受限制。

本專利文件中描述的主題和功能操作的實現方式可以以各種系統、數位電子電路實現，或者以電腦軟體、韌體或硬體實現，包括說明書中公開的結構及其結構等同物，或者以它們中的一個或多個的組合實現。公開和其它實施例可以實現為一個或多個電腦程式產品，即，在有形且非暫態性的電腦可讀介質上編碼的一個或多個電腦程式指令模組，用於由資料處理裝置執行或控制資料處理裝置的操作。電腦可讀介質可以是機器可讀存放裝置、機器可讀儲存基板、記憶體設備、影響機器可讀傳播信號的物質組合、或者它們中的一個或多個的組合。術語「資料處理單元」或「資料處理裝置」涵蓋用於處理資料的所有裝置、設備和機器，包括例如可程式設計處理器、電腦或多個處理器或電腦。除了硬體之外，該裝置還可以包括為所討論的電腦程式創建執行環境的代碼，例如，構成處理器韌體、協定疊、資料庫管理系統、作業系統、或者它們中的一個或多個的組合的代碼。

電腦程式（也稱為程式、軟體、軟體應用、腳本或代碼）可以用任何形式的程式設計語言編寫，包括編譯或解釋語言，並且可以以任何形式來部署電腦程式，包括獨立程式或適合在計算環境中使用的模組、元件、子常式或其它單元。電腦程式並不必需對應於文件案系統中的文件。程式可以儲存在文件的保存其它程式或資料（例如，儲存在標記語言文件中的一個或多個腳本）的部分中，儲存在專用於所討論的程式的單個文件中，或儲存在多個協調文件中（例如，儲存一個或多個模組、副程式或代碼部分的文件）。可以部署電腦程式以在一個電腦上或在位於一個網站上或分佈在多個網站上並通過通信網路互連的多個電腦上執行。

本說明書中描述的過程和邏輯流程可以由執行一個或多個電腦程式的一個或多個可程式設計處理器執行，以通過對輸入資料進行操作並生成輸出來執行功能。過程和邏輯流程也可以由專用邏輯電路執行，並且裝置也可以實現為專用邏輯電路，例如FPGA（現場可程式設計閘陣列）或ASIC（專用積體電路）。

舉例來說，適合於執行電腦程式的處理器包括通用和專用微處理器、以及任何種類的數位電腦的任何一個或多個處理器。通常，處理器將從唯讀記憶體或隨機存取記憶體或兩者接收指令和資料。電腦的基本元件是用於執行指令的處理器和用於儲存指令和資料的一個或多個記憶體設備。通常，電腦還將包括或可操作地耦合到用於儲存資料的一個或多個大型存放區設備，例如磁片、磁光碟或光碟，以從該一個或多個大型存放區設備接收資料，或將資料傳輸到該一個或多個大型存放區設備，或者既接收又傳遞資料。然而，電腦不需要具有這樣的設備。適用於儲存電腦程式指令和資料的電腦可讀介質包括所有形式的非易失性記憶體、介質和記憶體設備，包括例如半導體記憶體設備，例如EPROM、EEPROM和快閃記憶體設備。處理器和記憶體可以由專用邏輯電路補充或併入專用邏輯電路中。

說明書和附圖旨在被認為僅是示例性的，其中示例性意味著示例。如這裡所使用的，單數形式的「一」、「一個」和「該」旨在也包括複數形式，除非上下文另有明確說明。另外，除非上下文另有明確說明，否則“或”的使用旨在包括「和/或」。

雖然本專利文件包含許多細節，但這些細節不應被解釋為對任何發明或可要求保護的範圍的限制，而是作為特定於特定發明的特定實施例的特徵的描述。在本專利文件中，在單獨的實施例的上下文中描述的某些特徵也可以在單個實施例中組合實現。相反，在單個實施例的上下文中描述的各種特徵也可以單獨地或以任何合適的子組合在多個實施例中實現。此外，儘管上面的特徵可以描述為以某些組合起作用並且甚至最初如此要求權利保護，但是在某些情況下，可以從所要求保護的組合中去除來自該組合的一個或多個特徵，並且所要求保護的組合可以指向子組合或子組合的變型。

類似地，雖然在附圖中以特定順序描繪了操作，但是這不應該被理解為要求以所示的特定順序或按循序執行這樣的操作，或者執行所有示出的操作，以實現期望的結果。此外，在本專利文件中描述的實施例中的各種系統元件的分離不應被理解為在所有實施例中都要求這種分離。

僅描述了幾個實現方式和示例，並且可以基於本專利文件中描述和示出的內容來做出其它實現方式、增強和變型。

1400、1500、1800、1900‧‧‧方法 1410～1420、1510～1530、1802～1806、1902～1904‧‧‧步驟 1600‧‧‧電腦系統 1605‧‧‧一個或多個處理器 1610‧‧‧記憶體 1615‧‧‧網路介面控制器 1625‧‧‧互連 1700‧‧‧移動設備 1701‧‧‧處理器/控制器 1702‧‧‧記憶體 1703‧‧‧I/O介面 1704‧‧‧顯示器

圖1示出了典型的高效視頻編碼（HEVC）視訊轉碼器和解碼器的示例框圖。圖2示出了H.264/AVC中的巨集區塊（MB）劃分的示例。圖3示出了將編碼塊（CB）分割成預測塊（PB）的示例。圖4A和圖4B分別示出了將編碼樹塊（CTB）細分為CB和變換塊（TB）以及相應的四叉樹的示例。圖5示出了一幀的劃分結構的示例。圖6A和圖6B分別示出了在圖5中的示例性幀中突出顯示的CTB的細分和信令方法。圖7A和圖7B示出了用於最大編碼單元（LCU）的細分和相應的QTBT（四叉樹加二叉樹）的示例。圖8A至圖8E示出了劃分編碼塊的示例。圖9示出了基於QTBT的CB的示例細分。圖10A至圖10I示出了支援多樹類型（MTT）的CB的劃分的示例，其中多樹類型（MTT）是QTBT的一般化。圖11示出了樹類型信令的示例。圖12A至圖12C示出了跨越圖片邊界的CTB的示例。圖13示出了圖片邊界處的零單元的示例。圖14示出了根據本公開的技術的用於視頻編碼的示例方法的流程圖。圖15示出了根據本公開的技術的用於視頻解碼的另一示例方法的流程圖。圖16是示出可用於實現本公開技術的各個部分的電腦系統或其它控制設備的架構的示例的框圖。圖17示出了可用於實現本公開技術的各個部分的移動設備的示例實施例的框圖。圖18是視頻處理的示例方法的流程圖。圖19是視頻處理的示例方法的流程圖。

1800‧‧‧方法

1802~1806‧‧‧步驟

Claims

一種視頻編碼方法，包括：由於視頻數據塊具有尺寸S×T、S和T中的至少一個是非二的冪數，確定所述視頻數據塊將被編碼為零單元（ZU）塊；將所述ZU塊劃分為兩個單元、三個單元或四個單元中的一個；以及通過編碼所述單元生成位元流。
一種視頻解碼方法，包括：接收對應於編碼為零單元（ZU）塊的視頻數據塊的位元流，該零單元（ZU）塊被劃分為兩個單元、三個單元或四個單元，所述視頻數據塊具有尺寸S×T；以及通過解碼所述位元流生成所述視頻數據塊。
如申請專利範圍第1或2項所述的方法，其中，所述ZU塊使用二叉樹劃分方案被劃分為兩個單元，每個單元具有尺寸S/2×T。
如申請專利範圍第1或2項所述的方法，其中，所述ZU塊使用二叉樹劃分方案被劃分為兩個單元，每個單元具有尺寸S×T/2。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >S≤2^N+1 的ZU塊使用二叉樹劃分方案被劃分為兩個單元的結果，所述兩個單元中的第一單元具有尺寸2^N ×T ，並且所述兩個單元中的第二單元具有尺寸（S-2^N ）×T。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >S≤2^N+1 的ZU塊使用二叉樹劃分方案被劃分為兩個單元的結果，所述兩個單元中的第一單元具有尺寸（S-2^N ）×T，並且所述兩個單元中的第二單元具有尺寸2^N ×T。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >T≤2^N+1 的ZU塊使用二叉樹劃分方案被劃分為兩個單元的結果，所述兩個單元中的第一單元具有尺寸S×2^N ，並且所述兩個單元中的第二單元具有尺寸S×（T-2^N ）。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >T≤2^N+1 的ZU塊使用二叉樹劃分方案被劃分為兩個單元的結果，所述兩個單元中的第一單元具有尺寸S×（T-2^N ）並且所述兩個單元中的第二單元具有尺寸S×2^N 。
如申請專利範圍第1或2項所述的方法，其中，所述ZU塊使用三叉樹劃分方案被劃分為三個單元，所述三個單元中的兩個單元的每一個具有尺寸S/4×T，並且所述三個單元中的一個單元具有尺寸S/2×T。
如申請專利範圍第1或2項所述的方法，其中，所述ZU塊使用三叉樹劃分方案被劃分為三個單元，所述三個單元中的兩個具有尺寸S×T/4，並且所述三個單元中的一個具有尺寸S×T/2。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >S≤2^N+1 的ZU塊使用三叉樹劃分方案被劃分為三個單元的結果，第一單元具有尺寸2^N-1 ×T，第二單元具有尺寸（S-2^N ）×T，並且第三單元具有尺寸2^N-1 ×T。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >T≤2^N+1 的ZU塊使用三叉樹劃分方案被劃分為三個單元的結果，第一單元具有尺寸S×2^N-1 ，第二單元具有尺寸S×（T-2^N ），並且第三單元具有尺寸S×2^N-1 。
如申請專利範圍第1或2項所述的方法，其中，所述ZU塊使用四叉樹劃分方案被劃分為四個單元，每個單元具有尺寸S/2×T/2。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >S≤2^N+1 的ZU塊使用四叉樹劃分方案被劃分為四個單元的結果，第一單元具有尺寸2^N ×T/2，第二單元具有尺寸2^N ×T/2，並且第三單元具有尺寸S/2×（T-2^N ），並且第四單元具有尺寸S/2×（T-2^N ）。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >T≤2^N+1 的ZU塊使用四叉樹劃分方案被劃分為四個單元的結果，第一單元具有尺寸S/2×2^N ，第二單元具有尺寸S/2×2^N ，並且第三單元具有尺寸S/2×（T-2^N ），並且第四單元具有尺寸S/2×（T-2^N ）。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >S≤2^N+1 且2^M >T≤2^M+1 的ZU塊使用四叉樹劃分方案被劃分為四個單元的結果，第一單元具有尺寸2^N ×2^M ，第二單元具有尺寸2^N ×2^M ，並且第三單元具有尺寸（S-2^N ）×（T-2^M ），並且第四單元具有尺寸（S-2^N ）×（T-2^M ）。
如申請專利範圍第1或2項所述的方法，其中，作為2^N >S≤2^N+1 且2^M >T≤2^M+1 的ZU塊使用四叉樹劃分方案被劃分為四個單元的結果，第一單元具有尺寸2^N ×（T-2^M ），第二單元具有尺寸2^N ×（T-2^M ），第三單元具有尺寸（S-2^N ）×2^M ，並且第四單元具有尺寸（S-2^N ）×2^M 。
如申請專利範圍第1或2項所述的方法，其中，所述ZU塊的每個單元的高度和/或寬度是偶數。
如申請專利範圍第1或2項所述的方法，其中，所述ZU塊使用三叉樹劃分方案被分割為三個單元。
如申請專利範圍第19項所述的方法，其中，作為3*2^N >S≤3*2^N+1 的ZU塊被劃分的結果，所述三個單元中的第一單元具有尺寸2^N ×T，所述三個單元中的第二單元具有尺寸（S-3*2^N ）×T，並且所述三個單元中的第三單元具有尺寸2^N+1 ×T。
如申請專利範圍第19項所述的方法，其中，作為3*2^N >T≤3*2^N+1 的ZU塊被劃分的結果，所述三個單元中的第一單元具有尺寸S×2^N ，所述三個單元中的第二單元具有尺寸S×（T-3*2^N ），並且所述三個單元中的第三單元具有尺寸S×2^N+1 。
如申請專利範圍第1或2項所述的方法，其中，所述單元具有K*M形式的尺寸，其中M和K是整數。
如申請專利範圍第1或2項所述的方法，其中，所述單元具有K*M形式的尺寸，M是允許的編碼單元的最小高度或最小寬度，並且所述單元是從非ZU塊劃分得到的。
如申請專利範圍第22項所述的方法，其中，導致非K*M形式的單元的ZU塊劃分方案的信令通知被跳過。
如申請專利範圍第23項所述的方法，其中，導致從非ZU塊劃分的非K*M形式的單元的劃分方案的信令通知被跳過。
一種視頻編碼方法，包括：由於所述塊具有非二的冪數的高度或寬度，確定視頻數據塊將被編碼為零單元（ZU）塊；使用劃分方案來劃分所述視頻數據塊，其中，所述劃分方案將所述視頻數據塊劃分為兩個單元、三個單元或四個單元中的一個；以及通過編碼所述視頻數據塊生成位元流，其中，所述劃分方案使用與用於對作為非零單元塊的另一視頻數據塊進行劃分的信令通知相同的語法來發信令通知。
一種視頻解碼方法，包括：接收對應於視頻數據塊的位元流，由於所述視頻數據塊具有尺寸S×T、S和T中的至少一個是非二的冪數，所述視頻數據塊被編碼為零單元（ZU）塊，其中，使用將所述視頻數據塊劃分為兩個單元、三個單元或四個單元中的一個的劃分方案將所述視頻數據塊劃分，並且其中，所述劃分方案在所述位元流中使用與用於信令通知非零單元塊的劃分相同的語法來發信令通知；以及基於所述信令通知，解碼所述位元流以生成所述視頻數據塊。
一種視頻編碼方法，包括：由於視頻數據塊具有尺寸S×T、S和T的至少一個是非二的冪數，確定所述視頻數據塊將被編碼為零單元（ZU）塊；使用從ZU塊劃分方案的組中選擇的劃分方案將所述ZU塊劃分為兩個單元、三個單元或四個單元中的一個；編碼所述單元；以及在位元流中信令通知被編碼的單元；其中，所述ZU塊劃分方案的組是可用於劃分編碼單元（CU）的劃分方案的組的子集。
一種視頻解碼方法，包括：接收對應於視頻數據塊的位元流，所述視頻數據塊具有尺寸；接收信令通知，所述信令通知指示由於所述視頻數據塊具有尺寸S×T、S和T中的至少一個是非二的冪數，所述視頻數據塊作為零單元（ZU）塊被劃分，使用從ZU塊劃分方案的組中選擇的劃分方案將所述塊劃分；以及基於所述信令通知，解碼對應於所述單元的所述位元流以重建所述視頻數據塊；其中，所述ZU塊劃分方案的組是可用於分割編碼單元（CU）的劃分方案的組的子集。
如申請專利範圍第28或29項所述的方法，其中，所述ZU塊劃分方案的組基於所述ZU塊的大小或者與圖片、條帶、片或條帶類型的一個有關的所述ZU塊的位置中的一個。
如申請專利範圍第28或29項所述的方法，其中，可用的所述ZU塊劃分方案的組限於四叉樹劃分方案和二叉樹劃分方案。
如申請專利範圍第28或29項所述的方法，其中，所述ZU塊使用三叉樹劃分方案被劃分為三個單元，並且所述ZU塊的信令通知不包括與所述劃分方案有關的信息。
如申請專利範圍第28或29項所述的方法，其中，所述ZU塊劃分方案的組與可用於分割所述編碼單元（CU）的所述劃分方案的組相同，並且基於所述視頻數據塊是所述ZU塊來選擇用於信令通知分割所述ZU塊的指示的上下文。
一種視頻編碼方法，包括：由於所述視頻數據塊具有尺寸，並且所述尺寸的高和寬中的至少一個是非二的冪數，確定視頻數據塊將被編碼為零單元（ZU）塊；在確定所述ZU塊位於I條帶或幀內編碼的圖片中時，將所述ZU塊劃分為兩個單元、三個單元或四個單元中的一個；編碼所述單元；以及在位元流中信令通知被編碼的單元。
一種視頻解碼方法，包括：接收對應於視頻數據塊的位元流，所述視頻數據塊具有尺寸；接收信令通知，所述信令通知指示所述視頻數據塊包括從零單元（ZU）塊劃分的單元，所述零單元（ZU）塊至少高度或寬度為非二的冪數，並且在無變換和殘差編碼的情況下被編碼，所述劃分的ZU塊位於I條帶或幀內編碼圖片中；以及基於所述信令通知，解碼對應於所述單元的所述位元流以重建所述視頻數據塊。
如申請專利範圍第34或35項所述的方法，其中，所述ZU塊的尺寸的高和寬中的至少一個是非二的冪數。
如申請專利範圍第34或35項所述的方法，其中，所述視頻數據塊是編碼單元（CU）塊，並且其中，所述CU塊由於至少一個尺寸為大於閾值的整數而被看待為ZU塊。
一種視頻系統中的設備，包括處理器和其上儲存有指令的非暫態性記憶體，其中，當由所述處理器執行所述指令時，使得所述處理器實現如申請專利範圍第1到37項中的一個或多個所述的方法。
一種儲存在非暫態性的電腦可讀介質上的電腦程式產品，所述電腦程式產品包括用於執行如申請專利範圍第1到37項中的一個或多個所述的方法的程式碼。
如本文件中所描述的方法、裝置或系統。