TW202339504A

TW202339504A - 幾何分割模式及合併候選重排

Info

Publication number: TW202339504A
Application number: TW112110011A
Authority: TW
Inventors: 羅志軒; 邱志堯; 陳俊嘉; 莊子德; 徐志瑋; 陳慶曄; 黃毓文
Original assignee: 聯發科技股份有限公司
Priority date: 2022-03-18
Filing date: 2023-03-17
Publication date: 2023-10-01
Also published as: WO2023174426A1

Abstract

視訊編解碼器（編碼器或解碼器）接收要被編碼或解碼為視訊的當前圖片的當前塊的像素塊的資料。視訊編碼器將多種分區模式分類為多組分區模式。每種分區模式將當前塊分割成至少兩個幾何分區。視訊編解碼器發送或接收從多組分區模式中選擇的一組分區模式。視訊編解碼器從選定組分區模式中選擇分區模式。視訊編解碼器根據所選擇的分區模式將當前塊至少分成第一分區和第二分區。視訊編解碼器通過組合第一分區的第一預測和第二分區的第二預測來編碼或解碼當前塊。

Description

幾何分割模式及合併候選重排

本公開涉及視訊編解碼。更具體地，本公開涉及合併模式候选（merge mode candidate）的排序和幾何分區模式（geometric partitioning mode）。

除非本文另有說明，否則本節中描述的方法不是後面列出的申請專利範圍的現有技術，並且不因包含在本節中而被承認為現有技術。

通用視訊編解碼(VVC)是由ITU-T SG16 WP3和ISO/IEC JTC1/SC29/WG11聯合視訊專家組(JVET)制定的最新國際視訊編解碼標準。輸入視訊信號是根據從編碼的圖片區域導出的重建的信號預測的。預測殘差信號通過塊變換進行處理。變換係數與位元流中的其他輔助資訊一起被量化和熵編解碼。重建的信號是根據預測信號和對去量化的變換係數進行逆變換後的重建的殘差信號生成的。重建的信號通過環路濾波進一步處理，以去除編解碼偽像。解碼後的圖片存儲在幀緩衝器中，用於預測輸入視訊信號中的未來圖片。

在VVC中，編碼的圖片被劃分為由相關聯的編解碼樹單元(CTU)表示的非重疊方形塊區域。編碼的圖片可以由切片集合表示，每個切片包含整數個 CTU。切片中的各個 CTU 以光柵掃描順序處理。可以使用幀內預測或幀間預測對雙向預測（bi-predictive，簡寫為B）切片進行解碼，其中最多有兩個運動向量和參考索引來預測每個塊的樣本值。使用具有至多一個運動矢量和參考索引的幀內預測或幀間預測來解碼預測（predictive，簡寫為P）切片以預測每個塊的樣本值。僅使用幀內預測對幀內 (I) 切片進行解碼。

利用具有嵌套多類型樹（multi-type-tree，簡寫為MTT）結構的四叉樹（QT）可以將CTU劃分為一個或多個非重疊編解碼單元（CU），以適應各種局部運動和紋理特徵。可以使用五種分割類型之一將 CU 進一步分割成更小的 CU：四叉樹分割、垂直二叉樹分割、水平二叉樹分割、垂直中心側三叉樹分割、水平中心側三叉樹分割。

每個CU包含一個或多個預測單元(PU)。預測單元與關聯的 CU 句法一起作為用於發送預測資訊的基本單元。指定的預測過程用於預測 PU 內的相關像素樣本的值。每個CU可以包含一個或多個變換單元（TU）用於表示預測殘差塊。變換單元 (TU) 由一個亮度樣本的變換塊 (TB) 和兩個相應的色度樣本變換塊組成，每個 TB 對應於來自一種顏色分量的樣本的一個殘差塊。將整數變換應用於變換塊。量化係數的電平值（level value）與其他輔助資訊一起在位元流中被熵編解碼。術語編解碼樹塊 (CTB)、編解碼塊 (CB)、預測塊 (PB) 和變換塊 (TB) 被定義為指定分別與 CTU、CU、PU 和TU相關聯的一種顏色分量的2維樣本陣列（2-D sample array）。因此，一個 CTU 由一個亮度 CTB、兩個色度 CTB 和相關語法元素組成。類似的關係對 CU、PU 和 TU 有效。

以下概述僅是說明性的並且不旨在以任何方式進行限制。即，以下概述被提供以介紹本文所述的新穎且非顯而易見的技術的概念、亮點、益處和優點。選擇而不是所有的實施方式在下面的詳細描述中被進一步描述。因此，以下概述並非旨在識別所要求保護的主題的基本特徵，也不旨在用於確定所要求保護的主題的範圍。

本公開的一些實施例提供了一種用於發送幾何分區模式（geometric partitioning mode，簡寫為GPM）的分區模式和合併候選的方法。視訊編解碼器（編碼器或解碼器）接收要作為視訊的當前圖片的當前塊被編碼或解碼的像素塊的資料。視訊編解碼器將多種分區模式分類為多組分區模式。每種分區模式是一種幾何分區，將當前塊分割成至少兩個幾何分區。視訊編解碼器發送或接收從多組分區模式中選擇的一組分區模式。視訊編解碼器從選定的一組分區模式中選擇分區模式。視訊編解碼器根據所選擇的分區模式將當前塊至少分成第一分區和第二分區。視訊編解碼器通過組合第一分區的第一預測和第二分區的第二預測來編碼或解碼當前塊。

在一些實施例中，視訊編解碼器為多個分區模式中的每個分區模式計算用於編碼當前塊的成本，基於計算的成本從多個分區模式中識別最佳分區模式，並且選擇包括已識別的最佳分區模式的一組分區模式。針對分區模式對當前塊進行編碼的成本可以是使用分區模式對當前塊進行編碼的模板匹配成本或邊界匹配成本。在一些實施例中，視訊編解碼器通過為多組分區模式中的每組識別最低成本分區模式來識別最佳分區模式。

在一些實施例中，視訊編碼器計算用於以所選組分區模式中的每個分區模式編碼當前塊的成本。視訊編解碼器可通過從所選的一組分區模式中選擇最低成本的分區模式來從所選的一組分區模式中選擇分區模式。視訊編解碼器可通過根據計算的成本對所選組中的分區模式重新排序，以及基於重新排序發送或接收對分區模式的選擇。

在一些實施例中，視訊編碼器接收要被編碼或解碼為視訊的當前圖片的當前塊的像素塊的資料。視訊編解碼器發送或接收從多個分區模式中選擇的分區模式。每種分區模式都是一種幾何分區，將當前塊分割成至少兩個分區。視訊編解碼器計算由所選分區模式形成的當前塊的至少兩個分區中的每一者的每一合併候選的成本。視訊編解碼器基於計算的成本為由所選分區模式形成的至少兩個分區選擇一組至少合併候選。視訊編解碼器通過基於所選擇的至少兩個合併候選的集合組合至少兩個分區的兩個預測來編碼或解碼當前塊。

在一些實施例中，對於多個分區模式中的每個分區模式，視訊編解碼器計算由分區模式形成的至少兩個分區的每組至少兩個合併候選的成本，基於計算出的成本，識別該至少兩個分區的一組至少兩個合併候選。所選擇的分區模式是基於多個分區模式的識別的合併候選對的計算成本來選擇的。視訊編解碼器可以通過重新排序至少兩個分區的合併候選，基於所計算的成本選擇該組至少兩個合併候選，其中合併候選由所選分區模式根據計算的成本形成，以及基於該重新排序發送或接收對一組至少兩個合併候選的選擇。視訊編解碼器可通過在由所選分區模式形成的至少兩個分區的合併候選中選擇具有最低成本的至少兩個合併候選的集合來基於計算的成本來選擇一組至少兩個合併候選。

在以下詳細描述中，藉由示例的方式闡述了許多具體細節，以便提供對相關教導的透徹理解。基於本文描述的教導的任何變化、衍生和/或擴展都在本公開的保護範圍內。在一些情況下，與在此公開的一個或多個示例實施方式有關的眾所周知的方法、處理、組件和/或電路可以在相對較高的水平上進行描述而沒有細節，以避免不必要地模糊本公開的教導的方面。 一、合併模式的候選重新排序

第1圖示出合併模式的運動候選。該圖示出由視訊編解碼器編碼或解碼的視訊圖片或幀的當前塊100。如圖所示，多達四個空間MV候選從空間相鄰A0、A1、B0和B1導出，以及一個時間MV候選從TBR或TCTR導出（首先使用TBR，如果TBR不可用，則使用TCTR）。如果四個空間MV候選中的任何一個都不可用，則位置B2被用來導出MV候選作為替代。在四個空間MV候選和一個時間MV候選的推導處理之後，在一些實施例中移除冗餘（修剪）被應用以移除冗餘MV候選。如果在移除冗餘（修剪pruning）之後，可用的MV候選的數量小於5，則三種額外的候選被導出並添加到候選集合（候選列表）中。視訊編碼器根據速率失真優化（rate-distortion optimization，簡稱RDO）決策在候選集合中選擇一個最終候選，用於跳過或合併模式，以及將索引傳輸到視訊解碼器。（本文檔中將跳過模式和合併模式統稱為“合併模式”。）

對於一些實施例，合併候選被定義為通用“預測+合併”演算法框架的候選。“預測+合併”演算法框架有第一部分和第二部分。第一部分生成（一組）預測子的候選列表，這些預測子是藉由繼承相鄰資訊或精確化（refining）或處理相鄰資訊而導出。第二部分是發送（i ）合併索引，以指示候選列表中的哪個被選擇，以及（ii）與合併索引相關的一些輔助資訊。換句話說，編碼器將合併索引和所選候選的一些輔助資訊發送給解碼器。

第2圖概念性地示出用於合併候選的“預測+合併”演算法框架。候選列表包括許多繼承相鄰資訊的候選。然後繼承的資訊被處理或精確化以形成新的候選。在這些處理中，一些候選的輔助資訊被生成以及被發送到解碼器。

視訊編解碼器（編碼器或解碼器）可以以不同方式處理合併候選。首先，在一些實施例中，視訊編解碼器可將兩個或多個候選組合成一個候選。其次，在一些實施例中，視訊編解碼器可以使用原始候選作為原始MV預測子以及使用當前像素塊執行運動估計搜索以找到最終的運動向量差（Motion Vector Difference，簡稱MVD），其中輔助資訊是MVD。第三，在一些實施例中，視訊編解碼器可以使用原始候選作為原始MV預測子以及使用當前像素塊執行運動估計搜索以找到L0的最終MVD，以及L1預測子是原始候選。第四，在一些實施例中，視訊編解碼器可以使用原始候選作為原始MV預測子以及使用當前像素塊執行運動估計搜索以找到L1的最終MVD，以及L0預測子是原始候選。第五，在一些實施例中，視訊編解碼器可以使用原始候選作為原始MV預測子以及使用頂部或左側相鄰像素作為搜索模板進行MV精確化搜索以找到最終預測子。第六，視訊編解碼器可以使用原始候選作為原始MV預測子，以及使用雙邊模板（候選MV或鏡像MV指向的L0和L1參考圖片上的像素）作為搜索模板進行MV精確化搜索以找到最終預測子。

模板匹配（template matching，簡稱TM）是一種視訊編解碼方法，以藉由將當前圖片中的當前CU的模板（當前模板）與參考圖片中的參考模板進行匹配來精確化當前CU的預測以用於預測。CU或塊的模板通常是指與CU頂部和/或左側相鄰的特定像素集合。

對於本文檔，術語“合併候選”或“候選”是指通用“預測+合併”演算法框架中的候選。“預測+合併”演算法框架不限於前述實施例。任一具有“預測+合併索引”行為的演算法都屬於這個框架。

在一些實施例中，視訊編解碼器對合併候選重新排序，即，視訊編解碼器修改候選列表內的候選順序以實現更好的編解碼效率。重排序規則依賴於對當前候選的一些預計算（重新排序之前的合併候選），例如當前CU的頂部相鄰條件（模式、MV等）或左側相鄰條件（模式、MV等），當前CU形狀，或頂部/左側L形模板匹配。

第3圖概念性地示出示例候選重新排序。如圖所示，示例合併候選列表0300具有標記為“0”到“5”的六個候選。視訊編解碼器最初選擇一些候選（標記為“1”和“3”的候選）進行重新排序。然後，視訊編解碼器預先計算這些候選的成本（標記為“1”和“3”的候選的成本分別為100和50）。成本被稱為候選的猜測成本（因為這不是使用候選的真實成本，而只是對真實成本的估計或猜測），成本越低意味著候選越好。最後，視訊編解碼器藉由將成本較低的候選（標記為“3”的候選）移動到列表的前面來重新排序所選候選。

一般而言，對於在合併候選列表中具有順序位置Oi的合併候選Ci（其中i = 0〜N-1，N為列表中候選的總數，Oi= 0表示Ci在列表的開頭，以及Oi=N-1表示Ci在列表的末尾），Oi = i（C0順序為0，C1順序為1，C2順序為2，... 等等），視訊編解碼器藉由更改i的選定值的Ci的Oi（更改一些選定候選的順序）來重新排序列表中的合併候選。

在一些實施例中，合併候選重新排序可以根據當前PU或CU的大小或形狀來關閉。視訊編解碼器可預先定義若干PU大小或形狀以關閉合併候選重新排序。在一些實施例中，用於關閉合併候選重新排序的其他條件，例如圖片大小、QP值等，是特定的預定值。在一些實施例中，視訊編解碼器可以發送標誌以打開或關閉合併候選重新排序。例如，視訊編解碼器可以發送標誌（例如，“merge_cand_rdr_en”）以指示“合併候選重新排序”是否啟用（值1：啟用，值 0：禁用）。當該標誌不存在時，merge_cand_rdr_en的值被推斷為1。信令中的單元的最小尺寸，merge_cand_rdr_en，也可以在序列級別、圖片級別、片段級別或PU級別中被單獨編解碼。

通常，視訊編解碼器可以藉由（1）識別一個或多個用於重新排序的候選，（2）計算每個識別的候選的猜測成本，以及（3）根據所選候選的猜測成本對候選進行重新排序。在一些實施例中，一些候選的計算的猜測成本在候選被重新排序之前被調整（成本調整）。

在一些實施例中，L形匹配方法用於計算所選候選的猜測成本。對於當前選擇的合併候選，視訊編解碼器獲取當前圖片的L形模板（當前模板）和參考圖片的L形模板（參考模板）以及比較至少兩個模板之間的差值。L形匹配方法有兩個部分或步驟：（i）識別L形模板和（ii）匹配導出的模板以確定猜測成本，或候選的匹配成本。

第4-5圖概念性地示出用於計算所選候選的猜測成本的L形匹配方法。第4圖顯示當前圖片中當前CU的L形模板（當前模板），其包括當前PU或CU的頂部和左側邊界周圍的一些像素。參考圖片的L形模板包括用於當前合併候選的“用於猜測的參考塊（reference block for guessing）”的頂部和左側邊界周圍的一些像素。“用於猜測的參考塊”（寬度BW和高度BH與當前PU相同）是當前合併候選的運動向量的整數部分所指向的塊。

不同的實施例以不同的方式定義L形模板。在一些實施例中，L形模板的所有像素都在reference_block_for_guessing之外（如第4圖中的“外部像素”標籤）。在一些實施例中，L形模板的所有像素都在“用於猜測的參考塊”內部（如第4圖中的“內部像素”標籤）。在一些實施例中，L形模板的一些像素在“用於猜測的參考塊”之外，而L形模板的一些像素在“用於猜測的參考塊”之內。第5圖示出當前圖片中的當前PU或CU的L形模板（當前模板），類似於第4圖，參考圖片中的L形模板（外部像素實施例）沒有左上角像素。

在一些實施例中，L形匹配方法和對應的L形模板（命名為template_std）根據如下定義：假設當前PU的寬度為BW，當前PU的高度為BH，則當前圖片的L形模板具有頂部部分和左側部分。定義頂部厚度=TTH, 左側厚度=LTH，則頂部部分包含座標為（ltx+tj, lty-ti）的所有當前圖片像素，其中ltx為當前PU的左上整數像素水平座標，lty為當前PU的左上整數像素垂直座標，ti為像素行的索引（ti為0~（TTH-1）），tj為行的像素索引（tj為0~BW-1）。對於左側部分，包括座標為（ltx-tjl, lty+til）的所有當前圖片像素，其中ltx為當前PU的左上整數像素水平座標，lty為當前PU的左上整數像素垂直座標，til為列的像素索引（til為0~（BH-1）），tjl為列的索引（tjl為0~（LTH-1））。

在template_std中，參考圖片的L形模板具有頂部部分和左側部分。定義頂部厚度=TTHR, 左側厚度= LTHR，則頂部部分包括座標為（ltxr+tjr, ltyr-tir+shifty）的所有參考圖片像素，其中ltxr為reference_block_for_guessing的左上整數像素水平座標，ltyr是reference_block_for_guessing的左上整數像素垂直座標，tir是像素行的索引（tir是0~（TTHR-1）），tjr是行的像素索引（tjr是0~BW-1）,shifty是預定移位值。對於左側部分，其由座標為（ltxr-tjlr+shiftx, ltyr+tilr）的所有參考圖片像素組成，其中ltxr為reference_block_for_guessing的左上整數像素水平坐標，ltyr為reference_block_for_guessing的左上整數像素垂直坐標，tilr為列的像素索引（tilr為0~（BH-1）），tjlr為列的索引（tjlr為0~（LTHR-1）），shiftx為預定移位值。

如果當前候選僅具有L0 MV或僅具有L1 MV，則參考圖片存在一個L形模板。但是如果當前候選同時具有L0和L1 MV（雙向預測候選），則參考圖片有2個L形模板，一個模板由L0參考圖片中的L0 MV指向，另一個模板由L1參考圖片中的L1 MV指向。

在一些實施例中，對於L形模板，視訊編解碼器具有適應性厚度模式。厚度被定義為L形模板頂部的像素行的數量或L形模板左側的像素列的數量。對於前面提到的L型模板template_std，當前圖片的L型模板的頂部厚度為TTH以及左側厚度為LTH，參考圖片的L型模板頂部厚度為TTHR以及左側厚度為LTHR。適應性厚度模式根據一些條件改變頂部厚度或左側厚度，例如當前PU大小或當前PU形狀（寬度或高度）或當前片段的QP。例如，在當前PU高度≥32時，適應性厚度模式可以設置頂部厚度=2，在當前PU高度＜32時，適應性厚度模式可以設置頂部厚度=1。

在進行L形模板匹配時，視訊編解碼器獲取當前圖片的L形模板和參考圖片的L形模板，以及比較（匹配）至少兩個模板之間的差值。至少兩個模板中像素之間的差值（例如，絕對差值之和，或SAD）被用作MV的匹配成本。在一些實施例中，視訊編解碼器可以在計算至少兩個L形模板的所選像素之間的差值之前從當前圖片的L形模板獲得所選像素以及從參考圖片的L形模板獲得所選像素。

在一些實施例中，使用編解碼工具或預測模式來編解碼當前塊的成本（例如，用於分區模式的特定合併候選對（或一組至少兩個合併候選））可以通過邊界匹配成本來評估。邊界匹配 (boundary matching，簡寫為BM) 成本是一種相似性（或不連續性）度量，用於量化當前塊的重建像素與沿當前塊邊界的（重建的）相鄰像素之間的相關性。基於根據特定編解碼工具或預測模式重建的像素樣本的邊界匹配成本被用作該特定編解碼工具或預測模式的邊界匹配成本。

第6圖圖示了用於確定邊界匹配成本的4x4塊的相鄰樣本和重建的樣本。圖中 p _x,-2, p _x,-1為當前塊600上方的重建的相鄰樣本， p _-2,y, p _-1,y為當前塊左側的重建的相鄰樣本， p _x,0, p _0,y是當前塊600沿頂部和左側邊界根據特定變換配置被重建的樣本。

對於一個 4x4 塊，成本可以通過以下等式使用跨頂部和左側邊界上的像素來計算，該等式為假設提供了頂部和左側邊界處的相似性度量（或不連續性度量）： (1)

使用等式（1）獲得的成本可稱為邊界匹配 (BM) 成本。在一些實施例中，在進行邊界匹配處理時，僅重建邊界像素（border pixel），可以避免不必要的操作（例如二次逆變換等），從而降低複雜度。二、 幾何分區模式（ Geometric partitioning Mode ， GPM ）

在VVC中，幾何分區模式被支持用於幀間預測。幾何分區模式（GPM）使用CU級標誌作為一種合併模式來發送，其他合併模式包括常規合併模式、MMVD 模式、CIIP 模式和子塊合併模式。對於每個可能的CU大小 w×h=2 ^m×2 ⁿ（其中m,n∈{3⋯6}，不包括8x64和64x8），幾何分區模式總共支持64個分區。

第7圖示出藉由幾何分區模式（GPM）對CU的分割。每個GPM分區或GPM拆分的分區模式的特點是定義平分線（bisecting line）或分段線（segmenting line）的距離-角度配對（distance-angle pairing）。該圖示出按相同角度分組的GPM拆分示例。如圖所示，當GPM被使用時，CU被幾何定位的直線分成至少兩部分。分割線的位置在數學上從特定分區的角度和偏移參數導出。

由GPM的分區模式形成的CU中的每個分區使用其自己的運動（向量）進行幀間預測。在一些實施例中，每個分區只允許單向預測，即每個部分有一個運動向量和一個參考索引。與傳統的雙向預測類似，單向預測運動約束被應用以確保對於每個CU僅執行兩次運動補償預測。

如果GPM用於當前CU，則指示幾何分區的分區模式（角度和偏移）的幾何分區索引和兩個合併索引（每個分區一個）被進一步發送。通過根據分區的幾何分區創建的至少兩個分區中的每一個可以被分配合併索引，以從單向預測候選列表（也稱為GPM候選列表）中選擇候選。因此，這兩個分區的合併索引對選擇一對合併候選。GPM 候選列表中的最大候選數量可在SPS中明確發送，以指定GPM合併索引的語法二值化。在預測至少兩個分區的每個之後，沿幾何分區邊緣的樣本值使用具有適應性權重的混合處理進行調整。這是整個CU的預測訊號，變換和量化處理將像在其他預測模式中一樣應用於整個CU。然後由GPM預測的CU的運動欄位（motion field）被存儲。

GPM分區的單向預測候選列表（GPM候選列表）可以直接從當前CU的合併候選列表導出。第8圖示出用於GPM分區的示例性單向預測候選列表800以及對GPM的單向預測MV的選擇。GPM候選列表800以奇偶方式構建，僅具有在L0 MV和L1 MV之間交替的單向預測候選。設置n為GPM的單向預測候選列表中單向預測運動的索引。第n個擴展合併候選的LX（即L0或L1）運動向量，其中X等於n的奇偶性，用作GPM的第n個單向預測運動向量。（這些運動向量在圖中用“x”標記。）在不存在第n個擴展合併候選的對應LX運動向量的情況下，相同候選的L（1-X）運動向量被用作GPM的單向預測運動向量。

如前所述，沿幾何分區邊緣的樣本值使用具有適應性權重的混合處理來調整。具體來說，在使用自己的運動來預測幾何分區的每個部分之後，混合被應用於至少兩個預測訊號以導出幾何分區邊緣周圍的樣本。CU的每個位置的混合權重基於相應位置與分區邊緣之間的距離導出。位置（x,y）到分區邊緣的距離推導如下：（2）（3）（4）（5）

其中 i, j是幾何分區的角度和偏移的索引，它取決於發送的幾何分區索引。 ρ _x,j 和 ρ _y,j 的符號取決於角度索引i。幾何分區的每個部分的權重推導如下：（6）（7）（8）

變數partIdx取決於角度索引 i。第9圖示出用於CU 900的GPM的示例分區邊緣混合處理。在圖中，混合權重基於初始混合權重w ₀生成。

如上所述，使用GPM預測的CU的運動欄位被存儲。具體來說，來自幾何分區的第一部分的Mv1、來自幾何分區的第二部分的Mv2以及Mv1和Mv2的組合Mv被存儲在由GPM編解碼的CU的運動欄位中。運動欄位中每個單獨位置的存儲運動向量類型被確定為：（9）

其中motionIdx等於d（4x+2,4y+2），它從等式（2）重新計算。partIdx取決於角度索引 i。如果sType等於0或1，則Mv0或Mv1被存儲在相應的運動欄位中，否則如果sType等於2，則來自Mv0和Mv2的組合的Mv被存儲。組合的Mv使用以下處理生成：（i）如果Mv1和Mv2來自不同的參考圖片列表（一個來自 L0，另一個來自L1），則Mv1和Mv2被簡單地組合以形成雙向預測運動向量；（ii）否則，如果Mv1和Mv2來自同一列表，則僅單向預測運動Mv2被存儲。

三、發送 GPM 預測子

基於兩個合併候选和GPM分區模式定義GPM預測子。為了指示為 GPM 預測子選擇了哪些合併候選和哪種 GPM 分區模式，視訊編碼器發信號並且視訊解碼器接收兩個合併索引和 GPM 分區索引。然而，合併索引（通過可變長度編解碼進行編解碼）和分區索引（通過固定長度編解碼進行編解碼）的發送導致語法開銷。為了減少發送開銷並提高編解碼效率，本公開的一些實施例提供了發送GPM分區模式和合併候選的方法該方法可減少發送開銷。

在一些實施例中，視訊編解碼器將所有GPM分區模式分類為多組分區模式，並應用模式重排序/選擇方法來確定或識別每個組中的最佳分區模式（表示為partition_cands）。通過根據RDO成本對partition_cands進行升序排序，確定GPM的最佳分區模式，並推斷包含最佳分區模式的分區模式組為最佳組分區模式。不是發送分區索引，而是發送具有減少的位元長度的組索引（即，組索引的位元長度小於分區索引）給解碼器，以通知選擇哪個GPM分區模式組。在解碼器側，可以在選擇的該組分區模式中執行模式重排序/選擇方法以識別最佳分區模式。

在一些實施例中，64種GPM分區模式被分為不同組分區模式（例如，模式索引可以分為4組，4n、4n+1、4n+2、4n+3。或更通常地，模式索引可以分為 M 組，如 Mn、Mn+1、Mn+2、... Mn+(M-1)。對於每個組，收集或識別一些相似的模式（即具有相似分區方向的模式）或不同的模式（diverse mode）（即具有不同分區方向的模式）。在每個組內，通過混合分區模式的至少兩個分區的參考模板（根據至少兩個分區的各權重，如上文參考第9圖所述），計算每個GPM分區模式的成本（通過計算例如模板匹配成本或邊界匹配成本）。然後根據組中模式的計算成本識別最佳 GPM 分區模式（例如，具有最小成本的分區模式被識別為最佳 GPM 分區模式）。通過從每個組中收集最佳分區模式，構造 partition_cands。然後將partition_cands按照RDO成本升序排序，確定GPM的最佳分區模式和最佳組分區模式(亦稱為最佳分區模式組)。向解碼器發送具有減少的位元長度的組索引以指示選擇了哪個GPM分區模式組。在解碼器側，視訊解碼器對所選組分區模式中的所有GPM分區模式計算模板匹配成本或邊界匹配成本，並確定（模板匹配或邊界匹配）成本最小的最佳分區模式。

第10圖概念性地說明將GPM分區模式分類為多組分區模式並識別最佳組分區模式。如圖所示，有64種不同的GPM分區模式（分區模式0到63）用於對當前塊進行分區。 64 種分區模式被分類為或分配到四組分區模式（模式組 0 到 3）。每個組的分區模式根據成本（通過模板匹配或邊界匹配）排序或重新排序。確定每個組的最佳（例如，最低成本）分區模式。四個組的確定的最佳分區模式稱為 partition_cands（包括分區模式 13、28、43、57）。在此示例中，屬於模式組 2 的分區模式 43 在 partition_cands 中成本最低。因此，模式組 2 被識別為最佳組分區模式。可以將指示分區模式組2的組索引發送給解碼器。

在解碼器側，視訊解碼器可以為所選分區模式組（組2）中的所有GPM分區模式計算模板匹配成本或邊界匹配成本。在一些實施例中，所選模式組中的最低成本分區模式由解碼器隱含地選擇。在一些實施例中，所選模式組的分區模式根據計算的成本被排序或重新排序，並且具有減少的位元數量的分區模式選擇索引可以由編碼器發送以基於重新排序來選擇分區模式。

在一些實施例中，應用特定的GPM合併候選重新排序方法或方案來識別導致至少該兩個GPM分區的最佳合併候選的GPM分區模式。首先，合併候選重新排序方法被應用於合併不同分區模式的候選列表（表示為mrg_cands）。通過根據相應的 RDO 成本對不同分區模式的 mrg_cands 進行升序排序，確定最佳合併候選對（成本最低），而相應的分區模式（產生最佳合併候選對的分區模式）被推斷為最佳分區模式。因此，不是發送 GPM 分區模式索引和兩個合併索引（作為 GPM 預測子），而是僅將一個分區索引發送到解碼器以指示選擇了哪個 GPM 分區模式。在解碼器端，對（所選 GPM 分區模式的）所有GPM 合併候選執行相應的合併候選重新排序方法，以確定最佳合併候選對以及所選分區模式。

在一些實施例中，對於GPM合併候選重新排序，分別為每個合併候選對或（每個分區的）每個合併候選計算模板匹配成本或邊界匹配成本以確定每個GPM 分區模式的最佳合併候選對（表示為 mrg_cands）。通過對mrg_cands以RDO成本進行升序排序，確定兩個GPM分區的最佳合併候選對和分區模式。分區模式索引被發送給解碼器，以通知選擇了哪個 GPM 分區模式。在解碼器側，分別為每個合併候選對或為所選分區模式的每個合併候選計算模板匹配成本或邊界匹配成本。確定具有最小模板匹配成本的最佳合併候選對。在一些實施例中，當發送分區模式組時，解碼器僅針對發送的模式組的分區模式計算模板或邊界匹配成本。

第11圖概念性地說明了識別導致至少兩個GPM分區的最佳合併候選的GPM分區模式。該圖說明了 GPM 當前塊的各種分區模式及其對應的合併候選。每種分區模式將當前塊劃分為partition-L（左）和partition-R（右）。 partition-L的合併候選（合併候選列表）被標記為合併候選L0、L1等。 partition-R的合併候選被標記為合併候選R0、R1等。對於每一個分區模式，（模板匹配或邊界匹配），計算partition-L和partition-R的合併候選的成本。對於每個分區模式，partition-L的最佳合併候選和partition-R的最佳合併候選是基於成本識別的。例如，對於模板匹配，合併對的成本是通過混合partition-L 合併候選模板和partition-R 候選模板來計算的。然後將混合的模板與當前塊（頂部和左側相鄰）的模板進行比較。根據計算的成本確定每個分區模式的最佳合併候選對。在所示示例中，分區模式 N-1 的最佳合併對是 (L3, R1)，成本為 150，分區模式 N 的最佳合併對是 (L1, R4)，成本為 190。

然後根據成本比較不同分區模式的最佳合併候選對。在 64 種 GPM 分區模式中，具有比所有其他分區模式的最佳合併候選對更好的最佳合併候選對的分區模式被識別為最佳分區模式並被發送給解碼器。在此示例中，分區模式 N+1 被識別為最佳分區模式，因為其最佳合併候選對 (L4, R5) 在所有分區模式中成本最低 (110)。分區模式N+1的索引可以發送給解碼器以選擇分區模式。

在解碼器側，視訊解碼器計算所選分區模式（模式N+1）的所有合併候選對的模板匹配成本或邊界匹配成本。在一些實施例中，所選分區模式的最低成本合併對由解碼器隱含地選擇。在一些實施例中，合併候選根據計算出的成本針對選擇的分區模式進行排序或重新排序，並且可以發送具有減少的位元數的合併候選選擇索引以基於重新排序來選擇合併候選對。

上述提出的方法可以在編碼器和解碼器中實現。例如，任何提出的方法都可以在編碼器的GPM編解碼模塊、解碼器的GPM候选和/或分區模式推導模塊中實現。或者，所提出的任何方法都可以實現為耦合到編碼器的 GPM 編解碼模塊和解碼器的 GPM 候选和/或分區模式推導模塊的電路。

三、示例視訊編碼器

第12圖示出可使用GPM來編碼像素塊的示例視訊編碼器1200。如圖所示，視訊編碼器1200從視訊源1205接收輸入視訊訊號以及將訊號編碼為位元流1295。視訊編碼器1200具有用於對來自視訊源1205的訊號進行編碼的若干組件或模組，至少包括選自以下的一些組件：變換模組1210、量化模組1211、逆量化模組1214、逆變換模組1215、圖片內估計模組1220、幀內預測模組1225、運動補償模組1230、運動估計模組1235、環路濾波器1245、重建圖片緩衝器1250、MV緩衝器1265、MV預測模組1275和熵編碼器1290。運動補償模組1230和運動估計模組1235是幀間預測模組1240的一部分。

在一些實施例中，模組1210-1290是由計算設備或電子裝置的一個或多個處理單元（例如，處理器）執行的軟體指令模組。在一些實施例中，模組1210-1290是由電子裝置的一個或多個積體電路（integrated circuit，簡稱IC）實現的硬體電路模組。儘管模組1210-1290被示為單獨的模組，但一些模組可以組合成單個模組。

視訊源1205提供原始視訊訊號，其呈現每個視訊幀的像素資料而不進行壓縮。減法器1208計算視訊源1205的原始視訊像素資料與來自運動補償模組1230或幀內預測模組1225的預測像素資料1213之間的差值。變換模組1210轉換差值（或殘差像素資料或殘差訊號1208）轉換成變換係數（例如，藉由執行離散余弦變換或DCT）。量化模組1211將變換係數量化成量化資料（或量化係數）1212，其由熵編碼器1290編碼成位元流1295。

逆量化模組1214對量化資料（或量化係數）1212進行去量化以獲得變換係數，以及逆變換模組1215對變換係數執行逆變換以產生重建殘差1219。重建殘差1219與預測像素資料1213相加一起產生重建的像素資料1217。在一些實施例中，重建的像素資料1217被臨時存儲在線緩衝器（line buffer未示出）中用於圖片內預測和空間MV預測。重建像素由環路濾波器1245濾波並被存儲在重建圖片緩衝器1250中。在一些實施例中，重建圖片緩衝器1250是視訊編碼器1200外部的記憶體。在一些實施例中，重建圖片緩衝器1250是視訊編碼器1200內部的記憶體.

圖片內估計模組1220基於重建的像素資料1217執行幀內預測以產生幀內預測資料。幀內預測資料被提供至熵編碼器1290以被編碼成位元流1295。幀內預測資料還被幀內預測模組1225用來產生預測像素資料1213。

運動估計模組1235藉由產生MV以參考存儲在重建圖片緩衝器1250中的先前解碼幀的像素資料來執行幀間預測。這些MV被提供至運動補償模組1230以產生預測像素資料。

視訊編碼器1200不是對位元流中的完整實際MV進行編碼，而是使用MV預測來生成預測的MV，以及用於運動補償的MV與預測的MV之間的差值被編碼為殘差運動資料並存儲在位元流1295。

基於為編碼先前視訊幀而生成的參考MV，即用於執行運動補償的運動補償MV，MV預測模組1275生成預測的MV。MV預測模組1275從MV緩衝器1265中獲取來自先前視訊幀的參考MV。視訊編碼器1200將對當前視訊幀生成的MV存儲在MV緩衝器1265中作為用於生成預測MV的參考MV。

MV預測模組1275使用參考MV來創建預測的MV。預測的MV可以藉由空間MV預測或時間MV預測來計算。預測的MV和當前幀的運動補償MV（MC MV）之間的差值（殘差運動資料）由熵編碼器1290編碼到位元流1295中。

熵編碼器1290藉由使用諸如上下文適應性二進位算術編解碼（context-adaptive binary arithmetic coding，簡稱CABAC）或霍夫曼編碼的熵編解碼技術將各種參數和資料編碼到位元流1295中。熵編碼器1290將各種報頭元素、標誌連同量化的變換係數1212和作為語法元素的殘差運動資料編碼到位元流1295中。位元流1295繼而被存儲在存放裝置中或藉由比如網路等通訊媒介傳輸到解碼器。

環路濾波器1245對重建的像素資料1217執行濾波或平滑操作以減少編解碼的偽影，特別是在像素塊的邊界處。在一些實施例中，所執行的濾波操作包括樣本適應性偏移（sample adaptive offset，簡稱SAO）。在一些實施例中，濾波操作包括適應性環路濾波器（adaptive loop filter，簡稱ALF）。

第13圖示出基於TM或BM成本實施GPM預測子（分區模式+合併候選對）信令的視訊編碼器1200的部分。具體地，該圖示出視訊編碼器1200的幀間預測模組1240的組件。候選分區模組1310向幀間預測模組1240提供候選分區模式指示符。這些可能的候選分區模式可以對應於各種角度-距離對，各種角度-距離對定義根據GPM將當前塊分成至少兩個（或更多）分區的線。MV候選識別模組1315識別可用於GPM分區的MV候選（作為合併候選）。MV候選識別模組1315可以僅識別單向預測候選或重新使用來自MV緩衝器1265的合併候選。

對於每個合併候選和/或對於每個候選分區模式，模板或邊界識別模組1320從重建圖片緩衝器1250中獲取相鄰樣本作為L形模板，或生成沿當前塊邊界的預測的樣本。對於將當前塊劃分為至少兩個分區的候選分區模式，模板識別模組1320可以獲取當前塊的相鄰像素作為兩個當前模板，以及使用兩個運動向量來獲取兩個L形像素集合作為當前塊的至少兩個分區的兩個參考模板。

模板識別模組1320將當前指示的編解碼模式的參考模板、當前模板和/或邊界預測樣本提供至成本計算器1330，成本計算器1330執行模板或邊界匹配以產生用於指示的候選分區模式的成本。成本計算器1330可以根據GPM模式組合參考模板（具有邊緣混合）。成本計算器1330還可計算不同候選分區模式的不同合併候選對的模板或邊界匹配成本。成本計算器1340還可以基於計算的成本將重新排序的索引分配給分區模式組、組內的分區模式，和/或分區模式形成的分區的合併候選。基於TM或BM成本的索引重新排序在上文部分一中被描述。

計算的各種候選的成本被提供至候選選擇模組1340，其可以使用計算的TM或BM成本來選擇用於編碼當前塊的最低成本候選分區模式和/或合併候選對。選擇的候選分區模式和/或合併候選對被指示給運動補償模組1230以完成用於編碼當前塊的預測。選擇的分區模式和/或合併候選對也被提供給熵編碼器1290以在位元流1295中發送。選擇的分區模式和/或合併候選對可以藉由使用分區模式和/或合併候選對的相應重新排序的索引來發送，以減少傳輸的位元數。在一些實施例中，候選分區模式被分類成組，並且指示包括所選擇的候選分區模式的組的索引被提供給熵編碼器1290以在位元流中發送。在一些實施例中，分區模式和/或合併候選對可以基於在解碼器處計算的成本被隱式地發送（即，不在位元流中）。

第14圖概念性地示出基於用於發送對GPM分區模式的選擇的處理1400。在一些實施例中，計算設備的一個或多個處理單元（例如，處理器）被用來實現編碼器1200，藉由執行存儲在電腦可讀介質中的指令來執行處理1400。在一些實施例中，實現編碼器1200的電子裝置執行處理1400。

編碼器（在步驟1410）接收要被編碼為當前圖片中的當前像素塊的資料。編碼器（在步驟1420）將多個分區模式分類為多組分區模式。每個分區模式可以是將當前塊分割成至少兩個分區的GPM分區模式。

編碼器（在步驟1430）發送從多組分區模式中對一組分區模式的選擇。該選擇基於編碼器針對多個分區模式中的每個分區模式計算用於編碼當前塊的成本，基於計算的成本從多個分區模式中識別最佳分區模式，並選擇包括確定的最佳分區模式的一組分區模式。編碼器可以通過為多組分區模式中的每組識別最低成本分區模式來識別最佳分區模式。針對分區模式對當前塊進行編碼的成本可以是使用分區模式對當前塊進行編碼的模板匹配成本或邊界匹配成本。

編碼器（在步驟1440）從選定組分區模式中選擇分區模式。編碼器可以通過為所選組分區模式中的每個分區模式計算對當前塊進行編碼的成本來從所選組中選擇分區模式，然後從所選組分區模式中選擇成本最低的分區模式。編碼器還可以根據計算出的成本對所選組中的分區模式進行重新排序，並基於重新排序發送對分區模式的選擇。

編碼器（在步驟1450）根據所選擇的分區模式將當前塊分割成至少第一和第二分區。

編碼器（在步驟1455）為第一和第二分區選擇一組至少兩個合併候選。合併候選對用於生成第一分區的第一預測和第二分區的第二預測。

在一些實施例中，編碼器通過計算由所選分區模式形成的當前塊的第一分區和第二分區中的每一個的每個合併候選的成本並基於計算的成本選擇集合來為第一和第二分區選擇一個至少兩個合併候選的集合。至少兩個合併候選的集合的成本可以是使用至少兩個合併候選的集合和分區模式對當前塊進行編碼的模板匹配成本或邊界匹配成本。

在一些實施例中，對於多個分區模式中的每個分區模式，編碼器計算至少兩個分區的每個至少兩個合併候選的集合的成本，並且基於該至少兩個合併候選的集合的計算的成本識別一至少兩個合併候選的最佳集合。所選分區模式在不同分區模式的最佳合併候選對中具有成本最低的合併對。

編碼器（在步驟1460）通過組合第一分區的第一預測和第二分區的第二預測來編碼當前塊。第一和第二預測可以基於所選擇的一至少兩個合併候選集合。第一和第二預測用於產生預測殘差和重建當前塊。

四、示例視訊解碼器

在一些實施例中，編碼器可以發送（或生成）位元流中的一個或多個語法元素，使得解碼器可以從位元流中解析該一個或多個語法元素。

第15圖示出可實施GPM以解碼或重建像素塊的示例視訊解碼器1500。如圖所示，視訊解碼器1500是圖像解碼或視訊解碼電路，該圖像解碼或視訊解碼電路接收位元流1595以及將位元流的內容解碼為視訊幀的像素資料以供顯示。視訊解碼器1500具有用於解碼位元流1595的若干組件或模組，包括選自以下的組件：逆量化模組1511、逆變換模組1510、幀內預測模組1525、運動補償模組1530、環路濾波器的1545、解碼圖片緩衝器1550、MV緩衝器1565、MV預測模組1575和解析器1590。運動補償模組1530是幀間預測模組1540的一部分。

在一些實施例中，模組1510-1590是由計算設備的一個或多個處理單元（例如，處理器）執行的軟體指令模組。在一些實施例中，模組1510-1590是由電子設備的一個或多個IC實現的硬體電路模組。儘管模組1510-1590被示為單獨的模組，但一些模組可以組合成單個模組。

根據由視訊編解碼或圖像編解碼標準定義的語法，解析器1590 （或熵解碼器）接收位元流1595以及執行初始解析。解析的語法元素包括各種頭部元素、標誌以及量化資料（或量化係數）1512。解析器1590藉由使用熵編解碼技術（例如上下文適應性二進位算術編解碼（context-adaptive binary arithmetic coding，簡稱CABAC）或霍夫曼編碼（Huffman encoding）。

逆量化模組1511對量化資料（或量化係數）1512進行去量化以獲得變換係數，以及逆變換模組1510對變換係數1516執行逆變換以產生重建的殘差訊號1519。重建的殘差訊號1519與來自幀內預測模組1525或運動補償模組1530的預測像素資料1513相加以產生解碼的像素資料1517。解碼像素資料由環路濾波器1545濾波並存儲在解碼圖片緩衝器1550中。在一些實施例中，解碼圖片緩衝器1550是視訊解碼器1500外部的記憶體。在一些實施例中，解碼圖片緩衝器1550是視訊解碼器1500內部的記憶體。

幀內預測模組1525從位元流1595接收幀內預測資料，以及據此，從存儲在解碼圖片緩衝器1550中的解碼的像素資料1517產生預測像素資料1513。在一些實施例中，解碼的像素資料1517也被存儲在線緩衝器（未示出）中，用於圖片內預測和空間MV預測。

在一些實施例中，解碼圖片緩衝器1550的內容用於顯示。顯示裝置1555或者獲取解碼圖片緩衝器1550的內容用於直接顯示，或者獲取解碼圖片緩衝器的內容到顯示緩衝器。在一些實施例中，顯示裝置藉由像素傳輸從解碼圖片緩衝器1550接收像素值。

運動補償模組1530根據運動補償MV（MC MV）從解碼圖片緩衝器1550中存儲的解碼的像素資料1517產生預測像素資料1513。這些運動補償MV藉由將從位元流1595接收的殘差運動資料與從MV預測模組1575接收的預測MV相加來解碼。

基於為解碼先前視訊幀而生成的參考MV（例如，用於執行運動補償的運動補償MV），MV預測模組1575生成預測的MV。MV預測模組1575從MV緩衝器1565中獲取先前視訊幀的參考MV。視訊解碼器1500將為解碼當前視訊幀而生成的運動補償MV存儲在MV緩衝器1565中作為用於產生預測MV的參考MV。

環路濾波器1545對解碼的像素資料1517執行濾波或平滑操作以減少編碼的偽影，特別是在像素塊的邊界處。在一些實施例中，所執行的濾波操作包括樣本適應性偏移（sample adaptive offset，簡稱SAO）。在一些實施例中，濾波操作包括適應性濾波器（adaptive loop filter，簡稱ALF）。

第16圖示出基於TM或BM成本實現GPM預測子發送的視訊解碼器1500的部分。具體地，該圖示出視訊解碼器1500的幀間預測模組1540的組件。候選分區模組1610向幀間預測模組1540提供候選分區模式指示符。這些可能的候選分區模式可以對應於各種角度-距離對，各種角度-距離對定義根據GPM將當前塊分成指示兩個（或更多）分區的線。MV候選識別模組1615識別可用於GPM分區的MV候選（作為合併候選）。MV候選識別模組1615可以僅識別單向預測候選或重新使用來自MV緩衝器1565的合併預測候選。

對於每個合併候選和/或對於每個候選分區模式，模板或邊界識別模組1620從重建圖片緩衝器1550中獲取相鄰樣本作為L形模板，或生成沿當前塊的邊界的預測的樣本。對於將塊劃分為至少兩個分區的候選分區模式，模板識別模組1620可以獲取當前塊的相鄰像素作為兩個當前模板，以及使用兩個運動向量來獲取兩個L形像素集合作為當前塊的至少兩個分區的兩個參考模板。

模板識別模組1620將當前指示的編解碼模式的參考模板、當前模板和/或邊界預測樣本提供給成本計算器1630，成本計算器1630執行模板或邊界匹配以產生指示的候選分區模式的成本。成本計算器1630可以根據GPM模式組合參考模板（具有邊緣混合）。成本計算器1630還可計算不同候選分區模式的不同合併候選對的模板或邊界匹配成本。成本計算器1640還可以基於計算的成本將重新排序的索引分配給分區模式組、組內的分區模式，和/或分區模式形成的分區的合併候選。基於TM或BM成本的索引的重新排序在上文部分一中被描述。

將計算出的各個候選的成本提供給候選選擇模塊1640，候選選擇模塊1640可以使用計算出的TM或BM成本來選擇最低成本的候選分區模式或合併候選對來解碼當前塊。所選的候選分區模式或合併候選對可以被指示給運動補償模塊1530以完成用於當前塊解碼的預測。候選選擇模塊1640還可以從熵解碼器1590接收對分區模式和/或合併候選對的選擇。對於分區模式和/或合併候選對的選擇的發送可以基於分區模式和/或合併候選對重新排序的索引以減少傳輸的位元數。在一些實施例中，候選分區模式被分類成組，並且候選選擇模塊1640可以從熵解碼器1590接收指示包括所選擇的候選分區模式的組的索引。在一些實施例中，分區模式和/或合併候選對可以在解碼器處基於計算的成本隱式地發送（即，不在位元流中）。

第17圖概念性地圖示了用於接收GPM分區模式的選擇的過程1700。在一些實施例中，實現解碼器1500的計算設備的一個或多個處理單元(例如，處理器)通過執行存儲在計算機可讀介質中的指令來執行過程1700。在一些實施例中，實現解碼器1500的電子裝置執行過程1700。

解碼器（在步驟1710）接收要被解碼為當前圖片中的當前像素塊的資料。解碼器（在步驟1720）將多個分區模式分類為多組分區模式。每個分區模式可以是將當前塊分割成至少兩個分區的GPM分區模式。

解碼器（在步驟1730）接收從多組分區模式中選擇的一組分區模式。該選擇基於解碼器針對多個分區模式中的每個分區模式計算用於解碼當前塊的成本，基於計算的成本從多個分區模式中識別最佳分區模式，以及選擇包括確定的最佳分區模式的一組分區模式。解碼器可以通過為多組分區模式中的每組識別最低成本分區模式來識別最佳分區模式。針對分區模式解碼當前塊的成本可以是使用分區模式解碼當前塊的模板匹配成本或邊界匹配成本。

解碼器（在步驟1740）從選定組分區模式中選擇分區模式。解碼器可以通過為所選組分區模式中的每個分區模式計算用於解碼當前塊的成本來從所選組中選擇分區模式，然後從所選組分區模式中選擇成本最低的分區模式。解碼器還可以根據計算出的成本對所選組中的分區模式進行重新排序，並接收基於重新排序的分區模式的選擇。

解碼器（在步驟1750）根據選擇的分區模式將當前塊分割為至少第一和第二分區。

解碼器（在步驟1755）為第一和第二分區選擇一組至少兩個合併候選。合併候選對用於生成第一分區的第一預測和第二分區的第二預測。

在一些實施例中，解碼器通過計算由所選分區模式形成的當前塊的第一分區和第二分區中的每一個的每個合併候選的成本來選擇一組至少兩個合併候選，對於第一分區和第二分區的該組至少兩個合併候選的選擇基於計算的成本。該組至少兩個合併候選的成本可以是使用該組至少兩個合併候選和分區模式對當前塊進行編解碼的模板匹配成本或邊界匹配成本。

在一些實施例中，對於多個分區模式中的每個分區模式，解碼器為至少兩個分區的每組至少兩個合併候選計算成本，並且基於該組至少兩個合併候選的計算成本識別包括至少兩個合併候選的最佳組合。所選分區模式在不同分區模式的最佳合併候選對中具有成本最低的合併對。

解碼器（在步驟1760）通過組合第一分區的第一預測和第二分區的第二預測來解碼當前塊。第一和第二預測可以基於所選擇的該組至少兩個合併候選。解碼器通過使用第一和第二預測以及根據選擇的分區模式重建當前塊。 五、示例電子系統

許多上述特徵和應用被實現為軟體處理，這些軟體處理被指定為記錄在電腦可讀存儲介質（也稱為電腦可讀介質）上的一組指令。當這些指令由一個或多個計算或處理單元（例如，一個或多個處理器、處理器內核或其他處理單元）執行時，它們使處理單元執行指令中指示的動作。電腦可讀介質的示例包括但不限於唯讀光碟驅動器（compact disc read-only memory，簡稱CD-ROM）、快閃記憶體驅動器、隨機存取記憶體（random-access memroy，簡稱RAM）晶片、硬碟驅動器、可擦除可程式設計唯讀記憶體（erasable programmble read-only memory，簡稱EPROM）、電可擦除可程式設計唯讀記憶體（electrically erasable proagrammble read-only memory，簡稱EEPROM）等。電腦可讀介質不包括藉由無線或有線連接傳遞的載波和電子訊號。

在本說明書中，術語“軟體”意在包括駐留在唯讀記憶體中的韌體或存儲在磁記憶體中的應用程式，其可以讀入記憶體以供處理器處理。此外，在一些實施例中，多個軟體發明可以實現為更大程式的子部分，同時保留不同的軟體發明。在一些實施例中，多個軟體發明也可以實現為單獨的程式。最後，共同實現此處描述的軟體發明的單獨程式的任一組合都在本公開的範圍內。在一些實施例中，軟體程式，在被安裝以在一個或多個電子系統上運行時，定義一個或多個特定機器實施方式，該實施方式處理和執行軟體程式的操作。

第18圖概念性地示出了實現本公開的一些實施例的電子系統1800。電子系統1800可以是電腦（例如，臺式電腦、個人電腦、平板電腦等）、電話、PDA或任一其他類型的電子設備。這種電子系統包括各種類型的電腦可讀介質和用於各種其他類型的電腦可讀介質的介面。電子系統1800包括匯流排1805、處理單元1810、圖形處理單元（graphics-processing unit，簡稱GPU）1815、系統記憶體1820、網路1825、唯讀記憶體1830、永久存儲裝置1835、輸入設備1840 , 和輸出設備1845。

匯流排1805共同表示與電子系統1800通訊連接的眾多內部設備的所有系統、週邊設備和晶片組匯流排。例如，匯流排1805將處理單元1810與GPU 1815，唯讀記憶體1830、系統記憶體1820和永久存儲裝置1835通訊地連接。

處理單元1810從這些各種記憶體單元中獲取要執行的指令和要處理的資料，以便執行本公開的處理。在不同的實施例中，處理單元可以是單個處理器或多核處理器。一些指令被傳遞到GPU 1815並由其執行。GPU 1815可以卸載各種計算或補充由處理單元1810提供的影像處理。

唯讀記憶體（read-only-memory，簡稱ROM）1830存儲由處理單元1810和電子系統的其他模組使用的靜態資料和指令。另一方面，永久存儲設備1835是讀寫存放設備。該設備是即使在電子系統1800關閉時也存儲指令和資料的非易失性存儲單元。本公開的一些實施例使用大容量記憶裝置（例如磁片或光碟及其對應的磁碟機）作為永久存儲裝置1835。

其他實施例使用卸除式存放裝置設備（例如軟碟、快閃記憶體設備等，及其對應的磁碟機）作為永久存儲裝置。與永久存儲裝置1835一樣，系統記憶體1820是讀寫記憶體設備。然而，與永久存儲裝置1835不同，系統記憶體1820是易失性（volatile）讀寫記憶體，例如隨機存取記憶體。系統記憶體1820存儲處理器在運行時使用的一些指令和資料。在一些實施例中，根據本公開的處理被存儲在系統記憶體1820、永久存儲裝置1835和/或唯讀記憶體1830中。例如，根據本公開的一些實施例，各種記憶體單元包括用於根據處理多媒體剪輯的指令。從這些各種記憶體單元中，處理單元1810獲取要執行的指令和要處理的資料，以便執行一些實施例的處理。

匯流排1805還連接到輸入設備1840和輸出設備1845。輸入設備1840使使用者能夠向電子系統傳達資訊和選擇命令。輸入設備1840包括字母數位鍵盤和定點設備（也被稱為“游標控制設備”）、照相機（例如，網路攝像頭）、麥克風或用於接收語音命令的類似設備等。輸出設備1845顯示由電子系統生成的圖像或者輸出資料。輸出設備1845包括印表機和顯示裝置，例如陰極射線管（cathode ray tubes，簡稱CRT）或液晶顯示器（liquid crystal display，簡稱LCD），以及揚聲器或類似的音訊輸出設備。一些實施例包括用作輸入和輸出設備的設備，例如觸控式螢幕。

最後，如第18圖所示，匯流排1805還藉由網路介面卡（未示出）將電子系統1800耦合到網路1825。以這種方式，電腦可以是電腦網路（例如局域網（“LAN”）、廣域網路（“WAN”）或內聯網的一部分，或者是多種網路的一個網路，例如互聯網。電子系統1800的任一或所有組件可以與本公開結合使用。

一些實施例包括電子組件，例如微處理器、存儲裝置和記憶體，其將電腦程式指令存儲在機器可讀或電腦可讀介質（或者被稱為電腦可讀存儲介質、機器可讀介質或機器可讀存儲介質）中。這種電腦可讀介質的一些示例包括RAM、ROM、唯讀光碟（read-only compact discs，簡稱CD-ROM）、可記錄光碟（recordable compact discs，簡稱CD-R）、可重寫光碟（rewritable compact discs，簡稱CD-RW）、唯讀數位多功能光碟（read-only digital versatile discs）（例如, DVD-ROM, 雙層DVD-ROM）, 各種可燒錄/可重寫DVD （例如, DVD-RAM, DVD-RW, DVD+RW等）, 快閃記憶體（例如, SD卡, 迷你SD卡、微型SD卡等）、磁性和/或固態硬碟驅動器、唯讀和可記錄Blu-Ray®光碟、超密度光碟、任一其他光學或磁性介質以及軟碟。電腦可讀介質可以存儲可由至少一個處理單元執行以及包括用於執行各種操作的指令集合的電腦程式。電腦程式或電腦代碼的示例包括諸如由編譯器產生的機器代碼，以及包括由電腦、電子組件或使用注釋器（interpreter）的微處理器執行的高級代碼的文檔。

雖然上述討論主要涉及執行軟體的微處理器或多核處理器，但許多上述特徵和應用由一個或多個積體電路執行，例如專用積體電路（application specific integrated circuit，簡稱ASIC）或現場可程式設計閘陣列（field programmable gate array，簡稱FPGA）。在一些實施例中，這樣的積體電路執行存儲在電路本身上的指令。此外，一些實施例執行存儲在可程式設計邏輯器件（programmable logic device，簡稱PLD）、ROM或RAM器件中的軟體。

如在本說明書和本申請的任一申請專利範圍中使用的，術語“電腦”、“伺服器”、“處理器”和“記憶體”均指電子或其他技術設備。這些術語不包括人或人群。出於本說明書的目的，術語顯示或顯示是指在電子設備上顯示。如在本說明書和本申請的任何申請專利範圍中所使用的，術語“電腦可讀介質”、“電腦可讀介質”和“機器可讀介質”完全限於以電腦可讀形式存儲資訊的有形物理物件。這些術語不包括任何無線訊號、有線下載訊號和任何其他短暫訊號。

雖然已經參考許多具體細節描述了本公開，但是本領域之通常知識者將認識到，本公開可以以其他特定形式實施而不背離本公開的精神。此外，許多圖（包括第14圖和第17圖）概念性地說明了處理。這些處理的具體操作可能不會按照所示和描述的確切循序執行。具體操作可以不是在一個連續的一系列操作中執行，在不同的實施例中可以執行不同的具體操作。此外，該處理可以使用幾個子處理來實現，或者作為更大的宏處理的一部分來實現。因此，本領域之通常知識者將理解本公開不受前述說明性細節的限制，而是由所附申請專利範圍限定。 補充說明

本文所描述的主題有時表示不同的組件，其包含在或者連接到其他不同的組件。可以理解的是，所描述的結構僅是示例，實際上可以由許多其他結構來實施，以實現相同的功能，從概念上講，任何實現相同功能的組件的排列實際上是“相關聯的”，以便實現所需功能。因此，不論結構或中間部件，為實現特定的功能而組合的任何兩個組件被視爲“相互關聯”，以實現所需的功能。同樣，任何兩個相關聯的組件被看作是相互“可操作連接”或“可操作耦接”，以實現特定功能。能相互關聯的任何兩個組件也被視爲相互“可操作地耦接”，以實現特定功能。能相互關聯的任何兩個組件也被視爲相互“可操作地耦合”以實現特定功能。可操作連接的具體例子包括但不限於物理可配對和/或物理上相互作用的組件，和/或無線可交互和/或無線上相互作用的組件，和/或邏輯上相互作用和/或邏輯上可交互的組件。

此外，關於基本上任何複數和/或單數術語的使用，本領域之通常知識者可以根據上下文和/或應用從複數變換為單數和/或從單數到複數。為清楚起見，本發明明確闡述了不同的單數/複數排列。

此外，本領域之通常知識者可以理解，通常，本發明所使用的術語特別是申請專利範圍中的，如申請專利範圍的主題，通常用作“開放”術語，例如，“包括”應解釋為“包括但不限於”，“有”應理解為“至少有”“包括”應解釋為“包括但不限於”等。本領域之通常知識者可以進一步理解，若計畫介紹特定數量的申請專利範圍内容，將在申請專利範圍内明確表示，並且，在沒有這類内容時將不顯示。例如，為幫助理解，下面申請專利範圍可能包含短語“至少一個”和“一個或複數個”，以介紹申請專利範圍的内容。然而，這些短語的使用不應理解為暗示使用不定冠詞“一個”或“一種”介紹申請專利範圍内容，而限制了任何特定神專利範圍。甚至當相同的申請專利範圍包括介紹性短語“一個或複數個”或“至少有一個”，不定冠詞，例如“一個”或“一種”，則應被解釋為表示至少一個或者更多，對於用於介紹申請專利範圍的明確描述的使用而言，同樣成立。此外，即使明確引用特定數量的介紹性内容，本領域之通常知識者可以認識到，這樣的内容應被解釋為表示所引用的數量，例如，沒有其他修改的“兩個引用”，意味著至少兩個引用，或兩個或兩個以上的引用。此外，在使用類似於“A、B和C中的至少一個”的表述的情況下，通常如此表述是為了本領域之通常知識者可以理解該表述，例如，“系統包括A、B和C中的至少一個”將包括但不限於單獨具有A的系統，單獨具有B的系統，單獨具有C的系統，具有A和B的系統，具有A和C的系統，具有B和C的系統，和/或具有A、B和C的系統等。本領域之通常知識者進一步可理解，無論在説明書中，申請專利範圍中或者附圖中，由兩個或兩個以上的替代術語所表現的任何分隔的單詞和/或短語應理解為，包括這些術語中的一個，其中一個，或者這兩個術語的可能性。例如，“A或B”應理解為，“A”，或者“B”，或者“A和B”的可能性。

從前述可知，出於説明目的，本發明已描述了各種實施方案，並且在不偏離本發明的範圍和精神的情況下，可以進行各種變形。因此，此處所公開的各種實施方式不用於限制，真實的範圍和申請由申請專利範圍表示。

300:合併候選列表 600:當前塊 800:GPM候選列表 900:CU 1200:編碼器 1205:視訊源 1208:減法器 1210:變換模組 1211:量化模組 1212:變換係數 1213:預測像素資料 1214:逆量化模組 1215:逆變換模組 1216:變換係數 1217:重建的像素資料 1219:重建殘差 1220:幀內估計模組 1225:幀內預測模組 1230:運動補償模組 1235:運動估計模組 1240:幀間預測模組 1245:環路濾波器 1250:重建圖片緩衝器 1265:MV緩衝器 1275:MV預測模組 1290:熵編碼器 1295:位元流 1310:候選分區模組 1315:MV候選識別模組 1320:模板識別模組 1330:成本計算器 1340:候選選擇模組 1400:處理 1410~1470:步驟 1500:視訊解碼器 1510:逆變換模組 1511:逆量化模組 1512:量化資料 1513:預測像素資料 1516:變換係數 1517:解碼的像素資料 1519:重建的殘差訊號 1525:幀內預測模組 1530:運動補償模組 1540:幀間預測模組 1545:環路濾波器 1550:解碼圖片緩衝器 1555:顯示裝置 1565:MV緩衝器 1575:MV預測模組 1590:熵解碼器 1595:位元流 1610:候選分區模組 1615:MV候選識別模組 1620:模板識別模組 1630:成本計算器 1640:候選選擇模組 1700:處理 1710~1760:步驟 1800:電子系統 1805:匯流排 1810:處理單元 1815:GPU 1820:系統記憶體 1825:網路 1830:唯讀記憶體 1835:永久存儲裝置 1840:輸入設備 1845:輸出設備

附圖被包括以提供對本公開的進一步理解並且被併入並構成本公開的一部分。附圖說明了本公開的實施方式，並且與描述一起用於解釋本公開的原理。值得注意的是，附圖不一定是按比例繪製的，因為在實際實施中特定組件可能被顯示為與尺寸不成比例，以便清楚地說明本公開的概念。第1圖示出合併模式的運動候選。第2圖概念性地示出用於合併候選的演算法框架。第3圖概念性地示出示例候選重新排序。第4-5圖概念性地示出用於計算所選候選的猜測成本的L形匹配方法。第6圖圖示了用於確定邊界匹配成本的相鄰樣本和重建的樣本。第7圖示出藉由幾何分區模式（geometric partitioning mode，簡稱GPM）對CU的分區。第8圖示出GPM分區的示例單向預測候選列表和單向預測MV的選擇。第9圖示出用於編解碼單元的GPM的示例分區邊緣混合過程。第10圖概念性地說明將GPM分區模式分類為多組分區模式並識別最佳組分區模式。第11圖概念性地說明了識別導致至少兩個GPM分區的最佳合併候選的GPM分區模式。第12圖說明可使用GPM來編碼像素塊的示例視訊編碼器。第13圖示出基於TM或BM成本實現GPM預測子發送的視訊編碼器的部分。第14圖概念性地圖示了用於發送GPM分區模式的選擇的過程。第15圖說明可實施GPM以解碼及重建像素塊的示例視訊解碼器。第16圖示出基於成本實現GPM預測子信令的視訊解碼器的部分。第17圖概念性地說明用於接收GPM分區模式的選擇的過程。第18圖概念性地示出實現本公開的一些實施例的電子系統。

1700:處理

1710~1760:步驟

Claims

一種視訊編解碼方法，包括：接收待編碼或解碼為視訊的當前圖片的當前塊的像素塊的資料；發送或接收從多個分區模式中對一組分區模式的選擇，其中該多個分區模式被分類為多組分區模式，每個分區模式將該當前塊分割成至少兩個分區；從選擇的該組分區模式中選擇一種分區模式；根據選擇的分區模式將該當前塊分割成至少第一分區和第二分區；以及通過組合該第一分區的第一預測和該第二分區的第二預測來編碼或解碼該當前塊。
如請求項1所述之視訊編解碼方法，還包括：計算針對該多個分區模式中的每個分區模式對該當前塊進行編碼的成本；基於計算的成本從該多個分區模式中識別最佳分區模式；以及選擇包括識別出的該最佳分區模式的一組分區模式。
如請求項2所述之視訊編解碼方法，其中，所述針對分區模式對該當前塊進行編碼的該成本是使用該分區模式對該當前塊進行編碼的模板匹配成本或邊界匹配成本。
如請求項2所述之視訊編解碼方法，其中識別該最佳分區模式包括為該多組分區模式中的每組識別最低成本分區模式。
如請求項1所述之視訊編解碼方法，還包括為所選擇的該組分區模式中的每個分區模式計算用於對該當前塊進行編碼的成本。
如請求項5所述之視訊編解碼方法，其中，從所選擇的該組分區模式中選擇分區模式包括從所選擇的該組分區模式中選擇成本最低的分區模式。
如請求項5所述之視訊編解碼方法，其中，從所選擇的該組分區模式中選擇分區模式包括根據所計算的成本對所選擇的組中的分區模式進行重新排序，以及發送或者接收基於該重新排序的分區模式的選擇。
如請求項1所述之視訊編解碼方法，還包括：計算由所選擇的該分區模式形成的該當前塊的第一和第二分區中的每一個的每個合併候選的成本；基於所計算的成本，為由所選擇的該分區模式形成的第一和第二分區選擇一組至少兩個合併候選；其中該第一預測和該第二預測基於所選擇的該組至少兩個合併候選。
如請求項8所述之視訊編解碼方法，還包括：對於該多個分區模式中的每個分區模式：計算由該分區模式形成的該至少兩個分區的每組至少兩個合併候選的的成本；以及基於該組至少兩個合併候選的計算成本，為該至少兩個分區識別包括至少兩個合併候選的最佳組；其中所選擇的該分區模式是基於該多個分區模式的包括至少兩個合併候選的最佳組的計算成本來選擇的。
如請求項8所述之視訊編解碼方法，其中，該分區模式形成的該至少兩個分區的一組至少兩個合併候選的成本是使用該組至少兩個合併候選和該分區模式來編碼該當前塊的模板匹配成本或邊界匹配成本。
一種視訊編解碼方法，包括：接收待編碼或解碼為視訊的當前圖片的當前塊的像素塊資料；發送或接收從多個分區模式中選擇的分區模式，每個分區模式將該當前塊分割成至少兩個分區；計算由所選擇的該分區模式形成的該當前塊的該至少兩個分區中的每一個的每個合併候選的成本；基於所計算的成本，為由所選擇的該分區模式形成的該至少兩個分區選擇一組至少兩個合併候選；以及通過基於所選擇的該組至少兩個合併候選組合該至少兩個分區的至少兩個預測來編碼或解碼該當前塊。
如請求項11所述之視訊編解碼方法，還包括對於該多個分區模式中的每個分區模式：計算由該分區模式形成的該至少兩個分區的每組至少兩個合併候選的成本；基於該計算的成本為該至少兩個分區識別一組至少兩個合併候選；其中所選擇的該分區模式是基於該多個分區模式的識別的合併候選對的該計算的成本來選擇的。
如請求項11所述之視訊編解碼方法，其中基於該計算的成本選擇該組至少兩個合併候選包括根據該計算的成本對由所選擇的該分區模式形成的該至少兩個分區的合併候選重新排序，以及基於該重新排序發送或接收對一組至少兩個合併候選的選擇。
如請求項11所述之視訊編解碼方法，其中基於該計算的成本來選擇該組至少兩個合併候選包括在由所選擇的該分區模式形成的該至少兩個分區的合併候選中選擇具有最低成本的一組至少兩個合併候選。
一種電子裝置，包括：一種視訊編碼器或解碼器電路，被配置為執行操作，包括：接收待編碼或解碼為視訊的當前圖片的當前塊的像素塊資料；將多個分區模式分類為多組分區模式，每個分區模式將該當前塊分割成至少兩個分區；發送或接收從該多組分區模式中選擇的一組分區模式；從選定的該組分區模式中選擇一種分區模式；根據選擇的該分區模式將該當前塊分割成至少第一分區和第二分區；以及通過組合該第一分區的第一預測和該第二分區的第二預測來編碼或解碼該當前塊。
一種視訊編碼方法，包括：接收待編碼為視訊的當前圖片的當前塊的像素塊資料；將多個分區模式分類為多組分區模式，每個分區模式將該當前塊分割成至少兩個分區；發送從該多組分區模式中選擇的一組分區模式；從選擇的該組分區模式中選擇一種分區模式；根據選擇的該分區模式將該當前塊分割成至少第一分區和第二分區；以及通過組合該第一分區的第一預測和該第二分區的第二預測來編碼該當前塊。
一種視訊解碼方法，包括：接收待解碼為視訊的當前圖片的當前塊的像素塊資料；將多個分區模式分類為多組分區模式，每個分區模式將該當前塊分割成至少兩個分區；接收從該多組分區模式中選擇的一組分區模式；從選擇的該組分區模式中選擇一種分區模式；根據選擇的該分區模式將該當前塊分割成至少第一分區和第二分區；以及通過組合該第一分區的第一預測和該第二分區的第二預測來解碼該當前塊。