TWI723448B

TWI723448B - 圖像以及視訊資料中編碼單元的熵編解碼

Info

Publication number: TWI723448B
Application number: TW108123566A
Authority: TW
Inventors: 向時達
Original assignee: 聯發科技股份有限公司
Priority date: 2018-07-05
Filing date: 2019-07-04
Publication date: 2021-04-01
Also published as: US10887594B2; EP3818708A1; EP3818708A4; US20200014928A1; TW202017372A; WO2020007353A1; CN112369029A

Abstract

提供了一視訊編解碼器，執行用於分割一像素塊的語法元素的熵編解碼。該視訊編解碼器接收一圖像的一當前像素塊。該視訊編解碼器藉由根據一分割指示符分割該當前像素塊來編碼或解碼該當前像素塊。該分割指示符藉由使用一上下文模型被熵編解碼為一位元流的一語法元素，該上下文模型基於該當前像素塊的一分割結構或該當前像素塊的一相鄰像素塊的一分割結構來選擇。

Description

圖像以及視訊資料中編碼單元的熵編解碼

本申請一般涉及視訊處理。特別地，本申請涉及視訊圖片或圖像的熵編解碼的方法。

除非在此另有指示，本節所描述的處理不是下文所列申請專利範圍的先前技術以及不藉由包括於本節中而承認為先前技術。

高效視訊編解碼(HEVC)是由視訊編解碼的聯合協作小組(JCT-VC)開發的最新的視訊編解碼標準。在HEVC中，已編碼圖像被分割成由複數個編碼樹單元(CTU)表示的複數個非重疊的正方形塊區域。已編碼圖像可以由一批切片(slice)表示，每一者包括整數數目的CTU。切片中各個CTU以光柵掃描次序(raster scanning order)進行處理。雙向預測(bi-predictive，B)切片可以使用採用至多兩個運動向量以及參考索引來預測每一塊的樣本值的幀內預測或幀間預測來解碼。幀內(intra，I)切片僅使用幀內預測來解碼。預測(predictive，P)切片使用採用至多一個運動向量以及參考索引來預測每一塊的樣本值的幀內預測或幀間預測來解碼。

一或複數個預測單元(PU)被指定用於每一編碼單元(CU)。預測單元與相關CU語法一起作為用於發信預測子(predictor)資訊的基礎單元。所指定的預測進程被應用於預測PU內相關像素樣本的值。根據所選擇的PU類型，一個CU可以被拆分成一個，兩個或四個PU。HEVC定義了用於將一個CU拆分成複數個PU的8種類型的分割。

一CU可以用殘差四叉樹(residual quadtree，RQT)結構來進一步被分割用於表示相關預測殘差訊號。RQT的葉節點對應於所生成的轉換單元(TU)。一轉換單元包括4:2:0格式的圖像中的尺寸為8x8、16x16或32x32的亮度樣本的一個轉換塊(TB)或尺寸為4x4的亮度樣本的四個轉換塊，以及色度樣本的兩個對應的轉換塊。整數轉換被應用於轉換塊以及在位元流中已量化系數值被編碼。最小以及最大轉換塊尺寸在序列參數集中被指定。

在HEVC中，術語編碼樹塊(CTB)、編碼塊(CB)、預測塊(PB)以及轉換塊(TB)被定義為來分別指來自相關CTU、CU、PU以及TU的一個色彩分量的2-D樣本陣列。在未使用三個單獨色彩平面編碼的色彩圖像中，一CTU因此包括一個亮度CTB、兩個色度CTB以及相關語法元素。雖然當遇到某些最小尺寸約束時應用一些例外，所發信的編碼樹分割一般被應用於亮度塊以及色度塊兩者。

下文的概述僅是說明性的以及不旨在以任何方式進行限制。即，下文的概述被提供來介紹本文所描述的新穎性以及非顯而易見性的概念、重點、益處與優點。下面在詳細描述中進一步描述所選擇而不是所有實施方式。因此，下文的概述不旨在識別所要求保護主題的基本特徵，或不旨在用於決定所要求保護主題的範圍。

本公開的一些實施例提供了一種視訊編解碼器，其執行用於分割一像素塊的一語法元素的熵編解碼。該視訊編解碼器接收一圖像的一當前像素塊。該視訊編解碼器藉由根據一分割指示符來分割該當前像素塊以編碼或解碼該當前像素塊。藉由使用一上下文模型，該分割指示符被熵編解碼為一位元流的一語法元素，該上下文模型基於該當前像素塊或該當前像素塊的一相鄰像素塊的一分割結構來選擇。該當前像素塊的該分割結構或者該相鄰像素塊的該分割結構被用於決定用於選擇該上下文模型的一上下文索引增量。該當前像素塊的該分割結構可以指定該當前像素塊的一拆分深度或一拆分形狀。

在一些實施例中，分割指示符指示是否去執行該當前像素塊的二叉樹拆分或者多類型樹拆分，而該上下文模型基於具有大於該當前像素塊的拆分深度的相鄰像素塊的數目來選擇。該上下文模型可以進一步基於該當前像素塊的一二叉樹深度來選擇。在一些實施例中，分割指示符指示該當前像素塊的分割的一方向，以及該上下文模型基於該當前像素塊的一分割單元的一形狀來選擇。該上下文模型可以進一步基於分割單元的二叉樹深度來選擇。在一些實施例中，分割指示符指示是否去執行該當前像素塊的四叉樹拆分，以及該上下文模型基於具有大於該當前像素塊的四叉樹深度的相鄰塊的數目來選擇。

在一些實施例中，用於熵編解碼一分割指示符的該上下文模型基於具有大於該當前像素塊的四叉樹深度的相鄰像素塊的一數目來選擇。該上下文模型可以進一步基於該當前像素塊的一四叉樹深度來選擇。在一些實施例中，該上下文模型基於該當前像素塊的一拆分深度以及兩個相鄰像素塊的拆分深度來選擇。在一些實施例中，該上下文模型基於該當前像素塊以及該相鄰像素塊的寬度、高度以及拆分深度來選擇。

在下文細節描述中，以示例的方式給出了許多具體細節以提供相關教導的透徹理解。基於本文所描述的教導的任何變化、衍生與/或擴展都在本申請的保護範圍內。在一些情況下，與本文所描述的一或複數個示例性實施方式有關的公知的方法、進程、元件與/或電路可以在沒有細節的情況下，在相對高的層級進行描述，以避免不必要地混淆本發明教導的各個方面。

本公開的一些實施例提供了一視訊編解碼器(如，編碼器與/或解碼器)，其熵編碼或解碼用於拆分像素塊的分割結構。例如，遞迴的二叉樹或多類型樹結構可以被採用用於由視訊編解碼器將CTU分割成一或複數個CU。編碼樹結構的表示由基於上下文的適應性二進位的算術編碼(CABAC)模式進行熵編解碼。當選擇用於熵編解碼CU分割結構的上下文模型時，視訊編解碼器可能考慮各種類型的拆分深度，包括相鄰塊以及當前塊的二叉樹深度、多類型樹深度以及四叉樹深度，以及當前塊以及相鄰塊的寬度、高度、尺寸以及拆分類型。

第1圖概念性示出了一熵編解碼器100，其基於當前塊或者其相鄰塊的分割結構選擇用於熵編解碼一當前像素塊的分割指示符的一上下文模型。圖式示出了圖像105的像素塊110。圖像105可以是靜止圖像或視訊序列的視訊圖像。像素塊110是被編解碼的當前像素塊。當前塊110可以是CTU或CU。當前塊110在圖像105中具有複數個相鄰塊111-113。相鄰塊111-113可能包括在當前塊110之前被編解碼的塊。一些相鄰塊111-113在當前塊110的左邊以及上方。相鄰塊111-113還可能包括空間鄰近當前塊110的其他塊。

當前編碼或解碼當前塊110時，出於編解碼的目的，當前塊可以被分割或拆分成複數個分割單元。該等分割單元可能具有不同的拆分形狀以及方向。一些分割單元可能進一步被拆分成具有較大拆分深度的複數個分割單元。當前塊的拆分類型以及拆分深度由當前塊的分割結構來決定。塊的分割結構由與塊有關的一或複數個分割指示符來表示。下文的節Ⅰ描述了各種分割結構以及下文的節Ⅱ描述了各種分割指示符。在一些實施例中，分割指示符是以符合標準的視訊位元流的語法元素的格式。在圖式中，當前塊110的分割結構由分割指示符120至少部分地指示。這可能有不止一個與當前塊110有關的分割指示符。

如圖所示，熵編解碼器100正在編解碼當前像素塊110。熵編解碼器100可以是熵編碼器，其從像素編碼器111接收當前塊110的已編碼像素資料115(如，已量化DCT係數、旗標)以及生成對應的熵已編碼位元(bit)作為位元流190的一部分。熵編解碼器100可以是熵解碼器，其接收位元流190的熵已編碼位元，以及生成對應的熵已解碼位元作為當前塊110的已編碼像素資料用於像素解碼器112。當前塊110的分割指示符120與當前塊110的已編碼像素資料115一起被熵編碼或熵解碼為語法元素。

熵編解碼器100執行CABAC編解碼，其使用不同的上下文模型130用於不同類型的語法元素。上下文模型選擇模組140藉由提供一上下文索引145選擇一上下文模型135用於熵編解碼器100，該上下文索引包括上下文索引偏移以及上下文索引增量(也稱為上下文選擇增量)。上下文模型選擇模組140基於當前被編解碼的語法元素類型(SE類型)決定上下文索引偏移。當語法元素類型指示當前被編解碼的語法元素是分割指示符時，上下文模型選擇模組140基於當前塊110與/或相鄰塊111-113的分割結構(如，拆分形狀以及拆分深度)決定上下文索引增量。下文節Ⅲ描述了用於熵編解碼分割指示符的上下文模型的選擇。 Ⅰ.分割結構

二叉樹(BT)分割結構可以被用於表示塊藉由二叉樹拆分(二元拆分)到複數個較小塊的分割。在二叉樹拆分結構中，塊可以被遞迴地拆分成兩個較小塊。這有各種類型的二叉樹拆分，包括對稱水平以及垂直拆分。對於尺寸為MxN的塊，水平拆分生成兩個尺寸為MxN/2的分割單元，以及垂直拆分生成尺寸為M/2xN的兩個分割單元。二叉樹拆分進程可以被遞迴地應用直到分割單元的尺寸(寬度或高度)達到最小塊尺寸(寬度或高度)。最小塊尺寸可以在高層級語法集合中被定義，如SPS。因為二叉樹具有兩個拆分類型(即，水平以及垂直)，最小塊寬度以及高度都被指示。

當拆分將導致塊高度小於所指示的最小值時，非水平拆分被暗示。當拆分將導致塊寬度小於所指示的最小值時，非垂直拆分被暗示。第2圖概念性示出了由二叉樹拆分的CU的分割。圖式示出了塊分割(左)及其對應二叉樹(右)的示例。對於二叉樹的每一拆分節點(即，非葉)，一個旗標被發信來指示使用了哪一拆分類型(水平或者垂直)，“0”用於水平拆分以及“1”用於垂直拆分。

像素塊，如CTU，也可以被分割成複數個非重疊的編碼單元(CU)來適應各種局部運動以及紋理特性。在四叉樹(QT)結構上構建的編碼樹被採用來表示從CTU拆分的CU分割。考慮尺寸為MxM像素樣本的CTU，其中M是值64、32以及16中的一個。CTU可以包括相同尺寸MxM的單個單元，或者被拆分成尺寸為M/2xM/2的四個較小單元。CTU與編碼樹的根節點有關以及四個M/2xM/2單元是從編碼樹的根節點拆分而來的子四叉樹節點。四個四叉樹節點的每一個可以成為父節點，用於到具有進一步減小尺寸(每一空間維度上減小一半)的四個子節點的另一個拆分。四叉樹拆分可以被遞迴地應用直到葉被達到。編碼樹的葉節點與複數個CU有關。第3圖示出了基於表示CTU到複數個CU的分割的四叉樹(QT)拆分結構構建的編碼樹。最小以及最大CU尺寸在序列參數集合(SPS)中被指定。

在一些實施例中，四叉樹加二叉樹結構被用於將CU分割成複數個更小的CU。每一CTU可以包含一個CU或者使用四叉樹拆分結構被分割成複數個更小的CU。四叉樹拆分可以被遞迴地應用於CU直到當前CU尺寸達到最小四叉樹葉節點尺寸。如果當前四叉樹塊不大於最大二叉樹根節點尺寸，其可以使用二叉樹拆分結構進一步被分割。二叉樹拆分可以被遞迴地應用直到當前CU尺寸(寬度或高度)達到最小二叉樹葉節點尺寸(寬度或高度)或者直到當前二叉樹深度達到最大二叉樹深度。這有兩種拆分類型，對稱水平拆分以及對稱垂直拆分。二叉樹葉節點與複數個CU有關。

第4圖概念性示出了由四叉樹拆分以及二叉樹拆分兩者來分割一CU。圖式示出了塊分割(左)及其對應QTBT(右)的示例。實線指示四叉樹拆分以及虛線指示二叉樹拆分。對於二叉樹的每一拆分節點(非葉)，一個旗標被發信來指示哪一拆分類型(水平或垂直)被使用。“0”指示水平拆分以及“1”指示垂直拆分。最小四叉樹葉節點尺寸、最大二叉樹根節點尺寸，最小二叉樹葉節點寬度以及高度，以及最大二叉樹深度在高層級語法集合中被指示。

在多類型樹(MTT)結構中，水平以及垂直中心側三元樹被進一步添加到QTBT結構中用於拆分CU。一CU可以使用複數個拆分類型之一被進一步拆分成複數個較小的CU。第5圖示出了MTT結構中用於分割CTU的複數個拆分類型或模式(a)-(e)。拆分類型(a)(b)以及(c)分別對應於四叉樹拆分、垂直二叉樹拆分以及水平二叉樹拆分。拆分類型(d)以及(e)被稱為三叉樹拆分，其將塊拆分成三個較小塊。來自三叉樹拆分的該三個較小塊在一個空間維度具有減小的尺寸，而在其他空間維度保持相同的尺寸。MTT結構中當前CU的二叉樹深度btDepthC被定義為：btDepthC = log2( (widthR * heightR) / (widthC * heightC))，其中widthC以及heightC分別表示當前CU的寬度以及高度，以及widthR與heightR分別表示對應的MTT根節點的寬度以及高度，並且函數log2(x)是x的2為底的對數。 Ⅱ.分割結構的信令

像素塊的分割結果由與塊有關的分割指示符來發信。該分割指示符指示塊是否以及如何被分割。例如，對於尺寸為MxN的給定塊，分割指示符bt_split_flag可以被發信為語法元素來指示是否將塊拆分成兩個較小塊。如果旗標為真，另一個分割指示符bt_split_mode(也稱為split_dr)被發信為語法元素來指示使用哪一拆分方向或定向(即，水平或垂直)。在一些實施例中，編碼樹單元(CTU)可以由四叉樹以及使用二元以及三元拆分的嵌入多類型樹被分割成一或複數個較小尺寸的CU。分割指示符qt_split_flag(也稱為qt_split_cu_flag)被發信為語法元素來指示編碼單元是否被拆分成具有一般水平以及垂直尺寸的編碼單元。分割指示符mtt_split_flag(也稱為mtt_split_cu_flag)被發信為語法元素來指示編碼單元是否由複數個多類型樹拆分模式之一來拆分成複數個CU，包括水平二叉樹拆分、垂直二叉樹拆分以及垂直三叉樹拆分，如第5圖所示。分割指示符mtt_split_cu_vertical_flag(也稱為mtt_split_vertical或者split_dir)被發信為語法元素來指示CU是否被水平或垂直拆分。分割指示符mtt_split_binart_flag(也稱為mtt_split_cu_binary_flag)被發信為語法元素來指示CU是否由二元或三元拆分來分割。

在一些實施例中，如果分割指示符bt_split_flag或者mtt_split_flag為真，一分割指示符split_dir(也稱為mtt_split_vertical)接下來被編解碼來指示當前塊所採用的拆分/分割方向(水平或垂直)。

第6圖示出了一些實施例中用於發信CTU的分割結構的決策樹。如圖所示，分割指示符split_flag最初被用於發信是否去拆分CTU(split_flag是‘1’)或者不去拆分CTU(split_flag是‘0’)。如果決定是拆分CTU，分割指示符qt_split_flag被用於決定是否由四叉樹(QT拆分)或由多類型樹(MTT拆分或1D拆分)來拆分CTU。如果決定是由QT拆分(qt_split_flag是‘1’)來拆分CTU，視訊編解碼器由四叉樹拆分CTU。如果決定是由MTT拆分(qt_split_flag是‘0’)來拆分CTU，視訊編解碼器使用分割指示符mtt_split_vertical來指示是否水平或垂直地拆分CTU，以及使用分割指示符mtt_split_binary_flag來決定是否由二叉樹拆分或三元拆分來拆分CTU。

第7圖示出了在一些實施例中用於發信CTU的分割結構的可替換決策樹。如圖所示，分割指示符qt_split_flag被用於指示CTU是否由四叉樹拆分。如果決定是由QT拆分(qt_split_flag是‘1’)來拆分CTU，視訊編解碼器藉由四叉樹拆分CTU。如果決定是不由QT拆分(qt_split_flag是‘0’)來拆分CTU，分割指示符mtt_split_flag用於指示CTU是否由MTT拆分(mtt_split_flag是‘1’)來拆分或者根本不被拆分(mtt_split_flag是‘0’)。如果決定是不由MTT拆分來拆分CTU，視訊編解碼器使用分割指示符mtt_split_vertical來決定是否水平或垂直地拆分CTU，以及使用mtt_split_binary_flag來決定是否由二元或三元拆分來拆分CTU。

Ⅲ.用於分割指示符的上下文建模

在一些實施例中，基於當前塊或者其相鄰塊的拆分深度或拆分形狀決定用於熵編解碼塊的分割結構的分割指示符的上下文建模。例如，基於相鄰塊(其包括當前塊上方的塊以及左邊的塊)的數目決定用於熵編解碼語法元素bt_split_flag或者mtt_split_flag的上下文模型的選擇，相比於當前塊，相鄰塊具有較大組合的QT加BT/MTT深度(也稱為組合的QTBT深度)。塊的組合的QT加BT/MTT深度被定義為等於塊的QT深度減去2加塊的BT/MTT深度的和。表1是分割指示符bt_split_flag或mtt_split_flag的上下文索引增量的映射表。映射是從具有較大組合的QTBT深度的相鄰塊的數目到上下文索引增量。

表1

在一些實施例中，基於當前塊的形狀決定用於熵編解碼的語法元素split_dir的上下文建模。表2是用於分割指示符split_dir的上下文索引增量的映射表。映射是從當前塊的形狀到上下文索引增量。表2

在一些實施例中，上下文模型的決定是進一步基於當前塊的BT或MTT深度(或拆分深度)。表3是用於分割指示符bt_split_flag或mtt_split_flag的上下文索引增量的可替換映射表。映射是從當前塊的二叉樹深度以及具有比當前塊大的組合的QTBT深度的相鄰塊的數目到上下文索引增量。表3

表4是分割指示符split_dir的上下文索引增量的可替換映射表。“W”以及“H”表示當前塊的寬度以及高度。映射是從當前塊的二叉樹深度以及當前塊的形狀到上下文索引增量。表4

在一些實施例中，視訊編解碼器熵編解碼來自四叉樹或QTBT分割結構的CU四叉樹拆分旗標(qt_split_flag，對應於HEVC中的語法元素split_cu_flag)的二進位值。上下文建模方案基於具有比當前CU大的四叉樹深度的相鄰CU的數目來決定以及進一步以用於某些相鄰配置的當前CU的四叉樹深度為條件。例如，用於編解碼當前CU的分割指示符qt_split_flag的上下文索引增量ctxInc可以決定如下： ctxInc = (d>T0? 0: (d>T1? (T1-T0+1): (d-T0)))*(N+1)+n, 等式(1)

其中n是具有比當前CU大的QT深度的相鄰CU的數目，N是相鄰CU的最大數目，d是當前CU的四叉樹深度，以及T0以及T1是一些預定深度閾值。

在一些實施例中，用於熵編解碼的上下文的總數目被減小，以及用於編解碼當前CU的分割指示符qt_split_flag的上下文索引增量ctxInc決定如下： ctxInc = (n>N)? n: ((d>T0? 0: (d>T1?(T1-T0+1): (d-T0)))+N), 等式 (2)

其中n是具有比當前CU大的QT深度的相鄰CU的數目，N是相鄰CU的最大數目，d是當前CU的四叉樹深度，以及T0以及T1是一些預定四叉樹深度閾值。

在表5中提供了基於等式(2)的用於上下文索引增量的示例映射表，其中當相鄰CU兩者(N等於2)對應於較大四叉樹深度時，上下文建模進一步以閾值T0與T1分別等於0與2的當前CU的四叉樹深度為條件。

在一些實施例中，視訊編解碼器採用藉由四叉樹聯合使用二元或三元拆分的嵌入多類型樹或者僅使用二叉樹拆分的嵌入二叉樹的分割結構來將CTU拆分成一或複數個較小尺寸的CU。這一分割結構由分割指示符qt_split_flag，mtt_split_flag或者bt_split_flag來指示。

用於熵編解碼分割指示符qt_split_flag的上下文索引增量ctxIncQt可以共同以當前CU的拆分深度(如，組合的QTBT深度)以及兩個空間相鄰CU的拆分深度為條件，由下給出：ctxIncQt=(((qtDepthC<qtDepthA)？ 1：0)+((qtDepthC<qtDepthL)？1：0))+(3*(qtDepthC<T1？ 0：1)), 等式.(3)

其中qtDepthC，qtDepthA以及qtDepthL分別表示當前CU，上方相鄰CU以及左邊相鄰CU的四叉樹深度，以及T1是閾值。在一些實施例中，T1被設置為2，其中(qtDepthC<qtDepthA)？ 1：0表示當條件qtDepthC<qtDepthA為真時，值為1，否則，當條件qtDepthC<qtDepthA為假時，值為0；同理(qtDepthC<qtDepthL)？1：0表示當條件qtDepthC<qtDepthL為真時，值為1，否則當條件qtDepthC<qtDepthL為假時，值為0，相同的原理也應用於qtDepthC<T1？ 0：1。也即邏輯運算符x ？ y：z表示，當條件x為真或不等於0時，輸出的值為y，否則，輸出的值為z。

用於編解碼分割指示符split_flag，,mtt_split_flag或者bt_split_flag的所選擇的上下文索引增量ctxIncMtt可以共同以當前CU以及相鄰CU的寬度、高度以及深度為條件，給定為：(heightC>heightL)？1：0))+(3*(btDepthC<T2 ？ 0：1), 等式(4)

其中widthC以及widthA分別表示當前CU以及上方相鄰CU的寬度，以及heightC與heightL分別表示當前CU與左邊相鄰CU的高度，以及btDephthC表示當前CU的BT深度，以及T2是閾值。在一個優選實施例中，T2被設置為2。在一些可選實施例中，上下文建模可以以當前CU的MTT深度為條件，給出為：ctxIncMtt=(((widthC>widthA)？1：0)+(heightC>heightL)？1：0))+(3*(mttDepthC<T2 ？ 0：1), 等式(5)

其中mttDepthC是當前CU的MTT深度。

Ⅳ.示例性視訊編碼器

第8圖示出了示例性視訊編碼器800，其藉由使用當前塊或者其相鄰塊的分割結構熵編碼當前塊的分割指示符來執行上下文建模。如圖所示，視訊編碼器800接收來自視訊源805的輸入視訊訊號以及將該訊號編碼進位元流895。視訊編碼器800具有複數個元件或模組用於編碼來自視訊源805的訊號，至少包括從轉換模組810，量化模組811，逆量化模組814，逆轉換模組815，幀內圖像估計模組820，幀內圖像預測模組825，運動補償模組830，運動估計模組835，環路濾波器845，重構圖像緩衝器850，MV緩衝器865以及MV預測模組875，以及熵編碼器890中選擇的一些元件。運動補償模組830以及運動估計模組835是幀間預測模組840的一部分。

在一些實施例中，模組810-890是由計算裝置或電子裝置的一或複數個處理單元(如，處理器)執行的軟體指令的模組。在一些實施例中，模組 810-890是由電子裝置的一或複數個積體電路(IC)實施的硬體電路的複數個模組。雖然模組810-890被示出為分離的模組，一些模組可以被組合成單個模組。

視訊源805提供未壓縮的表示每一視訊幀像素資料的原始視訊訊號。減法器808計算視訊源805的原始視訊像素資料與來自運動補償模組830或幀內圖像預測模組825的已預測像素資料813之間的差值。轉換模組810藉由執行轉換操作(如，離散余弦轉換(DCT)，離散正弦轉換(DST)或者其他任何轉換操作)來將該差值(或者殘差像素資料或殘差訊號809)轉換成轉換係數。量化模組811將該轉換係數量化成已量化資料(或已量化係數)812，其被熵編碼器890編碼進位元流895。

逆量化模組814解量化已量化的資料(或已量化的係數)812來獲得轉換係數，以及逆轉換模組815對轉換係數執行逆轉換來生成重構殘差819。重構殘差819與已預測像素資料813相加來生成已重構像素資料817。在一些實施例中，已重構像素資料817被暫時存儲在線性緩衝器(未示出)中用於幀內圖像預測以及空間MV預測。已重構像素由環路濾波器845進行濾波並且存儲在重構圖像緩衝器850中。在一些實施例中，重構圖像緩衝器850是視訊編碼器800外部的儲存區。在一些實施例中，重構圖像緩衝器850是視訊編碼器800內部的儲存區。

幀內圖像估計模組820基於已重構像素資料817執行幀內預測來生成幀內預測資料。幀內預測資料被提供給熵編碼器890來被編碼進位元流895。幀內預測資料也由幀內圖像預測模組825使用來生成已預測像素資料813。

運動估計模組835藉由生成複數個MV來參考被存儲在重構圖像緩衝器850中的複數個先前已解碼幀的像素資料執行幀間預測。這些MV被提供給運動補償模組830來生成已預測像素資料。

除了在位元流中編碼完整實際的MV，視訊編碼器800使用MV 預測來生成複數個已預測MV，以及用於運動補償的複數個MV與複數個已預測MV之間的差異被編碼為殘差運動資料並且被存儲在位元流895中。

MV預測模組875基於為編碼先前視訊幀生成的複數個參考MV生成複數個已預測MV，即複數個運動補償MV被用於執行運動補償。MV預測模組875從來自MV緩衝器865的複數個先前視訊幀檢索複數個參考MV。視訊編碼器800將為當前視訊幀生成的複數個MV存儲在MV緩衝器865中作為用於生成複數個已預測MV的複數個參考MV。

MV預測模組875使用複數個參考MV來創造複數個已預測MV。可以由空間MV預測或時間MV預測計算複數個已預測MV。複數個已預測MV與當前幀的複數個運動補償MV(MC MV)之間的差異(殘差運動資料)被熵編碼器890編碼進位元流895。

熵編碼器890藉由使用如上下文自我調整二進位算術編碼(CABAC)或霍夫曼(Huffman)編碼的熵編解碼技術將各種參數以及資料編碼進位元流895。熵編碼器890將各種資料頭元素、旗標與已量化轉換資料812，以及殘差運動資料一起編碼為語法元素到位元流895中。位元流895反過來存儲在儲存裝置或通過如網路的通訊媒介傳輸到解碼器。

環路濾波器845對已重構像素資料817執行濾波或光滑操作來減少編解碼的偽影(artifact)，尤其是在像素塊的邊界處。在一些實施例中，所執行的濾波操作包括樣本自我調整偏移(SAO)。在一些實施例中，所執行的濾波操作包括適應性環路濾波(ALF)。

第9圖示出了視訊編碼器800的部分，其基於當前塊或者其相鄰塊的分割結構選擇用於熵編碼當前像素塊的分割指示符的上下文模型。特別地，圖式示出了當熵編碼當前塊的分割指示符時，熵編碼器890的元件。

如圖所示，熵編碼器890包括語法元素選擇模組910、上下文選擇模組920、上下文模型儲存區930、二值化(binarization)模組940、箱(bin)編碼引擎950，以及上下文模型更新模組960。

語法元素選擇模組910從視訊編碼器800的各種源中選擇將被編碼為位元流895中語法元素的資料，包括分割指示符。被選擇為語法元素的資料被傳輸給二值化模組940，其將所選擇的資料轉換成箱。箱編碼引擎950反過來執行二進位算術編解碼來將箱轉換成將被包括在位元流895中的二進位算術碼。二進位算術編解碼操作依賴於上下文建模，其基於特定於被編解碼的語法元素的類型的可能性提供上下文模型。不同類型語法元素的不同的上下文模型被存儲在上下文模型儲存區930。上下文模型更新模組960基於在箱編碼引擎95處被處理的箱值更新各種上下文模型的可能性。

由箱編碼引擎950使用的上下文模型基於由上下文選擇模組920提供的上下文索引從上下文模型儲存區來檢索。上下文索引是基於上下文索引偏移以及上下文索引增量。當被編碼的語法元素是分割指示符時，上下文選擇模組920設置上下文索引偏移以及上下文索引增量為對應於特定的分割指示符。上下文選擇模組920可以基於當前塊或者其相鄰塊的分割結構設置上下文索引增量(ctxInc)。當前塊以及相鄰塊的分割結構可以從重構圖像緩衝器950中來檢索。例如，當前塊以及相鄰塊的寬度以及高度可以用於根據等式(4)決定mtt_split_flag的ctxInc。當前塊的二叉樹深度以及塊形狀可以用於根據表4決定split_dir的ctxInc。對應於大於當前塊的四叉樹深度的相鄰塊的數目可以用於根據等式(1)決定qt_split_flag的ctxInc。

第10圖概念地示出了用於編碼當前像素塊的進程1000，其中分割指示符的上下文建模以當前塊或者其相鄰塊的分割結構為條件。在一些實施例中，實施視訊編碼器800的計算裝置的一或複數個處理單元(如，處理器)藉由執行存儲在電腦可讀媒介中的指令來執行進程1000。在一些實施例中，實施視訊編碼器800的電子裝置執行進程1000。

視訊編碼器接收圖像的像素塊作為將被編碼的當前塊(在步驟1010)。像素塊可以是CU或CTU。該當前塊可以具有圖像中已被編碼的相鄰塊。在編碼期間，一些相鄰塊可以以四叉樹結構或多類型樹結構方式進行分割。

視訊編碼器接收用於分割該當前塊的一分割指示符(在步驟1020)。該分割指示符可以是用於二叉樹拆分(如，bt_split_flag)、多類型拆分(如，mtt_split_flag)、四叉樹拆分(如，qt_split_flag)、拆分方向(如，split_dir)的旗標，或另一類型的分割指示符。視訊編碼器可以從基於圖像的內容決定編碼模式的率控制進程接收分割指示符。

視訊編碼器基於當前塊的分割結構或者相鄰塊的分割結構選擇用於該分割指示符的一上下文模型(在步驟1030)。藉由基於如當前塊的拆分深度、相鄰塊的拆分深度、當前塊的形狀、相鄰塊的形狀、當前塊或相鄰塊的分割單元的形狀以及方向(如，由於四叉樹分割的正方形，由於二元分割或三元分割的水平矩形或者垂直矩形等等)的複數個因素設置上下文索引增量，視訊編碼器決定用於選擇上下文模型的上下文索引。上文節Ⅲ描述了決定各種類型分割指示符的上下文索引增量。

藉由根據該分割指示符分割該當前塊，視訊編碼器將該當前塊編碼為位元流的一部分(在步驟1040)。例如，如果分割指示符是指示當前塊將由四叉樹分割的qt_split_flag，視訊編碼器將該當前塊拆分成四個分割單元並分別編碼該四個分割單元。作為該當前塊的編碼的部分，藉由使用在步驟1030選擇的上下文模型，分割指示符被熵編解碼。

V.示例性視訊解碼器

第11圖示出了示例性視訊解碼器1100，其藉由使用當前塊或者其相鄰塊的分割結構熵解碼當前塊的分割指示符來執行上下文建模。視訊解碼器1100具有用於解碼位元流1195的複數個元件或模組，包括從逆量化模組1105、逆轉換模組1115、幀內圖像預測模組1125、運動補償模組1130、環路濾波器1145、解碼圖像緩衝器1150、MV緩衝器1165、MV預測模組1175以及解析器1190中選擇的一些元件。運動補償模組1130是幀間預測模組1140的一部分。

在一些實施例中，模組1110-1190是由計算裝置的一或複數個處理單元(如，處理器)執行的軟體指令的模組。在一些實施例中，模組1110-1190是由電子裝置的一或複數個IC實施的硬體電路的模組。雖然模組1110-1190被示出為分離的模組，一些模組可以被組合成單個模組。

解析器1190(或熵解碼器)根據由視訊編解碼或圖像編解碼標準定義的語法接收位元流1195以及執行初始解析。所解析的語法元素包括各種資料頭元素、旗標以及已量化資料(或已量化係數)1112。解析器1190藉由使用如上下文自我調整性二進位算術編碼(CABAC)或霍夫曼編碼的熵編解碼技術解析出各種語法元素。

逆量化模組1105解量化已量化的資料(或已量化係數)1112來獲得轉換係數，以及逆轉換模組1115對轉換係數1116執行逆轉換來生成已重構殘差訊號1119。已重構殘差訊號1119與來自幀內圖像預測模組1125或運動補償模組1130的已預測像素資料1113相加來生成已解碼像素資料1117。已解碼像素資料由環路濾波器1145進行濾波並被存儲在解碼圖像緩衝器1150中。在一些實施例中，解碼圖像緩衝器1150是視訊解碼器1100的外部儲存區。在一些實施例中，解碼圖像緩衝器1150是視訊解碼器1100的內部儲存區。

幀內圖像預測模組1125從位元流1195接收幀內預測資料以及根據該幀內預測資料，從存儲於解碼圖像緩衝器1150的已解碼像素資料1117生成已預測像素資料1113。在一些實施例中，已解碼像素資料1117也存儲於線性緩衝器(未示出)用於幀內圖像預測以及空間MV預測。

在一些實施例中，解碼圖像緩衝器1150的內容用於顯示。顯示裝置1155檢索解碼圖像緩衝器1150的內容直接用於顯示，或者檢索解碼圖像緩衝器的內容到顯示緩衝器。在一些實施例中，顯示裝置通過像素傳輸從解碼圖像緩衝器1150接收像素值。

運動補償模組1130根據複數個運動補償MV(MC MV)從存儲於解碼圖像緩衝器1150中的已解碼像素資料1117生成已預測像素資料1113。這些運動補償MV藉由將從位元流1195接收到的殘差運動資料與從MV預測模組1175接收到的已預測MV相加來解碼。

MV預測模組1175基於為解碼先前視訊幀生成的複數個參考MV生成複數個已預測MV，如複數個運動補償MV用於執行運動補償。MV預測模組1175從MV緩衝器1165檢索先前視訊幀的複數個參考MV。視訊解碼器1100將為解碼當前視訊幀生成的複數個運動補償MV存儲於MV緩衝器1165中作為用於生成複數個已預測MV的複數個參考MV。

環路濾波器1145對已解碼像素資料1117執行濾波或光滑操作來減少編解碼的偽影，尤其是在像素塊的邊界。在一些實施例中，所執行的濾波操作包括樣本適應性偏移(SAO)。在一些實施例中，所執行的濾波操作包括適應性環路濾波(ALF)。

第12圖示出了視訊解碼器1100的部分，其基於當前塊或者其相鄰塊的分割結構選擇用於熵編解碼當前像素塊的分割指示符的上下文模型。特別地，圖式示出了當熵解碼當前塊的分割指示符時，熵解碼器1190的元件。

如圖所示，熵解碼器1190包括語法元素分配模組1210、上下文選擇模組1220、上下文模型儲存區1230、解二值化(de-binarization)模組1240、箱解碼引擎1250以及上下文模型更新模組1260。

箱解碼器引擎1250從位元流1195接收位元以及執行二進位算術編解碼來將所接收到的位元轉換成箱。二進位算術編解碼操作依賴於上下文建模，其基於特定於被編解碼的語法元素的類型的可能性提供上下文模型。不同類型語法元素的不同上下文模型被存儲於上下文模型儲存區1230。上下文模型更新模組1260基於在箱解碼引擎1250處理的箱值更新各種上下文模型的可能性。解量化模組1240將箱轉換成語法元素，包括分割指示符。所解碼的語法元素藉由語法元素分配模組1210反過來分配到視訊解碼器1100的各個目的端。

由箱解引擎1250使用的上下文模型基於由上下文選擇模組1220提供的上下文索引從上下文模型儲存區1230來檢索。上下文索引是基於上下文索引偏移以及上下文索引增量。當被編解碼的語法元素是分割指示符時，上下文選擇模組1220設置上下文索引偏移以及上下文索引增量為對應於特定的分割指示符。上下文選擇模組1220可以基於當前塊或者相鄰塊的分割結構設置上下文索引增量(ctxInc)。當前塊以及相鄰塊的分割結構可以從解碼圖像緩衝器1150中來檢索。例如，當前塊或者相鄰塊的寬度以及高度可以用於根據等式(4)決定mtt_split_flag的ctxInc。當前塊的二叉樹深度以及塊形狀可以用於根據表4決定split_dir的ctxInc。對應於比當前塊大的二叉樹深度的相鄰塊的數目可以用於根據等式(1)決定qt_split_flag的ctxInc。

第13圖概念地示出了用於解碼當前像素塊的進程1300，其中分割指示符的上下文建模以當前塊或者其相鄰塊的分割結構為條件。在一些實施例中，實施視訊解碼器1100的計算裝置的一或複數個處理單元(如，處理器)藉由執行存儲於電腦可讀媒介中的指令執行進程1300。在一些實施例中，實施視訊解碼器1100的電子裝置執行進程1300。

視訊解碼器接收位元流，該位元流包括將圖像的像素塊的被解碼的資料作為將被解碼的當前塊(在步驟1310)。該位元流還包括分割指示符，根據該分割指示符來分割當前塊。像素塊可以是CU或CTU。當前塊可以具有在圖像中已被解碼的相鄰塊。一些相鄰塊可以以四叉樹結構或二叉樹結構的方式被分割。將被解碼的位元流中的像素塊包括用於像素資料(如，轉換係數)的熵編解碼位元以及用於當前塊的分割指示符。分割指示符可以是用於二叉樹拆分(如，bt_split_flag)、多類型拆分(如，mtt_split_flag)、四叉樹拆分(如，qt_split_flag)、拆分方向(如，split_dir)的旗標或者其他類型的分割指示符。

視訊解碼器基於當前塊的分割結構或相鄰塊的分割結構選擇用於分割指示符的上下文模型(在步驟1320)。視訊解碼器藉由基於如當前塊的拆分深度、相鄰塊的拆分深度、當前塊的形狀、相鄰塊的形狀、分割單元的形狀與方向(如，由於四叉樹分割的正方形，由於二元分割或三元分割的水平矩形或垂直矩形等等)的因素設置上下文索引增量，決定用於選擇上下文模型的上下文索引。上文的節Ⅲ描述了決定各種分割指示符的上下文索引增量的方法。視訊解碼器熵藉由使用所選擇的上下文模型熵解碼該分割指示符(在步驟1330)。

視訊解碼器藉由使用分割指示符解碼當前像素塊(在步驟1340)。特別地，視訊解碼器基於由分割指示符指示的分割結構熵解碼當前塊的像素資料(如，轉換係數)的位元流以及重構當前塊。例如，如果分割指示符是指示當前塊被四叉樹拆分成四個分割單元的qt_split_flag，視訊解碼器分別解碼四個分割單元並然後將已解碼分割單元組裝成當前塊。

Ⅵ.示例性電子系統

許多上述描述的特徵以及應用被實施為軟體進程，其被指定為記錄在電腦可讀儲存媒介(也稱為電腦可讀媒介)上的一組指令。當這些指令由一或複數個計算或處理單元(如，一或複數個處理器、處理器的核心或者其他處理單元)執行時，它們使得處理單元執行指令中所指示的動作。電腦可讀媒介的示例包括但不限於CD-ROM、炔閃記憶體驅動器、隨機存取記憶體(RAM)晶片、硬碟驅動器、可擦可程式設計唯讀記憶體(EPROM)、電可擦可程式設計唯讀記憶體(EEPROM)等等。電腦可讀媒介不包括無線地或者通過有線連接傳播的載波與電子訊號。

在這一規範中，術語“軟體”旨在包括駐留在唯讀記憶體中的韌體或者存儲於磁性儲存區中的應用，其可以被讀入記憶體由處理器處理。此外，在一些實施例中，複數個軟體發明可以被實施為較大程式的子部分而同時保持獨特的軟體發明。在一些實施例中，複數個軟體發明也可以被實施為分離的程式。最終，分離程式的任何組合一起實施本文所描述的軟體發明在本發明的範圍內。在一些實施例中，在被安裝來在一或複數個電子系統上操作時，軟體程式定義執行與執行軟體程式的操作的一或複數個特定機器實現。

第14圖概念地示出了實施本發明一些實施例的電子系統1400。電子系統1400可以是電腦(如，臺式電腦、個人電腦、平板電腦等等)、電話、PDA或任何其他合適的電子裝置。這種電子裝置包括各種類型的電腦可讀媒介以及用於各種其他類型的電腦可讀媒介的介面。電子系統1400包括匯流排1405、處理單元1410、影像處理單元(GPU)1415、系統記憶體1420、網路1425、唯讀記憶體1430、永久儲存裝置1435、輸入裝置1440以及輸出裝置1445。

匯流排1405共同表示通訊地連接電子系統1400的複數個內部設備的所有系統、週邊設備以及晶片組匯流排。例如，匯流排1405通訊地將處理單元1410與GPU1415、唯讀記憶體1430、系統記憶體1420以及永久儲存裝置1435連接。

處理單元1410從這些各種存儲單元檢索要執行指令以及要處理的資料以執行本發明的進程。處理單元可以是單個處理器或者不同實施例中的多核處理器。一些指令被傳輸到GPU 1415並由其執行。GPU 1415可以分流各種計算或者實施由處理單元1410提供的影像處理。

唯讀記憶體(ROM)1430存儲處理單元1410以及電子系統的其他模組所需要靜態資料以及指令。另一方面，永久儲存裝置1435是讀寫儲存裝置。這一裝置是即使在電子系統1400是關閉時存儲指令以及資料的非揮發性存儲單元。本發明的一些實施例使用大型存放區裝置(如磁性或光碟及其對應的磁碟機)作為永久儲存裝置1435。

其他實施例使用可移除儲存裝置(如軟碟、閃速儲存裝置等等，以及其對應的硬碟驅動器)作為永久儲存裝置。類似於永久儲存裝置1435，系統記憶體1420是讀寫記憶體裝置。然而，不同於儲存裝置1435，系統記憶體1420是揮發性讀寫記憶體，如隨機存取記憶體。系統記憶體1420存儲處理器在運行時所需要的一些指令以及資料。在一些實施例中，根據本發明的進程被存儲於系統記憶體1420、永久儲存裝置1435與/或唯讀記憶體1430中。例如，根據一些實施例，各種記憶體單元包括用於處理多媒體剪輯的指令。處理單元1410從這各種記憶體檢索要執行的指令以及要處理的資料以執行一些實施例的進程。

匯流排1405也連接輸入以及輸出裝置1400與1445。輸入裝置1440使使用者能夠向電子系統傳送資訊以及選擇命令。輸入裝置1440包括字母鍵盤以及定位裝置(也稱為“指標控制裝置”)、攝像機(如，網路攝像機)、用於接收聲音命令的麥克風或類似裝置等等。輸出裝置1445顯示有電子系統生成的圖像或者其他輸出資料。輸出裝置1445包括印表機以及顯示裝置，例如陰極射線管(CRT)或液晶顯示(LCD)以及揚聲器或類似的聲音輸出裝置。一些實施例包括如同時作為輸入以及輸出裝置的觸控式螢幕的裝置。

最後，如第14圖所示，匯流排1405也通過網路介面卡(未示出)將電子系統1400耦合到網路1425。這樣，電腦可以是電腦網路(如局域網“LAN”)、廣域網路(WAN)或內聯網或者如網際網路的複數個網路的網路的一部分。電子系統1400的任何或所有元件可以與本發明結合使用。

一些實施例包括電子元件，如微處理器、以機器可讀或電腦可讀媒介(或者稱為電腦可讀存儲媒介、機器可讀媒介或機器可讀存儲媒介)的方式存儲電腦程式指令的儲存區以及記憶體。這種電腦可讀媒介的一些示例包括RAM、ROM、唯讀光碟驅動器(CD-ROM)、可記錄光碟(CD-R)、可再寫光碟(CD-RW)、唯讀數位通用光碟(如，DVD-ROM、雙層DVD-ROM)、各種可記錄/可再寫DVD(如，DVD-RAM、DVD-RW、DVD+RW等等)、閃速記憶體(如，SD卡、小型SD卡、微小型SD卡等等)、磁性與/或固態硬碟驅動器、唯讀以及可記錄藍光光碟、超密集光碟、任何其他光或磁性媒介以及軟碟。電腦可讀媒介可以存儲電腦程式，該電腦程式由至少一個處理單元執行以及包括用於執行各種操作的一組指令。電腦程式或電腦代碼的示例包括如由編譯器生成機器代碼，以及由電腦執行的包括高層級代碼的檔，或者使用注釋器的微處理器。

雖然上述的討論首先指執行軟體的微處理器或複數個處理器，許多上述描述的特徵以及應用由一或複數個積體電路來執行，如特定應用積體電路(ASIC)或現場可程式設計閘陣列(FPGA)。在一些實施例中，這種積體電路執行存儲於其自身中的指令。此外，一些實施例執行存儲於可程式設計邏輯裝置(PLD)、ROM或RAM裝置的軟體。

如在這一說明書以及這一申請任何申請專利範圍中使用的，術語“電腦”、“伺服器”、“處理器”以及“記憶體”都指電子或其他科技裝置。這些術語不包括人或人群。出於說明書的目的，術語顯示(display)或顯示(displaying)意味著在電子裝置上顯示。如在這一說明書以及這一應用任何申請專利範圍中所使用的，術語“電腦可讀媒介”、“電腦可讀媒介”以及“機器可讀媒介”被完全限制為有形、物理物件，其以電腦可讀的形式存儲資訊。這些術語不包括無線訊號、有線下載訊號以及任何其他短暫的訊號。

雖然本發明已經參考許多特定細節進行描述，本領域普通技術人員將意識到本發明可以在不背離本發明精神的情況下，以其他特定形式實施。此外，許多圖式(包括第10圖以及底13圖)概念地示出了進程。這些進程的具體操作可以不以示出以及所描述的精確次序執行。特定操作可以不以一個連續的操作執行，以及不同的特定操作可以在不同的實施例中被執行。此外，進程可以使用各種子進程或作為較大宏進程的一部分來實施。因此，本領域普通技術人員將理解，本法不限於前述示出的細節，而是由所附申請專利範圍來定義。

附注

本發明所描述的主題有時示出了包括在不同其他元件中或者與不同的其他元件連接的不同元件。將能理解，這種描述的架構僅是示例，以及事實上實現相同功能的許多其他架構可以被實施。概念上來講，實現相同功能的複數個元件的任何安排是有效“關聯地”以致實現所需要的功能。因此，被組合來實現特定功能的本文中任何兩個元件可以被視為彼此“關聯”以致實現所期望的功能，而不管架構或中間元件。同樣地，相關聯的任何兩個元件也可以被視為彼此“可操作地連接”或“可操作地耦合”來實現所期望的功能，以及能夠相關聯的任何兩個元件也可以被視為彼此“可操作地耦合”來實現所期望的功能。可操作地耦合的具體示例包括但不限於物理可匹配與/或物理上交互的元件與/或無線地可交互與/或無線交互的元件與/或邏輯交互與/或邏輯可交互的元件。

進一步地，關於本文中基本上任何複數與/或單數術語的使用，本領域這些技術人員可以根據上下文與/或應用將複數轉換成單數與/或從單數轉換為複數。為了清楚起見，在此可以明確地闡述各種單數/複數排列。

此外，本領域這些技術人員將理解，通常，本文中所使用尤其是所附申請專利範圍中的術語，如所附申請專利範圍的主體部分通常被認為是“開放式”術語，如術語“包括(including)”應當被解釋為“包括但不限於”，術語“具有”應當被解釋為“至少具有”，術語“包括(include)”應當被解釋為“包括但不限於”等等。本領域技術人員將進一步理解，如果所介紹的申請專利範圍表述旨在引入具體的數目，這一意圖將會在申請專利範圍中明確表述，並且在不存在這種表述時沒有這種意圖存在。例如，為了幫助理解，後文的所附申請專利範圍可以包含介紹性短語“至少一個”以及“一或複數個”的使用來介紹申請專利範圍的表述。然而，這種短語的使用將不被解釋為暗示由不定冠詞“一(a)”或“一(an)”的申請專利範圍表述的引入將包含這種所引入的申請專利範圍表述限制為僅包含一個這種表述的實現方式，即使當相同的申請專利範圍包括介紹性短語“一或複數個”或“至少一個”以及如“一(a)”或“一(an)”的不定冠詞時，例如“一(a)”與/或一(an)應當被解釋為意為“至少一個”或“一或複數個”，相同的規則對用於介紹申請專利範圍表述的定冠詞的使用也適用。此外，即使所介紹的申請專利範圍表述的具體數目是明確表述的，本領域技術人員將理解，這種表述應該被解釋為至少所表述的數目，例如，沒有其他修飾的情況下，僅“兩個表述”的表述意為至少兩個表述或者兩個或複數個表述。此外，在類似於使用“至少一個A、B以及C”的慣例的這些情況下，通常這種結構在本領域技術人員理解該慣例的意義上是有意的，例如，“具有至少一個A、B或C的系統”將包括但不限於單獨具有A、單獨具有B、單獨具有C、一起具有A與B、一起具有A與C、一起具有B與C與/或一起具有A、B與C的系統等等。在類似於使用“至少一個A、C或C”的慣例的這些情況下，通常這種結構旨在本領域技術人員將理解這種慣例的意義上是有意的，例如，“具有至少一個A、B或C的系統”將包括但不限於單獨具有A、單獨具有B、單獨具有C、一起具有A與B、一起具有A與C、一起具有B與C與/或一起具有A、B與C的系統等等。本領域這些技術人員將進一步理解，實際上，表示兩個或複數個可替換術語的任何連接詞與/或短語，無論是在細節描述、申請專利範圍或圖示中，將被理解為考慮包括這些術語中一個、這些術語中任一個或這兩個術語的可能性，例如，“A或B”將被理解為包括“A或B”或“A與B”的可能性。

根據前述內容，將能理解，為了說明的目的，本公開的各種實施方式已在本文中被描述，並且在不背離本公開的範圍以及精神的情況下，可以對本公開進行修正。因此，不旨在限於本文所描述的各種實施方式，真正的範圍以及精神由後續申請專利範圍來指示。

100:熵編解碼器

105:圖像

110:當前塊

111~113:相鄰塊

115:已編碼像素資料

120:分割指示符

121:像素解碼器

130:上下文模型

135:所選擇的上下文模型

140:上下文模型選擇模組

145:上下文索引

190、895、1195:位元流

800:視訊編碼器

805:視訊源

808:減法器

810:轉換模組

811:量化模組

812、1112:已量化係數

813、1113:已預測像素資料

814、1105:逆量化模組

815、1115:逆轉換模組

816、1116:轉換係數

817:已重構像素資料

819:重構殘差

820:幀內圖像估計模組

825、1125:幀內圖像預測模組

830、1130:運動補償模組

835:運動估計模組

840、1140:幀間預測模組

845、1145:環路濾波器

850:重構圖像緩衝器

865、1165:MV緩衝器

875、1175:MV預測模組

890:熵編碼器

910、1210:語法元素選擇模組

920、1220:上下文選擇模組

930、1230:上下文模型儲存區

940:二值化模組

950:箱編碼引擎

960、1260:上下文模型更新模組

1010~1040、1310~1340:步驟

1100:視訊解碼器

1117:已解碼像素資料

1119:已重構殘差訊號

1150:解碼圖像緩衝器

1155:顯示裝置

1190:熵解碼器

1240:解二值化模組

1250:箱解碼引擎

1400:電子系統

1405:匯流排

1410:處理單元

1415:影像處理單元

1420:系統記憶體

1425:網路

1430:唯讀記憶體

1435:永久儲存裝置

1440:輸入裝置

1445:輸出裝置

附圖被包括來提供本發明的進一步理解以及被併入其中並構成本發明的一部分。圖式示出了本發明的實施方式以及與描述一起用於解釋本發明的原理。應當理解，因為為了清楚地說明本發明的概念，一些元件可以被示出為與實際實施方式中的尺寸不成比例，圖式不需要按比例繪製。

第1圖概念性示出了熵編解碼器，其基於當前塊或者其相鄰塊的分割結構選擇用於熵編解碼當前像素塊的分割指示符的一上下文模型。

第2圖概念性示出了由二叉樹拆分的一編碼單元(CU)的分割。

第3圖示出了在表示編碼樹單元(CTU)到複數個CU的分割的四叉樹(QT)拆分結構上構建的編碼樹。

第4圖概念性示出了由四叉樹拆分以及二叉樹拆分兩者來分割一CU。

第5圖示出了MTT結構中用於分割一CTU的各種拆分類型或模式。

第6圖示出了一些實施例中用於發信一CTU的分割結構的一決策樹。

第7圖示出了一些實施例中用於發信一CTU的分割結構的一可替換決策樹。

第8圖示出了一示例性視訊編碼器，其藉由使用當前塊或者其相鄰塊的分割結構來熵編碼一當前塊的一分割指示符以執行上下文建模。

第9圖示出了視訊編碼器的一部分，其基於當前塊或者其相鄰塊的分割結構選擇用於熵編碼一當前像素塊的一分割指示符的一上下文模型。

第10圖概念性示出了用於編碼當前像素塊的進程，其中分割指示符的上下文建模以當前塊或者其相鄰塊的分割結構為條件。

第11圖示出了示例性視訊解碼器，其藉由使用當前塊或者其相鄰塊的分割結構熵解碼當前塊的分割指示符來執行上下文建模。

第12圖示出了視訊解碼器的一部分，其基於當前塊或者其相鄰塊的分割結構選擇用於熵編解碼一當前像素塊的一分割指示符的一上下文模型。

第13圖概念性示出了用於解碼當前像素塊的進程，其中分割指示符的上下文建模以當前塊或者其相鄰塊的分割結構為條件。

第14圖概念性示出了實施本發明的一些實施例的一電子系統。

1310~1340:步驟

Claims

一種解碼方法，包括：接收一位元流，該位元流包括將被編碼的一圖像的一當前像素塊的資料以及一分割指示符，其中該當前像素塊根據該分割指示符被分割；基於該當前像素塊的一分割結構或者該當前像素塊的一相鄰像素塊的一分割結構，選擇用於該分割指示符的一上下文模型；藉由使用所選擇的該上下文模型熵解碼該分割指示符；以及藉由使用該分割指示符解碼該當前像素塊；其中該分割指示符指示是否執行該當前像素塊的二叉樹拆分或多類型拆分，其中該上下文模型是根據ctxIncMtt=(((widthC>widthA)？1：0)+(heightC>heightL)？1：0))+(3*(btDepthC<T2 ？ 0：1)來選擇，其中ctxIncMtt是上下文索引增量，widthC以及widthA分別表示該當前像素塊以及一上方相鄰像素塊的寬度，以及heightC以及heightL分別表示該當前像素塊以及一左邊相鄰像素塊的高度，以及btDepthC表示該當前像素塊的一二叉樹深度，以及T2是一閾值。
一種解碼方法，包括：接收一位元流，該位元流包括將被編碼的一圖像的一當前像素塊的資料以及一分割指示符，其中該當前像素塊根據該分割指示符被分割；基於該當前像素塊的一分割結構或者該當前像素塊的一相鄰像素塊的一分割結構，選擇用於該分割指示符的一上下文模型；藉由使用所選擇的該上下文模型熵解碼該分割指示符；以及藉由使用該分割指示符解碼該當前像素塊；其中該分割指示符指示是否執行該當前像素塊的四叉樹拆分，該上下文模型是基於ctxIncQt=(((qtDepthC<qtDepthA)？ 1：0)+((qtDepthC<qtDepthL)？1：0))+(3*(qtDepthC<T1？ 0：1))來選擇，其中ctxIncQt表示上下文索引增量，qtDepthC、qtDepthA以及qtDepthL分別表示該當前像素塊、一上方相鄰像素塊以及一左邊相鄰像素塊的四叉樹深度，以及T1是一閾值。
如申請專利範圍第2項所述之解碼方法，其中該閾值是2。
一種編碼方法，包括：接收一圖像的一當前像素塊；接收用於分割該當前像素塊的一分割指示符；基於該當前像素塊的一分割結構或者該當前像素塊的一相鄰像素塊的一分割結構，選擇用於該分割指示符的一上下文模型；以及藉由根據該分割指示符來分割該當前像素塊，將該當前像素塊編碼進一位元流，其中藉由使用所選擇的該上下文模型，該分割指示符被熵編碼為一位元流的一語法元素；其中該分割指示符指示是否執行該當前像素塊的二叉樹拆分或多類型拆分，其中該上下文模型是根據ctxIncMtt=(((widthC>widthA)？1：0)+(heightC>heightL)？1：0))+(3*(btDepthC<T2 ？ 0：1)來選擇，其中ctxIncMtt是上下文索引增量，widthC以及widthA分別表示該當前像素塊以及一上方相鄰像素塊的寬度，以及heightC以及heightL分別表示該當前像素塊以及一左邊相鄰像素塊的高度，以及btDepthC表示該當前像素塊的一二叉樹深度，以及T2是一閾值。
一種編碼方法，包括：接收一圖像的一當前像素塊；接收用於分割該當前像素塊的一分割指示符；基於該當前像素塊的一分割結構或者該當前像素塊的一相鄰像素塊的一分割結構，選擇用於該分割指示符的一上下文模型；以及藉由根據該分割指示符來分割該當前像素塊，將該當前像素塊編碼進一位元流，其中藉由使用所選擇的該上下文模型，該分割指示符被熵編碼為一位元流的一語法元素；其中該分割指示符指示是否去執行該當前像素塊的四叉樹拆分，以及其中該上下文模型根據ctxIncQt=(((qtDepthC<qtDepthA)？ 1：0)+((qtDepthC<qtDepthL)？1：0))+(3*(qtDepthC<T1？ 0：1))來選擇，其中ctxIncQt表示上下文索引增量，qtDepthC、qtDepthA以及qtDepthL分別表示該當前像素塊、一上方相鄰像素塊、以及一左邊相鄰像素塊的該四叉樹深度，以及T1是被設置為2的一閾值。
一種電子裝置，包括：一視訊解碼器電路，能夠：接收一位元流，該位元流包括將被解碼的一圖像的一當前像素塊的資料以及一分割指示符，其中該當前像素塊根據該分割指示符被分割；基於該當前像素塊的一分割結構或該當前像素塊的一相鄰像素塊的一分割結構選擇用於該分割指示符的一上下文模型；藉由使用所選擇的該上下文模型熵解碼該分割指示符；以及藉由使用該分割指示符解碼該當前像素塊；其中該分割指示符指示是否去執行該當前像素塊的二叉樹拆分或多類型拆分，以及其中該上下文模型時根據ctxIncMtt=(((widthC>widthA)？1：0)+(heightC>heightL)？1：0))+(3*(btDepthC<T2 ？ 0：1)來選擇，其中ctxIncMtt是上下文索引增量，widthC以及widthA分別表示該當前像素塊以及一上方相鄰像素塊的的寬度，以及heightC以及heigthL分別表示該當前像素塊以及一左邊相鄰像素塊的高度，以及btDepthC表示該當前像素塊的一二叉樹深度，以及T2是一閾值。
一種電子裝置，包括：一視訊解碼器電路，能夠：接收一位元流，該位元流包括將被解碼的一圖像的一當前像素塊的資料以及一分割指示符，其中該當前像素塊根據該分割指示符被分割；基於該當前像素塊的一分割結構或該當前像素塊的一相鄰像素塊的一分割結構選擇用於該分割指示符的一上下文模型；藉由使用所選擇的該上下文模型熵解碼該分割指示符；以及藉由使用該分割指示符解碼該當前像素塊；其中該分割指示符指示是否執行該當前像素塊的四叉樹拆分，該上下文模型是基於ctxIncQt=(((qtDepthC<qtDepthA)？ 1：0)+((qtDepthC<qtDepthL)？1：0))+(3*(qtDepthC<T1？ 0：1))來選擇，其中ctxIncQt表示上下文索引增量，qtDepthC、qtDepthA以及qtDepthL分別表示該當前像素塊、一上方相鄰像素塊以及一左邊相鄰像素塊的四叉樹深度，以及T1是一閾值。