TW201703535A

TW201703535A - 畫面間預測的運動向量預測方法與裝置

Info

Publication number: TW201703535A
Application number: TW105134375A
Authority: TW
Inventors: 金壹求
Original assignee: 三星電子股份有限公司
Priority date: 2012-07-02
Filing date: 2013-07-02
Publication date: 2017-01-16
Also published as: BR112014033038A2; AU2013285749A1; EP2863631A4; AU2016225775B2; MX2015000096A; US10200710B2; RU2015103123A; JP2015525547A; TWI574553B; IN2015MN00119A; AU2017216496B2; KR20150146471A; US20190158866A1; MX358773B; TWI604721B; KR20150009494A; RU2624578C2; RU2673846C1; AU2013285749B2; SG11201408725WA

Abstract

提供用於對視訊做編碼以及解碼的運動向量預測方法與裝置。所述運動向量預測方法包含：自當前區塊的相鄰區塊決定經參考以便預測所述當前區塊的運動向量的多個候選區塊；基於所述多個候選區塊中的第一候選區塊的參考影像以及所述當前區塊的參考影像各自是否為長期參考影像而決定所述第一候選區塊的候選運動向量；以及藉由使用包含所述第一候選區塊的所述所決定的候選運動向量以及剩餘候選區塊的候選運動向量的候選運動向量清單來決定所述當前區塊的所述運動向量。

Description

畫面間預測的運動向量預測方法與裝置

本揭露是關於對視訊做編碼及解碼，且更特定而言，是關於藉由執行畫面間預測及/或運動補償來對視訊做編碼及解碼。

隨著用於再生以及儲存高解析度或高品質視訊內容的硬體正被開發以及供應，對用於有效地對高解析度或高品質視訊內容做編碼或解碼的視訊編解碼器的需要增加。在習知視訊編解碼器中，基於具有預定大小的巨集區塊而根據有限編碼方法來對視訊做編碼。

藉由使用頻率變換而將空間域中的影像資料轉換為頻域中的係數。在視訊編解碼器中，將影像分割為具有預定大小的區塊，且對每一區塊執行離散餘弦變換（discrete cosine transformation，DCT）以便以區塊為單位來對頻率係數做編碼，以便迅速地執行頻率變換。相比空間域中的影像資料，頻域中的係數易於壓縮。特定而言，由於經由視訊編解碼器的畫面間預測或畫面內預測以預測誤差來表達空間域中的影像像素值，因此在對預測誤差執行頻率變換時，可將大量資料轉換為0。視訊編解碼器以具有較小大小的資料來替換連續且重複出現的資料，藉此減少資料量。

本揭露提供一種用於經由運動向量預測而決定運動向量的方法與裝置，且提供一種伴隨有經由運動向量預測而進行的畫面間預測以及運動補償的視訊編碼的方法與裝置，以及一種伴隨有經由運動向量預測而進行的運動補償的視訊解碼的方法與裝置。

根據本揭露的一或多個實施例，提供一種用於畫面間預測的運動向量預測方法，所述運動向量預測方法包含：自當前區塊的相鄰區塊決定經參考以便預測所述當前區塊的運動向量的多個候選區塊；基於所述多個候選區塊中的第一候選區塊的參考影像以及所述當前區塊的參考影像各自是否為長期參考影像而決定所述第一候選區塊的候選運動向量；以及藉由使用包含所述第一候選區塊的所述所決定的候選運動向量以及剩餘候選區塊的候選運動向量的候選運動向量清單來決定所述當前區塊的所述運動向量。

根據本文所揭露的一或多個實施例，在當前區塊以及所述當前區塊的參考影像中的至少一者為長期參考影像時，省略調整候選區塊的運動向量的大小的操作或參考所述候選區塊的所述運動向量的操作，且可藉由參考具有相對高的預測準確度的另一候選區塊的運動向量來預測所述當前區塊。因此，可改良預測運動向量的操作的效率。

根據本文所揭露的實施例，提供一種用於畫面間預測的運動向量預測方法，所述運動向量預測方法包含：自當前區塊的相鄰區塊決定經參考以便預測所述當前區塊的運動向量的多個候選區塊；基於所述多個候選區塊中的第一候選區塊的參考影像以及所述當前區塊的參考影像各自是否為長期參考影像而決定所述第一候選區塊的候選運動向量；以及藉由使用包含所述第一候選區塊的所述所決定的候選運動向量以及剩餘候選區塊的候選運動向量的候選運動向量清單來決定所述當前區塊的所述運動向量。

所述第一候選區塊的所述候選運動向量的所述決定可包含：在所述當前區塊的所述參考影像以及所述第一候選區塊的所述參考影像兩者為長期參考影像時，將所述第一候選區塊的當前運動向量決定為所述第一候選區塊的所述候選運動向量。

所述第一候選區塊的所述候選運動向量的所述決定可包含：在所述當前區塊的所述參考影像以及所述第一候選區塊的所述參考影像兩者為短期參考影像時，基於當前影像與所述當前區塊的所述參考影像之間的距離與所述第一候選區塊的影像與所述第一候選區塊的所述參考影像之間的距離的比率來改變所述第一候選區塊的當前運動向量；以及將所述改變的當前運動向量決定為所述第一候選區塊的所述候選運動向量。

所述第一候選區塊可為包含所述當前區塊的當前影像中的所述當前區塊的相鄰區塊，或在早於所述當前影像而復原的影像中處於與所述當前區塊相同的位置的搭配區塊。

根據本文所揭露的實施例，提供一種用於畫面間預測的運動向量預測裝置，所述運動向量預測裝置包含：候選區塊決定器，用於自當前區塊的相鄰區塊決定經參考以便預測所述當前區塊的運動向量的多個候選區塊，且基於所述多個候選區塊中的第一候選區塊的參考影像以及所述當前區塊的參考影像各自是否為長期參考影像而決定所述第一候選區塊的候選運動向量；以及運動向量決定器，用於藉由使用包含所述第一候選區塊的所述所決定的候選運動向量以及剩餘候選區塊的候選運動向量的候選運動向量清單來決定所述當前區塊的所述運動向量。

根據本文所揭露的實施例，提供一種電腦可讀記錄媒體，其上記錄有用於執行所述運動向量預測方法的程式。

下文中，將參照圖1至圖4B來描述根據本揭露的實施例的運動向量預測裝置以及運動向量決定方法。且將參照圖5及圖8來描述根據本揭露的實施例的伴隨有運動向量預測方法的視訊編碼方法及視訊解碼方法以及視訊編碼裝置及視訊解碼裝置。且將參照圖9至圖21來描述根據本揭露的實施例的伴隨有運動向量預測操作且基於具有樹狀結構的編碼單元的視訊編碼操作以及視訊解碼操作。下文中，「影像」可表示視訊的靜態影像或動態影像或視訊自身。

首先，將參照圖1至圖4B來描述根據本文所揭露的實施例的運動向量預測裝置以及運動向量決定方法。接著，將參照圖5及圖8來描述根據本文所揭露的實施例的伴隨有運動向量預測方法的視訊編碼方法及視訊解碼方法以及視訊編碼裝置及視訊解碼裝置。

圖1為根據本揭露的實施例的運動向量預測裝置10的方塊圖。

運動向量預測裝置10包含候選區塊決定器12以及運動向量決定器14。

畫面間預測使用當前影像與另一影像之間的相似性。自早於當前影像而復原的參考影像偵測類似於當前影像的當前區域的參考區域。當前區域的坐標與參考區域的坐標之間的距離表達為運動向量，且當前區域的像素值與參考區域的像素值之間的差表達為殘餘資料。因此，替代於直接輸出當前區域的影像資訊，可經由當前區域的畫面間預測來輸出指示參考影像、運動向量以及殘餘資料的索引。

根據實施例的運動向量預測裝置10可根據視訊的每一影像的區塊來執行畫面間預測。區塊可具有正方形形狀、矩形形狀或任意幾何形狀且不限於具有預定大小的資料單元。根據實施例的區塊可為根據樹狀結構的編碼單元中的最大編碼單元、編碼單元、預測單元或變換單元。稍後將參照圖9至圖21來描述基於根據樹狀結構的編碼單元的視訊編碼及解碼操作。

用於當前影像的畫面間預測的參考影像必須早於當前影像而解碼。根據實施例的用於畫面間預測的參考影像可分類為短期參考影像以及長期參考影像。經解碼圖像緩衝器儲存經由先前影像的運動補償而產生的所復原的影像。所產生的所復原的影像可用作用於其他影像的畫面間預測的參考影像。因此，用於當前影像的畫面間預測的至少一個短期參考影像或至少一個長期參考影像可選自儲存於經解碼圖像緩衝器中的所復原的影像。短期參考影像可為根據解碼次序在當前影像之前不久或最近解碼的影像，而長期參考影像可為遠早於當前影像而解碼但被選擇且儲存於經解碼圖像緩衝器中以用作用於其他影像的畫面間預測的參考影像的影像。

對於運動向量預測、預測單元（prediction unit，PU）合併或進階運動向量預測（advanced motion vector prediction，AMVP），可藉由參考另一區塊的運動向量來決定當前區塊的運動向量。

運動向量預測裝置10可藉由參考空間上或時間上鄰近於當前區塊的另一區塊的運動向量來決定當前區塊的運動向量。運動向量預測裝置10可決定包含可加以參考的候選區塊的多個運動向量的候選運動向量清單。運動向量預測裝置10可藉由參考選自候選運動向量清單的一個運動向量來決定當前區塊的運動向量。

候選區塊決定器12可自當前區塊周圍的相鄰區塊決定可經參考以便預測當前區塊的運動向量的多個候選區塊。

根據本揭露的實施例的候選區塊可為當前區塊的當前影像中的鄰近於所述當前區塊的相鄰區塊，或在早於所述當前影像而復原的影像中處於與所述當前區塊相同的位置的搭配區塊。

運動向量決定器14可產生候選運動向量清單，所述候選運動向量清單包含經參考以便預測當前區塊的運動向量的多個候選區塊的候選運動向量。

運動向量決定器14可基於候選區塊的參考影像以及當前區塊的參考影像各自是否為長期參考影像而將多個候選區塊中的一候選區塊的運動向量決定為候選運動向量以成為候選運動向量清單中的一個候選運動向量。運動向量決定器14可選擇候選區塊的當前運動向量作為候選運動向量，或縮放當前運動向量且接著選擇經縮放的當前運動向量作為候選運動向量。所決定的候選運動向量可包含於候選運動向量清單中。

當候選區塊的參考影像不同於當前區塊的參考影像時，運動向量決定器14可決定當前區塊的參考影像以及候選區塊的參考影像各自是否為長期參考影像。運動向量決定器14可基於當前區塊以及候選區塊的參考影像各自為短期參考影像還是長期參考影像而決定如何使用候選區塊的運動向量。

在當前區塊的參考影像以及候選區塊的參考影像兩者為長期參考影像時，運動向量決定器14可將候選區塊的當前運動向量決定為候選運動向量。此處，候選區塊的當前運動向量包含於候選運動向量清單中而不進行縮放。

在當前區塊的參考影像以及候選區塊的參考影像兩者為短期參考影像時，運動向量決定器14可縮放候選區塊的當前運動向量。此處，候選區塊決定器12可基於當前影像與當前區塊的參考影像之間的距離與候選區塊的影像與候選區塊的參考影像之間的距離的比率來縮放候選區塊的當前運動向量。運動向量決定器14可將候選區塊的經縮放的當前運動向量包含在候選運動向量清單中。

在當前區塊的參考影像以及候選區塊的參考影像中的一者為短期參考影像且另一者為長期參考影像時，運動向量決定器14可決定不使用候選區塊的運動向量作為候選運動向量清單的候選運動向量。可將候選區塊的參考可能性資訊設定為停用狀態。

或者，在當前區塊的參考影像以及候選區塊的參考影像中的一者為短期參考影像且另一者為長期參考影像時，可將第一候選區塊的候選運動向量設定為0。

運動向量決定器14可自候選運動向量清單決定至少一個候選運動向量，且可藉由使用所選擇的至少一個候選運動向量來決定當前區塊的運動向量。運動向量決定器14可複製、組合或修改所述至少一個候選運動向量以決定當前區塊的運動向量。

圖2為說明根據本揭露的實施例的運動向量預測方法的流程圖。

可藉由使用根據本揭露的實施例的運動向量預測裝置10使用時間上或空間上鄰近於當前區塊的區塊的運動向量來預測當前區塊的運動向量。或者，可決定能夠預測運動向量的多個候選區塊，可選擇所述候選區塊中的一者，且可藉由參考所述所選擇的候選區塊的運動向量來決定當前區塊的運動向量。

當由候選區塊中的預定候選區塊的參考索引指示的參考影像不同於當前區塊的參考影像，且運動向量預測裝置10藉由參考所述預定候選區塊的運動向量來預測當前區塊的運動向量時，即使縮放了預定候選區塊的運動向量，但所預測的運動向量的準確度可仍較低。因此，在當前區塊的參考影像與預定候選區塊的參考影像彼此不同時，運動向量預測裝置10可決定是否縮放並參考預定候選區塊的運動向量或是否不參考對應運動向量。

現將參考圖2的操作21、23及25來描述運動向量預測方法，其中由運動向量預測裝置10自候選區塊的運動向量預測當前區塊的運動向量。

在操作21中，運動向量預測裝置10可自空間上鄰近於當前區塊的相鄰區塊或時間上早於或緊接著當前影像的影像中處於與當前區塊相同的位置的區塊決定待參考的候選區塊。

在操作23中，運動向量預測裝置10可基於當前區塊的參考影像以及第一候選區塊的參考影像各自是否為長期參考影像而將第一候選區塊的運動向量決定為當前區塊的候選運動向量。

在操作25中，運動向量預測裝置10可決定候選運動向量清單，所述候選運動向量清單包含第一候選區塊的候選運動向量以及剩餘候選區塊的候選運動向量。運動向量預測裝置10可藉由使用候選運動向量清單中的至少一個候選運動向量來決定當前區塊的運動向量。

當第一候選區塊的參考影像不同於當前區塊的參考影像時，運動向量預測裝置10可基於當前區塊的參考影像以及第一候選區塊的參考影像各自為短期參考影像還是長期參考影像來決定是否使用第一候選區塊的運動向量作為候選運動向量清單中的候選運動向量。

運動向量預測裝置10可藉由使用指示當前區塊的參考影像是否為長期參考影像的長期參考索引來決定當前區塊的參考影像是否為長期參考影像。類似地，藉由使用所述第一候選區塊的長期參考索引來決定所述第一候選區塊的所述參考影像是否為所述長期參考影像。

在操作25中，在當前區塊以及第一候選區塊的參考影像兩者為長期參考影像時，運動向量預測裝置10可將第一候選區塊的當前運動向量包含於候選運動向量清單中，而不縮放第一候選區塊的當前運動向量。

在操作25中，當參考影像中的一者為短期參考影像且另一者為長期參考影像時，可決定第一候選區塊的運動向量不用於候選運動向量清單中。

在操作25中，當所述參考影像兩者為短期參考影像時，可根據當前影像與當前區塊的參考影像之間的距離與第一候選區塊的影像與第一候選區塊的參考影像之間的距離的比率來縮放第一候選區塊的當前運動向量。經縮放的當前運動向量可包含於候選運動向量清單中。

運動向量預測裝置10可經由操作21、23以及25來決定候選運動向量清單。當參考影像中僅一者為長期參考影像時，運動向量預測裝置10將第一候選區塊的運動向量排除於候選運動向量清單以外，且因此不參考第一候選區塊的運動向量。因此，運動向量預測裝置10可藉由參考候選運動向量清單中的剩餘運動向量來決定當前區塊的運動向量。

當所述參考影像兩者為長期參考影像時，運動向量預測裝置10將第一候選區塊的運動向量包含至候選運動向量清單中而不進行縮放。因此，運動向量預測裝置10可自第一候選區塊的運動向量以及剩餘候選運動向量選擇最佳參考運動向量，且基於所選擇的的最佳參考運動向量來決定當前區塊的運動向量。

當所述參考影像兩者為短期參考影像時，運動向量預測裝置10縮放第一候選區塊的當前運動向量且將經縮放的當前運動向量作為候選運動向量包含至候選運動向量清單中。因此，運動向量預測裝置10可自第一候選區塊的候選運動向量以及剩餘候選運動向量選擇最佳參考運動向量，且藉由使用所選擇的的最佳參考運動向量來決定當前區塊的運動向量。

如上所述，根據上文參照圖1及圖2而描述的運動向量預測裝置10以及運動向量預測方法，當參考影像中的至少一者為長期參考影像時，可省略縮放候選區塊的運動向量的操作或參考候選區塊的運動向量的操作。

換句話說，若在當前區塊的參考影像以及候選區塊的參考影像彼此不同且所述參考影像中的至少一者為長期參考影像時，藉由參考候選區塊的運動向量來預測當前區塊的運動向量，則所預測的運動向量的準確度可較低。因此，可省略參考預測準確度較低的候選區塊的運動向量的操作，且可藉由參考預測準確度相對高的另一候選區塊的運動向量來預測當前區塊。因此，可改良預測運動向量的效率。

圖3說明根據本揭露的實施例的空間上鄰近於當前區塊20的相鄰區塊。

為了預測當前區塊20的編碼資訊，可參考空間上鄰近於當前區塊20的相鄰區塊中的區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 中的至少一者的編碼資訊。在圖3中，區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 的大小並不展示相鄰區塊的實際大小。此處，區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 展示相對於當前區塊20位於相對方向上的區塊。

區塊的x坐標自左向右增大且區塊的y坐標自上向下增大。區塊A₀ 可為包含x坐標及y坐標兩者小於左下方樣本的樣本的區塊。區塊A₁ 可為包含x坐標小於左下方樣本但y坐標與左下方樣本相同的樣本的區塊。區塊B₀ 可為包含x坐標及y坐標兩者大於右上方樣本的樣本的區塊。區塊B₁ 可為包含y坐標小於右上方樣本但x坐標與右上方樣本相同的樣本的區塊。區塊B₂ 可為包含x坐標及y坐標兩者小於左上方樣本的樣本的區塊。

運動向量預測裝置10可使用區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 作為候選區塊以便預測當前區塊20的運動向量。因此，運動向量預測裝置10可參考當前區塊20周圍的相鄰區塊中的區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 的編碼資訊。

運動向量預測裝置10可藉由使用候選運動向量清單中所包含的候選運動向量來決定將成為當前區塊的參考區塊且預測資訊將與當前區塊20的預測資訊合併的候選區塊。可將所決定的候選區塊的預測資訊作為當前區塊的預測資訊來編碼。

舉例而言，當區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 中的區塊A₀ 的編碼資訊與當前區塊20的編碼資訊相同時，當前區塊20可與區塊A₀ 合併且與區塊A₀ 一起編碼。藉由合併當前區塊20與區塊A₀ ，不重複地對區塊A₀ 與當前區塊20的編碼資訊的重疊部分做編碼。因此，當編碼器輸出區塊A₀ 的編碼資訊時，可以不再次輸出當前區塊20的編碼資訊。即使當接收器剖析包含相互合併的當前區塊20以及區塊A₀ 的區塊的編碼資訊時不剖析當前區塊20的編碼資訊，解碼器仍可藉由使用針對區塊A₀ 而預先剖析的編碼資訊來對當前區塊20做解碼。

運動向量預測裝置10可藉由組合候選運動向量清單中的候選運動向量中的至少一者來預測當前區塊20的運動向量。

當預測運動向量時，可藉由使用鄰近於當前區塊20而安置的區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 的運動向量來決定當前區塊20的運動向量。可藉由使用區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 的運動向量估計子（motion vector estimator）來決定當前區塊20的運動向量估計子。或者，可藉由使用區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 的兩個或兩個以上運動向量（運動向量估計子）的組合來決定當前區塊20的運動向量估計子。

因此，可自區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 的運動向量（運動向量估計子）中的至少一者來預測當前區塊20的運動向量（運動向量估計子）。因此，當編碼器首先對區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 的運動向量（運動向量估計子）做編碼且輸出所述運動向量（運動向量估計子）時，編碼器可以不對當前區塊20的運動向量（運動向量估計子）做編碼。即使當未接收到當前區塊20的運動向量（運動向量估計子）時，解碼器亦可藉由使用區塊A₀ 、區塊A₁ 、區塊B₀ 、區塊B₁ 以及區塊B₂ 的運動向量（運動向量估計子）中的至少一者來預測當前區塊20的運動向量（運動向量估計子）。

下文中，將參照圖4A及圖4B來描述根據候選區塊的類型的運動向量預測方案。

圖4A為用於描述根據本揭露的實施例的候選區塊為另一影像的搭配區塊36時的狀況的圖式。

搭配影像35為早於當前影像30而復原的影像，且可經參考以用於當前影像30中的當前區塊31的畫面間預測。可根據當前區塊31的搭配索引32來決定搭配影像35。

可將處於與當前影像30的當前區塊31相同的位置的搭配影像35的區塊決定為搭配區塊36。運動向量預測裝置10可使用搭配區塊36作為待參考以便預測當前區塊31的運動向量34的候選區塊。因此，可藉由參考搭配區塊36的運動向量37來預測當前區塊31的運動向量34。

可根據由搭配區塊36的參考索引指示的圖像次序號（picture order count，POC）來決定搭配參考影像38。可根據由當前區塊31的參考索引指示的POC來決定當前參考影像33。

然而，當搭配參考影像38與當前參考影像33彼此不同時，運動向量預測裝置10可再次決定是否參考搭配區塊36的運動向量37或如何參考搭配區塊36的運動向量37。

詳細而言，當搭配區塊36的參考索引與當前區塊31的參考索引彼此不同時，運動向量預測裝置10可藉由使用搭配區塊36以及當前區塊31的長期參考索引來決定搭配參考影像38以及當前參考影像33各自為短期參考影像還是長期參考影像。

在當前參考影像33與搭配參考影像38彼此不同但兩者為短期參考影像時，可基於搭配影像35與搭配參考影像38之間的距離Td與當前影像30與當前參考影像33之間的距離Tb的比率來縮放搭配區塊36的運動向量37。此處，可基於當前影像30與搭配參考影像38的POC的差值來決定當前影像30與搭配參考影像38之間的距離Td。類似地，可基於當前影像30與當前參考影像33的POC的差值來決定當前影像30與當前參考影像33之間的距離Tb。

換句話說，在當前參考影像33與搭配參考影像38兩者為短期參考影像時，可將候選運動向量MVcol'更新至藉由將搭配區塊36的運動向量37 MVcol與距離Td與距離Tb的比率相乘而獲得的值。(MVcol' = MVcol * Tb/Td)

因此，在當前參考影像33與搭配參考影像38彼此不同但兩者為短期參考影像時，運動向量預測裝置10可將候選運動向量清單中的搭配區塊36的運動向量37改變為候選運動向量MVcol'。

在當前參考影像33以及搭配參考影像38中的一者為短期參考影像且另一者為長期參考影像時，可將「無法使用」旗標指派給搭配區塊36的運動向量37。在此狀況下，可將搭配區塊36的運動向量37排除於當前影像30的候選運動向量清單以外。

在當前參考影像33以及搭配參考影像38兩者為長期參考影像時，可維持搭配區塊36的運動向量37。在此狀況下，可將搭配區塊36的運動向量37維持於候選運動向量清單中而不進行縮放。

圖4B為用於描述根據本揭露的實施例的候選區塊為同一影像的相鄰區塊46時的狀況的圖式。

運動向量預測裝置10可使用鄰近於當前影像40中的當前區塊41的相鄰區塊46作為待參考以便預測當前區塊41的運動向量44的候選區塊。因此，可藉由參考相鄰區塊46的運動向量47來預測當前區塊41的運動向量44。

可根據由相鄰區塊46的參考索引指示的POC來決定相鄰參考影像48。可根據由當前區塊41的參考索引指示的POC來決定當前參考影像43。

然而，當相鄰參考影像48與當前參考影像43彼此不同時，運動向量預測裝置10可再次決定是否參考相鄰區塊46的運動向量47或如何參考相鄰區塊46的運動向量47。

詳細而言，當相鄰區塊46的參考索引與當前區塊41的參考索引彼此不同時，運動向量預測裝置10可藉由使用相鄰區塊46的長期參考索引以及當前區塊41的長期參考索引來決定相鄰區塊46以及當前參考影像43各自為短期參考影像還是長期參考影像。

然而，當相鄰區塊46與當前參考影像43彼此不同時，運動向量預測裝置10可決定是否參考相鄰區塊46的運動向量47或如何參考相鄰區塊46的運動向量47。

在當前參考影像43與相鄰參考影像48彼此不同但兩者為短期參考影像時，可基於當前影像40與相鄰參考影像48之間的距離Td與當前影像40與當前參考影像43之間的距離Tb的比率來縮放相鄰區塊46的運動向量47。此處，可基於當前影像40與相鄰參考影像48的POC的差值來決定當前影像40與相鄰參考影像48之間的距離Td。類似地，可基於當前影像40與當前參考影像43的POC的差值來決定當前影像40與當前參考影像43之間的距離Tb。

換句話說，在當前參考影像43與相鄰參考影像48兩者為短期參考影像時，可將候選運動向量MVne'更新至藉由將距離Td與距離Tb的比率與搭配區塊46的運動向量47 MVne相乘而獲得的值。(MVne' = MVne * Tb/Td)

因此，在當前參考影像43與相鄰參考影像48彼此不同但兩者為短期參考影像時，運動向量預測裝置10可將候選運動向量清單中的相鄰區塊46的運動向量47改變為候選運動向量MVne'。

在當前參考影像43以及相鄰參考影像48中的一者為短期參考影像且另一者為長期參考影像時，可將「無法使用」旗標指派給相鄰區塊46的運動向量47。在此狀況下，可將相鄰區塊46的運動向量47排除於當前影像40的候選運動向量清單以外。

在當前參考影像43以及相鄰參考影像48兩者為長期參考影像時，可維持相鄰區塊46的運動向量47。在此狀況下，可將相鄰區塊46的運動向量47維持於候選運動向量清單中而不進行縮放。

在圖4A及圖4B中，運動向量預測裝置10可藉由使用當前區塊31或41以及搭配區塊36或相鄰區塊46的長期參考索引來決定當前參考影像33或43與候選區塊（搭配區塊36或相鄰區塊46）的參考影像（搭配參考影像38或相鄰參考影像48）各自為短期參考影像還是長期參考影像，且決定是否參考搭配區塊36或相鄰區塊46的運動向量37或47或是否將搭配區塊36或相鄰區塊46的運動向量37或47在縮放之後參考。

現將參照圖5及圖6來描述根據實施例的伴隨有運動向量預測方法的視訊編碼方法以及視訊解碼方法。

圖5為說明根據本揭露的實施例的伴隨有運動向量預測方法的視訊編碼方法的流程圖。

在操作51中，根據運動向量預測方法，可自當前區塊的相鄰區塊決定多個候選區塊，且可基於當前區塊以及候選區塊的參考影像各自是否為長期參考影像而將候選區塊的運動向量決定為當前區塊的一或多個候選運動向量。

當候選區塊中的第一候選區塊的參考影像不同於當前區塊的參考影像時，基於當前區塊以及第一候選區塊的參考影像各自是否為長期參考影像而決定將使用第一候選區塊的運動向量按原樣使用還是在縮放之後使用。

在當前區塊以及第一候選區塊的參考影像兩者為長期參考影像時，第一候選區塊的運動向量可包含至候選運動向量清單中而不進行縮放。

當參考影像中的一者為短期參考影像且另一者為長期參考影像時，可決定不使用候選運動向量清單中的第一候選區塊的運動向量。

當參考影像兩者為短期參考影像時，第一候選區塊的運動向量可在縮放之後包含至候選運動向量清單中。

在操作53中，可決定包含候選區塊的候選運動向量的候選運動向量清單，且可藉由使用候選運動向量清單中的至少一個候選運動向量來決定當前區塊的運動向量。

可選擇候選運動向量清單中的一個候選運動向量作為參考運動向量。所選擇的的候選運動向量可在決定為參考運動向量之前修改。或者，可選擇且組合至少一個候選運動向量以將其決定為當前區塊的運動向量。舉例而言，當存在運動向量的不同資訊時，將差異資訊合成為參考運動向量以便決定當前區塊的運動向量。

當在當前區塊的參考影像中決定由當前區塊的所決定的運動向量指示的參考區塊時，可產生參考區塊與當前區塊之間的殘餘資料。

在操作55中，變換且量化殘餘資料以產生經量化的變換係數。

可根據當前影像的區塊來執行操作51至操作55，藉此根據所述區塊而產生經量化的變換係數。此外，可對根據區塊的經量化的變換係數執行熵編碼以便產生以及輸出位元串流。

圖5的視訊編碼方法可由視訊編碼裝置實現。當藉由將執行圖5的視訊編碼方法的視訊編碼處理器安裝於視訊編碼裝置中或使其在外部與視訊編碼裝置合作來操作所述視訊編碼處理器時，可執行包含畫面間預測、變換以及量化的視訊編碼操作。視訊編碼裝置的視訊編碼處理器可執行基本視訊編碼程序，此是因為不僅個別處理器包含視訊編碼處理模組，視訊編碼裝置、中央處理裝置或圖形處理裝置亦包含視訊編碼處理模組。

圖6為說明根據本揭露的實施例的伴隨有運動向量預測方法的視訊解碼方法的流程圖。

在操作61中，可接收當前區塊的參考索引以及經量化的變換係數，以及候選區塊的運動向量。

在操作63中，對操作61中所接收的當前區塊的經量化的變換係數執行解量化以及逆變換以復原當前區塊的殘餘資料。

在操作65中，可決定待參考以便預測當前區塊的運動向量的候選區塊。可基於候選區塊中的第一候選區塊的參考影像以及當前區塊的參考影像各自是否為長期參考影像來決定所述第一候選區塊的候選運動向量。

在當前區塊的參考影像以及候選區塊的參考影像兩者為長期參考影像時，可參考候選區塊的運動向量而不進行縮放。

當參考影像中的一者為短期參考影像且另一者為長期參考影像時，可決定不參考第一候選區塊的運動向量。

當參考影像兩者為短期參考影像時，可縮放且接著參考候選區塊的運動向量。

在操作67中，可產生包含操作65中所決定的候選運動向量的候選運動向量清單。可藉由使用候選運動向量清單中的至少一個候選運動向量來決定參考運動向量。可選擇一個候選運動向量且按原樣使用所述候選運動向量，或可在用作參考運動向量之前修改所述一個候選運動向量。或者，可組合至少一個候選運動向量以用作參考運動向量。

可在由當前區塊的所接收的參考索引指示的當前區塊的參考影像中決定由當前區塊的運動向量指示的參考區塊。可藉由合成殘餘資料與所決定的參考區塊來復原當前區塊。

可藉由根據區塊執行操作61至67來復原包含所復原的當前區塊的當前影像。當如此復原影像時，可復原包含所復原的影像的序列的視訊。

當在視訊解碼操作期間藉由在接收到經編碼的位元串流後即刻對經編碼的位元串流做解碼來復原視訊時，可執行操作61至67。此處，在操作61中，可剖析所接收的經編碼的位元串流，且可自所剖析的位元串流提取當前區塊的參考索引及經量化的變換係數以及候選區塊的運動向量。

在上文參照圖5而描述的視訊編碼方法期間，亦可執行操作61至67以便產生待參考以用於另一影像的畫面間預測的所復原的影像。此處，在操作61中，接收經由畫面間預測、變換以及量化而產生的當前區塊的參考索引及經量化的變換係數以及候選區塊的運動向量，且接著執行操作63至67以便使用最終復原的當前影像作為用於另一影像的畫面間預測的參考影像。

圖6的視訊解碼方法可由視訊解碼裝置實現。當藉由將執行圖6的視訊解碼方法的視訊解碼處理器安裝於視訊解碼裝置中或使其在外部與視訊解碼裝置合作來操作所述視訊解碼處理器時，可執行包含解量化、逆變換以及預測/補償的視訊解碼操作。視訊解碼裝置的視訊解碼處理器可執行基本視訊解碼程序，此是因為不僅個別處理器包含視訊解碼處理模組，視訊解碼裝置、中央處理裝置或圖形操作裝置亦包含視訊解碼處理模組。

現將參照圖7及圖8來描述根據本揭露的實施例的包含運動向量預測裝置10的視訊編碼器70以及視訊解碼器80。

圖7為根據本揭露的實施例的包含運動向量預測裝置10的視訊編碼器70的方塊圖。

視訊編碼器70可包含畫面間預測單元71以及變換量化單元75。畫面間預測單元71可包含根據實施例的運動向量預測裝置10以及殘餘產生器73。

運動向量預測裝置10根據區塊而決定運動向量。此外，對於運動向量預測、預測單元（PU）合併或進階運動向量預測（AMVP），可藉由參考另一區塊的運動向量來預測當前區塊的運動向量。運動向量預測裝置10可決定當前區塊的候選運動向量清單以用於運動向量預測。可自候選運動向量清單中所包含的候選運動向量決定一個參考運動向量。

運動向量預測裝置10可基於候選運動向量清單中的候選區塊中的第一候選區塊的參考影像以及當前區塊的參考影像各自是否為長期參考影像而決定如何參考所述第一候選區塊的運動向量。

運動向量預測裝置10可藉由自候選運動向量清單中的候選運動向量選擇最佳候選運動向量來決定參考運動向量，且藉由使用參考運動向量來預測當前區塊的運動向量。

殘餘產生器73可自當前區塊的參考影像決定由當前區塊的運動向量指示的參考區塊，且產生參考區塊與當前區塊之間的殘餘資料。

因此，畫面間預測單元71可藉由根據區塊執行畫面間預測來輸出根據區塊的殘餘資料。

變換量化單元75可藉由對由畫面間預測單元71輸出的殘餘資料執行變換及量化來產生量化變換係數。變換量化單元75可藉由對自畫面間預測單元71接收的根據區塊的殘餘資料執行變換及量化來產生根據區塊的經量化的變換係數。

視訊編碼器70可藉由對由變換量化單元75產生的經量化的變換係數執行熵編碼來輸出經編碼的位元串流。此外，當自畫面間預測單元71輸出參考索引、運動向量以及長期參考索引時，視訊編碼器70可藉由不僅對經量化的變換係數，亦對參考索引、運動向量以及長期參考索引執行熵編碼來輸出位元串流。

圖8為根據本揭露的實施例的包含運動向量預測裝置10的視訊解碼器80的方塊圖。

視訊解碼器80包含解量化及逆變換單元81以及運動補償單元83。畫面間預測單元71可包含根據實施例的運動向量預測裝置10以及區塊復原器85。

視訊解碼器80可接收當前區塊的參考索引以及經量化的變換係數，以及候選區塊的運動向量。解量化及逆變換單元81可藉由對當前區塊的所接收的經量化的變換係數執行解量化以及逆變換來復原當前區塊的殘餘資料。

運動補償單元83可藉由對經由畫面間預測而編碼的當前區塊執行運動補償來復原當前區塊。

運動向量預測裝置10根據區塊而決定運動向量。運動向量預測裝置10可決定當前區塊的候選運動向量清單以用於運動向量預測。候選區塊可為搭配區塊或相鄰區塊。運動向量預測裝置10可自候選運動向量清單中所包含的候選運動向量決定一個參考運動向量。

運動向量預測裝置10可基於候選區塊中的第一候選區塊的參考影像以及當前區塊的參考影像各自是否為長期參考影像而決定如何參考所述第一候選區塊的運動向量。

運動向量預測裝置10可藉由自候選運動向量清單中的候選運動向量選擇最佳候選運動向量來決定參考運動向量，且藉由使用參考運動向量來預測且決定當前區塊的運動向量。

區塊復原器85可決定由視訊解碼器80接收的當前區塊的參考索引指示的當前區塊的參考影像。由運動向量預測裝置10決定的當前區塊的運動向量指示參考影像中的參考區塊，且當前區塊可藉由合成參考區塊與當前區塊的殘餘資料來復原。

因此，運動補償單元83可藉由根據區塊執行運動補償來復原區塊，且復原包含所復原的區塊的當前影像。因此，在復原影像時，視訊解碼器80可復原包含影像序列的視訊。

視訊解碼器80可更包含迴路內濾波單元，所述迴路內濾波單元對所復原的當前區塊以及包含所復原的區塊的所復原的影像執行解區塊濾波。

視訊解碼器80可藉由在接收到經編碼的位元串流後即刻對經編碼的位元串流做解碼來復原視訊。此處，視訊解碼器80可剖析所接收的位元串流且自所剖析的位元串流提取當前區塊的參考索引以及經量化的變換係數以及候選區塊的運動向量。此外，視訊解碼器80可更包含接收器，所述接收器接收位元串流，對位元串流執行熵解碼，且剖析位元串流並自位元串流提取當前區塊的參考索引以及經量化的變換係數以及候選區塊的運動向量。

此外，視訊解碼器80可組合至視訊編碼器70以便使圖7的視訊編碼器70產生待參考以用於另一影像的畫面間預測的所復原的影像。此處，視訊解碼器80可接收經由視訊編碼器70進行的畫面間預測、變換以及量化而產生及輸出的當前區塊的參考索引以及經量化的變換係數，以及候選區塊的運動向量，且經由解量化及逆變換單元81以及運動補償單元83而輸出最終復原的當前影像。由視訊解碼器80輸出的所復原的影像可用作用於由視訊編碼器70進行的另一影像的畫面間預測的參考影像。

如上所述，運動向量預測裝置10可將視訊資料的區塊分割為具有樹狀結構的編碼單元，且可使用用於編碼單元的畫面間預測的預測單元。下文中，將參照圖9至圖22來描述基於具有樹狀結構的編碼單元以及變換單元的視訊編碼方法、視訊編碼裝置、視訊解碼方法以及視訊解碼裝置。

圖9為根據本揭露的實施例的基於根據樹狀結構的編碼單元的視訊編碼裝置100的方塊圖。

涉及基於根據樹狀結構的編碼單元的視訊預測的視訊編碼裝置100包含最大編碼單元分割器110、編碼單元決定器120以及輸出單元130。

最大編碼單元分割器110可基於最大編碼單元來分割當前圖像，最大編碼單元為影像的當前圖像的具有最大大小的編碼單元。若當前圖像大於最大編碼單元，則當前圖像的影像資料可分割為至少一個最大編碼單元。根據本揭露的實施例的最大編碼單元可為大小為32×32、64×64、128×128、256×256等的資料單元，其中資料單元的形狀是寬度以及長度為2的平方的正方形。影像資料可根據至少一個最大編碼單元而輸出至編碼單元決定器120。

根據本揭露的實施例的編碼單元可藉由最大大小以及深度來表徵。深度表示編碼單元自最大編碼單元在空間上分割的次數，且隨著深度加深，根據深度的較深編碼單元可自最大編碼單元分割為最小編碼單元。最大編碼單元的深度為最上層深度，且最小編碼單元的深度為最下層深度。由於對應於每一深度的編碼單元的大小隨著最大編碼單元的深度加深而減小，因此對應於較上層深度的編碼單元可包含對應於較下層深度的多個編碼單元。

如上所述，當前圖像的影像資料根據編碼單元的最大大小而分割為最大編碼單元，且最大編碼單元中的每一者可包含根據深度而分割的較深編碼單元。由於根據本揭露的實施例的最大編碼單元是根據深度來分割，因此包含於最大編碼單元中的空間域的影像資料可根據深度而階層式(hierarchical)分類。

限制最大編碼單元的高度以及寬度階層式分割的總次數的編碼單元的最大深度以及最大大小可為預定的。

編碼單元決定器120對藉由根據深度來分割最大編碼單元的區域而獲得的至少一個分割區域做編碼，且決定深度以根據所述至少一個分割區域來輸出最終編碼的影像資料。換句話說，編碼單元決定器120藉由根據當前圖像的最大編碼單元來對根據深度的較深編碼單元中的影像資料做編碼以及選擇具有最小編碼誤差的深度來決定經編碼的深度。所決定的經編碼的深度以及根據所決定的經編碼的深度的經編碼的影像資料輸出至輸出單元130。

基於對應於等於或低於最大深度的至少一個深度的較深編碼單元而對最大編碼單元中的影像資料做編碼，且基於較深編碼單元中的每一者而比較對影像資料做編碼的結果。可在比較較深編碼單元的編碼誤差之後選擇具有最小編碼誤差的深度。可針對每一最大編碼單元選擇至少一個經編碼的深度。

隨著編碼單元根據深度而階層式分割，且隨著編碼單元的數目增大，最大編碼單元的大小被分割。此外，即使編碼單元對應於一個最大編碼單元中的同一深度，仍藉由獨立量測每一編碼單元的影像資料的編碼誤差而決定是否將對應於同一深度的編碼單元中的每一者分割為較下層深度。因此，即使當影像資料包含於一個最大編碼單元中時，編碼誤差仍可根據所述一個最大編碼單元中的區域而不同，且因此經編碼的深度可根據影像資料中的區域而不同。因此，可在一個最大編碼單元中決定一或多個經編碼的深度，且可根據至少一個經編碼的深度的編碼單元而劃分最大編碼單元的影像資料。

因此，編碼單元決定器120可決定包含於最大編碼單元中的具有樹狀結構的編碼單元。根據本揭露的實施例的「具有樹狀結構的編碼單元」包含最大編碼單元中所包含的所有較深編碼單元中的對應於決定為經編碼的深度的深度的編碼單元。可根據最大編碼單元的同一區域中的深度而階層式決定經編碼的深度的編碼單元，且可在不同區域中獨立地進行決定。類似地，可獨立於另一區域中的經編碼的深度而決定當前區域中的經編碼的深度。

根據本揭露的實施例的最大深度為與自最大編碼單元至最小編碼單元的分割次數相關的索引。根據本揭露的實施例的第一最大深度可表示自最大編碼單元至最小編碼單元的總分割次數。根據本揭露的實施例的第二最大深度可表示自最大編碼單元至最小編碼單元的總深度層級數。舉例而言，當最大編碼單元的深度為0時，最大編碼單元被分割一次的編碼單元的深度可設定為1，且最大編碼單元被分割兩次的編碼單元的深度可設定為2。此處，若最小編碼單元為最大編碼單元被分割四次的編碼單元，則存在深度0、1、2、3以及4的5個深度層級，且因此第一最大深度可設定為4，且第二最大深度可設定為5。

可根據最大編碼單元執行預測編碼以及變換。根據最大編碼單元，亦基於根據等於最大深度的深度或小於最大深度的深度的較深編碼單元來執行預測編碼以及變換。

由於每當根據深度來分割最大編碼單元，較深編碼單元的數目便增大，因此對隨著深度加深而產生的所有較深編碼單元執行包含預測編碼以及變換的編碼。為便於描述，在最大編碼單元中，現將基於當前深度的編碼單元來描述預測編碼以及變換。

視訊編碼裝置100可按各種方式選擇用於對影像資料做編碼的資料單元的大小或形狀。為了對影像資料做編碼，執行諸如預測編碼、變換以及熵編碼的操作，且此時，同一資料單元可用於所有操作或不同資料單元可用於每一操作。

舉例而言，視訊編碼裝置100可不僅選擇用於對影像資料做編碼的編碼單元，而且選擇不同於編碼單元的資料單元，以便對編碼單元中的影像資料執行預測編碼。

為了在最大編碼單元中執行預測編碼，可基於對應於經編碼的深度的編碼單元（亦即，基於不再分割為對應於較下層深度的編碼單元的編碼單元）來執行預測編碼。下文中，不再分割且變為用於預測編碼的基礎單元的編碼單元現將被稱為「預測單元」。藉由分割預測單元而獲得的分區可包含藉由分割預測單元的高度以及寬度中的至少一者而獲得的預測單元或資料單元。分區為分割編碼單元的預測單元的資料單元，且預測單元可為大小與編碼單元相同的分區。

舉例而言，當2N×2N（其中N為正整數）的編碼單元不再分割且變為2N×2N的預測單元，且分區的大小可為2N×2N、2N×N、N×2N或N×N。分區類型的實例包含藉由對稱地分割預測單元的高度或寬度而獲得的對稱分區、藉由非對稱地分割預測單元的高度或寬度（諸如，1:n或n:1）而獲得的分區、藉由用幾何方式分割預測單元而獲得的分區，以及具有任意形狀的分區。

預測單元的預測模式可為畫面內模式、畫面間模式以及跳過模式中的至少一者。舉例而言，可對2N×2N、2N×N、N×2N或N×N的分區執行畫面內模式或畫面間模式。此外，可僅對2N×2N的分區執行跳過模式。在編碼單元中對一個預測單元獨立地執行編碼，藉此選擇具有最小編碼誤差的預測模式。

視訊編碼裝置100亦可不僅基於用於對影像資料做編碼的編碼單元而且基於不同於編碼單元的資料單元而對編碼單元中的影像資料執行變換。為了在編碼單元中執行變換，可基於具有小於等於編碼單元的大小的資料單元來執行變換。舉例而言，用於變換的資料單元可包含用於畫面內模式的資料單元以及用於畫面間模式的資料單元。

以類似於根據樹狀結構的編碼單元的方式，編碼單元中的變換單元可按遞迴方式分割為較小大小的區域。因此，可根據具有根據變換深度的樹狀結構的變換單元而劃分編碼單元中的殘餘資料。

亦可在變換單元中設定指示藉由分割編碼單元的高度以及寬度而達到變換單元的分割次數的變換深度。舉例而言，在2N×2N的當前編碼單元中，當變換單元的大小為2N×2N時，變換深度可為0，當變換單元的大小為N×N時，變換深度可為1，且當變換單元的大小為N/2×N/2時，變換深度可為2。換句話說，可根據變換深度而設定具有樹狀結構的變換單元。

根據對應於經編碼的深度的編碼單元的編碼資訊不僅需要關於經編碼的深度的資訊，而且需要與預測編碼以及變換相關的資訊。因此，編碼單元決定器120不僅決定具有最小編碼誤差的經編碼的深度，而且決定預測單元中的分區類型、根據預測單元的預測模式，以及用於變換的變換單元的大小。

稍後將參照圖11至圖22來詳細描述根據本文所揭露的實施例的最大編碼單元中的根據樹狀結構的編碼單元以及決定預測單元/分區以及變換單元的方法。

編碼單元決定器120可藉由基於拉格朗日乘數（Lagrangian multiplier）使用位元率-失真最佳化（Rate-Distortion Optimization）來量測根據深度的較深編碼單元的編碼誤差。

輸出單元130按照位元串流的形式輸出基於由編碼單元決定器120決定的至少一個經編碼的深度而編碼的最大編碼單元的影像資料，以及根據經編碼的深度關於編碼模式的資訊。

可藉由對影像的殘餘資料做編碼來獲得經編碼的影像資料。

根據經編碼的深度關於編碼模式的資訊可包含關於經編碼的深度、關於預測單元中的分區類型、預測模式以及變換單元的大小的資訊。

可藉由使用根據深度的分割資訊來定義關於經編碼的深度的資訊，根據深度的分割資訊指示是否對較下層深度而非當前深度的編碼單元執行編碼。若當前編碼單元的當前深度為經編碼的深度，則對當前編碼單元中的影像資料做編碼且輸出，且因此，分割資訊可定義為不將當前編碼單元分割為較下層深度。或者，若當前編碼單元的當前深度並非經編碼的深度，則對較下層深度的編碼單元執行編碼，且因此分割資訊可定義為分割當前編碼單元以獲得較下層深度的編碼單元。

若當前深度並非經編碼的深度，則對分割為較下層深度的編碼單元的編碼單元執行編碼。由於較下層深度的至少一個編碼單元存在於當前深度的一個編碼單元中，因此對較下層深度的每一編碼單元重複地執行編碼，且因此可對具有同一深度的編碼單元按遞迴方式執行編碼。

由於針對一個最大編碼單元而決定具有樹狀結構的編碼單元，且針對經編碼的深度的編碼單元而決定關於至少一個編碼模式的資訊，因此可針對一個最大編碼單元而決定關於至少一個編碼模式的資訊。此外，最大編碼單元的影像資料的經編碼的深度可根據位置而不同，此是因為根據深度而階層式分割影像資料，且因此可針對影像資料而設定關於經編碼的深度以及編碼模式的資訊。

因此，輸出單元130可將關於對應經編碼的深度以及編碼模式的編碼資訊指派給包含於最大編碼單元中的編碼單元、預測單元以及最小單元中的至少一者。

根據本揭露的實施例的最小單元為藉由將構成最下層深度的最小編碼單元分割為4份而獲得的正方形資料單元。或者，根據實施例的最小單元可為可包含於最大編碼單元中所包含的所有編碼單元、預測單元、分區單元以及變換單元中的最大正方形資料單元。

舉例而言，由輸出單元130輸出的編碼資訊可分類為根據較深編碼單元的編碼資訊，以及根據預測單元的編碼資訊。根據較深編碼單元的編碼資訊可包含關於預測模式以及關於分區的大小的資訊。根據預測單元的編碼資訊可包含關於畫面間模式的估計方向、關於畫面間模式的參考影像索引、關於運動向量、關於畫面內模式的色度分量以及關於畫面內模式的內插方法的資訊。

關於根據圖像、片段或GOP而定義的編碼單元的最大大小的資訊，以及關於最大深度的資訊可插入至位元串流的標頭、序列參數集合（Sequence Parameter Set）或圖像參數集合（picture parameter set）中。

關於針對當前視訊而允許的變換單元的最大大小的資訊，以及關於變換單元的最小大小的資訊亦可經由位元串流的標頭、序列參數集合或圖像參數集合而輸出。輸出單元130可對上文參照圖1至圖8而描述的與預測有關的參考資訊、預測資訊以及片段類型資訊做編碼以及輸出。

在視訊編碼裝置100中，較深編碼單元可為藉由將較上層深度的編碼單元（其為上一層）的高度或寬度劃分為2份而獲得的編碼單元。換句話說，在當前深度的編碼單元的大小為2N×2N時，較下層深度的編碼單元的大小為N×N。此外，大小為2N×2N的當前深度的編碼單元可包含較下層深度的最多4個編碼單元。

因此，視訊編碼裝置100可藉由基於考慮當前圖像的特性而決定的最大編碼單元的大小以及最大深度，藉由針對每一最大編碼單元決定具有最佳形狀以及最佳大小的編碼單元而形成具有樹狀結構的編碼單元。此外，由於藉由使用各種預測模式以及變換中的任一者對每一最大編碼單元執行編碼，因此可考慮各種影像大小的編碼單元的特性來決定最佳編碼模式。

因此，若在習知巨集區塊中對具有高解析度或大資料量的影像做編碼，則每圖像的巨集區塊的數目過度地增大。因此，針對每一巨集區塊產生的壓縮資訊的段數增大，且因此難以傳輸壓縮資訊，且資料壓縮效率降低。然而，藉由使用視訊編碼裝置100，因為在考慮影像的大小而增大編碼單元的最大大小的同時考慮影像的特性而調整編碼單元，所以影像壓縮效率可提高。

圖9的視訊編碼裝置100可執行圖1的運動向量預測裝置10或圖7的視訊編碼器70的操作。

編碼單元決定器120可針對每一最大編碼單元根據具有樹狀結構的編碼單元而決定包含用於畫面間預測的分區的預測單元，且執行畫面間預測單元。

編碼單元決定器120根據預測單元而決定運動向量。此外，對於運動向量預測、PU合併或AMVP，可藉由參考另一預測單元的運動向量來預測當前預測單元（分區）的運動向量。運動向量預測裝置10可決定當前預測單元的候選運動向量清單以用於運動向量預測。可自候選運動向量清單中的候選運動向量決定一個參考運動向量。候選預測單元可為鄰近於當前預測單元的相鄰預測單元或搭配影像中的搭配預測單元。

編碼單元決定器120可基於鄰近於當前預測單元的多個候選預測單元中的第一候選預測單元的參考影像以及當前預測單元的參考影像各自是否為長期參考影像來決定如何參考所述第一候選預測單元的運動向量。

基於當前預測單元以及第一候選預測單元的長期參考索引來決定參考影像各自是短期參考影像還是長期參考影像。

當參考影像兩者為長期參考影像時，可按原樣參考候選預測單元的運動向量而不進行縮放。

當參考影像中的一者為短期參考影像且另一者為長期參考影像時，可決定不參考第一候選預測單元的運動向量。

當參考影像兩者為短期參考影像時，可將候選預測單元的運動向量在縮放之後參考。

編碼單元決定器120可藉由自根據候選區塊而決定的候選運動向量選擇最佳候選運動向量來決定參考運動向量，且接著藉由使用參考運動向量來預測且決定當前預測單元的運動向量。

編碼單元決定器120可決定由當前區塊的運動向量在當前預測單元的參考影像中指示的參考區塊，且產生預測單元與當前預測單元之間的殘餘資料。

因此，編碼單元決定器120可藉由根據預測單元執行畫面間預測來輸出根據預測單元的殘餘資料。

編碼單元決定器120可藉由對包含根據預測單元的殘餘資料的編碼單元的變換單元執行變換以及量化來產生經量化的變換係數。因此，編碼單元決定器120可產生根據變換單元的經量化的變換係數。

編碼單元決定器120可執行上文參照圖8而描述的視訊解碼器80的操作，以便產生用於預測單元的畫面間預測的參考影像。

編碼單元決定器120可藉由對當前預測單元的所接收的經量化的變換係數執行解量化以及逆變換來復原當前區塊的殘餘資料。可藉由對經由畫面間預測而編碼的當前預測單元執行運動補償來復原當前預測單元。

如上所述，編碼單元決定器120可基於鄰近於當前預測單元的多個候選預測單元中的第一候選預測單元的參考影像以及當前預測單元的參考影像各自是否為長期參考影像來決定如何使用所述第一候選預測單元的運動向量。

編碼單元決定器120可藉由自候選運動向量清單中所包含的候選運動向量選擇最佳候選運動向量來決定參考運動向量，且藉由使用參考運動向量來預測且決定當前預測單元的運動向量。

編碼單元決定器120可決定由當前預測單元的所接收的參考索引指示的當前預測單元的參考影像。可根據由當前預測單元的參考索引指示的POC來決定當前預測單元的參考影像。參考索引指示POC，而不管參考影像是長期參考影像還是短期參考影像，且由POC指示的影像可決定為參考影像。

自參考影像決定由當前預測單元的運動向量指示的參考預測單元，且可藉由合成參考預測單元與當前預測單元的殘餘資料來復原當前預測單元。

因此，編碼單元決定器120可藉由根據預測單元而執行運動補償來復原預測單元，且復原包含所復原的預測單元的當前影像。所復原的預測單元以及所復原的當前影像可由另一預測影像以及另一影像參考。

圖10為根據本揭露的實施例的基於根據樹狀結構的編碼單元的視訊解碼裝置200的方塊圖。

涉及基於具有樹狀結構的編碼單元的視訊預測的視訊解碼裝置200包含接收器210、影像資料以及編碼資訊提取器220以及影像資料解碼器230。

用於視訊解碼裝置200的解碼操作的各種術語（諸如，編碼單元、深度、預測單元、變換單元以及關於各種編碼模式的資訊）的定義與參照圖9且參考視訊編碼裝置100所述的術語相同。

接收器210接收且剖析經編碼的視訊的位元串流。影像資料以及編碼資訊提取器220自所剖析的位元串流提取每一編碼單元的經編碼的影像資料，其中編碼單元具有根據每一最大編碼單元的樹狀結構，且將所提取的影像資料輸出至影像資料解碼器230。影像資料以及編碼資訊提取器220可自關於當前圖像的標頭、序列參數集合或圖像參數集合提取關於當前圖像的編碼單元的最大大小的資訊。

此外，影像資料以及編碼資訊提取器220自所剖析的位元串流針對具有根據每一最大編碼單元的樹狀結構的編碼單元提取關於經編碼的深度以及編碼模式的資訊。關於經編碼的深度以及編碼模式的所提取的資訊輸出至影像資料解碼器230。換句話說，位元串流中的影像資料分割為最大編碼單元，以使得影像資料解碼器230對每一最大編碼單元的影像資料做解碼。

可針對關於對應於經編碼的深度的至少一個編碼單元的資訊而設定根據最大編碼單元關於經編碼的深度以及編碼模式的資訊，且關於編碼模式的資訊可包含關於對應於經編碼的深度的對應編碼單元的分區類型、關於預測模式以及變換單元的大小的資訊。此外，可將根據深度的分割資訊作為關於經編碼的深度的資訊來提取。

由影像資料以及編碼資訊提取器220提取的根據每一最大編碼單元關於經編碼的深度以及編碼模式的資訊為關於經決定以在諸如視訊編碼裝置100的編碼器根據每一最大編碼單元對根據深度的每一較深編碼單元重複地執行編碼時產生最小編碼誤差的經編碼的深度以及編碼模式的資訊。因此，視訊解碼裝置200可藉由根據產生最小編碼誤差的經編碼的深度以及編碼模式來對影像資料做解碼而復原影像。

由於關於經編碼的深度以及編碼模式的編碼資訊可指派給對應編碼單元、預測單元以及最小單元中的預定資料單元，因此影像資料以及編碼資訊提取器220可提取根據預定資料單元關於經編碼的深度以及編碼模式的資訊。若根據預定資料單元而記錄關於對應最大編碼單元的經編碼的深度以及編碼模式的資訊，則被指派關於經編碼的深度以及編碼模式的相同資訊的預定資料單元可推斷為包含於同一最大編碼單元中的資料單元。

影像資料解碼器230可藉由基於根據最大編碼單元關於經編碼的深度以及編碼模式的資訊對每一最大編碼單元中的影像資料做解碼來復原當前圖像。換句話說，影像資料解碼器230可基於關於每一最大編碼單元中所包含的具有樹狀結構的編碼單元中的每一編碼單元的分區類型、預測模式以及變換單元的所提取的資訊而對經編碼的影像資料做解碼。解碼操作可包含：包含畫面內預測以及運動補償的預測；以及逆變換。

影像資料解碼器230可基於根據經編碼的深度關於每一編碼單元的預測單元的分區類型以及預測模式的資訊根據所述編碼單元的分區以及預測模式來執行畫面內預測或運動補償。

此外，影像資料解碼器230可針對每一編碼單元根據樹狀結構來讀取關於變換單元的資訊，以便基於每一編碼單元的變換單元來執行逆變換，以實現每一最大編碼單元的逆變換。經由逆變換，可復原編碼單元的空間區域的像素值。

影像資料解碼器230可藉由使用根據深度的分割資訊而決定當前最大編碼單元的經編碼的深度。若分割資訊指示影像資料在當前深度中不再分割，則當前深度為經編碼的深度。因此，影像資料解碼器230可針對對應於經編碼的深度的每一編碼單元藉由使用關於預測單元的分區類型、預測模式以及變換單元的大小的資訊來對當前最大編碼單元中的經編碼的資料做解碼。

換句話說，可藉由觀測針對編碼單元、預測單元以及最小單元中的預定資料單元而指派的編碼資訊集合來收集含有包含相同分割資訊的編碼資訊的資料單元，且可將所收集的資料單元視為待由影像資料解碼器230在同一編碼模式中解碼的一個資料單元。因此，可藉由針對每一編碼單元獲得關於編碼模式的資訊來對當前編碼單元做解碼。

此外，圖10的視訊解碼裝置200的影像資料解碼器230可執行圖1的運動補償裝置10或圖8的視訊解碼器80的操作。

影像資料解碼器230可決定用於運動補償的預測單元，且可針對每一最大編碼單元根據具有樹狀結構的編碼單元來執行每一預測單元的運動補償。

影像資料解碼器230可藉由對當前預測單元的經量化的變換係數執行解量化以及逆變換來復原當前區塊的殘餘資料。可藉由對經由畫面間預測而編碼的當前預測單元執行運動補償來復原當前預測單元。

影像資料解碼器230可基於鄰近於當前預測單元的多個候選預測單元中的第一候選預測單元的參考影像以及當前預測單元的參考影像各自是否為長期參考影像來決定將所述第一候選預測單元的運動向量按原樣使用還是在修改之後使用。

候選預測單元可為鄰近於當前影像中的當前預測單元的相鄰預測單元或搭配影像中的搭配預測單元。

可基於當前預測單元以及第一候選預測單元的長期參考索引來決定當前預測單元以及第一候選預測單元的參考影像各自是短期參考影像還是長期參考影像。

當參考影像兩者為長期參考影像時，可按原樣使用第一候選預測單元的運動向量而不進行縮放。

當參考影像兩者為短期參考影像時，可縮放第一候選預測單元的運動向量以將其決定為候選運動向量。

影像資料解碼器230可決定包含根據候選區塊而決定的候選運動向量的候選運動向量清單。藉由自候選運動向量清單選擇最佳候選運動向量來決定參考運動向量，且藉由使用所述參考運動向量來預測且決定當前區塊的運動向量。

影像資料解碼器230可根據由當前預測單元的參考索引指示的POC來決定當前預測單元的參考影像。參考索引指示POC，而不管參考影像是長期參考影像還是短期參考影像，且由POC指示的影像可決定為參考影像。

因此，影像資料解碼器230可藉由根據預測單元而執行運動補償來復原預測單元，且復原包含所復原的預測單元的當前影像。因此，可在復原影像時復原包含影像序列的視訊。所復原的預測單元以及所復原的當前影像可由另一預測單元以及影像參考。

因此，視訊解碼裝置200可獲得關於在對每一最大編碼單元按遞迴方式執行編碼時產生最小編碼誤差的至少一個編碼單元的資訊，且可使用所述資訊來對當前圖像做解碼。換句話說，可對決定為每一最大編碼單元中的最佳編碼單元的具有樹狀結構的編碼單元做解碼。

因此，即使影像資料具有高解析度以及大量資料，仍可藉由使用自編碼器接收的關於最佳編碼模式的資訊藉由使用根據影像資料的特性而適應性地決定的編碼單元的大小以及編碼模式來有效地對影像資料做解碼以及復原。

圖11為用於描述根據本揭露的實施例的編碼單元的概念的圖式。

編碼單元的大小可用寬度×高度來表達，且可為64×64、32×32、16×16以及8×8。64×64的編碼單元可分割為64×64、64×32、32×64或32×32的分區，且32×32的編碼單元可分割為32×32、32×16、16×32或16×16的分區，16×16的編碼單元可分割為16×16、16×8、8×16或8×8的分區，且8×8的編碼單元可分割為8×8、8×4、4×8或4×4的分區。

在視訊資料310中，解析度為1920×1080，編碼單元的最大大小為64，且最大深度為2。在視訊資料320中，解析度為1920×1080，編碼單元的最大大小為64，且最大深度為3。在視訊資料330中，解析度為352×288，編碼單元的最大大小為16，且最大深度為1。圖11所示的最大深度表示自最大編碼單元至最小解碼單元的總分割次數。

若解析度高或資料量大，則編碼單元的最大大小可為大的，以便不僅提高編碼效率而且準確地反映影像的特性。因此，具有高於視訊資料330的解析度的視訊資料310以及320的編碼單元的最大大小可為64。

由於視訊資料310的最大深度為2，因此視訊資料310的編碼單元315可包含長軸大小為64的最大編碼單元，以及長軸大小為32以及16的編碼單元，此是因為深度藉由分割最大編碼單元兩次而加深為兩層。由於視訊資料330的最大深度為1，因此視訊資料330的編碼單元335可包含長軸大小為16的最大編碼單元，以及長軸大小為8的編碼單元，此是因為深度藉由分割最大編碼單元一次而加深為一層。

由於視訊資料320的最大深度為3，因此視訊資料320的編碼單元325可包含長軸大小為64的最大編碼單元，以及長軸大小為32、16以及8的編碼單元，此是因為深度藉由分割最大編碼單元三次而加深為三層。隨著深度加深，可精確地表達詳細資訊。

圖12為根據本揭露的實施例的基於編碼單元的影像編碼器400的方塊圖。

影像編碼器400執行視訊編碼裝置100的編碼單元決定器120的操作以對影像資料做編碼。換句話說，畫面內預測器410對當前畫面405中的處於畫面內模式中的編碼單元執行畫面內預測，且運動估計器420以及運動補償器425分別藉由使用當前畫面405以及參考畫面495而對當前畫面405中的處於畫面間模式中的編碼單元執行畫面間估計以及運動補償。

自畫面內預測器410、運動估計器420以及運動補償器425輸出的資料經由變換器430以及量化器440作為經量化的變換係數而輸出。經量化的變換係數經由解量化器460以及逆變換器470而復原為空間域中的資料，且空間域中的所復原的資料在經由解區塊單元480以及樣本適應性偏移（sample adaptive offset，SAO）調整器490後處理之後作為參考畫面495輸出。經量化的變換係數可經由熵編碼器450作為位元串流455輸出。

為了使影像編碼器400應用於視訊編碼裝置100中，影像編碼器400的所有部件（亦即，畫面內預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、解量化器460、逆變換器470、解區塊單元480以及SAO調整器490）在考慮每一最大編碼單元的最大深度的同時基於具有樹狀結構的編碼單元中的每一編碼單元來執行操作。

具體而言，畫面內預測器410、運動估計器420以及運動補償器425在考慮當前最大編碼單元的最大大小以及最大深度的同時決定具有樹狀結構的編碼單元中的每一編碼單元的分區以及預測模式，且變換器430決定具有樹狀結構的編碼單元中的每一編碼單元中的變換單元的大小。

具體而言，對於PU合併或AMVP，運動估計器420可藉由參考另一預測單元的運動向量來預測當前預測單元（分區）的運動向量。運動估計器420可根據上文參照圖1至圖4B而描述的運動向量預測方法來預測運動向量。

運動估計器420可藉由自候選運動向量清單中所包含的候選運動向量選擇最佳候選運動向量來決定參考運動向量，且藉由使用參考運動向量來預測且決定當前預測單元的運動向量。運動估計器420可決定由當前區塊的運動向量在當前預測單元的參考畫面495中指示的參考區塊，且產生參考預測單元與當前預測單元之間的殘餘資料。因此，運動估計器420可輸出根據預測單元的殘餘資料。

此外，運動補償器425可根據上文參照圖1至圖4B而描述的運動向量預測方法來預測運動向量，且藉由使用所述運動向量來執行運動補償。

運動補償器425可決定由當前預測單元的運動向量在參考畫面495中指示的參考預測單元，且當前預測單元可藉由合成參考預測單元與當前預測單元的殘餘資料來復原。

因此，運動補償器425可藉由根據預測單元而執行運動補償來復原預測單元，且復原包含所復原的預測單元的當前影像。所復原的預測單元以及所復原的影像可由另一預測單元以及影像參考。

圖13為根據本揭露的實施例的基於編碼單元的影像解碼器500的方塊圖。

剖析器510自位元串流505剖析待解碼的經編碼的影像資料以及解碼所需的關於編碼的資訊。經編碼的影像資料經由熵解碼器520以及解量化器530作為經逆量化的資料而輸出，且經逆量化的資料經由逆變換器540而復原為空間域中的影像資料。

畫面內預測器550關於空間域中的影像資料對處於畫面內模式中的編碼單元執行畫面內預測，且運動補償器560藉由使用參考畫面585對處於畫面間模式中的編碼單元執行運動補償。

通過畫面內預測器550以及運動補償器560的空間域中的影像資料可在經由解區塊單元570以及SAO調整器580後處理之後作為所復原的畫面595輸出。此外，經由解區塊單元570以及SAO調整器580後處理的影像資料可作為參考畫面585輸出。

為了在視訊解碼裝置200的影像資料解碼器230中對影像資料做解碼，影像解碼器500可執行在剖析器510之後執行的操作。

為了使影像解碼器500應用於視訊解碼裝置200中，影像解碼器500的所有部件（亦即，剖析器510、熵解碼器520、解量化器530、逆變換器540、畫面內預測器550、運動補償器560、解區塊單元570以及SAO調整器580）針對每一最大編碼單元基於具有樹狀結構的編碼單元來執行操作。

具體而言，畫面內預測器550以及運動補償器560針對具有樹狀結構的編碼單元中的每一者基於分區以及預測模式而執行操作，且逆變換器540針對每一編碼單元基於變換單元的大小而執行操作。

詳細而言，運動補償器560可根據上文參照圖1至圖4B而描述的運動向量預測方法來預測運動向量。運動補償器560可決定由根據當前預測單元的參考索引的POC指示的參考畫面585，自參考畫面585決定由當前預測單元的運動向量指示的參考預測單元，且藉由合成參考預測單元以及當前預測單元的殘餘資料來復原當前預測單元。

因此，運動補償器560可藉由根據預測單元而執行運動補償來復原預測單元，且產生包含所復原的預測單元的所復原的影像。所復原的預測單元以及所復原的影像可由另一預測單元以及另一影像參考。

圖14為說明根據本揭露的實施例的根據深度的較深編碼單元以及分區的圖式。

視訊編碼裝置100以及視訊解碼裝置200使用階層式編碼單元以便考慮影像的特性。可根據影像的特性來適應性地決定編碼單元的最大高度、最大寬度以及最大深度，或可由使用者不同地進行設定。可根據編碼單元的預定最大大小決定根據深度的較深編碼單元的大小。

在根據本揭露的實施例的編碼單元的階層式結構600中，編碼單元的最大高度以及最大寬度各為64，且最大深度為4。在此狀況下，最大深度指編碼單元自最大編碼單元分割至最小編碼單元的總分割次數。由於深度沿著階層式結構600的垂直軸加深，因此將較深編碼單元的高度以及寬度各自分割。此外，沿著階層式結構600的水平軸展示作為用於每一較深編碼單元的預測編碼的基礎的預測單元以及分區。

換句話說，編碼單元610為階層式結構600中的最大編碼單元，其中深度為0且大小（亦即，高度乘寬度）為64×64。深度沿著垂直軸而加深，且存在大小為32×32且深度為1的編碼單元620、大小為16×16且深度為2的編碼單元630以及大小為8×8且深度為3的編碼單元640。大小為8×8且深度為3的編碼單元640為具有最下層深度的編碼單元，且為最小編碼單元。

編碼單元的預測單元以及分區根據每一深度沿著水平軸而配置。換句話說，若大小為64×64且深度為0的編碼單元610為預測單元，則預測單元可分割為包含於解碼單元610中的分區，亦即，大小為64×64的分區610、大小為64×32的分區612、大小為32×64的分區614或大小為32×32的分區616。

類似地，大小為32×32且深度為1的編碼單元620的預測單元可分割為包含於編碼單元620中的分區，亦即，大小為32×32的分區620、大小為32×16的分區622、大小為16×32的分區624以及大小為16×16的分區626。

類似地，大小為16×16且深度為2的編碼單元630的預測單元可分割為包含於編碼單元630中的分區，亦即，包含於編碼單元中的大小為16×16的分區630、大小為16×8的分區632、大小為8×16的分區634以及大小為8×8的分區636。

類似地，大小為8×8且深度為3的編碼單元640的預測單元可分割為包含於編碼單元640中的分區，亦即，包含於編碼單元中的大小為8×8的分區640、大小為8×4的分區642、大小為4×8的分區644以及大小為4×4的分區646。

為了決定構成最大編碼單元610的編碼單元的至少一個經編碼的深度，視訊編碼裝置100的編碼單元決定器120對包含於最大編碼單元610中的對應於每一深度的編碼單元執行編碼。

隨著深度加深，包含相同範圍中的資料以及相同大小的根據深度的較深編碼單元的數目增大。舉例而言，需要對應於深度2的四個編碼單元來涵蓋包含於對應於深度1的一個編碼單元中的資料。因此，為了比較根據深度的相同資料的編碼結果，將對應於深度1的編碼單元以及對應於深度2的四個編碼單元各自編碼。

為了針對深度中的當前深度執行編碼，沿著階層式結構600的水平軸，可藉由針對對應於當前深度的編碼單元中的每一預測單元執行編碼而針對當前深度選擇最小編碼誤差。或者，可藉由比較根據深度的最小編碼誤差、藉由隨著深度沿著階層式結構600的垂直軸加深而針對每一深度執行編碼來搜尋最小編碼誤差。可選擇編碼單元610中具有最小編碼誤差的深度以及分區作為編碼單元610的經編碼的深度以及分區類型。

圖15為用於描述根據本揭露的實施例的編碼單元710與變換單元720之間的關係的圖式。

視訊編碼裝置100或視訊解碼裝置200針對每一最大編碼單元根據具有小於或等於最大編碼單元的大小的編碼單元來對影像做編碼或解碼。可基於不大於對應編碼單元的資料單元而選擇在編碼期間用於變換的變換單元的大小。

舉例而言，在視訊編碼裝置100或視訊解碼裝置200中，若編碼單元710的大小為64×64，則可藉由使用大小為32×32的變換單元720來執行變換。

此外，可藉由對大小為小於64×64的32×32、16×16、8×8以及4×4的變換單元中的每一者執行變換而對大小為64×64的編碼單元710的資料做編碼，且接著可選擇具有最小編碼誤差的變換單元。

圖16為用於描述根據本揭露的實施例的對應於經編碼的深度的編碼單元的編碼資訊的圖式。

視訊編碼裝置100的輸出單元130可對關於分區類型的資訊800、關於預測模式的資訊810，以及關於對應於經編碼的深度的每一編碼單元的變換單元的大小的資訊820做編碼且作為關於編碼模式的資訊而傳輸。

資訊800指示關於藉由分割當前編碼單元的預測單元而獲得的分區的形狀的資訊，其中分區為用於當前編碼單元的預測編碼的資料單元。舉例而言，大小為2N×2N的當前編碼單元CU_0可分割為大小為2N×2N的分區802、大小為2N×N的分區804、大小為N×2N的分區806以及大小為N×N的分區808中的任一者。此處，關於分區類型的資訊800設定為指示大小為2N×N的分區804、大小為N×2N的分區806以及大小為N×N的分區808中的一者。

資訊810指示每一分區的預測模式。舉例而言，資訊810可指示對由資訊800指示的分區執行的預測編碼的模式，亦即，畫面內模式812、畫面間模式814或跳過模式816。

資訊820指示待基於何時對當前編碼單元執行變換的變換單元。舉例而言，變換單元可為第一畫面內變換單元822、第二畫面內變換單元824、第一畫面間變換單元826或第二畫面間變換單元828。

根據每一較深編碼單元，視訊解碼裝置200的影像資料以及編碼資訊提取器220可提取且使用資訊800、810以及820以用於解碼。

圖17為根據本揭露的實施例的根據深度的較深編碼單元的圖式。

分割資訊可用以指示深度的改變。分割資訊指示當前深度的編碼單元是否分割為較下層深度的編碼單元。

用於深度為0且大小為2N_0×2N_0的編碼單元900的預測編碼的預測單元910可包含大小為2N_0×2N_0的分區類型912、大小為2N_0×N_0的分區類型914、大小為N_0×2N_0的分區類型916以及大小為N_0×N_0的分區類型918的分區。圖17僅說明藉由對稱地分割預測單元910而獲得的分區類型912至918，但分區類型不限於此，且預測單元910的分區可包含非對稱分區、具有預定形狀的分區以及具有幾何形狀的分區。

根據每一分區類型，對大小為2N_0×2N_0的一個分區、大小為2N_0×N_0的兩個分區、大小為N_0×2N_0的兩個分區以及大小為N_0×N_0的四個分區重複地執行預測編碼。可對大小為2N_0×2N_0、N_0×2N_0、2N_0×N_0以及N_0×N_0的分區執行在畫面內模式以及畫面間模式中的預測編碼。僅對大小為2N_0×2N_0的分區執行在跳過模式中的預測編碼。

若編碼誤差在分區類型912至916中的一者中最小，則預測單元910可能不分割為較下層深度。

若編碼誤差在分區類型918中最小，則深度自0改變為1以在操作920中分割分區類型918，且對深度為2且大小為N_0×N_0的編碼單元930重複地執行編碼以搜尋最小編碼誤差。

用於預測編碼具有深度為1且大小為2N_1×2N_1（=N_0×N_0）的編碼單元930的預測單元940可包含大小為2N_1×2N_1的分區類型942、大小為2N_1×N_1的分區類型944、大小為N_1×2N_1的分區類型946以及大小為N_1×N_1的分區類型948的分區。

若編碼誤差在分區類型948中最小，則深度自1改變為2以在操作950中分割分區類型948，且對深度為2且大小為N_2×N_2的編碼單元960重複地執行編碼以搜尋最小編碼誤差。

當最大深度為d時，可執行根據每一深度的分割操作直至深度變為d-1時，且可對分割資訊做編碼直至深度為0至d-2中的一者時。換句話說，當執行編碼直至在對應於深度d-2的編碼單元在操作970中分割之後深度為d-1時，用於深度為d-1且大小為2N_(d-1)×2N_(d-1)的編碼單元980的預測編碼的預測單元990可包含大小為2N_(d-1)×2N_(d-1)的分區類型992、大小為2N_(d-1)×N_(d-1)的分區類型994、大小為N_(d-1)×2N_(d-1)的分區類型996以及大小為N_(d-1)×N_(d-1)的分區類型998的分區。

可對分區類型992至998中的大小為2N_(d-1)×2N_(d-1)的一個分區、大小為2N_(d-1)×N_(d-1)的兩個分區、大小為N_(d-1)×2N_(d-1)的兩個分區、大小為N_(d-1)×N_(d-1)的四個分區重複地執行預測編碼以搜尋具有最小編碼誤差的分區類型。

即使當分區類型998具有最小編碼誤差時，由於最大深度為d，因此不再將深度為d-1的編碼單元CU_(d-1)分割為較下層深度，且將構成當前最大編碼單元900的編碼單元的經編碼的深度決定為d-1，且可將當前最大編碼單元900的分區類型決定為N_(d-1)×N_(d-1)。此外，由於最大深度為d且具有最下層深度d-1的最小編碼單元980不再分割為較下層深度，因此不設定用於最小編碼單元980的分割資訊。

資料單元999可為當前最大編碼單元的「最小單元」。根據本揭露的實施例的最小單元可為藉由將最小編碼單元980分割為4份而獲得的正方形資料單元。藉由重複地執行編碼，視訊編碼裝置100可藉由根據編碼單元900的深度比較編碼誤差而選擇具有最小編碼誤差的深度以決定經編碼的深度，且將對應分區類型以及預測模式設定為經編碼的深度的編碼模式。

因而，在所有深度1至d中比較根據深度的最小編碼誤差，且可將具有最小編碼誤差的深度決定為經編碼的深度。可對經編碼的深度、預測單元的分區類型以及預測模式做編碼且作為關於編碼模式的資訊而傳輸。此外，由於編碼單元自深度0分割為經編碼的深度，因此僅經編碼的深度的分割資訊設定為0，且排除經編碼的深度的深度的分割資訊設定為1。

視訊解碼裝置200的影像資料以及編碼資訊提取器220可提取且使用關於編碼單元900的經編碼的深度以及預測單元的資訊以對分區類型912做解碼。視訊解碼裝置200可藉由使用根據深度的分割資訊而將分割資訊為0的深度決定為經編碼的深度，且使用關於對應深度的編碼模式的資訊以用於解碼。

圖18至圖20為用於描述根據本揭露的實施例的編碼單元1010、預測單元1060與變換單元1070之間的關係的圖式。

編碼單元1010為在最大編碼單元中對應於由視訊編碼裝置100決定的經編碼的深度的具有樹狀結構的編碼單元。預測單元1060為編碼單元1010中的每一者的預測單元的分區，且變換單元1070為編碼單元1010中的每一者的變換單元。

當最大編碼單元的深度在編碼單元1010中為0時，編碼單元1012以及1054的深度為1，編碼單元1014、1016、1018、1028、1050以及1052的深度為2，編碼單元1020、1022、1024、1026、1030、1032以及1048的深度為3，且編碼單元1040、1042、1044以及1046的深度為4。

在預測單元1060中，藉由在編碼單元1010中分割編碼單元而獲得一些編碼單元1014、1016、1022、1032、1048、1050、1052以及1054。換句話說，編碼單元1014、1022、1050以及1054中的分區類型的大小為2N×N，編碼單元1016、1048以及1052中的分區類型的大小為N×2N，且編碼單元1032的分區類型的大小為N×N。編碼單元1010的預測單元以及分區小於等於每一編碼單元。

對小於編碼單元1052的資料單元中的變換單元1070中的編碼單元1052的影像資料執行變換或逆變換。此外，變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050以及1052的大小以及形狀不同於預測單元1060中的編碼單元。換句話說，視訊編碼裝置100以及視訊解碼裝置200可對同一編碼單元中的資料單元個別地執行畫面內預測、運動估計、運動補償、變換以及逆變換。

因此，對在最大編碼單元的每一區域中具有階層式結構的編碼單元中的每一者以遞迴方式執行編碼以決定最佳編碼單元，且因此可獲得具有遞迴樹狀結構的編碼單元。編碼資訊可包含關於編碼單元的分割資訊、關於分區類型的資訊、關於預測模式的資訊，以及關於變換單元的大小的資訊。表1展示可由視訊編碼裝置100以及視訊解碼裝置200設定的編碼資訊。表1

視訊編碼裝置100的輸出單元130可輸出關於具有樹狀結構的編碼單元的編碼資訊，且視訊解碼裝置200的影像資料以及編碼資訊提取器220可自所接收的位元串流提取關於具有樹狀結構的編碼單元的編碼資訊。

分割資訊指示當前編碼單元是否分割為較下層深度的編碼單元。若當前深度d的分割資訊為0，則當前編碼單元不再分割為較下層深度的深度為經編碼的深度，且因此可針對經編碼的深度而定義關於分區類型、預測模式以及變換單元的大小的資訊。若根據分割資訊進一步分割當前編碼單元，則對較下層深度的四個分割編碼單元獨立地執行編碼。

預測模式可為畫面內模式、畫面間模式以及跳過模式中的一者。可在所有分區類型中定義畫面內模式以及畫面間模式，且僅在大小為2N×2N的分區類型中定義跳過模式。

關於分區類型的資訊可指示：大小為2N×2N、2N×N、N×2N以及N×N的對稱分區類型，其是藉由對稱地分割預測單元的高度或寬度而獲得；以及大小為2N×nU、2N×nD、nL×2N以及nR×2N的非對稱分區類型，其是藉由非對稱地分割預測單元的高度或寬度而獲得。可藉由以1:3以及3:1分割預測單元的高度而分別獲得大小為2N×nU以及2N×nD的非對稱分區類型，且可藉由以1:3以及3:1分割預測單元的寬度而分別獲得大小為nL×2N以及nR×2N的非對稱分區類型。

變換單元的大小可在畫面內模式中設定為兩種類型且在畫面間模式中設定為兩種類型。換句話說，若變換單元的分割資訊為0，則變換單元的大小可為2N×2N，此為當前編碼單元的大小。若變換單元的分割資訊為1，則可藉由分割當前編碼單元而獲得變換單元。此外，若大小為2N×2N的當前編碼單元的分區類型為對稱分區類型，則變換單元的大小可為N×N，且若當前編碼單元的分區類型為非對稱分區類型，則變換單元的大小可為N/2×N/2。

關於具有樹狀結構的編碼單元的編碼資訊可包含對應於經編碼的深度的編碼單元、預測單元以及最小單元中的至少一者。對應於經編碼的深度的編碼單元可包含含有相同編碼資訊的預測單元以及最小單元中的至少一者。

因此，藉由比較鄰近資料單元的編碼資訊而決定鄰近資料單元是否包含於對應於經編碼的深度的同一編碼單元中。此外，藉由使用資料單元的編碼資訊而決定對應於經編碼的深度的對應編碼單元，且因此可決定最大編碼單元中的經編碼的深度的分佈。

因此，若基於鄰近資料單元的編碼資訊而預測當前編碼單元，則可直接參考且使用鄰近於當前編碼單元的較深編碼單元中的資料單元的編碼資訊。

或者，若基於鄰近資料單元的編碼資訊而預測當前編碼單元，則使用資料單元的經編碼的資訊而搜尋鄰近於當前編碼單元的資料單元，且可參考所搜尋的鄰近編碼單元以用於預測當前編碼單元。

圖21為用於描述根據表1的編碼模式資訊的編碼單元、預測單元與變換單元之間的關係的圖式。

最大編碼單元1300包含經編碼的深度的編碼單元1302、1304、1306、1312、1314、1316以及1318。此處，由於編碼單元1318為經編碼的深度的編碼單元，因此分割資訊可設定為0。關於大小為2N×2N的編碼單元1318的分區類型的資訊可設定為大小為2N×2N的分區類型1322、大小為2N×N的分區類型1324、大小為N×2N的分區類型1326、大小為N×N的分區類型1328、大小為2N×nU的分區類型1332、大小為2N×nD的分區類型1334、大小為nL×2N的分區類型1336以及大小為nR×2N的分區類型1338中的一者。

變換單元的分割資訊（TU大小旗標）為一種類型的變換索引。對應於變換索引的變換單元的大小可根據編碼單元的預測單元類型或分區類型而改變。

舉例而言，在分區類型設定為對稱（亦即，分區類型1322、1324、1326或1328）時，若變換單元的TU大小旗標為0，則設定大小為2N×2N的變換單元1342，且若TU大小旗標為1，則設定大小為N×N的變換單元1344。

當分區類型設定為非對稱（亦即，分區類型1332、1334、1336或1338）時，若TU大小旗標為0，則設定大小為2N×2N的變換單元1352，且若TU大小旗標為1，則設定大小為N/2×N/2的變換單元1354。

參照圖21，TU大小旗標為具有值0或1的旗標，但TU大小旗標不限於1個位元，且變換單元可在TU大小旗標自0增大時階層式分割為具有樹狀結構。變換單元的分割資訊（TU大小旗標）可為變換索引的實例。

在此狀況下，藉由將根據本揭露的實施例的變換單元的TU大小旗標與變換單元的最大大小及最小大小一起使用，可表達已實際使用的變換單元大小。視訊編碼裝置100能夠對最大變換單元大小資訊、最小變換單元大小資訊以及最大TU大小旗標做編碼。對最大變換單元大小資訊、最小變換單元大小資訊以及最大TU大小旗標做編碼的結果可插入至SPS中。視訊解碼裝置200可藉由使用最大變換單元大小資訊、最小變換單元大小資訊以及最大TU大小旗標來對視訊做解碼。

舉例而言，（a）若當前編碼單元的大小為64×64且最大變換單元大小為32×32，則（a-1）當TU大小旗標為0時，變換單元的大小可為32×32，（a-2）當TU大小旗標為1時，變換單元的大小可為16×16，且（a-3）當TU大小旗標為2時，變換單元的大小可為8×8。

作為另一實例，（b）若當前編碼單元的大小為32×32且最小變換單元大小為32×32，則（b-1）當TU大小旗標為0時，變換單元的大小可為32×32。此時，TU大小旗標無法設定為除0之外的值，此是因為變換單元的大小無法小於32×32。

作為另一實例，（c）若當前編碼單元的大小為64×64且最大TU大小旗標為1，則TU大小旗標可為0或1。此時，TU大小旗標無法設定為除0或1之外的值。

因此，若定義最大TU大小旗標為「MaxTransformSizeIndex」、最小變換單元大小為「MinTransformSize」且在TU大小旗標為0時的變換單元大小為「RootTuSize」，則可在當前編碼單元中決定的當前最小變換單元大小「CurrMinTuSize」可由方程式（1）來定義： CurrMinTuSize = max (MinTransformSize, RootTuSize/(2^MaxTransformSizeIndex)) ... （1）

與可在當前編碼單元中決定的當前最小變換單元大小「CurrMinTuSize」相比，在TU大小旗標為0時的變換單元大小「RootTuSize」可表示可在系統中選擇的最大變換單元大小。在方程式（1）中，「RootTuSize/(2^MaxTransformSizeIndex)」表示在TU大小旗標為0時的變換單元大小「RootTuSize」分割對應於最大TU大小旗標的次數時的變換單元大小，且「MinTransformSize」表示最小變換大小。因此，「RootTuSize/(2^MaxTransformSizeIndex)」以及「MinTransformSize」中的較小值可為可在當前編碼單元中決定的當前最小變換單元大小「CurrMinTuSize」。

根據本揭露的實施例，最大變換單元大小RootTuSize可根據預測模式的類型而變化。

舉例而言，若當前預測模式為畫面間模式，則可藉由使用下文方程式（2）來決定「RootTuSize」。在方程式（2）中，「MaxTransformSize」表示最大變換單元大小，且「PUSize」表示當前預測單元大小。 RootTuSize = min(MaxTransformSize, PUSize) ......... （2）

亦即，若當前預測模式為畫面間模式，則在TU大小旗標為0時的變換單元大小「RootTuSize」可為最大變換單元大小以及當前預測單元大小中的較小值。

若當前分區單元的預測模式為畫面內模式，則可藉由使用下文方程式（3）來決定「RootTuSize」。在方程式（3）中，「PartitionSize」表示當前分區單元的大小。 RootTuSize = min(MaxTransformSize, PartitionSize) ...........（3）

亦即，若當前預測模式為畫面內模式，則在TU大小旗標為0時的變換單元大小「RootTuSize」可為最大變換單元大小以及當前分區單元的大小中的較小值。

然而，根據分區單元的預測模式的類型而變化的當前最大變換單元大小「RootTuSize」僅為一實例，且本揭露不限於此。

根據如參照圖9至圖21而描述的基於具有樹狀結構的編碼單元的視訊編碼方法，針對樹狀結構的每一編碼單元來對空間區域的影像資料做編碼。根據基於具有樹狀結構的編碼單元的視訊解碼方法，針對每一最大編碼單元來執行解碼以復原空間區域的影像資料。因此，可復原圖像以及視訊（其為圖像序列）。所復原的視訊可由再生裝置再生，儲存於儲存媒體中或經由網路而傳輸。

根據本揭露的實施例可寫為電腦程式，且可在使用電腦可讀記錄媒體執行程式的通用數位電腦中實施。電腦可讀記錄媒體的實例包含磁性儲存媒體（例如，ROM、軟碟、硬碟等）以及光學記錄媒體（例如，CD-ROM或DVD）。

為便於描述，參照圖1至圖21而描述的根據運動向量預測方法的視訊編碼方法將統稱為「根據本揭露的視訊編碼方法」。此外，參照圖1至圖21而描述的根據運動向量預測方法的視訊解碼方法將稱為「根據本揭露的視訊解碼方法」。

此外，已參照圖1至圖21而描述的包含畫面間預測裝置20、視訊編碼器70、視訊解碼器80、視訊編碼裝置100或影像編碼器400的視訊編碼裝置將稱為「根據本揭露的視訊編碼裝置」。此外，已參照圖1至圖21而描述的包含畫面間預測裝置20、視訊解碼器70、視訊解碼裝置200或影像解碼器500的視訊解碼裝置將稱為「根據本發明的視訊解碼裝置」。

現將詳細描述根據本揭露的實施例的儲存程式的電腦可讀記錄媒體（例如，光碟26000）。

圖22為根據本揭露的實施例的儲存程式的光碟26000的實體結構的圖式。光碟26000（其為儲存媒體）可為硬碟機（hard drive）、緊密光碟-唯讀記憶體（compact disc-read only memory，CD-ROM）光碟、藍光光碟（Blu-ray disc）或數位多功能光碟（digital versatile disc，DVD）。光碟26000包含多個同心磁軌Tr，其各自劃分為在光碟26000的圓周方向上的具體數目的磁區Se。在光碟26000的具體區域中，可指派並儲存執行上述量化參數決定方法、視訊編碼方法以及視訊解碼方法的程式。

現將參照圖23描述電腦系統，所述電腦系統是使用儲存媒體來體現的，所述儲存媒體儲存用於執行如上所述的視訊編碼方法以及視訊解碼方法的程式。

圖23為藉由使用光碟26000而記錄以及讀取程式的光碟機26800的圖式。電腦系統26700可經由光碟機26800而在光碟26000中儲存程式，所述程式執行根據本揭露的實施例的視訊編碼方法以及視訊解碼方法中的至少一者。為了在電腦系統26700中執行儲存於光碟26000中的程式，可藉由使用光碟機26800而自光碟26000讀取程式，並將其傳輸至電腦系統26700。

執行根據本揭露的實施例的視訊編碼方法以及視訊解碼方法中的至少一者的程式可不僅儲存於圖22或圖23所說明的光碟26000中，而且儲存於記憶卡、ROM卡匣（ROM cassette）或固態磁碟（solid state drive，SSD）中。

下文將描述應用了上述視訊編碼方法以及視訊解碼方法的系統。

圖24為提供內容散佈服務的內容供應系統11000的整體結構的圖式。通信系統的服務區域劃分為預定大小的小區，且無線基地台11700、11800、11900以及12000分別安裝於此等小區中。

內容供應系統11000包含多個獨立元件。舉例而言，諸如電腦12100、個人數位助理（personal digital assistant，PDA）12200、視訊攝影機12300以及行動電話12500的所述多個獨立元件經由網際網路服務提供商11200、通信網路11400以及無線基地台11700、11800、11900以及12000而連接至網際網路11100。

然而，內容供應系統11000不限於如圖24所說明的內容供應系統，且多個元件可選擇性連接至所述內容供應系統。多個獨立元件可直接連接至通信網路11400，而不是經由無線基地台11700、11800、11900以及12000來連接。

視訊攝影機12300為能夠攝取視訊影像的成像元件，例如，數位視訊攝影機。行動電話12500可使用各種協定中的至少一種通信方法，例如，個人數位通信（Personal Digital Communications，PDC）、分碼多重存取（Code Division Multiple Access，CDMA）、寬頻分碼多重存取（Wideband-Code Division Multiple Access，W-CDMA）、全球行動通信系統（Global System for Mobile Communications，GSM）以及個人手持電話系統（Personal Handyphone System，PHS）。

視訊攝影機12300可經由無線基地台11900以及通信網路11400而連接至串流伺服器11300。串流伺服器11300允許經由視訊攝影機12300自使用者接收的內容經由即時廣播（real-time broadcast）而串流傳輸。可使用視訊攝影機12300或串流伺服器11300來對自視訊攝影機12300接收的內容做編碼。可將由視訊攝影機12300攝取的視訊資料經由電腦12100傳輸至串流伺服器11300。

亦可將由相機12600攝取的視訊資料經由電腦12100傳輸至串流伺服器11300。相機12600為類似於數位相機能夠攝取靜態影像與視訊影像兩者的成像元件。可使用相機12600或電腦12100來對由相機12600攝取的視訊資料做編碼。執行視訊編碼以及解碼的軟體可儲存於可由電腦12100存取的電腦可讀記錄媒體中，電腦可讀記錄媒體例如為CD-ROM光碟、軟碟（floppy disc）、硬碟機、SSD或記憶卡。

若視訊資料是由內建於行動電話12500中的相機攝取，則可自行動電話12500接收視訊資料。

視訊資料亦可由安裝於視訊攝影機12300、行動電話12500或相機12600中的大型積體電路（large scale integrated circuit，LSI）系統編碼。

內容供應系統11000可對由使用者使用視訊攝影機12300、相機12600、行動電話12500或另一成像元件記錄的內容資料（例如，在音樂會期間記錄的內容）做編碼，且將經編碼的內容資料傳輸至串流伺服器11300。串流伺服器11300可將經編碼的內容資料以串流內容的類型傳輸至請求內容資料的其他用戶端。

用戶端為能夠對經編碼的內容資料做解碼的元件，例如，電腦12100、PDA 12200、視訊攝影機12300或行動電話12500。因此，內容供應系統11000允許用戶端接收並再生經編碼的內容資料。此外，內容供應系統11000允許用戶端接收經編碼的內容資料並即時地對經編碼的內容資料做解碼以及再生，藉此實現個人廣播。

內容供應系統11000中所包含的多個獨立元件的編碼以及解碼操作可類似於根據本揭露的實施例的視訊編碼裝置以及視訊解碼裝置的編碼以及解碼操作。

現將參照圖25及圖26更詳細地描述根據本揭露的實施例的內容供應系統11000中所包含的行動電話12500。

圖25說明根據本揭露的實施例的應用了視訊編碼方法以及視訊解碼方法的行動電話12500的外部結構。行動電話12500可為智慧型電話，其功能不受限制，且其大量功能可被改變或擴展。

行動電話12500包含內部天線12510，可經由內部天線12510而與圖21的無線基地台12000交換射頻（radio-frequency，RF）信號，且行動電話12500包含用於顯示由相機12530攝取的影像或經由天線12510而接收並被解碼的影像的顯示螢幕12520，例如，液晶顯示器（liquid crystal display，LCD）或有機發光二極體（organic light-emitting diode，OLED）螢幕。行動電話12500包含操作面板12540，其包含控制按鈕以及觸控面板。若顯示螢幕12520為觸控螢幕，則操作面板12540更包含顯示螢幕12520的觸摸感測面板。行動電話12500包含用於輸出語音以及聲音的揚聲器12580或另一類型的聲音輸出單元，以及用於輸入語音以及聲音的麥克風12550或另一類型的聲音輸入單元。行動電話12500更包含相機12530（諸如，電荷耦合元件（charge-coupled device，CCD）相機）以攝取視訊以及靜態影像。行動電話12500可更包含：儲存媒體12570，其用於儲存經編碼/經解碼的資料，例如，由相機12530攝取、經由電子郵件而接收或根據各種方式而獲得的視訊或靜態影像；以及插槽12560，儲存媒體12570經由插槽12560而裝載至行動電話12500中。儲存媒體12570可為快閃記憶體，例如，安全數位（secure digital，SD）卡或包含於塑膠外殼中的電可抹除可程式化唯讀記憶體（electrically erasable and programmable read only memory，EEPROM）。

圖26說明根據本揭露的實施例的行動電話12500的內部結構。為了系統地控制包含顯示螢幕12520以及操作面板12540的行動電話12500的多個部分，電力供應電路12700、操作輸入控制器12640、影像編碼單元12720、相機介面12630、LCD控制器12620、影像解碼單元12690、多工器/解多工器12680、記錄/讀取單元12670、調變/解調變單元12660以及聲音處理器12650經由同步匯流排12730而連接至中央控制器12710。

若使用者操作電源按鈕且自「電源關閉」狀態設定至「電源開啟」狀態，則電力供應電路12700將電力自電池組（battery pack）供應至行動電話12500的所有部分，藉此將行動電話12500設定於操作模式。

中央控制器12710包含中央處理單元（central processing unit，CPU）、ROM以及RAM。

雖然行動電話12500將通信資料傳輸至外部，但數位資料在中央控制器12710的控制下由行動電話12500產生。舉例而言，聲音處理器12650可產生數位聲音信號，影像編碼單元12720可產生數位影像信號，且訊息的文字資料可經由操作面板12540以及操作輸入控制器12640而產生。在數位信號在中央控制器12710的控制下傳輸至調變/解調變單元12660時，調變/解調變單元12660調變數位信號的頻帶，且通信電路12610對經頻帶調變的數位聲音信號執行數位至類比轉換（DAC）以及頻率轉換。自通信電路12610輸出的傳輸信號可經由天線12510而傳輸至語音通信基地台或無線基地台12000。

舉例而言，在行動電話12500處於交談模式時，經由麥克風12550而獲得的聲音信號在中央控制器12710的控制下由聲音處理器12650變換為數位聲音信號。數位聲音信號可經由調變/解調變單元12660以及通信電路12610而變換為變換信號，且可經由天線12510而傳輸。

當在資料通信模式中傳輸文字訊息（例如，電子郵件）時，文字訊息的文字資料經由操作面板12540而輸入，且經由操作輸入控制器12640而傳輸至中央控制器12710。在中央控制器12710的控制下，文字資料經由調變/解調變單元12660以及通信電路12610變換為傳輸信號，且經由天線12510而傳輸至無線基地台12000。

為了在資料通信模式中傳輸影像資料，由相機12530攝取的影像資料經由相機介面12630而提供至影像編碼單元12720。所攝取的影像資料可經由相機介面12630以及LCD控制器12620直接顯示在顯示螢幕12520上。

影像編碼單元12720的結構可對應於上述影像編碼裝置100的結構。影像編碼單元12720可根據上述視訊編碼方法而將自相機12530接收的影像資料變換為經壓縮且編碼的影像資料，且接著將經編碼的影像資料輸出至多工器/解多工器12680。在相機12530的記錄操作期間，由行動電話12500的麥克風12550獲得的聲音信號可經由聲音處理器12650而變換為數位聲音資料，且所述數位聲音資料可傳輸至多工器/解多工器12680。

多工器/解多工器12680將自影像編碼單元12720接收的經編碼的影像資料以及自聲音處理器12650接收的聲音資料一起多工。對資料進行多工的結果可經由調變/解調變單元12660以及通信電路12610而變換為傳輸信號，且可接著經由天線12510而傳輸。

雖然行動電話12500自外部接收通信信號，但對經由天線12510而接收的信號執行頻率恢復以及ADC，以將信號變換為數位信號。調變/解調變單元12660調變數位信號的頻帶。經頻帶調變的數位信號根據數位信號的類型而傳輸至視訊解碼單元12690、聲音處理器12650或LCD控制器12620。

在交談模式中，行動電話12500放大經由天線12510而接收的信號，且藉由對經放大的信號執行頻率轉換以及ADC而獲得數位聲音信號。在中央控制器12710的控制下，所接收的數位聲音信號經由調變/解調變單元12660以及聲音處理器12650而變換為類比聲音信號，且所述類比聲音信號經由揚聲器12580而輸出。

在處於資料通信模式時，接收在網際網路網站處存取的視訊檔案的資料，且將經由天線12510而自無線基地台12000接收的信號經由調變/解調變單元12660作為經多工的資料而輸出，且將經多工的資料傳輸至多工器/解多工器12680。

為了對經由天線12510而接收的經多工的資料做解碼，多工器/解多工器12680將經多工的資料解多工為經編碼的視訊資料串流以及經編碼的音訊資料串流。經由同步匯流排12730而分別將經編碼的視訊資料串流以及經編碼的音訊資料串流提供至視訊解碼單元12690以及聲音處理器12650。

影像解碼單元12690的結構可對應於上述影像解碼裝置200的結構。根據上述視訊解碼方法，影像解碼單元12690可對經編碼的視訊資料做解碼以獲得所復原的視訊資料且經由LCD控制器12620而將所復原的視訊資料提供至顯示螢幕12520。

因此，在網際網路網站處存取的視訊檔案的資料可顯示於顯示螢幕12520上。同時，聲音處理器12650可將音訊資料變換為類比聲音信號，且將類比聲音信號提供至揚聲器12580。因此，在網際網路網站處存取的視訊檔案中所含有的音訊資料亦可經由揚聲器12580而再生。

行動電話12500或另一類型的通信終端機可為包含根據本揭露的實施例的視訊編碼裝置與視訊解碼裝置兩者的收發終端機，可為僅包含視訊編碼裝置的收發終端機，或可為僅包含視訊解碼裝置收發終端機。

根據本揭露的通信系統不限於上文參照圖24而描述的通信系統。舉例而言，圖27說明根據本揭露的實施例的使用通信系統的數位廣播系統。圖27的數位廣播系統可藉由使用根據本揭露的實施例的視訊編碼裝置以及視訊解碼裝置而接收經由衛星或地面網路傳輸的數位廣播。

具體而言，廣播站12890藉由使用無線電波而將視訊資料串流傳輸至通信衛星或廣播衛星12900。廣播衛星12900傳輸廣播信號，且廣播信號經由家用天線12860而傳輸至衛星廣播接收器。在每個家庭中，經編碼的視訊串流可由TV接收器12810、機上盒（set-top box）12870或另一元件解碼並再生。

在根據本揭露的實施例的視訊解碼裝置實施於再生裝置12830中時，再生裝置12830可對記錄於儲存媒體12820（諸如，光碟或記憶卡）上的經編碼的視訊串流進行剖析以及解碼以復原數位信號。因此，所復原的視訊信號可再生於（例如）監視器12840上。

在連接至用於衛星/地面廣播的天線12860或用於接收有線電視（TV）廣播的電纜天線12850的機上盒12870中，可安裝有根據本揭露的實施例的視訊解碼裝置。自機上盒12870輸出的資料亦可再生於TV監視器12880上。

作為另一實例，根據本揭露的實施例的視訊解碼裝置可安裝於TV接收器12810而非機上盒12870上。

具有合適天線12910的汽車12920可接收自衛星12900或圖21的無線基地台11700傳輸的信號。經解碼的視訊可再生於安裝於汽車12920中的汽車導航系統12930的顯示螢幕上。

視訊信號可由根據本揭露的實施例的視訊編碼裝置編碼且可接著儲存於儲存媒體中。具體而言，影像信號可由DVD記錄器儲存於DVD光碟12960中或可由硬碟記錄器12950儲存於硬碟中。作為另一實例，視訊信號可儲存於SD卡12970中。若硬碟記錄器12950包含根據本揭露的實施例的視訊解碼裝置，則DVD光碟12960、SD卡12970或另一儲存媒體上所記錄的視訊信號可再生於TV監視器12880上。

汽車導航系統12930可能不包含圖24的相機12530、相機介面12630以及影像編碼單元12720。舉例而言，電腦12100以及TV接收器12810可能不包含於圖24的相機12530、相機介面12630以及影像編碼單元12720中。

圖28為說明根據本揭露的實施例的使用視訊編碼裝置以及視訊解碼裝置的雲端計算系統的網路結構的圖式。

雲端計算系統可包含雲端計算伺服器14000、使用者資料庫（DB）14100、多個計算資源14200以及使用者終端機。

雲端計算系統回應於來自使用者終端機的請求而經由資料通信網路（例如，網際網路）提供多個計算資源14200的應需委外服務（on-demand outsourcing service）。在雲端計算環境下，服務提供商藉由使用虛擬化技術來組合位於實體上不同位置處的資料中心的計算資源而向使用者提供所要服務。服務使用者並不需要將計算資源（例如，應用程式、儲存器、作業系統（OS）或安全機制）安裝於其自身的終端機上以便進行使用，而是可在所要時間點自經由虛擬化技術而產生的虛擬空間中的服務選擇所要服務並進行使用。

指定服務使用者的使用者終端機經由資料通信網路（包含網際網路以及行動電信網路）而連接至雲端計算伺服器14000。可自雲端計算伺服器14000對使用者終端機提供雲端計算服務且特定言的視訊再生服務。使用者終端機可為能夠連接至網際網路的各種類型的電子元件，例如，桌上型PC 14300、智慧型TV 14400、智慧型電話14500、筆記型電腦14600、攜帶型多媒體播放器（PMP）14700、平板型PC 14800及其類似者。

雲端計算伺服器14000可組合雲端網路中所分散的多個計算資源14200且向使用者終端機提供組合的結果。多個計算資源14200可包含各種資料服務，且可包含自使用者終端機上傳的資料。如上所述，雲端計算伺服器14000可藉由根據虛擬化技術來組合不同區域中所分散的視訊資料庫而向使用者終端機提供所要服務。

關於已預訂雲端計算服務的使用者的使用者資訊儲存於使用者DB 14100中。使用者資訊可包含使用者的登錄資訊、地址、姓名以及個人信用資訊。使用者資訊可更包含視訊的索引。此處，索引可包含已再生的視訊的清單、正再生的視訊的清單、再生的視訊的暫停點（pausing point）以及其類似者。

關於儲存於使用者DB 14100中的視訊的資訊可在使用者元件之間共用。舉例而言，在視訊服務回應於來自筆記型電腦14600的請求而提供至筆記型電腦14600時，視訊服務的再生歷史儲存於使用者DB 14100中。在自智慧型電話14500接收到對再生此視訊服務的請求時，雲端計算伺服器14000基於使用者DB 14100而搜尋並再生此視訊服務。在智慧型電話14500自雲端計算伺服器14000接收視訊資料串流時，藉由對視訊資料串流做解碼而再生視訊的操作類似於上文參照圖21而描述的行動電話12500的操作。

雲端計算伺服器14000可參考儲存於使用者DB 14100中的所要視訊服務的再生歷史。舉例而言，雲端計算伺服器14000自使用者終端機接收對再生儲存於使用者DB 14100中的視訊的請求。若正再生此視訊，則由雲端計算伺服器14000執行的串流傳輸此視訊的方法可根據來自使用者終端機的請求（亦即，根據將始於視訊的開始還是其暫停點而再生視訊）而變化。舉例而言，若使用者終端機請求始於視訊的開始而再生視訊，則雲端計算伺服器14000始於視訊的第一畫面而將視訊的資料串流傳輸至使用者終端機。舉例而言，若使用者終端機請求始於視訊的暫停點而再生視訊，則雲端計算伺服器14000始於對應於暫停點的畫面而將視訊的資料串流傳輸至使用者終端機。

在此狀況下，使用者終端機可包含如上文參照圖1至圖23而描述的視訊解碼裝置。作為另一實例，使用者終端機可包含如上文參照圖1至圖23而描述的視訊編碼裝置。或者，使用者終端機可包含如上文參照圖1至圖23而描述的視訊解碼裝置與視訊編碼裝置兩者。

上文已參照圖22至圖28而描述上文參照圖1至圖23所述的根據本揭露的實施例的視訊編碼方法、視訊解碼方法、視訊編碼裝置以及視訊解碼裝置的各種應用。然而，根據本揭露的各種實施例的將視訊編碼方法以及視訊解碼方法儲存於儲存媒體中的方法或將視訊編碼裝置以及視訊解碼裝置實施在元件中的方法不限於上文參照圖22至圖28而描述的實施例。

儘管已參考本揭露的例示性實施例特定地展示且描述了本揭露，但一般熟習此項技術者將理解，在不脫離如由所附申請專利範圍界定的本揭露的精神以及範疇的情況下，可對本揭露進行形式以及細節上的各種改變。

A₀‧‧‧區塊
A₁‧‧‧區塊
B₀‧‧‧區塊
B₁‧‧‧區塊
B₂‧‧‧區塊
10‧‧‧運動向量預測裝置
12‧‧‧候選區塊決定器
14‧‧‧運動向量決定器
20‧‧‧當前區塊
21‧‧‧操作
23‧‧‧操作
25‧‧‧操作
30‧‧‧當前影像
31‧‧‧當前區塊
32‧‧‧搭配索引
33‧‧‧當前參考影像
34‧‧‧運動向量
35‧‧‧搭配影像
36‧‧‧搭配區塊
37‧‧‧運動向量
38‧‧‧搭配參考影像
40‧‧‧當前影像
41‧‧‧當前區塊
43‧‧‧當前參考影像
44‧‧‧運動向量
46‧‧‧相鄰區塊
47‧‧‧運動向量
48‧‧‧相鄰參考影像
51‧‧‧操作
53‧‧‧操作
55‧‧‧操作
61‧‧‧操作
63‧‧‧操作
65‧‧‧操作
67‧‧‧操作
70‧‧‧視訊編碼器
71‧‧‧畫面間預測單元
73‧‧‧殘餘產生器
75‧‧‧變換量化單元
80‧‧‧視訊解碼器
81‧‧‧解量化及逆變換單元
83‧‧‧運動補償單元
85‧‧‧區塊復原器
100‧‧‧視訊編碼裝置
110‧‧‧最大編碼單元分割器
120‧‧‧編碼單元決定器
130‧‧‧輸出單元
200‧‧‧視訊解碼裝置
210‧‧‧接收器
220‧‧‧影像資料以及編碼資訊提取器
230‧‧‧影像資料解碼器
310‧‧‧視訊資料
315‧‧‧編碼單元
320‧‧‧視訊資料
325‧‧‧編碼單元
330‧‧‧視訊資料
335‧‧‧編碼單元
400‧‧‧影像編碼器
405‧‧‧當前畫面
410‧‧‧畫面內預測器
420‧‧‧運動估計器
425‧‧‧運動補償器
430‧‧‧變換器
440‧‧‧量化器
450‧‧‧熵編碼器
455‧‧‧位元串流
460‧‧‧解量化器
470‧‧‧逆變換器
480‧‧‧解區塊單元
490‧‧‧樣本適應性偏移（SAO）調整器
495‧‧‧參考畫面
500‧‧‧影像解碼器
505‧‧‧位元串流
510‧‧‧剖析器
520‧‧‧熵解碼器
530‧‧‧解量化器
540‧‧‧逆變換器
550‧‧‧畫面內預測器
560‧‧‧運動補償器
570‧‧‧解區塊單元
580‧‧‧SAO調整器
585‧‧‧參考畫面
595‧‧‧所復原的畫面
600‧‧‧階層式結構
610‧‧‧分區/最大編碼單元
612‧‧‧分區
614‧‧‧分區
616‧‧‧分區
620‧‧‧分區
622‧‧‧分區
624‧‧‧分區
626‧‧‧分區
630‧‧‧分區
632‧‧‧分區
634‧‧‧分區
636‧‧‧分區
640‧‧‧分區
642‧‧‧分區
644‧‧‧分區
646‧‧‧分區
710‧‧‧編碼單元
720‧‧‧變換單元
800‧‧‧資訊
802‧‧‧分區
804‧‧‧分區
806‧‧‧分區
808‧‧‧分區
810‧‧‧資訊
812‧‧‧畫面內模式
814‧‧‧畫面間模式
816‧‧‧跳過模式
820‧‧‧資訊
822‧‧‧第一畫面內變換單元
824‧‧‧第二畫面內變換單元
826‧‧‧第一畫面間變換單元
828‧‧‧第二畫面間變換單元
900‧‧‧當前最大編碼單元
910‧‧‧預測單元
912‧‧‧分區類型/分區
914‧‧‧分區類型
916‧‧‧分區類型
918‧‧‧分區類型
920‧‧‧操作
930‧‧‧編碼單元
940‧‧‧預測單元
942‧‧‧分區類型
944‧‧‧分區類型
946‧‧‧分區類型
948‧‧‧分區類型
950‧‧‧操作
960‧‧‧編碼單元
970‧‧‧操作
980‧‧‧編碼單元
990‧‧‧預測單元
992‧‧‧分區類型
994‧‧‧分區類型
996‧‧‧分區類型
998‧‧‧分區類型
999‧‧‧資料單元
1010‧‧‧編碼單元
1012‧‧‧編碼單元
1014‧‧‧編碼單元
1016‧‧‧編碼單元
1018‧‧‧編碼單元
1020‧‧‧編碼單元
1022‧‧‧編碼單元
1024‧‧‧編碼單元
1026‧‧‧編碼單元
1028‧‧‧編碼單元
1030‧‧‧編碼單元
1032‧‧‧編碼單元
1040‧‧‧編碼單元
1042‧‧‧編碼單元
1044‧‧‧編碼單元
1046‧‧‧編碼單元
1048‧‧‧編碼單元
1050‧‧‧編碼單元
1052‧‧‧編碼單元
1054‧‧‧編碼單元
1060‧‧‧預測單元
1070‧‧‧變換單元
1300‧‧‧最大編碼單元
1302‧‧‧編碼單元
1304‧‧‧編碼單元
1306‧‧‧編碼單元
1312‧‧‧編碼單元
1314‧‧‧編碼單元
1316‧‧‧編碼單元
1318‧‧‧編碼單元
1322‧‧‧分區類型
1324‧‧‧分區類型
1326‧‧‧分區類型
1328‧‧‧分區類型
1332‧‧‧分區類型
1334‧‧‧分區類型
1336‧‧‧分區類型
1338‧‧‧分區類型
1342‧‧‧變換單元
1344‧‧‧變換單元
1352‧‧‧變換單元
1354‧‧‧變換單元
11000‧‧‧內容供應系統
11100‧‧‧網際網路
11200‧‧‧網際網路服務提供商
11300‧‧‧串流伺服器
11400‧‧‧通信網路
11700‧‧‧無線基地台
11800‧‧‧無線基地台
11900‧‧‧無線基地台
12000‧‧‧無線基地台
12100‧‧‧電腦
12200‧‧‧個人數位助理
12300‧‧‧視訊攝影機
12500‧‧‧行動電話
12510‧‧‧內部天線
12520‧‧‧顯示螢幕
12530‧‧‧相機
12540‧‧‧操作面板
12550‧‧‧麥克風
12560‧‧‧插槽
12570‧‧‧儲存媒體
12580‧‧‧揚聲器
12600‧‧‧相機
12610‧‧‧通信電路
12620‧‧‧LCD控制器
12630‧‧‧相機介面
12640‧‧‧操作輸入控制器
12650‧‧‧聲音處理器
12660‧‧‧調變/解調變單元
12670‧‧‧記錄/讀取單元
12680‧‧‧多工器/解多工器
12690‧‧‧影像解碼單元
12700‧‧‧電力供應電路
12710‧‧‧中央控制器
12720‧‧‧影像編碼單元
12730‧‧‧同步匯流排
12810‧‧‧TV接收器
12820‧‧‧儲存媒體
12830‧‧‧再生裝置
12840‧‧‧監視器
12850‧‧‧電纜天線
12860‧‧‧天線
12870‧‧‧機上盒
12880‧‧‧TV監視器
12890‧‧‧廣播站
12900‧‧‧廣播衛星
12910‧‧‧天線
12920‧‧‧汽車
12930‧‧‧汽車導航系統
12950‧‧‧硬碟記錄器
12960‧‧‧DVD光碟
12970‧‧‧SD卡
14000‧‧‧雲端計算伺服器
14100‧‧‧使用者資料庫
14200‧‧‧計算資源
14300‧‧‧桌上型PC
14400‧‧‧智慧型TV
14500‧‧‧智慧型電話
14600‧‧‧筆記型電腦
14700‧‧‧攜帶型多媒體播放器
14800‧‧‧平板型PC
26000‧‧‧光碟
26700‧‧‧電腦系統
26800‧‧‧光碟機
CU_0‧‧‧當前編碼單元
CU_1‧‧‧編碼單元
CU_(d-1)‧‧‧編碼單元
PU‧‧‧預測單元
Se‧‧‧磁區
Tb‧‧‧距離
Td‧‧‧距離
Tr‧‧‧同心磁軌
TU‧‧‧變換單元

圖1為根據本揭露的實施例的運動向量預測裝置的方塊圖。圖2為說明根據本揭露的實施例的運動向量預測方法的流程圖。圖3說明根據本揭露的實施例的空間上鄰近於當前區塊的相鄰區塊。圖4A為用於描述根據本揭露的實施例的候選區塊為另一影像的搭配區塊時的狀況的圖式。圖4B為用於描述根據本揭露的實施例的候選區塊為同一影像的相鄰區塊時的狀況的圖式。圖5為說明根據本揭露的實施例的伴隨有運動向量預測方法的視訊編碼方法的流程圖。圖6為說明根據本揭露的實施例的伴隨有運動向量預測方法的視訊解碼方法的流程圖。圖7為根據本揭露的實施例的包含運動向量預測裝置的視訊編碼器的方塊圖。圖8為根據本揭露的實施例的包含運動向量預測裝置的視訊解碼器的方塊圖。圖9為根據本揭露的實施例的基於根據樹狀結構的編碼單元的視訊編碼裝置的方塊圖。圖10為根據本揭露的實施例的基於根據樹狀結構的編碼單元的視訊解碼裝置的方塊圖。圖11為用於描述根據本揭露的實施例的編碼單元的概念的圖式。圖12為根據本揭露的實施例的基於編碼單元的影像編碼器的方塊圖。圖13為根據本揭露的實施例的基於編碼單元的影像解碼器的方塊圖。圖14為說明根據本揭露的實施例的根據深度的較深編碼單元以及分區的圖式。圖15為用於描述根據本揭露的實施例的編碼單元與變換單元之間的關係的圖式。圖16為用於描述根據本揭露的實施例的對應於經編碼的深度的編碼單元的編碼資訊的圖式。圖17為根據本揭露的實施例的根據深度的較深編碼單元的圖式。圖18至圖20為用於描述根據本揭露的實施例的編碼單元、預測單元與變換單元之間的關係的圖式。圖21為用於描述根據表1的編碼模式資訊的編碼單元、預測單元與變換單元之間的關係的圖式。圖22為根據本揭露的實施例的儲存程式的光碟的實體結構的圖式。圖23為藉由使用光碟而記錄以及讀取程式的光碟機的圖式。圖24為提供內容散佈服務的內容供應系統的整體結構的圖式。圖25及圖26分別為根據本揭露的實施例的應用了視訊編碼方法以及視訊解碼方法的行動電話的外部結構以及內部結構的圖式。圖27為根據本揭露的實施例的應用了通信系統的數位廣播系統的圖式。圖28為說明根據本揭露的實施例的使用視訊編碼裝置以及視訊解碼裝置的雲端計算系統的網路結構的圖式。

21‧‧‧操作

23‧‧‧操作

25‧‧‧操作

Claims

一種對影像解碼的方法，所述方法包括：於相同的位置決定搭配區塊作為在所述當前影像之前恢復的影像中的當前區塊；當所述搭配區塊的參考影像或所述當前區塊的參考影像的其中之一為長期參考影像時，則決定所述搭配區塊的運動向量是不可用的；當所述搭配區塊的所述參考影像及所述當前區塊的參考影像皆為長期參考影像時，則不縮放所述搭配區塊的所述運動向量而取得暫時的運動向量預測候選；當所述搭配區塊的所述參考影像及所述當前區塊的參考影像皆為短期參考影像時，則藉由縮放所述搭配區塊的所述運動向量取得所述暫時的運動向量預測候選；從具有所述暫時的運動向量預測候選的多個運動向量預測候選中決定所述當前區塊的運動向量估計子；以及基於所述運動向量估計子產生所述當前區塊的運動向量，其中所述當前影像被分割為至少一最大編碼單元，所述至少一最大編碼單元根據分割資訊被階層式分割為具有至少當前深度與較下層深度的其中之一深度的編碼單元，當所述分割資訊指出所述當前深度的分割，所述當前深度的編碼單元被分割為所述較下層深度的所述四個編碼單元，所述四個編碼單元為正方形獨立於鄰近的編碼單元，以及當所述分割資訊指出所述當前深度的不分割，則基於所述當前深度的所述編碼單元取得具有當前預測單元的至少一預測單元。