TWI763931B

TWI763931B - 編碼視訊的裝置以及方法

Info

Publication number: TWI763931B
Application number: TW107133697A
Authority: TW
Inventors: 鄭詠凡; 楊政燁; 張爀在
Original assignee: 南韓商三星電子股份有限公司
Priority date: 2017-11-17
Filing date: 2018-09-26
Publication date: 2022-05-11
Also published as: KR20190056888A; TW201924335A; US10616580B2; CN109803141A; US20190158834A1

Abstract

一種視訊編碼裝置包括至少一個處理器。所述至少一個處理器被配置成：參照利用第一量化參數自輸入資料所產生的量化係數的特性來調整所述第一量化參數的大小；確定所述大小被調整的所述第一量化參數作為最終量化參數；以及利用所述最終量化參數來對所述輸入資料進行量化，以產生輸出資料。

Description

編碼視訊的裝置以及方法

[相關申請案的交叉參考]

本美國非臨時專利申請案主張於2017年11月17日在韓國智慧財產局提出申請的韓國專利申請案第10-2017-0154286號的優先權，所述韓國專利申請案的揭露內容全文併入本文中供參考。

本發明的各實施例是有關於一種用於處理影像的方法及裝置。更具體而言，本發明的各實施例是有關於一種用於編碼視訊的方法及裝置。

視訊編碼可指代自影像資料或由一系列影像資料構成的視訊資料產生容量較原始資料小的經編碼資料的過程。視視訊編碼方式而定，藉由解碼經編碼資料或位元串流所產生的經解碼資料可與原始資料相同或不同。舉例而言，自根據無損壓縮而編碼的資料所解碼的資料可與原始資料相同，但自根據有損壓縮而編碼的資料所解碼的資料可與原始資料不同。

與視訊編碼相關聯的主要問題之一是在減小根據有損壓縮而編碼的資料的大小(即，位元串流的位元率)的同時減小經解碼資料與原始資料之間的差異的問題。

本發明的各實施例提供一種用於高效地選擇量化參數的方法及裝置。

欲由本發明的實施例解決的技術問題並非僅限於上述技術問題，且依據以下實施例，可推斷出其他技術問題。

根據示例性實施例，一種視訊編碼裝置可包括至少一個處理器。所述至少一個處理器可被配置成：參照(基於)利用第一量化參數自輸入資料所產生的量化係數的特性來調整所述第一量化參數的大小；確定所述大小被調整的所述第一量化參數作為最終量化參數；以及利用所述最終量化參數來對所述輸入資料進行量化，以產生輸出資料。

根據示例性實施例，一種由至少一個處理器執行的視訊編碼方法可包括：利用第一量化參數對輸入資料執行量化，以產生量化係數；參照(基於)利用所述第一量化參數所產生的所述量化係數的特性來調整所述第一量化參數的大小；確定所述大小被調整的所述第一量化參數作為最終量化參數；以及利用所述最終量化參數對所述輸入資料進行量化，以產生輸出資料。

根據示例性實施例，一種由至少一個處理器執行的視訊編碼方法可包括：確定與編碼單位相關聯的至少一個變換單位；對所述至少一個變換單位中所包含的多條殘差資料執行頻率變換，以產生與所述至少一個變換單位相關聯的經變換係數；利用第一量化參數對所述經變換係數執行量化，以產生量化係數；參照(基於)利用所述第一量化參數所產生的所述量化係數的特性來調整所述第一量化參數的大小，以確定最終量化參數；以及利用所確定的所述最終量化參數來對所述經變換係數進行量化。

5:原始視訊資料

10、2000、9000:視訊編碼裝置

100:控制模組

200、9400:變換模組

300、9600:量化模組

320、9800、11200:量化參數決策模組

340:量化處理器

400:解量化模組

500、11600:逆變換模組

600:解塊/樣本適應性偏移濾波器模組

700:經解碼訊框緩衝器

800:訊框內預測模組

900:訊框間預測模組

1000:電子系統

1101:主處理器

1200:工作記憶體

1300:儲存裝置

1310、1312、1314、1316、1320、1322、1324、1326、1330、1332、1334、1336、1340、1342、1344、1346:編碼單位

1400:通訊區塊

1500:使用者介面

1600:匯流排

2050:初始量化參數

2100、D_IN:輸入資料

2300:處理器

2500、3400、3800、4100、4300、4600、4800:量化係數

2700:最終量化參數

2900、D_OUT:輸出資料

3200、3600、4000、4500:經變換係數

3300:初始量化參數

3500、3900:最終量化參數

4200、4400、4700、4900:恢復資料

6000:決策模型

7000:層結構

8000:當前編碼單位/編碼單位

8200:變換單位

9200:預測模組

11000:視訊解碼裝置

11400:逆量化模組

11800:重建模組

D_ORG:原始資料

D_PRE:預測資料

D_RES:殘差資料

QP:量化參數

S2200、S2400、S2600、S2800、S5410、S5420、S5430、S5450、S5460、S5480、S10100、S10200、S10300、S10400、S12100、S12200、S12300、S12400、S12500:操作

藉由參照附圖詳細地闡述本文所述的本發明概念的示例性實施例，本發明概念的以上以及其他目標及特徵將變得顯而易見。

圖1說明根據實施例的視訊編碼裝置的方塊圖。

圖2A說明根據實施例的視訊編碼裝置。

圖2B是說明根據實施例的在圖2A所示視訊編碼裝置中執行的視訊編碼方法的流程圖。

圖3是說明根據實施例的參照(基於)利用初始量化參數所產生的量化係數的特性來調整初始量化參數的操作的概念圖。

圖4A說明根據實施例的用於闡述其中欲利用初始量化參數而產生的恢復資料與欲利用另一量化參數而產生的恢復資料彼此完全相同的情形的數列(progression)。在圖4A所示實施例中，所述另一量化參數的大小大於初始量化參數的大小。

圖4B說明根據實施例的用於闡述其中欲利用初始量化參數而產生的恢復資料與欲利用另一量化參數而產生的恢復資料彼此不同的情形的數列。在圖4B所示實施例中，所述另一量化參數的大小較初始量化參數的大小大的程度在參考範圍之內。

圖5是說明根據實施例的用於參照(基於)利用初始量化參數所產生的量化係數來決定最終量化參數的方法的流程圖。

圖6說明根據實施例的用於基於利用初始量化參數所產生的量化係數的特性來輸出最終量化參數的決策模型。

圖7說明根據實施例每一深度的編碼單位/分割區(coding unit/partition)。

圖8說明根據實施例的編碼單位與變換單位之間的關係。

圖9說明根據實施例的另一視訊編碼裝置的方塊圖。

圖10是說明視訊編碼裝置編碼影像的方法的流程圖。

圖11說明根據實施例的另一視訊解碼裝置的方塊圖。

圖12是說明視訊解碼裝置解碼影像的方法的流程圖。

圖13說明根據實施例的執行視訊編碼方法及視訊解碼方法的電子系統的示例性配置的方塊圖。

以下，將詳細且清楚地闡述本發明的各實施例，以使得熟習此項技術者(在下文中被稱為「通常知識者」)輕易地實作本文所述的本發明概念。

以下，在本說明書中所使用的用語「單元(unit)」或「模組(module)」可意指例如現場可程式化閘陣列(field programmable gate array，FPGA)或應用專用積體電路(application specific integrated circuit，ASIC)等的硬體組件或電子電路。此類用語亦可指代以下各項的組合：由硬體組件或電子電路執行的軟體指令、以及所述硬體組件或電子電路、及/或儲存所述軟體指令的記憶體。

圖1說明根據實施例的視訊編碼裝置的方塊圖。

視訊編碼裝置10可為處理視訊資料(或影像資料)的各種裝置中的一者。根據實施例，視訊編碼裝置10可屬於包括用以輸出視訊資料的顯示器的類型。舉例而言，視訊編碼裝置10可為行動電話、桌上型個人電腦(personal computer，PC)、膝上型個人電腦、平板個人電腦等。視訊編碼裝置10亦可屬於包括用以產生視訊資料的攝影機模組的類型，例如數位攝影機、數位攝錄影機(digital camcorder)、智慧型電話等。此外，視訊編碼裝置10可以是為了藉由通訊頻道(例如網路)傳送資料而執行視訊編碼的伺服器。此外，視訊編碼裝置10可利用作為一部分包含於上述裝置中的一或多個半導體晶片來實作，且可包括儲存軟體的電腦可讀取儲存媒體，所述軟體是利用可由處理器、中央處理單元(central processing unit，CPU)、圖形處理單元(graphic processing unit，GPU)等執行以用於執行視訊編碼的指令來實作。

視訊編碼裝置10可包括至少一個處理器。圖1所示的各模組可由一個處理器實作，且可利用不同的處理器來獨立地實作，並且亦可以是此類處理器與由處理器執行的軟體、以及儲存由處理器執行的軟體的記憶體的組合。

視訊編碼裝置10可藉由編碼原始視訊資料5來產生經編碼資料(例如，經編碼位元串流)。量化模組300的量化參數決策模組320可產生與區塊對應的量化參數QP。舉例而言，量化參數QP可被產生成對於不同的相應區塊具有不同的值。根據實施例的視訊編碼裝置10可包括控制模組100、變換模組200、量化模組300、解量化模組(de-quantization module)400、逆變換模組500、解塊(deblocking)/樣本適應性偏移濾波器模組600(sample adaptive offset(SAO)filter module)、經解碼訊框緩衝器700、訊框內預測模組(intra prediction module)800及訊框間預測模組(inter prediction module)900，且可包括用以運行資料加法或資料減法的運算區塊。

控制模組100可控制視訊編碼。舉例而言，控制模組100可接收原始視訊資料5，且可如虛線所示將控制訊號發送至視訊編碼裝置10中所包含的其他模組。

變換模組200可藉由對殘差資料D_RES進行變換來產生輸入資料D_IN。殘差資料D_RES是表示原始資料D_ORG與預測資料D_PRE之間的差異的資料。舉例而言，變換模組200可藉由對殘差資料D_RES執行離散餘弦變換(discrete cosine transform，DCT)來產生輸入資料D_IN。因此，空間域的殘差資料D_RES可被變換成頻域的輸入資料D_IN。

量化模組300(或量化器)可藉由對輸入資料D_IN進行量化來獲得輸出資料D_OUT。舉例而言，量化模組300可依據量化參數QP來對輸入資料D_IN進行量化。如稍後將闡述，量化模組300可產生被調整成使自輸出資料D_OUT產生的經編碼資料的視訊品質改良的量化參數。亦即，量化模組300可產生被調整成使自位元串流所解碼的資料的視訊品質改良的經調整量化參數，且可藉由依據經調整量化參數對輸入資料D_IN進行量化來獲得輸出資料D_OUT。如圖1中所示，量化模組300可包括量化參數決策模組320及量化處理器340。

量化參數決策模組320可基於經量化係數的特性來決定量化參數。舉例而言，量化參數決策模組320可利用給定初始量化參數來對頻域的輸入資料D_IN進行量化以產生量化係數，且可參照所產生的量化係數的特性來增大或減小初始量化參數。亦即，可基於所產生的量化係數的特性來增大或減小初始量化參數，使得若所述特性不同，則所述增大或減小將不發生或者將達到不同的量或程度。

量化處理器340可藉由依據量化參數對輸入資料D_IN進行量化來獲得輸出資料D_OUT。

解量化模組400及逆變換模組500可執行與量化模組300及變換模組200相逆的操作。舉例而言，解量化模組400可對輸出資料D_OUT進行解量化，且逆變換模組500可藉由對由解量化模組400產生的資料(即，頻域的資料)進行逆變換來產生空間域的資料。由逆變換模組500產生的資料可為經解碼殘差資料。

解塊/樣本適應性偏移濾波器模組600及經解碼訊框緩衝器700可產生並儲存用於訊框間預測的經解碼訊框資料。解塊/樣本適應性偏移濾波器模組600可對與預測資料D_PRE與由解量化模組400解量化且然後由逆變換模組500逆變換的殘差資料之和對應的資料進行濾波。因此，因構成一個訊框的各區塊所致的錯誤可減少。此可意味著，產生了指示品質更佳的影像的訊框資料。經解碼訊框緩衝器700可儲存由解塊/樣本適應性偏移濾波器模組600產生的訊框資料，且可將所儲存的訊框資料提供至訊框間預測模組900。

訊框內預測模組800可基於與預測資料D_PRE與由解量化模組400解碼且然後由逆變換模組500逆變換的殘差資料以及原始資料D_ORG之和對應的資料來產生訊框內預測資料。舉例而言，訊框內預測模組800可藉由執行訊框內估計及訊框內預測來產生訊框內預測資料。

訊框間預測模組900可基於自經解碼訊框緩衝器700提供的訊框資料、及原始資料D_ORG來產生訊框間預測資料。舉例而言，訊框間預測模組900可藉由執行運動估計及運動補償來產生訊框間預測資料。

訊框內預測資料及訊框間預測資料中的一者可由控制模組100選擇來作為預測資料D_PRE，且可用於自原始資料D_ORG產生殘差資料D_RES。

在圖1中，原始資料D_ORG可為構成原始視訊資料5一個訊框的多個區塊的一者中所包含的影像資料。舉例而言，包含多個訊框的原始視訊資料5可以是針對多個訊框中的每一者的多個區塊中的每一者來加以編碼。因此，原始資料D_ORG、預測資料D_PRE、殘差資料D_RES、輸入資料D_IN及輸出資料D_OUT可對應於一個區塊。量化模組300的量化參數決策模組320可決定與區塊對應的量化參數。舉例而言，量化參數可被確定成對於不同的相應區塊具有不同的值。

圖2A指示根據實施例的視訊編碼裝置。

視訊編碼裝置2000可編碼視訊資料，且可輸出經編碼位元串流。根據實施例的視訊編碼裝置2000可包括圖1所示視訊編碼裝置10的全部或一部分(例如，圖1所示量化模組300)。因此，視訊編碼裝置2000可執行參照圖1所述的視訊編碼裝置10的操作的全部或一部分。

視訊編碼裝置2000可包括至少一個處理器2300。以下欲闡述的視訊編碼裝置2000的操作可由所述至少一個處理器2300執行。

輸入資料2100可包含藉由對相對於原始資料所產生的殘差資料執行頻率變換而產生的變換係數，但並非僅限於此。

視訊編碼裝置2000可利用初始量化參數(QP0)2050對輸入資料2100執行量化，且可產生量化係數2500。

根據實施例的初始量化參數2050可為依據輸入資料2100而提前確定的量化參數。舉例而言，初始量化參數2050可為針對每一編碼單位或針對每一變換單位而基本上確定的值。根據實施例的視訊編碼裝置2000可基於藉由編碼原始視訊資料所產生的位元串流的位元率來決定初始量化參數2050。在其中於位元率中存在充足裕度(margin)的情形中，初始量化參數2050可被確定成相對小的；否則，初始量化參數2050可被確定成相對大的。根據實施例，可將關於初始量化參數2050的資訊編碼並以位元串流的形式傳送至視訊解碼裝置。

視訊編碼裝置2000可參照(基於)量化係數2500來調整初始量化參數2050的大小。大小被調整的初始量化參數亦可被確定為欲用於對輸入資料2100進行量化的最終量化參數(QP1)2700。視訊編碼裝置2000可利用最終量化參數2700對輸入資料2100進行量化，且可獲得輸出資料2900。以下，將參照圖2B更全面地闡述視訊編碼裝置2000的操作。

圖2B是說明根據實施例的在視訊編碼裝置中執行的視訊編碼方法的流程圖。

在操作S2200中，視訊編碼裝置2000可利用初始量化參數來對輸入資料執行量化，且可產生量化係數。以下，假設初始量化參數具有值22。

參照圖3，經變換係數3200及經變換係數3600指示根據實施例的輸入資料。經變換係數3200及經變換係數3600中的每一者可為藉由對相對於原始資料所產生的殘差資料執行頻率變換而獲得的係數。經變換係數3200及經變換係數3600中的每一者可由16個係數構成，且所述16個係數可以二維排列的形式(例如，TC(i,j)，0<=i<4且0<=j<4)或以一維排列的形式(例如，TC(k)，0<=k<15)來說明。然而，經變換係數3200及經變換係數3600的構成及形式可並非僅限於此。

量化係數3400及量化係數3800分別指示利用初始量化參數3300對經變換係數3200及經變換係數3600進行量化的結果。量化係數3400及量化係數3800中的每一者可由16個係數構成，且所述16個係數可以二維排列的形式(例如，QC(i,j)，0<=i<4且0<=j<4)或以一維排列的形式(例如，QC(k)，0<=k<15)來說明。然而，量化係數3400及量化係數3800的構成及形式可並非僅限於此。以下，第(x,y)位置的係數可意指係數A(i,j)(0<=i<4且0<=j<4)中第x列及第y行處的值(即，A(x,y))。

可利用以下方程式而自量化參數QP獲得執行量化所使用的量化步長(quantization step)Q_step。

舉例而言，與初始量化參數3300對應的量化步長可被確定成「8」，且在初始量化參數增大至「28」時可增大至「16」。因此，量化參數的大小的增大可意味著量化步長的大小的增大。此外，使量化步長的大小增大至兩倍可意味著使現有量化參數的大小增大至與大小增大至兩倍的量化步長對應的大小。

可藉由利用以下方程式分別對經變換係數3200及經變換係數3600進行量化來獲得量化係數3400及量化係數3800。

[方程式(2)]Q_coeff=lower bound(T_coeff+(R_coeff×Q_step))/Q_step)(Q_coeff：量化係數，T_coeff：經變換係數，R_coeff：量化捨入偏移，及Q_step：量化步長)。

在操作S2400中，視訊編碼裝置2000可參照(基於)在操作S2200中所產生的量化係數的特性來調整初始量化參數的大小。

返回至圖3，視訊編碼裝置2000可參照(基於)量化係數3400將初始量化參數3300增大6，以決定欲用於對經變換係數3200進行量化的最終量化參數3500(例如，28)。舉例而言，視訊編碼裝置2000可參照(基於)量化係數3800將初始量化參數3300增大6，以決定欲用於對經變換係數3600進行量化的最終量化參數3900(例如，28)。

在操作S2400中，視訊編碼裝置2000可判斷欲藉由利用初始量化參數來恢復輸入資料而產生的恢復資料與欲藉由利用另一量化參數來恢復輸入資料而產生的恢復資料是否彼此相同或是否彼此相差在參考範圍內。所述另一量化參數的大小大於初始量化參數的大小。視訊編碼裝置2000可提前判斷欲利用不同的量化參數(例如，初始量化參數及大小被調整的另一量化參數)而產生的多條恢復資料是否彼此相同或是否彼此相差在參考範圍之內。視訊編碼裝置可僅參照在操作S2200中所產生的量化參數來判斷欲產生的多條恢復資料是彼此相同還是彼此不同，而無需進行實際上產生恢復資料並將所產生的恢復資料與對應的資料進行比較的過程。

以下，將參照圖4A更全面地闡述一個實施例。可藉由對量化係數4100執行逆量化來產生恢復資料4200，量化係數4100是利用初始量化參數對經變換係數4000進行量化而產生。可藉由對量化係數4300執行逆量化來產生恢復資料4400，量化係數4300是利用大小較初始量化參數的大小大的另一量化參數(例如，28)對經變換係數4000進行量化而產生。恢復資料4200與恢復資料4400相同。

因此，視訊編碼裝置2000可決定大小較初始量化參數的大小大的另一量化參數作為欲用於對經變換係數4000進行量化的最終量化參數，藉此改良編碼效率。亦即，由於恢復資料4200與恢復資料4400相同，因此，即使編碼及解碼是利用大小較初始量化參數的大小大的另一量化參數來執行，與利用初始量化參數來執行編碼及解碼的情形相較，亦可不發生影像的劣化(degradation)。

以下，將參照圖4B更全面地闡述另一實施例。可藉由對量化係數4600執行逆量化來產生恢復資料4700，量化係數4600是利用初始量化參數對經變換係數4500進行量化而產生。可藉由對量化係數4800執行逆量化來產生恢復資料4900，量化係數4800是利用大小較初始量化參數的大小大的另一量化參數(例如，28) 對經變換係數4500進行量化而產生。由於(1,3)位置處的值是「8」及「0」，因此恢復資料4700與恢復資料4900彼此不同。然而，甚至在此種情形中，視訊編碼裝置2000亦可決定大小較初始量化參數的大小大的另一量化參數作為欲用於對經變換係數4500進行量化的最終量化參數，藉此改良編碼效率。

亦即，在其中即使恢復資料4700與恢復資料4900不彼此重合但恢復資料4700與恢復資料4900之間的差異在參考範圍之內的情形中，視訊編碼裝置2000亦可確定藉由減小位元率而獲得的益處所提供的優點大於因所使用的另一量化參數的增大而使影像劣化所致的缺點。根據實施例，其中恢復資料4700與恢復資料4900之間的差異在參考範圍之內的情形可包括其中不同係數的數目是小的或不同係數指示具有高頻帶的分量的情形。然而，當各恢復資料(例如，恢復資料4700與恢復資料4900)之間的差異在參考範圍之內時的情形可並非僅限於此。

根據另一實施例，視訊編碼裝置2000可利用決策模型來調整初始量化參數的大小。參照圖6，決策模型6000可接收在操作S2200中所產生的量化係數，且可鑒於編碼效率及影像的劣化程度而輸出最終量化參數。最終量化參數可為藉由增大或減小初始量化參數而獲得的值。

決策模型6000可以是基於機器學習而產生。機器學習可意指用於獨自對多條輸入資料的特性進行分類/學習的演算法技術。舉例而言，可利用主成分分析(principal component analysis， PCA)技術、深度網路學習技術及奇異值分解(singular value decomposition，SVD)技術中的任一者並使用與大量的量化係數相關聯的資料作為輸入來執行與決策模型6000相關聯的機器學習。

可基於關於量化係數的資訊來執行與決策模型6000相關聯的機器學習，以決定用於產生與輸入資料對應的具有參考品質或更高品質的恢復資料的最終量化參數。舉例而言，與決策模型6000相關聯的機器學習可包括容許決策模型6000利用圖3所示的量化係數3400及與量化係數3400對應的最終量化參數3500進行學習的操作。此外，與決策模型6000相關聯的機器學習可包括容許決策模型6000利用圖3所示的經變換係數3600及與經變換係數3600對應的最終量化參數3900進行學習的操作。

以上述方式，可利用大量的量化係數及與其對應的最終量化參數來執行與決策模型6000相關聯的機器學習。隨著機器學習被執行，可一致地更新決策模型6000。

如上所述，視訊編碼裝置2000可參照(基於)量化係數4100或僅參照(基於)與量化係數4100相關聯的特性而在不實際上執行逆量化過程的情況下調整初始量化參數的大小。因此，可省略為了決定另一量化參數而執行的複雜操作(例如，計算速率失真成本(rate-distortion cost))。將參照圖5更全面地闡述根據實施例用於調整初始量化參數大小的確定參考。

在操作S2600中，視訊編碼裝置2000可決定大小被調整的初始量化參數作為最終量化參數。

在操作S2800中，視訊編碼裝置2000可利用在操作S2600中所確定的最終量化參數來對輸入資料進行量化，且可獲得輸出資料。根據實施例的視訊編碼裝置2000可將在操作S2200中所產生的量化係數中的每一者除以相同值「K」(K是正實數)，且可決定除法結果值作為輸出資料。此處，可根據初始量化參數被調整了多少(例如，為量化步長的增量)來不同地確定「K」。參照圖4A及圖4B，視訊編碼裝置2000可僅執行將在操作S2200中所產生的量化係數4100或量化係數4600中的每一者除以「2」的操作，而不執行利用所確定的最終量化參數來對經變換係數4000或經變換係數4500進行量化的操作。因此，視訊編碼裝置2000可決定如此獲得的量化係數4300或量化係數4800作為輸出資料。

圖5所示的操作S5410、操作S5420、操作S5430、操作S5450、操作S5460及操作S5480可屬於圖2B所示的操作S2400。然而，圖5所示的操作S5410、操作S5420、操作S5430、操作S5450、操作S5460及操作S5480可並非是圖2B所示操作S2400的必要成分。圖5所示的操作S5410、操作S5420、操作S5430、操作S5450、操作S5460及操作S5480的次序可改變。舉例而言，可在操作S2400中省略操作S5410、操作S5420、操作S5430、操作S5450、操作S5460及操作S5480中的一或多者，或者可為操作S2400添加除操作S5410、操作S5420、操作S5430、操作S5450、操作S5460及操作S5480之外的任何其他操作。

在操作S5410中，視訊編碼裝置2000可利用初始量化參數對輸入資料執行量化，且可產生量化係數。

在操作S5420中，視訊編碼裝置2000可判斷在操作S5410中所產生的所有量化係數是否均為偶數。其中所有量化係數均為偶數的情形可意味著存在用於在無資料損失的情況下壓縮輸入資料的另一量化參數(例如，圖4A所示的量化參數(quantization parameter，QP)28)，且所述另一量化參數具有較初始量化參數大的值。如果在操作S5410中所產生的所有量化係數均為偶數，則可執行操作S5430；否則，可在操作S5450中確定另一條件。

在操作S5430中，視訊編碼裝置2000可增大初始量化參數的大小。舉例而言，若在操作S5410中所產生的量化係數中大小最小的量化係數是2n(n是正整數)，則視訊編碼裝置2000可將量化步長增大至多達2ⁿ倍。返回至圖3，由於利用初始量化參數3300對經變換係數3200進行量化所產生的所有量化係數3400均為偶數且量化係數3400中大小最小的量化係數是「2」，則視訊編碼裝置2000可將初始量化參數增大至與量化步長的大小(例如，16)對應的值(例如，28)，所述量化步長的大小是初始量化參數3300的大小(例如，8)的兩倍。

在操作S5450中，視訊編碼裝置2000可僅基於量化係數的特性來判斷藉由減小位元率而獲得的益處所提供的優點是否超過因初始量化參數的增大而使影像劣化所致的缺點。因此，視訊編碼裝置2000可在不計算速率失真成本的情況下判斷是否調整初始量化參數的大小。

在操作S5420中，視訊編碼裝置2000可判斷在操作S5410中所產生的量化係數中為奇數的量化係數的數目是否不大於參考。返回至圖3，視訊編碼裝置2000可判斷所產生的16個量化係數中為奇數的量化係數的數目是否不大於3。藉由對初始量化參數3300進行量化所產生的量化係數3800中在(1,3)處的係數為奇數，即「1」。此可意味著，在利用值較初始量化參數3300的值大的另一量化參數來對輸入資料進行量化的情形中，關於輸入資料而發生損失(即，影像劣化)。

然而，如上所述，在其中利用初始量化參數所獲得的量化係數中為奇數的量化係數的數目小於參考的情形中，視訊編碼裝置2000可確定藉由減小位元率而獲得的益處所提供的優點大於因考慮初始量化參數的增大而使影像劣化所致的缺點。

然而，在例外情形下，即使量化係數中為奇數的量化係數的數目大於參考，若大多數的奇係數是指示具有高頻帶的分量的係數，則視訊編碼裝置2000亦可確定人所感覺到的影像劣化程度是微小的。原因是，人對影像在高頻帶中的劣化不像對在低頻帶中的劣化那麼敏感。甚至在此種情形中，視訊編碼裝置2000亦可確定藉由減小位元率而獲得的益處所提供的優點超過因考慮初始量化參數的增大而使影像劣化所致的缺點。

若確定藉由減小位元率而獲得的益處所提供的優點超過因初始量化參數的增大而使影像劣化所致的缺點，則可執行操作S5460；否則，可執行操作S5480。

在操作S5460中，視訊編碼裝置2000可增大初始量化參數的大小。舉例而言，若在操作S5410中所產生的量化係數中大小最小的量化係數是2n，則視訊編碼裝置2000可將量化步長增大至多達2ⁿ倍。返回至圖3，量化係數3800是由藉由利用初始量化參數3300對經變換係數3600進行量化所產生的16個量化係數構成。量化係數3800中的所述16個量化係數中僅有「1」為奇數。另外，量化係數3800中的所述16個量化係數中為偶數的最小者是「2」。因此，視訊編碼裝置2000可將初始量化參數增大至與量化步長的大小(例如，16)對應的值(例如，28)，所述量化步長的大小是初始量化參數3300的大小(例如，8)的兩倍。

在操作S5480中，視訊編碼裝置2000可利用決策模型來增大初始量化參數的大小。舉例而言，視訊編碼裝置2000可利用基於機器學習技術而學習的決策模型(例如，圖6所示的6000)而輸出與在操作S5410中所產生的量化係數對應的最終量化參數。

圖7說明根據實施例每一深度的編碼單位/分割區。

為了鑒於影像特性來執行編碼，根據實施例的視訊編碼裝置2000可使用基於層的編碼單位。編碼單位的最大高度、最大寬度及最大深度可根據影像的特性來適應性地加以確定，且可根據使用者的要求而以各種方式來加以設定。每一深度的編碼單位的大小可根據預設定編碼單位的最大大小來加以確定。

根據實施例的編碼單位的層結構7000說明其中編碼單位的最大高度及最大寬度是「64」且最大深度是「3」的情形。最大深度指示自最大編碼單位達成最小編碼單位所進行的總劃分次數。由於深度是沿著根據實施例的編碼單位的層結構7000的垂直軸線變深，因此每一深度的編碼單位的高度及寬度中的每一者被劃分。此外，用於對每一深度的編碼單位進行預測編碼的預測單位/分割區是沿著編碼單位的層結構7000的水平軸線而說明。

編碼單位1310(其是具有所述編碼單位的層結構7000的最大編碼單位)的深度是「0」，且所述編碼單位的大小(亦即，高度乘以寬度)是64×64。深度沿著垂直軸線變深，且存在以下編碼單位：深度為1、大小為32×32的編碼單位1320；深度為2、大小為16×16的編碼單位1330；以及深度為3、大小為8×8的編碼單位1340。深度為3、大小為8×8的編碼單位1340是最小編碼單位。

對於每一深度，編碼單位的預測單位/分割區是沿著水平軸線排列。若深度為0、大小為64×64的編碼單位1310是預測單位，則可將所述預測單位分割成大小為64×64的編碼單位1310中所包含的大小為64×64的預測區(prediction)、大小為64×32的預測區1312、大小為32×64的預測區1314及大小為32×32的預測區1316。

同樣地，若深度為1、大小為32×32的編碼單位1320 是預測單位，則可將所述預測單位分割成大小為32×32的編碼單位1320中所包含的大小為32×32的預測區、大小為32×16的預測區1322、大小為16×32的預測區1324及大小為16×16的預測區1326。

同樣地，若深度為2、大小為16×16的編碼單位1330是預測單位，則可將所述預測單位分割成大小為16×16的編碼單位1330中所包含的大小為16×16的預測區、大小為16×8的預測區1332、大小為8×16的預測區1334及大小為8×8的預測區1336。

同樣地，若深度為3、大小為8×8的編碼單位1340是預測單位，則可將所述預測單位分割成大小為8×8的編碼單位1340中所包含的大小為8×8的預測區、大小為8×4的預測區1342、大小為4×8的預測區1344及大小為4×4的預測區1346。

每一深度中為了包含範圍及大小相同的資料所需的編碼單位的數目隨著深度變深而增加。舉例而言，關於深度為1的一個編碼單位所包含的資料，需要深度為2的四個編碼單位。

圖8說明根據實施例的編碼單位與變換單位之間的關係。

關於最大編碼單位中的每一者，根據實施例的視訊編碼裝置2000可依據大小較最大編碼單位小或與最大編碼單位相同的編碼單位來編碼或解碼影像。用於編碼過程中的變換的變換單位的大小可基於不大於每一編碼單位的資料單位來加以選擇。

舉例而言，在當前編碼單位8000的大小是64×64時，根據實施例的視訊編碼裝置2000可利用大小為32×32的變換單位8200來執行變換。

此外，根據實施例的視訊編碼裝置2000可藉由以大小為32×32、16×16、8×8及4×4的變換單位中的每一者進行變換來編碼大小為64×64的編碼單位8000的資料，且然後可選擇其中原始資料與經編碼資料之間的差異最小的變換單位。

與原始資料與預測資料之間的差異對應的殘差資料可包含於變換單位中。根據實施例的視訊編碼裝置2000可對變換單位的殘差資料執行頻率變換，以產生經變換係數(例如，圖3所示的3200或3600)。此外，視訊編碼裝置2000可對基於藉由上述量化參數決定方法所確定的量化參數而產生的經變換係數進行量化。

圖9說明根據實施例的另一視訊編碼裝置的方塊圖。

視訊編碼裝置9000可包括預測模組9200、變換模組9400、量化模組9600及量化參數決策模組9800。視訊編碼裝置9000說明圖1所示視訊編碼裝置10的實施例。因此，即使以下省略，以上關於圖1所示視訊編碼裝置10所給出的說明亦可適用於圖9所示視訊編碼裝置9000。以下，將參照圖10所示流程圖來闡述視訊編碼裝置9000的操作。

圖10是說明視訊編碼裝置編碼影像的方法的流程圖。

在操作S10100中，預測模組9200可對當前編碼單位的至少一個預測單位執行訊框內預測或運動預測，且可為每一預測單位產生預測資料。作為運動預測結果而產生的預測單位的預測資料可意指當前預測單位與參考預測單位之間的殘差資料。

在操作S10200中，變換模組9400可相對於包含由預測模組9200產生的預測資料的當前編碼單位而決定將被執行變換的具有樹結構的至少一個變換單位。變換模組9400可對當前編碼單位中所包含的至少一個變換單位執行變換以產生經變換係數(例如，圖3所示的3200或3600)。

在操作S10300中，量化參數決策模組9800可藉由相對於所述至少一個變換單位而調整初始量化參數的大小來決定最終量化參數。在操作S10200中，在其中確定出與當前編碼單位相關聯的多個變換單位的情形中，可相對於所述多個變換單位來不同地確定最終量化參數。舉例而言，量化參數決策模組9800可利用初始量化參數來對當前變換單位執行量化，且可參照(基於)所產生的經量化的經變換係數來調整初始量化參數的大小。大小被調整的初始量化參數可被確定為當前變換單位的最終量化參數。參照圖2A至圖6更全面地闡述了量化參數決策模組9800決定最終量化參數的操作。

在操作S10400中，量化模組9600可利用由量化參數決策模組9800確定的量化參數對經變換係數執行量化，且可產生經量化的經變換係數。

圖11說明根據實施例的另一視訊解碼裝置的方塊圖。

視訊解碼裝置11000可接收在視訊編碼裝置9000中所產生的位元串流，且可解碼所接收的位元串流以恢復影像。

根據實施例的視訊解碼裝置11000可包括量化參數決策模組11200、逆量化模組11400、逆變換模組11600及重建模組11800。以下，將參照圖12所示流程圖來闡述視訊解碼裝置11000的操作。

圖12是說明視訊解碼裝置解碼影像的方法的流程圖。

在操作S12100中，量化參數決策模組11200可確定當前編碼單位中所包含的至少一個變換單位。

在操作S12200中，量化參數決策模組11200可確定如此確定的所述至少一個變換單位的量化參數。在操作S12100中，在其中確定出與當前編碼單位相關聯的多個變換單位的情形中，可分別相對於所述多個變換單位中的不同者來不同地確定量化參數。根據實施例的量化參數決策模組11200可基於與自位元串流接收的初始量化參數的差值來確定當前變換單位的另一量化參數。根據實施例，可自編碼單位的報頭獲得初始量化參數，所述報頭含有關於當前變換單位所屬的編碼單位的資訊。

在操作S12300中，逆量化模組11400可利用由量化參數決策模組11200確定的量化參數來對所述至少一個變換單位執行逆量化。可藉由逆量化來恢復經變換係數，且所恢復的經變換係數可被稱為恢復係數。可利用第一量化參數來產生第一恢復係數。可利用第二量化參數(例如最終量化參數)來產生第二恢復係數。

在操作S12400中，逆變換模組11600可對由逆量化模組11400恢復的經變換係數執行逆變換，以恢復變換單位中所包含的殘差資料。

在操作S12500中，重建模組11800可對當前編碼單位的所述至少一個預測單位執行訊框內預測或運動補償，且對於每一預測單位，可基於在操作S12400中所恢復的殘差資料來恢復影像資料。

電子系統1000可包括主處理器1101、工作記憶體1200、儲存裝置1300、通訊區塊1400、使用者介面1500及匯流排1600。舉例而言，電子系統1000可為例如桌上型電腦、膝上型電腦、平板電腦、智慧型電話、可穿戴裝置、視訊遊戲機、工作站、伺服器及電動車輛等電子裝置中的一者。根據實施例的電子系統1000可包括參照圖1至圖9所述的視訊編碼裝置或圖10所示的視訊解碼裝置中的至少一者。舉例而言，電子系統1000可包括圖2A所示視訊編碼裝置2000，但並非僅限於此。

主處理器1101可控制電子系統1000的整體操作。主處理器1101可處理各種類的算術運算及/或邏輯運算。為此，主處理器1101可包括專用邏輯電路(例如，現場可程式化閘陣列(FPGA)或應用專用積體晶片(application specific integrated chip， ASIC))。舉例而言，主處理器1101可包括一或多個處理器核心，且可利用通用處理器、專用處理器或應用處理器來實作。

在實施例中，主處理器1101可藉由執行儲存裝置1300中所儲存的指令來執行上述視訊編碼方法。舉例而言，主處理器1101可利用參照圖5所述的量化參數確定方法來確定輸入資料的量化參數，且可利用所確定的量化參數來編碼輸入資料。

主處理器1101可包括圖形處理單元(圖中未說明)。舉例而言，圖形處理單元可執行與圖形處理相關聯的程式指令。圖形處理單元可自外部接收圖形資料，且可將由圖形處理單元處理的圖形資料傳送至外部。在實施例中，圖形處理單元可執行參照圖1至圖9所述的視訊編碼方法。舉例而言，圖形處理單元可藉由編碼自外部接收的原始資料來產生位元串流。

工作記憶體1200可儲存欲在電子系統1000的操作中使用的資料。舉例而言，工作記憶體1200可臨時儲存已由或將由主處理器1101處理的資料。工作記憶體1200可臨時儲存由主處理器1101產生的視訊位元串流或欲由主處理器1101處理的視訊位元串流。工作記憶體1200可包括揮發性記憶體(例如動態隨機存取記憶體(dynamic random access memory，DRAM)、同步動態隨機存取記憶體(synchronous DRAM，SDRAM)等)及/或非揮發性記憶體(例如相變隨機存取記憶體(phase-change RAM，PRAM)、磁阻性隨機存取記憶體(magneto-resistive RAM，MRAM)、電阻性隨機存取記憶體(resistive RAM，ReRAM)、鐵電性隨機存取記憶體(ferroelectric RAM，FRAM)等)。

儲存裝置1300可包括至少一個記憶體裝置及控制器。不管電源供應如何，儲存裝置1300的記憶體裝置均可儲存資料。舉例而言，儲存裝置1300可包括非揮發性記憶體裝置，例如快閃記憶體、相變隨機存取記憶體、磁阻性隨機存取記憶體、電阻性隨機存取記憶體、鐵電性隨機存取記憶體等。舉例而言，儲存裝置1300可包括例如固態磁碟機(solid state drive，SSD)、卡式儲存器、嵌入式儲存器等儲存媒體。根據實施例，儲存裝置1300可儲存藉由編碼上述原始資料或視訊資料而產生的位元串流。

通訊區塊1400可與電子系統1000的外部裝置/系統進行通訊。舉例而言，通訊區塊1400可支援各種無線通訊協定(例如長期演進(long term evolution，LTE)、全球微波存取互通(worldwide interoperability for microwave access，WiMax)、全球行動通訊系統(global system for mobile communication，GSM)、分碼多重存取(code division multiple access，CDMA)、藍芽(Bluetooth)、近場通訊(near field communication，NFC)、無線保真(wireless fidelity，Wi-Fi)及射頻識別(radio frequency identification，RFID))中的至少一者及/或各種有線通訊協定(例如傳輸控制協定/網際網路協定(transfer control protocol/Internet protocol，TCP/IP)、通用串列匯流排(universal serial bus，USB)及火線(Firewire))中的至少一者。

使用者介面1500可在使用者與電子系統1000之間執行通訊仲裁。舉例而言，使用者介面1500可包括例如鍵盤、滑鼠、小鍵盤、按鈕、觸控面板、觸控螢幕、觸控板、觸控球、攝影機、麥克風、陀螺儀感測器及振動感測器等輸入介面。舉例而言，使用者介面1500可包括例如液晶顯示(liquid crystal display，LCD)裝置、發光二極體(light emitting diode，LED)顯示裝置、有機發光二極體(organic LED，OLED)顯示裝置、主動矩陣有機發光二極體(active matrix OLED，AMOLED)顯示裝置、揚聲器及馬達等輸出介面。

匯流排1600可在電子系統1000的各組件之間提供通訊路徑。電子系統1000的各組件可基於匯流排1600的匯流排格式來彼此交換資料。舉例而言，匯流排格式可包括例如通用串列匯流排、小型電腦系統介面(small computer system interface，SCSI)、快速周邊組件互連(peripheral component interconnect express，PCIe)、行動快速周邊組件互連(mobile PCIe，M-PCIe)、先進技術附接(advanced technology attachment，ATA)、並列先進技術附接(parallel ATA，PATA)、串列先進技術附接(serial ATA SATA)、串列附接小型電腦系統介面(serial attached SCSI，SAS)、積體驅動電子裝置(integrated drive electronics，IDE)、增強型積體驅動電子裝置(enhanced IDE，EIDE)、快速非揮發性記憶體(nonvolatile memory express，NVMe)及通用快閃儲存(universal flash storage，UFS)等各種介面協定中的一或多者。

同時，以上所述的視訊編碼方法及視訊解碼方法可利用電腦可讀取記錄媒體中的電腦可讀取碼來實作。電腦可讀取記錄媒體可包括其中儲存資料的所有種類的儲存裝置。電腦可讀取記錄媒體的實例包括唯讀記憶體(read-only memory，ROM)、隨機存取記憶體(RAM)、壓縮碟片-唯讀記憶體(compact disc-read only memory，CD-ROM)、磁帶、軟碟、光學資料儲存裝置及載波(例如藉由網際網路進行的資料傳輸)。此外，在電腦可讀取記錄媒體中，可以分佈式方式儲存及執行可由電腦讀出的程式或碼。

以上說明旨在提供用於實作本文所述的本發明概念的示例性配置及操作。除上述實施例以外，本發明的範圍及精神亦可包含能夠藉由簡單地改變或修改上述實施例而獲得的實施方案。此外，本發明的範圍及精神可包含能夠藉由以後輕易地改變或修改上述實施例而達成的實施方案。

2000‧‧‧視訊編碼裝置

2050‧‧‧初始量化參數

2100‧‧‧輸入資料

2300‧‧‧處理器

2500‧‧‧量化係數

2700‧‧‧最終量化參數

2900‧‧‧輸出資料

Claims

一種視訊編碼裝置，包括至少一個處理器，其中所述至少一個處理器被配置成：參照利用第一量化參數自輸入資料所產生的量化係數的特性來調整所述第一量化參數的大小；確定所述大小被調整的所述第一量化參數作為最終量化參數；以及利用所述最終量化參數來對所述輸入資料進行量化，以產生輸出資料，其中若參照利用所述第一量化參數所產生的所述量化係數的所述特性而確定欲藉由利用所述第一量化參數恢復所述輸入資料而產生的第一恢復資料與欲藉由利用第二量化參數恢復所述輸入資料而產生的第二恢復資料彼此相同或彼此相差在參考範圍之內，則所述至少一個處理器將所述第一量化參數的所述大小增大至所述第二量化參數的大小以獲得所述最終量化參數，且其中所述第二量化參數的所述大小大於所述第一量化參數的所述大小。
如申請專利範圍第1項所述的視訊編碼裝置，其中若利用所述第一量化參數所產生的所有所述量化係數均為偶數，則所述至少一個處理器確定所述第一恢復資料與所述第二恢復資料彼此相同。
如申請專利範圍第2項所述的視訊編碼裝置，其中所述第二量化參數是與量化步長對應的值，所述量化步長的大小是與所述第一量化參數對應的量化步長的大小的兩倍。
如申請專利範圍第1項所述的視訊編碼裝置，其中若利用所述第一量化參數所產生的所述量化係數中為奇數的量化係數的數目不大於參考，則所述至少一個處理器確定所述第一恢復資料與所述第二恢復資料彼此相差在所述參考範圍之內。
如申請專利範圍第1項所述的視訊編碼裝置，其中若利用所述第一量化參數所產生的所述量化係數中為奇數的量化係數是指示具有高頻帶的分量的係數，則所述至少一個處理器確定所述第一恢復資料與所述第二恢復資料彼此相差在所述參考範圍之內。
如申請專利範圍第1項所述的視訊編碼裝置，其中所述至少一個處理器更被配置成透過使用基於機器學習所產生的決策模型來調整所述第一量化參數，並且其中所述決策模型接收使用所述第一量化參數所產生的量化參數，以輸出所述最終量化參數。
如申請專利範圍第6項所述的視訊編碼裝置，其中所述決策模型是透過使用主成分分析(PCA)技術、深度網路學習技術及奇異值分解(SVD)技術中的至少一者所產生的。
一種由至少一個處理器執行的視訊編碼方法，所述方法包括：利用第一量化參數對輸入資料執行量化，以產生量化係數；參照利用所述第一量化參數所產生的所述量化係數的特性來調整所述第一量化參數的大小；確定所述大小被調整的所述第一量化參數作為最終量化參數；以及利用所述最終量化參數對所述輸入資料進行量化，以產生輸出資料，其中調整所述第一量化參數的所述大小包括：參照利用所述第一量化參數所產生的所述量化係數的所述特性來判斷欲藉由利用所述第一量化參數恢復所述輸入資料而產生的第一恢復資料與欲藉由利用第二量化參數恢復所述輸入資料而產生的第二恢復資料是否彼此相同或是否彼此相差在參考範圍之內；以及若確定所述第一恢復資料與所述第二恢復資料彼此相同或彼此相差在參考範圍之內，則將所述第一量化參數的所述大小增大至所述第二量化參數的大小以獲得所述最終量化參數，其中所述第二量化參數的所述大小大於所述第一量化參數的所述大小。
如申請專利範圍第8項所述的方法，其中所述確定包括：若利用所述第一量化參數所產生的所有所述量化係數均為偶數，則確定所述第一恢復資料與所述第二恢復資料彼此相同。
如申請專利範圍第9項所述的方法，其中所述第二量化參數是與量化步長對應的值，所述量化步長的大小是與所述第一量化參數對應的量化步長的大小的兩倍。
如申請專利範圍第8項所述的方法，其中所述確定包括：若利用所述第一量化參數所產生的所述量化係數中為奇數的量化係數的數目不大於參考，則確定所述第一恢復資料與所述第二恢復資料彼此在所述參考範圍之內不同。
如申請專利範圍第8項所述的方法，其中所述確定包括：若利用所述第一量化參數所產生的所述量化係數中為奇數的量化係數是指示具有高頻帶的分量的係數，則確定所述第一恢復資料與所述第二恢復資料彼此在所述參考範圍之內不同。
如申請專利範圍第8項所述的方法，其中調整所述第一量化參數的所述大小包括：透過使用基於機器學習所產生的決策模型來調整所述第一量化參數。
如申請專利範圍第13項所述的方法，其中所述決策模型是透過使用主成分分析(PCA)技術、深度網路學習技術及奇異值分解(SVD)技術中的至少一者所產生的。
一種由至少一個處理器執行的視訊編碼方法，所述方法包括：確定與編碼單位相關聯的至少一個變換單位；對所述至少一個變換單位中所包含的多條殘差資料執行頻率變換，以產生與所述至少一個變換單位相關聯的經變換係數；利用第一量化參數對所述經變換係數執行量化，以產生量化係數；參照利用所述第一量化參數所產生的所述量化係數的特性來調整所述第一量化參數的大小，以確定最終量化參數；以及利用所確定的所述最終量化參數來對所述經變換係數進行量化，其中確定所述最終量化參數包括：參照利用所述第一量化參數所產生的所述量化係數的所述特性來判斷欲藉由利用所述第一量化參數恢復所述經變換係數而產生的第一恢復係數與欲藉由利用第二量化參數恢復所述經變換係數而產生的第二恢復係數是否彼此相同或是否彼此相差在參考範圍之內；以及若確定所述第一恢復係數與所述第二恢復係數彼此相同或彼此相差在參考範圍之內，則將所述第一量化參數的所述大小增大至所述第二量化參數的大小以獲得所述最終量化參數，其中所述第二量化參數的所述大小大於所述第一量化參數的所述大小。
如申請專利範圍第15項所述的方法，其中所述確定包括：若利用所述第一量化參數所產生的所有所述量化係數均為偶數或多個量化係數，則確定所述第一恢復係數與所述第二恢復係數在所述參考範圍之內彼此相同或彼此不同，多個量化係數使用所述第一量化係數所產生的所數量化係數中的奇數不大於參考值。
如申請專利範圍第15項所述的方法，其中若與所述編碼單位相關聯的多個變換單位被確定，則所述最終量化參數分別針對不同的所述多個變換單元而不同地確定。