TWI601411B - 視訊解碼裝置 - Google Patents

視訊解碼裝置 Download PDF

Info

Publication number
TWI601411B
TWI601411B TW105135497A TW105135497A TWI601411B TW I601411 B TWI601411 B TW I601411B TW 105135497 A TW105135497 A TW 105135497A TW 105135497 A TW105135497 A TW 105135497A TW I601411 B TWI601411 B TW I601411B
Authority
TW
Taiwan
Prior art keywords
unit
code
depth
size
prediction
Prior art date
Application number
TW105135497A
Other languages
English (en)
Other versions
TW201707449A (zh
Inventor
雅希納艾爾納
陳建樂
韓宇鎭
Original Assignee
三星電子股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三星電子股份有限公司 filed Critical 三星電子股份有限公司
Publication of TW201707449A publication Critical patent/TW201707449A/zh
Application granted granted Critical
Publication of TWI601411B publication Critical patent/TWI601411B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

視訊解碼裝置
本發明是關於視訊編碼與解碼,且更特定言之,是關於對視訊做編碼以及解碼以減少用於在運動補償期間讀出參考畫面的資料的記憶體存取的方法以及裝置。
為了對視訊做編碼,將一個圖像分割為諸如巨集區塊的預定資料單元。藉由使用畫面間預測或畫面內預測而對所述巨集區塊中的每一者做預測編碼。
畫面間預測是一種藉由移除圖像之間的時間冗餘而壓縮影像的方法,其使用運動估計以及運動補償。運動估計藉由使用至少一個參考圖像而預測當前圖像的區塊。運動估計以及運動補償是藉由使用預定評估函數(evaluation function)而搜尋預定搜尋範圍中最類似於當前區塊的參考區塊以及讀出最類似於當前區塊的參考區塊的資料的程序。為了較準確地執行運動估計以及運動補償,藉由在參考圖像的預定搜尋範圍中執行內插而產生整數像素之間的子像素,且基於具有子像素精度的參考圖像而執行運動估計以及運動補償。為了以子像素精度執行運動估計以及運動補償,需要對參考圖像的資料進行內插的程序。
在先前技術中,藉由使用具有預定分接頭數目的有限脈衝回應(finite impulse response;FIR)濾波器而執行內插。N分接頭FIR濾波器藉由使用N個相鄰整數像素而對子像素進行內插。為了在藉由使用N分接頭FIR濾波器執行內插的程序中對一個子像素進行內插,需要自記憶體讀出N個參考像素。若運動向量的水平分量與垂直分量兩者具有子像素精度,則因為需要在水平方向以及垂直方向上執行二維(2D)內插程序,所以增大了執行記憶體存取的次數。因為使用了兩個參考圖像,所以針對雙向運動而執行的記憶體存取的次數兩倍於針對單向運動估計而執行的記憶體存取的次數。
本發明提供用於對視訊做編碼以及解碼的方法及裝置,其可減少用於在運動估計以及運動補償期間讀出參考資料的記憶體存取。
根據本發明的一態樣,提供一種對視訊做編碼的方法,所述方法包含:基於待編碼的當前預測單元的大小而判定單向運動估計模式以及雙向運動估計模式是否用於所述當前預測單元的運動估計以及運動補償;根據是否使用所述單向運動估計模式以及所述雙向運動估計模式,藉由使用所述單向運動估計模式以及所述雙向運動估計模式中的至少一個運動估計模式而對所述當前預測單元執行所述運動估計以及所述運動補償;基於經由所述運動估計以及所述運動補償而獲得的所述當前預測單元的編碼成本來判定所述當前預測單元的運動估計模式;以及基於所述當前預測單元的所述大小而對所判定的運動估計模式資訊做編碼。
根據本發明的另一態樣,提供一種用於對視訊做編碼的裝置,所述裝置包含:運動估計器以及補償器,其基於待編碼的當前預測單元的大小而判定是否使用應用於所述當前預測單元的運動估計以及運動補償的單向運動估計模式以及雙向運動估計模式,且根據是否使用所述單向運動估計模式以及所述雙向運動估計模式,藉由使用所述單向運動估計模式以及所述雙向運動估計模式中的至少一個運動估計模式而對所述當前預測單元執行運動估計以及運動補償;控制器,其基於經由所述運動估計以及所述運動補償而獲得的所述當前預測單元的編碼成本來判定所述當前預測單元的運動估計模式;以及熵編碼器,其基於所述當前預測單元的所述大小而對所判定的運動估計模式資訊做編碼。
根據本發明的另一態樣,提供一種用於對視訊做解碼的裝置,所述裝置包含:熵解碼器,其獲得待自位元串流解碼的當前預測單元的大小資訊以及指示應用於所述當前預測單元的運動估計模式的運動估計模式資訊;以及運動補償器,其基於所述當前預測單元的大小以及所述所獲得的運動估計模式資訊而自單向運動估計模式以及雙向運動估計模式判定應用於所述當前預測單元的所述運動估計模式,且藉由使用所判定的運動估計模式而對所述當前預測單元執行運動補償。
可藉由以下方式而將用於讀取參考畫面的資料的記憶體存取限制於預定頻寬:基於預測單元的大小而判定是否使用單向運動估計模式以及雙向運動估計模式;以及藉由使用所述所判定的運動估計模式而執行運動估計以及運動補償。
現將參看附圖來更全面描述本發明,附圖中展示了本發明的例示性實施例。
圖1為根據本發明的實施例的視訊編碼裝置100的方塊圖。
視訊編碼裝置100包含最大寫碼單元分割器110、寫碼單元判定器120以及輸出單元130。
最大寫碼單元分割器110可基於影像的當前圖像的最大寫碼單元來分割當前圖像。若當前圖像大於最大寫碼單元,則當前圖像的影像資料可分割為至少一個最大寫碼單元。根據本發明的實施例的最大寫碼單元可為大小為32×32、64×64、128×128、256×256等的資料單元,其中資料單元的形狀是寬度以及長度為2的平方的正方形。影像資料可根據至少一個最大寫碼單元而輸出至寫碼單元判定器120。
根據本發明的實施例的寫碼單元可藉由最大大小以及深度來表徵。深度表示寫碼單元自最大寫碼單元在空間上分割的次數,且隨著深度加深,根據深度的較深寫碼單元可自最大寫碼單元分割為最小寫碼單元。最大寫碼單元的深度為最上層深度,且最小寫碼單元的深度為最下層深度。由於對應於每一深度的寫碼單元的大小隨著最大寫碼單元的深度加深而減小,因此對應於較上層深度的寫碼單元可包含對應於較下層深度的多個寫碼單元。
如上所述,當前圖像的影像資料根據寫碼單元的最大大小而分割為最大寫碼單元,且最大寫碼單元中的每一者可包含根據深度而分割的較深寫碼單元。由於根據本發明的實施例的最大寫碼單元是根據深度來分割,因此包含於最大寫碼單元中的空間域的影像資料可根據深度而階層式分類。
限制最大寫碼單元的高度以及寬度階層式分割的總次數的寫碼單元的最大深度以及最大大小可為預定的。
寫碼單元判定器120對藉由根據深度來分割最大寫碼單元的區域而獲得的至少一個分割區域做編碼,且判定深度以根據所述至少一個分割區域來輸出最終編碼的影像資料。換言之,寫碼單元判定器120藉由根據當前圖像的最大寫碼單元來對根據深度的較深寫碼單元中的影像資料做編碼以及選擇具有最小編碼誤差的深度來判定經寫碼的深度。因此,最終輸出對應於所判定的經寫碼的深度的寫碼單元的經編碼的影像資料。且,可將對應於經寫碼的深度的寫碼單元視為經編碼的寫碼單元。所判定的經寫碼的深度以及根據所判定的經寫碼的深度的經編碼的影像資料輸出至輸出單元130。
基於對應於等於或低於最大深度的至少一個深度的較深寫碼單元而對最大寫碼單元中的影像資料做編碼,且基於較深寫碼單元中的每一者而比較對影像資料做編碼的結果。可在比較較深寫碼單元的編碼誤差之後選擇具有最小編碼誤差的深度。可針對每一最大寫碼單元選擇至少一個經寫碼的深度。
隨著寫碼單元根據深度而階層式分割,且隨著寫碼單元的數目增大,最大寫碼單元的大小被分割。且,即使寫碼單元對應於一個最大寫碼單元中的同一深度,仍藉由單獨量測每一寫碼單元的影像資料的編碼誤差而判定是否將對應於同一深度的寫碼單元中的每一者分割為較下層深度。因此,即使當影像資料包含於一個最大寫碼單元中時,影像資料仍根據深度分割為區域且編碼誤差仍可根據所述一個最大寫碼單元中的區域而不同,且因此經寫碼的深度可根據影像資料中的區域而不同。因此,可在一個最大寫碼單元中判定一或多個經寫碼的深度,且可根據至少一個經寫碼的深度的寫碼單元而劃分最大寫碼單元的影像資料。
因此,寫碼單元判定器120可判定包含於最大寫碼單元中的具有樹狀結構的寫碼單元。根據本發明的實施例的「具有樹狀結構的寫碼單元」包含最大寫碼單元中所包含的所有較深寫碼單元中的對應於判定為經寫碼的深度的深度的寫碼單元。可根據最大寫碼單元的同一區域中的深度而階層式判定經寫碼的深度的寫碼單元,且可在不同區域中獨立地進行判定。類似地,可獨立於另一區域中的經寫碼的深度而判定當前區域中的經寫碼的深度。
根據本發明的實施例的最大深度為與自最大寫碼單元至最小寫碼單元執行的分割次數相關的索引。根據本發明的實施例的第一最大深度可表示自最大寫碼單元至最小寫碼單元執行的總分割次數。根據本發明的實施例的第二最大深度可表示自最大寫碼單元至最小寫碼單元的總深度層級數。舉例而言,當最大寫碼單元的深度為0時,最大寫碼單元被分割一次的寫碼單元的深度可設定為1,且最大寫碼單元被分割兩次的寫碼單元的深度可設定為2。此處,若最小寫碼單元為最大寫碼單元被分割四次的寫碼單元,則存在深度0、1、2、3以及4的5個深度層級,且因此第一最大深度可設定為4,且第二最大深度可設定為5。
可根據最大寫碼單元執行預測編碼以及變換。根據最大寫碼單元,亦基於根據等於最大深度的深度或小於最大深度的深度的較深寫碼單元來執行預測編碼以及變換。可根據正交變換或整數變換的方法而執行變換。
由於每當根據深度來分割最大寫碼單元,較深寫碼單元的數目便增大,因此對隨著深度加深而產生的所有較深寫碼單元執行包含預測編碼以及變換的編碼。為便於描述,在最大寫碼單元中,現將基於當前深度的寫碼單元來描述預測編碼以及變換。
視訊編碼裝置100可按各種方式選擇用於對影像資料做編碼的資料單元的大小或形狀。為了對影像資料做編碼,執行諸如預測編碼、變換以及熵編碼的操作,且此時,同一資料單元可用於所有操作或不同資料單元可用於每一操作。
舉例而言,視訊編碼裝置100可不僅選擇用於對影像資料做編碼的寫碼單元,而且選擇不同於寫碼單元的資料單元,以便對寫碼單元中的影像資料執行預測編碼。
為了在最大寫碼單元中執行預測編碼,可基於對應於經寫碼的深度的寫碼單元(亦即,基於不再分割為對應於較下層深度的寫碼單元的寫碼單元)來執行預測編碼。下文中,不再分割且變為用於預測編碼的基礎單元的寫碼單元現將被稱為「預測單元」。藉由分割預測單元而獲得的分區可包含藉由分割預測單元的高度以及寬度中的至少一者而獲得的預測單元或資料單元。
舉例而言,當2N×2N(其中N為正整數)的寫碼單元不再分割且變為2N×2N的預測單元,且分區的大小可為2N×2N、2N×N、N×2N或N×N。分區類型的實例包含藉由對稱地分割預測單元的高度或寬度而獲得的對稱分區、藉由非對稱地分割預測單元的高度或寬度(諸如,1:n或n:1)而獲得的分區、藉由用幾何方式分割預測單元而獲得的分區,以及具有任意形狀的分區。
預測單元的預測模式可為畫面內模式、畫面間模式以及跳過模式中的至少一者。舉例而言,可對2N×2N、2N×N、N×2N或N×N的分區執行畫面內模式或畫面間模式。且,可僅對2N×2N的分區執行跳過模式。在寫碼單元中對一個預測單元獨立地執行編碼,藉此選擇具有最小編碼誤差的預測模式。
視訊編碼裝置100亦可不僅基於用於對影像資料做編碼的寫碼單元而且基於不同於寫碼單元的資料單元而對寫碼單元中的影像資料執行變換。
為了在寫碼單元中執行變換,可基於具有小於或等於寫碼單元的大小的資料單元來執行變換。舉例而言,用於變換的資料單元可包含用於畫面內模式的資料單元以及用於畫面間模式的資料單元。
用作變換的基礎的資料單元現將稱為「變換單元」。類似於寫碼單元,寫碼單元中的變換單元可按遞迴方式分割為較小大小的區域,以使得可單獨以區域為單位來判定變換單元。因此,可根據具有根據變換深度的樹狀結構的變換單元而劃分寫碼單元中的殘餘資料。
亦可在變換單元中設定指示藉由分割寫碼單元的高度以及寬度而達到變換單元所執行的分割次數的變換深度。舉例而言,在2N×2N的當前寫碼單元中,當變換單元的大小為2N×2N時,變換深度可為0,當變換單元的大小為N×N時,變換深度可為1,且當變換單元的大小為N/2×N/2時,變換深度可為2。亦即,亦可根據變換深度而設定具有樹狀結構的變換單元。
根據對應於經寫碼的深度的寫碼單元的編碼資訊不僅需要關於經寫碼的深度的資訊,而且需要與預測編碼以及變換相關的資訊。因此,寫碼單元判定器120不僅判定具有最小編碼誤差的經寫碼的深度,而且判定預測單元中的分區類型、根據預測單元的預測模式,以及用於變換的變換單元的大小。
稍後將參看圖3至圖12詳細描述根據本發明的實施例的最大寫碼單元中具有樹狀結構的寫碼單元以及判定分區的方法。
寫碼單元判定器120可藉由基於拉格朗日乘數(Lagrangian multiplier)使用位元率-失真(Rate-Distortion;RD)最佳化來量測根據深度的較深寫碼單元的編碼誤差。
輸出單元130按照位元串流的形式輸出基於由寫碼單元判定器120判定的至少一個經寫碼的深度而編碼的最大寫碼單元的影像資料,以及根據經寫碼的深度關於編碼模式的資訊。
可藉由對影像的殘餘資料做編碼來獲得經編碼的影像資料。
根據經寫碼的深度關於編碼模式的資訊可包含關於經寫碼的深度、關於預測單元中的分區類型、預測模式以及變換單元的大小的資訊。
可藉由使用根據深度的分割資訊來定義關於經寫碼的深度的資訊,根據深度的分割資訊指示是否對較下層深度而非當前深度的寫碼單元執行編碼。若當前寫碼單元的當前深度為經寫碼的深度,則對當前寫碼單元中的影像資料做編碼且輸出,且因此,分割資訊可定義為不將當前寫碼單元分割為較下層深度。或者,若當前寫碼單元的當前深度並非經寫碼的深度,則對較下層深度的寫碼單元執行編碼,且因此分割資訊可定義為分割當前寫碼單元以獲得較下層深度的寫碼單元。
若當前深度並非經寫碼的深度,則對分割為較下層深度的寫碼單元的寫碼單元執行編碼。由於較下層深度的至少一個寫碼單元存在於當前深度的一個寫碼單元中,因此對較下層深度的每一寫碼單元重複地執行編碼,且因此可對具有同一深度的寫碼單元按遞迴方式執行編碼。
由於針對一個最大寫碼單元而判定具有樹狀結構的寫碼單元,且針對經寫碼的深度的寫碼單元而判定關於至少一個編碼模式的資訊,因此可針對一個最大寫碼單元而判定關於至少一個編碼模式的資訊。且,最大寫碼單元的影像資料的經寫碼的深度可根據位置而不同,此是因為根據深度而階層式分割影像資料,且因此可針對影像資料而設定關於經寫碼的深度以及編碼模式的資訊。
因此,輸出單元130可將關於相應經寫碼的深度以及編碼模式的編碼資訊指派給包含於最大寫碼單元中的寫碼單元、預測單元以及最小單元中的至少一者。
根據本發明的實施例的最小單元為藉由將構成最下層深度的最小寫碼單元分割為4份而獲得的矩形資料單元。或者,最小單元可為可包含於最大寫碼單元中所包含的所有寫碼單元、預測單元、分區單元以及變換單元中的最大矩形資料單元。
舉例而言,經由輸出單元130而輸出的編碼資訊可分類為根據寫碼單元的編碼資訊,以及根據預測單元的編碼資訊。根據寫碼單元的編碼資訊可包含關於預測模式以及關於分區的大小的資訊。根據預測單元的編碼資訊可包含關於畫面間模式的估計方向、關於畫面間模式的參考影像索引、關於運動向量、關於畫面內模式的色度分量以及關於畫面內模式的內插方法的資訊。且,關於根據圖像、片段或GOP而定義的寫碼單元的最大大小的資訊,以及關於最大深度的資訊可插入至位元串流的標頭中。
在視訊編碼裝置100中,較深寫碼單元可為藉由將較上層深度的寫碼單元(其為上一層)的高度或寬度劃分為2份而獲得的寫碼單元。換言之,在當前深度的寫碼單元的大小為2N×2N時,較下層深度的寫碼單元的大小為N×N。且,大小為2N×2N的當前深度的寫碼單元可包含較下層深度的最大4個寫碼單元。
因此,視訊編碼裝置100可藉由基於考慮當前圖像的特性而判定的最大寫碼單元的大小以及最大深度,藉由針對每一最大寫碼單元判定具有最佳形狀以及最佳大小的寫碼單元而形成具有樹狀結構的寫碼單元。且,由於藉由使用各種預測模式以及變換中的任一者對每一最大寫碼單元執行編碼,因此可考慮各種影像大小的寫碼單元的特性來判定最佳編碼模式。
因此,若在習知巨集區塊中對具有高解析度或大資料量的影像做編碼,則每圖像的巨集區塊的數目過度地增大。因此,針對每一巨集區塊產生的壓縮資訊的段數增大,且因此難以傳輸壓縮資訊,且資料壓縮效率降低。然而,藉由使用視訊編碼裝置100,因為在考慮影像的大小的而增大寫碼單元的最大大小的同時考慮影像的特性而調整寫碼單元,所以影像壓縮效率可提高。
圖2為根據本發明的實施例的視訊解碼裝置200的方塊圖。
視訊解碼裝置200包含接收器210、影像資料以及編碼資訊提取器220以及影像資料解碼器230。用於視訊解碼裝置200的各種操作的各種術語(諸如,寫碼單元、深度、預測單元、變換單元以及關於各種編碼模式的資訊)的定義與參看圖1且參考視訊編碼裝置100所述的術語相同。
接收器210接收且剖析經編碼的視訊的位元串流。影像資料以及編碼資訊提取器220自所剖析的位元串流提取每一寫碼單元的經編碼的影像資料,其中寫碼單元具有根據每一最大寫碼單元的樹狀結構,且將所提取的影像資料輸出至影像資料解碼器230。影像資料以及編碼資訊提取器220可自關於當前圖像的標頭提取關於當前圖像的寫碼單元的最大大小的資訊。
且,影像資料以及編碼資訊提取器220自所剖析的位元串流針對具有根據每一最大寫碼單元的樹狀結構的寫碼單元提取關於經寫碼的深度以及編碼模式的資訊。關於經寫碼的深度以及編碼模式的所提取的資訊輸出至影像資料解碼器230。換言之,位元串流中的影像資料分割為最大寫碼單元,使得影像資料解碼器230對每一最大寫碼單元的影像資料做解碼。
可針對關於對應於經寫碼的深度的至少一個寫碼單元的資訊而設定根據最大寫碼單元關於經寫碼的深度以及編碼模式的資訊,且關於編碼模式的資訊可包含關於對應於經寫碼的深度的相應寫碼單元的分區類型、關於預測模式以及變換單元的大小的資訊。且,可將根據深度的分割資訊作為關於經寫碼的深度的資訊來提取。
由影像資料以及編碼資訊提取器220提取的根據每一最大寫碼單元關於經寫碼的深度以及編碼模式的資訊為關於經判定以在諸如視訊編碼裝置100的編碼器根據每一最大寫碼單元對根據深度的每一較深寫碼單元重複地執行編碼時產生最小編碼誤差的經寫碼的深度以及編碼模式的資訊。因此,視訊解碼裝置200可藉由根據產生最小編碼誤差的經寫碼的深度以及編碼模式來對影像資料做解碼而復原影像。
由於關於經寫碼的深度以及編碼模式的編碼資訊可指派給相應寫碼單元、預測單元以及最小單元中的預定資料單元,因此影像資料以及編碼資訊提取器220可提取根據預定資料單元關於經寫碼的深度以及編碼模式的資訊。被指派關於經寫碼的深度以及編碼模式的相同資訊的預定資料單元可推斷為包含於同一最大寫碼單元中的資料單元。
影像資料解碼器230可藉由基於根據最大寫碼單元關於經寫碼的深度以及編碼模式的資訊對每一最大寫碼單元中的影像資料做解碼來復原當前圖像。換言之,影像資料解碼器230可基於關於每一最大寫碼單元中所包含的具有樹狀結構的寫碼單元中的每一寫碼單元的分區類型、預測模式以及變換單元的所提取的資訊而對經編碼的影像資料做解碼。解碼程序可包含:包含畫面內預測以及運動補償的預測;以及逆變換。可根據逆正交變換或逆整數變換的方法而執行逆變換。
影像資料解碼器230可基於根據經寫碼的深度關於每一寫碼單元的預測單元的分區類型以及預測模式的資訊根據所述寫碼單元的分區以及預測模式來執行畫面內預測或運動補償。
且,影像資料解碼器230可基於根據經寫碼的深度關於寫碼單元的變換單元的大小的資訊根據寫碼單元中的每一變換單元來執行逆變換,以便根據最大寫碼單元來執行逆變換。
影像資料解碼器230可藉由使用根據深度的分割資訊而判定當前最大寫碼單元的至少一個經寫碼的深度。若分割資訊指示影像資料在當前深度中不再分割,則當前深度為經寫碼的深度。因此,影像資料解碼器230可藉由使用關於對應於經寫碼的深度的每一寫碼單元的預測單元的分區類型、預測模式以及變換單元的大小的資訊來對對應於當前最大寫碼單元中的每一經寫碼的深度的至少一個寫碼單元的經編碼的資料做解碼,且輸出當前最大寫碼單元的影像資料。
換言之,可藉由觀測針對寫碼單元、預測單元以及最小單元中的預定資料單元而指派的編碼資訊集合來收集含有包含相同分割資訊的編碼資訊的資料單元,且可將所收集的資料單元視為待由影像資料解碼器230在同一編碼模式中解碼的一個資料單元。
視訊解碼裝置200可獲得關於在對每一最大寫碼單元按遞迴方式執行編碼時產生最小編碼誤差的至少一個寫碼單元的資訊,且可使用所述資訊來對當前圖像做解碼。換言之,可對判定為每一最大寫碼單元中的最佳寫碼單元的具有樹狀結構的寫碼單元做解碼。且,考慮影像資料的解析度以及量來判定寫碼單元的最大大小。
因此,即使影像資料具有高解析度以及大量資料,仍可藉由使用自編碼器接收的關於最佳編碼模式的資訊藉由使用根據影像資料的特性而適應性地判定的寫碼單元的大小以及編碼模式來有效地對影像資料做解碼以及復原。
現將參看圖3至圖13來描述根據本發明的實施例的判定具有樹狀結構的寫碼單元、預測單元以及變換單元的方法。
圖3為用於描述根據本發明的實施例的寫碼單元的概念的圖式。
寫碼單元的大小可用寬度×高度來表達,且可包含64×64、32×32、16×16以及8×8。64×64的寫碼單元可分割為64×64、64×32、32×64或32×32的分區,且32×32的寫碼單元可分割為32×32、32×16、16×32或16×16的分區,16×16的寫碼單元可分割為16×16、16×8、8×16或8×8的分區,且8×8的寫碼單元可分割為8×8、8×4、4×8或4×4的分區。
在視訊資料310中,解析度為1920×1080,寫碼單元的最大大小為64,且最大深度為2。在視訊資料320中,解析度為1920×1080,寫碼單元的最大大小為64,且最大深度為3。在視訊資料330中,解析度為352×288,寫碼單元的最大大小為16,且最大深度為1。圖3所示的最大深度表示自最大寫碼單元至最小解碼單元的總分割次數。
若解析度高或資料量大,則寫碼單元的最大大小可為大的,以便不僅提高編碼效率而且準確地反映影像的特性。因此,具有高於視訊資料330的解析度的視訊資料310以及320的寫碼單元的最大大小可為64。
由於視訊資料310的最大深度為2,因此視訊資料310的寫碼單元315可包含長軸大小為64的最大寫碼單元,以及長軸大小為32以及16的寫碼單元,此是因為深度藉由分割最大寫碼單元兩次而加深為兩層。同時,由於視訊資料330的最大深度為1,因此視訊資料330的寫碼單元335可包含長軸大小為16的最大寫碼單元,以及長軸大小為8的寫碼單元,此是因為深度藉由分割最大寫碼單元一次而加深為一層。
由於視訊資料320的最大深度為3,因此視訊資料320的寫碼單元325可包含長軸大小為64的最大寫碼單元,以及長軸大小為32、16以及8的寫碼單元,此是因為深度藉由分割最大寫碼單元三次而加深為三層。隨著深度加深,可精確地表達詳細資訊。
圖4為根據本發明的實施例的基於寫碼單元的影像編碼器400的方塊圖。
影像編碼器400執行視訊編碼裝置100的寫碼單元判定器120的操作以對影像資料做編碼。換言之,畫面內預測器410對當前畫面405中的處於畫面內模式中的寫碼單元執行畫面內預測,且運動估計器420以及運動補償器425藉由使用當前畫面405以及參考畫面495而對當前畫面405中的處於畫面間模式中的寫碼單元執行畫面間估計以及運動補償。
自畫面內預測器410、運動估計器420以及運動補償器425輸出的資料經由變換器430以及量化器440作為經量化的變換係數而輸出。經量化的變換係數經由逆量化器460以及逆變換器470復原為空間域中的資料,且空間域中的所復原的資料在經由解區塊單元480以及迴路濾波單元490後處理之後作為參考畫面495輸出。經量化的變換係數可經由熵編碼器450作為位元串流455輸出。
為了使影像編碼器400應用於視訊編碼裝置100中,影像編碼器400的所有部件(亦即,畫面內預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、逆量化器460、逆變換器470、解區塊單元480以及迴路濾波單元490)在考慮每一最大寫碼單元的最大深度的同時基於具有樹狀結構的寫碼單元中的每一寫碼單元來執行操作。
具體言之,畫面內預測器410、運動估計器420以及運動補償器425在考慮當前最大寫碼單元的最大大小以及最大深度的同時判定具有樹狀結構的寫碼單元中的每一寫碼單元的分區以及預測模式,且變換器430判定具有樹狀結構的寫碼單元中的每一寫碼單元中的變換單元的大小。
圖5為根據本發明的實施例的基於寫碼單元的影像解碼器500的方塊圖。
剖析器510自位元串流505剖析待解碼的經編碼的影像資料以及解碼所需的關於編碼的資訊。經編碼的影像資料經由熵解碼器520以及逆量化器530作為經逆量化的資料而輸出,且經逆量化的資料經由逆變換器540而復原為空間域中的影像資料。
畫面內預測器550關於空間域中的影像資料對處於畫面內模式中的寫碼單元執行畫面內預測,且運動補償器560藉由使用參考畫面585對處於畫面間模式中的寫碼單元執行運動補償。
通過畫面內預測器550以及運動補償器560的空間域中的影像資料可在經由解區塊單元570以及迴路濾波單元580後處理之後作為所復原的畫面輸出。且,經由解區塊單元570以及迴路濾波單元580後處理的影像資料可作為參考畫面585輸出。
為了在視訊解碼裝置200的影像資料解碼器230中對影像資料做解碼,影像解碼器500可執行在執行剖析器510的操作之後執行的操作。
為了使影像解碼器500應用於視訊解碼裝置200中,影像解碼器500的所有部件(亦即,剖析器510、熵解碼器520、逆量化器530、逆變換器540、畫面內預測器550、運動補償器560、解區塊單元570以及迴路濾波單元580)針對每一最大寫碼單元基於具有樹狀結構的寫碼單元來執行操作。
具體言之,畫面內預測器550以及運動補償器560針對具有樹狀結構的寫碼單元中的每一者基於分區以及預測模式而執行操作,且逆變換器540針對每一寫碼單元基於變換單元的大小而執行操作。
圖6為說明根據本發明的實施例的根據深度的較深寫碼單元以及分區的圖式。
視訊編碼裝置100以及視訊解碼裝置200使用階層式寫碼單元以便考慮影像的特性。可根據影像的特性來適應性地判定寫碼單元的最大高度、最大寬度以及最大深度,或可由使用者不同地進行設定。可根據寫碼單元的預定最大大小判定根據深度的較深寫碼單元的大小。
在根據本發明的實施例的寫碼單元的階層式結構600中,寫碼單元的最大高度以及最大寬度各為64,且最大深度為4。由於深度沿著階層式結構600的垂直軸加深,因此將較深寫碼單元的高度以及寬度各自分割。且,沿著階層式結構600的水平軸展示作為用於每一較深寫碼單元的預測編碼的基礎的預測單元以及分區。
換言之,寫碼單元610為階層式結構600中的最大寫碼單元,其中深度為0且大小(亦即,高度乘寬度)為64×64。深度沿著垂直軸而加深,且存在大小為32×32且深度為1的寫碼單元620、大小為16×16且深度為2的寫碼單元630、大小為8×8且深度為3的寫碼單元640,以及大小為4×4且深度為4的寫碼單元650。大小為4×4且深度為4的寫碼單元650為最小寫碼單元。
寫碼單元的預測單元以及分區根據每一深度沿著水平軸而配置。換言之,若大小為64×64且深度為0的寫碼單元610為預測單元,則預測單元可分割為包含於寫碼單元610中的分區,亦即,大小為64×64的分區610、大小為64×32的分區612、大小為32×64的分區614或大小為32×32的分區616。
類似地,大小為32×32且深度為1的寫碼單元620的預測單元可分割為包含於寫碼單元620中的分區,亦即,大小為32×32的分區620、大小為32×16的分區622、大小為16×32的分區624以及大小為16×16的分區626。
類似地,大小為16×16且深度為2的寫碼單元630的預測單元可分割為包含於寫碼單元630中的分區,亦即,包含於寫碼單元中的大小為16×16的分區630、大小為16×8的分區632、大小為8×16的分區634以及大小為8×8的分區636。
類似地,大小為8×8且深度為3的寫碼單元640的預測單元可分割為包含於寫碼單元640中的分區,亦即,包含於寫碼單元中的大小為8×8的分區640、大小為8×4的分區642、大小為4×8的分區644以及大小為4×4的分區646。
大小為4×4且深度為4的寫碼單元650為最小寫碼單元以及最下層深度的寫碼單元。寫碼單元650的預測單元僅指派給大小為4×4的分區。
為了判定構成最大寫碼單元610的寫碼單元的至少一個經寫碼的深度,視訊編碼裝置100的寫碼單元判定器120對包含於最大寫碼單元610中的對應於每一深度的寫碼單元執行編碼。
隨著深度加深,包含相同範圍中的資料以及相同大小的根據深度的較深寫碼單元的數目增大。舉例而言,需要對應於深度2的四個寫碼單元來涵蓋包含於對應於深度1的一個寫碼單元中的資料。因此,為了比較根據深度的相同資料的編碼結果,將對應於深度1的寫碼單元以及對應於深度2的四個寫碼單元各自編碼。
為了針對深度中的當前深度執行編碼,沿著階層式結構600的水平軸,可藉由針對對應於當前深度的寫碼單元中的每一預測單元執行編碼而針對當前深度選擇最小編碼誤差。或者,可藉由比較根據深度的最小編碼誤差以及隨著深度沿著階層式結構600的垂直軸加深而針對每一深度執行編碼來搜尋最小編碼誤差。可選擇寫碼單元610中具有最小編碼誤差的深度以及分區作為寫碼單元610的經寫碼的深度以及分區類型。
圖7為用於描述根據本發明的實施例的寫碼單元710與變換單元720之間的關係的圖式。
視訊編碼裝置100或200針對每一最大寫碼單元根據具有小於或等於最大寫碼單元的大小的寫碼單元來對影像做編碼或解碼。可基於不大於相應寫碼單元的資料單元而選擇在編碼期間用於變換的變換單元的大小。
舉例而言,在視訊編碼裝置100或200中,若寫碼單元710的大小為64×64,則可藉由使用大小為32×32的變換單元720來執行變換。
且,可藉由對大小為小於64×64的32×32、16×16、8×8以及4×4的變換單元中的每一者執行變換而對大小為64×64的寫碼單元710的資料做編碼,且接著可選擇具有最小寫碼誤差的變換單元。
圖8為用於描述根據本發明的實施例的對應於經寫碼的深度的寫碼單元的編碼資訊的圖式。
視訊編碼裝置100的輸出單元130可對關於分區類型的資訊800、關於預測模式的資訊810,以及關於對應於經寫碼的深度的每一寫碼單元的變換單元的大小的資訊820做編碼且作為關於編碼模式的資訊而傳輸。
資訊800指示關於藉由分割當前寫碼單元的預測單元而獲得的分區的形狀的資訊,其中分區為用於當前寫碼單元的預測編碼的資料單元。舉例而言,大小為2N×2N的當前寫碼單元CU_0可分割為大小為2N×2N的分區802、大小為2N×N的分區804、大小為N×2N的分區806以及大小為N×N的分區808中的任一者。此處,關於分區類型的資訊800設定為指示大小為2N×N的分區804、大小為N×2N的分區806以及大小為N×N的分區808中的一者。
資訊810指示每一分區的預測模式。舉例而言,資訊810可指示對由資訊800指示的分區執行的預測編碼的模式,亦即,畫面內模式812、畫面間模式814或跳過模式816。
資訊820指示待基於何時對當前寫碼單元執行變換的變換單元。舉例而言,變換單元可為第一畫面內變換單元822、第二畫面內變換單元824、第一畫面間變換單元826或第二畫面間變換單元828。
根據每一較深寫碼單元,視訊解碼裝置200的影像資料以及編碼資訊提取器220可提取且使用資訊800、810以及820以用於解碼。
圖9為根據本發明的實施例的根據深度的較深寫碼單元的圖式。
分割資訊可用以指示深度的改變。分割資訊指示當前深度的寫碼單元是否分割為較下層深度的寫碼單元。
用於深度為0且大小為2N_0×2N_0的寫碼單元900的預測編碼的預測單元910可包含大小為2N_0×2N_0的分區類型912、大小為2N_0×N_0的分區類型914、大小為N_0×2N_0的分區類型916以及大小為N_0×N_0的分區類型918的分區。圖9僅說明藉由對稱地分割預測單元910而獲得的分區類型912至918,但分區類型不限於此,且預測單元910的分區可包含非對稱分區、具有預定形狀的分區以及具有幾何形狀的分區。
根據每一分區類型,對大小為2N_0×2N_0的一個分區、大小為2N_0×N_0的兩個分區、大小為N_0×2N_0的兩個分區以及大小為N_0×N_0的四個分區重複地執行預測編碼。可對大小為2N_0×2N_0、N_0×2N_0、2N_0×N_0以及N_0×N_0的分區執行在畫面內模式以及畫面間模式中的預測編碼。僅對大小為2N_0×2N_0的分區執行在跳過模式中的預測編碼。
若編碼誤差在大小為2N_0×2N_0、2N_0×N_0以及N_0×2N_0的分區類型912至916中的一者中最小,則預測單元910可能不分割為較下層深度。
若編碼誤差在大小為N_0×N_0的分區類型918中最小,則深度自0改變為1以在操作920中分割分區類型918,且對深度為2且大小為N_0×N_0的寫碼單元930重複地執行編碼以搜尋最小編碼誤差。
用於深度為1且大小為2N_1×2N_1(=N_0×N_0)的寫碼單元930的預測編碼的預測單元940可包含大小為2N_1×2N_1的分區類型942、大小為2N_1×N_1的分區類型944、大小為N_1×2N_1的分區類型946以及大小為N_1×N_1的分區類型948的分區。
若編碼誤差在大小為N_1×N_1的分區類型948中最小,則深度自1改變為2以在操作950中分割分區類型948,且對深度為2且大小為N_2×N_2的寫碼單元960重複地執行編碼以搜尋最小編碼誤差。
當最大深度為d時,可執行根據每一深度的分割操作直至深度變為d-1時,且可對分割資訊做編碼直至深度為0至d-2中的一者時。換言之,當執行編碼直至在對應於深度d-2的寫碼單元在操作970中分割之後深度為d-1時,用於深度為d-1且大小為2N_(d-1)×2N_(d-1)的寫碼單元980的預測編碼的預測單元990可包含大小為2N_(d-1)×2N_(d-1)的分區類型992、大小為2N_(d-1)×N_(d-1)的分區類型994、大小為N_(d-1)×2N_(d-1)的分區類型996以及大小為N_(d-1)×N_(d-1)的分區類型998的分區。
可對分區類型992至998中的大小為2N_(d-1)×2N_(d-1)的一個分區、大小為2N_(d-1)×N_(d-1)的兩個分區、大小為N_(d-1)×2N_(d-1)的兩個分區、大小為N_(d-1)×N_(d-1)的四個分區重複地執行預測編碼以搜尋具有最小編碼誤差的分區類型。
即使當大小為N_(d-1)×N_(d-1)的分區類型998具有最小編碼誤差時,由於最大深度為d,因此深度為d-1的寫碼單元CU_(d-1)不再分割為較下層深度,且將構成當前最大寫碼單元900的寫碼單元的經寫碼的深度判定為d-1,且可將當前最大寫碼單元900的分區類型判定為N_(d-1)×N_(d-1)。且,由於最大深度為d且具有最下層深度d-1的最小寫碼單元980不再分割為較下層深度,因此不設定用於最小寫碼單元980的分割資訊。
資料單元999可為當前最大寫碼單元的「最小單元」。根據本發明的實施例的最小單元可為藉由將最小寫碼單元980分割為4份而獲得的矩形資料單元。藉由重複地執行編碼,視訊編碼裝置100可藉由根據寫碼單元900的深度比較編碼誤差而選擇具有最小編碼誤差的深度以判定經寫碼的深度,且將相應分區類型以及預測模式設定為經寫碼的深度的編碼模式。
因而,在所有深度1至d中比較根據深度的最小編碼誤差,且可將具有最小編碼誤差的深度判定為經寫碼的深度。可對經寫碼的深度、預測單元的分區類型以及預測模式做編碼且作為關於編碼模式的資訊而傳輸。且,由於寫碼單元自深度0分割為經寫碼的深度,因此僅經寫碼的深度的分割資訊設定為0,且排除經寫碼的深度的深度的分割資訊設定為1。
視訊解碼裝置200的影像資料以及編碼資訊提取器220可提取且使用關於寫碼單元900的經寫碼的深度以及預測單元的資訊以對分區912做解碼。視訊解碼裝置200可藉由使用根據深度的分割資訊而將分割資訊為0的深度判定為經寫碼的深度,且使用關於相應深度的編碼模式的資訊以用於解碼。
圖10至圖12為用於描述根據本發明的實施例的寫碼單元1010、預測單元1060與變換單元1070之間的關係的圖式。
寫碼單元1010為在最大寫碼單元中對應於由視訊編碼裝置100判定的經寫碼的深度的具有樹狀結構的寫碼單元。預測單元1060為寫碼單元1010中的每一者的預測單元的分區,且變換單元1070為寫碼單元1010中的每一者的變換單元。
當最大寫碼單元的深度在寫碼單元1010中為0時,寫碼單元1012以及1054的深度為1,寫碼單元1014、1016、1018、1028、1050以及1052的深度為2,寫碼單元1020、1022、1024、1026、1030、1032以及1048的深度為3,且寫碼單元1040、1042、1044以及1046的深度為4。
在預測單元1060中,藉由分割寫碼單元而獲得一些寫碼單元1014、1016、1022、1032、1048、1050、1052以及1054。換言之,寫碼單元1014、1022、1050以及1054中的分區類型的大小為2N×N,寫碼單元1016、1048以及1052中的分區類型的大小為N×2N,且寫碼單元1032的分區類型的大小為N×N。寫碼單元1010的預測單元以及分區小於或等於每一寫碼單元。
對小於寫碼單元1052的資料單元中的變換單元1070中的寫碼單元1052的影像資料執行變換或逆變換。且,變換單元1070中的寫碼單元1014、1016、1022、1032、1048、1050以及1052的大小以及形狀不同於預測單元1060中的寫碼單元。換言之,視訊編碼裝置100以及視訊解碼裝置200可對同一寫碼單元中的資料單元個別地執行畫面內預測、運動估計、運動補償、變換以及逆變換。
因此,對在最大寫碼單元的每一區域中具有階層式結構的寫碼單元中的每一者以遞迴方式執行編碼以判定最佳寫碼單元,且因此可獲得具有遞迴樹狀結構的寫碼單元。編碼資訊可包含關於寫碼單元的分割資訊、關於分區類型的資訊、關於預測模式的資訊,以及關於變換單元的大小的資訊。表1展示可由視訊編碼裝置100以及視訊解碼裝置200設定的編碼資訊。
表1
視訊編碼裝置100的輸出單元130可輸出關於具有樹狀結構的寫碼單元的編碼資訊,且視訊解碼裝置200的影像資料以及編碼資訊提取器220可自所接收的位元串流提取關於具有樹狀結構的寫碼單元的編碼資訊。
分割資訊指示當前寫碼單元是否分割為較下層深度的寫碼單元。若當前深度d的分割資訊為0,則當前寫碼單元不再分割為較下層深度的深度為經寫碼的深度,且因此可針對經寫碼的深度而定義關於分區類型、預測模式以及變換單元的大小的資訊。若根據分割資訊進一步分割當前寫碼單元,則對較下層深度的四個分割寫碼單元獨立地執行編碼。
預測模式可為畫面內模式、畫面間模式以及跳過模式中的一者。可在所有分區類型中定義畫面內模式以及畫面間模式,且僅在大小為2N×2N的分區類型中定義跳過模式。
關於分區類型的資訊可指示:大小為2N×2N、2N×N、N×2N以及N×N的對稱分區類型,其是藉由對稱地分割預測單元的高度或寬度而獲得;以及大小為2N×nU、2N×nD、nL×2N以及nR×2N的非對稱分區類型,其是藉由非對稱地分割預測單元的高度或寬度而獲得。可藉由以1:3以及3:1分割預測單元的高度而分別獲得大小為2N×nU以及2N×nD的非對稱分區類型,且可藉由以1:3以及3:1分割預測單元的寬度而分別獲得大小為nL×2N以及nR×2N的非對稱分區類型。
變換單元的大小可在畫面內模式中設定為兩種類型且在畫面間模式中設定為兩種類型。換言之,若變換單元的分割資訊為0,則變換單元的大小可為2N×2N,此為當前寫碼單元的大小。若變換單元的分割資訊為1,則可藉由分割當前寫碼單元而獲得變換單元。且,若大小為2N×2N的當前寫碼單元的分區類型為對稱分區類型,則變換單元的大小可為N×N,且若當前寫碼單元的分區類型為非對稱分區類型,則變換單元的大小可為N/2×N/2。
關於具有樹狀結構的寫碼單元的編碼資訊可包含對應於經寫碼的深度的寫碼單元、預測單元以及最小單元中的至少一者。對應於經寫碼的深度的寫碼單元可包含含有相同編碼資訊的預測單元以及最小單元中的至少一者。
因此,藉由比較鄰近資料單元的編碼資訊而判定鄰近資料單元是否包含於對應於經寫碼的深度的同一寫碼單元中。且,藉由使用資料單元的編碼資訊而判定對應於經寫碼的深度的相應寫碼單元,且因此可判定最大寫碼單元中的經寫碼的深度的分佈。
因此,若基於鄰近資料單元的編碼資訊而預測當前寫碼單元,則可直接參考且使用鄰近於當前寫碼單元的較深寫碼單元中的資料單元的編碼資訊。
或者,若基於鄰近資料單元的編碼資訊而預測當前寫碼單元,則使用資料單元的經編碼的資訊而搜尋鄰近於當前寫碼單元的資料單元,且可參考所搜尋的鄰近寫碼單元以用於預測當前寫碼單元。
圖13為用於描述根據表1的編碼模式資訊的寫碼單元、預測單元或分區與變換單元之間的關係的圖式。
最大寫碼單元1300包含經寫碼的深度的寫碼單元1302、1304、1306、1312、1314、1316以及1318。此處,由於寫碼單元1318為經寫碼的深度的寫碼單元,因此分割資訊可設定為0。關於大小為2N×2N的寫碼單元1318的分區類型的資訊可設定為大小為2N×2N的分區類型1322、大小為2N×N的分區類型1324、大小為N×2N的分區類型1326、大小為N×N的分區類型1328、大小為2N×nU的分區類型1332、大小為2N×nD的分區類型1334、大小為nL×2N的分區類型1336以及大小為nR×2N的分區類型1338中的一者。
當分區類型設定為對稱(亦即,分區類型1322、1324、1326或1328)時,若變換單元的分割資訊(TU大小旗標)為0,則設定大小為2N×2N的變換單元1342,且若TU大小旗標為1,則設定大小為N×N的變換單元1344。
當分區類型設定為非對稱(亦即,分區類型1332、1334、1336或1338)時,若TU大小旗標為0,則設定大小為2N×2N的變換單元1352,且若TU大小旗標為1,則設定大小為N/2×N/2的變換單元1354。
將詳細解釋由圖4的影像編碼器400的運動補償器425以及圖5的影像解碼器500的畫面內預測器550執行的運動補償程序。
圖14為說明根據本發明的實施例的運動估計裝置1400的圖式。圖14的運動估計裝置1400對應於圖4的影像編碼器400的運動估計器420。
內插單元1410藉由內插參考畫面以及產生子像素位置的像素值而產生經內插的參考畫面。運動估計執行單元1420藉由使用經內插的參考畫面而以子像素精度執行運動估計,且判定並輸出指示最類似於預測單元的參考畫面的相應區域的運動向量。圖4的運動補償器425藉由獲得由運動向量指示的參考畫面的經內插的子像素或整數像素而獲得預測單元的像素的預測值。雖然內插單元1410包含於圖14的運動估計裝置1400中,但本實施例不限於此,且內插單元1410可與運動估計裝置1400分離。
圖15為說明根據本發明的實施例的可在1/4像素精度的運動補償程序中選擇的子像素以及整數像素的位置的圖式。
參看圖15,標以大寫字母的A 1501、B 1502、C 1503以及D 1504指示整數像素,且標以小寫字母的a 1505至o 1519指示整數像素之間的子像素。在運動向量指示整數像素A 1501、B 1502、C 1503以及D 1504中的任一者時,亦即,在運動向量的水平分量與垂直分量兩者具有整數值時,可在運動補償程序期間,藉由直接讀出儲存於記憶體中的參考畫面的資料而獲得預測單元的預測值。因此,在運動向量的水平分量以及垂直分量具有整數值時,不需要內插程序。舉例而言,在當前預測單元為L×M(L以及M為整數)且在對當前預測單元L×M執行運動估計後獲得的運動向量MV的水平分量MVx以及垂直分量MVy具有整數值時,運動補償器425可藉由獲得對應於一位置的相應區域的L×M個整數像素,而獲得當前預測單元L×M的預測值,所述位置是藉由將當前預測單元L×M自儲存於記憶體中的參考畫面以運動向量(MVx, MVy)移位而獲得。
在運動向量指示a 1505至o 1519中的任一子像素而非整數像素時,需要內插程序以便獲得相應子像素。可藉由將具有預定濾波器分接頭數目的內插濾波器應用於參考畫面的整數像素而執行子像素的內插程序。在安置於彼此水平鄰近的整數像素A 1501與B 1502之間的子像素a 1505、b 1506以及c 1507中,僅水平分量具有分數值,而垂直分量具有整數值。因此,為了對子像素a 1505、b 1506以及c 1507進行內插,執行水平一維(1D)內插程序。同樣,在安置於彼此垂直鄰近的整數像素A 1501與C 1503之間的子像素d 1508、h 1512以及l 1516中,僅垂直分量具有分數值,而水平分量具有整數值。因此,為了對子像素d 1508、h 1512以及l 1516進行內插,執行垂直1D內插程序。
在除子像素a 1505、b 1506、c 1507、d 1508、h 1512以及l 1516的外的子像素e 1509、f 1510、g 1511、i 1513、j 1514、k 1515、m 1517、n 1518以及o 1519中,因為水平分量與垂直分量兩者具有分數值,所以執行水平與垂直二維(2D)內插程序。
因此,本文中所使用的1D內插程序意指在運動補償程序期間僅在水平方向以及垂直方向中的一個方向上執行內插的程序,此是因為運動向量的水平分量以及垂直分量中的任一者具有分數值而非整數值。本文中所使用的2D內插程序意指在水平方向以及垂直方向上執行內插的程序,此是因為運動向量的水平分量以及垂直分量兩者具有分數值而非整數值。
圖16為用於解釋根據本發明的實施例的對參考畫面進行內插的程序的圖式。在圖16中,大寫字母A至Z表示整數像素,且小寫字母a至z表示1/2或1/4子像素。
內插單元1410將具有預定濾波器分接頭數目的內插濾波器應用於整數像素,以便產生運動估計以及運動補償所需的子像素。舉例而言,參看圖16,內插單元1410可藉由在水平或垂直方向上將N(N為整數)分接頭內插濾波器應用於整數像素信號A至Z而產生子像素。可使用8分接頭內插濾波器以便對明度分量進行內插,且可使用4分接頭內插濾波器以便對色度分量進行內插。濾波器分接頭數目N不限於此,且可進行改變。
將參看圖16更詳細地解釋對子像素進行內插的程序。
為了對與整數像素位於同一列或行上的子像素a、b、c、d、h以及n進行內插,可藉由以下方式而產生子像素a、b、c、d、h以及n:在水平方向以及垂直方向中的任一方向上根據濾波器分接頭數目而讀出N個整數像素;以及如上所述而將內插濾波器應用於所讀取的N個整數像素。舉例而言,可藉由使用方程式b = (G*p1+H*p2+I*p3+J*p4+K*p5+L*p6+M*p7+N*p8)而將具有分接頭係數{p1, p2, p3, p4, p5, p6, p7, p8}的8分接頭內插濾波器應用於水平鄰近於子像素b 1610的8個整數像素G、H、I、J、K、L、M以及N,來產生1/2子像素b 1610。同樣,可藉由使用方程式h=(A*p1+C*p2+E*p3+J*p4+R*p5+W*p6+Y*p7+AA*p8)而將具有分接頭係數{p1, p2, p3, p4, p5, p6, p7, p8}的8分接頭內插濾波器應用於垂直鄰近於子像素h 1620的8個整數像素A、C、E、J、R、W、Y、AA,來產生1/2子像素h 1620。如上所述,可改變分接頭數目以及分接頭係數。
可藉由使用經由上文內插程序而產生的1/2子像素b 1610以及1/2子像素h 1620與整數像素之間的平均值,來產生與整數像素位於同一列或行上的1/4子像素a、c、d以及n。舉例而言,可藉由使用方程式a=(J+b)/2而產生1/4子像素a 1640。因而,為了對與整數像素位於同一列或行上的1/2子像素b或h或1/4子像素a、c、d以及n進行內插,需要讀出N(N為濾波器分接頭數目)個相鄰整數像素的程序。
接著,將解釋對並不與整數像素位於同一列或行上的子像素e、f、g、i、j、k、p、q以及r進行內插的程序。
可藉由在水平方向以及垂直方向中的任意方向上應用內插濾波器而產生1/2子像素j 1630。舉例而言,可藉由將8分接頭內插濾波器應用於水平鄰近的相鄰1/2子像素nn、mm、ll、h、hh、ii、jj以及kk而產生1/2子像素j 1630,或可藉由將8分接頭內插濾波器應用於垂直鄰近的相鄰1/2子像素aa、bb、cc、b、dd、ee、ff以及gg而產生1/2子像素j 1630。此處,可按類似於用於獲得1/2子像素h 1620的方式的方式產生水平鄰近的1/2子像素nn、mm、ll、h、hh、ii、jj以及kk,且可按類似於用於獲得1/2子像素b 1610的方式的方式產生垂直鄰近的1/2子像素aa、bb、cc、b、dd、ee、ff以及gg。
可藉由使用與相鄰的鄰近整數像素或1/2子像素的平均值濾波器而產生並不與整數像素位於同一列或行上的1/4子像素e、f、g、i、j、k、p、q以及r。舉例而言,可藉由使用1/2子像素b 1610與1/2子像素j 1630之間的平均值而獲得1/4子像素f 1650,且可藉由使用諸如方程式r=(hh+dd)/2的對角線平均值濾波器而產生1/4子像素r 1660。
圖17A至圖17C為說明根據本發明的實施例的運動補償程序所需的參考畫面的資料的圖式。
參看圖17A,在由運動估計器420經由運動估計而判定大小為L×M(L及M為整數)的當前預測單元1711的運動向量MV1時,運動補償器425藉由在來自記憶體的參考畫面1720中讀出由運動向量MV1指示的相應區域而產生當前預測單元1711的預測值。假設:運動向量MV1的水平分量為MVx1,且運動向量MV1的垂直分量為MVy1,水平分量MVx1具有整數值,且垂直分量MVy1具有分數值。在此狀況下,為了讀出相應區域1721,需要產生垂直鄰近的整數像素之間的子像素。若假設在垂直方向上應用的內插濾波器的分接頭數目為NL,則因為每像素的垂直內插所需的垂直整數像素的數目為NL,且相應區域1721的一行包含L個像素,所以為了讀出相應區域1721,可需要讀出包含內插所需的垂直整數像素的(L+NL-1)*M個整數像素。
同樣,參看圖17B,在由運動估計器420經由運動估計而判定當前預測單元1711的運動向量MV2時,運動補償器425藉由在來自記憶體的參考畫面1720中讀出由運動向量MV2指示的相應區域1721而產生當前預測單元1711的預測值。假設:運動向量MV2的水平分量為MVx2,且運動向量MV2的垂直分量為Mvy2,水平分量MVx2具有分數值,且垂直分量Mvy2具有整數值。在此狀況下,為了讀出相應區域1721,可需要產生水平鄰近的整數像素之間的子像素。若假設在水平方向上應用的內插濾波器的分接頭數目為NM,則因為每像素的水平內插所需的水平整數像素的數目為NM,且相應區域1721的一列包含M個像素,所以為了讀出相應區域1721,可需要讀出包含內插所需的水平整數像素的L*(M+NM-1)個整數像素。
參看圖17C,在由運動估計器420經由運動估計而判定當前預測單元1711的運動向量MV3時,運動補償器425藉由在來自記憶體的參考畫面1720中讀出由運動向量MV3指示的相應區域1721而產生當前預測單元1711的預測值。假設:運動向量MV3的水平分量為MVx3,運動向量MV3的垂直分量為Mvy3,且水平分量MVx3與垂直分量Mvy3兩者具有分數值。在此狀況下,為了讀出相應區域1721,可需要藉由在水平方向以及垂直方向上執行內插而產生整數像素之間的子像素。如上所述,在假設在垂直方向上應用的內插濾波器的分接頭數目為NL且在水平方向上應用的內插濾波器的分接頭數目為NM時,為了讀出相應區域1721,可需要讀出包含內插所需的水平整數像素以及垂直整數像素的(L+NL-1)*(M+NM-1)個整數像素。
因而,根據當前預測單元的運動向量的水平分量以及垂直分量而判定為了對子像素進行內插而讀出的參考畫面的整數像素的數目。
自記憶體存取的觀點而言,可藉由使用方程式Num=(當前預測單元的運動補償所需的參考畫面的像素的數目)/(當前預測單元中所包含的像素的總數)而獲得在運動補償期間當前預測單元的每像素所需的參考畫面的整數像素的數目Num。如上所述,假設:在垂直方向上應用的內插濾波器的分接頭數目為NL,在水平方向上應用的內插濾波器的分接頭數目為NM,當前預測單元的運動向量的水平分量為MVx,且當前預測單元的運動向量的垂直分量為MVy。在僅運動向量的水平分量MVx具有分數值而非整數值時,因為大小為L×M的當前預測單元的運動補償所需的參考畫面的像素的數目為(L+NL-1)*M,所以在運動補償期間當前預測單元的每像素所需的參考畫面的整數像素的數目Num為Num=(L+NL-1)*M/(L*M)。
同樣,在僅運動向量的垂直分量MVy具有分數值而非整數值時,因為大小為L×M的當前預測單元的運動補償所需的參考畫面的像素的數目為L*(M+NM-1),所以在運動補償期間當前預測單元的每像素所需的參考畫面的整數像素的數目Num為Num=L*(M+NM-1)/(L*M)。
在運動向量的水平分量MVx以及垂直分量MVy具有分數值而非整數值時,因為大小為L×M的當前預測單元的運動補償所需的參考畫面的像素的數目為(L+NL-1)*(M+NM-1),所以在運動補償期間當前預測單元的每像素所需的參考畫面的整數像素的數目Num為Num=(L+NL-1)*(M+NM-1)/(L*M)。
因而,在運動補償期間當前預測單元的每像素的參考畫面的整數像素的數目Num對應於在單向預測的狀況下的數目。在雙向預測的狀況下,因為使用了兩個參考畫面,所以所需的整數像素的數目為2*Num。
如下所述,根據當前預測單元的大小以及應用於當前預測單元的單向運動估計模式以及雙向運動估計模式而對當前預測單元的每一個像素的運動補償所需的參考畫面的像素的數目Num進行分類,且藉由以下方式而限制對儲存參考畫面的預定記憶體元件的存取:在當前預測單元的每一個像素的運動補償所需的參考畫面的像素的數目等於或小於預定臨限值時,將單向運動估計模式與雙向運動估計模式兩者應用於當前預測單元;以及在當前預測單元的每一個像素的運動補償所需的參考畫面的像素的數目大於預定臨限值時,僅將單向運動估計模式應用於當前預測單元。亦即,在運動補償期間,在每一個像素所需的參考畫面的像素的數目過大時,藉由限制運動補償程序而限制用於在運動補償程序中讀出參考畫面資料的記憶體存取。
圖18A至圖18G為說明根據預測單元的大小、預測模式,以及預測單元的運動向量的水平分量以及垂直分量是否具有整數值的當前預測單元的每一個像素的運動補償所需的參考畫面的像素的數目的表格。在圖18A至圖18G中,I指示運動向量的水平分量與垂直分量兩者具有整數值的狀況,1D指示運動向量的水平分量以及垂直分量中的任一者具有分數值而非整數值的狀況,且2D指示運動向量的水平分量與垂直分量兩者具有分數值而非整數值的狀況。且,在包含參考第一參考像素清單的L0預測以及參考第二參考圖像清單的L1預測的雙向預測的狀況下,I-I指示用於L0預測以及L1預測的兩個運動向量中的每一者的水平分量與垂直分量兩者具有整數值的狀況,1D-1D指示用於L0預測以及L1預測的兩個運動向量的一個水平分量或一個垂直分量具有分數值而非整數值的狀況,且2D-2D指示用於L0預測以及L1預測的兩個運動向量的水平分量以及垂直分量具有分數值而非整數值的狀況。且,I-1D指示用於L0預測以及L1預測的兩個運動向量中的一個運動向量的水平分量與垂直分量兩者具有整數值且剩餘一個運動向量的水平分量以及垂直分量中的任一者具有分數值而非整數值的狀況。且,I-2D指示用於L0預測以及L1預測的兩個運動向量中的一個運動向量的水平分量與垂直分量兩者具有整數值且剩餘一個運動向量的水平分量與垂直分量兩者具有分數值而非整數值的狀況。且,1D-2D指示用於L0預測以及L1預測的兩個運動向量中的一個運動向量的水平分量以及垂直分量中的任一者具有分數值而非整數值且剩餘一個運動向量的水平分量與垂直分量兩者具有分數值而非整數值的狀況。
在圖18A至圖18G中,具有相同分接頭數目N的內插濾波器用作水平方向以及垂直方向上的內插濾波器,且分接頭數目N具有在8至2的範圍內的值。
參看圖18A,在使用8分接頭內插濾波器時,大小為4×8的預測單元的運動向量的水平分量以及垂直分量中的任一者具有分數值而非整數值,且對大小為4×8的預測單元執行單向運動估計,因為大小為4×8的預測單元的運動補償所需的整數像素的總數為(4+8-1)*8,所以藉由將(4+8-1)*8除以大小為4×8的預測單元中所包含的32個像素而獲得2.75((4+8-1)*8/(4x8)=2.75)。經由此計算,如圖18A所示,在預測單元(區塊)的大小為4×8時,運動向量的水平分量以及垂直分量中僅一者具有分數值而非整數值(在狀況1D下),且執行單向預測模式,可獲得每一個像素所需的參考畫面的整數像素的數目2.75。類似地,可藉由使用以下方程式中的任一者而獲得圖18A至圖18G的表格:Num=(L+NL-1)*M/(L*M)、Num=L*(M+NM-1)/(L*M)以及Num=(L+NL-1)*(M+NM-1)/(L*M),所述方程式根據運動向量的水平分量以及垂直分量具有整數值還是分數值而計算運動補償期間當前預測單元的每一個像素所需的參考畫面的整數像素的數目。
分析圖18A的圖18G的表格,發現運動補償期間當前預測單元的每一個像素所需的參考畫面的整數像素的數目隨著預測單元的大小增大而減小。舉例而言,參看圖18A,在雙向預測模式(雙向),發現在運動向量的水平分量以及垂直分量具有分數值而非整數值(在2D-2D的狀況下)且預測單元的大小自2×2增大至64×64時,每一個像素所需的參考畫面的整數像素的數目自40.50減小至2.46。因此,在對具有過小大小的預測單元執行運動估計以及運動補償時,因為每一個像素所需的參考畫面的整數像素的數目增大,所以,自記憶體存取的觀點而言,此為低效的。因此,用於讀出參考畫面資料的記憶體存取可藉由以下方式而限於預定頻寬:藉由在預測單元的大小大於預定大小時使用單向運動估計模式與雙向運動估計模式兩者以及藉由在預測單元的大小等於或小於預定大小時僅使用單向運動估計模式而限制在預測單元的大小等於或小於預定臨限值時使用的運動估計模式。
圖19至圖20為自高值開始以降序說明根據明度分量的預測單元的大小、色度分量的預測單元的大小、預測模式,以及預測單元的運動向量的水平分量以及垂直分量是否具有整數值的當前預測單元的每一個像素的運動補償所需的參考畫面的像素的數目的表格。在圖19中,假設:8分接頭內插濾波器用作明度分量的內插濾波器,4分接頭內插濾波器用作色度分量的內插濾波器,明度分量的最小預測單元的大小為4×8,且色度分量的最小預測單元的大小為2×4。與圖19相比,在圖20中,明度分量的最小預測單元的大小為4×4,且色度分量的最小預測單元的大小為2×2。
參看圖19,因為自記憶體存取的觀點而言,表中的上方位置較低效,所以運動估計器420以及運動補償器425可藉由在上方位置的狀況下限制或改變運動估計模式而限制運動補償程序中的記憶體存取。舉例而言,運動估計器420以及運動補償器425可在明度分量的預測單元的大小為4×8或8×4(其為最小預測單元)時,僅執行包含L0預測以及L1預測的單向運動估計模式,且可僅在明度分量的預測單元的大小大於4×8或8×4(其為最小預測單元)時,執行除單向運動估計模式的外的雙向運動估計模式。同樣,運動估計器420以及運動補償器425可在色度分量的預測單元的大小為2×4或4×2(其為最小預測單元)時,僅執行包含L0預測以及L1預測的單向運動估計模式,且可僅在色度分量的預測單元的大小大於2×4或4×2(其為最小預測單元)時,執行除單向運動估計模式的外的雙向運動估計模式。
同樣,參看圖20,運動估計器420以及運動補償器425可藉由在上方位置的狀況下限制或改變運動估計模式而限制運動補償程序中的記憶體存取。
如上所述,自記憶體存取的觀點而言,運動估計器420以及運動補償器425在當前預測單元的每一個像素的運動補償所需的參考畫面的像素的數目等於或大於預定臨限值時,限制運動估計模式。亦即,運動估計器420以及運動補償器425判定在當前預測單元的大小大於預定大小時使用單向運動估計模式與雙向運動估計模式兩者,且判定在當前預測單元的大小等於或小於預定大小時僅使用單向運動估計模式。運動估計器420以及運動補償器425可判定在當前預測單元的大小過小時不使用運動估計模式。舉例而言,運動估計器420以及運動補償器425可針對明度分量的預測單元將最小預測單元的大小設定為4×8或8×4,且可在明度分量的當前預測單元小於4×8或8×4時,並不執行運動估計。且,運動估計器420以及運動補償器425可針對色度分量的預測單元將最小預測單元的大小設定為2×4或4×2,且可在色度分量的當前預測單元小於2×4或4×2時,並不執行運動估計。運動估計器420以及運動補償器425可即使在大小等於或大於最小預測單元的大小時仍對待執行的運動估計模式進行分類,且可判定在最低效當前預測單元的大小為最小預測單元的大小時,僅使用單向運動估計模式,且判定僅在當前預測單元的大小並非最小預測單元的大小時,亦即,在當前預測單元的大小大於最小預測單元的大小時,使用單向運動估計模式與雙向運動估計模式兩者。
因而,運動估計器420以及運動補償器425基於當前預測單元的大小而判定是否使用應用於當前預測單元的運動估計以及運動補償的單向運動估計模式以及雙向運動估計模式,且根據是否使用單向運動估計模式以及雙向運動估計模式,藉由使用單向運動估計模式以及雙向運動估計模式中的至少一個運動估計模式而對當前預測單元執行運動估計以及運動補償。圖4未圖示的控制器基於經由運動估計以及運動補償而獲得的當前預測單元的編碼成本(例如,RD成本)而判定待應用於當前預測單元的最佳運動估計模式。熵編碼器460基於當前預測單元的大小而對所判定的運動估計模式資訊做編碼。
舉例而言,熵編碼器460根據表2基於當前預測單元的大小而判定指示當前預測單元的最終運動估計模式的語法inter_pred_idc,且對語法inter_pred_idc做編碼。
表2
參看表2,熵編碼器460基於當前預測單元的大小而對指示當前預測單元的最終運動估計模式的inter_pred_idc做熵編碼。詳言的,在當前預測單元的大小大於4×8或8×4(其為作為明度分量的預測單元的最小預測單元)時,可使用單向預測(L0預測以及L1預測)與雙向預測兩者。在L1預測被判定為當前預測單元的最終運動估計模式時,熵編碼器460將1作為inter_pred_idc來熵編碼。解碼器側處的熵解碼器520可基於inter_pred_idc以及自位元串流獲得的當前預測單元的大小資訊根據表2而判定用於當前預測單元的運動估計模式。或者,在當前預測單元為4×8或8×4(其為作為明度分量的預測單元的最小預測單元)的最小預測單元時,可僅使用單向預測(L0預測以及L1預測)。在L1預測被判定為當前預測單元的最終運動估計模式時,熵編碼器460將1作為inter_pred_idc來熵編碼。
自記憶體存取的觀點而言,藉由基於預測單元的大小而限制是否使用單向運動估計模式以及雙向運動估計模式,來執行運動補償。或者,可減小用於運動估計的內插濾波器的分接頭數目。舉例而言,可使用用於對明度分量進行內插的4分接頭內插濾波器代替8分接頭內插濾波器,且可使用用於對色度分量進行內插的2分接頭內插濾波器代替4分接頭內插濾波器。
或者,可藉由將2D內插程序替換為1D內插程序而減少讀出參考畫面資料的程序。
圖21至圖23為根據本發明的另一實施例的用於解釋用於減少讀出參考畫面資料的程序的內插程序的參考圖。
參看圖21至圖23,因為可能無法僅藉由使用1D內插濾波器來獲得並不與整數像素位於同一列或行上的子像素e、f、g、i、j、k、m、n以及o,且經由2D內插程序而獲得此等子像素,所以增加了記憶體存取。因此,根據本發明的另一實施例,可藉由使用經由1D內插濾波器而獲得的相鄰子像素或整數像素,而在不對子像素e、f、g、i、j、k、m、n以及o執行2D內插程序的情況下,獲得子像素e、f、g、i、j、k、m、n以及o的值。
參看圖21至圖23,運動估計器420以及運動補償器425可使用由箭頭標記的相鄰子像素或整數像素,以便產生子像素e、f、g、i、j、k、m、n以及o的值。
圖24以及圖25為根據本發明的另一實施例自高值開始以降序說明在藉由使用可藉由使用1D內插濾波器而非2D內插程序而獲得的相鄰子像素或整數像素或減小內插濾波器的分接頭數目而執行內插時,根據明度分量的預測單元的大小、色度分量的預測單元的大小、運動估計模式,以及預測單元的運動向量的水平分量以及垂直分量是否具有整數值的當前預測單元的每一個像素的運動補償所需的參考畫面的像素的數目的表格。圖24說明明度分量的最小預測單元的大小為4×8且色度分量的最小預測單元的大小為2×4的狀況。圖25說明明度分量的最小預測單元的大小為4×4且色度分量的最小預測單元的大小為2×2的狀況。且,在圖24及圖25中,A指示減小內插濾波器的分接頭數目的狀況,且B指示藉由使用可藉由使用1D內插濾波器而非2D內插程序而獲得的相鄰子像素或整數像素來執行內插的狀況。
參看圖24及圖25,發現,在藉由使用可藉由使用1D內插濾波器而非2D內插程序而獲得的相鄰子像素或整數像素或藉由減小內插濾波器的分接頭數目而執行內插時,當前預測單元的每一個像素的運動補償所需的參考畫面的像素的數目可小於原始狀況所需的參考畫面的像素的數目。
圖26為說明根據本發明的實施例的視訊編碼方法的流程圖。
參看圖26,在操作2610中,運動估計器420以及運動補償器425基於待編碼的當前預測單元的大小而判定是否使用應用於當前預測單元的運動估計以及運動補償的單向運動估計模式以及雙向運動估計模式。如上所述,自記憶體存取的觀點而言,運動估計器420以及運動補償器425在當前預測單元的每一個像素的運動補償所需的參考畫面的像素的數目等於或大於預定臨限值時,限制運動估計模式。亦即,運動估計器420以及運動補償器425可判定在當前預測單元的大小大於預定大小時使用單向運動估計模式與雙向運動估計模式兩者,且可判定在當前預測單元的大小等於或小於預定大小時僅使用單向運動估計模式。
在操作2620中,運動估計器420以及運動補償器425根據是否使用單向運動估計模式以及雙向運動估計模式,藉由應用單向運動估計模式以及雙向運動估計模式中的至少一個運動估計模式而對當前預測單元執行運動估計以及運動補償。
在操作2630中,控制器基於經由運動估計以及運動補償而獲得的當前預測單元的編碼成本來判定當前預測單元的運動估計模式。在操作2640中,熵編碼器460基於當前預測單元的大小而對所判定的運動估計模式資訊做熵編碼。如上所述,熵編碼器460基於表2而判定指示當前預測單元的最終運動估計模式的語法inter_pred_idc,且對語法inter_pred_idc做熵編碼。
圖27為說明根據本發明的實施例的運動補償裝置2700的方塊圖。圖27的運動補償裝置2700對應於圖5的影像解碼器500的運動補償器560。
參看圖5及圖27,熵解碼器520獲得指示應用於當前預測單元的運動估計模式的運動估計模式資訊以及待自位元串流解碼的當前預測單元的大小資訊。
如參看圖1至圖13所述,可獲得指示藉由分割來自位元串流的構成視訊的畫面而獲得的最大寫碼單元的大小的資訊、指示在空間上分割最大寫碼單元的次數的深度,以及具有階層式結構的變換單元與用於根據深度而階層式分類的寫碼單元的預測編碼的預測單元的結構,且針對基於所獲得的資訊以最大大小的寫碼單元分割畫面而獲得的每一至少一個最大寫碼單元,自根據指示在空間上分割最大寫碼單元的次數的深度根據深度而階層式分類的寫碼單元,可判定包含經寫碼的深度的寫碼單元的具有樹狀結構的寫碼單元,可判定用於經寫碼的深度的每一寫碼單元的預測編碼的預測單元,且可判定具有樹狀結構的變換單元。
且,作為運動估計模式資訊,可使用指示基於當前預測單元的大小而應用於當前預測單元的運動估計模式的語法inter_pred_idc。
運動補償執行單元2720基於當前預測單元的大小以及所獲得的運動估計模式資訊(亦即,語法inter_pred_idc),藉由使用表2而自單向運動估計模式以及雙向運動估計模式判定應用於當前預測單元的運動估計模式。
返回參看表2,在當前預測單元的大小大於4×8或8×4(其為作為明度分量的預測單元的最小預測單元)且自位元串流提取的語法inter_pred_idc的值為1時,運動補償執行單元2720將當前預測單元的運動估計模式判定為單向L1預測。或者,在當前預測單元為4×8或8×4(其為作為明度分量的預測單元的最小預測單元)的最小預測單元時,運動補償執行單元2720在自位元串流提取的語法inter_pred_idc的值為1時,將當前預測單元的最終運動估計模式判定為L1預測,且在語法inter_pred_idc的值為2時,判定運動估計模式不應用於當前預測單元。
圖28為說明根據本發明的實施例的視訊解碼方法的流程圖。
參看圖28,在操作2810中,熵解碼器520獲得指示應用於當前預測單元的運動估計模式的運動估計模式資訊以及待自位元串流解碼的當前預測單元的大小資訊。
在操作2820中,運動補償器560基於當前預測單元的大小以及所獲得的運動估計模式資訊而自單向運動估計模式以及雙向運動估計模式判定應用於當前預測單元的運動估計模式。如上所述,運動補償器560可基於預測單元的大小以及根據表2而判定的語法inter_pred_idc而判定待用於當前預測單元的運動估計模式。
在操作2830中,運動補償器560根據所判定的運動估計模式而執行運動補償,所述運動補償藉由讀出參考畫面的資料而獲得當前預測單元的預測值。
因為用於執行參看圖1至圖28所述的視訊編碼方法以及視訊解碼方法的每一實施例的程式儲存於電腦可讀記錄媒體中,所以獨立電腦系統可容易根據儲存於電腦可讀記錄媒體中的每一實施例而執行操作。
將詳細描述儲存程式的電腦可讀記錄媒體為光碟260的實施例。
圖29A說明根據本發明的實施例的儲存程式的光碟260的實體結構。光碟260(其為儲存媒體)可為硬碟機(hard drive)、緊密光碟-唯讀記憶體(compact disc-read only memory;CD-ROM)光碟、藍光光碟(Blu-ray disc)或數位多功能光碟(digital versatile disc;DVD)。光碟260包含多個同心磁軌Tr,其各自劃分為在光碟260的圓周方向上的具體數目的磁區Se。在光碟260的具體區域中,可指派並儲存執行如上所述的預測多視角視訊的方法、預測復原多視角視訊的方法、對多視角視訊做編碼的方法以及對多視角視訊做解碼的方法的程式。
現將參看圖29B描述電腦系統,所述電腦系統是使用儲存媒體來體現的,所述儲存媒體儲存用於執行如上所述的視訊編碼方法以及視訊解碼方法的程式。
圖29B說明藉由使用光碟260而記錄以及讀取程式的光碟機263。電腦系統265可經由光碟機263在光碟260中儲存程式,所述程式執行根據本發明的實施例的視訊編碼方法以及視訊解碼方法中的至少一者。為了在電腦系統265中執行儲存於光碟260中的程式,可藉由使用光碟機263而自光碟260讀取程式,並將其傳輸至電腦系統265。
執行根據本發明的實施例的視訊編碼方法以及視訊解碼方法中的至少一者的程式可不僅儲存於圖29A或圖29B所說明的光碟260中,而且儲存於記憶卡、ROM卡匣(ROM cassette)或固態磁碟(solid state drive;SSD)中。
下文將描述應用了上述視訊編碼方法以及視訊解碼方法的系統。
圖30說明提供內容散佈服務的內容供應系統1100的整體結構。通信系統的服務區域劃分為預定大小的小區,且無線基地台1170、1180、1190以及1200分別安裝於此等小區中。
內容供應系統1100包含多個獨立元件。舉例而言,諸如電腦1210、個人數位助理(personal digital assistant;PDA)1220、視訊攝影機1230以及行動電話1250的所述多個獨立元件經由網際網路服務提供商1120、通信網路1140以及無線基地台1170、1180、1190以及1200而連接至網際網路1110。
然而,內容供應系統1100不限於圖30所說明的內容供應系統,且多個元件可選擇性連接至所述內容供應系統。多個獨立元件可直接連接至通信網路1140,而不是經由無線基地台1170、1180、1190以及1200來連接。
視訊攝影機1230為能夠攝取視訊影像的成像元件,例如,數位視訊攝影機。行動電話1250可使用各種協定中的至少一種通信方法,例如,個人數位通信(Personal Digital Communications;PDC)、分碼多重存取(code division multiple access;CDMA)、寬頻分碼多重存取(wideband-code division multiple access;W-CDMA)、全球行動通信系統(Global System for Mobile Communications;GSM)以及個人手持電話系統(Personal Handyphone System;PHS)。
視訊攝影機1230可經由無線基地台1190以及通信網路1140而連接至串流伺服器1130。串流伺服器1130允許經由視訊攝影機1230自使用者接收的內容經由即時廣播(real-time broadcast)而串流傳輸。可使用視訊攝影機1230或串流伺服器1130來對自視訊攝影機1230接收的內容做編碼。可將由視訊攝影機1230攝取的視訊資料經由電腦1210傳輸至串流伺服器1130。
亦可將由相機1260攝取的視訊資料經由電腦1210傳輸至串流伺服器1130。相機1260為類似於數位相機能夠攝取靜態影像與視訊影像兩者的成像元件。可使用相機1260或電腦1210來對由相機1260攝取的視訊資料做編碼。對視訊做編碼以及解碼的軟體可儲存於可由電腦1210存取的電腦可讀記錄媒體中,電腦可讀記錄媒體例如為CD-ROM光碟、軟碟(floppy disc)、硬碟機、SSD或記憶卡。
若視訊資料是由內建於行動電話1250中的相機攝取,則可自行動電話1250接收視訊資料。
視訊資料亦可由安裝於視訊攝影機1230、行動電話1250或相機1260中的大型積體電路(large scale integrated circuit;LSI)系統編碼。
根據本發明的實施例,內容供應系統1100可對由使用者使用視訊攝影機1230、相機1260、行動電話1250或另一成像元件記錄的內容資料(例如,在音樂會期間記錄的內容)做編碼,且將經編碼的內容資料傳輸至串流伺服器1130。串流伺服器1130可將經編碼的內容資料串流傳輸至請求內容資料的其他用戶端。
用戶端為能夠對經編碼的內容資料做解碼的元件,例如,電腦1210、PDA 1220、視訊攝影機1230或行動電話1250。因此,內容供應系統1100允許用戶端接收並再生經編碼的內容資料。且,內容供應系統1100允許用戶端接收經編碼的內容資料並即時地對經編碼的內容資料做解碼以及再生,藉此實現個人廣播。
內容供應系統1100中所包含的多個獨立元件的編碼以及解碼操作可類似於根據本發明的實施例的視訊編碼裝置以及視訊解碼裝置的編碼以及解碼操作。
現將參看圖31及圖32更詳細地描述根據本發明的實施例的內容供應系統1100中所包含的行動電話1250。
圖31說明根據本發明的實施例的應用了視訊編碼方法以及視訊解碼方法的行動電話1250的外部結構。行動電話1250可為智慧型電話,其功能不受限制,且其大部分功能可被改變或擴展。
行動電話1250包含內部天線1251,可經由內部天線1251而與圖26的無線基地台1200交換射頻(radio-frequency;RF)信號,且行動電話1250包含用於顯示由相機1253攝取的影像或經由天線1251而接收並被解碼的影像的顯示螢幕1252,例如,液晶顯示器(liquid crystal display;LCD)或有機發光二極體(organic light-emitting diode;OLED)螢幕。智慧型電話1250包含操作面板1254,其包含控制按鈕以及觸控面板。若顯示螢幕1252為觸控螢幕,則操作面板1254更包含顯示螢幕1252的觸摸感測面板。智慧型電話1250包含用於輸出語音以及聲音的揚聲器或另一類型的聲音輸出單元,以及用於輸入語音以及聲音的麥克風1255或另一類型的聲音輸入單元。智慧型電話1250更包含相機1253(諸如,電荷耦合元件(charge-coupled device;CCD)相機)以攝取視訊以及靜態影像。智慧型電話1250可更包含:儲存媒體1257,其用於儲存經編碼/經解碼的資料,例如,由相機1253攝取、經由電子郵件而接收或根據另一方法而獲得的視訊或靜態影像;以及插槽1256,儲存媒體1257經由插槽1256而裝載至行動電話1250中。儲存媒體1257可為快閃記憶體,例如,安全數位(secure digital;SD)卡或包含於塑膠外殼中的電可抹除可程式化唯讀記憶體(electrically erasable and programmable read only memory;EEPROM)。
圖32說明根據本發明的實施例的行動電話1250的內部結構。為了系統地控制包含顯示螢幕1252以及操作面板1254的行動電話1250的多個部分,電力供應電路1270、操作輸入控制器1264、影像編碼器1272、相機介面1263、LCD控制器1262、影像解碼器1269、多工器/解多工器1268、記錄/讀取單元1267、調變/解調變單元1266以及聲音處理器1265經由同步匯流排1273而連接至中央控制器1271。
若使用者操作電源按鈕且自「電源關閉」狀態改變至「電源開啟」狀態,則電力供應電路1270將電力自電池組(battery pack)供應至行動電話1250的所有部分,藉此將行動電話1250設定於操作模式。
中央控制器1271包含中央處理單元(central processing unit;CPU)、ROM以及隨機存取記憶體(random access memory;RAM)。
雖然行動電話1250將通信資料傳輸至外部,但數位資料在中央控制器的控制下產生於行動電話1250中。舉例而言,聲音處理器1265可產生數位聲音信號,影像編碼器1272可產生數位影像信號,且訊息的文字資料可經由操作面板1254以及操作輸入控制器1264而產生。在數位信號在中央控制器1271的控制下遞送至調變/解調變單元1266,調變/解調變單元1266對數位信號的頻帶執行調變,且通信電路1261對經頻帶調變的數位信號執行數位至類比轉換(DAC)以及頻率轉換。自通信電路1261輸出的傳輸信號可經由天線1251而傳輸至語音通信基地台或無線基地台1200。
舉例而言,在行動電話1250處於交談模式時,經由麥克風1255而獲得的聲音信號在中央控制器1271的控制下由聲音處理器1265變換為數位聲音信號。數位聲音信號可經由調變/解調變單元1266以及通信電路1261而變換為變換信號,且可經由天線1251而傳輸。
當在資料通信模式中傳輸文字訊息(例如,電子郵件)時,文字訊息的文字資料經由操作面板1254而輸入,且經由操作輸入控制器1264而傳輸至中央控制器1261。在中央控制器1261的控制下,文字資料經由調變/解調變單元1266以及通信電路1261變換為傳輸信號,且經由天線1251而傳輸至無線基地台1200。
為了在資料通信模式中傳輸影像資料,由相機1253攝取的影像資料經由相機介面1263而提供至影像編碼器1272。所攝取的影像資料可經由相機介面1263以及LCD控制器1262直接顯示在顯示螢幕1252上。
影像編碼器1272的結構可對應於上述影像編碼裝置100的結構。影像編碼器1272可根據由上述視訊編碼裝置100或影像編碼器400使用的視訊編碼方法而將自相機1253接收的影像資料變換為經壓縮編碼的影像資料,且接著將經編碼的影像資料輸出至多工器/解多工器1268。在相機1253的記錄操作期間,由行動電話1250的麥克風1255獲得的聲音信號可經由聲音處理器1265而變換為數位聲音資料,且所述數位聲音資料可遞送至多工器/解多工器1268。
多工器/解多工器1268將自影像編碼器1272接收的經編碼的影像資料以及自聲音處理器1265接收的聲音資料一起多工。對資料進行多工的結果可經由調變/解調變單元1266以及通信電路1261而變換為變換信號,且可接著經由天線1251而傳輸。
雖然行動電話1250自外部接收通信信號,但對經由天線1251而接收的信號執行頻率恢復以及ADC,以將信號變換為數位信號。調變/解調變單元1266調變數位信號的頻帶。經頻帶調變的數位信號根據數位信號的類型而傳輸至視訊解碼器1269、聲音處理器1265或LCD控制器1262。
在交談模式中,行動電話1250放大經由天線1251而接收的信號,且藉由對經放大的信號執行頻率轉換以及ADC而獲得數位聲音信號。在中央控制器1271的控制下,所接收的數位聲音信號經由調變/解調變單元1266以及聲音處理器1265而變換為類比聲音信號,且所述類比聲音信號經由揚聲器1258而輸出。
在處於資料通信模式時,接收經由網際網路網站而存取的視訊檔案的資料,且將經由天線1251而自無線基地台1200接收的信號經由調變/解調變單元1266作為經多工的資料而輸出,且將經多工的資料傳輸至多工器/解多工器1268。
為了對經由天線1251而接收的經多工的資料做解碼,多工器/解多工器1268將經多工的資料解多工為經編碼的視訊資料串流以及經編碼的音訊資料串流。經由同步匯流排1273而分別將經編碼的視訊資料串流以及經編碼的音訊資料串流提供至視訊解碼器1269以及聲音處理器1265。
影像解碼器1269的結構可對應於上述影像解碼裝置200的結構。根據由上述視訊解碼裝置200或影像解碼器500使用的視訊解碼方法,影像解碼器1269可對經編碼的視訊資料做解碼以獲得所復原的視訊資料且經由LCD控制器1262而將所復原的視訊資料提供至顯示螢幕1252。
因此,經由網際網路網站而存取的視訊檔案的資料可顯示於顯示螢幕1252上。同時,聲音處理器1265可將音訊資料變換為類比聲音信號,且將類比聲音信號提供至揚聲器1258。因此,經由網際網路網站而存取的視訊檔案中所含有的音訊資料亦可經由揚聲器1258而再生。
行動電話1250或另一類型的通信終端機可為包含根據本發明的實施例的視訊編碼裝置與視訊解碼裝置兩者的收發終端機,可為僅包含視訊編碼裝置的收發終端機,或可為僅包含視訊解碼裝置收發終端機。
根據本發明的通信系統不限於上文參看圖30所描述的通信系統。舉例而言,圖33說明根據本發明的實施例的使用通信系統的數位廣播系統。圖32的數位廣播系統可藉由使用根據本發明的實施例的視訊編碼裝置以及視訊解碼裝置而接收經由衛星或地面網絡傳輸的數位廣播。
具體言之,廣播站1289藉由使用電波而將視訊資料串流傳輸至通信衛星或廣播衛星1290。廣播衛星1290傳輸廣播信號,且廣播信號經由家用天線1286而傳輸至衛星廣播接收器。在每個家庭中,經編碼的視訊串流可由TV接收器1281、機上盒(set-top box)1287或另一元件解碼並再生。
在根據本發明的實施例的視訊解碼裝置包含於再生裝置1283中時,再生裝置1283可對記錄於儲存媒體1282(諸如,光碟或記憶卡)上的經編碼的視訊串流進行剖析以及解碼以復原原始視訊信號。因此,所復原的視訊信號可再生於(例如)監視器1284上。
在衛星/地面廣播的天線1286或連接至用於接收有線電視(TV)節目的電纜天線1285的機上盒1287中,可安裝有根據本發明的實施例的視訊解碼裝置。自機上盒1287輸出的資料亦可再生於TV監視器1288上。
作為另一實例,根據本發明的實施例的視訊解碼裝置可安裝於TV接收器1281而非機上盒1287中。
包含合適天線1291的汽車1292可接收自衛星1290或圖26的無線基地台1170傳輸的信號。經解碼的視訊可再生於內建於汽車1292中的汽車導航系統1293的顯示螢幕上。
視訊信號可由根據本發明的實施例的視訊編碼裝置編碼且可接著儲存於儲存媒體中。具體言之,影像信號可由DVD記錄器儲存於DVD光碟1296中或可由硬碟記錄器1295儲存於硬碟中。作為另一實例,視訊信號可儲存於SD卡1297中。若硬碟記錄器1295包含根據本發明的實施例的視訊解碼裝置,則DVD光碟1296、SD卡1297或另一儲存媒體上所記錄的視訊信號可再生於TV監視器1288上。
汽車導航系統1293可能不包含圖32的相機1253、相機介面1263以及影像編碼器1272。舉例而言,電腦1210以及TV接收器1281可能不包含於圖32的相機1253、相機介面1263以及影像編碼器1272中。
圖34說明根據本發明的實施例的使用視訊編碼裝置以及視訊解碼裝置的雲端計算系統的網路結構。
雲端計算系統可包含雲端計算伺服器1400、使用者資料庫(DB)1410、多個計算資源1420以及使用者終端機。
雲端計算系統回應於來自使用者終端機的請求而經由資訊通信網絡(例如,網際網路)提供多個計算資源1420的應需委外服務(on-demand outsourcing service)。在雲端計算環境下,服務提供商藉由使用虛擬化技術來組合位於實體上不同位置處的資料中心的計算資源而向使用者提供所要服務。服務使用者並不需要將計算資源(例如,應用程式、儲存設施、作業系統(OS)或安全特徵)安裝於其自身的終端機上以便進行使用,而是可在所要時間點自經由虛擬化技術而產生的虛擬空間中的服務選擇所要服務並進行使用。
指定服務使用者的使用者終端機經由資訊通信網路(包含網際網路以及行動電信網路)而連接至雲端計算伺服器1410。可自雲端計算伺服器1410對使用者終端機提供雲端計算服務且特定言的動態圖像再生服務。使用者終端機可為能夠連接至網際網路的各種類型的電子元件,例如,桌上型PC 1430、智慧型TV 1440、智慧型電話1450、筆記型電腦1460、攜帶型多媒體播放器(PMP)1470、平板型PC 1480及其類似者。
雲端計算伺服器1410可組合雲端網路中所分散的多個計算資源1420且向使用者終端機提供所述組合的結果。多個計算資源1420可包含各種資料服務,且可包含自使用者終端機上傳的資料。如上所述,雲端計算伺服器1410可藉由根據虛擬化技術來組合不同區域中所分散的運動圖像資料庫而向使用者終端機提供所要服務。
關於已預訂雲端計算服務的使用者的使用者資訊儲存於使用者DB 1410中。使用者資訊可包含使用者的登錄資訊、地址、姓名以及個人信用資訊。使用者資訊可更包含運動圖像的索引。此處,索引可包含已再生的運動圖像的清單、正再生的運動圖像的清單、再生的運動圖像的暫停點(pausing point)以及其類似者。
關於儲存於使用者DB 1410中的運動圖像的資訊可在使用者元件之間共用。舉例而言,在運動圖像服務回應於來自筆記型電腦1460的請求而提供至筆記型電腦1460時,運動圖像服務的再生歷史儲存於使用者DB 1410中。在自智慧型電話1450接收到對再生此運動圖像服務的請求時,雲端計算伺服器1410基於使用者DB 1410而搜尋並再生此運動圖像服務。在智慧型電話1450自雲端計算伺服器1410接收運動圖像資料串流時,藉由對運動圖像資料串流做解碼而再生視訊的程序類似於上文參看圖28所描述的行動電話1250的操作。
雲端計算伺服器1410可參考儲存於使用者DB 1410中的所要運動圖像服務的再生歷史。舉例而言,雲端計算伺服器1410自使用者終端機接收對再生儲存於使用者DB 1410中的運動圖像的請求。若正再生此運動圖像,則由雲端計算伺服器1410執行的串流傳輸此運動圖像的方法可根據來自使用者終端機的請求(亦即,根據將始於運動圖像的開始還是其暫停點而再生運動圖像)而變化。舉例而言,若使用者終端機請求始於運動圖像的開始而再生運動圖像,則雲端計算伺服器1410始於運動圖像的第一畫面而將運動圖像串流傳輸至使用者終端機。舉例而言,若使用者終端機請求始於運動圖像的暫停點而再生運動圖像,則雲端計算伺服器1410始於對應於暫停點的畫面而將運動圖像串流傳輸至使用者終端機。
在此狀況下,使用者終端機可包含如上文參看圖1至圖28而描述的視訊解碼裝置。作為另一實例,使用者終端機可包含如上文參看圖1至圖28而描述的視訊編碼裝置。或者,使用者終端機可包含如上文參看圖1至圖28而描述的視訊解碼裝置與視訊編碼裝置兩者。
上文已參看圖29A至圖30而描述上文參看圖1至圖28所描述的根據本發明的實施例的視訊編碼方法、視訊解碼方法、視訊編碼裝置以及視訊解碼裝置的各種應用。然而,根據本發明的各種實施例的將視訊編碼方法以及視訊解碼方法儲存於儲存媒體中的方法或將視訊編碼裝置以及視訊解碼裝置包含在元件中的方法不限於上文參看圖29A至圖34而描述的實施例。
一般熟習此項技術者應理解,本揭露中所揭露的方塊圖作為用於實現本發明的原理的電路的概念圖。類似地,對於一般熟習此項技術者而言將顯而易見的是,任意流程圖(flow chart、flow diagram)、狀態轉變圖、偽碼以及其類似者表示可實質上儲存於電腦可讀記錄媒體中且可由電腦或處理器執行的各種程序,而不管電腦或處理器是否被明確說明。因此,上文所述的本發明的實施例可體現為電腦程式。電腦程序可儲存於電腦可讀記錄媒體中,且使用通用數位電腦而執行。電腦可讀媒體的實例為磁性記錄媒體(例如,ROM、軟碟、硬碟等)以及光學記錄媒體(例如,CD-ROM、DVD等)。
圖中所說明的各種部件的功能可有關合適軟體,且不僅經由能夠執行軟體的硬體而且能夠經由專屬硬體來提供。此等功能亦可經由單個專屬處理器、單個共用處理器或多個個別處理器(其中的一些可被共用)來提供。且,術語「處理器」或「控制器」的明確使用不限於專指使用能夠執行軟體的硬體,而是可隱含包含諸如數位信號處理器(digital signal processor;DSP)以及用於儲存軟體的唯讀記憶體(read-only memory;ROM)、隨機存取記憶體(random access memory;RAM)或非揮發性儲存媒體的硬體。
在本說明書的申請專利範圍中,作為用於執行具體操作的部件建議的部件包含執行所述具體操作的任何任意方法。此部件的實例可包含能夠執行所述具體操作的電路部件的組合、或與執行用於執行所述具體操作的軟體的合適電路組合的具有任意形式(例如,韌體或微碼)的軟體。
在本揭露中,表達「本發明的原理的實施例」以及此表達的各種修改意謂有關此實施例的具體特徵、結構以及特性包含於本發明的原理的至少一個實施例中。因此,本揭露中所揭露的表達「實施例」及其任意其他修改並非始終指示同一實施例。
在本揭露中,表達「A以及B中的至少一者」的「……中的至少一者」用以包含式意謂僅選擇第一選項(A)、僅選擇第二選項(B)或選擇第一選項與第二選項兩者(A以及B)。此外,表達「A、B以及C中的至少一者」用以包含式意謂僅選擇第一選項(A)、僅選擇第二選項(B)、僅選擇第三選項(C)、僅選擇第一選項以及第二選項(A以及B)、僅選擇第二選項以及第三選項(B以及C)、僅選擇第一選項以及第三選項(A以及C)或選擇全部三個選項(A、B以及C)。在結合此表達而列出三個以上項目時,其含義對於一般熟習此項技術者而言將是顯而易見的。
已在上文描述本發明的例示性實施例。
儘管已參考本發明的例示性實施例特定地展示且描述了本發明,但一般熟習此項技術者將理解,在不脫離如由所附申請專利範圍界定的本發明的精神以及範疇的情況下,可對本發明進行形式以及細節上的各種改變。例示性實施例應僅在描述性意義上考慮且並非用於限制目的。因此,本發明的範疇並非由本發明的詳細描述界定而是由所附申請專利範圍界定,且在此範疇內的所有差異將解釋為包含於本發明中。
100‧‧‧視訊編碼裝置
110‧‧‧最大寫碼單元分割器
120‧‧‧寫碼單元判定器
130‧‧‧輸出單元
200‧‧‧視訊解碼裝置
210‧‧‧接收器
220‧‧‧影像資料以及編碼資訊提取器
230‧‧‧影像資料解碼器
260‧‧‧光碟
310‧‧‧視訊資料
315‧‧‧寫碼單元
320‧‧‧視訊資料
325‧‧‧寫碼單元
330‧‧‧視訊資料
335‧‧‧寫碼單元
400‧‧‧影像編碼器
405‧‧‧當前畫面
410‧‧‧畫面內預測器
420‧‧‧運動估計器
425‧‧‧運動補償器
430‧‧‧變換器
440‧‧‧量化器
450‧‧‧熵編碼器
455‧‧‧位元串流
460‧‧‧逆量化器
470‧‧‧逆變換器
480‧‧‧解區塊單元
490‧‧‧回路濾波單元
495‧‧‧參考畫面
500‧‧‧影像解碼器
505‧‧‧位元串流
510‧‧‧剖析器
520‧‧‧熵解碼器
530‧‧‧逆量化器
540‧‧‧逆變換器
550‧‧‧畫面內預測器
560‧‧‧運動補償器
570‧‧‧解區塊單元
580‧‧‧回路濾波單元
585‧‧‧參考畫面
600‧‧‧階層式結構
610‧‧‧寫碼單元/分區/最大寫碼單元
612‧‧‧分區
614‧‧‧分區
616‧‧‧分區
620‧‧‧寫碼單元/分區
622‧‧‧分區
624‧‧‧分區
626‧‧‧分區
630‧‧‧寫碼單元/分區
632‧‧‧分區
634‧‧‧分區
636‧‧‧分區
640‧‧‧寫碼單元/分區
642‧‧‧分區
644‧‧‧分區
646‧‧‧分區
650‧‧‧寫碼單元
710‧‧‧寫碼單元
720‧‧‧變換單元
800‧‧‧資訊
802‧‧‧分區
804‧‧‧分區
806‧‧‧分區
808‧‧‧分區
810‧‧‧資訊
812‧‧‧畫面內模式
814‧‧‧畫面間模式
816‧‧‧跳過模式
820‧‧‧資訊
822‧‧‧第一畫面內變換單元
824‧‧‧第二畫面內變換單元
826‧‧‧第一畫面間變換單元
828‧‧‧第二畫面間變換單元
900‧‧‧寫碼單元/當前最大寫碼單元
910‧‧‧預測單元
912‧‧‧分區類型/寫碼單元(分區)
914‧‧‧分區類型
916‧‧‧分區類型
918‧‧‧分區類型
920‧‧‧操作
930‧‧‧寫碼單元
940‧‧‧預測單元
942‧‧‧分區類型
944‧‧‧分區類型
946‧‧‧分區類型
948‧‧‧分區類型
950‧‧‧操作
960‧‧‧寫碼單元
970‧‧‧操作
980‧‧‧寫碼單元
990‧‧‧預測單元
992‧‧‧分區類型
994‧‧‧分區類型
996‧‧‧分區類型
998‧‧‧分區類型
999‧‧‧資料單元
1010‧‧‧寫碼單元
1012‧‧‧寫碼單元
1014‧‧‧寫碼單元(分區)
1016‧‧‧寫碼單元(分區)
1018‧‧‧寫碼單元
1020‧‧‧寫碼單元
1022‧‧‧寫碼單元(分區)
1024‧‧‧寫碼單元
1026‧‧‧寫碼單元
1028‧‧‧寫碼單元
1030‧‧‧寫碼單元
1032‧‧‧寫碼單元(分區)
1040‧‧‧寫碼單元
1042‧‧‧寫碼單元
1044‧‧‧寫碼單元
1046‧‧‧寫碼單元
1048‧‧‧寫碼單元(分區)
1050‧‧‧寫碼單元(分區)
1052‧‧‧寫碼單元(分區)
1054‧‧‧寫碼單元(分區)
1060‧‧‧預測單元
1070‧‧‧變換單元
1100‧‧‧內容供應系統
1110‧‧‧網際網路
1120‧‧‧網際網路服務提供商
1130‧‧‧串流伺服器
1140‧‧‧通信網路
1170‧‧‧無線基地台
1180‧‧‧無線基地台
1190‧‧‧無線基地台
1200‧‧‧無線基地台
1210‧‧‧電腦
1220‧‧‧個人數位助理
1230‧‧‧視訊攝影機
1250‧‧‧行動電話
1251‧‧‧內部天線
1252‧‧‧顯示螢幕
1253‧‧‧相機
1254‧‧‧操作面板
1255‧‧‧麥克風
1256‧‧‧插槽
1257‧‧‧儲存媒體
1258‧‧‧揚聲器
1260‧‧‧相機
1261‧‧‧通信電路
1262‧‧‧LCD控制器
1263‧‧‧相機介面
1264‧‧‧操作輸入控制器
1265‧‧‧聲音處理器
1266‧‧‧調變/解調變單元
1267‧‧‧記錄/讀取單元
1268‧‧‧多工器/解多工器
1269‧‧‧影像解碼器
1270‧‧‧電力供應電路
1271‧‧‧中央控制器
1272‧‧‧影像編碼器
1273‧‧‧同步匯流排
1281‧‧‧TV接收器
1282‧‧‧儲存媒體
1283‧‧‧再生裝置
1284‧‧‧監視器
1285‧‧‧電纜天線
1286‧‧‧天線
1287‧‧‧機上盒
1288‧‧‧TV監視器
1289‧‧‧廣播站
1290‧‧‧廣播衛星
1291‧‧‧天線
1292‧‧‧汽車
1293‧‧‧汽車導航系統
1295‧‧‧硬碟記錄器
1296‧‧‧DVD光碟
1297‧‧‧SD卡
1300‧‧‧最大寫碼單元
1302‧‧‧寫碼單元
1304‧‧‧寫碼單元
1306‧‧‧寫碼單元
1312‧‧‧寫碼單元
1314‧‧‧寫碼單元
1316‧‧‧寫碼單元
1318‧‧‧寫碼單元
1322‧‧‧分區類型
1324‧‧‧分區類型
1326‧‧‧分區類型
1328‧‧‧分區類型
1332‧‧‧分區類型
1334‧‧‧分區類型
1336‧‧‧分區類型
1338‧‧‧分區類型
1342‧‧‧變換單元
1344‧‧‧變換單元
1352‧‧‧變換單元
1354‧‧‧變換單元
1400‧‧‧運動估計裝置/雲端計算伺服器
1410‧‧‧內插單元/使用者資料庫
1420‧‧‧運動估計執行單元/計算資源
1430‧‧‧桌上型PC
1440‧‧‧智慧型TV
1450‧‧‧智慧型電話
1460‧‧‧筆記型電腦
1470‧‧‧攜帶型多媒體播放器
1480‧‧‧平板型PC
1501‧‧‧整數像素A
1502‧‧‧整數像素B
1503‧‧‧整數像素C
1504‧‧‧整數像素D
1505‧‧‧子像素a
1506‧‧‧子像素b
1507‧‧‧子像素c
1508‧‧‧子像素d
1509‧‧‧子像素e
1510‧‧‧子像素f
1511‧‧‧子像素g
1512‧‧‧子像素h
1513‧‧‧子像素i
1514‧‧‧子像素j
1515‧‧‧子像素k
1516‧‧‧子像素l
1517‧‧‧子像素m
1518‧‧‧子像素n
1519‧‧‧子像素o
1610‧‧‧子像素b
1620‧‧‧子像素h
1630‧‧‧子像素j
1640‧‧‧像素a
1650‧‧‧像素f
1660‧‧‧子像素r
1711‧‧‧當前預測單元
1720‧‧‧參考畫面
1721‧‧‧相應區域
2610~2640‧‧‧本發明的實施例的視訊編碼方法的流程各操作
2700‧‧‧運動補償裝置
2720‧‧‧運動補償執行單元
a‧‧‧子像素
aa‧‧‧子像素
A‧‧‧整數像素
AA‧‧‧整數像素
b‧‧‧子像素
bb‧‧‧子像素
B‧‧‧整數像素
BB‧‧‧整數像素
c‧‧‧子像素
cc‧‧‧子像素
C‧‧‧整數像素
CU‧‧‧寫碼單元
CU_0‧‧‧當前寫碼單元
CU_1‧‧‧寫碼單元
CU_(d-1)‧‧‧寫碼單元
d‧‧‧子像素
dd‧‧‧子像素
D‧‧‧整數像素
e‧‧‧子像素
ee‧‧‧子像素
E‧‧‧整數像素
f‧‧‧子像素
ff‧‧‧子像素
F‧‧‧整數像素
g‧‧‧子像素
gg‧‧‧子像素
G‧‧‧整數像素
h‧‧‧子像素
hh‧‧‧子像素
H‧‧‧整數像素
i‧‧‧子像素
ii‧‧‧子像素
I‧‧‧整數像素
j‧‧‧子像素
jj‧‧‧子像素
J‧‧‧整數像素
k‧‧‧子像素
kk‧‧‧子像素
K‧‧‧整數像素
l‧‧‧子像素
ll‧‧‧子像素
L‧‧‧整數像素
m‧‧‧子像素
mm‧‧‧子像素
M‧‧‧整數像素
MV1‧‧‧運動向量
MV2‧‧‧運動向量
MV3‧‧‧運動向量
n‧‧‧子像素
nn‧‧‧子像素
N‧‧‧整數像素
o‧‧‧子像素
O‧‧‧整數像素
p‧‧‧子像素
P‧‧‧整數像素
PU‧‧‧預測單元
q‧‧‧子像素
Q‧‧‧整數像素
r‧‧‧子像素
R‧‧‧整數像素
S‧‧‧整數像素
Se‧‧‧磁區
T‧‧‧整數像素
Tf‧‧‧磁軌
TU‧‧‧變換單元
U‧‧‧整數像素
V‧‧‧整數像素
W‧‧‧整數像素
X‧‧‧整數像素
Y‧‧‧整數像素
Z‧‧‧整數像素
藉由參看附圖詳細描述本發明的例示性實施例,本發明的以上以及其他特徵以及優點將變得更顯而易見。 圖1為根據本發明的實施例的用於對視訊做編碼的裝置的方塊圖。 圖2為根據本發明的實施例的用於對視訊做解碼的裝置的方塊圖。 圖3為用於描述根據本發明的實施例的寫碼單元的概念的圖式。 圖4為根據本發明的實施例的基於寫碼單元的影像編碼器的方塊圖。 圖5為根據本發明的實施例的基於寫碼單元的影像解碼器的方塊圖。 圖6為說明根據本發明的實施例的根據深度的較深寫碼單元以及分區的圖式。 圖7為用於描述根據本發明的實施例的寫碼單元與變換單元之間的關係的圖式。 圖8為用於描述根據本發明的實施例的對應於經寫碼的深度的寫碼單元的編碼資訊的圖式。 圖9為根據本發明的實施例的根據深度的較深寫碼單元的圖式。 圖10至圖12為用於描述根據本發明的實施例的寫碼單元、預測單元與變換單元之間的關係的圖式。 圖13為用於描述根據表1的編碼模式資訊的寫碼單元、預測單元或分區與變換單元之間的關係的圖式。 圖14為說明根據本發明的實施例的運動估計裝置的圖式。 圖15為說明根據本發明的實施例的可在1/4像素精度的運動補償期間選擇的子像素以及整數像素的位置的圖式。 圖16為用於解釋根據本發明的實施例的對參考畫面進行內插的程序的圖式。 圖17A至圖17C為說明根據本發明的實施例的運動補償程序所需的參考畫面的資料的圖式。 圖18A至圖18G為說明根據預測單元的大小、預測模式,以及預測單元的運動向量的水平分量以及垂直分量是否具有整數值的當前預測單元的每像素的運動補償所需的參考畫面的像素的數目的表格。 圖19及圖20為自高值開始以降序說明根據明度分量的預測單元的大小、色度分量的預測單元的大小、預測模式,以及預測單元的運動向量的水平分量以及垂直分量是否具有整數值的當前預測單元的每像素的運動補償所需的參考畫面的像素的數目的表格。 圖21至圖23為根據本發明的另一實施例的用於解釋用於減少讀出參考畫面的資料的程序的內插程序的參考圖。 圖24及圖25為自高值開始以降序說明根據明度分量的預測單元的大小、色度分量的預測單元的大小、運動估計模式,以及預測單元的運動向量的水平分量以及垂直分量是否具有整數值的當前預測單元的每像素的運動補償所需的參考畫面的像素的數目的表格。 圖26為說明根據本發明的實施例的視訊編碼方法的流程圖。 圖27為說明根據本發明的實施例的運動補償裝置的方塊圖。 圖28為說明根據本發明的實施例的視訊解碼方法的流程圖。 圖29A說明根據本發明的實施例的儲存程式的光碟的實體結構。 圖29B說明根據本發明的實施例的藉由使用光碟而記錄以及讀取程式的光碟機。 圖30說明根據本發明的實施例的提供內容散佈服務的內容供應系統的整體結構。 圖31以及圖32說明根據本發明的實施例的應用了視訊編碼方法以及視訊解碼方法的行動電話的外部結構以及內部結構。 圖33說明根據本發明的實施例的使用通信系統的數位廣播系統。 圖34說明根據本發明的實施例的使用視訊編碼裝置以及視訊解碼裝置的雲端計算系統的網路結構。
2610~2640‧‧‧本發明的實施例的視訊編碼方法的流程各操作

Claims (2)

  1. 一種對視訊做解碼的裝置,所述裝置包括: 熵解碼器,經配置以: 自位元串流接收分割資訊和指示當前寫碼單元的分區類型之分區類型資訊; 藉由使用所述分割資訊自最大寫碼單元判定所述當前寫碼單元; 基於所述分區類型資訊判定在所述當前寫碼單元中當前預測單元的大小; 在所述當前預測單元的所述大小並非等於預定大小時,獲得指示在包含L0預測模式、L1預測模式、以及雙向預測模式的多個預測模式中用於所述當前預測單元的畫面間預測模式之運動預測模式資訊; 在所述當前預測單元的所述大小等於所述預定大小時,獲得指示在包含所述L0預測模式以及所述L1預測模式的多個預測模式中用於所述當前預測單元的所述畫面間預測模式之所述運動預測模式資訊;以及 根據所述運動預測模式資訊指示的所述畫面間預測模式對所述當前預測單元執行畫面間預測, 其中,在所述當前預測單元的所述大小等於所述預定大小時,所述多個預測模式不包含所述雙向預測模式, 其中,所述預測模式是基於所判定的所述當前預測單元的所述大小而定, 其中,所述L0預測模式參考L0圖像清單,所述L1預測模式參考L1圖像清單,並且所述雙向預測模式參考所述L0圖像清單與所述L1圖像清單。
  2. 如申請專利範圍第1項所述的裝置,其中所述當前預測單元的所述預定大小為4×8或8×4。
TW105135497A 2011-09-14 2012-09-14 視訊解碼裝置 TWI601411B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201161534499P 2011-09-14 2011-09-14

Publications (2)

Publication Number Publication Date
TW201707449A TW201707449A (zh) 2017-02-16
TWI601411B true TWI601411B (zh) 2017-10-01

Family

ID=47883895

Family Applications (4)

Application Number Title Priority Date Filing Date
TW106129256A TWI615018B (zh) 2011-09-14 2012-09-14 視訊解碼方法
TW101133837A TWI562601B (en) 2011-09-14 2012-09-14 Method of decoding video
TW106145897A TWI650010B (zh) 2011-09-14 2012-09-14 視訊解碼方法、視訊編碼裝置、視訊編碼方法及非暫態電腦可讀記錄媒體
TW105135497A TWI601411B (zh) 2011-09-14 2012-09-14 視訊解碼裝置

Family Applications Before (3)

Application Number Title Priority Date Filing Date
TW106129256A TWI615018B (zh) 2011-09-14 2012-09-14 視訊解碼方法
TW101133837A TWI562601B (en) 2011-09-14 2012-09-14 Method of decoding video
TW106145897A TWI650010B (zh) 2011-09-14 2012-09-14 視訊解碼方法、視訊編碼裝置、視訊編碼方法及非暫態電腦可讀記錄媒體

Country Status (18)

Country Link
US (5) US9538184B2 (zh)
EP (2) EP2744204B1 (zh)
JP (2) JP2014531153A (zh)
KR (8) KR20130029361A (zh)
CN (6) CN103931184B (zh)
CY (1) CY1121108T1 (zh)
DK (2) DK3454561T3 (zh)
ES (2) ES2702290T3 (zh)
HR (1) HRP20182107T1 (zh)
HU (2) HUE049155T2 (zh)
LT (1) LT2744204T (zh)
PL (2) PL3454561T3 (zh)
PT (1) PT2744204T (zh)
RS (1) RS58057B1 (zh)
SI (1) SI2744204T1 (zh)
TR (1) TR201819237T4 (zh)
TW (4) TWI615018B (zh)
WO (1) WO2013039357A2 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9264725B2 (en) 2011-06-24 2016-02-16 Google Inc. Selection of phase offsets for interpolation filters for motion compensation
WO2013047811A1 (ja) * 2011-09-29 2013-04-04 シャープ株式会社 画像復号装置、画像復号方法および画像符号化装置
CN103858430B (zh) 2011-09-29 2017-05-03 夏普株式会社 图像解码装置、图像解码方法及图像编码装置
US9451277B2 (en) * 2012-02-08 2016-09-20 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
JP2015526012A (ja) * 2012-07-02 2015-09-07 サムスン エレクトロニクス カンパニー リミテッド ブロックサイズによってインター予測の参照ピクチャリストを決定するビデオ符号化方法及びその装置、並びにビデオ復号化方法及びその装置
US20140078394A1 (en) * 2012-09-17 2014-03-20 General Instrument Corporation Selective use of chroma interpolation filters in luma interpolation process
US9313493B1 (en) * 2013-06-27 2016-04-12 Google Inc. Advanced motion estimation
CN104662905B (zh) * 2013-07-08 2019-06-11 三星电子株式会社 使用多个假设估计因子的帧间预测方法及其装置
KR101506723B1 (ko) * 2013-10-02 2015-03-30 인하대학교 산학협력단 Hevc 압축을 위한 계층적 상관관계를 갖는 예측 방향의 초기 결정 방법
US10531116B2 (en) * 2014-01-09 2020-01-07 Qualcomm Incorporated Adaptive motion vector resolution signaling for video coding
KR102290964B1 (ko) 2014-02-19 2021-08-18 삼성전자주식회사 적응적 서치 레인지를 이용한 비디오 인코딩 장치 및 그 방법
US10327001B2 (en) * 2014-06-19 2019-06-18 Qualcomm Incorporated Systems and methods for intra-block copy
US9936201B2 (en) * 2015-01-27 2018-04-03 Qualcomm Incorporated Contexts for large coding tree units
KR102402671B1 (ko) * 2015-09-09 2022-05-26 삼성전자주식회사 보간 필터의 연산 복잡도를 조절할 수 있는 영상 처리 장치, 영상 보간 방법 및 영상 부호화 방법
US10009622B1 (en) 2015-12-15 2018-06-26 Google Llc Video coding with degradation of residuals
KR20180129860A (ko) 2016-04-25 2018-12-05 엘지전자 주식회사 영상 코딩 시스템에서 인터 예측 방법 및 장치
KR102017027B1 (ko) * 2016-05-10 2019-09-02 한양대학교 산학협력단 고속 영상 부호화 방법 및 장치
CN117221572A (zh) * 2016-10-04 2023-12-12 英迪股份有限公司 视频解码方法、图像编码方法以及发送比特流的方法
US10609384B2 (en) * 2017-09-21 2020-03-31 Futurewei Technologies, Inc. Restriction on sub-block size derivation for affine inter prediction
US11825117B2 (en) 2018-01-15 2023-11-21 Samsung Electronics Co., Ltd. Encoding method and apparatus therefor, and decoding method and apparatus therefor
US10869016B2 (en) * 2018-04-12 2020-12-15 Mediatek Singapore Pte. Ltd. Methods and apparatus for encoding and decoding virtual reality content
WO2019199071A1 (ko) * 2018-04-13 2019-10-17 엘지전자 주식회사 영상 코딩 시스템에서 인터 예측에 따른 영상 디코딩 방법 및 장치
WO2020084473A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Multi- iteration motion vector refinement
CN109561315B (zh) * 2018-10-31 2020-10-02 北京金山云网络技术有限公司 一种运动估计方法、装置、电子设备及存储介质
WO2020098644A1 (en) 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Bandwidth control methods for inter prediction
CN117319644A (zh) 2018-11-20 2023-12-29 北京字节跳动网络技术有限公司 基于部分位置的差计算
CN111010572A (zh) * 2018-12-04 2020-04-14 北京达佳互联信息技术有限公司 一种视频编码方法和装置及设备
CN115361549B (zh) 2018-12-21 2024-04-09 华为技术有限公司 一种使用基于历史的运动矢量预测的编码器、解码器及相应方法
WO2020177756A1 (en) 2019-03-06 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Size dependent inter coding
CN110213577B (zh) * 2019-06-20 2023-05-09 深圳市网心科技有限公司 一种重建帧构造方法、系统及电子设备和存储介质
CN112004091B (zh) * 2020-07-31 2021-08-03 浙江大华技术股份有限公司 帧间预测方法及其相关装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5477272A (en) * 1993-07-22 1995-12-19 Gte Laboratories Incorporated Variable-block size multi-resolution motion estimation scheme for pyramid coding
US5786860A (en) * 1994-07-30 1998-07-28 Korean Advanced Institute Of Science And Technology High speed block matching for bi-directional motion vector estimation
US5832120A (en) * 1995-12-22 1998-11-03 Cirrus Logic, Inc. Universal MPEG decoder with scalable picture size
US6084908A (en) * 1995-10-25 2000-07-04 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
US6307887B1 (en) * 1997-04-04 2001-10-23 Microsoft Corporation Video encoder and decoder using bilinear motion compensation and lapped orthogonal transforms
US6418166B1 (en) * 1998-11-30 2002-07-09 Microsoft Corporation Motion estimation and block matching pattern

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6950469B2 (en) * 2001-09-17 2005-09-27 Nokia Corporation Method for sub-pixel value interpolation
JP4015934B2 (ja) * 2002-04-18 2007-11-28 株式会社東芝 動画像符号化方法及び装置
JP3861698B2 (ja) * 2002-01-23 2006-12-20 ソニー株式会社 画像情報符号化装置及び方法、画像情報復号装置及び方法、並びにプログラム
US7620109B2 (en) * 2002-04-10 2009-11-17 Microsoft Corporation Sub-pixel interpolation in motion estimation and compensation
US7154952B2 (en) * 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
US7352808B2 (en) * 2004-01-29 2008-04-01 International Business Machines Corporation System and method for the dynamic resolution change for video encoding
EP1578137A2 (en) 2004-03-17 2005-09-21 Matsushita Electric Industrial Co., Ltd. Moving picture coding apparatus with multistep interpolation process
US7006700B2 (en) * 2004-06-25 2006-02-28 Avocent Corporation Digital video compression command priority
US8111752B2 (en) * 2004-06-27 2012-02-07 Apple Inc. Encoding mode pruning during video encoding
US7792188B2 (en) * 2004-06-27 2010-09-07 Apple Inc. Selecting encoding types and predictive modes for encoding video data
EP1617672A1 (en) * 2004-07-13 2006-01-18 Matsushita Electric Industrial Co., Ltd. Motion estimator/compensator including a 16-bit 1/8 pel interpolation filter
JP2006080925A (ja) * 2004-09-09 2006-03-23 Toshiba Corp 動画符号化装置、動画符号化方法および動画符号化プログラム
US8565307B2 (en) * 2005-02-01 2013-10-22 Panasonic Corporation Picture encoding method and picture encoding device
JP4666255B2 (ja) * 2005-12-27 2011-04-06 日本電気株式会社 符号化データ選定、符号化データ設定、再符号化データ生成及び再符号化の方法及び装置
JP4752631B2 (ja) * 2006-06-08 2011-08-17 株式会社日立製作所 画像符号化装置、及び画像符号化方法
US8320460B2 (en) * 2006-09-18 2012-11-27 Freescale, Semiconductor, Inc. Dyadic spatial re-sampling filters for inter-layer texture predictions in scalable image processing
US20080137743A1 (en) * 2006-12-06 2008-06-12 Electronics And Telecommunications Research Institute Intra-mode predication search method and apparatus for compression of real-time video signal
TWI330341B (en) * 2007-03-05 2010-09-11 Univ Nat Chiao Tung Video surveillance system hiding and video encoding method based on data
TW200840366A (en) * 2007-03-28 2008-10-01 Univ Nat Central Complexity control method of video encoder
KR100944333B1 (ko) * 2007-07-30 2010-03-02 한국과학기술원 스케일러블 비디오 부호화에서 계층간 예측모드 고속결정방법
BRPI0818344A2 (pt) * 2007-10-12 2015-04-22 Thomson Licensing Métodos e aparelhos para codificação e decodificação de vídeo de partições de modo bi-preditivo geometricamente particionadas
EP2061248A1 (en) * 2007-11-13 2009-05-20 IBBT vzw Motion estimation and compensation process and device
FR2925819A1 (fr) * 2007-12-21 2009-06-26 Thomson Licensing Sas Procede de codage double passe par macrobloc
EP2250813B1 (en) * 2008-03-10 2018-12-05 InterDigital Madison Patent Holdings Method and apparatus for predictive frame selection supporting enhanced efficiency and subjective quality
RU2518390C2 (ru) * 2008-04-15 2014-06-10 Франс Телеком Кодирование и декодирование изображения или последовательности изображений, разбитых на пиксельные разделы линейной формы
KR20090129926A (ko) * 2008-06-13 2009-12-17 삼성전자주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
CN101350925A (zh) * 2008-07-11 2009-01-21 清华大学 一种插值滤波方法
CN102204254B (zh) * 2008-09-04 2015-03-18 汤姆森特许公司 使用隐式运动预测进行预测精细化的方法及装置
US8619856B2 (en) 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
JP5394212B2 (ja) * 2008-12-19 2014-01-22 トムソン ライセンシング データを挿入する方法、挿入されたデータを読み出す方法
US8311112B2 (en) * 2008-12-31 2012-11-13 Entropic Communications, Inc. System and method for video compression using predictive coding
WO2010131903A2 (en) * 2009-05-12 2010-11-18 Lg Electronics Inc. Method and apparatus for processing a video signal
US8995526B2 (en) * 2009-07-09 2015-03-31 Qualcomm Incorporated Different weights for uni-directional prediction and bi-directional prediction in video coding
KR20110017719A (ko) * 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CA2714932A1 (en) * 2009-09-23 2011-03-23 Her Majesty The Queen In The Right Of Canada As Represented By The Minister Of Industry Image interpolation for motion/disparity compensation
US8548065B2 (en) * 2009-10-22 2013-10-01 The Chinese University Of Hong Kong Parametric interpolation filter for motion-compensated prediction
CN102648631B (zh) * 2009-12-01 2016-03-30 数码士控股有限公司 用于编码/解码高分辨率图像的方法和设备
KR20110061468A (ko) * 2009-12-01 2011-06-09 (주)휴맥스 고해상도 영상의 부호화/복호화 방법 및 이를 수행하는 장치
US20110142135A1 (en) * 2009-12-14 2011-06-16 Madhukar Budagavi Adaptive Use of Quarter-Pel Motion Compensation
US20110194613A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
US8995527B2 (en) * 2010-02-19 2015-03-31 Qualcomm Incorporated Block type signalling in video coding
EP2947878B1 (en) * 2010-04-23 2017-02-15 M&K Holdings Inc. Apparatus for encoding an image
EP2603002A4 (en) * 2010-08-03 2014-12-31 Sony Corp IMAGE PROCESSING DEVICE AND IMAGE PROCESSING METHOD
CN108347620B (zh) * 2010-09-27 2022-08-30 Lg 电子株式会社 用于分割块的方法和解码设备
CN105516722B (zh) * 2010-09-30 2018-12-07 三菱电机株式会社 运动图像编码装置及方法、运动图像解码装置及方法
EP2661880A4 (en) * 2011-01-07 2016-06-29 Mediatek Singapore Pte Ltd METHOD AND DEVICE FOR IMPROVED CODING OF INTRA-LUMA PREDICTION MODE
US20120236936A1 (en) * 2011-03-14 2012-09-20 Segall Christopher A Video coding based on edge determination
WO2013047811A1 (ja) 2011-09-29 2013-04-04 シャープ株式会社 画像復号装置、画像復号方法および画像符号化装置
JP2013098933A (ja) * 2011-11-04 2013-05-20 Sony Corp 画像処理装置および方法
KR101665921B1 (ko) * 2011-11-08 2016-10-12 가부시끼가이샤 도시바 이미지 부호화 방법, 이미지 복호화 방법, 이미지 부호화 장치 및 이미지 복호화 장치
CN104041034B (zh) * 2012-01-19 2018-10-16 索尼公司 图像处理设备和方法
WO2013157791A1 (ko) * 2012-04-15 2013-10-24 삼성전자 주식회사 인터 예측의 참조영상을 결정하는 방법과 그 장치
KR102341826B1 (ko) * 2012-07-02 2021-12-21 엘지전자 주식회사 영상 정보 코딩 방법 및 이를 이용하는 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5477272A (en) * 1993-07-22 1995-12-19 Gte Laboratories Incorporated Variable-block size multi-resolution motion estimation scheme for pyramid coding
US5786860A (en) * 1994-07-30 1998-07-28 Korean Advanced Institute Of Science And Technology High speed block matching for bi-directional motion vector estimation
US6084908A (en) * 1995-10-25 2000-07-04 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
US5832120A (en) * 1995-12-22 1998-11-03 Cirrus Logic, Inc. Universal MPEG decoder with scalable picture size
US6307887B1 (en) * 1997-04-04 2001-10-23 Microsoft Corporation Video encoder and decoder using bilinear motion compensation and lapped orthogonal transforms
US6418166B1 (en) * 1998-11-30 2002-07-09 Microsoft Corporation Motion estimation and block matching pattern

Also Published As

Publication number Publication date
RS58057B1 (sr) 2019-02-28
PL3454561T3 (pl) 2020-05-18
TWI615018B (zh) 2018-02-11
KR20160097161A (ko) 2016-08-17
US20150172656A1 (en) 2015-06-18
KR101728465B1 (ko) 2017-04-19
WO2013039357A2 (ko) 2013-03-21
SI2744204T1 (sl) 2019-02-28
PT2744204T (pt) 2019-01-31
TW201740736A (zh) 2017-11-16
HUE043274T2 (hu) 2019-08-28
KR102123064B1 (ko) 2020-06-15
JP2017063468A (ja) 2017-03-30
CN107801028A (zh) 2018-03-13
EP2744204B1 (en) 2018-12-12
CN107820090A (zh) 2018-03-20
US9538184B2 (en) 2017-01-03
CN107968945B (zh) 2021-09-14
TW201813395A (zh) 2018-04-01
KR20180019009A (ko) 2018-02-22
CN107979755B (zh) 2021-12-21
TWI650010B (zh) 2019-02-01
US20150172707A1 (en) 2015-06-18
KR20180131521A (ko) 2018-12-10
CN107979757A (zh) 2018-05-01
TR201819237T4 (tr) 2019-01-21
CN107979755A (zh) 2018-05-01
EP3454561A1 (en) 2019-03-13
LT2744204T (lt) 2019-01-10
PL2744204T3 (pl) 2019-03-29
WO2013039357A3 (ko) 2013-05-10
TW201707449A (zh) 2017-02-16
KR101728466B1 (ko) 2017-04-19
CN103931184B (zh) 2017-12-01
HUE049155T2 (hu) 2020-09-28
US9538188B2 (en) 2017-01-03
US20150172696A1 (en) 2015-06-18
KR102019491B1 (ko) 2019-09-06
HRP20182107T1 (hr) 2019-02-22
JP2014531153A (ja) 2014-11-20
EP2744204A2 (en) 2014-06-18
EP2744204A4 (en) 2015-01-28
DK3454561T3 (da) 2020-02-17
US9578332B2 (en) 2017-02-21
KR101821703B1 (ko) 2018-01-24
EP3454561B1 (en) 2020-02-05
ES2702290T3 (es) 2019-02-28
KR102214441B1 (ko) 2021-02-09
US20150172699A1 (en) 2015-06-18
US20140233634A1 (en) 2014-08-21
CN103931184A (zh) 2014-07-16
US9544600B2 (en) 2017-01-10
KR20190104967A (ko) 2019-09-11
CN107820090B (zh) 2020-06-23
CY1121108T1 (el) 2019-12-11
ES2773691T3 (es) 2020-07-14
CN107801028B (zh) 2020-11-27
DK2744204T3 (en) 2019-01-14
TW201320761A (zh) 2013-05-16
CN107979757B (zh) 2021-12-21
KR20130029361A (ko) 2013-03-22
KR20200070184A (ko) 2020-06-17
KR101925555B1 (ko) 2018-12-05
TWI562601B (en) 2016-12-11
KR20170081578A (ko) 2017-07-12
KR20160097160A (ko) 2016-08-17
CN107968945A (zh) 2018-04-27
US9538187B2 (en) 2017-01-03

Similar Documents

Publication Publication Date Title
TWI601411B (zh) 視訊解碼裝置
RU2654503C1 (ru) Способ и устройство для внутреннего предсказания видео
TWI556648B (zh) 解碼影像的方法