TW201701670A - 視訊解碼裝置 - Google Patents

視訊解碼裝置 Download PDF

Info

Publication number
TW201701670A
TW201701670A TW105131153A TW105131153A TW201701670A TW 201701670 A TW201701670 A TW 201701670A TW 105131153 A TW105131153 A TW 105131153A TW 105131153 A TW105131153 A TW 105131153A TW 201701670 A TW201701670 A TW 201701670A
Authority
TW
Taiwan
Prior art keywords
unit
prediction
list
size
code
Prior art date
Application number
TW105131153A
Other languages
English (en)
Inventor
金讚烈
李泰美
艾拉雪納伊蘭娜
Original Assignee
三星電子股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三星電子股份有限公司 filed Critical 三星電子股份有限公司
Publication of TW201701670A publication Critical patent/TW201701670A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供判斷用於幀間預測的參考影像的方法以及根據判斷用於幀間預測的參考影像的方法的幀間預測方法。所述幀間預測包含:在當前片段為B片段時,判斷由寫碼單元中所包含的預測單元中的當前預測單元使用的參考圖像列表;以及在所述當前預測單元的尺寸為4×8或8×4時,輸出指示L0列表及L1列表中的參考圖像列表的所述當前預測單元的幀間預測索引資訊,且在所述當前預測單元的尺寸並非4×8或8×4時,輸出指示L0列表、L1列表及雙向預測列表中的參考圖像列表的所述當前預測單元的所述幀間預測索引資訊。

Description

視訊解碼裝置
本發明是關於涉及幀間預測的視訊編碼以及解碼。
隨著用於再生以及儲存高解析度或高品質視訊內容的硬體正被開發以及供應,對用於有效地對高解析度或高品質視訊內容做編碼或解碼的視訊編解碼器的需要增加。在習知視訊編解碼器中,基於具有預定尺寸的巨集區塊而根據有限編碼方法來對視訊做編碼。
視訊編解碼器藉由使用視訊影像在時間上及空間上具有高相關的特徵以預測方法來減少資料量。根據預測方法,為了藉由使用相鄰影像來預測當前影像,藉由使用影像之間的時間距離或空間距離或預測誤差來記錄影像資訊。
技術問題
本揭露提供一種判斷用於幀間預測的參考圖像列表的方法及根據所述方法的幀間預測方法。
本揭露亦提供一種用於有效地對參考圖像列表資訊進行編碼及傳輸的視訊編碼方法以及一種用於獲得及讀取參考圖像列表資訊的視訊解碼方法。
技術解決方案
根據本揭露的一態樣,提供一種運動預測方法,所述運動預測方法包含:在當前片段為B片段時,判斷由寫碼單元中所包含的預測單元中的當前預測單元使用的參考圖像列表;以及在所述當前預測單元的尺寸為4×8或8×4時,輸出指示L0列表及L1列表中的參考圖像列表的所述當前預測單元的幀間預測索引資訊,且在所述當前預測單元的尺寸並非4×8或8×4時,輸出指示L0列表、L1列表及雙向預測列表中的參考圖像列表的所述當前預測單元的所述幀間預測索引資訊。
有利效應
根據一或多個實施例的運動預測方法,當預測單元的尺寸為4×8或8×4時,可跳過用於指示用於雙向幀間預測的參考圖像列表為雙向預測列表的符號寫碼。由於跳過傳輸與不必要的參考圖像列表相關的資訊的操作,因此可減少傳輸位元量。且,根據所述實施例的運動補償方法,當預測單元的尺寸為4×8或8×4時,跳過檢查用於雙向幀間預測的參考圖像列表是否為雙向預測列表的操作,且因此亦可簡化資料剖析操作。
根據本揭露的一態樣,提供一種運動預測方法,所述運動預測方法包含:在當前片段為B片段時,判斷由寫碼單元中所包含的預測單元中的當前預測單元使用的參考圖像列表;以及在所述當前預測單元的尺寸為4×8或8×4時,輸出指示L0列表及L1列表中的參考圖像列表的所述當前預測單元的幀間預測索引資訊,且在所述當前預測單元的尺寸並非4×8或8×4時,輸出指示L0列表、L1列表及雙向預測列表中的參考圖像列表的所述當前預測單元的所述幀間預測索引資訊。
所述運動預測方法可更包含:判斷關於所述當前片段中的4×8或8×4尺寸的預測單元是否允許進行包含所述L0列表及所述L1列表的所述雙向預測列表用於所述當前預測單元的幀間預測;以及將雙向預測限制資訊包含至所述當前片段的片段標頭中,所述雙向預測限制資訊指示關於4×8或8×4尺寸的所述預測單元不允許進行所述雙向預測列表用於所述當前預測單元的幀間預測。
所述當前預測單元的幀間預測索引資訊的所述輸出可包含在所述當前預測單元的尺寸為4×8或8×4時,輸出指示用於所述當前預測單元的參考圖像列表為除所述雙向預測列表之外的參考圖像列表的所述幀間預測索引資訊。
在所述輸出的步驟中,在所述當前預測單元的尺寸為4×8或8×4時,可跳過對指示所述參考圖像列表為雙向預測列表的資訊的二進位化操作。
根據本揭露的另一態樣,提供一種運動補償方法,所述運動補償方法包含:在當前片段為B片段時,獲得根據寫碼單元中所包含的預測單元中的當前預測單元使用的參考圖像列表的類型而指示的幀間預測索引資訊;以及在所述當前預測單元的尺寸為4×8或8×4時,基於指示所述當前預測單元的參考圖像列表為L0列表及L1列表中的一者的所述幀間預測索引資訊而判斷所述參考圖像列表,且在所述當前預測單元的尺寸並非4×8或8×4時,基於指示所述當前預測單元的參考圖像列表為L0列表、L1列表及雙向預測列表中的一者的所述幀間預測索引資訊而判斷所述參考圖像列表。
所述運動補償方法可更包含:自所述當前片段的片段標頭剖析指示關於4×8或8×4尺寸的所述預測單元是否允許進行幀間預測的雙向預測限制資訊;以及基於所述剖析的雙向預測限制資訊而判斷關於所述當前片段中的4×8或8×4尺寸的預測單元是否允許進行包含所述L0列表及所述L1列表的所述雙向預測列表用於所述當前預測單元的幀間預測。
在所述獲得所述幀間預測索引資訊的步驟中,在所述當前預測單元的尺寸為4×8或8×4時,可跳過自剖析自位元串流的二進位化位元串讀取指示所述參考圖像列表為雙向預測列表的資訊的操作。
所述判斷可包含在所述當前預測單元的所述尺寸為4×8或8×4時自所述幀間預測索引資訊讀取除所述雙向預測列表之外的參考圖像列表,其中在所述當前預測單元的所述尺寸為4×8或8×4時,跳過檢查所述幀間預測索引資訊是否指示所述參考圖像列表為所述雙向預測列表的操作。
根據本揭露的另一態樣,提供一種運動預測裝置,包含:運動預測單元,用於在當前片段為B片段時,判斷寫碼單元中所包含的預測單元中的當前預測單元使用的參考圖像列表以及屬於所述參考圖像列表的經重新建構的影像中的所述當前預測單元的參考區塊;以及幀間預測資訊輸出單元,用於在所述當前預測單元的尺寸為4×8或8×4時,輸出指示所述參考圖像列表為L0列表及L1列表中的一者的所述當前預測單元的幀間預測索引資訊,且在所述當前預測單元的所述尺寸並非4×8或8×4時,輸出指示作為L0列表、L1列表及雙向預測列表中的一者的參考圖像列表的所述當前預測單元的幀間預測索引資訊。
根據本揭露的另一態樣,提供一種運動補償裝置,包含:幀間預測資訊獲得單元,用於在當前片段為B片段時,獲得根據寫碼單元中所包含的預測單元中的當前預測單元使用的參考圖像列表的類型而指示所述參考圖像列表的幀間預測索引資訊;以及運動補償單元,用於在所述當前預測單元的尺寸為4×8或8×4時,基於指示所述當前預測單元的參考圖像列表為L0列表及L1列表中的一者的所述當前預測單元的所述幀間預測索引資訊而判斷所述參考圖像列表,且在所述當前預測單元的所述尺寸並非4×8或8×4時,基於指示所述當前預測單元的參考圖像列表為L0列表、L1列表及雙向預測列表中的一者的所述當前預測單元的所述幀間預測索引資訊而判斷所述參考圖像列表,以及藉由使用所述所判斷的參考圖像列表而對所述當前預測單元執行運動補償。
根據本揭露的另一態樣,提供一種電腦可讀記錄媒體,其上體現有用於執行上述運動預測方法的電腦程式。
根據本揭露的另一態樣,提供一種電腦可讀記錄媒體,其上體現有用於執行上述運動補償方法的電腦程式。
諸如「......中的至少一者」的表達在部件的列表之前時修飾部件的整個列表,而不是修飾列表的個別部件。
下文中,將參看圖1A至圖4來描述根據一或多個實施例的用於判斷可進行單向預測或雙向預測的參考影像的方法及裝置,及根據所述用於判斷的方法及裝置的用於運動預測的方法及裝置,以及用於運動補償的方法及裝置。且,將參看圖5至圖17來描述基於根據一或多個實施例的具有樹狀結構的寫碼單元的根據一或多個實施例的視訊編碼裝置及視訊解碼裝置以及根據一或多個實施例的視訊編碼方法及視訊解碼方法。且,將參看圖18至圖24來描述根據實施例的視訊編碼方法及視訊解碼方法。下文中,「影像」可指視訊的靜態影像或動態影像(亦即,視訊自身)。
圖1A為說明根據一或多個實施例的參考影像判斷裝置10的方塊圖。圖1B為說明根據一或多個實施例的判斷參考影像的方法的流程圖。
參考影像判斷裝置10包含參考圖像列表判斷單元12以及參考索引判斷單元14。
參考影像判斷裝置10可包含總體控制參考圖像列表判斷單元12以及參考索引判斷單元14的中央處理器(未圖示)。或者,參考圖像列表判斷單元12以及參考索引判斷單元14可分別由參考圖像列表判斷單元12以及參考索引判斷單元14中的每一者中所包含的獨立處理器(未圖示)操作,且所述處理器可彼此合作以便操作參考影像判斷裝置10。或者,參考圖像列表判斷單元12以及參考索引判斷單元14可根據參考影像判斷裝置10的外部處理器(未圖示)的控制而受到控制。
參考影像判斷裝置10可包含至少一個資料儲存單元(未圖示),參考圖像列表判斷單元12以及參考索引判斷單元14的輸入及輸出資料儲存於所述資料儲存單元中。參考影像判斷裝置10可包含記憶體控制單元(未圖示),所述記憶體控制單元負責資料儲存單元(未圖示)的資料輸入及輸出。
參考影像判斷裝置10判斷視訊影像的時間預測中所使用的參考影像。參考影像判斷裝置10判斷指示當前影像與參考影像的位置的差異或留數(residue)的預測資訊。因此,可藉由使用預測資訊而不是使用整體影像資料來記錄影像資訊。
根據時間預測編碼方法,可藉由參考在再生時間方面的先前及後續影像來預測當前影像。無論影像在再生時間方面是在之前還是之後,可參考關於編碼次序或解碼次序在當前影像之前編碼或復原的影像以用於當前影像的預測編碼。當前影像以及參考影像可為包含圖像、幀、欄位、片段或其類似者的影像資料單元。
參考影像判斷裝置10可將當前影像分割為多個區塊以用於幀間預測的迅速計算,且可執行關於區塊的幀間預測。亦即,在藉由分割當前影像而獲得的多個區塊中,為了進行當前影像的幀間預測,可參考藉由分割當前影像而獲得的多個區塊中的一者。
用於B片段類型影像的幀間預測可包含前向預測及反向預測。在前向預測中,可參考具有在當前影像之前的圖像次序號(Picture Order Count, POC)號的影像以執行當前影像的幀間預測。相比之下,在反向預測中,可參考具有在當前影像的POC號之後的POC號的影像以執行當前影像的幀間預測。
參考圖像列表包含指示參考影像的索引。根據一或多個實施例的參考圖像列表可分類為L0列表及L1列表。L0列表及L1列表可各自包含指示參考影像的參考索引以及關於參考次序的資訊。可預先設定待分配至參考圖像列表的參考影像的基本有效數目。
舉例而言,用於列表0預測的L0列表可包含指示用於前向預測的參考影像的參考索引。然而,若用於前向預測的參考影像的數目小於L0列表中所設定的參考影像的基本有效數目,則L0列表可更包含指示用於反向預測的參考影像的參考索引。
舉例而言,用於列表1預測的L1列表可包含指示用於反向預測的參考影像的參考索引。然而,若用於反向預測的參考影像的數目小於L1列表中所設定的參考影像的基本有效數目,則L1列表可更包含指示用於前向預測的參考影像的參考索引。
對於當前影像的幀間預測,可自L0列表及L1列表的參考圖像列表中的至少一者判斷參考影像。參考圖像列表判斷單元12可判斷使用哪一參考圖像列表來用於B片段類型當前影像的幀間預測。
舉例而言,可判斷當前片段使用L0列表還是L1列表。且,對於當前片段,可執行使用包含L0列表及L1列表兩者的雙向預測列表的雙向預測。
參考影像判斷裝置10可判斷分配至每一參考圖像列表的參考影像的參考次序。舉例而言,在分配至參考圖像列表的參考影像中,可判斷參考次序以使得優先參考在顯示次序方面接近當前影像的參考影像。
參考圖像列表判斷單元12可檢查包含區塊的片段的片段類型,且根據所述片段類型而判斷參考圖像列表。
當片段為可進行單向預測或雙向預測的B片段類型時,參考圖像列表判斷單元12可將區塊的參考圖像列表判斷為L0列表、L1列表及雙向預測列表中的一者。參考圖像列表判斷單元12可判斷片段的幀間預測中所使用的參考圖像列表。參考圖像列表可判斷為L0列表、L1列表及雙向預測列表中的一者。
根據一或多個實施例,可根據區塊尺寸來限制可用於幀間預測的參考圖像列表的類型。舉例而言,當B片段類型中的區塊的尺寸為4×8或8×4時,可允許進行使用L0列表及L1列表中的一個參考圖像列表的幀間預測。可能不允許使用雙向預測列表的幀間預測用於B片段類型中的區塊。
參考索引判斷單元14可基於參考圖像列表來判斷參考圖像列表中的指示參考影像的參考索引。
舉例而言,參考索引判斷單元14可將來自L0列表的L0參考索引或來自L1列表的L1參考索引判斷為用於區塊的參考索引。
下文中,將參看圖1B來描述藉由使用參考影像判斷裝置10來判斷參考影像以用於幀間預測的操作。
在操作11中,參考圖像列表判斷單元12可檢查包含區塊的片段的片段類型。在操作13中,若當前片段類型為B片段類型,則參考圖像列表判斷單元12可將區塊的參考圖像列表判斷為L0列表、L1列表及雙向預測列表中的一者。
在操作15中,若由參考圖像列表判斷單元12判斷的參考圖像列表並非L1列表,則參考索引判斷單元14可將來自L0列表的L0參考索引判斷為用於區塊的參考索引。亦即,當參考圖像列表為L0列表或雙向預測列表時,可自L0列表選擇至少一個參考索引。
若由參考圖像列表判斷單元12判斷的參考圖像列表為L1列表,則不判斷L0參考索引,而是所述方法進行至操作17。
在操作17中,當由參考圖像列表判斷單元12判斷的參考圖像列表並非L0列表時,參考索引判斷單元14可將L1列表中的L1參考索引判斷為用於區塊的參考索引。亦即,當參考圖像列表為L1列表或雙向預測列表時,可自L1列表選擇至少一個參考索引。
因此,當參考圖像列表為雙向預測列表時,可自L0列表判斷至少一個L0參考索引,且可自L1列表判斷至少一個L1參考索引。
在操作15中,參考索引判斷單元14可判斷L0參考索引且亦可判斷第一運動向量的差分值,其指示由L0參考索引指示的參考影像中的參考區塊。
在操作17中,參考索引判斷單元14可判斷L1參考索引且亦可判斷第二運動向量的差分值,其指示由L1參考索引指示的參考影像中的參考區塊。
參考索引指示屬於參考圖像列表的參考影像的次序,且運動向量可指示預定參考影像中的參考區塊的位置。因此,基於參考索引以及運動向量,可判斷用於區塊的幀間預測的參考影像以及參考區塊。
參考影像判斷裝置10可使用2位元幀間預測索引資訊作為指示參考圖像列表的資訊。
為了根據一或多個實施例執行關於2位元幀間預測索引資訊的基於內文的熵編碼(entropy encoding)或熵解碼(entropy decoding),可使用包含指示幀間預測索引資訊的符號的機率資訊的內文模型。特定言之,針對符號的每一二進位(bin)而判斷內文模型,且因此可判斷分別對應於幀間預測資訊的2個位元的兩個二進位中的每一者的內文模型。
根據一或多個實施例的幀間預測索引資訊的二進位中的第一二進位可指示參考圖像列表為單一列表還是雙向預測列表。當第一二進位指示雙向預測列表幀間預測時,不必再定義第二二進位。然而,當第一二進位指示使用單一參考圖像列表的幀間預測時,第二列表可指示所述單一參考圖像列表為L0列表還是L1列表。
根據一或多個實施例,當B片段類型中的區塊的水平及垂直尺寸的總和為12(如區塊尺寸4×8或8×4的狀況)時,不允許進行使用雙向預測列表的幀間預測。因此,區塊的幀間預測索引資訊可指示L0列表或L1列表。僅除雙向預測列表之外的參考圖像列表可判斷為幀間預測索引資訊。因此,將指示L0列表預測或L1列表預測的位元串判斷為區塊的幀間預測索引資訊,且可能不將指示雙向預測的位元串判斷為區塊的幀間預測索引資訊。
當B片段類型中的區塊的水平及垂直尺寸的總和為12時,可關於B片段類型中的區塊而判斷指示L0列表預測、L1列表預測、雙向預測中的一者的幀間預測索引資訊。
下文中,將參看圖2A及圖2B來描述藉由使用由參考影像判斷裝置10判斷的參考圖像來執行運動預測的操作。且,將參看圖3A及圖3B描述藉由使用由參考影像判斷裝置10判斷的參考圖像來執行運動補償的操作。
圖2A為說明根據一或多個實施例的包含參考影像判斷裝置10的運動預測裝置20的方塊圖。圖2B為說明根據一或多個實施例的運動預測方法的流程圖。
運動預測裝置20包含運動預測單元22以及幀間預測資訊輸出單元24。
運動預測單元22可檢查包含當前區塊的當前片段的片段類型。運動預測單元22可在當前片段為B片段時判斷待在幀間預測中由當前區塊使用的參考圖像列表。
運動預測單元22可藉由使用屬於L0列表及L1列表中的至少一者的參考圖像來關於區塊執行運動預測。運動預測單元22可自分配至所判斷的參考圖像列表的參考影像判斷當前區塊的參考圖像。
運動預測單元22可自屬於參考圖像列表的經重新建構的影像判斷用於當前區塊的參考區塊。運動預測單元22可判斷所判斷的參考影像的區塊與當前影像的當前區塊之間的類似性以偵測關於當前區塊具有最小誤差的區塊。亦即,可藉由運動預測來偵測與當前區塊類似的區塊,且所偵測的區塊可判斷為參考區塊。且,包含所偵測的參考區塊的圖像可判斷為參考圖像。當判斷與當前區塊最類似的至少一個參考區塊時,可判斷至少一個參考圖像。
運動預測單元22可產生指示當前預測單元與參考區塊之間的空間距離的運動向量以及指示當前預測單元與參考區塊的像素值之間的差的留數。
幀間預測資訊輸出單元24可輸出指示屬於參考圖像列表的經重新建構的影像中的包含參考區塊的經重新建構的影像的參考索引資訊,指示當前預測單元的運動向量與先前運動向量之間的差的運動向量差資訊,以及留數。
幀間預測資訊輸出單元24可產生及輸出指示用於當前區塊的參考圖像列表的類型的幀間預測索引資訊。對於當前區塊的幀間預測,可輸出指示使用L0列表、L1列表還是雙向預測列表的幀間預測索引資訊。
執行幀間預測的當前區塊可稱作預測單元。在操作21中,運動預測單元22可在包含寫碼單元的當前片段為B片段時判斷由預測單元中的當前預測單元使用的參考列表。可將L0列表、L1列表或雙向預測列表判斷為參考列表。
運動預測單元22可判斷預測單元的尺寸,且可根據預測單元的尺寸而限制可經選擇以用於幀間預測的參考圖像列表的類型。
在當前區塊的尺寸為4×8或8×4時,當前區塊的幀間預測索引可指示作為L0列表及L1列表中的一者的參考圖像列表。在當前區塊的尺寸並非4×8或8×4時,當前區塊的幀間預測索引可指示作為L0列表、L1列表及雙向預測列表中的一者的參考圖像列表。
在操作23中,幀間預測資訊輸出單元24可輸出當前預測單元的幀間預測索引資訊。
幀間預測索引資訊輸出單元24可將指示L0預測、L1預測及雙向預測中的一者的幀間預測索引資訊包含至位元串流中的包含區塊的預測資訊的預測單元欄位中。
且,若幀間預測索引資訊不表示L1預測,則幀間預測索引資訊輸出單元24可將L0參考索引資訊以及第一運動向量的差值資訊包含至預測單元欄位中。
當由運動預測單元22判斷參考區塊以及參考圖像時,可判斷指示參考圖像的資訊,例如,屬於參考圖像列表的影像中的參考圖像的編號,亦即,參考索引。若參考圖像屬於L0列表,則可判斷L0參考索引,且若參考圖像屬於L1列表,則可判斷L1參考索引。幀間預測索引資訊輸出單元24可產生參考索引資訊且將參考索引資訊包含至預測單元欄位中。
幀間預測索引資訊輸出單元24可將由於幀間預測而產生的資訊包含至片段標頭及預測單元欄位中,且可傳輸包含片段標頭及預測單元欄位的位元串流。
幀間預測索引資訊輸出單元24可藉由使用針對幀間預測索引資訊的每一二進位而判斷的內文模型來對幀間預測索引資訊做熵編碼。幀間預測索引資訊輸出單元24不僅可傳輸由於先前幀間預測而產生的彼等各種符號(亦即,幀間預測索引資訊),亦可傳輸藉由對運動向量的差值資訊或參考索引資訊或其類似者執行熵編碼而產生的位元串。
運動預測單元22可預先設定關於當前片段中的4×8或8×4尺寸的預測單元是否允許進行雙向預測列表包含L0列表及L1列表的幀間預測。在此狀況下,幀間預測索引資訊輸出單元24可將雙向預測限制資訊包含至當前片段的片段標頭中,雙向預測限制資訊指示關於4×8或8×4尺寸的預測單元不允許進行使用雙向預測列表的幀間預測。
在當前預測單元的尺寸為4×8或8×4時,幀間預測索引資訊輸出單元24可輸出指示用於當前預測單元的參考圖像列表為除雙向預測列表之外的參考圖像列表的幀間預測索引資訊。因此,在當前預測單元的尺寸為4×8或8×4時,幀間預測索引資訊輸出單元24可跳過關於指示參考圖像列表為雙向預測列表的資訊的二進位化操作。
藉由熵編碼而編碼的預測資訊可包含至位元串流的區塊區域中以待傳輸。
圖3A為說明根據一或多個實施例的包含參考影像判斷裝置10的運動補償裝置30的方塊圖。圖3B為說明根據一或多個實施例的運動補償方法的流程圖。
運動補償裝置30包含幀間預測資訊獲得單元32以及運動補償單元34。
一般而言,在視訊編碼程序中,可執行運動預測以及運動補償。在視訊解碼程序中,亦可執行運動補償。在執行關於原始影像的運動預測之後,為了經由運動補償而產生與原始影像相同的經重新建構的影像,必須藉由使用參考資訊及經由運動預測而產生的留數來執行運動補償。因此,對於視訊編碼程序以及視訊解碼程序中的幀間預測模式區塊的編碼以及解碼,必須傳輸或接收關於參考資訊(參考索引、運動向量)及留數的資訊。
幀間預測資訊獲得單元32可自所接收的位元串流中的片段標頭剖析片段類型資訊。可藉由使用所剖析的片段類型資訊來判斷當前片段的片段類型。
幀間預測資訊獲得單元32可獲得關於寫碼單元中所包含的預測單元的尺寸的資訊。當包含寫碼單元的當前片段為B片段時,可進一步獲得指示預測單元中的當前預測單元使用的參考列表的類型的幀間預測索引資訊。
在當前預測單元的尺寸為4×8或8×4時,運動補償單元34可基於指示L0列表及L1列表中的一者的幀間預測索引資訊來判斷當前預測單元的參考圖像列表。在當前預測單元的尺寸並非4×8或8×4時,運動補償單元34可基於指示L0列表、L1列表及雙向預測列表中的一者的幀間預測索引資訊來判斷當前預測單元的參考圖像列表。
運動補償單元34可藉由使用所判斷的參考圖像列表來關於當前預測單元執行運動補償。
在操作31中,當包含寫碼單元的當前片段為B片段時,幀間預測資訊獲得單元32可獲得指示預測單元中的當前預測單元使用的參考列表的類型的幀間預測索引資訊。在所接收的位元串流中,可自預測單元欄位剖析指示當前區塊(預測單元)的參考圖像列表的幀間預測索引資訊。
在操作33中,在當前預測單元的尺寸為4×8或8×4時,運動補償單元34可基於預測單元區域而將L0列表或L1列表判斷為待用於當前幀間預測的參考圖像列表。
在操作33中,在當前預測單元的尺寸並非4×8或8×4時,運動補償單元34可基於幀間預測索引資訊而將L0列表、L1列表及雙向預測列表中的一者判斷為待用於當前幀間預測的參考圖像列表。
幀間預測資訊獲得單元32可自當前片段的片段標頭剖析雙向預測限制資訊,其指示關於4×8或8×4尺寸的預測單元是否允許進行使用雙向預測列表的幀間預測。
幀間預測資訊獲得單元32可基於所剖析的雙向預測限制資訊而預期是否將在當前片段中剖析關於4×8或8×4尺寸的預測單元指示雙向預測列表預測的幀間預測索引資訊。
且,幀間預測資訊獲得單元32可基於所剖析的雙向預測限制資訊而判斷剖析預測單元的2位元幀間預測索引資訊還是1位元幀間預測索引資訊。
若根據一或多個實施例關於4×8或8×4尺寸的預測單元限制雙向預測列表預測,則在當前預測單元的尺寸為4×8或8×4時,幀間預測資訊獲得單元32可跳過自剖析自位元串流的二進位化位元串讀取指示參考圖像列表為雙向預測列表的資訊的操作。
因此,在當前預測單元的尺寸為4×8或8×4時,幀間預測資訊獲得單元32可自幀間預測索引資訊判斷除雙向預測列表之外的參考圖像列表。因此,若當前預測單元的尺寸為4×8或8×4,則幀間預測資訊獲得單元32可跳過檢查幀間預測索引資訊是否指示雙向預測列表的操作。
幀間預測資訊獲得單元32可關於位元串流中的包含幀間預測索引資訊的位元串來執行使用針對每一二進位而判斷的內文模型的熵編碼,藉此復原幀間預測索引資訊。
幀間預測資訊獲得單元32可自所接收的位元串流剖析參考索引資訊、運動向量的差值以及屬於片段的幀間預測模式中的每一區塊的留數。
幀間預測資訊獲得單元32可進一步獲得基於由幀間預測索引指示的參考列表而判斷的參考索引以及運動向量差資訊。且,幀間預測資訊獲得單元32可基於寫碼單元的尺寸以及分區類型資訊而獲得寫碼單元的分區類型資訊,以使得可判斷寫碼單元中所包含的預測單元的尺寸。
運動補償單元34可基於所判斷的參考圖像列表來判斷第一所復原參考影像中的指示當前預測單元的參考索引的參考影像。運動補償單元34可自參考圖像列表判斷由參考索引指示的參考影像。當前區塊的運動向量是藉由使用運動向量與先前運動向量的差值而判斷,且由運動向量指示的參考區塊可判斷自參考影像的區塊。運動補償單元34可組合當前區塊與參考區塊以藉由留數來補償參考區塊,藉此復原當前區塊。
因此,運動補償單元34可藉由使用針對每一區塊判斷的參考圖像、運動向量以及留數來執行運動補償以產生經重新建構的影像。
運動預測裝置20可藉由使用預測資訊而不是整個影像資料來表達影像,且因此,運動預測裝置20可用於視訊編碼以用於執行視訊壓縮編碼,所述視訊壓縮編碼需要減少視訊資料量。
詳言之,運動預測裝置20可包含於視訊編碼器中或連接至視訊編碼器,所述視訊編碼器基於藉由將視訊影像分割至空間域中而獲得的寫碼單元來對視訊做編碼以藉此執行用於視訊編碼的幀間預測。且,對於對寫碼單元的幀間預測,將寫碼單元分割為預測單元及分區,且可基於所述預測單元及分區來執行幀間預測。
根據一或多個實施例的寫碼單元可不僅包含具有固定設定的形式的區塊,亦包含具有樹狀結構的寫碼單元。根據一或多個實施例,下文將參看圖5至圖17來詳細描述具有樹狀結構的寫碼單元以及寫碼單元中的預測單元及分區。
運動預測裝置20可關於寫碼單元的影像區塊或影像資料執行幀間預測以輸出關於參考影像的預測誤差,亦即,留數。運動預測裝置20可產生藉由對留數進行變換及量化而獲得的經量化的變換係數,且關於(例如)變換係數、參考資訊以及編碼資訊的符號而執行熵編碼以輸出位元串流。運動預測裝置20亦可對包含L0列表相關資訊以及L1列表相關資訊(其包含屬於每一參考圖像列表的影像的參考次序或影像的編號)或參考圖像列表相關資訊(諸如,與參考圖像列表的修改相關的資訊)的符號做編碼且輸出所述符號。
運動預測裝置20亦可藉由對變換係數執行逆量化、逆變換以及預測補償以復原空間域的影像以及執行迴路濾波來產生經重新建構的影像。亦即,運動預測裝置20可參考藉由使用L0列表及L1列表中的至少一者以視訊編碼器產生的經重新建構的影像以便關於作為B片段的當前影像而執行幀間預測。以此方式產生的經重新建構的影像用作用於下一輸入影像的運動預測的參考影像,且因此,運動預測裝置20可又關於下一輸入影像經由幀間預測來判斷參考資訊及留數。
因此,可經由藉由使用運動預測裝置20而執行的運動預測來執行視訊壓縮編碼。
為了輸出視訊編碼結果,運動預測裝置20可結合內部安裝的視訊編碼處理器或外部視訊編碼處理器操作以藉此執行包含運動預測的視訊編碼操作。運動預測裝置20的內部視訊編碼處理器可由額外處理器實施,且根據一或多個實施例,中央處理單元或圖形計算元件可驅動視訊編碼處理模組以執行基本視訊編碼操作。
接著,將描述視訊解碼程序。
根據一或多個實施例的運動補償裝置30可接收經由運動預測而壓縮的位元串流,以藉此藉由使用預測資訊而不是整個影像資料來復原影像。
運動補償裝置30可自位元串流的區塊區域剖析指示用於當前區塊的參考圖像的參考索引、運動向量以及留數。
運動補償裝置30可包含於視訊解碼器中或連接至視訊解碼器,所述視訊解碼器基於藉由將視訊影像分割至空間域中而獲得的寫碼單元來對視訊做解碼以藉此執行用於視訊解碼的運動補償。且,用於運動補償的寫碼單元可包含預測單元及分區,且運動補償可基於所述預測單元及分區來執行。如上所述,根據一或多個實施例的寫碼單元可不僅包含具有固定設定的形式的區塊,亦包含具有樹狀結構的寫碼單元。
運動補償裝置30可關於所接收的位元串流而執行熵解碼以剖析變換係數、參考資訊、編碼資訊的符號或其類似者。運動補償裝置30可剖析包含參考圖像列表相關資訊的符號。
運動補償裝置30可對針對每一變換單元而剖析的變換係數執行逆量化以及逆變換以復原空間域中的留數。
運動補償裝置30可經由運動補償來復原空間域的影像,在運動補償中,參考區塊是藉由每一分區的留數來補償。對於作為B片段的當前分區的運動補償,運動補償裝置30可參考L0列表及L1列表中的至少一者中所包含的第一所復原影像來判斷參考影像且自所述參考影像判斷由運動向量指示的參考區塊。藉由將留數與所判斷的參考區塊相加,可產生經重新建構的區塊。
運動補償裝置30可關於空間域的經重新建構的區塊而執行解區塊濾波以及樣本適應性偏移(sample adaptive offset, SAO)操作,以藉此減小經重新建構的區塊與原始區塊之間的誤差。經重新建構的區塊可用作用於下一區塊的預測的參考區塊。
因此,可在執行運動補償裝置30的運動補償之後執行視訊壓縮解碼。
為了輸出視訊解碼結果,運動補償裝置30可結合內部安裝的視訊解碼處理器或外部視訊解碼處理器操作以藉此執行包含運動補償的視訊解碼操作。運動補償裝置30的內部視訊解碼處理器可由額外處理器實施,且根據一或多個實施例,中央處理單元或圖形計算元件可驅動視訊解碼處理模組以藉此執行基本視訊解碼操作。
下文中,將參看圖4來詳細描述由運動預測裝置20傳輸且由運動補償裝置30剖析的幀間預測相關資訊的語法。
圖4說明幀間預測索引資訊的兩個例示性實施例。
在當前影像為B片段類型時,幀間預測索引資訊inter_pred_idc 45可指示B片段類型中的區塊的參考圖像列表為L0列表、L1列表還是雙向預測列表。
nPbW及nPbH分別表示當前預測單元的水平及垂直尺寸。因此,當預測單元的水平及垂直尺寸的總和(nPbW+nPbH)為12(如預測單元尺寸4×8或8×4的狀況)時,雙向預測列表幀間預測可不允許用於B片段類型的預測單元。因此,當水平及垂直尺寸的總和為12時,可關於B片段類型的預測單元而判斷指示L0預測Pred_L0以及L1預測Pred_L1中的一者的幀間預測索引資訊45。
當預測單元的水平及垂直尺寸的總和並非12時,可判斷指示L0預測Pred_L0、L1預測Pred_L1以及雙向預測Pred_BI中的一者的幀間預測索引資訊45。
因此,當作為B片段類型的當前預測單元的水平及垂直尺寸的總和並非12時,運動預測裝置20可將指示L0預測Pred_L0、L1預測Pred_L1以及雙向預測Pred_BI中的一者的幀間預測索引資訊45包含至位元串流的預測單元欄位中。然而,當作為B片段類型的當前預測單元的水平及垂直尺寸的總和為12時,運動預測裝置20可將指示L0預測Pred_L0以及L1預測Pred_L1中的一者的幀間預測索引資訊45編碼於位元串流的預測單元欄位中。
舉例而言,當作為B片段類型的當前預測單元的水平及垂直尺寸的總和並非12時,運動預測裝置20可將指示L0預測Pred_L0的「00」、指示L1預測Pred_L1的「01」或指示雙向預測Pred_BI的「1」作為幀間預測索引資訊45輸出。然而,當作為B片段類型的當前預測單元的水平及垂直尺寸的總和為12時,運動預測裝置20可將指示L0預測Pred_L0的「0」或指示L1預測Pred_L1的「1」作為幀間預測索引資訊45輸出。
當自位元串流的預測單元欄位剖析根據本揭露的另一實施例的幀間預測索引資訊45且當前預測單元的水平及垂直尺寸的總和並非12時,運動補償裝置30可自幀間預測索引資訊45讀取L0預測Pred_L0、L1預測Pred_L1以及雙向預測Pred_BI中的一者。然而,在當前預測單元的水平及垂直尺寸的總和為12時,可自幀間預測索引資訊45讀取L0預測Pred_L0以及L1預測Pred_L1中的一者。
舉例而言,當作為B片段類型的當前預測單元的水平及垂直尺寸的總和並非12時,運動補償裝置30可在幀間預測索引資訊45為「00」時將幀間預測模式判斷為L0預測(Pred_L0),在幀間預測索引資訊45為「01」時將幀間預測模式判斷為L1預測Pred_L1,且在幀間預測索引資訊45為「1」時將幀間預測模式判斷為雙向預測Pred_B1。在當前預測單元的水平及垂直尺寸的總和為12時,運動補償裝置30可在幀間預測索引資訊45為「0」時將幀間預測模式判斷為L0預測Pred_L0,且在幀間預測索引資訊45為「1」時將幀間預測模式判斷為L1預測Pred_L1。
且,基於雙向預測限制資訊,當作為B片段類型的當前預測單元的水平及垂直尺寸的總和為12時,運動補償裝置30可判斷是否限制使用雙向預測列表的幀間預測。可基於雙向預測限制資訊來判斷剖析預測單元的2位元幀間預測索引資訊還是1位元幀間預測索引資訊。當關於水平及垂直尺寸的總和為12的預測單元而限制使用雙向預測列表的幀間預測時,將1位元剖析為當前預測單元的幀間預測索引資訊,但當不限制使用雙向預測列表的幀間預測時,可剖析2位元。
因此,當預測單元的尺寸為4×8或8×4時,運動預測裝置20可跳過指示用於雙向幀間預測的參考圖像列表為雙向預測列表的符號寫碼。由於跳過傳輸與不必要的參考圖像列表相關的資訊的操作,因此可減少傳輸位元量。同樣,當預測單元的尺寸為4×8或8×4時,運動補償裝置30跳過檢查用於雙向幀間預測的參考圖像列表是否為雙向預測列表的操作,且因此資料剖析操作亦可減少。
如上所述,在根據上文參看圖1A至圖4而描述的各種實施例的參考影像判斷裝置10、運動預測裝置20以及運動補償裝置30中針對在具有樹狀結構的寫碼單元中判斷的每一分區而執行運動預測以及運動補償。下文中,將參看圖5至圖17來描述根據一或多個實施例的基於具有樹狀結構的寫碼單元的視訊編碼方法以及視訊解碼方法。
圖5為根據一或多個實施例的涉及基於具有樹狀結構的寫碼單元的視訊預測的視訊編碼裝置100的方塊圖。
根據一或多個實施例的涉及基於具有樹狀結構的寫碼單元的視訊預測的視訊編碼裝置100包含最大寫碼單元分割器110、寫碼單元判斷器120以及輸出單元130。下文中,為便於描述,涉及基於具有樹狀結構的寫碼單元的視訊預測的視訊編碼裝置100將被稱為「視訊編碼裝置100」。
寫碼單元判斷器120可基於影像的當前圖像的最大寫碼單元來分割當前圖像。若當前圖像大於最大寫碼單元,則當前圖像的影像資料可分割為至少一個最大寫碼單元。根據一或多個實施例的最大寫碼單元可為尺寸為32×32、64×64、128×128、256×256等的資料單元,其中資料單元的形狀是寬度以及長度為2的平方的正方形。
根據一或多個實施例的寫碼單元可藉由最大尺寸以及深度來表徵。深度表示寫碼單元自最大寫碼單元在空間上分割的次數,且隨著深度加深,根據深度的較深編碼單元可自最大寫碼單元分割為最小寫碼單元。最大寫碼單元的深度為最上層深度,且最小寫碼單元的深度為最下層深度。由於對應於每一深度的寫碼單元的尺寸隨著最大寫碼單元的深度加深而減小,因此對應於較上層深度的寫碼單元可包含對應於較下層深度的多個寫碼單元。
如上所述,當前圖像的影像資料根據寫碼單元的最大尺寸而分割為最大寫碼單元,且最大寫碼單元中的每一者可包含根據深度而分割的較深寫碼單元。由於根據一或多個實施例的最大寫碼單元是根據深度來分割,因此包含於最大寫碼單元中的空間域的影像資料可根據深度而階層式分類。
限制最大寫碼單元的高度以及寬度階層式分割的總次數的寫碼單元的最大深度以及最大尺寸可為預定的。
寫碼單元判斷器120對藉由根據深度來分割最大寫碼單元的區域而獲得的至少一個分割區域做編碼,且判斷深度以根據所述至少一個分割區域來輸出最終編碼的影像資料。換言之,寫碼單元判斷器120藉由根據當前圖像的最大寫碼單元來對根據深度的較深寫碼單元中的影像資料做編碼以及選擇具有最小編碼誤差的深度來判斷經寫碼的深度。
所判斷的經寫碼的深度以及根據所判斷的經寫碼的深度的經編碼的影像資料輸出至輸出單元130。
基於對應於等於或低於最大深度的至少一個深度的較深寫碼單元而對最大寫碼單元中的影像資料做編碼,且基於較深寫碼單元中的每一者而比較對影像資料做編碼的結果。可在比較較深寫碼單元的編碼誤差之後選擇具有最小編碼誤差的深度。可針對每一最大寫碼單元選擇至少一個經寫碼的深度。
隨著寫碼單元根據深度而階層式分割,且隨著寫碼單元的數目增大,最大寫碼單元的尺寸被分割。且,即使寫碼單元對應於一個最大寫碼單元中的同一深度,仍藉由獨立量測每一寫碼單元的影像資料的編碼誤差而判斷是否將對應於同一深度的寫碼單元中的每一者分割為較下層深度。因此,即使當影像資料包含於一個最大寫碼單元中時,影像資料仍根據深度分割為區域且編碼誤差仍可根據所述一個最大寫碼單元中的區域而不同,且因此經寫碼的深度可根據影像資料中的區域而不同。因此,可在一個最大寫碼單元中判斷一或多個經寫碼的深度,且可根據至少一個經寫碼的深度的寫碼單元而分割最大寫碼單元的影像資料。
因此,寫碼單元判斷器120可判斷包含於最大寫碼單元中的具有樹狀結構的寫碼單元。根據一或多個實施例的「具有樹狀結構的寫碼單元」包含最大寫碼單元中所包含的所有較深寫碼單元中的對應於判斷為經寫碼的深度的深度的寫碼單元。可根據最大寫碼單元的同一區域中的深度而階層式判斷經寫碼的深度的寫碼單元,且可在不同區域中獨立地進行判斷。類似地,可獨立於另一區域中的經寫碼的深度而判斷當前區域中的經寫碼的深度。
根據一或多個實施例的最大深度為與自最大寫碼單元至最小寫碼單元的分割次數相關的索引。根據一或多個實施例的第一最大深度可表示自最大寫碼單元至最小寫碼單元的總分割次數。根據一或多個實施例的第二最大深度可表示自最大寫碼單元至最小寫碼單元的總深度層級數。舉例而言,當最大寫碼單元的深度為0時,最大寫碼單元被分割一次的寫碼單元的深度可設定為1,且最大寫碼單元被分割兩次的寫碼單元的深度可設定為2。此處,若最小寫碼單元為最大寫碼單元被分割四次的寫碼單元,則存在深度0、1、2、3以及4的5個深度層級,且因此第一最大深度可設定為4,且第二最大深度可設定為5。
可根據最大寫碼單元執行預測編碼以及變換。根據最大寫碼單元,亦基於根據等於最大深度的深度或小於最大深度的深度的較深寫碼單元來執行預測編碼以及變換。可根據正交變換或整數變換的方法而執行變換。
由於每當根據深度來分割最大寫碼單元,較深寫碼單元的數目便增大,因此對隨著深度加深而產生的所有較深寫碼單元執行包含預測編碼以及變換的編碼。為便於描述,在至少一個最大寫碼單元中,現將基於當前深度的寫碼單元來描述預測編碼以及變換。
視訊編碼裝置100可按各種方式選擇用於對影像資料做編碼的資料單元的尺寸或形狀。為了對影像資料做編碼,執行諸如預測編碼、變換以及熵編碼的操作,且此時,同一資料單元可用於所有操作或不同資料單元可用於每一操作。
舉例而言,視訊編碼裝置100可不僅選擇用於對影像資料做編碼的寫碼單元,而且選擇不同於寫碼單元的資料單元,以便對寫碼單元中的影像資料執行預測編碼。
為了在最大寫碼單元中執行預測編碼,可基於對應於經寫碼的深度的寫碼單元(亦即,基於不再分割為對應於較下層深度的寫碼單元的寫碼單元)來執行預測編碼。下文中,不再分割且變為用於預測編碼的基礎單元的寫碼單元現將被稱為「預測單元」。藉由分割預測單元而獲得的分區可包含藉由分割預測單元的高度以及寬度中的至少一者而獲得的預測單元或資料單元。分區可為呈寫碼單元的預測單元的分割形式的資料單元,且預測單元可為尺寸與寫碼單元相同的分區。
舉例而言,當2N×2N(其中N為正整數)的寫碼單元不再分割且變為2N×2N的預測單元,分區的尺寸可為2N×2N、2N×N、N×2N或N×N。分區類型的實例包含藉由對稱地分割預測單元的高度或寬度而獲得的對稱分區、藉由非對稱地分割預測單元的高度或寬度(諸如,1:n或n:1)而獲得的分區、藉由用幾何方式分割預測單元而獲得的分區,以及具有任意形狀的分區。
預測單元的預測模式可為幀內模式、幀間模式以及跳過模式中的至少一者。舉例而言,可對2N×2N、2N×N、N×2N或N×N的分區執行幀內模式或幀間模式。且,可僅對2N×2N的分區執行跳過模式。在寫碼單元中對一個預測單元獨立地執行編碼,藉此選擇具有最小編碼誤差的預測模式。
視訊編碼裝置100亦可不僅基於用於對影像資料做編碼的寫碼單元而且基於不同於寫碼單元的資料單元而對寫碼單元中的影像資料執行變換。為了在寫碼單元中執行變換,可基於具有小於等於寫碼單元的尺寸的資料單元來執行變換。舉例而言,用於變換的資料單元可包含用於幀內模式的資料單元以及用於幀間模式的資料單元。
類似於根據一或多個實施例的具有樹狀結構的寫碼單元,寫碼單元中的變換單元按遞迴方式進一步分割為較小變換單元,以使得寫碼單元的殘餘資料亦可根據具有根據變換深度的樹狀結構的變換單元而分割。
亦可在變換單元中設定指示藉由分割寫碼單元的高度以及寬度而達到變換單元的分割次數的變換深度。舉例而言,在2N×2N的當前寫碼單元中,當變換單元的尺寸為2N×2N時,變換深度可為0,當變換單元的尺寸為N×N時,變換深度可為1,且當變換單元的尺寸為N/2×N/2時,變換深度可為2。換言之,可根據變換深度而設定具有樹狀結構的變換單元。
根據對應於經寫碼的深度的寫碼單元的編碼資訊不僅需要關於經寫碼的深度的資訊,而且需要與預測編碼以及變換相關的資訊。因此,寫碼單元判斷器120不僅判斷具有最小編碼誤差的經寫碼的深度,而且判斷預測單元中的分區類型、根據預測單元的預測模式,以及用於變換的變換單元的尺寸。
稍後將參看圖7至圖17來詳細描述根據本揭露的實施例的判斷最大寫碼單元中的根據樹狀結構的寫碼單元及預測單元/分區以及變換單元的多種方法中的一者。
寫碼單元判斷器120可藉由基於拉格朗日乘數(Lagrangian multiplier)使用位元率-失真最佳化(Rate-Distortion Optimization)來量測根據深度的較深寫碼單元的編碼誤差。
輸出單元130按照位元串流的形式輸出基於由寫碼單元判斷器120判斷的至少一個經寫碼的深度而編碼的最大寫碼單元的影像資料,以及根據經寫碼的深度關於編碼模式的資訊。
可藉由對影像的殘餘資料做編碼來獲得經編碼的影像資料。
根據經寫碼的深度關於編碼模式的資訊可包含關於經寫碼的深度、關於預測單元中的分區類型、預測模式以及變換單元的尺寸的資訊。
可藉由使用根據深度的分割資訊來定義關於經寫碼的深度的資訊,根據深度的分割資訊指示是否對較下層深度而非當前深度的寫碼單元執行編碼。若當前寫碼單元的當前深度為經寫碼的深度,則對當前寫碼單元中的影像資料做編碼且輸出,且因此,分割資訊可定義為不將當前寫碼單元分割為較下層深度。或者,若當前寫碼單元的當前深度並非經寫碼的深度,則對較下層深度的寫碼單元執行編碼,且因此分割資訊可定義為分割當前寫碼單元以獲得較下層深度的寫碼單元。
若當前深度並非經寫碼的深度,則對分割為較下層深度的寫碼單元的寫碼單元執行編碼。由於較下層深度的至少一個寫碼單元存在於當前深度的一個寫碼單元中,因此對較下層深度的每一寫碼單元重複地執行編碼,且因此可對具有同一深度的寫碼單元按遞迴方式執行編碼。
由於針對一個最大寫碼單元而判斷具有樹狀結構的寫碼單元,且針對經寫碼的深度的寫碼單元而判斷關於至少一個編碼模式的資訊,因此可針對一個最大寫碼單元而判斷關於至少一個編碼模式的資訊。且,最大寫碼單元的寫碼單元的經寫碼的深度可根據寫碼單元的位置而不同,此是因為根據深度而階層式分割最大寫碼單元中的寫碼單元,且因此可針對寫碼單元而設定關於經寫碼的深度以及編碼模式的資訊。
因此,輸出單元130可將關於對應經寫碼的深度以及編碼模式的編碼資訊指派給包含於最大寫碼單元中的寫碼單元、預測單元以及最小單元中的至少一者。
根據一或多個實施例的最小單元為藉由將構成最下層深度的最小寫碼單元分割為4份而獲得的矩形資料單元。或者,最小單元可為可包含於最大寫碼單元中所包含的所有寫碼單元、預測單元、分區單元以及變換單元中的最大矩形資料單元。
舉例而言,經由輸出單元130而輸出的編碼資訊可分類為根據具有經寫碼的深度的寫碼單元的編碼資訊,以及根據預測單元的編碼資訊。根據具有經寫碼的深度的寫碼單元的編碼資訊可包含關於預測模式以及關於分區的尺寸的資訊。根據預測單元而傳輸的編碼資訊可包含關於幀間模式的估計方向、關於幀間模式的參考影像索引、關於運動向量、關於幀內模式的色度分量以及關於幀內模式的內插方法的資訊。
且,關於根據圖像、片段或圖像群(groups of pictures, GOP)而定義的寫碼單元的最大尺寸的資訊,以及關於最大深度的資訊可插入至位元串流的標頭、序列參數集合(sequence parameter set, SPS)或圖像參數集合(picture parameter set, PPS)中。
且,關於當前視訊而允許的關於變換單元的最大尺寸的資訊以及關於變換單元的最小尺寸的資訊亦可經由位元串流的標頭、SPS或PPS而輸出。輸出單元130可對與預測相關的參考資訊、預測資訊、片段類型資訊或其類似者進行編碼及輸出。
在根據實施例的視訊編碼裝置100中,較深寫碼單元可為藉由將較上層深度的寫碼單元(其為上一層)的高度或寬度劃分為2份而獲得的寫碼單元。換言之,在當前深度的寫碼單元的尺寸為2N×2N時,較下層深度的寫碼單元的尺寸為N×N。且,尺寸為2N×2N的當前深度的寫碼單元可包含較下層深度的最多4個寫碼單元。
因此,視訊編碼裝置100可藉由基於考慮當前圖像的特性而判斷的最大寫碼單元的尺寸以及最大深度,藉由針對每一最大寫碼單元判斷具有最佳形狀以及最佳尺寸的寫碼單元而形成具有樹狀結構的寫碼單元。且,由於藉由使用各種預測模式以及變換中的任一者對每一最大寫碼單元執行編碼,因此可考慮各種影像尺寸的寫碼單元的特性來判斷最佳編碼模式。
因此,若在習知巨集區塊中對具有高解析度或大資料量的影像做編碼,則每圖像的巨集區塊的數目過度地增大。因此,針對每一巨集區塊產生的壓縮資訊的段數增大,且因此難以傳輸壓縮資訊,且資料壓縮效率降低。然而,藉由使用視訊編碼裝置100,因為在考慮影像的尺寸而增大寫碼單元的最大尺寸的同時考慮影像的特性而調整寫碼單元,所以可提高影像壓縮效率。
視訊編碼裝置100可根據上文參看圖2A及圖2B而描述的運動預測方法來判斷參考圖像列表以執行幀間預測。
寫碼單元判斷器120可針對每一最大寫碼單元針對具有樹狀結構的每一寫碼單元而判斷用於幀間預測的預測單元,且可針對每一預測單元及其分區執行幀間預測。
寫碼單元判斷器120關於視訊的影像而判斷用於時間預測的參考影像。參考影像判斷裝置10判斷指示當前影像與相鄰影像之間的時間距離、留數或其類似者的預測資訊。因此,可藉由使用預測資訊而不是整體影像資料來記錄影像資訊。
寫碼單元判斷器120可判斷寫碼單元中所包含的預測單元的尺寸,且關於當前預測單元而判斷執行幀內預測還是幀間預測。在當前片段為B片段時,可判斷待用於當前預測單元的幀間預測的參考列表。亦即,可判斷指示參考列表為L0列表、L1列表或雙向預測列表的幀間預測索引。
在根據一或多個實施例的當前預測單元的尺寸為4×8或8×4時,幀間預測索引可指示L0列表及L1列表中的一者的參考圖像列表。在根據一或多個實施例的當前預測單元的尺寸並非4×8或8×4時,幀間預測索引可指示L0列表、L1列表及雙向預測列表中的一者的參考圖像列表。
輸出單元130可將雙向預測限制資訊包含至片段標頭中,所述雙向預測限制資訊指示關於當前片段中的4×8或8×4尺寸的預測單元是否允許進行包含L0列表及L1列表的雙向預測列表用於當前預測單元的幀間預測。
輸出單元130可對根據當前預測單元的尺寸而判斷的幀間預測索引資訊與參考索引資訊及運動向量差資訊進行編碼及輸出。
在根據一或多個實施例的當前預測單元的尺寸為4×8或8×4時,可跳過關於指示參考圖像列表為雙向預測列表的資訊的二進位化操作。
寫碼單元判斷器120可判斷指示參考索引以及當前影像與周邊影像之間的時間距離、留數或其類似者的預測資訊。
圖6為根據一或多個實施例的涉及基於具有樹狀結構的寫碼單元的視訊預測的視訊解碼裝置200的方塊圖。
視訊解碼裝置200包含接收器210、影像資料以及編碼資訊提取器220以及影像資料解碼器230。下文中,為便於描述,根據一或多個實施例的涉及基於具有樹狀結構的寫碼單元的視訊預測的視訊解碼裝置200將被稱為「視訊解碼裝置200」。
用於視訊解碼裝置200的各種解碼操作的各種術語(諸如,寫碼單元、深度、預測單元、變換單元以及關於各種編碼模式的資訊)的定義與參看圖5且參考視訊編碼裝置100所述的術語相同。
接收器210接收且剖析經編碼的視訊的位元串流。影像資料以及編碼資訊提取器220自所剖析的位元串流提取每一寫碼單元的經編碼的影像資料,其中寫碼單元具有根據每一最大寫碼單元的樹狀結構,且將所提取的影像資料輸出至影像資料解碼器230。影像資料以及編碼資訊提取器220可自關於當前圖像的標頭、SPS或PPS提取關於當前圖像的寫碼單元的最大尺寸的資訊。
且,影像資料以及編碼資訊提取器220自所剖析的位元串流針對具有根據每一最大寫碼單元的樹狀結構的寫碼單元提取關於經寫碼的深度以及編碼模式的資訊。關於經寫碼的深度以及編碼模式的所提取的資訊輸出至影像資料解碼器230。換言之,位元串流中的影像資料分割為最大寫碼單元,以使得影像資料解碼器230對每一最大寫碼單元的影像資料做解碼。
可針對關於對應於經寫碼的深度的至少一個寫碼單元的資訊而設定根據最大寫碼單元關於經寫碼的深度以及編碼模式的資訊,且關於編碼模式的資訊可包含關於對應於經寫碼的深度的對應寫碼單元的分區類型、關於預測模式以及變換單元的尺寸的資訊。且,可將根據深度的分割資訊作為關於經寫碼的深度的資訊來提取。
由影像資料以及編碼資訊提取器220提取的根據每一最大寫碼單元關於經寫碼的深度以及編碼模式的資訊為關於經判斷以在諸如視訊編碼裝置100的編碼器根據每一最大寫碼單元對根據深度的每一較深寫碼單元重複地執行編碼時產生最小編碼誤差的經寫碼的深度以及編碼模式的資訊。因此,視訊解碼裝置200可藉由根據產生最小編碼誤差的經寫碼的深度以及編碼模式來對影像資料做解碼而復原影像。
由於關於經寫碼的深度以及編碼模式的編碼資訊可指派給對應寫碼單元、預測單元以及最小單元中的預定資料單元,因此影像資料以及編碼資訊提取器220可提取根據預定資料單元關於經寫碼的深度以及編碼模式的資訊。被指派關於經寫碼的深度以及編碼模式的相同資訊的預定資料單元可推斷為包含於同一最大寫碼單元中的資料單元。
影像資料解碼器230可藉由基於根據最大寫碼單元關於經寫碼的深度以及編碼模式的資訊對每一最大寫碼單元中的影像資料做解碼來復原當前圖像。換言之,影像資料解碼器230可基於關於每一最大寫碼單元中所包含的具有樹狀結構的寫碼單元中的每一寫碼單元的分區類型、預測模式以及變換單元的所提取的資訊而對經編碼的影像資料做解碼。解碼程序可包含:包含幀內預測以及運動補償的預測;以及逆變換。
影像資料解碼器230可基於根據經寫碼的深度關於每一寫碼單元的預測單元的分區類型以及預測模式的資訊根據所述寫碼單元的分區以及預測模式來執行幀內預測或運動補償。
且,影像資料解碼器230可基於根據經寫碼的深度關於寫碼單元的變換單元的尺寸的資訊根據寫碼單元中的每一變換單元來執行逆變換,以便根據最大寫碼單元來執行逆變換。可藉由逆變換來復原寫碼單元的空間域的像素值。
影像資料解碼器230可藉由使用根據深度的分割資訊而判斷當前最大寫碼單元的至少一個經寫碼的深度。若分割資訊指示影像資料在當前深度中不再分割,則當前深度為經寫碼的深度。因此,影像資料解碼器230可針對對應於經寫碼的深度的每一寫碼單元藉由使用關於預測單元的分區類型、預測模式以及變換單元的尺寸的資訊來對當前最大寫碼單元中的經編碼的影像資料做解碼。
換言之,可藉由觀測針對寫碼單元、預測單元以及最小單元中的預定資料單元而指派的編碼資訊集合來收集含有包含相同分割資訊的編碼資訊的資料單元,且可將所收集的資料單元視為影像資料解碼器230在同一編碼模式中解碼的一個資料單元。針對以上述方式判斷的每一寫碼單元而獲得關於編碼模式的資訊,以便執行當前寫碼單元的解碼。
且,視訊解碼裝置200可藉由根據上文參看圖3A及圖3B而描述的運動補償方法自參考圖像列表判斷參考索引而執行運動補償。
在當前片段為B片段時,影像資料以及編碼資訊提取器220可自位元串流剖析指示區塊的參考圖像列表、參考索引、運動向量或其類似者的幀間索引資訊。可基於幀間索引資訊而判斷用於運動補償的當前預測單元使用的參考列表的類型。
影像資料解碼器230可針對每一最大寫碼單元針對具有樹狀結構的每一寫碼單元而判斷用於運動補償的預測單元,且可針對每一預測單元及其分區執行運動補償。
影像資料解碼器230可在判斷寫碼單元中所包含的預測單元時判斷預測單元的尺寸。可基於預測單元的尺寸而不同地讀取幀間索引資訊。
在當前預測單元的尺寸為4×8或8×4時,影像資料解碼器230可基於幀間預測索引資訊而將當前預測單元的參考圖像列表判斷為L0列表及L1列表中的一者。可自幀間預測索引資訊讀取除雙向預測列表之外的參考圖像列表。
若當前預測單元的尺寸並非4×8或8×4,則影像資料解碼器230可基於幀間預測索引資訊而將當前預測單元的參考圖像列表判斷為L0列表、L1列表及雙向預測列表中的一者。
影像資料以及編碼資訊提取器220可自片段標頭剖析雙向預測限制資訊,其指示關於4×8或8×4尺寸的預測單元是否允許進行雙向預測列表用於當前預測單元的幀間預測。因此,基於雙向預測限制資訊,在當前片段中,可判斷關於4×8或8×4尺寸的預測單元是否允許進行雙向預測列表用於當前預測單元的幀間預測。且,提取器220可基於所剖析的雙向預測限制資訊來判斷剖析預測單元的2位元幀間預測索引資訊還是1位元幀間預測索引資訊。
且,在當前預測單元的尺寸為4×8或8×4時,提取器220可跳過自剖析自位元串流的二進位化位元串讀取指示參考圖像列表為雙向預測列表的資訊的操作。
在當前預測單元的尺寸為4×8或8×4時,提取器220可自幀間預測索引資訊讀取除雙向預測列表之外的參考圖像列表。且,在當前預測單元的尺寸為4×8或8×4時,提取器220亦可跳過檢查幀間預測索引資訊是否為雙向預測列表的操作。
影像資料解碼器230可自屬於參考圖像列表的參考圖像判斷由參考索引指示的參考圖像,且在參考圖像中判斷由運動向量指示的參考區塊。影像資料解碼器230可藉由對參考區塊補償留數而復原當前區塊。
圖7為用於描述根據一或多個實施例的寫碼單元的概念的圖式。
寫碼單元的尺寸可用寬度×高度來表達,且可為64×64、32×32、16×16以及8×8。64×64的寫碼單元可分割為64×64、64×32、32×64或32×32的分區,且32×32的寫碼單元可分割為32×32、32×16、16×32或16×16的分區,16×16的寫碼單元可分割為16×16、16×8、8×16或8×8的分區,且8×8的寫碼單元可分割為8×8、8×4、4×8或4×4的分區。
根據一或多個實施例的用於幀間預測的分區可不包含4×4尺寸的分區。
在視訊資料310中,解析度為1920×1080,寫碼單元的最大尺寸為64,且最大深度為2。在視訊資料320中,解析度為1920×1080,寫碼單元的最大尺寸為64,且最大深度為3。在視訊資料330中,解析度為352×288,寫碼單元的最大尺寸為16,且最大深度為1。圖7所示的最大深度表示自最大寫碼單元至最小解碼單元的總分割次數。
若解析度高或資料量大,則寫碼單元的最大尺寸可為大的,以便不僅提高編碼效率而且準確地反映影像的特性。因此,具有高於視訊資料330的解析度的視訊資料310以及320的寫碼單元的最大尺寸可為64。
由於視訊資料310的最大深度為2,因此視訊資料310的寫碼單元315可包含長軸尺寸為64的最大寫碼單元,以及長軸尺寸為32以及16的寫碼單元,此是因為深度藉由分割最大寫碼單元兩次而加深為兩層。同時,由於視訊資料330的最大深度為1,因此視訊資料330的寫碼單元335可包含長軸尺寸為16的最大寫碼單元,以及長軸尺寸為8的寫碼單元,此是因為深度藉由分割最大寫碼單元一次而加深為一層。
由於視訊資料320的最大深度為3,因此視訊資料320的寫碼單元325可包含長軸尺寸為64的最大寫碼單元,以及長軸尺寸為32、16以及8的寫碼單元,此是因為深度藉由分割最大寫碼單元三次而加深為三層。隨著深度加深,可精確地表達詳細資訊。
圖8為根據一或多個實施例的基於寫碼單元的影像編碼器400的方塊圖。
影像編碼器400執行視訊編碼裝置100的寫碼單元判斷器120的操作以對影像資料做編碼。換言之,幀內預測器410對當前幀405中的處於幀內模式中的寫碼單元執行幀內預測,且運動估計器420以及運動補償器425藉由使用當前幀405以及參考幀495而對當前幀405中的處於幀間模式中的寫碼單元執行幀間估計以及運動補償。
自幀內預測器410、運動估計器420以及運動補償器425輸出的資料經由變換器430以及量化器440作為經量化的變換係數而輸出。經量化的變換係數經由逆量化器460以及逆變換器470復原為空間域中的資料,且空間域中的所復原的資料在經由解區塊單元480以及SAO操作器490後處理之後作為參考幀495輸出。經量化的變換係數可經由熵編碼器450作為位元串流455輸出。
為了使影像編碼器400應用於視訊編碼裝置100中,影像編碼器400的所有部件(亦即,幀內預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、逆量化器460、逆變換器470、解區塊單元480以及SAO操作器490)在考慮每一最大寫碼單元的最大深度的同時基於具有樹狀結構的寫碼單元中的每一寫碼單元來執行操作。
具體言之,幀內預測器410、運動估計器420以及運動補償器425在考慮當前最大寫碼單元的最大尺寸以及最大深度的同時判斷具有樹狀結構的寫碼單元中的每一寫碼單元的分區以及預測模式,且變換器430判斷具有樹狀結構的寫碼單元中的每一寫碼單元中的變換單元的尺寸。
運動估計器420以及運動補償器425可基於上文參看圖1A至圖3B而描述的幀間預測方法來判斷參考索引,且可藉由使用來自對應於參考索引的參考圖像列表的參考圖像來執行幀間預測。
圖9為根據一或多個實施例的基於寫碼單元的影像解碼器500的方塊圖。
剖析器510自位元串流505剖析待解碼的經編碼的影像資料以及解碼所需的關於編碼的資訊。經編碼的影像資料經由熵解碼器520以及逆量化器530作為經逆量化的資料而輸出,且經逆量化的資料經由逆變換器540而復原為空間域中的影像資料。
幀內預測器550關於空間域中的影像資料對處於幀內模式中的寫碼單元執行幀內預測,且運動補償器560藉由使用參考幀585對處於幀間模式中的寫碼單元執行運動補償。
通過幀內預測器550以及運動補償器560的空間域中的影像資料可在經由解區塊單元570以及SAO操作器580後處理之後作為所復原的幀595輸出。且,經由解區塊單元570以及SAO操作器580後處理的影像資料可作為參考幀585輸出。
為了在視訊解碼裝置200的影像資料解碼器230中對影像資料做解碼,影像解碼器500可執行在剖析器510之後執行的操作。
為了使影像解碼器500應用於視訊解碼裝置200中,影像解碼器500的所有部件(亦即,剖析器510、熵解碼器520、逆量化器530、逆變換器540、幀內預測器550、運動補償器560、解區塊單元570以及SAO操作器580)針對每一最大寫碼單元基於具有樹狀結構的寫碼單元來執行操作。
具體言之,幀內預測器550以及運動補償器560針對具有樹狀結構的寫碼單元中的每一者而判斷分區以及預測模式,且逆變換器540針對每一寫碼單元而判斷變換單元的尺寸。
運動補償器560可基於上文參看圖1A及圖3B而描述的幀間預測方法來判斷參考索引,且可藉由使用來自對應於參考索引的參考圖像列表的參考圖像來執行運動補償。
圖10為說明根據一或多個實施例的根據深度的較深寫碼單元以及分區的圖式。
視訊編碼裝置100以及視訊解碼裝置200使用階層式寫碼單元以便考慮影像的特性。可根據影像的特性來適應性地判斷寫碼單元的最大高度、最大寬度以及最大深度,或可由使用者不同地進行設定。可根據寫碼單元的預定最大尺寸判斷根據深度的較深寫碼單元的尺寸。
根據一或多個實施例,在寫碼單元的階層式結構600中,寫碼單元的最大高度以及最大寬度各為64,且最大深度為3。由於深度沿著階層式結構600的垂直軸加深,因此將較深寫碼單元的高度以及寬度各自分割。且,沿著階層式結構600的水平軸展示作為用於每一較深寫碼單元的預測編碼的基礎的預測單元以及分區。
換言之,寫碼單元610為階層式結構600中的最大寫碼單元,其中深度為0且尺寸(亦即,高度乘寬度)為64×64。深度沿著垂直軸而加深,且存在尺寸為32×32且深度為1的寫碼單元620、尺寸為16×16且深度為2的寫碼單元630以及尺寸為8×8且深度為3的寫碼單元640。尺寸為8×8且深度為3的寫碼單元640為最小寫碼單元。
寫碼單元的預測單元以及分區根據每一深度沿著水平軸而配置。換言之,若尺寸為64×64且深度為0的寫碼單元610為預測單元,則預測單元可分割為包含於編碼單元610中的分區,亦即,尺寸為64×64的分區610、尺寸為64×32的分區612、尺寸為32×64的分區614或尺寸為32×32的分區616。
類似地,尺寸為32×32且深度為1的寫碼單元620的預測單元可分割為包含於寫碼單元620中的分區,亦即,尺寸為32×32的分區620、尺寸為32×16的分區622、尺寸為16×32的分區624以及尺寸為16×16的分區626。
類似地,尺寸為16×16且深度為2的寫碼單元630的預測單元可分割為包含於寫碼單元630中的分區,亦即,包含於寫碼單元中的尺寸為16×16的分區630、尺寸為16×8的分區632、尺寸為8×16的分區634以及尺寸為8×8的分區636。
類似地,尺寸為8×8且深度為3的寫碼單元640的預測單元可分割為包含於寫碼單元640中的分區,亦即,包含於寫碼單元中的尺寸為8×8的分區640、尺寸為8×4的分區642、尺寸為4×8的分區644以及尺寸為4×4的分區646。
根據一或多個實施例的用於幀間預測的分區可不包含尺寸為4×4的分區646。
為了判斷構成最大寫碼單元610的寫碼單元的至少一個經寫碼的深度,視訊編碼裝置100的寫碼單元判斷器120對包含於最大寫碼單元610中的對應於每一深度的寫碼單元執行編碼。
隨著深度加深,包含相同範圍中的資料以及相同尺寸的根據深度的較深寫碼單元的數目增大。舉例而言,需要對應於深度2的四個寫碼單元來涵蓋包含於對應於深度1的一個寫碼單元中的資料。因此,為了比較根據深度的相同資料的編碼結果,將對應於深度1的寫碼單元以及對應於深度2的四個寫碼單元各自編碼。
為了針對深度中的當前深度執行編碼,沿著階層式結構600的水平軸,可藉由針對對應於當前深度的寫碼單元中的每一預測單元執行編碼而針對當前深度選擇最小編碼誤差。或者,可藉由比較根據深度的最小編碼誤差、藉由隨著深度沿著階層式結構600的垂直軸加深而針對每一深度執行編碼來搜尋最小編碼誤差。可選擇寫碼單元610中具有最小編碼誤差的深度以及分區作為寫碼單元610的經寫碼的深度以及分區類型。
圖11為用於描述根據一或多個實施例的寫碼單元710與變換單元720之間的關係的圖式。
視訊編碼裝置100或200針對每一最大寫碼單元根據具有小於或等於最大寫碼單元的尺寸的寫碼單元來對影像做編碼或解碼。可基於不大於對應寫碼單元的資料單元而選擇在編碼期間用於變換的變換單元的尺寸。
舉例而言,在視訊編碼裝置100或視訊解碼裝置200中,若寫碼單元710的尺寸為64×64,則可藉由使用尺寸為32×32的變換單元720來執行變換。
且,可藉由對尺寸為小於64×64的32×32、16×16、8×8以及4×4的變換單元中的每一者執行變換而對尺寸為64×64的寫碼單元710的資料做編碼,且接著可選擇具有最小寫碼誤差的變換單元。
圖12為用於描述根據一或多個實施例的對應於經寫碼的深度的寫碼單元的編碼資訊的圖式。
視訊編碼裝置100的輸出單元130可對關於分區類型的資訊800、關於預測模式的資訊810,以及關於對應於經寫碼的深度的每一寫碼單元的變換單元的尺寸的資訊820做編碼且作為關於編碼模式的資訊而傳輸。
資訊800指示關於藉由分割當前寫碼單元的預測單元而獲得的分區的形狀的資訊,其中分區為用於當前寫碼單元的預測編碼的資料單元。舉例而言,尺寸為2N×2N的當前寫碼單元CU_0可分割為尺寸為2N×2N的分區802、尺寸為2N×N的分區804、尺寸為N×2N的分區806以及尺寸為N×N的分區808中的任一者。此處,關於分區類型的資訊800設定為指示尺寸為2N×N的分區804、尺寸為N×2N的分區806以及尺寸為N×N的分區808中的一者。
資訊810指示每一分區的預測模式。舉例而言,資訊810可指示對由資訊800指示的分區執行的預測編碼的模式,亦即,幀內模式812、幀間模式814或跳過模式816。
資訊820指示待基於何時對當前寫碼單元執行變換的變換單元。舉例而言,變換單元可為第一幀內變換單元822、第二幀內變換單元824、第一幀間變換單元826或第二幀間變換單元828。
根據每一較深寫碼單元,視訊解碼裝置200的影像資料以及編碼資訊提取器220可提取且使用資訊800、810以及820以用於解碼。
圖13為根據一或多個實施例的根據深度的較深寫碼單元的圖式。
分割資訊可用以指示深度的改變。分割資訊指示當前深度的寫碼單元是否分割為較下層深度的寫碼單元。
用於深度為0且尺寸為2N_0×2N_0的寫碼單元900的預測編碼的預測單元910可包含尺寸為2N_0×2N_0的分區類型912、尺寸為2N_0×N_0的分區類型914、尺寸為N_0×2N_0的分區類型916以及尺寸為N_0×N_0的分區類型918的分區。圖13僅說明藉由對稱地分割預測單元910而獲得的分區類型912至918,但分區類型不限於此,且預測單元910的分區可包含非對稱分區、具有預定形狀的分區以及具有幾何形狀的分區。
根據每一分區類型,對尺寸為2N_0×2N_0的一個分區、尺寸為2N_0×N_0的兩個分區、尺寸為N_0×2N_0的兩個分區以及尺寸為N_0×N_0的四個分區重複地執行預測編碼。可對尺寸為2N_0×2N_0、N_0×2N_0、2N_0×N_0以及N_0×N_0的分區執行在幀內模式以及幀間模式中的預測編碼。僅對尺寸為2N_0×2N_0的分區執行在跳過模式中的預測編碼。
若編碼誤差在分區類型912至916中的一者中最小,則預測單元910可能不分割為較下層深度。
若編碼誤差在分區類型918中最小,則深度自0改變為1以在操作920中分割分區類型918,且對深度為2且尺寸為N_0×N_0的寫碼單元930重複地執行編碼以搜尋最小編碼誤差。
用於深度為1且尺寸為2N_1×2N_1(=N_0×N_0)的寫碼單元930的預測編碼的預測單元940可包含尺寸為2N_1×2N_1的分區類型942、尺寸為2N_1×N_1的分區類型944、尺寸為N_1×2N_1的分區類型946以及尺寸為N_1×N_1的分區類型948的分區。
若編碼誤差在分區類型948中最小,則深度自1改變為2以在操作950中分割分區類型948,且對深度為2且尺寸為N_2×N_2的寫碼單元960重複地執行編碼以搜尋最小編碼誤差。
當最大深度為d時,可執行根據每一深度的分割操作直至深度變為d-1時,且可對分割資訊做編碼直至深度為0至d-2中的一者時。換言之,當執行編碼直至在對應於深度d-2的寫碼單元在操作970中分割之後深度為d-1時,用於深度為d-1且尺寸為2N_(d-1)×2N_(d-1)的寫碼單元980的預測編碼的預測單元990可包含尺寸為2N_(d-1)×2N_(d-1)的分區類型992、尺寸為2N_(d-1)×N_(d-1)的分區類型994、尺寸為N_(d-1)×2N_(d-1)的分區類型996以及尺寸為N_(d-1)×N_(d-1)的分區類型998的分區。
可對分區類型992至998中的尺寸為2N_(d-1)×2N_(d-1)的一個分區、尺寸為2N_(d-1)×N_(d-1)的兩個分區、尺寸為N_(d-1)×2N_(d-1)的兩個分區、尺寸為N_(d-1)×N_(d-1)的四個分區重複地執行預測編碼以搜尋具有最小編碼誤差的分區類型。
即使當分區類型998具有最小編碼誤差時,由於最大深度為d,因此不再將深度為d-1的寫碼單元CU_(d-1)分割為較下層深度,且將構成當前最大寫碼單元900的寫碼單元的經寫碼的深度判斷為d-1,且可將當前最大寫碼單元900的分區類型判斷為N_(d-1)×N_(d-1)。且,由於最大深度為d,因此不設定用於寫碼單元952的分割資訊。
資料單元999可為當前最大寫碼單元的「最小單元」。根據一或多個實施例的最小單元可為藉由將最小寫碼單元980分割為4份而獲得的矩形資料單元。藉由重複地執行編碼,視訊編碼裝置100可藉由根據寫碼單元900的深度比較編碼誤差而選擇具有最小編碼誤差的深度以判斷經寫碼的深度,且將對應分區類型以及預測模式設定為經寫碼的深度的編碼模式。
因而,在所有深度1至d中比較根據深度的最小編碼誤差,且可將具有最小編碼誤差的深度判斷為經寫碼的深度。可對經寫碼的深度、預測單元的分區類型以及預測模式做編碼且作為關於編碼模式的資訊而傳輸。且,由於寫碼單元自深度0分割為經寫碼的深度,因此僅經寫碼的深度的分割資訊設定為0,且排除經寫碼的深度的深度的分割資訊設定為1。
視訊解碼裝置200的影像資料以及編碼資訊提取器220可提取且使用關於寫碼單元900的經寫碼的深度以及預測單元的資訊以對分區912做解碼。視訊解碼裝置200可藉由使用根據深度的分割資訊而將分割資訊為0的深度判斷為經寫碼的深度,且使用關於對應深度的編碼模式的資訊以用於解碼。
圖14至圖16為用於描述根據一或多個實施例的寫碼單元1010、預測單元1060與變換單元1070之間的關係的圖式。
寫碼單元1010為在最大寫碼單元中對應於由視訊編碼裝置100判斷的經寫碼的深度的具有樹狀結構的寫碼單元。預測單元1060為寫碼單元1010中的每一者的預測單元的分區,且變換單元1070為寫碼單元1010中的每一者的變換單元。
當最大寫碼單元的深度在寫碼單元1010中為0時,寫碼單元1012以及1054的深度為1,寫碼單元1014、1016、1018、1028、1050以及1052的深度為2,寫碼單元1020、1022、1024、1026、1030、1032以及1048的深度為3,且寫碼單元1040、1042、1044以及1046的深度為4。
在預測單元1060中,藉由在編碼單元1010中分割寫碼單元而獲得一些編碼單元1014、1016、1022、1032、1048、1050、1052以及1054。換言之,寫碼單元1014、1022、1050以及1054中的分區類型的尺寸為2N×N,寫碼單元1016、1048以及1052中的分區類型的尺寸為N×2N,且寫碼單元1032的分區類型的尺寸為N×N。寫碼單元1010的預測單元以及分區小於等於每一寫碼單元。
對小於寫碼單元1052的資料單元中的變換單元1070中的寫碼單元1052的影像資料執行變換或逆變換。且,變換單元1070中的寫碼單元1014、1016、1022、1032、1048、1050、1052以及1054的尺寸以及形狀不同於預測單元1060中的寫碼單元。換言之,視訊編碼裝置100以及視訊解碼裝置200可對同一寫碼單元中的資料單元個別地執行幀內預測、運動估計、運動補償、變換以及逆變換。
因此,對在最大寫碼單元的每一區域中具有階層式結構的寫碼單元中的每一者以遞迴方式執行編碼以判斷最佳寫碼單元,且因此可獲得具有遞迴樹狀結構的寫碼單元。編碼資訊可包含關於寫碼單元的分割資訊、關於分區類型的資訊、關於預測模式的資訊,以及關於變換單元的尺寸的資訊。表1展示可由視訊編碼裝置100以及視訊解碼裝置200設定的編碼資訊。 表1
視訊編碼裝置100的輸出單元130可輸出關於具有樹狀結構的寫碼單元的編碼資訊,且視訊解碼裝置200的影像資料以及編碼資訊提取器220可自所接收的位元串流提取關於具有樹狀結構的寫碼單元的編碼資訊。
分割資訊指示當前寫碼單元是否分割為較下層深度的寫碼單元。若當前深度d的分割資訊為0,則當前寫碼單元不再分割為較下層深度的深度為經寫碼的深度,且因此可針對經寫碼的深度而定義關於分區類型、預測模式以及變換單元的尺寸的資訊。若根據分割資訊進一步分割當前寫碼單元,則對較下層深度的四個分割寫碼單元獨立地執行編碼。
預測模式可為幀內模式、幀間模式以及跳過模式中的一者。可在所有分區類型中定義幀內模式以及幀間模式,且僅在尺寸為2N×2N的分區類型中定義跳過模式。
關於分區類型的資訊可指示:尺寸為2N×2N、2N×N、N×2N以及N×N的對稱分區類型,其是藉由對稱地分割預測單元的高度或寬度而獲得;以及尺寸為2N×nU、2N×nD、nL×2N以及nR×2N的非對稱分區類型,其是藉由非對稱地分割預測單元的高度或寬度而獲得。可藉由以1:3以及3:1分割預測單元的高度而分別獲得尺寸為2N×nU以及2N×nD的非對稱分區類型,且可藉由以1:3以及3:1分割預測單元的寬度而分別獲得尺寸為nL×2N以及nR×2N的非對稱分區類型。
變換單元的尺寸可在幀內模式中設定為兩種類型且在幀間模式中設定為兩種類型。換言之,若變換單元的分割資訊為0,則變換單元的尺寸可為2N×2N,此為當前寫碼單元的尺寸。若變換單元的分割資訊為1,則可藉由分割當前寫碼單元而獲得變換單元。且,若尺寸為2N×2N的當前寫碼單元的分區類型為對稱分區類型,則變換單元的尺寸可為N×N,且若當前寫碼單元的分區類型為非對稱分區類型,則變換單元的尺寸可為N/2×N/2。
關於具有樹狀結構的寫碼單元的編碼資訊可包含對應於經寫碼的深度的寫碼單元、預測單元以及最小單元中的至少一者。對應於經寫碼的深度的寫碼單元可包含含有相同編碼資訊的預測單元以及最小單元中的至少一者。
因此,藉由比較鄰近資料單元的編碼資訊而判斷鄰近資料單元是否包含於對應於經寫碼的深度的同一寫碼單元中。且,藉由使用資料單元的編碼資訊而判斷對應於經寫碼的深度的對應寫碼單元,且因此可判斷最大寫碼單元中的經寫碼的深度的分佈。
因此,若基於鄰近資料單元的編碼資訊而預測當前寫碼單元,則可直接參考且使用鄰近於當前寫碼單元的較深寫碼單元中的資料單元的編碼資訊。
或者,若基於鄰近資料單元的編碼資訊而預測當前寫碼單元,則使用資料單元的經編碼的資訊而搜尋鄰近於當前寫碼單元的資料單元,且可參考所搜尋的鄰近寫碼單元以用於預測當前寫碼單元。
圖17為用於描述根據表1的編碼模式資訊的寫碼單元、預測單元或分區與變換單元之間的關係的圖式。
最大寫碼單元1300包含經寫碼的深度的寫碼單元1302、1304、1306、1312、1314、1316以及1318。此處,由於寫碼單元1318為經寫碼的深度的寫碼單元,因此分割資訊可設定為0。關於尺寸為2N×2N的寫碼單元1318的分區類型的資訊可設定為尺寸為2N×2N的分區類型1322、尺寸為2N×N的分區類型1324、尺寸為N×2N的分區類型1326、尺寸為N×N的分區類型1328、尺寸為2N×nU的分區類型1332、尺寸為2N×nD的分區類型1334、尺寸為nL×2N的分區類型1336以及尺寸為nR×2N的分區類型1338中的一者。
變換單元(transformation unit, TU)的分割資訊(TU尺寸旗標)為一種類型的變換索引,且對應於變換索引的變換單元的尺寸可根據寫碼單元的預測單元類型或分區類型而改變。
當分區類型設定為對稱(亦即,分區類型1322、1324、1326或1328)時,若變換單元的分割資訊(TU尺寸旗標)為0,則設定尺寸為2N×2N的變換單元1342,且若TU尺寸旗標為1,則設定尺寸為N×N的變換單元1344。
當分區類型設定為非對稱(亦即,分區類型1332、1334、1336或1338)時,若TU尺寸旗標為0,則設定尺寸為2N×2N的變換單元1352,且若TU尺寸旗標為1,則設定尺寸為N/2×N/2的變換單元1354。
參看圖17,TU尺寸旗標為具有值0或1的旗標,但TU尺寸旗標不限於1個位元,且變換單元可在TU尺寸旗標自0增大時階層式分割為具有樹狀結構。TU尺寸旗標可用作變換索引的例示性實施例。
根據一或多個實施例,在此狀況下,藉由將變換單元的TU尺寸旗標與變換單元的最大尺寸及最小尺寸一起使用,可表達已實際使用的變換單元的尺寸。根據一或多個實施例,視訊編碼裝置100能夠對最大變換單元尺寸資訊、最小變換單元尺寸資訊以及最大TU尺寸旗標做編碼。對最大變換單元尺寸資訊、最小變換單元尺寸資訊以及最大TU尺寸旗標做編碼的結果可插入至SPS中。根據一或多個實施例,視訊解碼裝置200可藉由使用最大變換單元尺寸資訊、最小變換單元尺寸資訊以及最大TU尺寸旗標來對視訊做解碼。
舉例而言,(a)若當前寫碼單元的尺寸為64×64且最大變換單元尺寸為32×32,則(a-1)當TU尺寸旗標為0時,變換單元的尺寸可為32×32,(a-2)當TU尺寸旗標為1時,變換單元的尺寸可為16×16,且(a-3)當TU尺寸旗標為2時,變換單元的尺寸可為8×8。
作為另一實例,(b)若當前寫碼單元的尺寸為32×32且最小變換單元尺寸為32×32,則(b-1)當TU尺寸旗標為0時,變換單元的尺寸可為32×32。此時,TU尺寸旗標無法設定為除0之外的值,此是因為變換單元的尺寸無法小於32×32。
作為另一實例,(c)若當前寫碼單元的尺寸為64×64且最大TU尺寸旗標為1,則TU尺寸旗標可為0或1。此時,TU尺寸旗標無法設定為除0或1之外的值。
因此,若定義最大TU尺寸旗標為「MaxTransformSizeIndex」、最小變換單元尺寸為「MinTransformSize」且在TU尺寸旗標為0時的變換單元尺寸為「RootTuSize」,則可在當前寫碼單元中判斷的當前最小變換單元尺寸「CurrMinTuSize」可由方程式(1)來定義: CurrMinTuSize = max(MinTransformSize, RootTuSize/(2^MaxTransformSizeIndex)) …....  (1)
與可在當前寫碼單元中判斷的當前最小變換單元尺寸「CurrMinTuSize」相比,在TU尺寸旗標為0時的變換單元尺寸「RootTuSize」可表示可在系統中選擇的最大變換單元尺寸。在方程式(1)中,「RootTuSize/(2^MaxTransformSizeIndex)」表示在TU尺寸旗標為0時的變換單元尺寸「RootTuSize」分割對應於最大TU尺寸旗標的次數時的變換單元尺寸,且「MinTransformSize」表示最小變換尺寸。因此,「RootTuSize/(2^MaxTransformSizeIndex)」以及「MinTransformSize」中的較小值可為可在當前寫碼單元中判斷的當前最小變換單元尺寸「CurrMinTuSize」。
根據一或多個實施例,最大變換單元尺寸RootTuSize可根據預測模式的類型而變化。
舉例而言,若當前預測模式為幀間模式,則可藉由使用下文方程式(2)來判斷「RootTuSize」。在方程式(2)中,「MaxTransformSize」表示最大變換單元尺寸,且「PUSize」表示當前預測單元尺寸。 RootTuSize = min(MaxTransformSize, PUSize) ......... (2)
亦即,若當前預測模式為幀間模式,則在TU尺寸旗標為0時的變換單元尺寸「RootTuSize」可為最大變換單元尺寸以及當前預測單元尺寸中的較小值。
若當前分區單元的預測模式為幀內模式,則可藉由使用下文方程式(3)來判斷「RootTuSize」。在方程式(3)中,「PartitionSize」表示當前分區單元的尺寸。 RootTuSize = min(MaxTransformSize, PartitionSize) ...........(3)
亦即,若當前預測模式為幀內模式,則在TU尺寸旗標為0時的變換單元尺寸「RootTuSize」可為最大變換單元尺寸以及當前分區單元的尺寸中的較小值。
然而,根據分區單元的預測模式的類型而變化的當前最大變換單元尺寸「RootTuSize」僅為一實例,且本揭露不限於此。
根據上文參看圖5至圖17而描述的基於具有樹狀結構的寫碼單元的視訊編碼方法,針對具有樹狀結構的每一寫碼單元而對空間域的影像資料做編碼,且由於根據基於具有樹狀結構的寫碼單元的視訊解碼方法針對每一最大寫碼單元而執行解碼,因此復原空間域的影像資料。因此,可復原圖像或視訊(其為圖像序列)。所復原的視訊可藉由使用再生裝置來再生,儲存於儲存媒體中或經由網路而傳輸。
本揭露的實施例可寫為電腦程式,且可在使用電腦可讀記錄媒體執行程式的通用數位電腦中實施。電腦可讀記錄媒體的實例包含磁性儲存媒體(例如,ROM、軟碟、硬碟等)以及光學記錄媒體(例如,CD-ROM或DVD)。
為便於描述,上文參看圖1A至圖17而描述的根據幀間預測方法、運動預測方法以及運動補償方法的視訊編碼方法將稱為「根據本揭露的視訊編碼方法」。且,上文參看圖1A至圖20而描述的根據幀間預測方法以及運動補償方法的視訊解碼方法將稱為「根據本揭露的視訊解碼方法」。
且,包含上文參看圖1A至圖20而描述的參考影像判斷裝置10、運動預測裝置20、運動補償裝置30、視訊編碼裝置100或影像編碼器400的視訊編碼裝置將稱為「根據本揭露的視訊編碼裝置」。且,包含參考影像判斷裝置10、運動補償裝置30、視訊解碼裝置200或影像解碼器500的視訊解碼裝置將稱為「根據本揭露的視訊解碼裝置」。
下文中,將描述包含光碟26000作為儲存程式的電腦可讀儲存媒體的一或多個實施例。
圖18說明根據一或多個實施例的儲存程式的光碟26000的實體結構。描述為儲存媒體的光碟26000的實例可為硬碟機(hard drive)、緊密光碟-唯讀記憶體(compact disk-read only memory, CD-ROM)光碟、藍光光碟(Blu-ray disk)或數位多功能光碟(digital versatile disk, DVD)。光碟26000包含多個同心磁軌Tr,其分割為在圓周方向上的預定數目的磁區Se。在儲存根據上述實施例的程式的光碟26000的預定區域中,可分配且儲存用於執行上述幀間預測方法、視訊編碼方法以及視訊解碼方法的程式。
下文將參看圖19來描述電腦系統,所述電腦系統是藉由使用儲存媒體來體現的,所述儲存媒體儲存用於執行上述視訊編碼方法以及視訊解碼方法的程式。
圖19說明用於藉由使用光碟26000而記錄以及讀取程式的光碟機26800。電腦系統26700可將用於執行視訊編碼方法以及視訊解碼方法中的至少一者的程式儲存於光碟26000中。為了在電腦系統26700上執行儲存於光碟26000中的程式,可經由光碟機26800而自光碟26000讀取程式,並將其傳輸至電腦系統26700。
執行根據本揭露的實施例的視訊編碼方法以及視訊解碼方法中的至少一者的程式可不僅儲存於圖18及圖19所說明的光碟26000中,而且儲存於記憶卡、ROM卡匣(ROM cassette)或固態磁碟(solid state drive, SSD)中。
下文將描述應用了根據本揭露的實施例的視訊編碼方法以及視訊解碼方法的系統。
圖20說明根據一或多個實施例的用於提供內容散佈服務的內容供應系統11000的整體結構。通信系統的服務區域劃分為具有預定尺寸的小區,且無線基地台11700、11800、11900以及12000分別安裝於所述小區中。
內容供應系統11000包含多個獨立元件。舉例而言,諸如電腦12100、個人數位助理(personal digital assistant, PDA)12200、攝影機12300以及行動電話12500的所述多個獨立元件經由網際網路服務供應商11200、通信網路11400、無線基地台11700、11800、11900以及12000而連接至網際網路11100。
然而,內容供應系統11000不限於圖20所說明的結構,且多個元件可選擇性連接至所述內容供應系統。獨立元件亦可直接連接至通信網路11400,而不是經由無線基地台11700、11800、11900以及12000來連接。
視訊攝影機12300為能夠拍攝視訊影像的影像攝取元件,例如,數位視訊攝影機。行動電話12500可使用各種協定中的至少一種通信方法,諸如,個人數位通信(Personal Digital Communications, PDC)、分碼多重存取(Code Division Multiple Access, CDMA)、寬頻分碼多重存取(Wideband-Code Division Multiple Access, W-CDMA)、全球行動通信系統(Global System for Mobile Communications, GSM)以及個人手持電話系統(Personal Handyphone System, PHS)。
視訊攝影機12300可經由無線基地台11900以及通信網路11400而連接至串流伺服器11300。串流伺服器11300允許經由視訊攝影機12300自使用者接收的內容經由即時廣播(real-time broadcast)而串流傳輸。可使用視訊攝影機12300或串流伺服器11300來對自視訊攝影機12300接收的內容做編碼。可將藉由使用視訊攝影機12300而攝取的視訊資料經由電腦12100傳輸至串流伺服器11300。
亦可將由相機12600攝取的視訊資料經由電腦12100傳輸至串流伺服器11300。相機12600為類似於數位相機能夠攝取靜態影像與視訊影像兩者的影像攝取元件。可使用相機12600或電腦12100來對藉由使用相機12600而攝取的視訊資料做編碼。執行視訊編碼以及解碼的軟體可儲存於可由電腦12100存取的電腦可讀記錄媒體中,電腦可讀記錄媒體例如為CD-ROM光碟、軟碟(floppy disc)、硬碟機、SSD或記憶卡。
若視訊資料是藉由使用內建於行動電話12500中的相機攝取,則可自行動電話12500接收視訊資料。
視訊資料亦可由安裝於視訊攝影機12300、行動電話12500或相機12600中的大型積體電路(large scale integrated circuit, LSI)系統編碼。
在內容供應系統11000中,可對由使用者使用視訊攝影機12300、相機12600、行動電話12500或另一影像攝取元件進行記錄而獲得的內容(例如,音樂會的記錄的內容)做編碼,且將所述內容傳輸至串流伺服器11300。串流伺服器11300可將內容資料作為串流傳輸至已請求內容資料的其他用戶端。
用戶端為能夠對經編碼的內容資料做解碼的元件,且,可為(例如)電腦12100、PDA 12200、視訊攝影機12300或行動電話12500。因此,內容供應系統11000允許用戶端接收並再生經編碼的內容資料。且,內容供應系統11000允許用戶端接收經編碼的內容資料並即時地對經編碼的內容資料做解碼以及再生經編碼的內容資料,藉此實現個人廣播。
根據本揭露的實施例的視訊編碼裝置以及視訊解碼裝置可應用於內容供應系統11000中所包含的獨立元件的編碼以及解碼操作中。
現將參看圖21及圖22來詳細描述根據一或多個實施例的內容供應系統11000的行動電話12500。
圖21說明應用了根據本揭露的實施例的視訊編碼方法以及視訊解碼方法的行動電話12500的外部結構。行動電話12500可為智慧型電話,其功能不受限制,且其大量功能可被修改或擴展。
行動電話12500可包含內部天線12510,可經由內部天線12510而與無線基地台12000交換RF信號,且行動電話12500包含用於顯示藉由使用相機12530而拍攝的影像或經由天線12510而接收並被解碼的影像的顯示螢幕12520,例如,液晶顯示器(liquid crystal display, LCD)或有機發光二極體(organic light-emitting diode, OLED)螢幕。行動電話12500包含操作面板12540,其包含控制按鈕或觸控面板。當顯示螢幕12520為觸控螢幕時,操作面板12540更包含顯示螢幕12520的觸摸感測面板。行動電話12500包含用於輸出語音或聲音的揚聲器12580或另一類型的聲音輸出單元,以及用於輸入語音或聲音的麥克風12550或另一類型的聲音輸入單元。行動電話12500更包含相機12530(諸如,電荷耦合元件(charge-coupled device, CCD)相機)以攝取視訊或靜態影像。且,行動電話12500可包含:儲存媒體12570,用於儲存經編碼或經解碼的資料,諸如,藉由使用相機12530來拍攝而獲得、經由電子郵件而接收或以其他方式獲得的視訊或靜態影像;以及插槽12560,儲存媒體12570經由插槽12560而裝載至行動電話12500中。儲存媒體12570可為快閃記憶體,諸如,安全數位(secure digital, SD)卡或嵌入於塑膠外殼中的電可抹除可程式化唯讀記憶體(electrically erasable and programmable read only memory, EEPROM)。
圖22說明行動電話12500的內部結構。為了系統地控制包含顯示螢幕12520以及操作面板12540的行動電話12500的每一部分,電力供應電路12700、操作輸入控制單元12640、影像編碼單元12720、相機介面12630、LCD控制單元12620、影像解碼單元12690、多工器/解多工器12680、記錄/讀取單元12670、調變/解調變單元12660以及聲音處理器12650經由同步匯流排12730而連接至中央控制器12710。
當使用者操作電源按鈕以自「電源關閉」狀態設定至「電源開啟」狀態時,電力供應電路12700可將電力自電池組(battery pack)供應至行動電話12500的每一部分,藉此將行動電話12500設定於操作模式。
中央控制器12710包含中央處理單元(central processing unit, CPU)、唯讀記憶體(read only memory, ROM)以及隨機存取記憶體(random access memory, RAM)。
雖然行動電話12500將通信資料傳輸至外部,但數位資料根據中央控制器12710的控制而產生於行動電話12500中。舉例而言,數位聲音信號可產生於聲音處理器12650中,且數位影像信號可產生於影像編碼單元12720中,且訊息的文字資料可經由操作面板12540以及操作輸入控制單元12640而產生。在數位信號根據中央控制器12710的控制而傳輸至調變/解調變單元12660時,調變/解調變單元12660可調變數位信號的頻帶,且通信電路12610可對經頻帶調變的數位聲音信號執行數位至類比轉換以及頻率轉換。自通信電路12610輸出的傳輸信號可經由天線12510而傳輸至語音通信基地台或無線基地台12000。
舉例而言,在行動電話12500處於交談模式時,藉由使用麥克風12550而獲得的聲音信號根據中央控制器12710的控制而由聲音處理器12650變換為數位聲音信號。數位聲音信號可經由調變/解調變單元12660以及通信電路12610而變換為傳輸信號,且可經由天線12510而傳輸。
當在資料通信模式中傳輸文字訊息(諸如,電子郵件)時,文字訊息的文字資料藉由使用操作面板12540而輸入,且經由操作輸入控制單元12640而傳輸至中央控制器12710。根據中央控制器12710的控制,文字資料經由調變/解調變單元12660以及通信單元12610變換為傳輸信號,且經由天線12510而傳輸至無線基地台12000。
為了在資料通信模式中傳輸影像資料,藉由使用相機12530來拍攝而獲得的影像資料經由相機介面12630而提供至影像編碼單元12720。藉由使用相機12530來拍攝而獲得的影像資料可經由相機介面12630以及LCD控制單元12620而直接顯示於顯示螢幕12520上。
影像編碼單元12720的結構可對應於上文所述的根據本揭露的實施例的影像編碼裝置100的結構。影像編碼單元12720可藉由使用上文所述的根據本揭露的實施例的視訊編碼方法而對由相機12530提供的影像資料做編碼以將影像資料變換為經壓縮且編碼的影像資料,且接著將經編碼的影像資料輸出至多工器/解多工器12680。在相機12530的記錄操作期間,經由行動電話12500的麥克風12550而獲得的聲音信號亦可經由聲音處理器12650而變換為數位聲音資料,且所述數位聲音資料可傳輸至多工器/解多工器12680。
多工器/解多工器12680將由影像編碼單元12720提供的經編碼的影像資料以及由聲音處理器12650提供的聲音資料一起多工。經多工的資料可經由調變/解調變單元12660以及通信電路12610而變換為傳輸信號,且可經由天線12510而傳輸。
在行動電話12500自外部接收通信信號時,藉由執行頻率恢復以及類比至數位轉換(analog-to-digital conversion, ADC),將經由天線12510而接收的信號變換為數位信號。調變/解調變單元12660調變數位信號的頻帶。經頻帶調變的數位信號根據數位信號的類型而傳輸至視訊解碼單元12690、聲音處理器12650或LCD控制單元12620。
在交談模式中,行動電話12500放大經由天線12510而接收的信號,且藉由頻率轉換以及ADC而產生數位聲音信號。根據中央控制器12710的控制,所接收的數位聲音信號經由調變/解調變單元12660以及聲音處理器12650而變換為類比聲音信號,且所述類比聲音信號經由揚聲器12580而輸出。
當在資料通信模式中接收在網際網路網站上存取的視訊檔案的資料時,將經由天線12510而自無線基地台12000接收的信號經由調變/解調變單元12660作為經多工的資料而輸出,且將經多工的資料傳輸至多工器/解多工器12680。
為了對經由天線12510而接收的經多工的資料做解碼,多工器/解多工器12680將經多工的資料解多工為經編碼的視訊資料串流以及經編碼的音訊資料串流。經由同步匯流排12730,將經編碼的視訊資料串流提供至視訊解碼單元12690,且將經編碼的音訊資料串流提供至聲音處理器12650。
影像解碼單元12690的結構可對應於上文所述的根據本揭露的實施例的影像解碼裝置的結構。藉由使用上文所述的根據本揭露的實施例的視訊解碼方法,影像解碼單元12690可對經編碼的視訊資料做解碼以產生所復原的視訊資料且經由LCD控制單元12620而將所復原的視訊資料提供至顯示螢幕12520。
因此,在網際網路網站上存取的視訊檔案的視訊資料可顯示於顯示螢幕12520上。同時,聲音處理器12650亦可將音訊資料變換為類比聲音信號,且將類比聲音信號提供至揚聲器12580。因此,在網際網路網站上存取的視訊檔案中所含有的音訊資料亦可經由揚聲器12580而再生。
行動電話12500或其他類型的通信終端機可為包含根據本揭露的實施例的視訊編碼裝置與視訊解碼裝置兩者的傳輸/接收終端機,或為僅包含視訊編碼裝置的傳輸終端機,或為僅包含視訊解碼裝置接收終端機。
根據本揭露的實施例的通信系統不限於參看圖20而描述的上述結構。舉例而言,圖23說明根據一或多個實施例的應用了根據一或多個實施例的通信系統的數位廣播系統。圖23的數位廣播系統可藉由使用根據本揭露的實施例的視訊編碼裝置或視訊解碼裝置而接收經由衛星或地面網路傳輸的數位廣播。
詳言之,廣播站12890經由無線電波而將視訊資料串流傳輸至通信衛星或廣播衛星12900。廣播衛星12900傳輸廣播信號,且廣播信號經由每個家庭中的天線12860而由衛星廣播接收器接收。在每個家庭中,經編碼的視訊串流可藉由使用電視接收器12810、機上盒(set-top box)12870或另一元件來解碼而再生。
在根據本揭露的實施例的視訊解碼裝置實施於再生裝置12830中時,再生裝置12830可對記錄於儲存媒體12820(諸如,光碟或記憶卡)上的經編碼的視訊串流進行讀取以及解碼。因此,所復原的視訊信號可再生於(例如)監視器12840上。
根據本揭露的實施例的視訊解碼裝置亦可安裝於連接至用於接收衛星/地面廣播的天線12860或用於接收有線電視廣播的電纜天線12850的機上盒12870中。自機上盒12870輸出的資料亦可再生於電視監視器12880上。
或者,根據本揭露的實施例的視訊解碼裝置可安裝於電視接收器12810而非機上盒12870上。
包含合適天線12910的汽車12920可接收由衛星12800或圖21的無線基地台11700傳輸的信號。經解碼的視訊可再生於安裝於汽車12920中的汽車導航系統12930的顯示螢幕上。
視訊信號可藉由使用根據本揭露的實施例的視訊編碼裝置來編碼且記錄並儲存於儲存媒體中。詳言之,影像信號可藉由使用DVD記錄器而儲存於DVD光碟12960中或可藉由使用硬碟記錄器12950而儲存於硬碟中。或者,視訊信號可儲存於SD卡12970中。當硬碟記錄器12950包含根據本揭露的實施例的視訊解碼裝置時,DVD光碟12960、SD卡12970或另一類型的儲存媒體中所記錄的視訊信號可再生於電視監視器12880上。
汽車導航系統12930可能不包含圖23的相機12530、相機介面12630以及影像編碼單元12720。舉例而言,電腦12100以及電視接收器12810亦可不包含圖23的相機12530、相機介面12630以及影像編碼單元12720。
圖24說明根據一或多個實施例的使用視訊編碼裝置以及視訊解碼裝置的雲端計算系統的網路結構。
根據本揭露的當前實施例的雲端計算系統可包含雲端計算伺服器14000、使用者資料庫(database, DB)14100、多個計算資源14200以及使用者終端機。
雲端計算系統根據使用者終端機的請求而經由資料通信網路(例如,網際網路)提供計算資源的應需委外服務(on-demand outsourcing service)。在雲端計算環境中,服務提供商藉由使用虛擬化技術來整合位於不同實體位置處的資料中心的計算資源而向使用者提供所請求的服務。代替藉由將計算資源(諸如,應用程式、儲存器、作業系統(operating system, OS)或安全特徵或其類似)安裝於使用者的終端機上來使用所述計算資訊,服務使用者可視需要且在所要時間點選擇並使用藉由使用虛擬化技術而產生的虛擬空間中的服務。
預定服務使用者的使用者終端機經由資料通信網路(包含網際網路以及行動通信網路)而連接至雲端計算伺服器14000。可自雲端計算伺服器14000對使用者終端機提供雲端計算服務且特定言之視訊再生服務。使用者終端機可為可連接至網際網路的任何電子元件,例如,桌上型PC 14300、智慧型電視 14400、智慧型電話14500、膝上型電腦14600、攜帶型多媒體播放器(portable multimedia player, PMP)14700或平板型PC 14800。
雲端計算伺服器14000可整合雲端網路中所分散的多個計算資源14200且向使用者終端機提供整合的計算資源14200。多個計算資源14200包含各種資料服務,且可包含自使用者終端機上傳的資料。以此方式,雲端計算伺服器14000可藉由使用虛擬化技術來整合分散於不同區域中的視訊資料庫而提供使用者終端機所請求的服務。
在使用者DB 14100中,儲存了已預訂雲端計算服務的使用者的使用者資訊。使用者資訊可包含登錄資訊以及個人信用資訊,諸如,地址及姓名。且,使用者資訊可包含視訊的索引。索引可包含已完全再生的視訊的列表、正再生的視訊的列表以及再生的視訊的暫停點(pausing point)及其類似者。
關於儲存於使用者DB 14100中的視訊的資訊可在使用者元件之間共用。舉例而言,在預定視訊服務根據膝上型電腦14600的再生請求而提供至膝上型電腦14600時,預定視訊服務的再生歷史儲存於使用者DB 14100中。在自智慧型電話14500接收到對再生所述視訊服務的請求時,雲端計算伺服器14000藉由參考使用者DB 14100而搜尋並再生此視訊服務。在智慧型電話14500經由雲端計算伺服器14000而接收視訊資料串流時,藉由對視訊資料串流做解碼而再生視訊的操作類似於上文參看圖21而描述的行動電話12500的操作。
雲端計算伺服器14000可參考儲存於使用者DB 14100中的預定視訊服務的再生歷史。舉例而言,雲端計算伺服器14000自使用者終端機接收對再生儲存於使用者DB 14100中的視訊的請求。若正再生此視訊,則由雲端計算伺服器14000執行的串流傳輸此視訊的方法可根據來自使用者終端機的請求(亦即,根據將始於視訊的開始還是其暫停點而再生視訊)而變化。舉例而言,若使用者終端機請求自視訊的開始再生視訊,則雲端計算伺服器14000自視訊的第一幀開始而將視訊的串流資料傳輸至使用者終端機。另一方面,若終端機請求自視訊的暫停點開始再生視訊,則雲端計算伺服器14000自對應於暫停點的幀開始而將視訊的串流資料傳輸至使用者終端機。
此處,使用者終端機可包含上文參看圖1A至圖17而描述的根據本揭露的實施例的視訊解碼裝置。根據另一實施例,使用者終端機可包含上文參看圖1A至圖17而描述的根據本揭露的實施例的視訊編碼裝置。且,使用者終端機可包含上文參看圖1A至圖17而描述的視訊編碼裝置與視訊解碼裝置兩者。
上文參看圖18至圖24而描述上文參看圖1A至圖17而描述的視訊編碼方法及視訊解碼方法以及根據本揭露的視訊編碼裝置及視訊解碼裝置的各種應用實例。然而,將上文參看圖1A至圖17而描述的視訊編碼方法以及視訊解碼方法儲存於儲存媒體中的方法或將視訊編碼裝置以及視訊解碼裝置實施於元件中的方法不限於圖18至圖24的實施例。
儘管已參考本發明的較佳實施例特定地展示且描述了本發明,但一般熟習此項技術者將理解,在不脫離如由所附申請專利範圍界定的本發明的精神以及範疇的情況下,可對本發明進行形式以及細節上的各種改變。較佳實施例應僅在描述性意義上考慮且並非用於限制目的。因此,本發明的範疇並非由本發明的詳細描述界定而是由隨附申請專利範圍界定,且在此範疇內的所有差異將解釋為包含於本揭露中。
10‧‧‧參考影像判斷裝置
11‧‧‧操作
12‧‧‧參考圖像列表判斷單元
13‧‧‧操作
14‧‧‧參考索引判斷單元
15‧‧‧操作
17‧‧‧操作
20‧‧‧運動預測裝置
21‧‧‧操作
22‧‧‧運動預測單元
23‧‧‧操作
24‧‧‧幀間預測資訊輸出單元
30‧‧‧運動補償裝置
31‧‧‧操作
32‧‧‧幀間預測資訊獲得單元
33‧‧‧操作
34‧‧‧運動補償單元
45‧‧‧幀間預測索引資訊
100‧‧‧視訊編碼裝置
110‧‧‧最大寫碼單元分割器
120‧‧‧寫碼單元判斷器
130‧‧‧輸出單元
200‧‧‧視訊解碼裝置
210‧‧‧接收器
220‧‧‧影像資料以及編碼資訊提取器
230‧‧‧影像資料解碼器
310‧‧‧視訊資料
315‧‧‧寫碼單元
320‧‧‧視訊資料
325‧‧‧寫碼單元
330‧‧‧視訊資料
335‧‧‧寫碼單元
400‧‧‧影像編碼器
405‧‧‧當前幀
410‧‧‧幀內預測器
420‧‧‧運動估計器
425‧‧‧運動補償器
430‧‧‧變換器
440‧‧‧量化器
450‧‧‧熵編碼器
455‧‧‧位元串流
460‧‧‧逆量化器
470‧‧‧逆變換器
480‧‧‧解區塊單元
490‧‧‧樣本適應性偏移(SAO)操作器
495‧‧‧參考幀
500‧‧‧影像解碼器
505‧‧‧位元串流
510‧‧‧剖析器
520‧‧‧熵解碼器
530‧‧‧逆量化器
540‧‧‧逆變換器
550‧‧‧幀內預測器
560‧‧‧運動補償器
570‧‧‧解區塊單元
580‧‧‧SAO操作器
585‧‧‧參考幀
595‧‧‧所復原的幀
600‧‧‧階層式結構
610‧‧‧寫碼單元/分區/最大寫碼單元/編碼單元
612‧‧‧分區
614‧‧‧分區
616‧‧‧分區
620‧‧‧寫碼單元/分區
622‧‧‧分區
624‧‧‧分區
626‧‧‧分區
630‧‧‧寫碼單元/分區
632‧‧‧分區
634‧‧‧分區
636‧‧‧分區
640‧‧‧寫碼單元/分區
642‧‧‧分區
644‧‧‧分區
646‧‧‧分區
710‧‧‧寫碼單元
720‧‧‧變換單元
800‧‧‧資訊
802‧‧‧分區
804‧‧‧分區
806‧‧‧分區
808‧‧‧分區
810‧‧‧資訊
812‧‧‧幀內模式
814‧‧‧幀間模式
816‧‧‧跳過模式
820‧‧‧資訊
822‧‧‧第一幀內變換單元
824‧‧‧第二幀內變換單元
826‧‧‧第一幀內變換單元
828‧‧‧第二幀內變換單元
900‧‧‧寫碼單元/當前最大寫碼單元
910‧‧‧預測單元
912‧‧‧分區類型/分區
914‧‧‧分區類型
916‧‧‧分區類型
918‧‧‧分區類型
920‧‧‧操作
930‧‧‧寫碼單元
940‧‧‧預測單元
942‧‧‧分區類型
944‧‧‧分區類型
946‧‧‧分區類型
948‧‧‧分區類型
950‧‧‧操作
960‧‧‧寫碼單元
970‧‧‧操作
980‧‧‧寫碼單元
990‧‧‧預測單元
992‧‧‧分區類型
994‧‧‧分區類型
996‧‧‧分區類型
998‧‧‧分區類型
999‧‧‧資料單元
1010‧‧‧寫碼單元/編碼單元
1012‧‧‧寫碼單元
1014‧‧‧寫碼單元/編碼單元
1016‧‧‧寫碼單元/編碼單元
1018‧‧‧寫碼單元
1020‧‧‧寫碼單元
1022‧‧‧寫碼單元/編碼單元
1024‧‧‧寫碼單元
1026‧‧‧寫碼單元
1028‧‧‧寫碼單元
1030‧‧‧寫碼單元
1032‧‧‧寫碼單元/編碼單元
1040‧‧‧寫碼單元
1042‧‧‧寫碼單元
1044‧‧‧寫碼單元
1046‧‧‧寫碼單元
1048‧‧‧寫碼單元/編碼單元
1050‧‧‧寫碼單元/編碼單元
1052‧‧‧寫碼單元/編碼單元
1054‧‧‧寫碼單元/編碼單元
1060‧‧‧預測單元
1070‧‧‧變換單元
1300‧‧‧最大寫碼單元
1302‧‧‧寫碼單元
1304‧‧‧寫碼單元
1306‧‧‧寫碼單元
1312‧‧‧寫碼單元
1314‧‧‧寫碼單元
1316‧‧‧寫碼單元
1318‧‧‧寫碼單元
1322‧‧‧分區類型
1324‧‧‧分區類型
1326‧‧‧分區類型
1328‧‧‧分區類型
1332‧‧‧分區類型
1334‧‧‧分區類型
1336‧‧‧分區類型
1338‧‧‧分區類型
1342‧‧‧變換單元
1344‧‧‧變換單元
1352‧‧‧變換單元
1354‧‧‧變換單元
11000‧‧‧內容供應系統
11100‧‧‧網際網路
11200‧‧‧網際網路服務供應商
11300‧‧‧串流伺服器
11400‧‧‧通信網路
11700‧‧‧無線基地台
11800‧‧‧無線基地台
11900‧‧‧無線基地台
12000‧‧‧無線基地台
12100‧‧‧電腦
12200‧‧‧個人數位助理
12300‧‧‧視訊攝影機
12500‧‧‧行動電話
12510‧‧‧內部天線
12520‧‧‧顯示螢幕
12530‧‧‧相機
12540‧‧‧操作面板
12550‧‧‧麥克風
12560‧‧‧插槽
12570‧‧‧儲存媒體
12580‧‧‧揚聲器
12600‧‧‧相機
12610‧‧‧通信電路
12620‧‧‧LCD控制單元
12630‧‧‧相機介面
12640‧‧‧操作輸入控制單元
12650‧‧‧聲音處理器
12660‧‧‧調變/解調變單元
12670‧‧‧記錄/讀取單元
12680‧‧‧多工器/解多工器
12690‧‧‧影像解碼單元
12700‧‧‧電力供應電路
12710‧‧‧中央控制器
12720‧‧‧影像編碼單元
12730‧‧‧同步匯流排
12810‧‧‧電視接收器
12820‧‧‧儲存媒體
12830‧‧‧再生裝置
12840‧‧‧監視器
12850‧‧‧電纜天線
12860‧‧‧天線
12870‧‧‧機上盒
12880‧‧‧電視監視器
12890‧‧‧廣播站
12900‧‧‧廣播衛星
12910‧‧‧天線
12920‧‧‧汽車
12930‧‧‧汽車導航系統
12950‧‧‧硬碟記錄器
12960‧‧‧DVD光碟
12970‧‧‧SD卡
14000‧‧‧雲端計算伺服器
14100‧‧‧使用者資料庫
14200‧‧‧計算資源
14300‧‧‧桌上型PC
14400‧‧‧智慧型電視
14500‧‧‧智慧型電話
14600‧‧‧膝上型電腦
14700‧‧‧攜帶型多媒體播放器
14800‧‧‧平板型PC
26000‧‧‧光碟
26700‧‧‧電腦系統
26800‧‧‧光碟機
CU_0‧‧‧當前寫碼單元
CU_1‧‧‧寫碼單元
CU_(d-1)‧‧‧寫碼單元
nPbH‧‧‧垂直尺寸
nPbW‧‧‧水平尺寸
Pred_BI‧‧‧雙向預測
Pred_L0‧‧‧L0預測
Pred_L1‧‧‧L1預測
Se‧‧‧磁區
Tr‧‧‧同心磁軌
TU‧‧‧變換單元
藉由參看所附圖式詳細描述本揭露的例示性實施例,本揭露的以上以及其他特徵以及優點將變得更顯而易見。 圖1A為說明根據一或多個實施例的參考影像判斷裝置的方塊圖。 圖1B為說明根據一或多個實施例的判斷參考影像的方法的流程圖。 圖2A為說明根據一或多個實施例的包含參考影像判斷裝置的運動預測裝置的方塊圖。 圖2B為說明根據一或多個實施例的運動預測方法的流程圖。 圖3A為說明根據一或多個實施例的包含參考影像判斷裝置的運動補償裝置的方塊圖。 圖3B為說明根據一或多個實施例的運動補償方法的流程圖。 圖4說明幀間預測索引資訊的兩個例示性實施例。 圖5為根據一或多個實施例的涉及基於具有樹狀結構的寫碼單元的視訊預測的視訊編碼裝置的方塊圖。 圖6為根據一或多個實施例的涉及基於具有樹狀結構的寫碼單元的視訊預測的視訊解碼裝置的方塊圖。 圖7為用於描述根據一或多個實施例的寫碼單元的概念的圖式。 圖8為根據一或多個實施例的基於寫碼單元的影像編碼器的方塊圖。 圖9為根據一或多個實施例的基於寫碼單元的影像解碼器的方塊圖。 圖10為說明根據一或多個實施例的根據深度的較深寫碼單元以及分區的圖式。 圖11為用於描述根據一或多個實施例的寫碼單元與變換單元之間的關係的圖式。 圖12為用於描述根據一或多個實施例的對應於經寫碼的深度的寫碼單元的編碼資訊的圖式。 圖13為根據一或多個實施例的根據深度的較深寫碼單元的圖式。 圖14至圖16為用於描述根據一或多個實施例的寫碼單元、預測單元與變換單元之間的關係的圖式。 圖17為用於描述根據表1的編碼模式資訊的寫碼單元、預測單元與變換單元之間的關係的圖式。 圖18說明根據一或多個實施例的儲存程式的光碟的實體結構。 圖19說明用於藉由使用光碟而記錄以及讀取程式的光碟機。 圖20說明根據一或多個實施例的用於提供內容散佈服務的內容供應系統的整體結構。 圖21及圖22說明應用了根據本揭露的實施例的視訊編碼方法以及視訊解碼方法的行動電話的外部結構以及內部結構。 圖23說明根據一或多個實施例的應用了根據一或多個實施例的通信系統的數位廣播系統。 圖24說明根據一或多個實施例的使用視訊編碼裝置以及視訊解碼裝置的雲端計算系統的網路結構。
21‧‧‧操作
23‧‧‧操作

Claims (1)

  1. 一種視訊解碼裝置,包括: 幀間預測資訊獲得器,經組態以:   自位元串流接收指示當前寫碼單元的分區類型的分區類型資訊;   基於所述分區類型資訊,判斷在所述當前寫碼單元中當前預測單元的尺寸;   在所述當前預測單元的所述尺寸並非4×8或8×4時,獲得指示所述當前預測單元的預測模式是否為雙向預測模式的第一位元以及指示所述當前預測單元的所述預測模式是否為L0預測模式或L1預測模式的第二位元;   在所述當前預測單元的所述尺寸為4×8或8×4時,獲得指示所述當前預測單元的所述預測模式是否為所述L0預測模式或所述L1預測模式的第一位元;以及 運動補償器,經組態以基於在所述當前預測單元的所述尺寸並非4×8或8×4時所獲得的所述第一位元和所述第二位元、或在所述當前預測單元的所述尺寸為4×8或8×4時所獲得的所述第一位元,執行幀間預測而用於在L0預測、L1預測以及雙向預測中的所述當前預測單元。
TW105131153A 2012-07-02 2013-07-02 視訊解碼裝置 TW201701670A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201261667033P 2012-07-02 2012-07-02

Publications (1)

Publication Number Publication Date
TW201701670A true TW201701670A (zh) 2017-01-01

Family

ID=49882225

Family Applications (2)

Application Number Title Priority Date Filing Date
TW102123711A TW201415904A (zh) 2012-07-02 2013-07-02 幀間預測的運動預測方法、運動補償方法、運動預測裝置、運動補償裝置以及電腦可讀記錄媒體
TW105131153A TW201701670A (zh) 2012-07-02 2013-07-02 視訊解碼裝置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW102123711A TW201415904A (zh) 2012-07-02 2013-07-02 幀間預測的運動預測方法、運動補償方法、運動預測裝置、運動補償裝置以及電腦可讀記錄媒體

Country Status (16)

Country Link
US (5) US20150117534A1 (zh)
EP (1) EP2887650A4 (zh)
JP (1) JP2015526012A (zh)
KR (6) KR20140007272A (zh)
CN (1) CN104604237A (zh)
AU (2) AU2013285746B2 (zh)
BR (1) BR112014033041A2 (zh)
CA (2) CA2923286C (zh)
MX (1) MX358152B (zh)
MY (1) MY178477A (zh)
PH (5) PH12015500022A1 (zh)
RU (2) RU2647674C1 (zh)
SG (2) SG10201702738RA (zh)
TW (2) TW201415904A (zh)
WO (1) WO2014007518A1 (zh)
ZA (1) ZA201500273B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10721487B2 (en) * 2012-04-17 2020-07-21 Texas Instruments Incorporated Converting a bi-predicted merging candidate in a merging candidate list for a prediction unit of a picture
RU2647674C1 (ru) * 2012-07-02 2018-03-16 Самсунг Электроникс Ко., Лтд. Способ и устройство для кодирования видео и способ и устройство для декодирования видео, определяющие список опорных изображений внешнего прогнозирования в зависимости от размера блока
CN107005696B (zh) * 2014-11-27 2020-06-26 株式会社Kt 视频信号处理方法和设备
CN112584140B (zh) 2014-11-27 2024-08-13 株式会社Kt 对视频信号进行解码或编码的方法
CN115134596A (zh) 2015-06-05 2022-09-30 杜比实验室特许公司 用于执行帧间预测的图像编解码方法、比特流存储方法
US10779005B2 (en) * 2015-07-15 2020-09-15 Blinxel Pty Ltd System and method for image processing
KR20170058838A (ko) 2015-11-19 2017-05-29 한국전자통신연구원 화면간 예측 향상을 위한 부호화/복호화 방법 및 장치
WO2017086738A1 (ko) 2015-11-19 2017-05-26 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
CN110115032B (zh) * 2016-12-22 2021-07-20 联发科技股份有限公司 用于视频编解码的运动细化的方法以及装置
CN113315975B (zh) 2018-03-29 2022-12-06 华为技术有限公司 一种双向帧间预测方法及装置
WO2020016748A1 (en) * 2018-07-15 2020-01-23 Beijing Bytedance Network Technology Co., Ltd. Cross-component motion information derivation
CN113316931B (zh) 2018-11-22 2024-04-12 北京字节跳动网络技术有限公司 视频处理中的脉冲编解码调制技术
CN109788332A (zh) * 2018-12-11 2019-05-21 新视家科技(北京)有限公司 左侧边控件的扩展方法及其装置、电子设备
BR112021016926A2 (pt) * 2019-02-28 2021-11-03 Samsung Electronics Co Ltd Método de decodificação de imagem, aparelho de decodificação de imagem, e método de codificação de imagem
US11240516B2 (en) * 2019-03-20 2022-02-01 Tencent America LLC Coding mode signaling for small blocks
AU2020388606A1 (en) * 2019-11-20 2022-04-21 Xris Corporation Image signal encoding/decoding method and apparatus therefor
TWI731579B (zh) * 2020-02-11 2021-06-21 日商東芝股份有限公司 傳輸裝置、通訊系統、傳輸方法及電腦程式產品
CN113497936A (zh) * 2020-04-08 2021-10-12 Oppo广东移动通信有限公司 编码方法、解码方法、编码器、解码器以及存储介质

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004023458A (ja) * 2002-06-17 2004-01-22 Toshiba Corp 動画像符号化/復号化方法及び装置
US7599435B2 (en) * 2004-01-30 2009-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video frame encoding and decoding
US7469070B2 (en) * 2004-02-09 2008-12-23 Lsi Corporation Method for selection of contexts for arithmetic coding of reference picture and motion vector residual bitstream syntax elements
JP4596975B2 (ja) * 2005-05-18 2010-12-15 キヤノン株式会社 画像符号化方法、及び画像処理装置
WO2007081176A1 (en) * 2006-01-12 2007-07-19 Lg Electronics Inc. Processing multiview video
RU2395174C1 (ru) * 2006-03-30 2010-07-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования/кодирования сигнала видео
PL2008460T3 (pl) * 2006-03-30 2017-10-31 Lg Electronics Inc Sposób i urządzenie do dekodowania/kodowania sygnału wideo
US8462849B2 (en) * 2008-12-23 2013-06-11 General Instrument Corporation Reference picture selection for sub-pixel motion estimation
KR101619451B1 (ko) * 2009-04-17 2016-05-10 엘지전자 주식회사 다시점 비디오 신호의 처리 방법 및 장치
KR101703327B1 (ko) * 2010-01-14 2017-02-06 삼성전자 주식회사 계층적 데이터 단위의 패턴 정보를 이용하는 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
US8942282B2 (en) * 2010-04-12 2015-01-27 Qualcomm Incorporated Variable length coding of coded block pattern (CBP) in video compression
US8862515B2 (en) * 2010-05-04 2014-10-14 Sony Corporation Geographic internet asset filtering for internet video client
US9497458B2 (en) * 2010-11-26 2016-11-15 Sun Patent Trust Image coding method, image decoding method, image coding apparatus, image decoding apparatus, program, and integrated ciruit
US9288491B2 (en) * 2010-12-13 2016-03-15 Electronics And Telecommunications Research Institute Method and device for determining reference unit
CN107968945B (zh) * 2011-09-14 2021-09-14 三星电子株式会社 对视频进行解码的方法和对视频进行编码的方法
US9237356B2 (en) * 2011-09-23 2016-01-12 Qualcomm Incorporated Reference picture list construction for video coding
MY164898A (en) * 2011-09-29 2018-01-30 Sharp Kk Image decoding device, image decoding method, and image encoding device
US20130170553A1 (en) * 2012-01-04 2013-07-04 Qualcomm Incorporated Coding motion vector difference
EP2806641A4 (en) * 2012-01-19 2016-01-13 Sony Corp IMAGE PROCESSING APPARATUS AND METHOD
JPWO2013111596A1 (ja) * 2012-01-26 2015-05-11 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 動画像符号化方法および動画像符号化装置
US9426463B2 (en) * 2012-02-08 2016-08-23 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
US9264706B2 (en) * 2012-04-11 2016-02-16 Qualcomm Incorporated Bypass bins for reference index coding in video coding
CA2870529C (en) * 2012-04-15 2018-09-18 Tammy Lee Method and apparatus for determining reference images for inter prediction
US9591312B2 (en) * 2012-04-17 2017-03-07 Texas Instruments Incorporated Memory bandwidth reduction for motion compensation in video coding
US20130287093A1 (en) * 2012-04-25 2013-10-31 Nokia Corporation Method and apparatus for video coding
RU2647674C1 (ru) * 2012-07-02 2018-03-16 Самсунг Электроникс Ко., Лтд. Способ и устройство для кодирования видео и способ и устройство для декодирования видео, определяющие список опорных изображений внешнего прогнозирования в зависимости от размера блока

Also Published As

Publication number Publication date
KR20140111232A (ko) 2014-09-18
AU2013285746B2 (en) 2015-09-24
SG11201408721RA (en) 2015-01-29
KR20140085390A (ko) 2014-07-07
CA2878206C (en) 2016-05-17
JP2015526012A (ja) 2015-09-07
KR101727064B1 (ko) 2017-04-14
EP2887650A1 (en) 2015-06-24
WO2014007518A1 (ko) 2014-01-09
CA2878206A1 (en) 2014-01-09
MX358152B (es) 2018-08-07
KR101843156B1 (ko) 2018-03-28
US20150208089A1 (en) 2015-07-23
CA2923286C (en) 2019-05-07
KR101722019B1 (ko) 2017-03-31
US20150163510A1 (en) 2015-06-11
KR20170052535A (ko) 2017-05-12
TW201415904A (zh) 2014-04-16
KR20150009495A (ko) 2015-01-26
BR112014033041A2 (pt) 2018-05-08
MY178477A (en) 2020-10-14
CA2923286A1 (en) 2014-01-09
AU2015275328C1 (en) 2017-10-19
RU2647674C1 (ru) 2018-03-16
AU2015275328B2 (en) 2017-04-20
AU2013285746A1 (en) 2015-02-05
EP2887650A4 (en) 2016-04-06
AU2015275328A1 (en) 2016-01-21
PH12017502374A1 (en) 2018-03-12
PH12015500022B1 (en) 2015-02-23
US20150117534A1 (en) 2015-04-30
CN104604237A (zh) 2015-05-06
KR20140007272A (ko) 2014-01-17
KR20180032549A (ko) 2018-03-30
PH12017502373A1 (en) 2018-03-12
MX2015000097A (es) 2015-04-08
PH12017502372A1 (en) 2018-03-12
SG10201702738RA (en) 2017-05-30
RU2015103074A (ru) 2016-08-20
KR101941250B1 (ko) 2019-01-22
RU2608354C2 (ru) 2017-01-18
PH12015500022A1 (en) 2015-02-23
KR101635110B1 (ko) 2016-06-30
ZA201500273B (en) 2019-06-26
US20150172708A1 (en) 2015-06-18
PH12017502371A1 (en) 2018-03-12
US20150163511A1 (en) 2015-06-11

Similar Documents

Publication Publication Date Title
TWI604721B (zh) 畫面間預測的運動向量預測方法與裝置
TWI575944B (zh) 視訊解碼裝置
TWI556648B (zh) 解碼影像的方法
TW201701670A (zh) 視訊解碼裝置
TW201325247A (zh) 在視訊解碼的反量化及逆轉換期間實現資料修剪的逆轉換方法及設備
US20150071351A1 (en) Inter prediction method in which reference picture lists can be changed and apparatus for the same
TWI661711B (zh) 視訊解碼方法、視訊編碼方法、裝置及非暫態電腦可讀儲存媒體
US10313699B2 (en) Method and apparatus for parallel video decoding based on multi-core system