TW202106027A - 用於解碼動作資訊的裝置及方法和用於編碼動作資訊的方法 - Google Patents

用於解碼動作資訊的裝置及方法和用於編碼動作資訊的方法 Download PDF

Info

Publication number
TW202106027A
TW202106027A TW109121036A TW109121036A TW202106027A TW 202106027 A TW202106027 A TW 202106027A TW 109121036 A TW109121036 A TW 109121036A TW 109121036 A TW109121036 A TW 109121036A TW 202106027 A TW202106027 A TW 202106027A
Authority
TW
Taiwan
Prior art keywords
code writing
writing unit
block
image
reference image
Prior art date
Application number
TW109121036A
Other languages
English (en)
Inventor
鄭丞洙
朴慜祐
朴緡茱
崔棋鎬
崔娜萊
崔雄一
安尼斯 塔姆塞
朴銀姬
Original Assignee
南韓商三星電子股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 南韓商三星電子股份有限公司 filed Critical 南韓商三星電子股份有限公司
Publication of TW202106027A publication Critical patent/TW202106027A/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

本發明提供一種解碼動作資訊的方法,包含:自位元串流獲得指示是否改變鄰近區塊的動作資訊的改變資訊;在改變資訊指示動作資訊的改變且較高級區塊能夠使用一個參考圖像清單時,識別包含於當前區塊的參考圖像清單中的圖像的數目;考慮到圖像的數目,選擇鄰近區塊的參考圖像或與鄰近區塊的參考圖像不同的圖像作為當前區塊的參考圖像;當選擇鄰近區塊的參考圖像作為當前區塊的參考圖像時,藉由將偏移應用於鄰近區塊的動作向量的x分量或y分量中的至少一者來獲得當前區塊的動作向量;以及藉由使用當前區塊的參考圖像中的由當前區塊的動作向量指示的參考區塊來重建構當前區塊。

Description

使用鄰近動作資訊編碼與解碼動作資訊之裝置以及方法
本發明是關於影像的編碼與解碼領域。特定言之,本發明是關於一種用於藉由使用鄰近動作資訊編碼與解碼當前動作資訊的裝置以及方法。
在影像的編碼與解碼中,影像可分裂成區塊,且每一區塊可經由框間預測或框內預測而預測編碼及預測解碼。
框間預測的代表性實例為使用藉由移除影像之間的時間冗餘壓縮影像的方法的動作估計編碼。在動作估計編碼中,藉由使用至少一個參考影像來預測當前影像的區塊。可藉由使用特定評估函數在特定搜尋範圍內搜尋與當前區塊最相似的參考區塊。基於參考區塊預測當前區塊,並且藉由自當前區塊減去由於預測而產生的預測區塊來產生殘餘區塊且接著編碼殘餘區塊。此處,為進一步精確地執行預測,對至少一個參考影像執行內插以便產生小於整數像素單元的子像素單元的像素,且可基於子像素單元的像素執行框間預測。
在諸如H.264進階視訊寫碼(advanced video coding;AVC)及高效率視訊寫碼(high efficiency video coding;HEVC)的編解碼器中,鄰近於當前區塊的預編碼區塊或包含於預編碼影像中的區塊的動作向量用於預測當前區塊的動作向量。經由特定方法將差分動作向量傳信到解碼器,所述差分動作向量為當前區塊的動作向量與預編碼區塊的動作向量之間的差。
技術難題
提供一種用於編碼動作資訊的裝置及方法以及一種用於解碼動作資訊的裝置及方法,所述裝置及方法藉由改變鄰近動作資訊來以少量位元分別地編碼及解碼當前動作資訊。 問題的解決方案
根據本揭露的實施例,一種藉由解碼裝置執行的解碼動作資訊的方法包含:自位元串流獲得指示是否改變與當前區塊時間上或空間上相關的鄰近區塊的動作資訊的改變資訊;在改變資訊指示動作資訊的改變且當前區塊的較高級區塊能夠使用一個參考圖像清單時,識別包含於當前區塊的參考圖像清單中的圖像的數目;考慮到所識別圖像數目,選擇鄰近區塊的參考圖像或與鄰近區塊的參考圖像不同的圖像作為當前區塊的參考圖像;當選擇鄰近區塊的參考圖像作為當前區塊的參考圖像時,藉由將偏移應用於鄰近區塊的動作向量的x分量或y分量中的至少一者來獲得當前區塊的動作向量;以及藉由使用當前區塊的參考圖像中的由當前區塊的動作向量指示的參考區塊來重建構當前區塊。 本揭露的有利作用
根據本揭露的實施例,用於編碼動作資訊的裝置及方法以及用於解碼動作資訊的裝置及方法可藉由改變鄰近動作資訊來以少量位元分別地編碼及解碼當前動作資訊。
然而,可藉由用於編碼動作資訊的裝置及方法以及用於解碼動作資訊的裝置及方法達成的效應不限於上文所提及的彼等,且所屬領域中具通常知識者可自以下描述清楚地理解並未提及的其他效應。
最佳模式
根據本揭露的實施例,一種藉由解碼裝置執行的解碼動作資訊的方法包含:自位元串流獲得指示是否改變與當前區塊時間上或空間上相關的鄰近區塊的動作資訊的改變資訊;在改變資訊指示動作資訊的改變且當前區塊的較高級區塊能夠使用一個參考圖像清單時,識別包含於當前區塊的參考圖像清單中的圖像的數目;考慮到所識別圖像數目,選擇鄰近區塊的參考圖像或與鄰近區塊的參考圖像不同的圖像作為當前區塊的參考圖像;當選擇鄰近區塊的參考圖像作為當前區塊的參考圖像時,藉由將偏移應用於鄰近區塊的動作向量的x分量或y分量中的至少一者來獲得當前區塊的動作向量;以及藉由使用當前區塊的參考圖像中的由當前區塊的動作向量指示的參考區塊來重建構當前區塊。
當所識別圖像數目為1時,選擇可包含選擇鄰近區塊的參考圖像作為當前區塊的參考圖像。
當改變資訊指示第一類型改變時,偏移可具有+號,且當改變資訊指示第二類型改變時,偏移可具有-號。
當所識別圖像數目為2且改變資訊指示第一類型改變時,選擇可包含選擇與鄰近區塊的參考圖像不同的圖像作為當前區塊的參考圖像,且獲得當前區塊的動作向量可包含藉由根據當前圖像與鄰近區塊的參考圖像之間的距離跟當前圖像與當前區塊的參考圖像之間的距離的比率按比例縮放鄰近區塊的動作向量來獲得當前區塊的動作向量。
當所識別圖像數目為2且改變資訊指示第二類型改變時,選擇可包含選擇鄰近區塊的參考圖像作為當前區塊的參考圖像,且獲得當前區塊的動作向量可包含藉由將偏移應用於鄰近區塊的動作向量的x分量或y分量中的至少一者來獲得當前區塊的動作向量。
當所識別圖像數目為3或大於3時,選擇可包含選擇與鄰近區塊的參考圖像不同的圖像作為當前區塊的參考圖像,且獲得當前區塊的動作向量可包含藉由根據當前圖像與鄰近區塊的參考圖像之間的距離跟當前圖像與當前區塊的參考圖像之間的距離的比率按比例縮放鄰近區塊的動作向量來獲得當前區塊的動作向量。
當所識別圖像數目為3或大於3且改變資訊指示第一類型改變時,選擇可包含自包含於參考圖像清單中的圖像當中選擇與鄰近區塊的參考圖像不同的圖像作為當前區塊的參考圖像。
當所識別圖像數目為3或大於3且改變資訊指示第二類型改變時,選擇可包含在指示鄰近區塊的參考圖像的索引小於2時,自包含於參考圖像清單中的圖像當中選擇索引為2的圖像作為當前區塊的參考圖像,且在指示鄰近區塊的參考圖像的索引等於或大於2時,自包含於參考圖像清單中的圖像當中選擇索引為1的圖像作為當前區塊的參考圖像。
獲得當前區塊的動作向量可包含藉由將自位元串流獲得的差分動作向量添加至被應用了偏移的鄰近區塊的動作向量來獲得當前區塊的動作向量。
可自包含於位元串流中的變化距離資訊及變化方向資訊計算差分動作向量。
變化距離資訊可指示2n 的變化距離,其中n可為等於或大於0的整數,且偏移可為奇數。
當改變資訊指示動作資訊不改變時,選擇可包含選擇鄰近區塊的參考圖像作為當前區塊的參考圖像,且獲得當前區塊的動作向量可包含藉由將自位元串流獲得的差分動作向量應用於鄰近區塊的動作向量來獲得當前區塊的動作向量。
在當前區塊的大小小於或等於預設大小時,並未執行改變資訊的獲得,選擇可包含選擇鄰近區塊的參考圖像作為當前區塊的參考圖像,且獲得當前區塊的動作向量可包含藉由將自位元串流獲得的差分動作向量應用於鄰近區塊的動作向量來獲得當前區塊的動作向量。
根據本揭露的另一實施例,一種用於解碼動作資訊的裝置包含:位元串流獲得器,經組態以自位元串流獲得指示是否改變與當前區塊時間上或空間上相關的鄰近區塊的動作資訊的改變資訊;動作資訊獲得器,經組態以在改變資訊指示動作資訊的改變且包含當前區塊的較高級區塊能夠使用一個參考圖像清單時,識別包含於當前區塊的參考圖像清單中的圖像的數目,根據所識別圖像數目,選擇鄰近區塊的參考圖像或與鄰近區塊的參考圖像不同的圖像作為當前區塊的參考圖像,以及當選擇鄰近區塊的參考圖像作為當前區塊的參考圖像時,藉由將偏移應用於鄰近區塊的動作向量的x分量或y分量中的至少一者來獲得當前區塊的動作向量;以及預測解碼器,經組態以藉由使用當前區塊的參考圖像中的由當前區塊的動作向量指示的參考區塊來重建構當前區塊。
根據本揭露的另一實施例,一種編碼動作資訊的方法包含:判定是否改變與當前區塊時間上或空間上相關的鄰近區塊的動作資訊;及產生位元串流,所述位元串流包含:指示鄰近區塊的資訊、指示是否改變動作資訊的改變資訊,以及指示差分動作向量的資訊,其中包含當前區塊的較高級區塊使用一個參考圖像清單,且當選擇鄰近區塊的參考圖像作為當前區塊的參考圖像時,差分動作向量對應於當前區塊的動作向量與藉由將偏移應用於鄰近區塊的動作向量的x分量或y分量中的至少一者而獲得的結果之間的差。 揭露模式
由於本揭露允許各種改變及眾多實例,因此本揭露的特定實施例將在圖式中進行說明,且在書面描述中詳細地描述。然而,此不意欲將本揭露限於特定實踐模式,且應理解,未脫離本揭露的精神及技術範疇的所有變化、等效物以及替代物均涵蓋在本揭露中。
在本揭露的實施例的描述中,相關技術的某些詳細解釋在認為其可能會不必要地混淆本揭露的本質時被省略。此外,說明書的描述中使用的數值(例如,第一、第二以及類似者)僅為用於將元件彼此區分開的標識符碼。
此外,在本說明書中,除非另外規定,否則應理解,當元件彼此「連接」或「耦接」時,元件可直接地彼此連接或耦接,但可替代地藉由其間的插入元件彼此連接或耦接。
在本說明書中,考慮表示為「單元」或「模組」的元件,兩個或更多個元件可組合為一個元件,或一個元件可根據細分功能劃分成兩個或更多個元件。另外,除自身的主要功能以外,下文中描述的每一元件可另外執行由另一元件執行的功能中的一些或全部,且每一元件的主要功能中的一些可完全由另一組件執行。
此外,在本說明書中,『影像』或『圖像』可表示視訊的靜態影像或移動影像,亦即,視訊自身。
此外,在本說明書中,『樣本』或『信號』表示指派給影像的取樣位置的資料,亦即,待處理的資料。舉例來說,空間域中的影像的像素值及變換區上的變換係數可為樣本。包含至少一個此樣本的單元可定義為區塊。
下文中,將參考圖1至圖19描述根據本揭露的實施例的基於樹狀結構的寫碼單元及變換單元的影像編碼方法及裝置以及影像解碼方法及裝置。
圖1為根據本揭露的實施例的影像解碼裝置100的方塊圖。
影像解碼裝置100可包含位元串流獲得器110及解碼器120。位元串流獲得器110及解碼器120可包含至少一個處理器。此外,位元串流獲得器110及解碼器120可包含儲存待由至少一個處理器執行的指令的記憶體。
位元串流獲得器110可接收位元串流。位元串流包含由稍後描述的影像編碼裝置200編碼的影像的資訊。此外,可自影像編碼裝置200傳輸位元串流。影像編碼裝置200及影像解碼裝置100可有線或無線地連接,且位元串流獲得器110可有線或無線地接收位元串流。位元串流獲得器110可自諸如光學媒體或硬碟的儲存媒體接收位元串流。解碼器120可基於自所接收的位元串流獲得的資訊重建構影像。解碼器120可自位元串流獲得用於重建構影像的語法元素。解碼器120可基於語法元素重建構影像。
考慮影像解碼裝置100的詳細操作,位元串流獲得器110可接收位元串流。
影像解碼裝置100可執行自位元串流獲得對應於寫碼單元的分裂形狀模式的位元子字串的操作。隨後,影像解碼裝置100可執行判定寫碼單元的分裂規則的操作。此外,影像解碼裝置100可執行基於對應於分裂形狀模式的位元子字串或分裂規則中的至少一者將寫碼單元分裂成多個寫碼單元的操作。影像解碼裝置100可根據寫碼單元的寬度與高度的比判定寫碼單元的大小的可允許第一範圍,以便判定分裂規則。影像解碼裝置100可根據寫碼單元的分裂形狀模式判定寫碼單元的大小的可允許第二範圍,以便判定分裂規則。
下文中,將根據本揭露的實施例詳細描述寫碼單元的分裂。
首先,一個圖像可分裂成一或多個切片或一或多個圖塊。一個切片或一個圖塊可為一系列一或多個最大寫碼單元(寫碼樹型單元(coding tree unit;CTU))。根據本揭露的實施例,一個切片可包含一或多個圖塊或一或多個最大寫碼單元。可在圖像中判定包含一或多個圖塊的切片。
存在與最大寫碼單元(CTU)概念上相比的最大寫碼區塊(寫碼樹型區塊(coding tree block;CTB))。最大寫碼單元(CTB)表示包含N×N個樣本的N×N區塊(N為整數)。每一色彩分量可分裂成一或多個最大寫碼區塊。
當圖像包含三個樣本陣列(用於Y分量、Cr分量以及Cb分量的樣本陣列)時,最大寫碼單元(CTU)包含明度樣本的最大寫碼區塊、色度樣本的兩個對應最大寫碼區塊,以及用於編碼明度樣本及色度樣本的語法結構。當圖像為單色圖像時,最大寫碼單元包含單色樣本的最大寫碼區塊及用於編碼單色樣本的語法結構。當圖像為在根據色彩分量隔開的色彩平面中編碼的圖像時,最大寫碼單元包含用於編碼圖像及圖像的樣本的語法結構。
一個最大寫碼區塊(CTB)可分裂成包含M×N個樣本的M×N個寫碼區塊(M及N為整數)。
當圖像具有用於Y分量、Cr分量以及Cb分量的樣本陣列時,寫碼單元(coding unit;CU)包含明度樣本的寫碼區塊、色度樣本的兩個對應寫碼區塊,以及用於編碼明度樣本及色度樣本的語法結構。當圖像為單色圖像時,寫碼單元包含單色樣本的寫碼區塊及用於編碼單色樣本的語法結構。當圖像為在根據色彩分量隔開的色彩平面中編碼的圖像時,寫碼單元包含用於編碼圖像及圖像的樣本的語法結構。
如上文所描述,最大寫碼區塊及最大寫碼單元概念上區別於彼此,並且寫碼區塊及寫碼單元概念上區別於彼此。亦即,(最大)寫碼單元是指包含含有對應樣本的(最大)寫碼區塊及對應於(最大)寫碼區塊的語法結構的資料結構。然而,由於所屬領域中具通常知識者應理解,(最大)寫碼單元或(最大)寫碼區塊是指包含特定數目個樣本的特定大小的區塊,所以除非另外描述,否則最大寫碼區塊及最大寫碼單元或寫碼區塊及寫碼單元在以下說明書中提及而不需進行區分。
影像可分裂成最大寫碼單元(CTU)。可基於自位元串流獲得的資訊判定每一最大寫碼單元的大小。每一最大寫碼單元的形狀可為相同大小的方形形狀。然而,本揭露的實施例不限於此。
舉例而言,可自位元串流獲得關於明度寫碼區塊的最大大小的資訊。舉例而言,由關於明度寫碼區塊的最大大小的資訊指示的明度寫碼區塊的最大大小可為4×4、8×8、16×16、32×32、64×64、128×128以及256×256中的一者。
舉例而言,可自位元串流獲得關於可分裂成兩個的明度寫碼區塊的明度區塊大小差異及最大大小的資訊。關於明度區塊大小差異的資訊可指明度最大寫碼單元與可分裂成兩個的最大明度寫碼區塊之間的大小差異。相應地,當關於可分裂成兩個的明度寫碼區塊的最大大小的資訊與自位元串流獲得的關於明度區塊大小差異的資訊彼此組合時,可判定明度最大寫碼單元的大小。可藉由使用明度最大寫碼單元的大小來判定色度最大寫碼單元的大小。舉例而言,當根據色彩格式的Y:Cb:Cr比為4:2:0時,色度區塊的大小可為明度區塊的大小的一半,且色度最大寫碼單元的大小可為明度最大寫碼單元的大小的一半。
根據本揭露的實施例,由於關於可二元分裂的明度寫碼區塊的最大大小的資訊是自位元串流獲得,所以可以可變地判定可二元分裂的明度寫碼區塊的最大大小。相比之下,可三元分裂的明度寫碼區塊的最大大小可為固定的。舉例而言,I圖像中的可三元分裂的明度寫碼區塊的最大大小可為32×32,且P圖像或B圖像中的可三元分裂的明度寫碼區塊的最大大小可為64×64。
此外,最大寫碼單元可基於自位元串流獲得的分裂形狀模式資訊階層式地分裂成寫碼單元。指示是否執行四元分裂的資訊、指示是否執行多元分裂的資訊、分裂方向資訊或分裂類型資訊中的至少一者可作為分裂形狀模式資訊而自位元串流獲得。
舉例而言,指示是否執行四元分裂的資訊可指示當前寫碼單元是否被四元分裂(QUAD_SPLIT)。
在當前寫碼單元未被四元分裂時,指示是否執行多元分裂的資訊可指示當前寫碼單元是不再分裂(NO_SPLIT)還是二元/三元分裂。
在當前寫碼單元被二元分裂或三元分裂時,分裂方向資訊指示當前寫碼單元在水平方向及垂直方向中的一者上分裂。
在當前寫碼單元在水平方向或垂直方向上分裂時,分裂類型資訊指示當前寫碼單元是二元分裂還是三元分裂。
可根據分裂方向資訊及分裂類型資訊判定當前寫碼單元的分裂模式。在當前寫碼單元在水平方向上二元分裂時的分裂模式可判定為二元水平分裂模式(SPLIT_BT_HOR),在當前寫碼單元在水平方向上三元分裂時的分裂模式可判定為三元水平分裂模式(SPLIT_TT_HOR),在當前寫碼單元在垂直方向上二元分裂時的分裂模式可判定為二元垂直分裂模式(SPLIT_BT_VER),且在當前寫碼單元在垂直方向上三元分裂時的分裂模式可判定為三元垂直分裂模式SPLIT_TT_VER。
影像解碼裝置100可自位元串流獲得來自一個位元子字串的分裂形狀模式資訊。藉由影像解碼裝置100接收到的位元串流的形式可包含固定長度二進位碼、一元碼、截斷一元碼、預定二進位碼或類似者。位元子字串為呈二進位數的資訊。位元子字串可包含至少一個位元。影像解碼裝置100可基於分裂規則獲得對應於位元子字串的分裂形狀模式資訊。影像解碼裝置100可基於一個位元子字串判定是否四元分裂寫碼單元、是否並未分裂寫碼單元、分裂方向以及分裂類型。
寫碼單元可小於最大寫碼單元或與最大寫碼單元相同。舉例而言,由於最大寫碼單元為具有最大大小的寫碼單元,所以最大寫碼單元為寫碼單元中的一者。當關於最大寫碼單元的分裂形狀模式資訊指示並未執行分裂時,在最大寫碼單元中判定的寫碼單元具有與最大寫碼單元的大小相同的大小。當關於最大寫碼單元的分裂形狀程式碼資訊指示執行分裂時,最大寫碼單元可分裂成寫碼單元。此外,當關於寫碼單元的分裂形狀模式資訊指示執行分裂時,寫碼單元可分裂成較小寫碼單元。然而,影像的分裂不限於此,且可能不區分最大寫碼單元及寫碼單元。將參考圖3至圖16詳細描述寫碼單元的分裂。
此外,可自寫碼單元判定用於預測的一或多個預測區塊。預測區塊可與寫碼單元相同或小於寫碼單元。此外,可自寫碼單元判定用於變換的一或多個變換區塊。變換區塊可與寫碼單元相同或小於寫碼單元。
變換區塊及預測區塊的形狀及大小可能並不彼此相關。
在本揭露的另一實施例中,可藉由使用寫碼單元作為預測單元來執行預測。此外,可藉由使用寫碼單元作為變換區塊來執行變換。
將參考圖3至圖16詳細描述寫碼單元的分裂。本揭露的當前區塊及鄰近區塊可指示最大寫碼單元、寫碼單元、預測區塊以及變換區塊中的一者。此外,當前寫碼單元的當前區塊為當前正解碼或編碼的區塊或當前正分裂的區塊。鄰近區塊可為在當前區塊之前重建構的區塊。鄰近區塊可空間上或時間上鄰近於當前區塊。鄰近區塊可位於當前區塊的左下方、左方、左上方、上方、右上方、右方、右下方中的一者處。
圖3示出根據本揭露的實施例的藉由影像解碼裝置100執行的藉由分裂當前寫碼單元來判定至少一個寫碼單元的程序。
區塊形狀可包含4N×4N、4N×2N、2N×4N、4N×N、N×4N、32N×N、N×32N、16N×N、N×16N、8N×N或N×8N。此處,N可為正整數。區塊形狀資訊為指示寫碼單元的形狀、方向、寬度與高度的比或大小中的至少一者的資訊。
寫碼單元的形狀可包含方形及非方形。當寫碼單元的寬度及高度的長度相同時(即,當寫碼單元的區塊形狀為4N×4N時),影像解碼裝置100可將寫碼單元的區塊形狀資訊判定為方形。影像解碼裝置100可將寫碼單元的形狀判定為非方形。
當寫碼單元的寬度及高度彼此不同時(即,當寫碼單元的區塊形狀為4N×2N、2N×4N、4N×N、N×4N、32N×N、N×32N、16N×N、N×16N、8N×N或N×8N時),影像解碼裝置100可將寫碼單元的區塊形狀資訊判定為非方形形狀。當寫碼單元的形狀為非方形時,影像解碼裝置100可將寫碼單元的區塊形狀資訊當中的寬度與高度的比判定為1:2、2:1、1:4、4:1、1:8、8:1、1:16、16:1、1:32或32:1中的至少一者。此外,影像解碼裝置100可基於寫碼單元的寬度的長度及高度的長度判定寫碼單元是在水平方向還是垂直方向上。此外,影像解碼裝置100可基於寫碼單元的寬度的長度、高度的長度或面積中的至少一者判定寫碼單元的大小。
根據本揭露的實施例,影像解碼裝置100可藉由使用區塊形狀資訊來判定寫碼單元的形狀,且可藉由使用分裂形狀模式資訊來判定寫碼單元的分裂方法。亦即,可基於由影像解碼裝置100所使用的區塊形狀資訊指示的區塊形狀來判定藉由分裂形狀模式資訊指示的寫碼單元分裂方法。
影像解碼裝置100可自位元串流獲得分裂形狀模式資訊。然而,本揭露的實施例不限於此,且影像解碼裝置100及影像編碼裝置200可基於區塊形狀資訊判定預協定分裂形狀模式資訊。影像解碼裝置100可關於最大寫碼單元或最小寫碼單元判定預協定分裂形狀模式資訊。舉例而言,影像解碼裝置100可關於待四元分裂的最大寫碼單元判定分裂形狀模式資訊。此外,影像解碼裝置100可考慮將「不執行分裂」的最小寫碼單元而判定分裂形狀模式資訊。特定言之,影像解碼裝置100可將最大寫碼單元的大小判定為256×256。影像解碼裝置100可將預協定分裂形狀模式資訊判定為四元分裂。四元分裂為其中寫碼單元的寬度及高度皆等分的分裂形狀模式。影像解碼裝置100可基於分裂形狀模式資訊自256×256大小的最大寫碼單元獲得128×128大小的寫碼單元。此外,影像解碼裝置100可將最小寫碼單元的大小判定為4×4。影像解碼裝置100可關於最小寫碼單元獲得指示「不執行分裂」的分裂形狀模式資訊。
根據本揭露的實施例,影像解碼裝置100可使用指示當前寫碼單元具有方形形狀的區塊形狀資訊。舉例而言,影像解碼裝置100可基於分裂形狀模式資訊來判定是否不分裂方形寫碼單元、是否垂直地分裂方形寫碼單元、是否水平地分裂方形寫碼單元,或是否將方形寫碼單元分裂成四個寫碼單元。參考圖3,在當前寫碼單元300的區塊形狀資訊指示方形形狀時,解碼器120可基於指示不執行分裂的分裂形狀模式資訊來判定具有與當前寫碼單元300相同的大小的寫碼單元310a並不分裂,或可基於指示特定分裂方法的分裂形狀模式資訊判定寫碼單元310b、寫碼單元310c、寫碼單元310d、寫碼單元310e或寫碼單元310f分裂。
參考圖3,根據本揭露的實施例,影像解碼裝置100可基於指示在垂直方向上執行分裂的分裂形狀模式資訊來判定藉由在垂直方向上分裂當前寫碼單元300而獲得的兩個寫碼單元310b。影像解碼裝置100可基於指示在水平方向上執行分裂的分裂形狀模式資訊來判定藉由在水平方向上分裂當前寫碼單元300而獲得的兩個寫碼單元310c。影像解碼裝置100可基於指示在垂直及水平方向上執行分裂的分裂形狀模式資訊來判定藉由在垂直及水平方向上分裂當前寫碼單元300而獲得的四個寫碼單元310d。根據本揭露的實施例,影像解碼裝置100可基於指示在垂直方向上執行三元分裂的分裂形狀模式資訊來判定藉由在垂直方向上分裂當前寫碼單元300而獲得的三個寫碼單元310e。影像解碼裝置100可基於指示在水平方向上執行三元分裂的分裂形狀模式資訊來判定藉由在水平方向上分裂當前寫碼單元300而獲得的三個寫碼單元310f。然而,方形寫碼單元的分裂方法不限於上述方法,且分裂形狀模式資訊可指示各種方法。將在下文相對於本揭露的各種實施例詳細描述分裂方形寫碼單元的特定分裂方法。
圖4示出根據本揭露的實施例的藉由影像解碼裝置100執行的藉由分裂當前寫碼單元來判定至少一個寫碼單元的程序。
根據本揭露的實施例,影像解碼裝置100可使用指示當前寫碼單元具有非方形形狀的區塊形狀資訊。影像解碼裝置100可基於分裂形狀模式資訊判定是否不分裂非方形當前寫碼單元或是否藉由使用特定分裂方法來分裂非方形當前寫碼單元。參考圖4,在當前寫碼單元400或當前寫碼單元450的區塊形狀資訊指示非方形形狀時,影像解碼裝置100可基於指示不執行分裂的分裂形狀模式資訊判定具有與當前寫碼單元400或當前寫碼單元450相同的大小的寫碼單元410或寫碼單元460不分裂,或基於指示特定分裂方法的分裂形狀模式資訊判定寫碼單元420a及寫碼單元420b、寫碼單元430a至寫碼單元430c、寫碼單元470a及寫碼單元470b,或寫碼單元480a至寫碼單元480c分裂。將在下文相對於本揭露的各種實施例詳細描述分裂非方形寫碼單元的特定分裂方法。
根據本揭露的實施例,影像解碼裝置100可藉由使用分裂形狀模式資訊判定寫碼單元的分裂方法,且在此情況下,分裂形狀模式資訊可指示藉由分裂寫碼單元產生的一或多個寫碼單元的數目。參考圖4,當分裂形狀模式資訊指示將當前寫碼單元400或當前寫碼單元450分裂成兩個寫碼單元時,影像解碼裝置100可藉由基於分裂形狀模式資訊分裂當前寫碼單元400或當前寫碼單元450來判定包含於當前寫碼單元400或當前寫碼單元450中的兩個寫碼單元420a及寫碼單元420b或寫碼單元470a及寫碼單元470b。
根據本揭露的實施例,當影像解碼裝置100基於分裂形狀模式資訊來分裂非方形當前寫碼單元400或非方形當前寫碼單元450時,影像解碼裝置100可考慮非方形當前寫碼單元400或非方形當前寫碼單元450的長邊的位置來分裂當前寫碼單元。舉例而言,影像解碼裝置100可考慮到當前寫碼單元400或當前寫碼單元450的形狀藉由分裂當前寫碼單元400或當前寫碼單元450的長邊來判定多個寫碼單元。
根據本揭露的實施例,當分裂形狀模式資訊指示將寫碼單元分裂(三元分裂)成奇數個區塊時,影像解碼裝置100可判定包含於當前寫碼單元400或當前寫碼單元450中的奇數個寫碼單元。舉例而言,當分裂形狀模式資訊指示將當前寫碼單元400或當前寫碼單元450分裂成三個寫碼單元時,影像解碼裝置100可將當前寫碼單元400或當前寫碼單元450分裂成三個寫碼單元430a、寫碼單元430b以及寫碼單元430c,或寫碼單元480a、寫碼單元480b以及寫碼單元480c。
根據本揭露的實施例,當前寫碼單元400或當前寫碼單元450的寬度與高度的比可為4:1或1:4。當寬度與高度的比為4:1時,區塊形狀資訊可為水平方向,此是因為寬度的長度長於高度的長度。當寬度與高度的比為1:4時,區塊形狀資訊可為垂直方向,此是因為寬度的長度短於高度的長度。影像解碼裝置100可基於分裂形狀模式資訊判定將當前寫碼單元分裂成奇數個區塊。此外,影像解碼裝置100可基於當前寫碼單元400或當前寫碼單元450的區塊形狀資訊判定當前寫碼單元400或當前寫碼單元450的分裂方向。舉例而言,在當前寫碼單元400處於垂直方向上時,影像解碼裝置100可藉由在水平方向上分裂當前寫碼單元400來判定寫碼單元430a至寫碼單元430c。此外,在當前寫碼單元450處於水平方向上時,影像解碼裝置100可藉由在垂直方向上分裂當前寫碼單元450來判定寫碼單元480a至寫碼單元480c。
根據本揭露的實施例,影像解碼裝置100可判定包含於當前寫碼單元400或當前寫碼單元450中的奇數個寫碼單元,且並非所有所判定寫碼單元可具有相同大小。舉例而言,來自所判定的奇數個寫碼單元430a、寫碼單元430b以及寫碼單元430c或寫碼單元480a、寫碼單元480b以及寫碼單元480c當中的特定寫碼單元430b或寫碼單元480b可具有與其他寫碼單元430a、及寫碼單元430c或寫碼單元480a及寫碼單元480c的大小不同的大小。亦即,可藉由分裂當前寫碼單元400或當前寫碼單元450判定的寫碼單元可具有多個大小,且在一些情況下,所有奇數個寫碼單元430a、寫碼單元430b以及寫碼單元430c或寫碼單元480a、寫碼單元480b以及寫碼單元480c可具有不同大小。
根據本揭露的實施例,在分裂形狀模式資訊指示將寫碼單元分裂成奇數個區塊時,影像解碼裝置100可判定包含於當前寫碼單元400或當前寫碼單元450中的奇數個寫碼單元,且另外,可對來自藉由分裂當前寫碼單元400或當前寫碼單元450產生的奇數個寫碼單元當中的至少一個寫碼單元施加特定限制。參考圖4,影像解碼裝置100可考慮到位於三個寫碼單元430a、寫碼單元430b以及寫碼單元430c或寫碼單元480a、寫碼單元480b以及寫碼單元480c當中的中心處的在當前寫碼單元400或當前寫碼單元450被分裂時產生為與其他寫碼單元430a及寫碼單元430c或寫碼單元480a或寫碼單元480c不同的寫碼單元430b或寫碼單元480b而設定解碼程序。舉例而言,不同於其他寫碼單元430a及寫碼單元430c或寫碼單元480a及寫碼單元480c,影像解碼裝置100可將中心位置處的寫碼單元430b或寫碼單元480b限制為不再分裂或僅分裂特定次數。
圖5示出根據本揭露的實施例的藉由影像解碼裝置100執行的基於區塊形狀資訊或分裂形狀模式資訊中的至少一者分裂寫碼單元的程序。
根據本揭露的實施例,影像解碼裝置100可基於區塊形狀資訊或分裂形狀模式資訊中的至少一者判定將或不將方形第一寫碼單元500分裂成寫碼單元。根據本揭露的實施例之,在分裂形狀模式資訊指示在水平方向上分裂第一寫碼單元500時,影像解碼裝置100可藉由在水平方向上分裂第一寫碼單元500而判定第二寫碼單元510。根據本揭露的實施例使用的第一寫碼單元、第二寫碼單元以及第三寫碼單元為用於理解在分裂寫碼單元之前及之後的關係的術語。舉例而言,可藉由分裂第一寫碼單元判定第二寫碼單元,且可藉由分裂第二寫碼單元判定第三寫碼單元。應理解,第一寫碼單元、第二寫碼單元以及第三寫碼單元的結構遵循以上描述。
根據本揭露的實施例,影像解碼裝置100可基於分裂形狀模式資訊判定將或不將所判定的第二寫碼單元510分裂成寫碼單元。參考圖5,影像解碼裝置100可基於分裂形狀模式資訊將藉由分裂第一寫碼單元500判定的非方形第二寫碼單元510分裂成一或多個第三寫碼單元520a或第三寫碼單元520b、第三寫碼單元520c以及第三寫碼單元520d,或可能不分裂非方形第二寫碼單元510。影像解碼裝置100可獲得分裂形狀模式資訊,且可基於所獲得的分裂形狀模式資訊藉由分裂第一寫碼單元500獲得多個各種形狀的第二寫碼單元(例如,第二寫碼單元510),且可基於分裂形狀模式資訊藉由使用第一寫碼單元500的分裂方法來分裂第二寫碼單元510。根據本揭露的實施例,在基於第一寫碼單元500的分裂形狀模式資訊將第一寫碼單元500分裂成第二寫碼單元510時,亦可基於第二寫碼單元510的分裂形狀模式資訊將第二寫碼單元510分裂成第三寫碼單元520a或第三寫碼單元520b、第三寫碼單元520c以及第三寫碼單元520d。亦即,寫碼單元可基於每一寫碼單元的分裂形狀模式資訊遞歸地分裂。因此,可藉由分裂非方形寫碼單元判定方形寫碼單元,且可藉由遞歸地分裂方形寫碼單元判定非方形寫碼單元。
參考圖5,來自藉由分裂非方形第二寫碼單元510判定的奇數個第三寫碼單元520b、第三寫碼單元520c以及第三寫碼單元520d當中的特定寫碼單元(例如,位於中心位置處的寫碼單元或方形寫碼單元)可遞歸地分裂。根據本揭露的實施例,來自奇數個第三寫碼單元520b、第三寫碼單元520c以及第三寫碼單元520d當中的非方形第三寫碼單元520b可在水平方向上分裂成多個第四寫碼單元。來自多個第四寫碼單元530a、第四寫碼單元530b、第四寫碼單元530c以及第四寫碼單元530d當中的非方形第四寫碼單元530b或非方形第四寫碼單元530d同樣可分裂成多個寫碼單元。舉例而言,非方形第四寫碼單元530b或非方形第四寫碼單元530d同樣可分裂成奇數個寫碼單元。將在下文相對於本揭露的各種實施例描述可用於遞歸地分裂寫碼單元的方法。
根據本揭露的實施例,影像解碼裝置100可基於分裂形狀模式資訊將第三寫碼單元520a或第三寫碼單元520b、第三寫碼單元520c以及第三寫碼單元520d中的每一者分裂成寫碼單元。此外,影像解碼裝置100可基於分裂形狀模式資訊判定不分裂第二寫碼單元510。根據本揭露的實施例,影像解碼裝置100可將非方形第二寫碼單元510分裂成奇數個第三寫碼單元520b、第三寫碼單元520c以及第三寫碼單元520d。影像解碼裝置100可對來自奇數個第三寫碼單元520b、第三寫碼單元520c以及第三寫碼單元520d當中的特定第三寫碼單元施加特定限制。舉例而言,影像解碼裝置100可將在來自奇數個第三寫碼單元520b、第三寫碼單元520c以及第三寫碼單元520d當中的中心位置處的第三寫碼單元520c限制為不再分裂或分裂可設定次數。
參考圖5,影像解碼裝置100可將第三寫碼單元520c(其在來自包含於非方形第二寫碼單元510中的奇數個第三寫碼單元520b、第三寫碼單元520c以及第三寫碼單元520d當中的中心位置處)限制為不再分裂、藉由使用特定分裂方法分裂(例如,分裂成僅四個寫碼單元或藉由使用第二寫碼單元510的分裂方法來分裂),或僅分裂特定次數(例如,僅分裂n次(其中n>0))。然而,對中心位置處的第三寫碼單元520c的限制不限於上述實例,且可包含用於解碼與其他第三寫碼單元520b及第三寫碼單元520d不同地在中心位置處的第三寫碼單元520c的各種限制。
根據本揭露的實施例,影像解碼裝置100可自當前寫碼單元中的特定位置獲得分裂形狀模式資訊,所述分裂形狀模式資訊用於分裂當前寫碼單元。
圖6示出根據本揭露的實施例的藉由影像解碼裝置100執行的自奇數個寫碼單元當中判定特定寫碼單元的方法。
參考圖6,可自包含於當前寫碼單元600或當前寫碼單元650中的多個樣本當中的特定位置的樣本(例如,中心位置的樣本640或樣本690)獲得當前寫碼單元600或當前寫碼單元650的分裂形狀模式資訊。然而,當前寫碼單元600中的特定位置(可自其獲得至少一條分裂形狀模式資訊)不限於圖6中的中心位置,且可包含包含於當前寫碼單元600中的各種位置(例如,上方、下方、左方、右方、左上方、左下方、右上方以及右下方位置)。影像解碼裝置100可自特定位置獲得分裂形狀模式資訊且可判定將或不將當前寫碼單元分裂成各種形狀及各種大小的寫碼單元。
根據本揭露的實施例,在當前寫碼單元分裂成特定數目個寫碼單元時,影像解碼裝置100可選擇寫碼單元中的一者。如下文相對於本揭露的各種實施例將描述,各種方法可用於選擇多個寫碼單元中的一者。
根據本揭露的實施例,影像解碼裝置100可將當前寫碼單元分裂成多個寫碼單元,且可判定特定位置處的寫碼單元。
根據本揭露的實施例,影像解碼裝置100可使用指示奇數個寫碼單元的位置的資訊自奇數個寫碼單元當中判定中心位置處的寫碼單元。參考圖6,影像解碼裝置100可藉由分裂當前寫碼單元600或當前寫碼單元650判定奇數個寫碼單元620a、寫碼單元620b以及寫碼單元620c或奇數個寫碼單元660a、寫碼單元660b以及寫碼單元660c。影像解碼裝置100可藉由使用關於奇數個寫碼單元620a、寫碼單元620b以及寫碼單元620c或奇數個寫碼單元660a、寫碼單元660b以及寫碼單元660c的位置的資訊來判定中間寫碼單元620b或中間寫碼單元660b。舉例而言,影像解碼裝置100可藉由基於指示包含於寫碼單元620a、寫碼單元620b以及寫碼單元620c中的特定樣本的位置的資訊判定寫碼單元620a、寫碼單元620b以及寫碼單元620c的位置來判定中心位置的寫碼單元620b。詳言之,影像解碼裝置100可藉由基於指示寫碼單元620a、寫碼單元620b以及寫碼單元620c的左上方樣本630a、左上方樣本630b以及左上方樣本630c的位置的資訊判定寫碼單元620a、寫碼單元620b以及寫碼單元620c的位置來判定中心位置處的寫碼單元620b。
根據本揭露的實施例,指示分別包含於寫碼單元620a、寫碼單元620b以及寫碼單元620c中的左上方樣本630a、左上方樣本630b以及左上方樣本630c的位置的資訊可包含關於寫碼單元620a、寫碼單元620b以及寫碼單元620c在圖像中的位置或座標的資訊。根據本揭露的實施例,指示分別包含於寫碼單元620a、寫碼單元620b以及寫碼單元620c中的左上方樣本630a、左上方樣本630b以及左上方樣本630c的位置的資訊可包含指示包含於當前寫碼單元600中的寫碼單元620a、寫碼單元620b以及寫碼單元620c的寬度或高度的資訊,且寬度或高度可對應於指示圖像中的寫碼單元620a、寫碼單元620b以及寫碼單元620c的座標之間的差的資訊。亦即,影像解碼裝置100可藉由直接使用關於寫碼單元620a、寫碼單元620b以及寫碼單元620c在圖像中的位置或座標的資訊或藉由使用關於寫碼單元的寬度或高度的資訊(其對應於座標之間的差值)來判定中心位置處的寫碼單元620b。
根據本揭露的實施例,指示上方寫碼單元620a的左上方樣本630a的位置的資訊可包含座標(xa, ya),指示中間寫碼單元620b的左上方樣本630b的位置的資訊可包含座標(xb, yb),且指示下方寫碼單元620c的左上方樣本630c的位置的資訊可包含座標(xc, yc)。影像解碼裝置100可藉由使用分別包含於寫碼單元620a、寫碼單元620b以及寫碼單元620c中的左上方樣本630a、左上方樣本630b以及左上方樣本630c的座標來判定中間寫碼單元620b。舉例而言,在左上方樣本630a、左上方樣本630b以及左上方樣本630c的座標以升序或降序分類時,包含中心位置處的樣本630b的座標(xb, yb)的寫碼單元620b可判定為藉由分裂當前寫碼單元600判定的寫碼單元620a、寫碼單元620b以及寫碼單元620c當中的中心位置處的寫碼單元。然而,指示左上方樣本630a、左上方樣本630b以及左上方樣本630c的位置的座標可包含指示圖像中的絕對位置的座標,或可參考上方寫碼單元620a的左上方樣本630a的位置使用指示中間寫碼單元620b的左上方樣本630b的相對位置的座標(dxb, dyb)及指示下方寫碼單元620c的左上方樣本630c的相對位置的座標(dxc, dyc)。藉由使用包含於寫碼單元中的樣本的座標作為指示樣本位置的資訊來判定特定位置處的寫碼單元的方法不限於上述方法,且可包含能夠使用樣本座標的各種算術方法。
根據本揭露的實施例,影像解碼裝置100可將當前寫碼單元600分裂成多個寫碼單元620a、寫碼單元620b以及寫碼單元620c,且可基於特定標準選擇寫碼單元620a、寫碼單元620b以及寫碼單元620c中的一者。舉例而言,影像解碼裝置100可自寫碼單元620a、寫碼單元620b以及寫碼單元620c當中選擇寫碼單元620b,所述寫碼單元620b具有與其他寫碼單元的大小不同的大小。
根據本揭露的實施例,影像解碼裝置100可藉由使用以下座標來判定寫碼單元620a、寫碼單元620b以及寫碼單元620c中的每一者的寬度或高度:座標(xa, ya),其為指示上方寫碼單元620a的左上方樣本630a的位置的資訊;座標(xb, yb),其為指示中間寫碼單元620b的左上方樣本630b的位置的資訊;以及座標(xc, yc),其為指示下方寫碼單元620c的左上方樣本630c的位置的資訊。影像解碼裝置100可藉由使用指示寫碼單元620a、寫碼單元620b以及寫碼單元620c的位置的座標(xa, ya)、座標(xb, yb)以及座標(xc, yc)來判定寫碼單元620a、寫碼單元620b以及寫碼單元620c的各別大小。根據本揭露的實施例,影像解碼裝置100可將上方寫碼單元620a的寬度判定為當前寫碼單元600的寬度。影像解碼裝置100可將上方寫碼單元620a的高度判定為yb-ya。根據本揭露的實施例,影像解碼裝置100可將中間寫碼單元620b的寬度判定為當前寫碼單元600的寬度。影像解碼裝置100可將中間寫碼單元620b的高度判定為yc-yb。根據本揭露的實施例,影像解碼裝置100可藉由使用當前寫碼單元600的寬度或高度或上方寫碼單元620a及中間寫碼單元620b的寬度或高度來判定下方寫碼單元620c的寬度或高度。影像解碼裝置100可基於寫碼單元620a至寫碼單元620c的所判定寬度及高度來判定具有與其他寫碼單元的大小不同的大小的寫碼單元。參考圖6,影像解碼裝置100可判定中間寫碼單元620b作為特定位置的寫碼單元,所述中間寫碼單元620b具有與及寫碼單元620a及下方寫碼單元620c的大小不同的大小。然而,藉由影像解碼裝置100執行的判定具有與其他寫碼單元的大小不同的大小的寫碼單元的上述方法僅對應於藉由使用寫碼單元的大小來判定特定位置處的寫碼單元的實例,所述寫碼單元是基於樣本的座標而判定的,且因此可使用藉由比較基於特定樣本的座標而判定的寫碼單元的大小來判定特定位置處的寫碼單元的各種方法。
影像解碼裝置100可藉由使用以下座標來判定寫碼單元660a、寫碼單元660b以及寫碼單元660c中的每一者的寬度或高度:座標(xd, yd),其為指示左方寫碼單元660a的左上方樣本670a的位置的資訊;座標(xe, ye),其為指示中間寫碼單元660b的左上方樣本670b的位置的資訊;以及座標(xf, yf),其為指示右方寫碼單元660c的左上方樣本670c的位置的資訊。影像解碼裝置100可藉由使用指示寫碼單元660a、寫碼單元660b以及寫碼單元660c的位置的座標(xd, yd)、座標(xe, ye)以及座標(xf, yf)來判定寫碼單元660a、寫碼單元660b以及寫碼單元660c的各別大小。
根據本揭露的實施例,影像解碼裝置100可將左方寫碼單元660a的寬度判定為xe-xd。影像解碼裝置100可將左方寫碼單元660a的高度判定為當前寫碼單元650的高度。根據本揭露的實施例,影像解碼裝置100可將中間寫碼單元660b的寬度判定為xf-xe。影像解碼裝置100可將中間寫碼單元660b的高度判定為當前寫碼單元650的高度。根據本揭露的實施例,影像解碼裝置100可藉由使用當前寫碼單元650的寬度或高度或左方寫碼單元660a及中間寫碼單元660b的寬度或高度來判定右方寫碼單元660c的寬度或高度。影像解碼裝置100可基於寫碼單元660a至寫碼單元660c的所判定寬度及高度來判定具有與其他寫碼單元的大小不同的大小的寫碼單元。參考圖6,影像解碼裝置100可將具有與左方寫碼單元660a及右方寫碼單元660c的大小不同的大小的中間寫碼單元660b判定為特定位置的寫碼單元。然而,藉由影像解碼裝置100執行的判定具有與其他寫碼單元的大小不同的大小的寫碼單元的上述方法僅對應於藉由使用寫碼單元的大小來判定特定位置處的寫碼單元的實例,所述寫碼單元是基於樣本的座標而判定的,且因此可使用藉由比較基於特定樣本的座標而判定的寫碼單元的大小來判定特定位置處的寫碼單元的各種方法。
然而,被視為判定寫碼單元的位置的樣本位置不限於上述左上方位置,且可使用關於包含於寫碼單元中的任意樣本位置的資訊。
根據本揭露的實施例,考慮到當前寫碼單元的形狀,影像解碼裝置100可自藉由分裂當前寫碼單元判定的奇數個寫碼單元當中選擇特定位置處的寫碼單元。舉例而言,在當前寫碼單元具有非方形形狀(其寬度長於高度)時,影像解碼裝置100可判定在水平方向上的特定位置處的寫碼單元。亦即,影像解碼裝置100可判定在水平方向上的不同位置處的寫碼單元中的一者並對所述寫碼單元施加限制。在當前寫碼單元具有非方形形狀(其高度長於寬度)時,影像解碼裝置100可判定在垂直方向上的特定位置處的寫碼單元。亦即,影像解碼裝置100可判定在垂直方向上的不同位置處的寫碼單元中的一者並對所述寫碼單元施加限制。
根據本揭露的實施例,影像解碼裝置100可使用指示偶數個寫碼單元的各別位置的資訊自偶數個寫碼單元當中判定特定位置處的寫碼單元。影像解碼裝置100可藉由分裂(二元分裂)當前寫碼單元來判定偶數個寫碼單元,且可藉由使用關於偶數個寫碼單元的位置的資訊來判定特定位置處的寫碼單元。與其相關的操作可對應於自奇數個寫碼單元當中判定特定位置(例如,中心位置)處的寫碼單元的操作,所述操作已在上文相對於圖6詳細描述,且因此,此處並不提供其詳細描述。
根據本揭露的實施例,在非方形當前寫碼單元分裂成多個寫碼單元時,可在分裂操作中使用關於特定位置處的寫碼單元的特定資訊自多個寫碼單元當中判定特定位置處的寫碼單元。舉例而言,影像解碼裝置100可在分裂操作中使用區塊形狀資訊或分裂形狀模式資訊中的至少一者自藉由分裂當前寫碼單元判定的多個寫碼單元當中判定中心位置處的寫碼單元,所述資訊儲存在包含於中間寫碼單元中的樣本中。
參考圖6,影像解碼裝置100可基於分裂形狀模式資訊將當前寫碼單元600分裂成多個寫碼單元620a、寫碼單元620b以及寫碼單元620c,且可自多個寫碼單元620a、寫碼單元620b以及寫碼單元620c當中判定中心位置處的寫碼單元620b。另外,影像解碼裝置100可考慮到自其獲得分裂形狀模式資訊的位置而判定中心位置處的寫碼單元620b。亦即,可自當前寫碼單元600的中心位置處的樣本640獲得當前寫碼單元600的分裂形狀模式資訊,且在當前寫碼單元600基於分裂形狀模式資訊分裂成多個寫碼單元620a、寫碼單元620b以及寫碼單元620c時,包含樣本640的寫碼單元620b可判定為中心位置處的寫碼單元。然而,用於判定中心位置處的寫碼單元的資訊不限於分裂形狀模式資訊,且各種類型的資訊可用於判定中心位置處的寫碼單元。
根據本揭露的實施例,可自包含於待判定的寫碼單元中的特定樣本獲得用於識別特定位置處的寫碼單元的特定資訊。參考圖6,影像解碼裝置100可使用自當前寫碼單元600中的特定位置處的樣本(例如,在當前寫碼單元600的中心位置處的樣本)獲得的分裂形狀模式資訊自藉由分裂當前寫碼單元600判定的多個寫碼單元620a、寫碼單元620b以及寫碼單元620c當中判定特定位置處的寫碼單元(例如,在來自多個分裂寫碼單元當中的中心位置處的寫碼單元)。亦即,影像解碼裝置100可藉由考慮到當前寫碼單元600的區塊形狀來判定特定位置處的樣本,自藉由分裂當前寫碼單元600判定的多個寫碼單元620a、寫碼單元620b以及寫碼單元620c當中判定包含樣本的寫碼單元620b,且可對寫碼單元620b施加特定限制,特定資訊(例如,分裂形狀模式資訊)可自所述樣本獲得。參考圖6,根據本揭露的實施例,影像解碼裝置100可判定當前寫碼單元600的中心位置處的樣本640作為可自其獲得特定資訊的樣本,且可在解碼操作中對包含樣本640的寫碼單元620b施加特定限制。然而,可自其獲得特定資訊的樣本的位置不限於上述位置,且可包含包含於待判定用於限制的寫碼單元620b中的任意樣本位置。
根據本揭露的實施例,可基於當前寫碼單元600的形狀判定可自其獲得特定資訊的樣本的位置。根據本揭露的實施例,區塊形狀資訊可指示當前寫碼單元是具有方形形狀還是非方形形狀,且可基於所述形狀判定可自其獲得特定資訊的樣本的位置。舉例而言,影像解碼裝置100可藉由使用關於當前寫碼單元的寬度的資訊或關於當前寫碼單元的高度的資訊中的至少一者來判定位於用於將當前寫碼單元的寬度或高度中的至少一者分裂成兩半的邊界上的樣本作為可自其獲得特定資訊的樣本。作為另一實例,在當前寫碼單元的區塊形狀資訊指示非方形形狀時,影像解碼裝置100可判定鄰近於用於將當前寫碼單元的長邊分裂成兩半的邊界的樣本中的一者作為可自其獲得特定資訊的樣本。
根據本揭露的實施例,在當前寫碼單元分裂成多個寫碼單元時,影像解碼裝置100可使用分裂形狀模式資訊自多個寫碼單元當中判定特定位置處的寫碼單元。根據本揭露的實施例,影像解碼裝置100可自寫碼單元中的特定位置處的樣本獲得分裂形狀模式資訊,且藉由使用分裂形狀模式資訊來分裂藉由分裂當前寫碼單元產生的多個寫碼單元,所述分裂形狀模式資訊是自多個寫碼單元中的每一者中的特定位置的樣本獲得的。亦即,寫碼單元可基於分裂形狀模式資訊遞歸地分裂,所述分裂形狀模式資訊是自每一寫碼單元中的特定位置處的樣本獲得的。上文已關於圖5描述遞歸地分裂寫碼單元的操作,且因此,此處將並不提供其詳細描述。
根據本揭露的實施例,影像解碼裝置100可藉由分裂當前寫碼單元來判定一或多個寫碼單元,且可基於特定區塊(例如,當前寫碼單元)判定解碼一或多個寫碼單元的次序。
圖7示出根據本揭露的實施例的在影像解碼裝置100藉由分裂當前寫碼單元判定多個寫碼單元時處理多個寫碼單元的次序。
根據本揭露的實施例,影像解碼裝置100可基於分裂形狀模式資訊藉由在垂直方向上分裂第一寫碼單元700來判定第二寫碼單元710a及第二寫碼單元710b,藉由在水平方向上分裂第一寫碼單元700來判定第二寫碼單元730a及第二寫碼單元730b,或藉由在垂直及水平方向上分裂第一寫碼單元700來判定第二寫碼單元750a至第二寫碼單元750d。
參考圖7,影像解碼裝置100可判定按水平方向次序710c處理第二寫碼單元710a及第二寫碼單元710b,所述第二寫碼單元710a及第二寫碼單元710b是藉由在垂直方向上分裂第一寫碼單元700而判定的。影像解碼裝置100可判定按垂直方向次序730c處理第二寫碼單元730a及第二寫碼單元730b,所述第二寫碼單元730a及第二寫碼單元730b是藉由在水平方向上分裂第一寫碼單元700而判定的。影像解碼裝置100可判定根據特定次序(例如,按光柵掃描次序或Z掃描次序750e)處理藉由在垂直及水平方向上分裂第一寫碼單元700而判定的第二寫碼單元750a至第二寫碼單元750d,藉由所述特定次序處理成一列的寫碼單元且接著處理下一列寫碼單元。
根據本揭露的實施例,影像解碼裝置100可遞歸地分裂寫碼單元。參考圖7,影像解碼裝置100可藉由分裂第一寫碼單元700來判定多個寫碼單元710a及寫碼單元710b、寫碼單元730a及寫碼單元730b或寫碼單元750a至寫碼單元750d,且遞歸地分裂所判定的多個寫碼單元710b、寫碼單元730a及寫碼單元730b或寫碼單元750a至寫碼單元750d中的每一者。多個寫碼單元710b、寫碼單元730a及寫碼單元730b或寫碼單元750a至寫碼單元750d的分裂方法可對應於第一寫碼單元700的分裂方法。因此,多個寫碼單元710b、寫碼單元730a及寫碼單元730b或寫碼單元750a至750d中的每一者可獨立地分裂成多個寫碼單元。參考圖7,影像解碼裝置100可藉由在垂直方向上分裂第一寫碼單元700來判定第二寫碼單元710a及第二寫碼單元710b,且可判定獨立地分裂或不分裂第二寫碼單元710a及第二寫碼單元710b中的每一者。
根據本揭露的實施例,影像解碼裝置100可藉由在水平方向上分裂左方第二寫碼單元710a來判定第三寫碼單元720a及第三寫碼單元720b,且可能不分裂右方第二寫碼單元710b。
根據本揭露的實施例,可基於分裂寫碼單元的操作而判定寫碼單元的處理次序。換言之,可基於緊接在分裂之前的寫碼單元的處理次序而判定分裂寫碼單元的處理次序。影像解碼裝置100可判定藉由獨立於右方第二寫碼單元710b分裂左方第二寫碼單元710a而判定的第三寫碼單元720a及第三寫碼單元720b的處理次序。由於第三寫碼單元720a及第三寫碼單元720b是藉由在水平方向上分裂左方第二寫碼單元710a而判定的,所以可按垂直方向次序720c處理第三寫碼單元720a及第三寫碼單元720b。由於左方第二寫碼單元710a及右方第二寫碼單元710b按水平方向次序710c處理,所以可在包含於左方第二寫碼單元710a中的第三寫碼單元720a及第三寫碼單元720b按垂直方向次序720c處理之後處理右方第二寫碼單元710b。基於分裂之前的寫碼單元判定寫碼單元的處理次序的操作不限於上述實例,且各種方法可用於獨立地處理按特定次序分裂且判定成各種形狀的寫碼單元。
圖8示出根據本揭露的實施例的藉由影像解碼裝置100執行的在寫碼單元不可按特定次序處理時判定當前寫碼單元將被分裂成奇數個寫碼單元的程序。
根據本揭露的實施例,影像解碼裝置100可基於所獲得的分裂形狀模式資訊判定當前寫碼單元將被分裂成奇數個寫碼單元。參考圖8,方形第一寫碼單元800可分裂成非方形第二寫碼單元810a及非方形第二寫碼單元810b,且第二寫碼單元810a及第二寫碼單元810b可獨立地分裂成第三寫碼單元820a及第三寫碼單元820b以及第三寫碼單元820c至第三寫碼單元820e。根據本揭露的實施例,影像解碼裝置100可藉由在水平方向上分裂左方第二寫碼單元810a判定多個第三寫碼單元820a及第三寫碼單元820b,且可將右方第二寫碼單元810b分裂成奇數個第三寫碼單元820c至第三寫碼單元820e。
根據本揭露的實施例,影像解碼裝置100可藉由判定第三寫碼單元820a及第三寫碼單元820b以及第三寫碼單元820c至第三寫碼單元820e是否可按特定次序處理來判定任何寫碼單元是否分裂成奇數個寫碼單元。參考圖8,影像解碼裝置100可藉由遞歸地分裂第一寫碼單元800來判定第三寫碼單元820a及第三寫碼單元820b以及第三寫碼單元820c至第三寫碼單元820e。影像解碼裝置100可基於區塊形狀資訊或分裂形狀模式資訊中的至少一者判定第一寫碼單元800、第二寫碼單元810a及第二寫碼單元810b或第三寫碼單元820a及第三寫碼單元820b以及第三寫碼單元820c至第三寫碼單元820e中的任一者是否分裂成奇數個寫碼單元。舉例而言,第二寫碼單元810a及第二寫碼單元810b當中位於右方的第二寫碼單元可分裂成奇數個第三寫碼單元820c、第三寫碼單元820d以及第三寫碼單元820e。包含於第一寫碼單元800中的多個寫碼單元的處理次序可為特定次序(例如,Z掃描次序830),且影像解碼裝置100可判定藉由將右方第二寫碼單元810b分裂成奇數個寫碼單元而判定的第三寫碼單元820c、第三寫碼單元820d以及第三寫碼單元820e是否滿足用於按特定次序處理的條件。
根據本揭露的實施例,影像解碼裝置100可判定包含於第一寫碼單元800中的第三寫碼單元820a及第三寫碼單元820b以及第三寫碼單元820c至第三寫碼單元820e是否滿足用於按特定次序處理的條件,且所述條件是關於第二寫碼單元810a及第二寫碼單元810b的寬度或高度中的至少一者是否將沿第三寫碼單元820a及第三寫碼單元820b以及第三寫碼單元820c至第三寫碼單元820e的邊界被分裂成兩半。舉例而言,在非方形形狀的左方第二寫碼單元810a的高度被分裂成兩半時判定的第三寫碼單元820a及第三寫碼單元820b可能滿足所述條件。由於在右方第二寫碼單元810b分裂成三個寫碼單元時判定的第三寫碼單元820c至第三寫碼單元820e的邊界無法將右方第二寫碼單元810b的寬度或高度分裂成兩半,可判定第三寫碼單元820c至第三寫碼單元820e並不滿足所述條件。在如上文所描述未滿足條件時,影像解碼裝置100可判定掃描次序的斷開,且可基於判定結果判定右方第二寫碼單元810b將被分裂成奇數個寫碼單元。根據本揭露的實施例,在寫碼單元分裂成奇數個寫碼單元時,影像解碼裝置100可對分裂寫碼單元當中的特定位置處的寫碼單元施加特定限制。上文已關於本揭露的各種實施例描述限制或特定位置,且因此,不再提供其詳細描述。
圖9示出根據本揭露的實施例的藉由影像解碼裝置100執行的藉由分裂第一寫碼單元900來判定至少一個寫碼單元的程序。
根據本揭露的實施例,影像解碼裝置100可基於經由位元串流獲得器110獲得的分裂形狀模式資訊來分裂第一寫碼單元900。方形第一寫碼單元900可分裂成四個方形寫碼單元,或可分裂成多個非方形寫碼單元。舉例而言,參考圖9,在分裂形狀模式資訊指示將第一寫碼單元900分裂成非方形寫碼單元時,影像解碼裝置100可將第一寫碼單元900分裂成多個非方形寫碼單元。詳言之,在分裂形狀模式資訊指示藉由在水平方向或垂直方向上分裂第一寫碼單元900來判定奇數個寫碼單元時,影像解碼裝置100可將方形第一寫碼單元900分裂成奇數個寫碼單元,例如,藉由在垂直方向上分裂方形第一寫碼單元900判定的第二寫碼單元910a、第二寫碼單元910b以及第二寫碼單元910c,或藉由在水平方向上分裂方形第一寫碼單元900判定的第二寫碼單元920a、第二寫碼單元920b以及第二寫碼單元920c。
根據本揭露的實施例,影像解碼裝置100可判定包含於第一寫碼單元900中的第二寫碼單元910a、第二寫碼單元910b、第二寫碼單元910c、第二寫碼單元920a、第二寫碼單元920b以及第二寫碼單元920c是否滿足用於按特定次序處理的條件,且所述條件是關於第一寫碼單元900的寬度或高度中的至少一者是否將沿第二寫碼單元910a、第二寫碼單元910b、第二寫碼單元910c、第二寫碼單元920a、第二寫碼單元920b以及第二寫碼單元920c的邊界被分裂成兩半。參考圖9,由於藉由在垂直方向上分裂方形第一寫碼單元900判定的第二寫碼單元910a、第二寫碼單元910b以及第二寫碼單元910c的邊界並不將第一寫碼單元900的寬度分裂成兩半,可判定第一寫碼單元900並不滿足用於按特定次序處理的條件。另外,由於藉由在水平方向上分裂方形第一寫碼單元900判定的第二寫碼單元920a、第二寫碼單元920b以及第二寫碼單元920c的邊界並不將第一寫碼單元900的高度分裂成兩半,可判定第一寫碼單元900並不滿足用於按特定次序處理的條件。在如上文所描述未滿足條件時,影像解碼裝置100可決定掃描次序的斷開,且可基於決定的結果判定第一寫碼單元900將被分裂成奇數個寫碼單元。根據本揭露的實施例,在寫碼單元分裂成奇數個寫碼單元時,影像解碼裝置100可對分裂寫碼單元當中的特定位置處的寫碼單元施加特定限制。上文已關於本揭露的各種實施例描述限制或特定位置,且因此,不再提供其詳細描述。
根據本揭露的實施例,影像解碼裝置100可藉由分裂第一寫碼單元來判定各種形狀的寫碼單元。
參考圖9,影像解碼裝置100可將方形第一寫碼單元900或非方形第一寫碼單元930或非方形第一寫碼單元950分裂成各種形狀的寫碼單元。
圖10示出根據本揭露的實施例在影像解碼裝置100分裂第一寫碼單元1000時判定的具有非方形形狀的第二寫碼單元滿足特定條件時所述第二寫碼單元可分裂成的形狀受限制。
根據本揭露的實施例,影像解碼裝置100可基於藉由位元串流獲得器110獲得的分裂形狀模式資訊判定將方形第一寫碼單元1000分裂成非方形第二寫碼單元1010a及非方形第二寫碼單元1010b或非方形第二寫碼單元1020a及非方形第二寫碼單元1020b。第二寫碼單元1010a及第二寫碼單元1010b或第二寫碼單元1020a及第二寫碼單元1020b可獨立地分裂。因此,影像解碼裝置100可基於第二寫碼單元1010a及第二寫碼單元1010b或第二寫碼單元1020a及第二寫碼單元1020b中的每一者的分裂形狀模式資訊判定將或不將第二寫碼單元1010a及第二寫碼單元1010b或第二寫碼單元1020a及第二寫碼單元1020b中的每一者分裂成多個寫碼單元。根據本揭露的實施例,影像解碼裝置100可藉由在水平方向上分裂非方形左方第二寫碼單元1010a來判定第三寫碼單元1012a及第三寫碼單元1012b,所述非方形左方第二寫碼單元1010a是藉由在垂直方向上分裂第一寫碼單元1000而判定的。然而,在左方第二寫碼單元1010a在水平方向上分裂時,影像解碼裝置100可將右方第二寫碼單元1010b限制為不在左方第二寫碼單元1010a分裂的水平方向上分裂。在藉由在同一方向上分裂右方第二寫碼單元1010b來判定第三寫碼單元1014a及第三寫碼單元1014b時,由於左方第二寫碼單元1010a及右方第二寫碼單元1010b在水平方向上獨立地分裂,可判定第三寫碼單元1012a及第三寫碼單元1012b或第三寫碼單元1014a及第三寫碼單元1014b。然而,此情況同樣用作影像解碼裝置100基於分裂形狀模式資訊來將第一寫碼單元1000分裂成四個方形第二寫碼單元1030a、方形第二寫碼單元1030b、方形第二寫碼單元1030c以及方形第二寫碼單元1030d的情況,且就影像解碼而言可為低效的。
根據本揭露的實施例,影像解碼裝置100可藉由在垂直方向上分裂非方形第二寫碼單元1020a或非方形第二寫碼單元1020b來判定第三寫碼單元1022a及第三寫碼單元1022b或第三寫碼單元1024a及第三寫碼單元1024b,所述非方形第二寫碼單元1020a或非方形第二寫碼單元1020b是藉由在水平方向上分裂第一寫碼單元1000而判定的。然而,在第二寫碼單元(例如,上方第二寫碼單元1020a)在垂直方向上分裂時,出於上述原因,影像解碼裝置100可將其他第二寫碼單元(例如,下方第二寫碼單元1020b)限制為不在上方第二寫碼單元1020a分裂的垂直方向上分裂。
圖11示出根據本揭露的實施例的藉由影像解碼裝置100執行的在分裂形狀模式資訊不能指示方形寫碼單元被分裂成四個方形寫碼單元時分裂方形寫碼單元的程序。
根據本揭露的實施例,影像解碼裝置100可藉由基於分裂形狀模式資訊分裂第一寫碼單元1100來判定第二寫碼單元1110a及第二寫碼單元1110b或第二寫碼單元1120a及第二寫碼單元1120b等等。分裂形狀模式資訊可包含關於分裂寫碼單元的各種方法的資訊,但關於各種分裂方法的資訊可不包含用於將寫碼單元分裂成四個方形寫碼單元的資訊。根據此分裂形狀模式資訊,影像解碼裝置100可能不將方形第一寫碼單元1100分裂成四個方形第二寫碼單元1130a、方形第二寫碼單元1130b、方形第二寫碼單元1130c以及方形第二寫碼單元1130d。影像解碼裝置100可基於分裂形狀模式資訊判定非方形第二寫碼單元1110a及非方形第二寫碼單元1110b或非方形第二寫碼單元1120a及非方形第二寫碼單元1120b等等。
根據本揭露的實施例,影像解碼裝置100可獨立地分裂非方形第二寫碼單元1110a及非方形第二寫碼單元1110b或非方形第二寫碼單元1120a及非方形第二寫碼單元1120b等等。第二寫碼單元1110a及第二寫碼單元1110b或第二寫碼單元1120a及第二寫碼單元1120b等等中的每一者可按特定次序遞歸地分裂,且此分裂方法可對應於基於分裂形狀模式資訊分裂第一寫碼單元1100的方法。
舉例而言,影像解碼裝置100可藉由在水平方向上分裂左方第二寫碼單元1110a來判定方形第三寫碼單元1112a及方形第三寫碼單元1112b,且可藉由在水平方向上分裂右方第二寫碼單元1110b來判定方形第三寫碼單元1114a及方形第三寫碼單元1114b。另外,影像解碼裝置100可藉由在水平方向上分裂左方第二寫碼單元1110a及右方第二寫碼單元1110b兩者來判定方形第三寫碼單元1116a、方形第三寫碼單元1116b、方形第三寫碼單元1116c以及方形第三寫碼單元1116d。在此情況下,可判定具有與自第一寫碼單元1100分裂的四個方形第二寫碼單元1130a、方形第二寫碼單元1130b、方形第二寫碼單元1130c以及方形第二寫碼單元1130d相同的形狀的寫碼單元。
作為另一實例,影像解碼裝置100可藉由在垂直方向上分裂上方第二寫碼單元1120a來判定方形第三寫碼單元1122a及方形第三寫碼單元1122b,且可藉由在垂直方向上分裂下方第二寫碼單元1120b來判定方形第三寫碼單元1124a及方形第三寫碼單元1124b。另外,影像解碼裝置100可藉由在垂直方向上分裂上方第二寫碼單元1120a及下方第二寫碼單元1120b兩者來判定方形第三寫碼單元1126a、方形第三寫碼單元1126b、方形第三寫碼單元1126c以及方形第三寫碼單元1126d。在此情況下,可判定具有與自第一寫碼單元1100分裂的四個方形第二寫碼單元1130a、方形第二寫碼單元1130b、方形第二寫碼單元1130c以及方形第二寫碼單元1130d相同的形狀的寫碼單元。
圖12示出根據本揭露的實施例多個寫碼單元之間的處理次序可取決於分裂寫碼單元的程序而改變。
根據本揭露的實施例,影像解碼裝置100可基於分裂形狀模式資訊來分裂第一寫碼單元1200。在區塊形狀指示方形形狀且分裂形狀模式資訊指示在水平方向或垂直方向中的至少一者上分裂第一寫碼單元1200時,影像解碼裝置100可藉由分裂第一寫碼單元1200來判定第二寫碼單元1210a及第二寫碼單元1210b或第二寫碼單元1220a及第二寫碼單元1220b等等。參考圖12,藉由僅在水平方向或垂直方向上分裂第一寫碼單元1200而判定的非方形第二寫碼單元1210a及非方形第二寫碼單元1210b或非方形第二寫碼單元1220a及非方形第二寫碼單元1220b可基於每一寫碼單元的分裂形狀模式資訊獨立地分裂。舉例而言,影像解碼裝置100可藉由在水平方向上分裂第二寫碼單元1210a及第二寫碼單元1210b來判定第三寫碼單元1216a、第三寫碼單元1216b、第三寫碼單元1216c以及第三寫碼單元1216d,所述第二寫碼單元1210a及第二寫碼單元1210b是藉由在垂直方向上分裂第一寫碼單元1200而產生的,且可藉由在垂直方向上分裂第二寫碼單元1220a及第二寫碼單元1220b來判定第三寫碼單元1226a、第三寫碼單元1226b、第三寫碼單元1226c以及第三寫碼單元1226d,所述第二寫碼單元1220a及第二寫碼單元1220b是藉由在水平方向上分裂第一寫碼單元1200而產生的。上文描述分裂第二寫碼單元1210a及第二寫碼單元1210b或第二寫碼單元1220a及第二寫碼單元1220b的操作與圖11有關聯,且因此,本文中將不提供其詳細描述。
根據本揭露的實施例,影像解碼裝置100可按特定次序處理寫碼單元。上文已關於圖7描述按特定次序處理寫碼單元的操作,且因此,不再提供其詳細描述。參考圖12,影像解碼裝置100可藉由分裂方形第一寫碼單元1200來判定四個方形第三寫碼單元1216a、方形第三寫碼單元1216b、方形第三寫碼單元1216c以及方形第三寫碼單元1216d及方形第三寫碼單元1226a、方形第三寫碼單元1226b、方形第三寫碼單元1226c以及方形第三寫碼單元1226d。根據本揭露的實施例,影像解碼裝置100可基於第一寫碼單元1200的分裂方法判定第三寫碼單元1216a、第三寫碼單元1216b、第三寫碼單元1216c以及第三寫碼單元1216d及第三寫碼單元1226a、第三寫碼單元1226b、第三寫碼單元1226c以及第三寫碼單元1226d的處理次序。
根據本揭露的實施例,影像解碼裝置100可藉由在水平方向上分裂藉由在垂直方向上分裂第一寫碼單元1200而產生的第二寫碼單元1210a及第二寫碼單元1210b來判定第三寫碼單元1216a、第三寫碼單元1216b、第三寫碼單元1216c以及第三寫碼單元1216d,且可按處理次序1217處理第三寫碼單元1216a、第三寫碼單元1216b、第三寫碼單元1216c以及第三寫碼單元1216d,所述處理次序1217用於最初在垂直方向上處理包含於左方第二寫碼單元1210a中的第三寫碼單元1216a及第三寫碼單元1216c,且接著在垂直方向上處理包含於右方第二寫碼單元1210b中的第三寫碼單元1216b及第三寫碼單元1216d。
根據本揭露的實施例,影像解碼裝置100可藉由在垂直方向上分裂藉由在水平方向上分裂第一寫碼單元1200而產生的第二寫碼單元1220a及第二寫碼單元1220b來判定第三寫碼單元1226a、第三寫碼單元1226b、第三寫碼單元1226c以及第三寫碼單元1226d,且可按處理次序1227處理第三寫碼單元1226a、第三寫碼單元1226b、第三寫碼單元1226c以及第三寫碼單元1226d,所述處理次序1227用於最初在水平方向上處理包含於上方第二寫碼單元1220a中的第三寫碼單元1226a及第三寫碼單元1226b,且接著在水平方向上處理包含於下方第二寫碼單元1220b中的第三寫碼單元1226c及第三寫碼單元1226d。
參考圖12,可藉由分裂第二寫碼單元1210a及第二寫碼單元1210b以及第二寫碼單元1220a及第二寫碼單元1220b來分別地判定方形第三寫碼單元1216a、方形第三寫碼單元1216b、方形第三寫碼單元1216c以及方形第三寫碼單元1216d及方形第三寫碼單元1226a、方形第三寫碼單元1226b、方形第三寫碼單元1226c以及方形第三寫碼單元1226d。儘管與藉由在水平方向上分裂第一寫碼單元1200而判定的第二寫碼單元1220a及第二寫碼單元1220b不同地藉由在垂直方向上分裂第一寫碼單元1200來判定第二寫碼單元1210a及第二寫碼單元1210b,但自其分裂的第三寫碼單元1216a、第三寫碼單元1216b、第三寫碼單元1216c以及第三寫碼單元1216d與第三寫碼單元1226a、第三寫碼單元1226b、第三寫碼單元1226c以及第三寫碼單元1226d最終展現自第一寫碼單元1200分裂的相同形狀的寫碼單元。因此,藉由基於分裂形狀模式資訊以不同方式遞歸地分裂寫碼單元,影像解碼裝置100即使在多個寫碼單元最終判定為相同形狀時亦可按不同次序處理寫碼單元。
圖13示出根據本揭露的實施例在寫碼單元遞歸地分裂以使多個寫碼單元得以判定時在寫碼單元的形狀及大小改變時判定寫碼單元的深度的程序。
根據本揭露的實施例,影像解碼裝置100可基於特定標準判定寫碼單元的深度。舉例而言,特定標準可為寫碼單元的長邊的長度。在寫碼單元在分裂之前的長邊的長度為分裂的當前寫碼單元的長邊的長度的2n倍(n>0)時,影像解碼裝置100可判定當前寫碼單元的深度自寫碼單元在分裂之前的深度增加n。在以下描述中,將具有增加的深度的寫碼單元表達為較深深度的寫碼單元。
參考圖13,根據本揭露的實施例,影像解碼裝置100可藉由基於指示方形形狀的區塊形狀資訊(例如區塊形狀資訊可表達為『0: SQUARE』)分裂方形第一寫碼單元1300來判定較深深度的第二寫碼單元1302及第三寫碼單元1304。假設方形第一寫碼單元1300的大小為2N×2N,則藉由以1/2分裂第一寫碼單元1300的寬度及高度而判定的第二寫碼單元1302可具有N×N大小。另外,藉由以1/2分裂第二寫碼單元1302的寬度及高度而判定的第三寫碼單元1304可具有N/2×N/2大小。在此情況下,第三寫碼單元1304的寬度及高度為第一寫碼單元1300的寬度及高度的1/4倍。在第一寫碼單元1300的深度為D時,寬度及高度為第一寫碼單元1300的寬度及高度的1/2倍的第二寫碼單元1302的深度可為D+1,且寬度及高度為第一寫碼單元1300的寬度及高度的1/4倍的第三寫碼單元1304的深度可為D+2。
根據本揭露的實施例,影像解碼裝置100可藉由基於指示非方形形狀的區塊形狀資訊(例如區塊形狀資訊可表達為指示非方形形狀(其高度長於寬度)的『1: NS_VER』或表達為指示非方形形狀(其寬度長於高度)的『2: NS_HOR』)分裂非方形第一寫碼單元1310或非方形第一寫碼單元1320來判定較深深度的第二寫碼單元1312或第二寫碼單元1322及第三寫碼單元1314或第三寫碼單元1324。
影像解碼裝置100可藉由分裂具有N×2N大小的第一寫碼單元1310的寬度或高度中的至少一者來判定第二寫碼單元1302、第二寫碼單元1312或第二寫碼單元1322。亦即,影像解碼裝置100可藉由在水平方向上分裂第一寫碼單元1310來判定具有N×N大小的第二寫碼單元1302或具有N×N/2大小的第二寫碼單元1322,或可藉由在水平及垂直方向上分裂第一寫碼單元1310來判定具有N/2×N大小的第二寫碼單元1312。
根據本揭露的實施例,影像解碼裝置100可藉由分裂具有2N×N大小的第一寫碼單元1320的寬度或高度中的至少一者來判定第二寫碼單元1302、第二寫碼單元1312或第二寫碼單元1322。亦即,影像解碼裝置100可藉由在垂直方向上分裂第一寫碼單元1320來判定具有N×N大小的第二寫碼單元1302或具有N/2×N大小的第二寫碼單元1312,或可藉由在水平及垂直方向上分裂第一寫碼單元1320來判定具有N×N/2大小的第二寫碼單元1322。
根據本揭露的實施例,影像解碼裝置100可藉由分裂具有N×N大小的第二寫碼單元1302的寬度或高度中的至少一者來判定第三寫碼單元1304、第三寫碼單元1314或第三寫碼單元1324。亦即,影像解碼裝置100可藉由在垂直及水平方向上分裂第二寫碼單元1302來判定具有N/2×N/2大小的第三寫碼單元1304、具有N/4×N/2大小的第三寫碼單元1314,或具有N/2×N/4大小的第三寫碼單元1324。
根據本揭露的實施例,影像解碼裝置100可藉由分裂具有N/2×N大小的第二寫碼單元1312的寬度或高度中的至少一者來判定第三寫碼單元1304、第三寫碼單元1314或第三寫碼單元1324。亦即,影像解碼裝置100可藉由在水平方向上分裂第二寫碼單元1312來判定具有N/2×N/2大小的第三寫碼單元1304或具有N/2×N/4大小的第三寫碼單元1324,或可藉由在垂直及水平方向上分裂第二寫碼單元1312來判定具有N/4×N/2大小的第三寫碼單元1314。
根據本揭露的實施例,影像解碼裝置100可藉由分裂具有N×N/2大小的第二寫碼單元1322的寬度或高度中的至少一者來判定第三寫碼單元1304、第三寫碼單元1314或第三寫碼單元1324。亦即,影像解碼裝置100可藉由在垂直方向上分裂第二寫碼單元1322來判定具有N/2×N/2大小的第三寫碼單元1304或具有N/4×N/2大小的第三寫碼單元1314,或可藉由在垂直及水平方向上分裂第二寫碼單元1322來判定具有N/2×N/4大小的第三寫碼單元1324。
根據本揭露的實施例,影像解碼裝置100可在水平或垂直方向上分裂方形寫碼單元1300、方形寫碼單元1302或方形寫碼單元1304。舉例而言,影像解碼裝置100可藉由在垂直方向上分裂具有2N×2N大小的第一寫碼單元1300來判定具有N×2N大小的第一寫碼單元1310,或可藉由在水平方向上分裂第一寫碼單元1300來判定具有2N×N大小的第一寫碼單元1320。根據本揭露的實施例,在基於寫碼單元的最長邊的長度判定深度時,藉由在水平或垂直方向上分裂具有2N×2N大小的第一寫碼單元1300而判定的寫碼單元的深度可與第一寫碼單元1300的深度相同。
根據本揭露的實施例,第三寫碼單元1314或第三寫碼單元1324的寬度及高度可為第一寫碼單元1310或第一寫碼單元1320的寬度及高度的1/4倍。在第一寫碼單元1310或第一寫碼單元1320的深度為D時,寬度及高度為第一寫碼單元1310或第一寫碼單元1320的寬度及高度的1/2倍的第二寫碼單元1312或第二寫碼單元1322的深度可為D+1,且寬度及高度為第一寫碼單元1310或第一寫碼單元1320的寬度及高度的1/4倍的第三寫碼單元1314或第三寫碼單元1324的深度可為D+2。
圖14示出根據本揭露的實施例的可基於寫碼單元的形狀及大小判定的深度及用於區分寫碼單元的部分索引(PID)。
根據本揭露的實施例,影像解碼裝置100可藉由分裂方形第一寫碼單元1400來判定各種形狀的第二寫碼單元。參考圖14,影像解碼裝置100可藉由基於分裂形狀模式資訊在垂直方向及水平方向中的至少一者上分裂第一寫碼單元1400來判定第二寫碼單元1402a及第二寫碼單元1402b、第二寫碼單元1404a及第二寫碼單元1404b以及第二寫碼單元1406a、第二寫碼單元1406b、第二寫碼單元1406c以及第二寫碼單元1406d。亦即,影像解碼裝置100可基於第一寫碼單元1400的分裂形狀模式資訊判定第二寫碼單元1402a及第二寫碼單元1402b、第二寫碼單元1404a及第二寫碼單元1404b以及第二寫碼單元1406a、第二寫碼單元1406b、第二寫碼單元1406c以及第二寫碼單元1406d。
根據本揭露的實施例,可基於第二寫碼單元1402a及第二寫碼單元1402b、第二寫碼單元1404a及第二寫碼單元1404b以及第二寫碼單元1406a、第二寫碼單元1406b、第二寫碼單元1406c以及第二寫碼單元1406d的長邊的長度判定其深度,所述第二寫碼單元1402a及第二寫碼單元1402b、第二寫碼單元1404a及第二寫碼單元1404b以及第二寫碼單元1406a、第二寫碼單元1406b、第二寫碼單元1406c以及第二寫碼單元1406d是基於方形第一寫碼單元1400的分裂形狀模式資訊而判定的。舉例而言,由於方形第一寫碼單元1400的邊的長度等於非方形第二寫碼單元1402a及非方形第二寫碼單元1402b以及非方形第二寫碼單元1404a及非方形第二寫碼單元1404b的長邊的長度,所以第一寫碼單元2100及非方形第二寫碼單元1402a及非方形第二寫碼單元1402b以及非方形第二寫碼單元1404a及非方形第二寫碼單元1404b可具有相同深度,例如D。然而,在影像解碼裝置100基於分裂形狀模式資訊將第一寫碼單元1400分裂成四個方形第二寫碼單元1406a、方形第二寫碼單元1406b、方形第二寫碼單元1406c以及方形第二寫碼單元1406d時,由於方形第二寫碼單元1406a、方形第二寫碼單元1406b、方形第二寫碼單元1406c以及方形第二寫碼單元1406d的邊的長度為第一寫碼單元1400的邊的長度的1/2倍,所以第二寫碼單元1406a、第二寫碼單元1406b、第二寫碼單元1406c以及第二寫碼單元1406d的深度可為D+1,比第一寫碼單元1400的深度D更深1。
根據本揭露的實施例,影像解碼裝置100可藉由基於分裂形狀模式資訊在水平方向上分裂第一寫碼單元1410(其高度長於寬度)來判定多個第二寫碼單元1412a及第二寫碼單元1412b以及第二寫碼單元1414a、第二寫碼單元1414b以及第二寫碼單元1414c。根據本揭露的實施例,影像解碼裝置100可藉由基於分裂形狀模式資訊在垂直方向上分裂第一寫碼單元1420(其寬度長於高度)來判定多個第二寫碼單元1422a及第二寫碼單元1422b以及第二寫碼單元1424a、第二寫碼單元1424b以及第二寫碼單元1424c。
根據本揭露的實施例,基於非方形第一寫碼單元1410或非方形第一寫碼單元1420的分裂形狀模式資訊而判定的第二寫碼單元1412a及第二寫碼單元1412b以及第二寫碼單元1414a、第二寫碼單元1414b以及第二寫碼單元1414c或第二寫碼單元1422a及第二寫碼單元1422b以及第二寫碼單元1424a、第二寫碼單元1424b以及第二寫碼單元1424c的深度可基於其長邊的長度而判定。舉例而言,由於方形第二寫碼單元1412a及方形第二寫碼單元1412b的邊的長度為具有非方形形狀(其高度長於寬度)的第一寫碼單元1410的長邊的長度的1/2倍,所以方形第二寫碼單元1412a及方形第二寫碼單元1412b的深度為D+1,比非方形第一寫碼單元1410的深度D更深1。
另外,影像解碼裝置100可基於分裂形狀模式資訊將非方形第一寫碼單元1410分裂成奇數個第二寫碼單元1414a、第二寫碼單元1414b以及第二寫碼單元1414c。奇數個第二寫碼單元1414a、第二寫碼單元1414b以及第二寫碼單元1414c可包含非方形第二寫碼單元1414a及非方形第二寫碼單元1414c以及方形第二寫碼單元1414b。在此情況下,由於非方形第二寫碼單元1414a及非方形第二寫碼單元1414c的長邊的長度及方形第二寫碼單元1414b的邊的長度為第一寫碼單元1410的長邊的長度的1/2倍,所以第二寫碼單元1414a、第二寫碼單元1414b以及第二寫碼單元1414c的深度可為D+1,比非方形第一寫碼單元1410的深度D更深1。影像解碼裝置100可藉由使用判定自第一寫碼單元1410分裂的寫碼單元的深度的上述方法來判定自具有非方形形狀(其寬度長於高度)的第一寫碼單元1420分裂的寫碼單元的深度。
根據本揭露的實施例,影像解碼裝置100可基於在奇數個分裂寫碼單元並不具有相同大小時的寫碼單元之間的大小比來判定用於識別分裂寫碼單元的PID。參考圖14,奇數個分裂寫碼單元1414a、寫碼單元1414b以及寫碼單元1414c當中的中心位置的寫碼單元1414b的寬度可等於其他寫碼單元1414a及寫碼單元1414c的寬度且其高度為其他寫碼單元1414a及寫碼單元1414c的高度的兩倍。亦即,在此情況下,中心位置處的寫碼單元1414b可包含其他寫碼單元1414a或寫碼單元1414c兩者。因此,在中心位置處的寫碼單元1414b的PID基於掃描次序為1時,緊鄰寫碼單元1414b定位的寫碼單元1414c的PID可增加2且因此可為3。亦即,可能存在PID值的不連續性。根據本揭露的實施例,影像解碼裝置100可基於用於識別分裂寫碼單元的PID中是否存在不連續性來判定奇數個分裂寫碼單元是否並不具有相同大小。
根據本揭露的實施例,影像解碼裝置100可基於用於識別藉由分裂當前寫碼單元而判定的多個寫碼單元的PID值來判定是否使用特定分裂方法。參考圖14,影像解碼裝置100可藉由分裂具有矩形形狀(其高度長於寬度)的第一寫碼單元1410來判定偶數個寫碼單元1412a及寫碼單元1412b或奇數個寫碼單元1414a、寫碼單元1414b以及寫碼單元1414c。影像解碼裝置100可使用指示各別寫碼單元的PID以便識別各別寫碼單元。根據本揭露的實施例,可自每一寫碼單元的特定位置的樣本(例如,左上方樣本)獲得PID。
根據本揭露的實施例,影像解碼裝置100可藉由使用用於區分寫碼單元的PID而自分裂寫碼單元當中判定特定位置處的寫碼單元。根據本揭露的實施例,在具有矩形形狀(其高度長於寬度)的第一寫碼單元1410的分裂形狀模式資訊指示將寫碼單元分裂成三個寫碼單元時,影像解碼裝置100可將第一寫碼單元1410分裂成三個寫碼單元1414a、寫碼單元1414b以及寫碼單元1414c。影像解碼裝置100可將PID指派給三個寫碼單元1414a、寫碼單元1414b以及寫碼單元1414c中的每一者。影像解碼裝置100可比較奇數個分裂寫碼單元的PID以自寫碼單元當中判定中心位置處的寫碼單元。影像解碼裝置100可判定具有對應於寫碼單元的PID當中的中值的PID的寫碼單元1414b作為藉由分裂第一寫碼單元1410判定的寫碼單元當中的中心位置處的寫碼單元。根據本揭露的實施例,影像解碼裝置100可基於在分裂寫碼單元並不具有相同大小時的寫碼單元之間的大小比來判定用於區分分裂寫碼單元的PID。參考圖14,藉由分裂第一寫碼單元1410產生的寫碼單元1414b的寬度可等於其他寫碼單元1414a及寫碼單元1414c的寬度且其高度為其他寫碼單元1414a及寫碼單元1414c的高度的兩倍。在此情況下,在中心位置處的寫碼單元1414b的PID為1時,緊鄰寫碼單元1414b定位的寫碼單元1414c的PID可增加2且因此可為3。在如上文所描述PID並未均勻地增加時,影像解碼裝置100可判定寫碼單元分裂成包含大小與其他寫碼單元的大小不同的寫碼單元的多個寫碼單元。根據本揭露的實施例,在分裂形狀模式資訊指示將寫碼單元分裂成奇數個寫碼單元時,影像解碼裝置100可以使得奇數個寫碼單元當中的特定位置的寫碼單元(例如,中心位置的寫碼單元)的大小與其他寫碼單元的大小不同的方式來分裂當前寫碼單元。在此情況下,影像解碼裝置100可藉由使用寫碼單元的PID來判定中心位置的寫碼單元,所述寫碼單元具有不同大小。然而,特定位置的寫碼單元的PID及大小或位置不限於上述實例,且可使用寫碼單元的各種PID以及各種位置及大小。
根據本揭露的實施例,影像解碼裝置100可使用開始遞歸地分裂寫碼單元的特定資料單元。
圖15示出根據本揭露的實施例基於包含於圖像中的多個特定資料單元來判定多個寫碼單元。
根據本揭露的實施例,特定資料單元可定義為藉由使用分裂形狀模式資訊開始遞歸地分裂寫碼單元的資料單元。亦即,特定資料單元可對應於最高深度的寫碼單元,其用於判定自當前圖像分裂的多個寫碼單元。在以下描述中,為方便解釋,特定資料單元被稱作參考資料單元。
根據本揭露的實施例,參考資料單元可具有特定大小及特定大小形狀。根據本揭露的實施例,參考資料單元可包含M×N個樣本。本文中,M及N可彼此相等,且可為表達為2的冪的整數。亦即,參考資料單元可具有方形或非方形形狀,且可分裂成整數數目個寫碼單元。
根據本揭露的實施例,影像解碼裝置100可將當前圖像分裂成多個參考資料單元。根據本揭露的實施例,影像解碼裝置100可藉由使用每一參考資料單元的分裂形狀模式資訊來分裂多個參考資料單元,所述多個參考資料單元是自當前圖像分裂的。分裂參考資料單元的操作可對應於使用四元樹結構的分裂操作。
根據本揭露的實施例,影像解碼裝置100可預先判定包含於當前圖像中的參考資料單元所允許的最小大小。相應地,影像解碼裝置100可判定大小等於或大於最小大小的各種參考資料單元,且可參考所判定的參考資料單元藉由使用分裂形狀模式資訊來判定一或多個寫碼單元。
參考圖15,影像解碼裝置100可使用方形參考寫碼單元1500或非方形參考寫碼單元1502。根據本揭露的實施例,可基於能夠包含一或多個參考寫碼單元(例如,序列、圖像、切片、切片片段、圖塊、圖塊群組、最大寫碼單元或類似者)的各種資料單元來判定參考寫碼單元的形狀及大小。
根據本揭露的實施例,影像解碼裝置100的位元串流獲得器110可自位元串流獲得關於各種資料單元中的每一者的參考寫碼單元形狀資訊或參考寫碼單元大小資訊中的至少一者。上文將方形參考寫碼單元1500分裂成一或多個寫碼單元的操作是相關聯於分裂圖3的當前寫碼單元300的操作描述,且上文將非方形參考寫碼單元1502分裂成一或多個寫碼單元的操作是相關聯於分裂圖4的當前寫碼單元400或當前寫碼單元450的操作描述。因此,不再提供其詳細描述。
根據本揭露的實施例,影像解碼裝置100可根據先前基於特定條件判定的一些資料單元使用用於識別參考寫碼單元的大小及形狀的PID來判定參考寫碼單元的大小及形狀。亦即,位元串流獲得器110可僅自位元串流獲得用於關於每一切片、切片片段、圖塊、圖塊群組或最大寫碼單元識別參考寫碼單元的大小及形狀的PID,所述最大寫碼單元為各種資料單元(例如,序列、圖像、切片、切片片段、圖塊、圖塊群組、最大寫碼單元或類似者)當中的滿足特定條件的資料單元(例如,具有等於或小於切片的大小的資料單元)。影像解碼裝置100可關於滿足特定條件的每一資料單元藉由使用PID判定參考資料單元的大小及形狀。在根據具有相對較小大小的每一資料單元自位元串流獲得及使用參考寫碼單元形狀資訊及參考寫碼單元大小資訊時,使用位元串流的效率可能不高,且因此,僅可獲得及使用PID而非直接地獲得參考寫碼單元形狀資訊及參考寫碼單元大小資訊。在此情況下,可先前判定對應於用於識別參考寫碼單元的大小及形狀的PID的參考寫碼單元的大小或形狀中的至少一者。亦即,影像解碼裝置100可藉由基於PID選擇先前判定的參考寫碼單元的大小或形狀中的至少一者來判定包含於充當用於獲得PID的單元的資料單元中的參考寫碼單元的大小或形狀中的至少一者。
根據本揭露的實施例,影像解碼裝置100可使用包含於最大寫碼單元中的一或多個參考寫碼單元。亦即,自圖像分裂的最大寫碼單元可包含一或多個參考寫碼單元,且可藉由遞歸地分裂每一參考寫碼單元來判定寫碼單元。根據本揭露的實施例,最大寫碼單元的寬度或高度中的至少一者可為參考寫碼單元的寬度或高度中的至少一者的整數倍。根據本揭露的實施例,可藉由基於四元樹結構將最大寫碼單元分裂n次來獲得參考寫碼單元的大小。亦即,根據本揭露的各種實施例,影像解碼裝置100可藉由基於四元樹結構將最大寫碼單元分裂n次來判定參考寫碼單元,且可基於區塊形狀資訊或分裂形狀模式資訊中的至少一者來分裂參考寫碼單元。
根據本揭露的實施例,影像解碼裝置100可自位元串流獲得指示當前寫碼單元的形狀的區塊形狀資訊或指示當前寫碼單元的分裂方法的分裂形狀模式資訊,且可使用所獲得的資訊。分裂形狀模式資訊可包含於與各種資料單元相關的位元串流中。舉例而言,影像解碼裝置100可使用包含於序列參數集、圖像參數集、視訊參數集、切片標頭、切片片段標頭、圖塊標頭或圖塊群組標頭中的分裂形狀模式資訊。另外,影像解碼裝置100可根據每一最大寫碼單元或每一參考寫碼單元自位元串流獲得對應於區塊形狀資訊或分裂形狀模式資訊的語法元素,且可使用所獲得的語法元素。
下文中,將根據本揭露的實施例詳細描述判定分裂規則的方法。
影像解碼裝置100可判定影像的分裂規則。可在影像解碼裝置100與影像編碼裝置200之間預先判定分裂規則。影像解碼裝置100可基於自位元串流獲得的資訊來判定影像的分裂規則。影像解碼裝置100可基於自序列參數集、圖像參數集、視訊參數集、切片標頭、切片片段標頭、圖塊標頭或圖塊群組標頭中的至少一者獲得的模式來判定分裂規則。影像解碼裝置100可根據圖框、切片、圖塊、時間層、最大寫碼單元或寫碼單元來不同地判定分裂規則。
影像解碼裝置100可基於寫碼單元的區塊形狀判定分裂規則。區塊形狀可包含寫碼單元的大小、形狀、寬度與高度的比率以及方向。影像編碼裝置200及影像解碼裝置100可預先判定基於寫碼單元的區塊形狀資訊判定分裂規則。然而,本揭露的實施例不限於此。影像解碼裝置100可基於自從影像編碼裝置200接收到的位元串流獲得的資訊來判定分裂規則。
寫碼單元的形狀可包含方形及非方形。在寫碼單元的寬度及高度的長度相同時,影像解碼裝置100可將寫碼單元的形狀判定為方形。此外,在寫碼單元的寬度及高度的長度不相同時,影像解碼裝置100可將寫碼單元的形狀判定為非方形。
寫碼單元的大小可包含各種大小,諸如4×4、8×4、4×8、8×8、16×4、16×8以及256×256。寫碼單元的大小可基於寫碼單元的長邊的長度、短邊的長度或面積而分類。影像解碼裝置100可將同一分裂規則應用於分類為同一群組的寫碼單元。舉例而言,影像解碼裝置100可將具有相同長邊長度的寫碼單元分類為具有相同大小。此外,影像解碼裝置100可將同一分裂規則應用於具有相同長邊長度的寫碼單元。
寫碼單元的寬度與高度的比可包含1:2、2:1、1:4、4:1、1:8、8:1、1:16、16:1、32:1、1:32或類似者。此外,寫碼單元的方向可包含水平方向及垂直方向。水平方向可指示其中寫碼單元的寬度的長度長於其高度的長度的情況。垂直方向可指示其中寫碼單元的寬度的長度短於其高度的長度的情況。
影像解碼裝置100可基於寫碼單元的大小自適應性地判定分裂規則。影像解碼裝置100可基於寫碼單元的大小不同地判定可允許的分裂形狀模式。舉例而言,影像解碼裝置100可基於寫碼單元的大小判定是否允許分裂。影像解碼裝置100可根據寫碼單元的大小判定分裂方向。影像解碼裝置100可基於寫碼單元的大小判定可允許的分裂類型。
基於寫碼單元的大小判定的分裂規則可為在影像編碼裝置200與影像解碼裝置100之間預先判定的分裂規則。此外,影像解碼裝置100可基於自位元串流獲得的資訊來判定分裂規則。
影像解碼裝置100可基於寫碼單元的位置自適應性地判定分裂規則。影像解碼裝置100可基於寫碼單元在影像中的位置自適應性地判定分裂規則。
此外,影像解碼裝置100可判定分裂規則以使得經由不同分裂路徑產生的寫碼單元不具有相同區塊形狀。然而,本揭露的實施例不限於此,且經由不同分裂路徑產生的寫碼單元具有相同區塊形狀。經由不同分裂路徑產生的寫碼單元可具有不同解碼處理次序。由於上文已參考圖12描述解碼處理次序,所以不再提供其細節。
圖16示出根據本揭露的實施例的在寫碼單元可分裂成的形狀的組合對於每一圖像不同時可針對每一圖像判定的寫碼單元。
參考圖16,影像解碼裝置100可將寫碼單元可分裂成的分裂形狀的組合判定為對於每一圖像不同。舉例而言,影像解碼裝置100可藉由使用包含於影像中的至少一個圖像當中的可分裂成4個寫碼單元的圖像1600、可分裂成2個或4個寫碼單元的圖像1610以及可分裂成2個、3個或4個寫碼單元的圖像1620來解碼影像。影像解碼裝置100可僅使用指示分裂成4個方形寫碼單元的分裂形狀資訊以便將圖像1600分裂成多個寫碼單元。影像解碼裝置100可僅使用指示分裂成2個或4個寫碼單元的分裂形狀資訊以便分裂圖像1610。影像解碼裝置100可僅使用指示分裂成2個、3個或4個寫碼單元的分裂形狀資訊以便分裂圖像1620。由於分裂形狀的以上組合僅為用於描述影像解碼裝置100的操作的本揭露的實施例,所以分裂形狀的組合不應限制性地解釋為本揭露的實施例且應解釋為分裂形狀的各種類型的組合可用於特定資料單元中的每一者。
根據本揭露的實施例,影像解碼裝置100的位元串流獲得器110可獲得包含指示用於特定資料單元(例如,序列、圖像、切片、切片片段、圖塊或圖塊群組)中的每一者的分裂形狀資訊的組合的索引的位元串流。舉例而言,位元串流獲得器110可自序列參數集、圖像參數集、切片標頭、圖塊標頭或圖塊群組標頭獲得指示分裂形狀資訊的組合的索引。影像解碼裝置100的位元串流獲得器110可藉由使用所獲得的索引來判定特定資料單元可分裂成的寫碼單元的分裂形狀的組合,且相應地,分裂形狀的不同組合可用於特定資料單元中的每一者。
圖17示出根據本揭露的實施例的可基於可以二進位碼表示的分裂形狀模式資訊判定的寫碼單元的各種形狀。
根據本揭露的實施例,影像解碼裝置100可藉由使用經由位元串流獲得器110獲得的區塊形狀資訊及分裂形狀模式資訊將寫碼單元分裂成各種形狀。寫碼單元的可分裂形狀可對應於包含經由本揭露的上述實施例描述的形狀的各種形狀。
參考圖17,影像解碼裝置100可基於分裂形狀模式資訊在水平方向或垂直方向中的至少一者上分裂方形寫碼單元,且在水平方向或垂直方向上分裂非方形寫碼單元。
根據本揭露的實施例,在影像解碼裝置100能夠在水平方向及垂直方向上分裂方形寫碼單元以獲得4個方形寫碼單元時,可藉由用於方形寫碼單元的分裂形狀模式資訊來指示4個分裂形狀。根據本揭露的實施例,分裂形狀模式資訊可表示為2位數二進位碼,且二進位碼可被指派用於每一分裂形狀。舉例而言,當寫碼單元並未分裂時,分裂形狀模式資訊可表示為(00)b,當寫碼單元在水平方向及垂直方向上分裂時,分裂形狀模式資訊可表示為(01)b,當寫碼單元在水平方向上分裂時,分裂形狀模式資訊可表示為(10)b,且當寫碼單元在垂直方向上分裂時,分裂形狀模式資訊可表示為(11)b。
根據影像解碼裝置100的本揭露的實施例,在非方形寫碼單元在水平方向或垂直方向上分裂時,可基於寫碼單元的分裂數目判定藉由分裂形狀模式資訊指示的一種類型的分裂形狀。參考圖17,根據本揭露的實施例,影像解碼裝置100可將非方形寫碼單元分裂為多達3個寫碼單元。影像解碼裝置100可將寫碼單元分裂成兩個寫碼單元,且在此情況下,分裂形狀模式資訊可表示為(10)b。影像解碼裝置100可將寫碼單元分裂成三個寫碼單元,且在此情況下,分裂形狀模式資訊可表示為(11)b。影像解碼裝置100可判定不分裂寫碼單元,且在此情況下,分裂形狀模式資訊可表示為(0)b。換言之,影像解碼裝置100可使用可變長度寫碼(variable length coding;VLC)而非固定長度寫碼(fixed length coding;FLC)以便使用指示分裂形狀模式資訊的二進位碼。
根據本揭露的實施例,參考圖17,指示寫碼單元並不分裂的分裂形狀模式資訊的二進位碼可表示為(0)b。在指示寫碼單元並不分裂的分裂形狀模式資訊的二進位碼設定為(00)b時,即使不存在設定為(01)b的分裂形狀模式資訊,亦使用所有2位元的分裂形狀模式資訊的二進位碼。然而,如圖17中所繪示,在3種類型的分裂形狀用於非方形寫碼單元時,影像解碼裝置100能夠判定即使藉由使用一位元二進位碼(0)b作為分裂形狀模式資訊亦不分裂寫碼單元,且因此可有效地使用位元串流。然而,藉由分裂形狀模式資訊指示的非方形寫碼單元的分裂形狀不應限制性地解釋為參考圖17所描述的3種形狀,且應解釋為包含本揭露的上述實施例的各種形狀。
圖18示出根據本揭露的實施例的可基於可以二進位碼表示的分裂形狀模式資訊判定的寫碼單元的其他形狀。
參考圖18,影像解碼裝置100可基於分裂形狀模式資訊在水平方向或垂直方向上分裂方形寫碼單元,且在水平方向或垂直方向上分裂非方形寫碼單元。換言之,分裂形狀模式資訊可指示方形寫碼單元在一個方向上分裂。在此情況下,指示方形寫碼單元並不分裂的分裂形狀模式資訊的二進位碼可表示為(0)b。在指示寫碼單元並不分裂的分裂形狀模式資訊的二進位碼設定為(00)b時,即使不存在設定為(01)b的分裂形狀模式資訊,亦使用所有2位元的分裂形狀模式資訊的二進位碼。然而,如圖18中所繪示,在3種類型的分裂形狀用於方形寫碼單元時,影像解碼裝置100能夠判定即使藉由使用一位元二進位碼(0)b作為分裂形狀模式資訊亦不分裂寫碼單元,且因此可有效地使用位元串流。然而,藉由分裂形狀模式資訊指示的方形寫碼單元的分裂形狀不應限制性地解釋為參考圖18所描述的3種形狀,且應解釋為包含本揭露的上述實施例的各種形狀。
根據本揭露的實施例,可藉由使用二進位碼來表示區塊形狀資訊或分裂形狀模式資訊,且此資訊可即刻產生為位元串流。替代地,以二進位碼表示的區塊形狀資訊或分裂形狀模式資訊在上下文自適應性二進位算術寫碼(context adaptive binary arithmetic coding;CABAC)期間可用作二進位碼輸入而不需即刻產生為位元串流。
根據本揭露的實施例,將描述其中影像解碼裝置100經由CABAC獲得關於區塊形狀資訊或分裂形狀模式資訊的語法的程序。可經由位元串流獲得器110獲得包含語法的二進位碼的位元串流。影像解碼裝置100可藉由反向二進位化包含於所獲得的位元串流中的位元子字串來偵測指示區塊形狀資訊或分裂形狀模式資訊的語法元素。根據本揭露的實施例,影像解碼裝置100可獲得對應於待解碼的語法元素的一組二進位位元子字串且藉由使用機率資訊來解碼每一位元子,且可重複此類操作直至包含經解碼位元子的位元子字串變得與先前獲得的位元子字串中的一者相同為止。影像解碼裝置100可藉由對位元子字串執行反向二進位化來判定語法元素。
根據本揭露的實施例,影像解碼裝置100可藉由執行自適應性二進位算術寫碼的解碼程序來判定位元子字串的語法,且更新經由位元串流獲得器110獲得的位元子的機率模型。參考圖17,根據本揭露的實施例,影像解碼裝置100的位元串流獲得器110可獲得指示二進位碼的位元串流,所述二進位碼指示分裂形狀模式資訊。影像解碼裝置100可藉由使用具有1位元或2位元的大小的二進位碼來判定分裂形狀模式資訊的語法。影像解碼裝置100可更新2位元二進位碼當中的每一位元的機率以便判定分裂形狀模式資訊的語法。換言之,影像解碼裝置100可在解碼下一位元子時基於2位元二進位碼當中的第一位元子的值是0還是1來更新具有值0或1的機率。
根據本揭露的實施例,在判定語法時,影像解碼裝置100可更新在解碼語法的位元子字串中的位元子時使用的位元子的機率,且可判定具有相同機率的位元子字串中的特定位元而無需更新機率。
參考圖17,在藉由使用指示非方形寫碼單元的分裂形狀模式資訊的位元子字串來判定語法時,影像解碼裝置100可在非方形寫碼單元並不分裂時藉由使用具有值0的一個位元子來判定分裂形狀模式資訊的語法。換言之,在區塊形狀資訊指示當前寫碼單元具有非方形形狀時,分裂形狀模式資訊的位元子字串中的第一位元子在非方形寫碼單元不分裂時可為0且在非方形寫碼單元分裂成2個或3個寫碼單元時可為1。相應地,非方形寫碼單元的分裂形狀模式資訊的位元子字串中的第一位元子為0的機率是1/3,且非方形寫碼單元的分裂形狀模式資訊的位元子字串中的第一位元子為1的機率是2/3。如上文所描述,由於指示非方形寫碼單元不分裂的分裂形狀模式資訊僅表示具有值0的1位元位元子字串,所以影像解碼裝置100可藉由判定第二位元子是否僅在分裂形狀模式資訊的第一位元子為1時為0來判定分裂形狀模式資訊的語法。根據本揭露的實施例,在分裂形狀模式資訊的第一位元子為1時,影像解碼裝置100可考慮到第二位元子為0及為1的機率相同而解碼位元子。
根據本揭露的實施例,影像解碼裝置100可在判定分裂形狀模式資訊的位元子字串中的位元子時將各種機率用於每一位元子。根據本揭露的實施例,影像解碼裝置100可基於非方形區塊的方向不同地判定分裂形狀模式資訊的位元子的機率。根據本揭露的實施例,影像解碼裝置100可基於當前寫碼單元的面積或長邊長度不同地判定分裂形狀模式資訊的位元子的機率。根據本揭露的實施例,影像解碼裝置100可基於當前寫碼單元的面積或長邊長度中的至少一者不同地判定分裂形狀模式資訊的位元子的機率。
根據本揭露的實施例,影像解碼裝置100可判定分裂形狀模式資訊的位元子的機率關於特定大小或更大的寫碼單元是相同的。舉例而言,可基於寫碼單元的長邊長度判定分裂形狀模式資訊的位元子的機率對於64個樣本或更大大小的寫碼單元是相同的。
根據本揭露的實施例,影像解碼裝置100可基於切片類型(例如I切片、P切片或B切片)判定包含於分裂形狀模式資訊的位元子字串中的位元子的初始機率,
圖19為執行迴路濾波的影像編碼及解碼系統1900的方塊圖。
影像編碼及解碼系統1900的編碼端1910傳輸影像的經編碼位元串流,且解碼端1950藉由接收及解碼位元串流而輸出經重建構影像。此處,編碼端1910可具有與稍後描述的影像編碼裝置200相似的組態,且解碼端1950可具有與影像解碼裝置100相似的組態。
在編碼端1910處,預測編碼器1915經由框間預測及框內預測輸出預測資料,且變換器及量化器1920輸出預測資料與當前輸入影像之間的殘餘資料的經量化變換係數。熵編碼器1925藉由編碼經量化變換係數來變換經量化變換係數,且輸出變換的經量化變換係數作為位元串流。經量化變換係數經由反量化器及反變換器1930重建構為空間域的資料,且空間域的資料經由解區塊濾波器1935及迴路濾波器1940輸出為經重建構影像。重建構影像可經由預測編碼器1915用作下一輸入影像的參考影像。
藉由解碼端1950接收到的位元串流當中的經編碼影像資料經由熵解碼器1955以及反量化器及反變換器1960重建構為空間域的殘餘資料。在自預測解碼器1975輸出的預測資料及殘餘資料組合時組態空間域的影像資料,且解區塊濾波器1965及迴路濾波器1970可藉由對空間域的影像資料執行濾波來輸出關於當前原始影像的經重建構影像。經重建構影像可由預測解碼器1975用作下一原始影像的參考影像。
編碼端1910的迴路濾波器1940藉由使用根據使用者輸入或系統設定的濾波器資訊輸入來執行迴路濾波。將由迴路濾波器1940使用的濾波器資訊以及經編碼影像資料輸出至熵編碼器1925且傳輸到解碼端1950。解碼端1950的迴路濾波器1970可基於來自解碼端1950的濾波器資訊輸入執行迴路濾波。
本揭露的上述各種實施例描述與由影像解碼裝置100執行的影像解碼方法相關的操作。下文中,將經由本揭露的各種實施例描述執行對應於影像解碼方法的反向程序的影像編碼方法的影像編碼裝置200的操作。
圖2為根據本揭露的實施例的能夠基於區塊形狀資訊或分裂形狀模式資訊中的至少一者編碼影像的影像編碼裝置200的方塊圖。
影像編碼裝置200可包含編碼器220及位元串流產生器210。編碼器220可接收輸入影像並編碼輸入影像。編碼器220可藉由編碼輸入影像獲得至少一個語法元素。語法元素可包含下述者中的至少一者:跳過旗標、預測模式、動作向量差、動作向量預測方法(或索引)、變換量化係數、寫碼區塊圖案、經寫碼區塊旗標、框內預測模式、直接旗標、合併旗標、差量QP、參考索引、預測方向或變換索引。編碼器220可基於包含寫碼單元的形狀、方向、寬度與高度的比或大小中的至少一者的區塊形狀資訊判定上下文模型。
位元串流產生器210可基於經編碼輸入影像產生位元串流。舉例而言,位元串流產生器210可基於上下文模型藉由熵編碼語法元素來產生位元串流。此外,影像編碼裝置200可將位元串流傳輸至影像解碼裝置100。
根據本揭露的實施例,影像編碼裝置200的編碼器220可判定寫碼單元的形狀。舉例而言,寫碼單元可具有方形形狀或非共用形狀,且指示此形狀的資訊可包含於區塊形狀資訊中。
根據本揭露的實施例,編碼器220可判定寫碼單元將被分裂成的形狀。編碼器220可判定包含於寫碼單元中的至少一個寫碼單元的形狀,且位元串流產生器210可產生包含分裂形狀模式資訊的位元串流,所述分裂形狀模式資訊包含關於寫碼單元的此形狀的資訊。
根據本揭露的實施例,編碼器220可判定寫碼單元是將被分裂還是不分裂。在編碼器220判定僅一個寫碼單元包含於寫碼單元中或寫碼單元並不分裂時,位元串流產生器210可產生包含指示寫碼單元並不分裂的分裂形狀模式資訊的位元串流。此外,編碼器220可將寫碼單元分裂成多個寫碼單元,且位元串流產生器210可產生包含指示寫碼單元分裂成多個寫碼單元的分裂形狀模式資訊的位元串流。
根據本揭露的實施例,指示寫碼單元將被分裂成的寫碼單元的數目或分裂寫碼單元的方向的資訊可包含於分裂形狀模式資訊中。舉例而言,分裂形狀模式資訊可指示寫碼單元在垂直方向或水平方向中的至少一者上分裂或並不分裂。
影像編碼裝置200基於寫碼單元的分裂形狀模式判定關於分裂形狀模式的資訊。影像編碼裝置200可基於寫碼單元的形狀、方向、寬度與高度的比或大小中的至少一者判定上下文模型。此外,影像編碼裝置200基於上下文模型產生包含關於用於分裂寫碼單元的分裂形狀模式的資訊的位元串流。
影像編碼裝置200可獲得用於映射上下文模型的索引及寫碼單元的形狀、方向、寬度與高度的比或大小中的至少一者以判定上下文模型的陣列。影像編碼裝置200可基於寫碼單元的形狀、方向、寬度與高度的比或大小中的至少一者自陣列獲得上下文模型的索引。影像編碼裝置200可基於上下文模型的索引判定上下文模型。
影像編碼裝置200可進一步基於包含鄰近於所述寫碼單元的鄰近寫碼單元的形狀、方向、寬度與高度的比或大小中的至少一者的區塊形狀資訊判定上下文模型,以判定上下文模型。此處,鄰近寫碼單元可包含位於寫碼單元的左下方、左方、左上方、上方、右方、右上方或右下方處的寫碼單元中的至少一者。
此外,影像編碼裝置200可比較上方鄰近寫碼單元的寬度的長度與寫碼單元的寬度的長度以判定上下文模型。此外,影像編碼裝置200可比較左方及右方鄰近寫碼單元的高度的長度與寫碼單元的高度的長度。此外,影像編碼裝置200可基於比較結果判定上下文模型。
由於影像編碼裝置200的操作包含與參考圖3至圖19所描述的影像解碼裝置100的操作相似的內容,所以不再提供其詳細描述。
圖20為根據本揭露的實施例的影像解碼裝置2000的組態的方塊圖。
參考圖20,影像解碼裝置2000包含位元串流獲得器2010、動作資訊獲得器2030以及預測解碼器2050。
圖20的位元串流獲得器2010可對應於圖1的位元串流獲得器110,且圖20的動作資訊獲得器2030及預測解碼器2050可對應於圖1的解碼器120。
根據本揭露的實施例的位元串流獲得器2010、動作資訊獲得器2030以及預測解碼器2050可實施為至少一個處理器。影像解碼裝置2000可包含儲存位元串流獲得器2010、動作資訊獲得器2030以及預測解碼器2050的輸入/輸出資料的至少一個記憶體(未繪示)。影像解碼裝置2000可包含用於控制記憶體的資料輸入及輸出的記憶體控制器(未繪示)。
位元串流獲得器2010獲得由於編碼影像而產生的位元串流。位元串流獲得器2010自位元串流獲得用於解碼影像的語法元素。根據影像的階層式結構,對應於語法元素的二進位值可包含於位元串流中。位元串流獲得器2010可藉由熵寫碼包含於位元串流中的二進位值而獲得語法元素。
位元串流可包含關於當前圖像中的當前區塊的預測模式的資訊。當前區塊可表示自待編碼或解碼的當前圖像分裂的最大寫碼單元、寫碼單元或變換單元的區塊。
當前區塊的預測模式可包含框內預測模式或框間預測模式。如上文所描述,框間預測模式為用於自藉由當前區塊的動作資訊指示的參考圖像中的參考區塊重建構當前區塊的模式。動作資訊可包含預測方向、參考圖像索引以及動作向量。
預測方向可為清單0方向、清單1方向以及雙向中的一者。在預測方向為清單0方向時,將包含於參考圖像清單0中的圖像用作清單0方向上的參考圖像,且在預測方向為清單1方向時,將包含於參考圖像清單1中的圖像用作清單1方向上的參考圖像。此外,在預測方向為雙向時,將包含於參考圖像清單0中的圖像用作清單0方向上的參考圖像且將包含於參考圖像清單1中的圖像用作清單1方向上的參考圖像。
參考圖像索引指示包含於參考圖像清單0及/或參考圖像清單1中的圖像當中的用作當前區塊的參考圖像的圖像。根據清單0方向上的參考圖像索引,自包含於參考圖像清單0中的圖像當中指定用作清單0方向上的參考圖像的圖像。此外,根據清單1方向上的參考圖像索引,自包含於參考圖像清單1中的圖像當中指定用作清單1方向上的參考圖像的圖像。
動作向量指定參考區塊在參考圖像中的位置。清單0方向上的動作向量表示指示在清單1方向上的參考圖像中的參考區塊的動作向量,且清單1方向上的動作向量表示指示在清單1方向上的參考圖像中的參考區塊的動作向量。
在當前區塊的預測方向為清單0方向時,當前區塊的動作資訊包含指示當前區塊的預測方向為清單0方向的資訊、清單0方向上的參考圖像索引或清單0方向上的動作向量中的至少一者。在當前區塊的預測方向為清單1方向時,當前區塊的動作資訊包含指示當前區塊的預測方向為清單1方向的資訊、清單1方向上的參考圖像索引或清單1方向上的動作向量中的至少一者。在當前區塊的預測方向為雙向時,當前區塊的動作資訊包含指示當前區塊的預測方向為雙向的資訊、清單0方向上的參考圖像索引、清單1方向上的參考圖像索引、清單0方向上的動作向量或清單1方向上的動作向量中的至少一者。
合併模式(或直接模式)使用在當前區塊之前解碼的先前區塊的動作資訊作為當前區塊的動作資訊,所述合併模式為框間預測模式中的一者。可藉由僅將指示先前區塊的資訊包含於位元串流而非直接地將當前區塊的動作資訊包含於位元串流來降低位元率。
通常,在包含鄰近區塊的多條動作資訊作為候選者的候選者清單中,候選者的數目被預限制且鄰近區塊的多條動作資訊與當前區塊的動作資訊之間的相似性可能不高。相應地,即使在最佳候選者是選自候選者清單時,重建構區塊的品質劣化在選定候選者的動作資訊與當前區塊的動作資訊不同時亦不可避免。
根據本揭露的實施例,在建構包含鄰近區塊的多條動作資訊作為候選者的候選者清單之後,鄰近區塊的動作資訊可根據特定標準改變為用作當前區塊的動作資訊。換言之,根據本揭露,替代實際上使用包含於候選者清單中的動作資訊,候選者清單中的動作資訊可根據特定標準改變以使得重建構區塊與原始區塊之間的差減小。
在當前區塊的預測模式為用於藉由使用鄰近區塊的動作資訊導出當前區塊的動作資訊的模式時,位元串流獲得器2010自位元串流獲得指示是否改變鄰近區塊的動作資訊的改變資訊。改變資訊可指示是否需要改變鄰近區塊的動作資訊,且在需要改變時,指示動作資訊將如何改變。
根據本揭露的實施例,在自當前區塊的較高層級(例如,位元串流的序列參數集、圖像參數集、視訊參數集、切片標頭、切片片段標頭、圖塊標頭或圖塊群組標頭)獲得的資訊指示不應用改變模式時,位元串流獲得器2010可能並不自位元串流獲得當前區塊的改變資訊,且在資訊指示應用改變模式時,位元串流獲得器2010可自位元串流獲得當前區塊的改變資訊。
根據本揭露的實施例,即使在自當前區塊的較高層級獲得的資訊指示應用改變模式時,位元串流獲得器2010在當前區塊的大小等於或小於預設大小時亦可能不自位元串流獲得改變資訊。在當前區塊的大小較小時,品質改良的程度與藉由改變鄰近區塊的動作資訊獲得當前區塊的動作資訊的複雜度相比可能低。可藉由乘以當前區塊的寬度及高度或藉由加上當前區塊的寬度及高度來計算當前區塊的大小。
在改變資訊指示鄰近區塊的動作資訊的改變時,動作資訊獲得器2030藉由改變鄰近區塊的動作資訊獲得當前區塊的動作資訊。另一方面,在改變資訊指示鄰近區塊的動作資訊不改變時,動作資訊獲得器2030可在不改變鄰近區塊的動作資訊的情況下獲得當前區塊的動作資訊。如下文所描述,即使在改變資訊指示改變時,鄰近區塊的動作資訊(特定言之,預測方向、參考圖像或動作資訊中的至少一者)亦可能不改變。此外,即使在改變資訊指示不改變時,鄰近區塊的動作資訊(特定言之,動作向量)可根據自位元串流獲得的差分動作向量改變。
在描述改變鄰近區塊的動作資訊的方法之前,將描述與當前區塊空間上或時間上相關的鄰近區塊。
圖21為繪示與當前區塊2100時間上或空間上相關的鄰近區塊的位置的例示性圖。
參考圖21,當前區塊2100的鄰近區塊可包含與當前區塊2100空間上相關的空間區塊及與當前區塊2100時間上相關的時間區塊。
空間區塊可包含左下角區塊A0、左下方區塊A1、右上角區塊B0、右上方區塊B1或左上角區塊B2中的至少一者。如圖21中所繪示,左下方區塊A1可位於左下角區塊A0上方,且右上方區塊B1可位於右上角區塊B0左方處。
時間區塊可包含位於與並置圖像中的當前區塊2100相同的點處的區塊Col及空間上鄰近於位於相同點處的區塊Col的區塊Br中的至少一者,所述並置圖像具有與包含當前區塊2100的當前圖像的圖像次序計數(picture order count;POC)不同的圖像次序計數。區塊Br可位於區塊Col的右下方處,所述區塊Col位於與當前區塊2100相同的點處。位於與當前區塊2100相同的點處的區塊Col可為包含並置圖像中所包含的像素當中的對應於當前區塊2100中的中心像素的像素的區塊。
圖22中的時間區塊及空間區塊的位置僅為實例,且時間區塊及空間區塊的位置及數目可根據本揭露的實施例變化。
動作資訊獲得器2030可根據特定次序判定鄰近區塊的可用性且取決於判定結果依序將鄰近區塊的動作資訊包含於候選者清單。動作資訊獲得器2030可判定經框內預測鄰近區塊不具有可用性。
在當前區塊的預測模式為用於藉由使用鄰近區塊的動作資訊導出當前區塊的動作資訊的模式時,動作資訊獲得器2030可自候選者清單獲得一個鄰近區塊的動作資訊並且基於改變資訊判定是否改變鄰近區塊的動作資訊及如何改變動作資訊。
在改變資訊指示改變時,鄰近區塊的動作資訊可取決於包含當前區塊的一種類型的較高級區塊(例如,圖像、圖塊、切片或最大寫碼單元)不同地改變。舉例而言,在較高級區塊為能夠使用參考圖像清單0及參考圖像清單1兩者的區塊(例如雙向預測性B切片)時,改變資訊可指示鄰近區塊的預測方向將改變的方向。作為另一實例,在較高級區塊為僅能夠使用參考圖像清單0的區塊(例如預測性P切片)時,不能與鄰近區塊的預測方向不同地選擇當前區塊的預測方向,且因此改變資訊可指示如何改變鄰近區塊的參考圖像及/或動作向量。
下文中,將描述在較高級區塊為能夠使用參考圖像清單0及參考圖像清單1兩者的區塊時基於改變資訊獲得當前區塊的動作資訊的方法。
I.在較高級區塊為能夠使用參考圖像清單0及參考圖像清單1兩者的區塊時
圖22為繪示在較高級區塊為能夠使用參考圖像清單0及參考圖像清單1兩者的區塊時鄰近區塊的預測方向根據由改變資訊指示的值改變的方向的例示性表。
參考圖22,在改變資訊mmvd_group_idx具有值0時,鄰近區塊的動作資訊並不改變。換言之,將鄰近區塊的預測方向及參考圖像判定為當前區塊的預測方向及參考圖像。隨後,藉由將下文所描述的差分動作向量應用於鄰近區塊的動作向量來獲得當前區塊的動作向量。即使在改變資訊mmvd_group_idx不包含於位元串流中時,鄰近區塊的動作資訊並不改變。換言之,將鄰近區塊的預測方向及參考圖像判定為當前區塊的預測方向及參考圖像。隨後,藉由將差分動作向量應用於鄰近區塊的動作向量來獲得當前區塊的動作向量。
在改變資訊mmvd_group_idx具有值1或2時,鄰近區塊的動作資訊改變。
特定言之,在鄰近區塊的預測方向為清單0方向且改變資訊mmvd_group_idx具有值1時,當前區塊的預測方向可判定為雙向,且在改變資訊mmvd_group_idx具有值2時,當前區塊的預測方向可判定為清單1方向。
此外,在鄰近區塊的預測方向為清單1方向且改變資訊mmvd_group_idx具有值1時,當前區塊的預測方向可判定為雙向,且在改變資訊mmvd_group_idx具有值2時,當前區塊的預測方向可判定為清單0方向。
此外,在鄰近區塊的預測方向為雙向且改變資訊mmvd_group_idx具有值1時,當前區塊的預測方向可判定為清單0方向,且在改變資訊mmvd_group_idx具有值2時,當前區塊的預測方向可判定為清單1方向。
可不同地判定鄰近區塊的預測方向根據圖22的改變資訊mmvd_group_idx的值的改變方向。
下文中,將描述在鄰近區塊的預測方向改變時選擇當前區塊的參考圖像的方法。
1.在鄰近區塊的預測方向為雙向且當前區塊的預測方向為單向時
在鄰近區塊的預測方向為雙向且當前區塊的預測方向為清單0方向時,選擇清單0方向上的鄰近區塊的參考圖像作為當前區塊的參考圖像。清單1方向上的鄰近區塊的參考圖像並不用於當前區塊。
在鄰近區塊的預測方向為雙向且當前區塊的預測方向為清單1方向時,選擇清單1方向上的鄰近區塊的參考圖像作為當前區塊的參考圖像。清單0方向上的鄰近區塊的參考圖像並不用於當前區塊。
2.在鄰近區塊的預測方向為清單0方向且當前區塊的預測方向為清單1方向時
基於當前圖像與清單0方向上的鄰近區塊的參考圖像之間的距離,選擇包含於參考圖像清單1中的圖像中的一者作為清單1方向上的當前區塊的參考圖像。此處,圖像之間的距離可為兩個圖像之間的POC的差。POC為指示每一圖像的輸出次序的圖像的固有值。
根據本揭露的實施例,動作資訊獲得器2030可選擇參考圖像清單1中的以當前圖像與清單0方向上的鄰近區塊的參考圖像之間的距離跟當前圖像間隔開的圖像作為清單1方向上的當前區塊的參考圖像。在當前圖像與清單0方向上的鄰近區塊的參考圖像之間的距離跟當前圖像與清單1方向上的當前區塊的參考圖像之間的距離相同時,可省略稍後描述的動作向量的縮放程序。
參考圖23,在當前圖像的POC為5且清單0方向上的鄰近區塊的參考圖像的POC為3時,可選擇包含於參考圖像清單1中的圖像當中的POC 7的圖像作為清單1方向上的當前區塊的參考圖像。在以當前圖像與清單0方向上的鄰近區塊的參考圖像之間的距離跟當前圖像間隔開的圖像並不包含於參考圖像清單1中時,動作資訊獲得器2030可自參考圖像清單1中的圖像當中選擇具有最小值(例如0)的索引的圖像作為清單1方向上的當前區塊的參考圖像。
根據本揭露的另一實施例,在包含於參考圖像清單1中的圖像的數目大於1且當前圖像與清單0方向上的鄰近區塊的參考圖像之間的距離跟當前圖像與參考圖像清單1中具有索引1的圖像之間的距離相同時,動作資訊獲得器2030可選擇包含於參考圖像清單1中的具有索引1的圖像作為清單1方向上的當前區塊的參考圖像。在包含於參考圖像清單1中的圖像的數目不大於1時,動作資訊獲得器2030可選擇參考圖像清單1中具有索引0的圖像作為清單1方向上的當前區塊的參考圖像。在包含於參考圖像清單1中的圖像的數目大於1但當前圖像與清單0方向上的鄰近區塊的參考圖像之間的距離跟當前圖像與參考圖像清單1中具有索引1的圖像之間的距離並不相同時,動作資訊獲得器2030可選擇參考圖像清單1中具有索引0的圖像作為清單1方向上的當前區塊的參考圖像。在此情況下,不需要識別所有包含於參考圖像清單1中的圖像的POC,且因此可簡化選擇參考圖像的程序。
3.在鄰近區塊的預測方向為清單1方向且當前區塊的預測方向為清單0方向時
基於當前圖像與清單1方向上的鄰近區塊的參考圖像之間的距離,選擇包含於參考圖像清單0中的圖像中的一者作為清單0方向上的當前區塊的參考圖像。
根據本揭露的實施例,動作資訊獲得器2030可選擇參考圖像清單0中的以當前圖像與清單1方向上的鄰近區塊的參考圖像之間的距離跟當前圖像間隔開的圖像作為清單0方向上的當前區塊的參考圖像。
參考圖23,在當前圖像的POC為5且清單1方向上的鄰近區塊的參考圖像的POC為7時,可自包含於參考圖像清單0中的圖像當中選擇POC 3的圖像作為清單0方向上的當前區塊的參考圖像。在以當前圖像與清單1方向上的鄰近區塊的參考圖像之間的距離跟當前圖像間隔開的圖像並不包含於參考圖像清單0中時,動作資訊獲得器2030可自參考圖像清單0中的圖像當中選擇具有最小值(例如0)的索引的圖像作為清單0方向上的當前區塊的參考圖像。
根據本揭露的另一實施例,在包含於參考圖像清單0中的圖像的數目大於1且當前圖像與清單1方向上的鄰近區塊的參考圖像之間的距離跟當前圖像與參考圖像清單0中具有索引1的圖像之間的距離相同時,動作資訊獲得器2030可選擇包含於參考圖像清單0中的具有索引1的圖像作為清單0方向上的當前區塊的參考圖像。在包含於參考圖像清單0中的圖像的數目不大於1時,動作資訊獲得器2030可選擇參考圖像清單0中的具有索引0的圖像作為清單0方向上的當前區塊的參考圖像。在包含於參考圖像清單0中的圖像的數目大於1但當前圖像與清單1方向上的鄰近區塊的參考圖像之間的距離跟當前圖像與參考圖像清單0中具有索引1的圖像之間的距離並不相同時,動作資訊獲得器2030可選擇參考圖像清單0中具有索引0的圖像作為清單0方向上的當前區塊的參考圖像。在此情況下,不需要識別所有包含於參考圖像清單0中的圖像的POC,且因此可簡化選擇參考圖像的程序。
4.在鄰近區塊的預測方向為清單0方向且當前區塊的預測方向為雙向時
選擇清單0方向上的鄰近區塊的參考圖像作為清單0方向上的當前區塊的參考圖像。隨後,基於當前圖像與清單0方向上的鄰近區塊的參考圖像之間的距離,選擇包含於參考圖像清單1中的圖像中的一者作為清單1方向上的當前區塊的參考圖像。由於已參考「2.在鄰近區塊的預測方向為清單0方向且當前區塊的預測方向為清單1方向時」描述基於當前圖像與清單0方向上的鄰近區塊的參考圖像之間的距離選擇包含於參考圖像清單1中的圖像中的一者作為清單1方向上的當前區塊的參考圖像的方法,所以省略其詳細描述。
5.在鄰近區塊的預測方向為清單1方向且當前區塊的預測方向為雙向時
選擇清單1方向上的鄰近區塊的參考圖像作為清單1方向上的當前區塊的參考圖像。隨後,基於當前圖像與清單1方向上的鄰近區塊的參考圖像之間的距離,選擇包含於參考圖像清單0中的圖像中的一者作為清單0方向上的當前區塊的參考圖像。由於已參考「3.在鄰近區塊的預測方向為清單1方向且當前區塊的預測方向為清單0方向時」描述基於當前圖像與清單1方向上的鄰近區塊的參考圖像之間的距離選擇包含於參考圖像清單0中的圖像中的一者作為清單0方向上的當前區塊的參考圖像的方法,所以省略其詳細描述。
在當前區塊的參考圖像與鄰近區塊的參考圖像相同時,可藉由將差分動作向量應用於鄰近區塊的動作向量來獲得當前區塊的動作向量。特定言之,在改變資訊並不包含於位元串流中或改變資訊指示不改變時,可藉由將差分動作向量應用於鄰近區塊的動作向量來獲得當前區塊的動作向量。在鄰近區塊的預測方向為雙向且當前區塊的預測方向為清單0方向或清單1方向時,可藉由將差分動作向量應用於清單0方向或清單1方向上的鄰近區塊的動作向量來獲得清單0方向或清單1方向上的當前區塊的動作向量。
在當前區塊的參考圖像與鄰近區塊的參考圖像並不相同時,可藉由按比例縮放鄰近區塊的動作向量並將差分動作向量應用於按比例縮放的動作向量來獲得當前區塊的動作向量。
下文中,將描述按比例縮放鄰近區塊的動作向量的程序。
動作資訊獲得器2030可藉由將鄰近區塊的參考圖像與當前圖像之間的距離比當前區塊的參考圖像與當前圖像之間的距離的比率乘以鄰近區塊的動作向量來按比例縮放鄰近區塊的動作向量。可藉由將差分動作向量應用於按比例縮放的動作向量來獲得當前區塊的動作向量。
動作資訊獲得器2030可取決於鄰近區塊的參考圖像、當前圖像以及當前區塊的參考圖像之間的位置關係來改變按比例縮放的動作向量的符號,如參考圖24及圖25將描述。
圖24及圖25為繪示鄰近區塊的參考圖像2430及參考圖像2530、當前圖像2410及當前圖像2510、與當前區塊的參考圖像2450及參考圖像2550之間的位置關係的圖。
在圖24及圖25中,當前圖像2410及當前圖像2510與鄰近區塊的參考圖像2430及參考圖像2530之間的距離將被稱為d1,且當前圖像2410及當前圖像2510與當前區塊的參考圖像2450及參考圖像2550之間的距離將被稱為d2。圖像之間的距離可表示兩個圖像的POC值的差。
參考圖24,當前圖像2410具有POC B,且鄰近區塊的參考圖像2430及當前區塊的參考圖像2450分別具有POC A及POC C。在POC B具有在POC A與POC C之間的值時,鄰近區塊的動作向量根據d1比d2的比率按比例縮放且其符號反轉。換言之,如圖24中所繪示,在當前圖像2410位於當前區塊的參考圖像2450與鄰近區塊的參考圖像2430之間時,鄰近區塊的按比例縮放的動作向量的符號反轉。當d1及d2的值相同時,僅鄰近區塊的動作向量的符號反轉。
接下來,參考圖25,當前圖像2510具有POC A,且鄰近區塊的參考圖像2530及當前區塊的參考圖像2550分別具有POC B及POC C。在POC A小於POC B及POC C或大於POC B及POC C時,鄰近區塊的動作向量根據d1比d2的比率按比例縮放且維持其符號。換言之,如圖25中所繪示,在當前區塊的參考圖像2550及鄰近區塊的參考圖像2530彼此不同時,當前圖像2510在POC方面在當前區塊的參考圖像2550及鄰近區塊的參考圖像2530之前或在當前區塊的參考圖像2550及鄰近區塊的參考圖像2530之後,鄰近區塊的按比例縮放的動作向量的符號得以維持。
動作資訊獲得器2030可藉由將差分動作向量應用於鄰近區塊的動作向量或鄰近區塊的按比例縮放的動作向量來獲得當前區塊的動作資訊。
根據本揭露的實施例,可根據自位元串流獲得的變化距離資訊及變化方向資訊計算差分動作向量。位元串流獲得器2010可自位元串流獲得變化距離資訊及變化方向資訊,且動作資訊獲得器2030可將基於變化距離資訊及變化方向資訊計算的差分動作向量應用於鄰近區塊的動作向量或鄰近區塊的按比例縮放的動作向量。
變化距離資訊可指示差分動作向量與原始點的距離。替代地,變化距離資訊可指示差分動作向量的大小。此處,變化距離可為子像素單元的距離,且舉例而言,在內插參考圖像以具有1/4像素單元的子像素且變化距離資訊指示變化距離2時,差分動作向量可具有2/4像素單元的大小。
變化方向資訊可指示差分動作向量基於原始點間隔開的方向。替代地,變化方向資訊可指示差分動作向量的符號。
圖26為繪示顯示於座標平面上的差分動作向量的圖。
基於原始點,差分動作向量可取決於變化距離及變化方向具有各種值。舉例而言,在變化距離為1且變化方向為+x軸方向時,差分動作向量可為(1,0),且在變化距離為1且變化方向為-x軸方向時,差分動作向量可為(-1,0)。此外,在變化距離為2且變化方向為+y軸方向時,差分動作向量可為(0,2),且在變化距離為2且變化方向為-y軸方向時,差分動作向量可為(0,-2)。
圖27為繪示對應於變化距離資訊的值的變化距離的例示性表,且圖28為繪示對應於變化方向資訊的值的變化方向的例示性表。
參考圖27,可回應於藉由變化距離資訊mmvd_distance_idx指示的值增大而按對數比例增大變化距離。換言之,在藉由變化距離資訊mmvd_distance_idx指示的值為n時,變化距離可為2n
參考圖28,取決於藉由變化方向資訊mmvd_direction_idx指示的值來判定差分動作向量的符號。在藉由變化方向資訊mmvd_direction_idx指示的值為0時,差分動作向量在x軸方向上可具有+號,且在藉由變化方向資訊mmvd_direction_idx指示的值為1時,差分動作向量在x軸方向上可具有-號。此外,在藉由變化方向資訊mmvd_direction_idx指示的值為2時,差分動作向量在y軸方向上可具有+號,且在藉由變化方向資訊mmvd_direction_idx指示的值為3時,差分動作向量在y軸方向上可具有-號。
可根據本揭露的實施例不同地判定根據由圖27的變化距離資訊指示的值的變化距離及根據由圖28的變化方向資訊指示的值的變化方向。
根據本揭露的實施例,在當前區塊的預測方向為雙向時,自變化距離資訊及變化方向資訊導出的差分動作向量可在按比例縮放之後應用於清單0方向的動作向量及清單1方向的動作向量。特定言之,在當前圖像與清單0方向上的當前區塊的參考圖像之間的距離大於當前圖像與清單1方向上的當前區塊的參考圖像之間的距離時,差分動作向量可在按比例縮放之後應用於清單0方向上的動作向量,且未按比例縮放的差分動作向量可應用於清單1方向上的動作向量。另一方面,在當前圖像與清單1方向上的當前區塊的參考圖像之間的距離大於當前圖像與清單0方向上的當前區塊的參考圖像之間的距離時,差分動作向量可在按比例縮放之後應用於清單1方向上的動作向量,且未按比例縮放的差分動作向量可應用於清單0方向上的動作向量。
可基於當前圖像與清單0方向上的參考圖像之間的距離比當前圖像與清單1方向上的參考圖像之間的距離的比率執行差分動作向量的縮放。舉例而言,在當前圖像與清單0方向上的參考圖像之間的距離為d0且當前圖像與清單1方向上的參考圖像之間的距離為d1時,d0/d1可乘以差分動作向量。在當前圖像的POC具有在清單0方向上的參考圖像的POC與清單1方向上的參考圖像的POC之間的值時,按比例縮放的差分動作向量的符號可反轉。
在當前圖像與清單0方向上的參考圖像之間的距離d0與當前圖像與清單1方向上的參考圖像之間的距離d1相同,且當前圖像的POC具有在清單0方向上的參考圖像的POC與清單1方向上的參考圖像的POC之間的值時,自變化距離資訊及變化方向資訊導出的差分動作向量可應用於清單0方向上的動作向量,且符號反轉的差分動作向量可應用於清單1方向上的動作向量。
根據本揭露的實施例,差分動作向量的縮放可表示為下文方程式1。
[方程式1]
mMvdL=Clip3(-32767, 32767, ((distScaleFactor * mMvdL+16)>> 5))
在方程式1中,distScaleFactor表示當前圖像與清單0方向上的參考圖像之間的距離比當前圖像與清單1方向上的參考圖像之間的距離的比率,且可根據下文方程式2得以計算。
[方程式2]
distScaleFactor=(Abs(currPocDiffL1)<<5)/Abs(currPocDiffL0)
在方程式2中,currPocDiffL1表示當前圖像與清單1方向上的參考圖像之間的POC差,且currPocDiffL0表示當前圖像與清單0方向上的參考圖像之間的POC差。
在方程式1中,剪輯操作的上限及下限分別設定為32767及-32767,其中32767為可由15位元數值部分及1位元符號部分表示的最高可能數目。此處,可由15位元數值部分及1位元符號部分表示的實際下限應為-32768。然而,在經由剪輯操作將差分動作向量判定為-32768(亦即下限)且當前圖像的POC具有在清單0方向上的參考圖像的POC與清單1方向上的參考圖像的POC之間的值時,-32768的符號需要反轉,且在此情況下,超出可由15位元數值部分及1位元符號部分表示的上限32767。相應地,在方程式1中,剪輯操作的下限設定為-32767。根據本揭露的實施例,方程式1的剪輯操作的下限可設定為-32768。
下文中,將描述在當前區塊的一種類型的較高級區塊僅能夠使用參考圖像清單0時考慮到改變資訊而獲得當前區塊的動作資訊的方法。
II.在較高級區塊為能夠使用參考圖像清單0的區塊時
在較高級區塊為僅能夠使用參考圖像清單0的區塊(例如預測性P切片)時,將當前區塊的預測方向判定為清單0方向。改變資訊指示將如何判定當前圖像的參考圖像,如參考圖29將描述。
圖29為用於描述根據包含於參考圖像清單中的圖像的數目及由改變資訊mmvd_group_idx指示的值來選擇當前區塊的參考圖像ref_idx的方法的表。
參考圖29,在改變資訊mmvd_group_idx為0時,亦即,在改變資訊mmvd_group_idx指示不改變鄰近區塊的動作資訊時,選擇鄰近區塊的參考圖像ref_idx_curr作為當前區塊的參考圖像ref_idx。隨後,藉由將差分動作向量應用於鄰近區塊的動作向量來獲得當前區塊的動作向量。
在改變資訊mmvd_group_idx為1或2時,亦即,在改變資訊mmvd_group_idx指示改變鄰近區塊的動作資訊時,根據包含於參考圖像清單0中的圖像的數目自適應性地選擇當前區塊的參考圖像ref_idex。
特定言之,在改變資訊mmvd_group_idx為1且包含於參考圖像清單0中的圖像的數目(主動參考數目)為1時,將當前區塊的參考圖像ref_idx選擇為與鄰近區塊的參考圖像ref_idx_curr相同。在包含於參考圖像清單0中的圖像的數目(主動參考數目)並非1(例如為2或3)時,將當前區塊的參考圖像ref_idx選擇為與鄰近區塊的參考圖像ref_idx_curr不同。舉例而言,在包含於參考圖像清單0中的圖像的數目(主動參考數目)為2且兩個圖像中的一者為鄰近區塊的參考圖像ref_idx_curr時,可將其他圖像選擇為當前區塊的參考圖像ref_idx。
在改變資訊mmvd_group_idx為2且包含於參考圖像清單0中的圖像的數目(主動參考數目)小於3(例如,2)時,將當前區塊的參考圖像ref_idx選擇為與鄰近區塊的參考圖像ref_idx_curr相同。由於在改變資訊mmvd_group_idx為1且包含於參考圖像清單0中的圖像的數目(主動參考數目)為2時將當前區塊的參考圖像ref_idx選擇為與鄰近區塊的參考圖像ref_idx_curr不同,因此在改變資訊mmvd_group_idx為2時將當前區塊的參考圖像ref_idx選擇為與鄰近區塊的參考圖像ref_idx_curr相同。
在改變資訊mmvd_group_idx為2,包含於參考圖像清單0中的圖像的數目(主動參考數目)為3或更大,且鄰近區塊的參考圖像ref_idx_curr的索引小於2時,將當前區塊的參考圖像ref_idx選擇為包含於參考圖像清單0中的圖像當中的具有索引2的圖像。換言之,將當前區塊的參考圖像ref_idx選擇為與鄰近區塊的參考圖像ref_idx_curr不同。
在改變資訊mmvd_group_idx為2,包含於參考圖像清單0中的圖像的數目(主動參考數目)為3或更大,且鄰近區塊的參考圖像ref_idx_curr的索引為2或更大時,將當前區塊的參考圖像ref_idx選擇為包含於參考圖像清單0中的圖像當中的具有索引1的圖像。換言之,在鄰近區塊的參考圖像ref_idx_curr的索引為2、3、4或類似者時,可將當前區塊的參考圖像ref_idx選擇為具有索引1的圖像。
換言之,在改變資訊指示改變且參考圖像清單0包含與鄰近區塊的參考圖像不同的圖像時,首先將當前區塊的參考圖像選擇為與鄰近區塊的參考圖像不同,但在參考圖像清單0並不包含與鄰近區塊的參考圖像不同的圖像時,可將當前區塊的參考圖像選擇為與鄰近區塊的參考圖像相同。
在改變資訊指示改變且根據改變資訊選擇的當前區塊的參考圖像與鄰近區塊的參考圖像不同時,按比例縮放鄰近區塊的動作向量且將差分動作向量應用於按比例縮放的動作向量以獲得當前區塊的動作向量。由於上文已描述在當前區塊的參考圖像與鄰近區塊的參考圖像不同時考慮到當前圖像與當前區塊的參考圖像之間的距離比當前圖像與鄰近區塊的參考圖像之間的距離的比率而縮放鄰近區塊的動作向量的方法,因此省略其詳細描述。
在改變資訊指示改變且根據改變資訊選擇的當前區塊的參考圖像與鄰近區塊的參考圖像相同時,動作資訊獲得器2030可將偏移應用於鄰近區塊的動作向量以區分改變資訊指示不改變的情況,且將差分動作向量應用於被應用了偏移的動作向量。
將參考圖30描述在改變資訊指示改變且當前區塊的參考圖像及鄰近區塊的參考圖像相同時藉由將偏移應用於鄰近區塊的動作向量來改變鄰近區塊的動作向量的方法。
圖30為用於描述在鄰近區塊的參考圖像與當前區塊的參考圖像相同時改變鄰近區塊的動作向量mv的方法的圖。
根據本揭露的實施例,動作資訊獲得器2030可藉由添加針對鄰近區塊的動作向量mv的x分量或y分量中的至少一者預設的偏移來改變鄰近區塊的動作向量mv。偏移可為預先判定的實數。
根據本揭露的實施例,偏移可為奇數,例如3。上文已描述,隨著由變化距離資訊指示的值增大,變化距離可按對數比例增大,且在此情況下,變化距離具有2n 的值。在偏移設定為奇數時,將差分動作向量添加至鄰近區塊的並未應用偏移的動作向量的結果必然與將差分動作向量添加至鄰近區塊的被應用了偏移的動作向量的結果不同。換言之,可選為當前區塊的動作向量的候選者可藉由應用奇數偏移而多樣化。
如圖30中所繪示,動作資訊獲得器2030可將偏移+3或-3應用於鄰近區塊的動作向量mv的x分量。在將偏移+3或-3應用於鄰近區塊的動作向量mv的x分量時,鄰近區塊的動作向量mv在對參考圖像內插多達1/4像素單元時移位3/4像素單元。根據本揭露的實施例,動作資訊獲得器2030可將偏移+3或-3應用於鄰近區塊的動作向量mv的y分量或將偏移+3或=3應用於鄰近區塊的動作向量mv的x分量及y分量。
動作資訊獲得器2030可在包含於參考圖像清單0中的圖像的數目為1且改變資訊具有值1時將+3添加至鄰近區塊的動作向量mv的x分量,且在改變資訊具有值2時將-3添加至鄰近區塊的動作向量mv的x分量。
此外,由於在包含於參考圖像清單0中的圖像的數目為2且改變資訊具有值1時與鄰近區塊的參考圖像不同地選擇當前區塊的參考圖像,動作資訊獲得器2030可按比例縮放鄰近區塊的動作向量mv。在改變資訊具有值2時,動作資訊獲得器2030可將+3添加至鄰近區塊動作向量mv的x分量。
此外,由於在包含於參考圖像清單0中的圖像的數目為3或大於3且改變資訊具有值1或2時當前區塊的參考圖像與鄰近區塊的參考圖像不同,動作資訊獲得器2030可按比例縮放鄰近區塊的動作向量mv。
根據包含於參考圖像清單0中的圖像的數目或由改變資訊指示的值,動作資訊獲得器2030可藉由在按比例縮放鄰近區塊的動作向量mv或將偏移應用於鄰近區塊的動作向量mv之後應用差分動作向量來獲得當前區塊的動作向量。
在獲得當前區塊的動作資訊時,預測解碼器2050根據當前區塊的動作資訊框間預測當前區塊。預測解碼器2050可自包含於對應於當前區塊的預測方向的參考圖像清單中的圖像當中選擇由參考圖像索引指示的圖像作為當前區塊的參考圖像,且自由動作向量指示的當前區塊的參考圖像中的參考區塊獲得當前區塊的預測區塊。
可將當前區塊的預測區塊判定為當前區塊的重建構區塊,且在位元串流根據本揭露的實施例包含殘餘資料時,可由於殘餘資料應用於預測區塊而獲得當前區塊的重建構區塊。
如上文所描述,即使在自當前區塊的較高層級獲得的資訊指示應用改變模式時,位元串流獲得器2010在當前區塊的大小等於或小於預設大小時亦可能不自位元串流獲得改變資訊。在此情況下,為防止小區塊中的雙向預測,當鄰近區塊的預測方向為雙向時,動作資訊獲得器2030可將當前區塊的預測方向判定為清單0方向或清單1方向。相應地,動作資訊獲得器2030可將清單0方向上的鄰近區塊的參考圖像或清單1方向上的鄰近區塊的參考圖像判定為當前區塊的參考圖像,且藉由將差分動作向量應用於鄰近區塊的動作向量mv來獲得當前區塊的動作向量。換言之,根據本揭露的實施例,在當前區塊的大小較小時,即使在鄰近區塊的預測方向為雙向時,亦可單向預測當前區塊。
圖31為根據本揭露的實施例的解碼動作資訊的方法的流程圖。
在操作S3110中,影像解碼裝置2000自位元串流獲得指示與當前區塊時間上或空間上相關的鄰近區塊的動作資訊的改變的改變資訊。
根據本揭露的實施例,在自當前區塊的較高層級獲得的資訊(例如位元串流的序列參數集、圖像參數集、視訊參數集、切片標頭、切片片段標頭、圖塊標頭或圖塊群組標頭)指示不應用改變模式時,影像解碼裝置2000可能並不自位元串流獲得當前區塊的改變資訊,且在資訊指示應用改變模式時,影像解碼裝置2000可自位元串流獲得當前區塊的改變資訊。
根據本揭露的實施例,即使在自當前區塊的較高層級獲得的資訊指示應用改變模式時,影像解碼裝置2000在當前區塊的大小等於或小於預設大小時亦可能不自位元串流獲得改變資訊。在此情況下,在鄰近區塊的預測方向為雙向時,影像解碼裝置2000可將當前區塊的預測方向判定為清單0方向或清單1方向。隨後,影像解碼裝置2000可將清單0方向上的鄰近區塊的參考圖像或清單1方向上的鄰近區塊的參考圖像判定為當前區塊的參考圖像,且藉由將差分動作向量應用於鄰近區塊的動作向量來獲得當前區塊的動作向量。
在操作S3120中,在改變資訊指示動作資訊的改變且當前區塊的較高級區塊能夠使用一個參考圖像清單時,亦即,在當前區塊的較高級區塊不能使用兩個參考圖像清單時,影像解碼裝置2000識別包含於參考圖像清單中的圖像的數目。
根據本揭露的實施例,在改變資訊指示動作資訊的改變且當前區塊的較高級區塊能夠使用兩個參考圖像清單時,影像解碼裝置2000根據改變資訊來改變鄰近區塊的預測方向。可選擇鄰近區塊的改變預測方向作為當前區塊的預測方向。換言之,可根據改變資訊判定當前區塊的預測方向。
在操作S3130中,影像解碼裝置2000可根據參考圖像清單中的圖像的數目自鄰近區塊的動作資訊獲得當前區塊的動作資訊。
特定言之,取決於參考圖像清單中的圖像的數目,影像解碼裝置2000選擇鄰近區塊的參考圖像或與鄰近區塊的參考圖像不同的圖像作為當前區塊的參考圖像。隨後,在選擇鄰近區塊的參考圖像作為當前區塊的參考圖像時,影像解碼裝置2000藉由將偏移應用於鄰近區塊的動作向量的x分量或y分量中的至少一者來獲得當前區塊的動作向量。影像解碼裝置2000可藉由將差分動作向量應用於被應用了偏移的動作向量來獲得當前區塊的動作向量。
在參考圖像清單中的圖像的數目為1時,影像解碼裝置2000可選擇鄰近區塊的參考圖像作為當前區塊的參考圖像。在改變資訊指示第一類型改變時(例如,在改變資訊具有值1時),影像解碼裝置2000可將+號的偏移應用於鄰近區塊的動作向量。在改變資訊指示第二類型改變時(例如,在改變資訊具有值2時),影像解碼裝置2000可將-號的偏移應用於鄰近區塊的動作向量。
在參考圖像清單中的圖像的數目為2且改變資訊指示第一類型改變時,影像解碼裝置2000可將當前區塊的參考圖像判定為與鄰近區塊的參考圖像不同,且按比例縮放鄰近區塊的動作向量。在參考圖像清單中的圖像的數目為2且改變資訊指示第二類型改變時,影像解碼裝置2000可將當前區塊的參考圖像判定為與鄰近區塊的參考圖像相同,且將偏移應用於鄰近區塊的動作向量的x分量或y分量中的至少一者。
在參考圖像清單中的圖像的數目為3或大於3且改變資訊指示第一類型改變或第二類型改變時,影像解碼裝置2000可將當前區塊的參考圖像判定為與鄰近區塊的參考圖像不同,且按比例縮放鄰近區塊的動作向量。此處,可取決於改變資訊何時指示第一類型改變及改變資訊何時指示第二類型改變來不同地選擇當前區塊的參考圖像。
在改變資訊指示動作資訊的改變且當前區塊的較高級區塊能夠使用兩個參考圖像清單時,影像解碼裝置2000可考慮到當前區塊的預測方向選擇當前區塊的參考圖像,且根據當前圖像與當前區塊的參考圖像之間的距離比當前圖像與鄰近區塊的參考圖像之間的距離的比率來按比例縮放鄰近區塊的動作向量。
影像解碼裝置2000可藉由將差分動作向量應用於鄰近區塊的動作向量、鄰近區塊的按比例縮放的動作向量或鄰近區塊的被應用了偏移的動作向量來獲得當前區塊的動作向量。
在操作S3140中,影像解碼裝置2000藉由使用當前區塊的動作資訊來重建構當前區塊。
影像解碼裝置2000可自包含於對應於當前區塊的預測方向的參考圖像清單中的圖像當中選擇由參考圖像索引指示的圖像作為當前區塊的參考圖像,且自由動作向量指示的當前區塊的參考圖像中的參考區塊獲得當前區塊的預測區塊。
根據本揭露的實施例,可將當前區塊的預測區塊判定為當前區塊的重建構區塊,且在位元串流根據本揭露的實施例包含殘餘資料時,可由於殘餘資料應用於預測區塊而獲得當前區塊的重建構區塊。
圖32為根據本揭露的實施例的影像編碼裝置3200的組態的方塊圖。
參考圖32,影像編碼裝置3200包含預測編碼器3210及位元串流產生器3230。預測編碼器3210可對應於圖2的編碼器220,且位元串流產生器3230可對應於圖2的位元串流產生器210。
根據本揭露的實施例的預測編碼器3210及位元串流產生器3230可實施為至少一個處理器。影像編碼裝置3200可包含至少一個記憶體(未繪示),預測編碼器3210及位元串流產生器3230的輸入及輸出資料儲存於所述至少一個記憶體中。此外,影像編碼裝置3200可包含用於控制記憶體的資料輸入及輸出的記憶體控制器(未繪示)。
預測編碼器3210根據預測模式編碼影像,且位元串流產生器3230產生包含由於編碼影像而產生的資訊的位元串流。
預測編碼器3210可判定當前影像中的當前區塊的預測模式。在將當前區塊的預測模式判定為框間預測模式時,位元串流產生器3230將指示當前區塊的動作資訊的資訊包含於位元串流。
在當前區塊的預測模式為用於自鄰近區塊的動作資訊導出當前區塊的動作資訊的模式時,預測編碼器3210構建包含與當前區塊時間上或空間上相關的鄰近區塊的多條動作資訊作為候選者的候選者清單。預測編碼器3210可藉由選擇包含於候選者清單中的多條動作資訊中的一者來導出當前區塊的動作資訊。
預測編碼器3210可判定是否有可能對包含於較高級區塊中的當前區塊的較高級區塊(例如,圖像序列、圖像、視訊、切片、切片片段或圖塊)中的區塊應用改變模式。在有可能對包含於較高級區塊中的區塊應用改變模式時,預測編碼器3210可判定是否改變鄰近區塊的動作資訊以導出當前區塊的動作資訊。
根據本揭露的實施例,在當前區塊的大小小於或等於預設大小時,即使在有可能對包含於較高級區塊中的區塊應用改變模式時預測編碼器3210亦可判定不改變鄰近區塊的動作資訊。
在判定不改變鄰近區塊的動作資訊時,預測編碼器3210可獲得鄰近區塊的動作向量與當前區塊的動作向量之間的差作為差分動作向量。位元串流產生器3230可產生位元串流,所述位元串流包含指示不改變鄰近區塊的動作資訊的改變資訊、指示包含於候選者清單中的候選者中的一者的資訊以及指示差分動作向量的資訊。
在判定改變鄰近區塊的動作資訊時,預測編碼器3210可考慮到可由包含當前區塊的較高級區塊使用的參考圖像清單的數目是1還是2而判定如何改變鄰近區塊的動作資訊。
如上文所描述,在較高級區塊僅能夠使用參考圖像清單0時,預測編碼器3210可考慮到包含於參考圖像清單0中的圖像的數目而選擇當前區塊的參考圖像。
在較高級區塊能夠使用參考圖像清單0及參考圖像清單1時,預測編碼器3210可判定鄰近區塊的預測方向將改變的方向,且考慮到鄰近區塊的預測方向、改變方向以及鄰近區塊的參考圖像而選擇當前區塊的參考圖像。
已參考影像解碼裝置2000詳細描述在較高級區塊僅能夠使用參考圖像清單0時及在較高級區塊能夠使用參考圖像清單0及參考圖像清單1時選擇當前區塊的參考圖像的方法,且因此省略其詳細描述。
在較高級區塊僅能夠使用參考圖像清單0且當前區塊的參考圖像及鄰近區塊的參考圖像相同時,預測編碼器3210可將偏移應用於鄰近區塊的動作向量的x分量及y分量中的至少一者。
在較高級區塊僅能夠使用參考圖像清單0且當前區塊的參考圖像及鄰近區塊的參考圖像彼此不同時,預測編碼器3210可根據當前圖像與鄰近區塊的參考圖像之間的距離比當前圖像與當前區塊的參考圖像之間的距離的比率來按比例縮放鄰近區塊的動作向量。
此外,在較高級區塊能夠使用參考圖像清單0及參考圖像清單1,且當前區塊的參考圖像及鄰近區塊的參考圖像彼此不同時,預測編碼器3210可根據當前圖像與鄰近區塊的參考圖像之間的距離比當前圖像與當前區塊的參考圖像之間的距離的比率來按比例縮放鄰近區塊的動作向量。
預測編碼器3210可獲得差分動作向量,所述差分動作向量為當前區塊的動作向量與鄰近區塊的動作向量、鄰近區塊的按比例縮放的動作向量,或鄰近區塊的被應用了偏移的動作向量之間的差。
位元串流產生器3230可產生位元串流,所述位元串流包含指示鄰近區塊的資訊、指示是否改變鄰近區塊的動作資訊及如何改變鄰近區塊的動作資訊的改變資訊,以及指示差分動作向量的資訊作為當前區塊的動作資訊。在當前區塊的大小等於或小於預設大小時,改變資訊可能不包含於位元串流中。
根據本揭露的實施例,指示差分動作向量的資訊可包含變化距離資訊及變化方向資訊。
圖33為根據本揭露的實施例的編碼動作資訊的方法的流程圖。
在操作S3310中,影像編碼裝置3200判定是否改變與當前區塊時間上或空間上相關的鄰近區塊的動作資訊以導出當前區塊的動作向量。
根據本揭露的實施例,影像編碼裝置3200可判定是否有可能在當前區塊的較高層級(例如圖像序列、圖像、視訊、切片、切片片段或圖塊)中應用改變模式,且在判定在較高層級中可應用改變模式時,判定是否改變鄰近區塊的動作資訊以獲得當前區塊的動作資訊。
根據本揭露的實施例,即使在判定在當前區塊的較高層級中可應用改變模式時,在當前區塊的大小等於或小於預設大小時影像編碼裝置3200亦可判定不改變鄰近區塊的動作資訊。
在操作S3320中,影像編碼裝置3200可產生位元串流,所述位元串流包含:指示用於自鄰近區塊當中導出當前區塊的動作資訊的鄰近區塊的資訊,指示是否改變鄰近區塊的動作資訊的資訊,以及指示差分動作向量的資訊。在判定在較高層級中不可應用改變模式或當前區塊的大小等於或小於預設大小時,改變資訊可能不包含於位元串流中。
影像編碼裝置3200可獲得當前區塊的動作向量與鄰近區塊的動作向量、鄰近區塊的按比例縮放的動作向量,或鄰近區塊的被應用了偏移的動作向量之間的差作為差分動作向量。影像編碼裝置3200可將指示差分動作向量的變化距離資訊及變化方向資訊包含於位元串流。
同時,上文所描述的本揭露的實施例可寫成可儲存在媒體中的電腦可執行程式。
媒體可持續儲存電腦可執行程式,或暫時地儲存用於執行或下載的電腦可執行程式或指令。此外,媒體可為單個或多個硬體組合於其中的各種記錄媒體或儲存媒體中的任一者,且所述媒體不限於直接連接至電腦系統的媒體,但可分佈於網路上。媒體的實例包含:磁性媒體,諸如硬碟、軟碟以及磁帶;光學記錄媒體,諸如CD-ROM及DVD;磁光式媒體,諸如光磁碟;以及ROM、RAM以及快閃記憶體,所述媒體經組態以儲存程式指令。媒體的其他實例包含藉由儲存分佈應用程式的應用或藉由供應或分佈其他各種類型的軟體的網站、伺服器及類似者管理的記錄媒體及儲存媒體。
儘管已參考圖式描述本揭露的一或多個實施例,但所屬領域中具通常知識者應理解,可在不脫離如由所附申請專利範圍所定義的精神及範疇的情況下在本文中進行形式及細節的各種變化。
100、2000:影像解碼裝置 110、2010:位元串流獲得器 120:解碼器 200、3200:影像編碼裝置 210、3230:位元串流產生器 220:編碼器 300、400、450、600、650:當前寫碼單元 310a、310b、310c、310d、310e、310f、410、420a、420b、430a、430b、430c、460、470a、470b、480a、480b、480c、620a、620b、620c、660a、660b、660c:寫碼單元 500、700、800、900、930、950、1000、1100、1200、1300、1310、1320、1400、1410、1420:第一寫碼單元 510、710a、710b、730a、730b、750a、750b、750c、750d、810a、810b、910a、910b、910c、920a、920b、920c、1010a、1010b、1020a、1020b、1030a、1030b、1030c、1030d、1110a、1110b、1120a、1120b、1130a、1130b、1130c、1130d、1210a、1210b、1220a、1220b、1302、1312、1322、1402a、1402b、1404a、1404b、1406a、1406b、1406c、1406d、1412a、1412b、1414a、1414b、1414c、1422a、1422b、1424a、1424b、1424c:第二寫碼單元 520a、520b、520c、520d、720a、720b、820a、820b、820c、820d、820e、1012a、1012b、1014a、1014b、1022a、1022b、1024a、1024b、1112a、1112b、1114a、1114b、1116a、1116b、1116c、1116d、1122a、1122b、1124a、1124b、1126a、1126b、1126c、1126d、1216a、1216b、1216c、1216d、1226a、1226b、1226c、1226d、1304、1314、1324:第三寫碼單元 530a、530b、530c、530d:第四寫碼單元 630a、630b、630c、670a、670b、670c:左上方樣本 640、690:樣本 710c:水平方向次序 720c、730c:垂直方向次序 750e、830:Z掃描次序 1217、1227:處理次序 1500:方形參考寫碼單元 1502:非方形參考寫碼單元 1600、1610、1620:圖像 1900:影像編碼及解碼系統 1910:編碼端 1915、3210:預測編碼器 1920:變換器及量化器 1925:熵編碼器 1930:反量化器及反變換器 1935、1965:解區塊濾波器 1940、1970:迴路濾波器 1950:解碼端 1955:熵解碼器 1960:反量化器及反變換器 1975、2050:預測解碼器 2030:動作資訊獲得器 2100:當前區塊 2410、2510:當前圖像 2430、2450、2530、2550:參考圖像 A0:左下角區塊 A1:左下方區塊 B0:右上角區塊 B1:右上方區塊 B2:左上角區塊 Br、Col:區塊 d1、d2:距離 mv:動作向量 S3110、S3120、S3130、S3140、S3310、S3320:操作
提供每一圖式的簡單說明以較佳地理解本文中所引用的圖式。 圖1為根據本揭露的實施例的影像解碼裝置的方塊圖。 圖2為根據本揭露的實施例的影像編碼裝置的方塊圖。 圖3示出根據本揭露的實施例的藉由分裂當前寫碼單元來判定至少一個寫碼單元的程序。 圖4示出根據本揭露的實施例的藉由分裂非方形寫碼單元來判定至少一個寫碼單元的程序。 圖5示出根據本揭露的實施例的基於區塊形狀資訊或分裂形狀模式資訊中的至少一者來分裂寫碼單元的程序。 圖6示出根據本揭露的實施例的自奇數個寫碼單元當中判定特定寫碼單元的方法。 圖7示出根據本揭露的實施例的在藉由分裂當前寫碼單元判定多個寫碼單元時處理多個寫碼單元的次序。 圖8示出根據本揭露的實施例的在寫碼單元不可按特定次序處理時判定當前寫碼單元將被分裂成奇數個寫碼單元的程序。 圖9示出根據本揭露的實施例的藉由分裂第一寫碼單元來判定至少一個寫碼單元的程序。 圖10示出根據本揭露的實施例在藉由分裂第一寫碼單元而判定的非方形第二寫碼單元滿足特定條件時所述第二寫碼單元可分裂成的形狀受限制。 圖11示出根據本揭露的實施例的在分裂形狀模式資訊指示方形寫碼單元不會被分裂成四個方形寫碼單元時分裂方形寫碼單元的程序。 圖12示出根據本揭露的實施例多個寫碼單元之間的處理次序可取決於分裂寫碼單元的程序而改變。 圖13示出根據本揭露的實施例在寫碼單元遞歸地分裂以使多個寫碼單元得以判定時在寫碼單元的形狀及大小改變時判定寫碼單元的深度的程序。 圖14示出根據本揭露的實施例的可基於寫碼單元的形狀及大小判定的深度及用於區分寫碼單元的部分索引(part index;PID)。 圖15示出根據本揭露的實施例基於包含於圖像中的多個特定資料單元來判定多個寫碼單元。 圖16示出根據本揭露的實施例的在寫碼單元可分裂成的形狀的組合對於每一圖像不同時可針對每一圖像判定的寫碼單元。 圖17示出根據本揭露的實施例的可基於以二進位碼表示的分裂形狀模式資訊判定的寫碼單元的各種形狀。 圖18示出根據本揭露的實施例的可基於以二進位碼表示的分裂形狀模式資訊判定的寫碼單元的其他形狀。 圖19為執行迴路濾波的影像編碼及解碼系統的方塊圖。 圖20為根據本揭露的實施例的影像解碼裝置的組態的方塊圖。 圖21為繪示與當前區塊時間上或空間上相關的鄰近區塊的位置的例示性圖。 圖22為繪示鄰近區塊的預測方向根據由改變資訊指示的值改變的方向的例示性表。 圖23為繪示包含於參考圖像清單0及參考圖像清單1中的圖像的例示性表。 圖24為繪示鄰近區塊的參考圖像、當前圖像以及當前區塊的參考圖像之間的位置關係的圖。 圖25為繪示鄰近區塊的參考圖像、當前圖像以及當前區塊的參考圖像之間的位置關係的圖。 圖26為繪示顯示於座標平面上的差分動作向量的圖。 圖27為繪示對應於變化距離資訊的值的變化距離的例示性表。 圖28為繪示對應於變化方向資訊的值的變化方向的例示性表。 圖29為用於描述根據包含於參考圖像清單中的圖像的數目及由改變資訊指示的值來選擇當前區塊的參考圖像的方法的表。 圖30為用於描述在鄰近區塊的參考圖像與當前區塊的參考圖像相同時改變鄰近區塊的動作向量的方法的圖。 圖31為根據本揭露的實施例的解碼動作資訊的方法的流程圖。 圖32為根據本揭露的實施例的影像編碼裝置的組態的方塊圖。 圖33為根據本揭露的實施例的編碼動作資訊的方法的流程圖。
S3110、S3120、S3130、S3140:操作

Claims (15)

  1. 一種藉由解碼裝置執行的解碼動作資訊的方法,所述方法包括: 自位元串流獲得指示是否改變與當前區塊時間上或空間上相關的鄰近區塊的動作資訊的改變資訊; 在所述改變資訊指示所述動作資訊的改變且所述當前區塊的較高級區塊能夠使用一個參考圖像清單時,識別包含於所述當前區塊的所述參考圖像清單中的圖像的數目; 考慮到所識別的所述圖像的數目,選擇所述鄰近區塊的參考圖像或與所述鄰近區塊的所述參考圖像不同的圖像作為所述當前區塊的參考圖像; 在選擇所述鄰近區塊的所述參考圖像作為所述當前區塊的所述參考圖像時,藉由將偏移應用於所述鄰近區塊的動作向量的x分量或y分量中的至少一者來獲得所述當前區塊的動作向量;以及 藉由使用所述當前區塊的所述參考圖像中的由所述當前區塊的所述動作向量指示的參考區塊來重建構所述當前區塊。
  2. 如請求項1所述的方法,其中所述選擇包括,在所識別的所述圖像的數目為1時,選擇所述鄰近區塊的所述參考圖像作為所述當前區塊的所述參考圖像。
  3. 如請求項2所述的方法,其中,當所述改變資訊指示第一類型改變時,所述偏移具有+號,且當所述改變資訊指示第二類型改變時,所述偏移具有-號。
  4. 如請求項1所述的方法,其中,在所識別的所述圖像的數目為2且所述改變資訊指示第一類型改變時,所述選擇包括選擇與所述鄰近區塊的所述參考圖像不同的所述圖像作為所述當前區塊的所述參考圖像,以及 獲得所述當前區塊的所述動作向量包括藉由根據當前圖像與所述鄰近區塊的所述參考圖像之間的距離與所述當前圖像與所述當前區塊的所述參考圖像之間的距離的比率來按比例縮放所述鄰近區塊的所述動作向量而獲得所述當前區塊的所述動作向量。
  5. 如請求項4所述的方法,其中,在所識別的所述圖像的數目為2且所述改變資訊指示第二類型改變時,所述選擇包括選擇所述鄰近區塊的所述參考圖像作為所述當前區塊的所述參考圖像,以及 獲得所述當前區塊的所述動作向量包括藉由將所述偏移應用於所述鄰近區塊的所述動作向量的所述x分量或所述y分量中的至少一者來獲得所述當前區塊的所述動作向量。
  6. 如請求項1所述的方法,其中,在所識別的所述圖像的數目為3或大於3時,所述選擇包括選擇與所述鄰近區塊的所述參考圖像不同的所述圖像作為所述當前區塊的所述參考圖像,以及 獲得所述當前區塊的所述動作向量包括藉由根據當前圖像與所述鄰近區塊的所述參考圖像之間的距離跟所述當前圖像與所述當前區塊的所述參考圖像之間的距離的比率來按比例縮放所述鄰近區塊的所述動作向量而獲得所述當前區塊的所述動作向量。
  7. 如請求項6所述的方法,其中,在所識別的所述圖像的數目為3或大於3且所述改變資訊指示第一類型改變時,所述選擇包括自包含於所述參考圖像清單中的圖像當中選擇與所述鄰近區塊的所述參考圖像不同的所述圖像作為所述當前區塊的所述參考圖像。
  8. 如請求項7所述的方法,其中,在所識別的所述圖像的數目為3或大於3且所述改變資訊指示第二類型改變時,所述選擇包括,在指示所述鄰近區塊的所述參考圖像的索引小於2時,自包含於所述參考圖像清單中的所述圖像當中選擇索引為2的圖像作為所述當前區塊的所述參考圖像,且在指示所述鄰近區塊的所述參考圖像的所述索引等於或大於2時,自包含於所述參考圖像清單中的所述圖像當中選擇索引為1的圖像作為所述當前區塊的所述參考圖像。
  9. 如請求項1所述的方法,其中獲得所述當前區塊的所述動作向量包括藉由將自所述位元串流獲得的差分動作向量添加至被應用了所述偏移的所述鄰近區塊的所述動作向量來獲得所述當前區塊的所述動作向量。
  10. 如請求項1所述的方法,其中自包含於所述位元串流中的變化距離資訊及變化方向資訊計算所述差分動作向量。
  11. 如請求項10所述的方法,其中所述變化距離資訊指示2n 的變化距離,其中n為等於或大於0的整數,且所述偏移為奇數。
  12. 如請求項1所述的方法,其中,在所述改變資訊指示不改變所述動作資訊時,所述選擇包括選擇所述鄰近區塊的所述參考圖像作為所述當前區塊的所述參考圖像,以及 獲得所述當前區塊的所述動作向量包括藉由將自所述位元串流獲得的差分動作向量應用於所述鄰近區塊的所述動作向量來獲得所述當前區塊的所述動作向量。
  13. 如請求項1所述的方法,其中,在所述當前區塊的大小小於或等於預設大小時,並不執行所述改變資訊的獲得, 所述選擇包括選擇所述鄰近區塊的所述參考圖像作為所述當前區塊的所述參考圖像,以及 獲得所述當前區塊的所述動作向量包括藉由將自所述位元串流獲得的差分動作向量應用於所述鄰近區塊的所述動作向量來獲得所述當前區塊的所述動作向量。
  14. 一種用於解碼動作資訊的裝置,所述裝置包括: 位元串流獲得器,經組態以自位元串流獲得指示是否改變與當前區塊時間上或空間上相關的鄰近區塊的動作資訊的改變資訊; 動作資訊獲得器,經組態以在所述改變資訊指示所述動作資訊的改變且包含所述當前區塊的較高級區塊能夠使用一個參考圖像清單時,識別包含於所述當前區塊的所述參考圖像清單中的圖像的數目,根據所識別圖像的數目選擇所述鄰近區塊的參考圖像或與所述鄰近區塊的所述參考圖像不同的圖像作為所述當前區塊的參考圖像,且在選擇所述鄰近區塊的所述參考圖像作為所述當前區塊的所述參考圖像時,藉由將偏移應用於所述鄰近區塊的動作向量的x分量或y分量中的至少一者來獲得所述當前區塊的動作向量;以及 預測解碼器,經組態以藉由使用所述當前區塊的所述參考圖像中的由所述當前區塊的所述動作向量指示的參考區塊來重建構所述當前區塊。
  15. 一種藉由編碼裝置執行的編碼動作資訊的方法,所述方法包括: 判定是否改變與當前區塊時間上或空間上相關的鄰近區塊的動作資訊;以及 產生位元串流,所述位元串流包括指示所述鄰近區塊的資訊、指示是否改變所述動作資訊的資訊以及指示差分動作向量的資訊, 其中在包含所述當前區塊的較高級區塊能夠使用一個參考圖像清單,且選擇所述鄰近區塊的參考圖像作為所述當前區塊的參考圖像時,所述差分動作向量對應於所述當前區塊的動作向量與藉由將偏移應用於所述鄰近區塊的動作向量的x分量或y分量中的至少一者而獲得的結果之間的差。
TW109121036A 2019-06-21 2020-06-19 用於解碼動作資訊的裝置及方法和用於編碼動作資訊的方法 TW202106027A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962864822P 2019-06-21 2019-06-21
US62/864,822 2019-06-21
US201962906895P 2019-09-27 2019-09-27
US62/906,895 2019-09-27

Publications (1)

Publication Number Publication Date
TW202106027A true TW202106027A (zh) 2021-02-01

Family

ID=74040544

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109121036A TW202106027A (zh) 2019-06-21 2020-06-19 用於解碼動作資訊的裝置及方法和用於編碼動作資訊的方法

Country Status (9)

Country Link
US (1) US20220109870A1 (zh)
EP (1) EP3989572A4 (zh)
KR (3) KR102220230B1 (zh)
CN (1) CN113994667A (zh)
AU (1) AU2020297835A1 (zh)
BR (1) BR112021023392A2 (zh)
MX (1) MX2021014762A (zh)
TW (1) TW202106027A (zh)
WO (1) WO2020256468A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6933235B2 (ja) * 2018-12-13 2021-09-08 株式会社Jvcケンウッド 画像復号装置、画像復号方法、及び画像復号プログラム
KR20230156809A (ko) 2018-12-13 2023-11-14 가부시키가이샤 제이브이씨 켄우드 화상 복호 장치, 화상 복호 방법, 화상 복호 프로그램 기록 매체, 화상 부호화 장치, 화상 부호화 방법, 화상 부호화 프로그램 기록 매체, 격납 방법, 및 전송 방법

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080015760A (ko) * 2006-08-16 2008-02-20 엘지전자 주식회사 비디오 신호 디코딩 방법 및 장치
KR101365574B1 (ko) * 2007-01-29 2014-02-20 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
GB2487200A (en) * 2011-01-12 2012-07-18 Canon Kk Video encoding and decoding with improved error resilience
CN105430390B (zh) * 2011-06-30 2017-04-12 Jvc建伍株式会社 图像解码装置、图像解码方法、接收装置及接收方法
EP2727366B1 (en) * 2011-10-11 2018-10-03 MediaTek Inc. Method and apparatus of motion and disparity vector derivation for 3d video coding and hevc
BR112014012187A2 (pt) * 2011-11-21 2017-05-30 Motorola Mobility Llc determinação implícita e determinação implícita e explícita combinadas de imagem colocalizada para predição temporal
KR102075207B1 (ko) * 2017-12-12 2020-02-10 전자부품연구원 부호화 유닛의 문맥을 사용하여 참조 프레임을 선택하는 영상 부호화 방법 및 장치
WO2020138958A1 (ko) * 2018-12-27 2020-07-02 에스케이텔레콤 주식회사 양방향 예측 방법 및 영상 복호화 장치
KR20220002897A (ko) * 2019-04-25 2022-01-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 모션 벡터 차에 대한 제한
WO2021002673A1 (ko) * 2019-07-01 2021-01-07 삼성전자 주식회사 주변 움직임 정보를 이용하여 움직임 정보를 부호화 및 복호화하는 장치, 및 방법

Also Published As

Publication number Publication date
KR20200145754A (ko) 2020-12-30
CN113994667A (zh) 2022-01-28
EP3989572A4 (en) 2023-04-12
KR20210024513A (ko) 2021-03-05
WO2020256468A1 (ko) 2020-12-24
KR102220230B1 (ko) 2021-02-25
MX2021014762A (es) 2022-01-18
AU2020297835A1 (en) 2022-01-06
BR112021023392A2 (pt) 2022-04-19
KR20210145701A (ko) 2021-12-02
KR102332529B1 (ko) 2021-12-01
US20220109870A1 (en) 2022-04-07
EP3989572A1 (en) 2022-04-27

Similar Documents

Publication Publication Date Title
JP7464684B2 (ja) 動き情報の符号化方法、復号方法、符号化装置及び復号装置並びに記録媒体
EP3855738A1 (en) Method for encodng and decoding motion information, and apparatus for encodng and decoding motion information
KR102487598B1 (ko) 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
KR102471075B1 (ko) 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
EP3902253A1 (en) Image encoding device and image decoding device using triangular prediction mode, and image encoding method and image decoding method performed thereby
KR20210012038A (ko) 타일 및 타일 그룹을 이용하는 비디오 부호화 및 복호화 방법, 타일 및 타일 그룹을 이용하는 비디오 부호화 및 복호화 장치
KR20200095579A (ko) 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
AU2021206074A1 (en) Video decoding method and apparatus for obtaining quantization parameter, and video encoding method and apparatus for transmitting quantization parameter
TW202106027A (zh) 用於解碼動作資訊的裝置及方法和用於編碼動作資訊的方法
KR102302201B1 (ko) 서브 블록 기반으로 영상을 복호화하는 방법 및 장치, 부호화 방법 및 장치
KR102427329B1 (ko) 주변 움직임 정보를 이용하여 움직임 정보를 부호화 및 복호화하는 장치, 및 방법
EP4054192A1 (en) Video decoding method and apparatus, and video encoding method and apparatus for performing inter prediction according to affine model
KR102219914B1 (ko) 부호화 순서를 고려하여 어파인 모델 기반의 예측을 수행하는 비디오 부호화 방법 및 그 장치, 복호화 순서를 고려하여 어파인 모델 기반의 예측을 수행하는 비디오 복호화 방법 및 그 장치
EP3972250A1 (en) Method and device for encoding video on basis of video size, and method and device for decoding video on basis of video size
EP4135327A1 (en) Device and method for encoding motion vector, and device and method for decoding motion vector